ES2836756T3 - Transposición armónica basada en bloque de sub bandas mejorada - Google Patents

Transposición armónica basada en bloque de sub bandas mejorada Download PDF

Info

Publication number
ES2836756T3
ES2836756T3 ES19175681T ES19175681T ES2836756T3 ES 2836756 T3 ES2836756 T3 ES 2836756T3 ES 19175681 T ES19175681 T ES 19175681T ES 19175681 T ES19175681 T ES 19175681T ES 2836756 T3 ES2836756 T3 ES 2836756T3
Authority
ES
Spain
Prior art keywords
subband
analysis
samples
signal
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19175681T
Other languages
English (en)
Inventor
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2836756T3 publication Critical patent/ES2836756T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Vibration Dampers (AREA)
  • Production Of Liquid Hydrocarbon Mixture For Refining Petroleum (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)
  • Braking Arrangements (AREA)
  • Superheterodyne Receivers (AREA)

Abstract

Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, que comprende: un banco de filtros de análisis (101) configurado para generar una pluralidad de señales de sub bandas de análisis a partir de la señal de entrada de audio; en el que cada señal de sub banda de análisis comprende una pluralidad de muestras de análisis de valor complejo en diferentes momentos, teniendo cada muestra de análisis una fase y una magnitud; una unidad de procesamiento de sub banda (102) configurada para determinar una pluralidad de señales de sub bandas de síntesis a partir de la pluralidad de señales de sub bandas de análisis, en donde la unidad de procesamiento de las sub bandas (102) está configurada para determinar una señal de sub banda de síntesis entre la pluralidad de señales de sub bandas de síntesis a partir de una señal de sub banda de análisis entre la pluralidad de señales de sub bandas de análisis utilizando un factor de transposición de sub bandas Q y un factor de extensión de sub bandas S; al menos uno de Q o S es mayor que uno; donde la unidad de procesamiento de sub banda (102) comprende un extractor de bloques (201) configurado para repetidamente derivar una trama de L muestras de entrada a partir de la pluralidad de muestras de análisis de valor complejo de la señal de sub banda de análisis; siendo la longitud de trama L mayor que uno; y aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis de valor complejo, antes de derivar una trama siguiente de L muestras de entrada; generando así un conjunto de tramas de L muestras de entrada; en donde, cuando Q es mayor que 1, el extractor de bloques (201) está configurado para muestrear en sentido descendente la pluralidad de muestras de análisis de valor complejo mediante el factor de transposición de sub bandas Q; una unidad de procesamiento de trama no lineal (202) configurada para determinar una trama de muestras procesadas a partir de una trama de L muestras de entrada del conjunto de tramas, determinando para cada muestra procesada de la trama: la fase de la muestra procesada, desplazando la fase de la muestra de entrada correspondiente mediante un valor de desplazamiento de fase constante, que está basado en la fase de una muestra de entrada predeterminada de la trama de L muestras de entrada, donde la muestra de entrada predeterminada se mantiene fija para la determinación de todas las muestras procesadas de la trama; y la magnitud de la muestra procesada basada en la magnitud de la muestra de entrada correspondiente y basada en la magnitud de una muestra de entrada predeterminada de la trama de muestras de entrada L; y una unidad de superposición y adición (204) configurada para determinar la señal de la sub banda de síntesis mediante la superposición y la adición de las muestras de un conjunto de tramas de muestras procesadas; en donde la unidad de superposición y adición (204) aplica un tamaño de salto a tramas sucesivos de muestras procesadas, siendo el tamaño de salto igual al tamaño del salto del bloque p multiplicado por el factor de extensión de sub bandas S; y un banco de filtros de síntesis (103) configurado para generar la señal extendida en el tiempo y/o transpuesta en frecuencia a partir de la pluralidad de señales de sub bandas de síntesis.

Description

DESCRIPCIÓN
Transposición armónica basada en bloque de sub bandas mejorada
Esta solicitud es una solicitud divisional europea de la solicitud de patente Euro-PCT EP11700033.1, presentada el 5 de enero de 2011.
Campo técnico
El presente documento se refiere a los sistemas de codificación de fuentes de audio que utilizan un método de transposición armónica para la reconstrucción de alta frecuencia (HFR), así como para procesadores de efectos digitales, por ejemplo, excitadores, en los que la generación de distorsión armónica añade brillo a la señal procesada, y a los extendedores de tiempo en los que la duración de la señal se prolonga con el contenido espectral mantenido.
Antecedentes de la invención
En el documento WO 98/57436, el concepto de transposición se estableció como un método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un ahorro sustancial en la velocidad de bits al utilizar este concepto en la codificación de audio. En un sistema de codificación de audio basado en HFR, se le presenta una señal de bajo ancho de banda a un codificador en forma de onda principal y las frecuencias más altas se regeneran utilizando la transposición y la información lateral adicional de velocidad de bits muy baja que describe la forma espectral destino en el lado del descodificador. Para velocidades de bits, en las que el ancho de banda de la señal codificada del núcleo es estrecho, se hace cada vez más importante recrear una banda alta con características perceptualmente agradables. La transposición armónica definida en el documento WO 98/57436 funciona bien para material musical complejo en una situación con baja frecuencia de cruce. El principio de una transposición armónica es que una sinusoide de frecuencia w se mapea a una sinusoide de frecuencia Q<pw donde Q<p > 1 es un entero que define el orden de la transposición. En contraste con esto, una HFR basada en modulación de banda lateral única (SSB) mapea una sinusoide de frecuencia w a una sinusoide de frecuencia w Aw donde Aw es un desplazamiento de frecuencia fijo. Dada una señal principal con bajo ancho de banda, un efecto de timbre disonante será normalmente consecuencia de la transposición SSB. Debido a estos efectos, la transposición armónica basada en HFR se prefiere generalmente a la SSB basada en HFR.
Per Ekstrand et al.:"WD test for USAC CE on Harmonic Transposer ", 91. Reunión MPEG; 18-1-2010 - 22-1-2010; Kyoto, describe una estructura de transposición para la norma USAC. Frederik Nagel et al. "A harmonic Bandwidth Extension Methods for Audio Codecs", Conferencia Internacional sobre Acústica, Procesamiento de Voz y Señal 2009, Taipei, 19 de abril de 2009, páginas 145-148, describe un método de extensión del ancho de banda armónico. Zhou Huan et al. "Core Experiment on eSBR module of USAC", 90. Reunión MPEG; 26-10-2009 - 30-10-2009, Xian, describe un codificador se señales vocales de fase para la norma USAC.
Para alcanzar una calidad de audio mejorada, los métodos de HFR basados en transposición armónica de alta calidad suelen emplear bancos de filtros complejos modulados con una resolución fina de frecuencia y un alto grado de sobre muestreo para alcanzar la calidad de audio requerida. La resolución fina de frecuencia se emplea generalmente para evitar la distorsión de intermodulación no deseada derivada del tratamiento o procesamiento no lineal de las señales de diferente sub banda que pueden considerarse como sumas de una pluralidad de sinusoides. Con sub bandas suficientemente estrechas, es decir, con una resolución de frecuencia suficientemente alta, los métodos de HFR basados en transposición armónica de alta calidad apuntan a tener como máximo una sinusoide en cada sub banda. Como resultado, se puede evitar la distorsión por intermodulación causada por el procesamiento no lineal. Por otro lado, un alto grado de sobre muestreo en el tiempo puede ser beneficioso para evitar un tipo de distorsión de alias, que puede ser causada por los bancos de filtros y el procesamiento no lineal. Además, puede ser necesario un cierto grado de sobre muestreo en frecuencia para evitar ecos previos para señales transitorias causadas por el procesamiento no lineal de las señales de sub banda.
Además, los métodos de HFR basados en transposición armónica generalmente utilizan dos bloques de procesamiento basados en el banco de filtros. Una primera parte de la HFR basada en transposición armónica generalmente emplea un banco de filtros de análisis/síntesis con una resolución de alta frecuencia y con sobre muestreo de tiempo y/o frecuencia para generar una componente de señal de alta frecuencia a partir de una componente de señal de baja frecuencia. Una segunda parte de la HFR basada en la transposición armónica generalmente emplea un banco de filtros con una resolución de frecuencia relativamente grosera, por ejemplo, un banco de filtros QMF, que se utiliza para aplicar información lateral espectral o información HFR a la componente de alta frecuencia, es decir, para realizar el llamado procesamiento de HFR, con el fin de generar una componente de alta frecuencia que tenga la deseada forma espectral. La segunda parte de los bancos de filtros también se utiliza para combinar la componente de señal de baja frecuencia con la componente de señal de alta frecuencia modificada para proporcionar la señal de audio descodificada.
Como resultado de usar una secuencia de dos bloques de bancos de filtros, y de usar los bancos de filtros de análisis/síntesis con una resolución de alta frecuencia, así como el sobre muestreo de tiempo y/o frecuencia, la complejidad computacional de la HFR basada en la transposición armónica puede ser relativamente alta. En consecuencia, existe la necesidad de proporcionar métodos de HFR basados en la transposición armónica con una complejidad computacional reducida, lo que al mismo tiempo proporcione una buena calidad de audio para diversos tipos de señales de audio (por ejemplo, señales de audio estacionarias y transitorias).
Resumen de la invención
La presente invención se expone en la reivindicación independiente 1 de sistema, en la reivindicación independiente 6 de método y la reivindicación 7 de programa de ordenador. Las realizaciones preferidas se definen por medio de las reivindicaciones dependientes.
Todas las siguientes apariciones de la palabra "realización(es)", si se refieren a combinaciones de características diferentes de las definidas por las reivindicaciones independientes, se refieren a ejemplos que se presentaron originalmente pero que no representan realizaciones de la presente invención reivindicada; estos ejemplos aún se muestran solo con fines ilustrativos.
De acuerdo con un aspecto, la llamada transposición armónica basada en bloques de sub banda puede ser utilizada para suprimir los productos de intermodulación causados por el procesamiento no lineal de las señales de sub banda, es decir. al realizar un procesamiento no lineal basado en bloques de las señales de sub banda de un transponedor armónico, los productos de intermodulación dentro de las sub bandas pueden ser suprimidos o reducidos. Como resultado, se puede aplicar la transposición armónica que usa un banco de filtros de análisis/síntesis con una resolución de frecuencia relativamente grosera y/o con un grado relativamente bajo de sobre muestreo. A modo de ejemplo, se puede aplicar un banco de filtros QMF.
El procesamiento no lineal basado en bloques de un sistema de transposición armónica basado en bloques de sub bandas comprende el procesamiento de un bloque de tiempo de muestras de sub bandas complejas. El procesamiento de un bloque de muestras de sub bandas complejas puede comprender una modificación de fase común de las muestras de sub bandas complejas y la superposición de diversas muestras modificadas para formar una muestra de sub banda de salida. Este procesamiento basado en bloques tiene el efecto de red de suprimir o reducir los productos de intermodulación que de otro modo tendrían lugar para señales de sub banda de entrada que comprenden varias sinusoides.
En vista del hecho de que se pueden emplear bancos de filtros de análisis/síntesis con una resolución de frecuencia relativamente grosera para la transposición armónica basada en bloques de sub banda y en vista del hecho de que puede requerirse un grado reducido de sobre muestreo, la transposición armónica basada en el procesamiento de sub banda basado en bloques puede haber reducido la complejidad computacional en comparación con los transponedores de armónicos de alta calidad, es decir, transponedores de armónicos que tengan una resolución fina de frecuencia y utilicen procesamiento basado en muestras. Al mismo tiempo, se ha demostrado experimentalmente, que, para muchos tipos de señales de audio, la calidad de audio que se puede alcanzar al utilizar la transposición armónica basada en bloques de sub banda es casi la misma que cuando se usa la transposición armónica basada en muestras. Sin embargo, se ha observado que la calidad de audio obtenida para señales transitorias de audio generalmente se reduce en comparación con la calidad de audio que se puede lograr con transponedores armónicos basados en muestras de alta calidad, es decir, transponedores armónicos que utilizan una resolución fina de frecuencia. Se ha identificado que la calidad reducida de las señales transitorias puede deberse al tiempo de ensuciado causado por el procesamiento del bloque.
Además de los problemas de calidad surgidos anteriormente, la complejidad de la transposición armónica basada en bloques de sub bandas es aún mayor que la complejidad de los métodos más simples de HFR basados en SSB. Esto es así porque diversas señales con diferentes órdenes de transposición Q<p se requieren generalmente en las aplicaciones HFR típicas para sintetizar el ancho de banda requerido. Normalmente, cada orden de transposición Q<p de la transposición armónica basada en bloques requiere una estructura de análisis y síntesis del banco de filtros diferente.
En vista del análisis anterior, existe una necesidad particular de mejorar la calidad de la transposición armónica basada en bloques de sub bandas para señales transitorias y de voz mientras se mantiene la calidad de las señales estacionarias. Como se describirá a continuación, la mejora de la calidad se puede obtener por medio de una modificación adaptada a la señal o fija del procesamiento no lineal de bloques. Además, existe la necesidad de reducir aún más la complejidad de la transposición armónica basada en bloques de sub bandas. Como se describirá a continuación, la reducción de la complejidad computacional se puede lograr mediante la realización eficiente de varios órdenes de transposición basada en bloques de sub bandas en la estructura de un único par de bancos de filtros de análisis y síntesis. Como resultado, un solo bancos de filtros de análisis/síntesis, por ejemplo, un banco de filtros QMF, puede ser usado para varios órdenes de transposición armónica Q<p. Además, se puede aplicar el mismo par de bancos de filtros de análisis/síntesis para la transposición armónica (es decir, la primera parte de la HFR basada en la transposición armónica) y el procesamiento de HFR (es decir, la segunda parte de la HFR basada en la transposición armónica), de modo que la HFR basada en la transposición armónica completa puede basarse en un único banco de filtros de análisis/síntesis. En otras palabras, solo se puede usar un único banco de filtros de análisis en el lado de entrada para generar una pluralidad de señales de sub banda de análisis que se envían posteriormente al procesamiento de transposición armónica y al procesamiento de HFR. Eventualmente, solo se puede usar un único banco de filtros de síntesis para generar la señal descodificada en el lado de salida.
De acuerdo con un aspecto, se describe un sistema configurado para generar una señal extendida en el tiempo y/o transpuesta en frecuencia a partir de una señal de entrada. El sistema puede comprender un banco de filtros de análisis configurado para proporcionar una señal de sub banda de análisis desde la señal de entrada. La sub banda de análisis puede estar asociada con una banda de frecuencia de la señal de entrada. La señal de sub banda de análisis puede comprender una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud. El banco de filtros de análisis puede ser uno de un banco de filtros de espejo en cuadratura, una transformada discreta de Fourier con ventana o una transformada wavelet. En particular, el banco de filtros de análisis puede ser un banco de filtros de espejo en cuadratura de 64 puntos. Como tal, el banco de filtros de análisis puede tener una resolución grosera de frecuencia.
El banco de filtros de análisis puede aplicar un paso de tiempo de análisis en AtA a la señal de entrada y/o el banco de filtros de análisis puede tener un espaciamiento de frecuencia de análisis AfA, de manera que la banda de frecuencia asociada con la señal de sub banda de análisis tenga un ancho nominal AfA y/o el banco de filtros de análisis pueda tener un número N de sub bandas de análisis, con N> 1, donde n es un índice de sub banda de análisis con n = 0, ..., N - 1. Cabe señalar, que, debido a la superposición de bandas de frecuencia contiguas, el ancho espectral real de la señal de sub banda de análisis puede ser mayor que AfA. Sin embargo, el espaciamiento de frecuencia entre sub bandas de análisis adyacentes se da normalmente por el espaciamiento de frecuencia de análisis AfA.
El sistema puede comprender una unidad de procesamiento de sub banda configurada para determinar una señal de sub banda de síntesis a partir de la señal de sub banda de análisis utilizando un factor de transposición de sub banda Q y un factor de extensión de sub banda S. Al menos uno de Q o S puede ser mayor que uno. La unidad de procesamiento de sub banda puede comprender un extractor de bloques configurado para derivar una trama de L muestras de entrada de la pluralidad de muestras de análisis de valor complejo. La longitud de la trama L puede ser mayor que uno, sin embargo, en ciertas realizaciones, la longitud de la trama L puede ser igual a uno. Alternativamente, o, además, el extractor de bloques puede configurarse para aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis, antes de derivar una siguiente trama de L muestras de entrada. Como resultado de aplicar repetidamente el tamaño de salto de bloque a la pluralidad de muestras de análisis, se puede generar un conjunto de tramas de muestras de entrada.
Cabe señalar que la longitud de trama L y/o el tamaño de salto de bloque p pueden ser números arbitrarios y no necesariamente tienen que ser valores enteros. Para este u otros casos, el extractor de bloques puede configurarse para interpolar dos o más muestras de análisis para obtener una muestra de entrada de una trama de L muestras de entrada. A modo de ejemplo, si la longitud de la trama y/o el tamaño de esperanza del bloque son números fraccionarios, se puede derivar una muestra de entrada de una trama de muestras de entrada interpolando dos o más muestras de análisis vecinas.
Alternativamente, o, además, el extractor de bloques puede configurarse para muestrear en sentido descendente la pluralidad de muestras de análisis con el fin de producir una muestra de entrada de una trama de L muestras de entrada. En particular, el extractor de bloques puede configurarse para muestrear en sentido descendente la pluralidad de muestras de análisis mediante el factor de transposición de sub banda Q. Como tal, el extractor de bloques puede contribuir a la transposición armónica y/o a la extensión del tiempo realizando una operación de muestreo en sentido descendente.
El sistema, en particular la unidad de procesamiento de sub banda, puede comprender una unidad de procesamiento de trama no lineal configurada para determinar una trama de muestras procesadas a partir de una trama de muestras de entrada. La determinación puede repetirse para un conjunto de tramas de entrada, generando así un conjunto de tramas de muestras procesadas. La determinación se puede realizar determinando para cada muestra procesada de la trama, la fase de la muestra procesada desplazando la fase de la muestra de entrada correspondiente. En particular, la unidad de procesamiento de trama no lineal puede configurarse para determinar la fase de la muestra procesada desplazando la fase de la muestra de entrada correspondiente una magnitud de desplazamiento de fase basado en una muestra de entrada predeterminada de la trama de muestras de entrada, en el factor de transposición Q y en el factor de extensión de sub banda S. El valor del desplazamiento de fase se puede basar en la muestra de entrada predeterminada multiplicada por (QS-1). En particular, el valor del desplazamiento de fase puede venir dado por la muestra de entrada predeterminada multiplicada por (QS - 1) más un parámetro de corrección de fase 0. El parámetro de corrección de fase 0 puede determinarse experimentalmente para una pluralidad de señales de entrada que tengan propiedades acústicas particulares.
En una realización preferida, la muestra de entrada predeterminada es la misma para cada muestra procesada de la trama. En particular, la muestra de entrada predeterminada puede ser la muestra central de la trama de muestras de entrada.
Alternativamente, o, además, la determinación puede realizarse determinando para cada muestra procesada de la trama, la magnitud de la muestra procesada en función de la magnitud de la muestra de entrada correspondiente y de la magnitud de la muestra predeterminada de entrada. En particular, la unidad de procesamiento de trama no lineal puede configurarse para determinar la magnitud de la muestra procesada como un valor medio de la magnitud de la muestra de entrada correspondiente y la magnitud de la muestra de entrada predeterminada. La magnitud de la muestra procesada se puede determinar como el valor de la media geométrica de la magnitud de la muestra de entrada correspondiente y de la magnitud de la muestra de entrada predeterminada. Más específicamente, el valor de la media geométrica puede determinarse como la magnitud de la muestra de entrada correspondiente elevada a la potencia de (1-p), multiplicada por la magnitud de la muestra de entrada predeterminada elevada a la potencia de p. Normalmente, el parámetro ponderado de la magnitud geométrica es p e (0,1). Además, el parámetro ponderado de la magnitud geométrica p puede ser una función del factor de transposición de sub banda Q y del factor de p = i - - L extensión de sub banda S. En particular, el parámetro ponderado de la magnitud geométrica puede ser Q s , lo que resulta ser de una complejidad computacional reducida.
Debe observarse que la muestra de entrada predeterminada utilizada para la determinación de la magnitud de la muestra procesada puede ser diferente de la muestra de entrada predeterminada utilizada para la determinación de la fase de la muestra procesada. Sin embargo, en una realización preferida, ambas muestras de entrada predeterminadas son las mismas.
En general, la unidad de procesamiento de trama no lineal se puede usar para controlar el grado de transposición armónica y/o la extensión del tiempo del sistema. Se puede mostrar que, como resultado de la determinación de la magnitud de la muestra procesada a partir de la magnitud de la muestra de entrada correspondiente y de la magnitud de una muestra de entrada predeterminada, el rendimiento del sistema para señales de entrada transitorias y/o vocales puede ser mejorado.
El sistema, en particular la unidad de procesamiento de sub banda, puede comprender una unidad de superposición y adición configurada para determinar la señal de sub banda de síntesis mediante la superposición y la adición de muestras de un conjunto de tramas de muestras procesadas. La unidad de superposición y adición puede aplicar un tamaño del salto a tramas sucesivas de muestras procesadas. Este tamaño de salto puede ser igual al tamaño de salto de bloque p multiplicado por el factor de extensión de sub banda S. Como tal, la unidad de superposición y adición puede usarse para controlar el grado de extensión del tiempo y/o de la transposición armónica del sistema. El sistema, en particular la unidad de procesamiento de sub banda, puede comprender una unidad de ventana aguas arriba de la unidad de superposición y adición. La unidad de ventana puede configurarse para aplicar una función de ventana a la trama de muestras procesadas. Como tal, la función de ventana puede ser aplicada a un conjunto de tramas de muestras procesadas antes de la operación de superposición y adición. La función de ventana puede tener una longitud que corresponda a la longitud de trama L. La función de ventana puede ser una de una ventana gaussiana, una ventana de coseno, una ventana de coseno elevado, una ventana Hamming, una ventana Hann, una ventana rectangular, una ventana Bartlett y/o ventana Blackman. Normalmente, la función de ventana comprende una pluralidad de muestras de ventana y las muestras de ventana superpuestas y añadidas de una pluralidad de funciones de ventana desplazadas con un tamaño de esperanza de Sp pueden proporcionar un conjunto de muestras a un valor K significativamente constante.
El sistema puede comprender un banco de filtros de síntesis configurado para generar las señales extendidas en el tiempo y/o transpuestas en frecuencia a partir de la señal de sub banda de síntesis. La sub banda de síntesis puede estar asociada con una banda de frecuencias extendida en el tiempo y/o transpuesta en frecuencia. El banco de filtros de síntesis puede ser un banco de filtros inverso correspondiente o transformarse al banco de filtros o transformado del banco de filtros de análisis. En particular, el banco de filtros de síntesis puede ser un banco de filtros espejo inverso de cuadratura de 64 puntos. En una realización, el banco de filtros de síntesis aplica un paso de tiempo de síntesis AtS a la señal de sub banda de síntesis, y/o el banco de filtros de síntesis tiene una separación de frecuencias de síntesis AfS, y/o el banco de filtros de síntesis tiene un número M de sub bandas de síntesis., con M > 1, donde m es un índice de sub banda de síntesis con m = 0, ..., M - 1.
Cabe señalar que, normalmente, el banco de filtros de análisis está configurado para generar una pluralidad de señales de sub banda de análisis; la unidad de procesamiento de sub banda está configurada para determinar una pluralidad de señales de sub banda de síntesis a partir de la pluralidad de señales de sub banda de análisis; y el banco de filtros de síntesis está configurado para generar las señales de tiempo extendido y/o transpuestas en frecuencia de la pluralidad de señales de sub banda de síntesis.
En una realización, el sistema puede configurarse para generar una señal que se extiende en el tiempo por un factor de extensión de tiempo físico S<p, y/o una frecuencia transpuesta por un factor de transposición de frecuencia Q<p. En 5' = —A f ^ P
tal caso, el factor de extensión de sub banda puede venir dado por * ,
Q = jA rl A Qv
el factor de transposición de sub banda puede venir dado por ;
y/o el índice de sub banda de análisis n asociado con la señal de sub banda de análisis y con el índice de sub banda
n « — ¥ s ^------- i----m de síntesis m asociado con la señal de sub banda de síntesis pueden estar relacionados por ^ . Si 4 f_s_i_ m
Q (p es un va|or no entero, n puede seleccionarse como el más cercano, decir, el valor entero menor o
- ¥ --- s ----- 1-- m m ,
mayor más cercano al término ^ .
El sistema puede comprender una unidad de recepción de datos de control configurada para recibir datos de control que reflejen propiedades acústicas momentáneas de la señal de entrada. Tales propiedades acústicas momentáneas pueden por ejemplo reflejarse por la clasificación de la señal de entrada en diferentes clases de propiedades acústicas. Tales clases pueden comprender una clase de propiedad transitoria para una señal transitoria y/o una clase de propiedad estacionaria para una señal estacionaria. El sistema puede comprender un clasificador de señales o puede recibir los datos de control de un clasificador de señales. El clasificador de señales puede configurarse para analizar las propiedades acústicas momentáneas de la señal de entrada y/o configurarse para establecer los datos de control que reflejen las propiedades acústicas momentáneas.
La unidad de procesamiento de sub banda se puede configurar para determinar la señal de sub banda de síntesis teniendo en cuenta los datos de control. En particular, el extractor de bloques puede configurarse para fijarla longitud de trama L de acuerdo con los datos de control. En una realización, se fija una longitud de trama corta L si los datos de control reflejan una señal transitoria; y/o se fija una longitud de trama larga L si los datos de control reflejan una señal estacionaria. En otras palabras, la longitud de la trama L puede acortarse para porciones de señal transitorias, en comparación con la longitud de la trama L utilizada para porciones de señal estacionarias. Como tal, las propiedades acústicas momentáneas de la señal de entrada se pueden tener en cuenta dentro de la unidad de procesamiento de sub banda. Como resultado, se puede mejorar el rendimiento del sistema para señales transitorias y/o de voz.
Como se describió anteriormente, el banco de filtros de análisis está normalmente configurado para proporcionar una pluralidad de señales de sub banda de análisis. En particular, el banco de filtros de análisis puede configurarse para proporcionar una segunda señal de sub banda de análisis a partir de la señal de entrada. Esta segunda señal de sub banda de análisis está asociada normalmente con una banda de frecuencias de la señal de entrada diferente de la señal de sub banda de análisis. La segunda señal de sub banda de análisis puede comprender una pluralidad de las segundas muestras de análisis de valor complejo.
La unidad de procesamiento de sub banda puede comprender un segundo extractor de bloques configurado para derivar un conjunto de segundas muestras de entrada aplicando el tamaño de salto de bloque p a la pluralidad de segundas muestras de análisis. Es decir. en una realización preferida, el segundo extractor de bloques aplica una longitud de trama L = 1. Normalmente, cada segunda muestra de entrada corresponde a una trama de muestras de entrada. Esta correspondencia puede referirse a aspectos de tiempo y/o muestra. En particular, una segunda muestra de entrada y la trama correspondiente de las muestras de entrada pueden relacionarse con los mismos casos de tiempo de la señal de entrada.
La unidad de procesamiento de sub banda puede comprender una segunda unidad de procesamiento de tramas no lineales configurada para determinar una trama de las segundas muestras procesadas a partir de una trama de muestras de entrada y de la correspondiente segunda muestra de entrada. La determinación de la trama de las segundas muestras procesadas puede realizarse determinando para cada segunda muestra procesada de la trama, la fase de la segunda muestra procesada desplazando la fase de la muestra de entrada correspondiente un valor de desplazamiento de fase basado en la segunda muestra de entrada correspondiente, en el factor de transposición Q y en el factor de extensión de la sub banda S. En particular, el desplazamiento de fase se puede realizar como se describe en el presente documento, en donde la segunda muestra procesada toma el lugar de la muestra de entrada predeterminada. Además, la determinación de la trama de las segundas muestras procesadas se puede realizar determinando para cada segunda muestra procesada de la trama, la magnitud de la segunda muestra procesada en función de la magnitud de la muestra de entrada correspondiente y la magnitud de la segunda muestra de entrada correspondiente. En particular, la magnitud puede determinarse como se describe en el presente documento, en donde la segunda muestra procesada toma el lugar de la muestra de entrada predeterminada.
Como tal, la segunda unidad de procesamiento de trama no lineal puede usarse para derivar una trama o un conjunto de tramas de muestras procesadas de tramas tomadas de dos señales de sub banda de análisis diferentes. En otras palabras, una señal de sub banda de síntesis en particular puede derivarse de dos o más señales de sub banda de análisis diferentes. Como se indica en el presente documento, esto puede ser beneficioso en el caso en el que un solo par de bancos de filtros análisis y síntesis se utilice para una pluralidad de órdenes de transposición armónica y/o grados de extensión en el tiempo.
Para determinar una o dos sub bandas de análisis que deben contribuir a una sub banda de síntesis con índice m, se puede tener en cuenta la relación entre la resolución de frecuencia del banco de filtros de análisis y síntesis. En A/s 1 — ----------- m
particular, se puede estipular que si el término ¥ a Q, es un valor entero n, la señal de sub banda de síntesis se puede determinar en función de la trama de muestras procesadas, es decir, la señal de sub banda de síntesis se puede determinar a partir de una única señal de sub banda de análisis correspondiente al índice entero n.
4/s ------- l---- m
Alternativamente o además, se puede estipular que si el término a/ , Q„ es un valor no entero, siendo n el valor entero más cercano, entonces la señal de sub banda de síntesis se puede determinar en función de la trama de las segundas muestras procesadas, es decir, la señal de sub banda de síntesis puede determinarse a partir de dos señales de sub bandas de análisis correspondientes al valor de índice entero n más cercano y a un valor de índice entero vecino. En particular, la segunda señal de sub banda de análisis puede corresponder al índice de sub banda de análisis n 1 o n - 1.
De acuerdo con un aspecto adicional, se describe un sistema configurado para generar una señal extendida en el tiempo y/o transpuesta en frecuencia a partir de una señal de entrada. Este sistema está particularmente adaptado para generar la señal extendida en el tiempo y/o transpuesta en frecuencia bajo la influencia de una señal de control, y de ese modo tener en cuenta las propiedades acústicas momentáneas de la señal de entrada. Esto puede ser particularmente relevante para mejorar la respuesta transitoria del sistema.
El sistema puede comprender una unidad de recepción de datos de control configurada para recibir datos de control que reflejen las propiedades acústicas momentáneas de la señal de entrada. Además, el sistema puede comprender un banco de filtros de análisis configurado para proporcionar una señal de sub banda de análisis a partir de la señal de entrada; en el que la señal de sub banda de análisis comprende una pluralidad de muestras de análisis de valor complejo, teniendo cada una, una fase y una magnitud. Además, el sistema puede comprender una unidad de procesamiento de sub banda configurada para determinar una señal de sub banda de síntesis a partir de la señal de sub banda de análisis utilizando un factor de transposición de sub banda Q, un factor de extensión de sub banda S y los datos de control. Normalmente, al menos uno de Q o S es mayor de uno.
La unidad de procesamiento de sub banda puede comprender un extractor de bloques configurado para derivar una trama de L muestras de entrada de la pluralidad de muestras de análisis de valor complejo. La longitud de la trama L puede ser mayor que uno. Además, el extractor de bloques puede estar configurado para fijar la longitud de la trama L de acuerdo con los datos de control. El extractor de bloques también puede estar configurado para aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis, antes de derivar una siguiente trama de L muestras de entrada; generando así un conjunto de tramas de muestras de entrada.
Como se describió anteriormente, la unidad de procesamiento de sub banda puede comprender una unidad de procesamiento de trama no lineal configurada para determinar una trama de muestras procesadas de una trama de muestras de entrada. Esto puede realizarse determinando para cada muestra procesada de la trama, la fase de la muestra procesada desplazando la fase de la muestra de entrada correspondiente; y determinando para cada muestra procesada de la trama la magnitud de la muestra procesada en función de la magnitud de la muestra de entrada correspondiente.
Además, como se describió anteriormente, el sistema puede comprender una unidad de superposición y adición configurada para determinar la señal de sub banda de síntesis mediante la superposición y la adición de las muestras de un conjunto de tramas de muestras procesadas; y un banco de filtros de síntesis configurado para generar la señal de tiempo extendido y/o transpuesta en frecuencia a partir de la señal de sub banda de síntesis. De acuerdo con otro aspecto, se describe un sistema configurado para generar una señal de tiempo extendido y/o transpuesta en frecuencia a partir de una señal de entrada. Este sistema puede estar particularmente bien adaptado para realizar una pluralidad de operaciones de tiempo extendido y/o transposición de frecuencia dentro de un único par de bancos de filtros de análisis/síntesis. El sistema puede comprender un banco de filtros de análisis configurado para proporcionar una primera y una segunda señales de sub banda de análisis a partir de la señal de entrada, en donde la primera y la segunda señales de sub banda de análisis comprenden cada una, una pluralidad de muestras de análisis de valor complejo, denominadas primera y segunda muestras de análisis, respectivamente, teniendo cada muestra de análisis una fase y una magnitud. Normalmente, la primera y la segunda señales de sub banda de análisis corresponden a diferentes bandas de frecuencia de la señal de entrada.
El sistema puede comprender además una unidad de procesamiento de sub banda configurada para determinar una señal de sub banda de síntesis a partir de la primera y de la segunda señales de sub banda de análisis utilizando un factor de transposición de sub banda Q y un factor de extensión de sub banda S. Por lo general, al menos uno de Q o S es mayor que uno. La unidad de procesamiento de sub banda puede comprender un primer extractor de bloques configurado para derivar una trama de L primeras muestras de entrada de la pluralidad de primeras muestras de análisis; siendo la longitud de la trama L mayor que uno. El primer extractor de bloques puede configurarse para aplicar un tamaño de salto de bloque de p muestras a la pluralidad de primeras muestras de análisis, antes de derivar una siguiente trama de L primeras muestras de entrada; generando así un conjunto de tramas de primeras muestras de entrada. Además, la unidad de procesamiento de sub banda puede comprender un segundo extractor de bloques configurado para derivar un conjunto de segundas muestras de entrada aplicando el tamaño de salto de bloque p a la pluralidad de las segundas muestras de análisis; en donde cada segunda muestra de entrada corresponde a una trama de primeras muestras de entrada. El extractor del primer y segundo bloques puede tener cualquiera de las características descritas en el presente documento.
La unidad de procesamiento de sub banda puede comprender una unidad de procesamiento de trama no lineal configurada para determinar una trama de muestras procesadas de una trama de primeras muestras de entrada y a partir de la segunda muestra de entrada correspondiente. Esto se puede realizar determinando para cada muestra procesada de la trama la fase de la muestra procesada desplazando la fase de la primera muestra de entrada correspondiente; y/o determinando para cada muestra procesada de la trama, la magnitud de la muestra procesada en función de la magnitud de la primera muestra de entrada correspondiente y de la magnitud de la segunda muestra de entrada correspondiente. En particular, la unidad de procesamiento de trama no lineal se puede configurar para determinar la fase de la muestra procesada desplazando la fase de la primera muestra de entrada correspondiente un valor de desplazamiento de fase basado en la segunda muestra de entrada correspondiente, en el factor de transposición Q y en el factor de extensión de la sub banda S.
Además, la unidad de procesamiento de sub banda puede comprender una unidad de superposición y adición configurada para determinar la señal de sub banda de síntesis mediante la superposición y adición de las muestras de un conjunto de tramas de muestras procesadas, en donde la unidad de superposición y adición puede aplicar un tamaño de salto a las tramas sucesivas de las muestras procesadas. El tamaño del salto puede ser igual al tamaño de salto de bloque p multiplicado por el factor de extensión de sub banda S. Finalmente, el sistema puede comprender un banco de filtros de síntesis configurado para generar la señal extendida en el tiempo y/o transpuesta en frecuencia a partir de la señal de sub banda de síntesis.
Cabe señalar que los diferentes componentes de los sistemas descritos en el presente documento pueden comprender cualquiera o todas las características descritas con respecto a estos componentes en el presente documento. Esto es en particular aplicable al banco de filtro de análisis y síntesis, a la unidad de procesamiento de sub banda, a la unidad de procesamiento no lineal, a los extractores de bloques, a la unidad de superposición y adición, y/o la unidad de ventana descrita en diferentes partes dentro de este documento.
Los sistemas descritos en el presente documento pueden comprender una pluralidad de unidades de procesamiento de sub banda. Cada unidad de procesamiento de sub banda puede configurarse para determinar una señal de sub banda de síntesis intermedia utilizando un factor de transposición de sub banda diferente Q y/o un factor de extensión de sub banda diferente S. Los sistemas pueden comprender además una unidad de mezclado aguas abajo de la pluralidad de unidades de procesamiento de sub banda y aguas arriba del banco de filtros de síntesis configurada para mezclar las correspondientes señales de sub banda de síntesis intermedias con la señal de sub bandas de síntesis. Como tal, los sistemas pueden ser utilizados para realizar una pluralidad de operaciones de extensión en el tiempo y/o de transposición armónica mientras se usa un único par de bancos de filtros de análisis/síntesis.
Los sistemas pueden comprender un descodificador principal aguas arriba del banco de filtros de análisis configurado para descodificar un flujo de bits dentro de la señal de entrada. Los sistemas también pueden comprender una unidad de procesamiento HFR aguas abajo de la unidad de mezclado (si tal unidad de fusión está presente) y aguas arriba del banco de filtros de síntesis. La unidad de procesamiento HFR puede configurarse para aplicar información de banda espectral derivada a partir del flujo de bits a la señal de sub banda de síntesis.
De acuerdo con otro aspecto, se describe un descodificador para descodificar una señal recibida que comprende al menos un componente de baja frecuencia de una señal de audio. El descodificador puede comprender un sistema de acuerdo con cualquiera de los aspectos y características descritos en el presente documento para generar un componente de alta frecuencia de la señal de audio a partir del componente de baja frecuencia de la señal de audio. De acuerdo con un aspecto adicional, se describe un método para generar una señal extendida en el tiempo y/o transpuesta en frecuencia a partir de una señal de entrada. Este método se adapta particularmente bien para mejorar la respuesta transitoria de una operación extendida en el tiempo y/o transpuesta en frecuencia. El método puede comprender la etapa de proporcionar una señal de sub banda de análisis. a partir de la señal de entrada, en donde la señal de sub banda de análisis comprende una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud.
En general, el método puede comprender la etapa de determinar una señal de sub banda de síntesis a partir de la señal de sub banda de análisis utilizando un factor de transposición de sub banda Q y un factor de extensión de la sub banda S. Normalmente, al menos uno de Q o S es mayor que uno. En particular, el método puede comprender la etapa de derivar una trama de L muestras de entrada de la pluralidad de muestras de análisis de valor complejo, en donde la longitud de la trama L es normalmente mayor que uno. Además, se puede aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis, antes de derivar una trama siguiente de L muestras de entrada; generando así un conjunto de tramas de muestras de entrada. Además, el método puede comprender la etapa de determinar una trama de muestras procesadas a partir de una trama de muestras de entrada. Esto se puede realizar determinando para cada muestra procesada de la trama la fase de la muestra procesada desplazando la fase de la muestra de entrada correspondiente. Alternativamente o, además, para cada muestra procesada de la trama, la magnitud de la muestra procesada puede determinarse en función de la magnitud de la muestra de entrada correspondiente y de la magnitud de una muestra de entrada predeterminada.
El método puede comprender además la etapa de determinar la señal de la sub banda de síntesis. mediante la superposición y la adición de las muestras de un conjunto de tramas de muestras procesadas. Eventualmente, la señal extendida en el tiempo y/o transpuesta en frecuencia se puede generar a partir de la señal de sub banda de síntesis.
De acuerdo con otro aspecto, se describe un método para generar una señal extendida en el tiempo y/o transpuesta en frecuencia a partir de una señal de entrada. Este método se adapta particularmente para mejorar el rendimiento de una operación extendida en el tiempo y/o transpuesta en frecuencia junto con señales de entrada transitorias. El método puede comprender la etapa de recibir datos de control que reflejen las propiedades acústicas momentáneas de la señal de entrada. El método puede comprender además la etapa de proporcionar una señal de sub banda de análisis a partir de la señal de entrada, en donde la señal de sub banda de análisis comprende una pluralidad de muestras de análisis de valor complejo, cada una con una fase y una magnitud.
En una etapa siguiente, se puede determinar la señal de sub banda de análisis usando un factor de transposición de sub banda Q, un factor de extensión de sub banda S y los datos de control. Normalmente, al menos uno de Q o S es mayor que uno. En particular, el método puede comprender la etapa de derivar una trama de L muestras de entrada a partir de la pluralidad de muestras de análisis de valor complejo, en donde la longitud de trama L es normalmente mayor que uno y en donde la longitud de trama L se fija de acuerdo con los datos de control. Además, el método puede comprender la etapa de aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis, antes de derivar una siguiente trama de L muestras de entrada, para generar así un conjunto de tramas de muestras de entrada. Posteriormente, se puede determinar una trama de las muestras procesadas a partir de una trama de muestras de entrada, determinando para cada muestra procesada de la trama la fase de la muestra procesada desplazando la fase de la muestra de entrada correspondiente, y la magnitud de la muestra procesada basándose en la magnitud de la muestra de entrada correspondiente.
La señal de la sub banda de síntesis se puede determinar superponiendo y agregando las muestras de un conjunto de tramas de muestras procesadas, y la señal extendida en el tiempo y/o transpuesta en frecuencia se puede generar a partir de la señal de sub banda de síntesis.
De acuerdo con un aspecto adicional, se describe un método para generar una señal extendida en el tiempo y/o transpuesta en frecuencia a partir de una señal de entrada. Este método puede estar particularmente bien adaptado para realizar una pluralidad de operaciones s en el tiempo y/o transpuestas en frecuencia utilizando un único par de bancos de filtros de análisis/síntesis. Al mismo tiempo, el método está bien adaptado para el procesamiento de señales de entrada transitorias. El método puede comprender la etapa de proporcionar una primera y una segunda señales de sub banda de análisis a partir de la señal de entrada, en donde la primera y la segunda señales de sub banda de análisis comprende cada una pluralidad de muestras de análisis de valor complejo, denominadas primera y segunda muestras de análisis, respectivamente, teniendo cada muestra de análisis una fase y una magnitud. Además, el método puede comprender la etapa de determinar una señal de sub banda de síntesis a partir de la primera y segunda señales de sub banda de análisis utilizando un factor de transposición de sub banda Q y un factor de extensión de sub banda S, en donde al menos uno de Q o S es normalmente mayor que uno. En particular, el método puede comprender la etapa de derivar una trama de las primeras muestras de entrada a partir de la pluralidad de las primeras muestras de análisis, en donde la longitud de trama L es normalmente mayor que uno. Se puede aplicar un tamaño de salto de bloque de p muestras a la pluralidad de las primeras muestras de análisis, antes de derivar una trama siguiente de L primeras muestras de entrada, para generar así un conjunto de tramas de primeras muestras de entrada. El método puede comprender además la etapa de derivar un conjunto de segundas muestras de entrada aplicando el tamaño de salto de bloque p a la pluralidad de las muestras de análisis, en donde cada segunda muestra de entrada corresponde a una trama de las muestras de entrada.
El método prosigue en la determinación de una trama de muestras procesadas a partir de una trama de las primeras muestras de entrada y a partir de la segunda muestra de entrada correspondiente. Esto se puede realizar determinando para cada muestra procesada de la trama la fase de la muestra procesada desplazando la fase de la primera muestra de entrada correspondiente, y la magnitud de la muestra procesada en función de la magnitud de la primera muestra de entrada correspondiente y de la magnitud de la segunda muestra de entrada correspondiente. Posteriormente, la señal de sub banda de síntesis se puede determinar superponiendo y agregando las muestras de un conjunto de tramas de muestras procesadas. Eventualmente, la señal de la sub banda de síntesis puede generar la señal extendida en el tiempo y/o transpuesta en frecuencia a partir de la señal de la sub banda de síntesis.
De acuerdo con otro aspecto, se describe un programa de software. El programa de software puede estar adaptado para su ejecución en un procesador y para ejecutar las etapas del método y/o para realizar los aspectos y características descritos en el presente documento cuando se realiza en un dispositivo de ordenador.
De acuerdo con un aspecto adicional, se describe un medio de almacenamiento. El medio de almacenamiento puede comprender un programa de software adaptado para su ejecución en un procesador y para ejecutar las etapas del método y/o para realizar los aspectos y características descritos en el presente documento cuando se realiza en un dispositivo de ordenador.
De acuerdo con otro aspecto, se describe un producto de programa de ordenador. El producto de programa de ordenador puede comprender instrucciones ejecutables para ejecutar las etapas del método y/o para realizar los aspectos y características descritos en el presente documento cuando se realizan en un ordenador.
Se debe tener en cuenta que los métodos y sistemas incluyendo sus realizaciones preferidas, como se describe en la presente solicitud de patente, se pueden usar de forma independiente o en combinación con los otros métodos y sistemas descritos en este documento. Además, todos los aspectos de los métodos y sistemas descritos en la presente solicitud de patente pueden ser arbitrariamente combinados En particular, las características de las reivindicaciones pueden combinarse entre sí de una manera arbitraria.
Breve descripción de los dibujos
La presente invención se describirá ahora a modo de ejemplos ilustrativos, sin limitar el alcance de la invención, con referencia a los dibujos que se acompañan, en los cuales:
La figura 1 ilustra el principio de un ejemplo de una transposición armónica basada en bloques de sub bandas; La figura 2 ilustra el funcionamiento de un ejemplo de procesamiento de bloque de sub bandas no lineal con una entrada de sub banda;
La figura 3 ilustra el funcionamiento de un ejemplo de procesamiento de bloque de sub bandas no lineal con dos entradas de sub banda;
La figura 4 ilustra un escenario de ejemplo para la aplicación de una transposición basada en bloque de sub bandas en un códec de audio mejorado HFR;
La figura 5 ilustra un escenario de ejemplo para el funcionamiento de una transposición basada bloque de sub bandas de orden múltiple aplicando un banco de filtros de análisis separado por orden de transposición;
La figura 6 ilustra un escenario de ejemplo para el funcionamiento eficiente de una transposición basada en bloques de sub bandas múltiple de orden aplicando un único banco de filtros de análisis QMF de 64 bandas; y
La figura 7 ilustra la respuesta transitoria para una extensión en el tiempo basada en un bloque de sub bandas de un factor dos de una señal de audio de ejemplo.
Descripción de las realizaciones preferidas
Las realizaciones que se describen a continuación son meramente ilustrativas de los principios de la presente invención para una transposición armónica basada en bloques de sub bandas mejorada. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en este documento serán evidentes para otros expertos en la técnica. Es la intención, por lo tanto, limitarse solo al alcance de las reivindicaciones de la patente en trámite y no a los detalles específicos presentados a modo de descripción y explicación de las realizaciones en este documento.
La figura 1 ilustra el principio de un ejemplo de transposición basada en bloque de sub bandas, de extensión en el tiempo o una combinación de transposición y extensión en el tiempo. La señal de entrada en el dominio en el tiempo se lleva a un banco de filtros de análisis 101 que proporciona una multitud o una pluralidad de señales de sub banda de valor complejo. Esta pluralidad de señales de sub banda se lleva a la unidad de procesamiento sub banda 102, cuyo funcionamiento puede verse influenciado por los datos de control 104. Cada sub banda de salida de la unidad de procesamiento de sub banda 102 se puede obtener a partir del procesamiento de una o de dos sub bandas de entrada, o incluso a partir de una superposición del resultado de varias de estas sub bandas procesadas. La multitud o la pluralidad de sub bandas de salida de valor complejo se lleva al banco de filtros de síntesis 103, que a su vez genera una señal modificada en el dominio en el tiempo. Los datos de control 104 son instrumentales para mejorar la calidad de la señal modificada en el dominio en el tiempo para ciertos tipos de señales. Los datos de control 104 pueden estar asociados con la señal en el dominio en el tiempo. En particular, los datos de control 104 pueden estar asociados con o pueden depender del tipo de señal en el dominio en el tiempo que se lleva al banco de filtros de análisis 101. A modo de ejemplo, los datos de control 104 pueden indicar si la señal en el dominio en el tiempo, o un extracto momentáneo de la señal en el dominio en el tiempo, es una señal estacionaria o si la señal en el dominio en el tiempo es una señal transitoria.
La figura 2 ilustra el funcionamiento de un ejemplo de procesamiento de bloque de sub bandas no lineal 102 con una entrada de sub banda. Teniendo en cuenta los valores deseados de extensión física en el tiempo y/o transposición, y los parámetros físicos de los bancos de filtros de análisis y síntesis 101 y 103, se deducen los parámetros de extensión del tiempo de sub banda y los parámetros de transposición, así como un índice de sub banda de origen, que también se puede denominar como un índice de una sub banda de análisis, para cada índice de sub banda destino, que también se puede denominar índice de una sub banda de síntesis. El destino del procesamiento del bloque de sub bandas es realizar la transposición correspondiente, la extensión de tiempo o una combinación de transposición y extensión de tiempo de la señal de sub banda de origen de valor complejo para producir la señal de sub banda de destino.
En el procesamiento de bloques de sub bandas no lineales 102, el extractor de bloques 201 muestrea una trama finita de muestras de la señal de entrada de valor complejo. La trama puede definirse por una posición del puntero de entrada y por el factor de transposición de sub banda. Esta trama se somete a un procesamiento en la unidad de procesamiento no lineal 202 y, posteriormente, se abre una ventana por medio de una ventana de longitud finita en 203. La ventana 203 puede ser, por ejemplo, una ventana gaussiana, una ventana de coseno, una ventana Hamming, una ventana Hann, una ventana rectangular, una ventana Bartlett, una ventana Blackman, etc. Las muestras resultantes se agregan a las muestras sacadas previamente en la unidad de superposición y agregación 204 donde la posición de la trama de salida puede definirse por medio de la posición del puntero de salida. El puntero de entrada se incrementa en una cantidad fija, también conocida como tamaño de salto del bloque, y el puntero de salida se incrementa el factor de extensión de la sub banda multiplicado por la misma cantidad, es decir, por el tamaño de salto del bloque multiplicada por el factor de extensión de la sub banda. Una iteración de esta cadena de operaciones producirá una señal de salida con una duración que es el factor de extensión de la sub banda multiplicado por la duración de la señal de la sub banda de entrada (hasta la longitud de la ventana de síntesis) y con frecuencias complejas transpuestas por el factor de transposición de la sub banda.
Los datos de control 104 pueden tener un impacto en cualquiera de los bloques de procesamiento 201, 202, 203, 204 del procesamiento no lineal basado en bloques 102. En particular, los datos de control 104 pueden controlar la longitud de los bloques extraídos en el extractor de bloques 201. En una realización, la longitud del bloque se reduce cuando los datos de control 104 indican que la señal en el dominio en el tiempo es una señal transitoria, mientras que la longitud del bloque aumenta o se mantiene en la longitud más larga cuando los datos de control 104 indican que la señal en el dominio en el tiempo es una señal estacionaria. Alternativamente, o, además, los datos de control 104 pueden afectar a la unidad de procesamiento no lineal 202, por ejemplo. un parámetro utilizado dentro de la unidad de procesamiento no lineal 202, y/o a la unidad de ventana 203, por ej. la ventana utilizada en la unidad de ventana 203.
La figura 3 ilustra el funcionamiento de un ejemplo de procesamiento de bloque de sub bandas no lineal 102 con dos entradas de sub banda. Dados los valores destino de extensión del tiempo físico y transposición, y los parámetros físicos de los bancos de filtros de análisis y síntesis 101 y 103, se deducen los parámetros de extensión del tiempo de la sub banda y los parámetros de transposición, así como los dos índices de sub banda de origen para cada índice de sub banda destino. El destino del procesamiento del bloque de sub bandas es realizar la transposición, la extensión del tiempo correspondientes, o una combinación de transposición y extensión del tiempo de la combinación de las dos señales de sub banda de origen de valor complejo para producir la señal de la sub banda destino. El extractor de bloques 301 -1 muestrea una trama finita de muestras a partir de la primera sub banda origen de valor complejo y el extractor de bloques 301-2 muestrea una trama finita de muestras a partir de la segunda sub banda origen de valor complejo. En una realización, uno de los extractores de bloques 301 -1 y 301 -2 puede producir una muestra de sub banda única, es decir, uno de los extractores de bloques 301-1, 301-2 puede aplicar una longitud de bloque de una muestra. Las tramas pueden ser definidas por una posición común del puntero de entrada y por el factor de transposición de la sub banda. Las dos tramas extraídas en los extractores de bloques 301-1, 301­ 2, respectivamente, se someten a un procesamiento no lineal en la unidad 302. La unidad de procesamiento no lineal 302 genera normalmente una única trama de salida a partir de las dos tramas de entrada. Posteriormente, se abre una ventana para la trama de salida por medio de una ventana de longitud finita en la unidad 203. El proceso anterior se repite para un conjunto de tramas generadas a partir de un conjunto de tramas extraídas de dos señales de sub banda utilizando un tamaño de salto del bloque. El conjunto de tramas de salida se superpone y se agrega en una unidad de superposición y agregación 204. Una iteración de esta cadena de operaciones producirá una señal de salida cuya duración es el factor de extensión de la sub banda multiplicado por la más larga de las dos señales de sub banda de entrada (hasta la longitud de la ventana de síntesis). En caso de que las dos señales de sub banda de entrada porten las mismas frecuencias, la señal de salida tendrá frecuencias complejas transpuestas por el factor de transposición de la sub banda.
Como se describe en el contexto de la figura 2, los datos de control 104 se pueden usar para modificar el funcionamiento de los diferentes bloques del procesamiento no lineal 102, por ejemplo, el funcionamiento de los extractores de bloques 301-1, 301-2. Además, debe observarse que las operaciones anteriores se realizan normalmente para todas las señales de la sub banda de análisis proporcionadas por el banco de filtros de análisis 101 y para todas las señales de la sub banda de síntesis que entran dentro del banco de filtros de síntesis 103.
En el siguiente texto, se hará una descripción de los principios de la extensión del tiempo y transposición basados en bloques de sub bandas con referencia a las figuras 1-3, y mediante la adición de la terminología matemática adecuada.
Los dos parámetros de configuración principales del transponedor armónico y/o del extendedor del tiempo son • S<p : el factor de extensión del tiempo físico deseado; y
• Q<p : el factor de transposición físico deseado.
Los bancos de filtros 101 y 103 pueden ser de cualquier tipo complejo de modulación exponencial, tales como un QMF o un DFT de ventana o una transformada wavelet. El banco de filtros de análisis 101 y el banco de filtros de síntesis 103 pueden apilarse de manera ordenada o desordenada en la modulación y pueden definirse a partir de una amplia gama de prototipos de filtros y/o ventanas. Mientras que todas estas segundas opciones de orden afectan a los detalles en el diseño posterior, tales como las correcciones de fase y la gestión del mapeo de la sub banda, los principales parámetros de diseño del sistema para el procesamiento de sub banda generalmente pueden derivarse del conocimiento de los dos cocientes AtS/AtA, y AfS/AfA de, de los siguientes cuatro parámetros de banco de filtros, todos medidos en unidades físicas. En los cocientes anteriores,
• AtA, es la etapa de tiempo de muestra de la sub banda o paso de tiempo del banco de filtros de análisis 101 (por ejemplo, medido en segundos [s]);
• AfA es el espaciado de frecuencia de la sub banda del banco de filtros de análisis 101 (por ejemplo, medido en Hertz [1/s]);
• AtS es la etapa de tiempo de muestra de la sub banda o paso de tiempo del banco de filtros de síntesis 103 (por ejemplo, medido en segundos [s]); y
• AfS es el espaciado de frecuencia de la sub banda del banco de filtros de síntesis 103 (por ejemplo, medido en Hertz [1/s]).
Para la configuración de la unidad de procesamiento de sub banda 102, se deben calcular los siguientes parámetros:
• S: el factor de extensión de la sub banda, es decir, el factor de extensión que se aplica dentro de la unidad de procesamiento de sub banda 102 para lograr una extensión de tiempo físico general de la señal en el dominio en el tiempo por S<p;
• Q: el factor de transposición de la sub banda, es decir, el factor de transposición que se aplica dentro de la unidad de procesamiento de sub banda 102 para lograr una transposición de frecuencia física general de la señal en el dominio en el tiempo por el factor Q<p; y
• la correspondencia entre los índices de la sub banda de origen y destino, donde n indica un índice de una sub banda de análisis que entra en la unidad de procesamiento de sub banda 102, y m indica un índice de una sub banda de síntesis correspondiente en la salida de la unidad de procesamiento de sub banda 102.
Para determinar el factor de extensión de la sub banda S, se observa que una señal de entrada al banco de filtros de análisis 101 de duración física D corresponde a un número D / AtA, de muestras de sub bandas de análisis en la entrada de la unidad de procesamiento de sub banda 102. Estas D / AtA muestras se extenderán a S • D / AtA, muestras por medio de la unidad de procesamiento de sub banda 102, que aplica el factor de extensión de sub banda S. En la salida del banco de filtros de síntesis 103 estas S • D / AtA muestras dan como resultado una señal de salida que tiene una duración física de AtS • S • D / AtA. Dado que esta última duración debe cumplir con el valor especificado S<p • D, es decir, dado que la duración de la señal de salida en el dominio en el tiempo debe extenderse en el tiempo en comparación con la señal de entrada en el dominio en el tiempo por el factor de extensión de tiempo físico S<p, se obtiene la siguiente regla:
Figure imgf000012_0001
Para determinar el factor de transposición de sub bandas Q que se aplica dentro de la unidad de procesamiento de sub banda 102 para lograr una transposición física Q<p se observó que una entrada sinusoidal al banco de filtros de análisis 101 de frecuencia física Q daría lugar a una señal de sub banda de análisis compleja con una frecuencia discreta en el tiempo w = Q^ AtA, y la contribución principal se produce dentro de la sub banda de análisis con el índice n = Q / AfA, Una sinusoide de salida a la salida del banco de filtros de síntesis 103 de la frecuencia física transpuesta deseada Q<p • Q resultará de alimentar la sub banda de síntesis con el índice m = Q<p . Q / AfS, con una señal de sub banda compleja de frecuencia discreta Q<p • Q • AtS. En este contexto, se debe tener cuidado para evitar la síntesis de frecuencias de salida en alias diferentes de Qp.Q. Normalmente esto puede evitarse ejerciendo las opciones de segundo orden de acuerdo con lo descrito, por ejemplo. seleccionando los bancos de filtros de análisis/síntesis apropiados. La frecuencia discreta Q<p . Q . AtS en la salida de la unidad de procesamiento sub banda 102 debe corresponder con la frecuencia discreta en el tiempo w = Q . AtA en la entrada de la unidad de procesamiento de sub banda 102 multiplicada por el factor de transposición de sub banda Q. es decir, fijando igual Qp. Q . AtA y Qp • Q • AtS, y se puede determinar la siguiente relación entre el factor de transposición física Qp y el factor de transposición de sub banda Q:
Figure imgf000013_0001
Del mismo modo, el origen apropiado o el índice de sub bandas n de la unidad de procesamiento de sub banda 102 para un destino determinado o un índice de sub bandas de síntesis m deben obedecer a
Figure imgf000013_0002
En una realización, se sostiene que AfS / AfA = Qp, es decir, el espaciado de frecuencia del banco de filtros de síntesis 103 corresponde a la separación de frecuencias del banco de filtros de análisis 101 multiplicado por el factor de transposición físico, y se puede aplicar el mapeo uno a uno de análisis a índice de sub banda de síntesis n = m. En otras realizaciones, el mapeo del índice de sub bandas puede depender de los detalles de los parámetros del banco de filtros. En particular, si la fracción de la separación de frecuencias del banco de filtros de síntesis 103 y del banco de filtros de análisis 101 es diferente del factor de transposición físico Qp, una o dos sub bandas de origen pueden asignarse a una sub banda destino determinada. En el caso de dos sub bandas de origen, puede ser preferible usar dos sub bandas de origen contiguas con índice n, n 1, respectivamente. Es decir, la primera y la segunda sub bandas de origen vienen dadas por (n (m), n (m) 1) o (n (m) 1, n (m)).
El procesamiento de sub banda de la figura 2 con una sub banda de origen única se describirá a continuación como una función de los parámetros de procesamiento de sub banda S y Q. Sea x (k) la señal de entrada al extractor de bloques 201, y sea p el paso del bloque de entrada, es decir. x (k) es una señal de sub banda de análisis de valor complejo de una sub banda de análisis con índice n. El bloque extraído por el extractor de bloques 201 puede, sin pérdida de la generalidad, considerarse como definido por las muestras L = 2R 1
Figure imgf000013_0003
en donde el entero l es un índice de conteo de bloques, L es la longitud del bloque y R es un entero con R > 0. Obsérvese, que para Q = 1, el bloque se extrae a partir de muestras consecutivas, pero para Q > 1 el muestreo descendente se realiza de tal manera que las direcciones de entrada son extendidas por el factor Q. Si Q es un número entero, esta operación es normalmente sencilla de realizar, mientras que un método de interpolación puede ser necesario para valores no enteros de Q. Esta declaración es relevante también para los valores no enteros del incremento p, es decir, del paso del bloque de entrada. En una realización, los filtros de interpolación cortos, por ejemplo, los filtros que tienen dos tomas intermedias de filtro, se pueden aplicar a la señal de sub banda de valor complejo. Por ejemplo, si se requiere una muestra en el índice de tiempo fraccionario k 0,5, una interpolación de dos tomas de la forma x (k 0,5), ~ ax (k) bx (k 1) puede conducir a una calidad suficiente.
Un caso especial interesante de fórmula (4) es R = 0, donde el bloque extraído consiste en una sola muestra, es decir, la longitud del bloque es L = 1.
Con la representación polar de un número complejo “ =
Figure imgf000013_0004
Adonde Mes la magnitud del número complejo y es la fase del número complejo, la unidad de procesamiento no lineal 202 que produce la trama de salida yl, a partir de la trama de entrada xl se define ventajosamente por el factor de modificación de fase T = S Q por medio de
Figure imgf000013_0005
donde " Jes un parámetro ponderado de la magnitud geométrica. El caso p = 0 corresponde a una modificación de fase pura del bloque extraído. El parámetro de corrección de fase 0 depende de los detalles del banco de filtros y de los índices de sub banda de origen y destino. En una realización, el parámetro de corrección de fase 0 se puede determinar experimentalmente barriendo un conjunto de sinusoides de entrada. Además, el parámetro de corrección de fase 0 se puede derivar estudiando la diferencia de fase de sinusoides complejas de sub banda destino contiguas u optimizando el rendimiento para un tipo de impulso Dirac de señal de entrada. El factor de modificación de fase T debe ser un número entero tal que los coeficientes T-1 y 1 sean números enteros en la combinación lineal de fases en la primera línea de la fórmula (5). Con este supuesto, es decir, con el supuesto que el factor de modificación de fase T sea un número entero, el resultado de la modificación no lineal queda bien definido, aunque las fases sean ambiguas por la adición de múltiplos enteros arbitrarios de 2n.
En palabras, la fórmula (5) especifica que la fase de una muestra de trama de salida se determina desplazando la fase de una muestra de trama de entrada correspondiente un valor de desplazamiento constante. Este valor de desplazamiento constante puede depender del factor de modificación T, que a su vez depende del factor de extensión de la sub banda y/o del factor de transposición de la sub banda.
Además, el valor de desplazamiento constante puede depender de la fase de una muestra de trama de entrada en particular a partir de la trama de entrada. Esta muestra de trama de entrada en particular se mantiene fija para la determinación de la fase de todas las muestras de trama de salida de un bloque dado. En el caso de la fórmula (5), la fase de la muestra central de la trama de entrada se utiliza como la fase de la muestra de trama de entrada en particular. Además, el valor de desplazamiento constante puede depender de un parámetro de corrección de fase 0 que puede, por ejemplo, determinarse experimentalmente.
La segunda línea de fórmula (5) especifica que la magnitud de una muestra de la trama de salida puede depender de la magnitud de la muestra correspondiente de la trama de entrada. Además, la magnitud de una muestra de la trama de salida puede depender de la magnitud de una muestra de la trama de entrada en particular. Esta muestra de trama de entrada en particular puede usarse para determinar la magnitud de todas las muestras de trama de salida. En el caso de la fórmula (5), la muestra central de la trama de entrada se utiliza como muestra de trama de entrada en particular. En una realización, la magnitud de una muestra de la trama de salida puede corresponder a la media geométrica de la magnitud de la muestra correspondiente de la trama de entrada y a la muestra de la trama de entrada en particular.
En la unidad de ventana 203, se aplica una ventana w de longitud L a la trama de salida, que da como resultado la trama de salida con ventana
Figure imgf000014_0001
Finalmente, se supone que todas las tramas se extienden mediante ceros, y el funcionamiento de superposición y adición 204 se define por
z(k) = Y,z,(k~Spl), (7)
!
en donde se debe tener en cuenta que la unidad de superposición y adición 204 aplica un paso de bloque de Sp, es decir, un paso de tiempo que es S veces mayor que el paso del bloque de entrada p. Debido a esta diferencia en los pasos de tiempo de la fórmula (4) y (7) la duración de la señal de salida z (k) es S veces la duración de la señal de entrada x (k), es decir, la señal de sub banda de síntesis se ha extendido por el factor de extensión de la sub banda S en comparación con la señal de sub banda de análisis. Se debe tener en cuenta que esta observación generalmente se aplica si la longitud L de la ventana es despreciable en comparación con la duración de la señal.
Para el caso en el que se utiliza una sinusoide compleja como entrada para el procesamiento de sub banda 102, es decir, una señal de sub banda de análisis correspondiente a una sinusoide compleja
x(k) - C cxpQcok) , ( 8 )
se puede determinar aplicando las fórmulas (4) -(7) que la salida del procesamiento sub banda 102, es decir, la señal de sub banda de síntesis correspondiente, viene dada por
z{k) = |c| exp [i{TZC 0 Q c o k ^ w ik - Spl ) . (9)
i
Por lo tanto, una sinusoide compleja de frecuencia discreta en el tiempo w se transformará en una sinusoide compleja con frecuencia discreta en el tiempo Qw siempre que los desplazamientos de ventana con un paso de Sp sumen hasta el mismo valor constante K para todo k,
Figure imgf000014_0002
Es ilustrativo considerar el caso especial de transposición pura donde S = 1 y T = Q, si el paso del bloque de entrada es p = 1 y R = 0, todo lo anterior, es decir, principalmente la fórmula (5), se reduce a la regla de modificación de fase puntual o basada en la muestra
Figure imgf000015_0001
La ventaja de usar un tamaño de bloque R > 0 se hace evidente cuando una suma de sinusoides se considera dentro de una señal de sub banda de análisis x (k). El problema con la regla puntual (11) para una suma de sinusoides con frecuencias U1, U2..., un es que no solo las frecuencias deseadas Qu 1, Qu 2, Qun estarán presentes en la salida del procesamiento de sub banda 102, es decir, dentro de la señal de sub banda de síntesis z(k), sino
Figure imgf000015_0002
también en las frecuencias de productos de intermodulación de la forma n
Usando un bloque R > 0 y una ventana que satisfacen la fórmula (10), normalmente conduce a una supresión de esos productos de intermodulación. Por otra parte, un bloque largo conducirá a un mayor grado de emborronado de tiempo no deseado para señales transitorias. Además, para señales similares a trenes de impulsos, por ejemplo, la voz humana en caso de vocales o un único instrumento de tono, con un tono suficientemente bajo, los productos de intermodulación podrían ser deseables como se describe en el documento WO 2002/052545.
Para abordar el problema del rendimiento relativamente bajo del procesamiento de sub banda basado en bloques 102 para señales transitorias, se sugiere utilizar un valor distinto de cero del parámetro de magnitud de ponderación geométrica p > 0 en la fórmula (5). Se ha observado (véase, por ejemplo, la figura 7) que la selección de un parámetro de magnitud de ponderación geométrica p > 0 mejora la respuesta transitoria del procesamiento 102 de sub banda basado en bloques en comparación con el uso de la modificación de fase pura con p = 0, mientras se mantiene al mismo tiempo una potencia suficiente de supresión de la distorsión de intermodulación para señales estacionarias. Un valor particularmente atractivo de la ponderación de magnitud es p = 1-1/T, para el cual la fórmula de procesamiento no lineal (5) se reduce a las etapas de cálculo.
Figure imgf000015_0003
Estas etapas de cálculo representan una cantidad equivalente de complejidad computacional en comparación con el funcionamiento de una modulación de fase pura resultante del caso de p = 0 en la fórmula (5). En otras palabras, la determinación de la magnitud de las muestras de la trama de salida basadas en la fórmula de medias geométricas (5) utilizando la ponderación de magnitud p = 1-1 / T puede realizarse sin ningún costo adicional en complejidad computacional. Al mismo tiempo, el rendimiento de la transposición de armónicos para señales transitorias mejora, al tiempo que se mantiene el rendimiento de las señales estacionarias.
Como se ha descrito en el contexto de las figuras 1,2 y 3, el procesamiento de sub banda 102 puede mejorarse aún más aplicando los datos de control 104. En una realización, dos configuraciones del procesamiento de sub banda 102 que comparten el mismo valor de K en la fórmula (11) y que emplean diferentes longitudes de bloque pueden utilizarse para realizar un procesamiento de sub banda adaptable a la señal. El punto de partida conceptual en el diseño de una unidad de procesamiento de sub banda conmutable de configuración adaptable a la señal puede ser imaginar las dos configuraciones funcionando en paralelo con un conmutador selector en sus salidas, en donde la posición del conmutador selector depende de los datos de control 104. El compartir el valor K garantiza que el conmutador sea continuo en el caso de una única entrada sinusoidal compleja. Para señales en general el conmutador mecánico en un nivel de señal de sub banda es automáticamente puesto en ventanas por la estructura de bancos de filtros circundante 101,103 para no introducir efectos de conmutación en las señales de salida finales. Se puede mostrar que, como resultado del proceso de superposición y adición en la fórmula (7), se puede reproducir una salida idéntica a la del sistema de conmutación conceptual descrito anteriormente al costo computacional del sistema de la configuración con el bloque más largo. cuando los tamaños de los bloques sean suficientemente diferentes, y la velocidad de actualización de los datos de control no sea demasiado rápida. Por lo tanto, no hay penalización en la complejidad computacional asociada con una operación de adaptación de señal. De acuerdo con la descripción anterior, la configuración con la longitud de bloque más corta es más adecuada para señales periódicas transitorias y de tono bajo, mientras que la configuración con una longitud de bloque más larga es más adecuada para señales estacionarias. Como tal, puede usarse un clasificador de señal para clasificar extractos de una señal de audio en una clase transitoria y en una clase no transitoria, y para pasar esta información de clasificación como datos de control 104 a la unidad de procesamiento de sub banda de configuración conmutable adaptable a la señal 102. La unidad de procesamiento de sub banda 102 puede usar los datos de control 104 para establecer ciertos parámetros de procesamiento, por ejemplo, la longitud del bloque de los extractores de bloques.
A continuación, la descripción del procesamiento de sub banda se ampliará para cubrir el caso de la figura 3 con dos entradas de sub banda. Sólo se describirán las modificaciones que se realizan en el caso de entrada única. De lo contrario, se hace referencia a la información proporcionada anteriormente. Sea x (k) la señal de la sub banda de
entrada al primer extractor de bloques 301-1 y sea la señal de la sub banda de entrada al segundo extractor de bloques 301-2. El bloque extraído por el extractor de bloques 301-1 se define por la fórmula (4) y el bloque extraído por el extractor de bloques 301-2 consiste en la muestra de la sub banda simple
(0) = x(pl). (13)
Es decir. en la realización descrita, el primer extractor de bloques 301-1 usa una longitud de bloque de L, mientras que el segundo extractor de bloques 301-2 usa una longitud de bloque de 1. En tal caso, el procesamiento no lineal 302 produce la trama de salida yl, que puede ser definida por
Figure imgf000016_0001
y el resto del procesamiento en 203 y 204 es idéntico al procesamiento descrito en el contexto del caso de entrada única. En otras palabras, se sugiere reemplazar la muestra de la trama en particular de la fórmula (5) por la muestra de la sub banda individual extraída de la respectiva otra señal de análisis de sub banda.
En una realización, en la que la relación del espaciado de frecuencia AfS del banco de filtros de síntesis 103 y el espaciado de frecuencias AfA del banco de filtros de análisis 101 es diferente del factor de transposición físico Q<p deseado, puede ser beneficioso determinar las muestras de una sub banda de síntesis con índice m a partir de dos sub bandas de análisis con índice n, n 1, respectivamente. Para un índice m dado, el índice n correspondiente puede venir dado por el valor entero obtenido al truncar el valor n del índice de análisis dado por la fórmula (3). Una de las señales de la sub banda de análisis, por ejemplo, la señal de la sub banda de análisis correspondiente al índice n, se lleva al primer extractor de bloques 301-1 y a la otra señal de la sub banda de análisis, por ejemplo, la correspondiente al índice n 1, se lleva al segundo extractor de bloques 301-2. Basándose en estas dos señales de la sub banda de análisis se determina una señal de la sub banda de síntesis correspondiente al índice m de acuerdo con el procesamiento descrito anteriormente. La asignación de las señales de la sub banda de análisis adyacentes a los dos extractores de bloques 301-1 y 302-1 puede basarse en el resto que se obtiene al truncar el valor de índice de la fórmula (3), es decir, la diferencia del valor de índice exacto dado por la fórmula (3) y el valor entero truncado n obtenido de la fórmula (3). Si el resto es mayor que 0,5, entonces la señal de la sub banda de análisis correspondiente al índice n puede asignarse al segundo extractor de bloques 301-2, de lo contrario, esta señal de la sub banda de análisis se puede asignar al primer extractor de bloques 301 -1.
La figura 4 ilustra un escenario de ejemplo para la aplicación de transposición basada en bloques de sub banda utilizando varios órdenes de transposición en un códec de audio mejorado HFR. Se recibe un flujo de bits transmitido en el descodificador principal 401, lo que proporciona una señal principal descodificada de bajo ancho de banda a una frecuencia de muestreo fs. Esta señal principal descodificada de bajo ancho de banda también puede denominarse como el componente de baja frecuencia de la señal de audio. La señal a baja frecuencia de muestreo fs se puede volver a muestrear a la frecuencia de muestreo de salida. frecuencia 2 fs por medio de un banco de análisis QMF de 32 bandas de modulación compleja 402 seguido de un banco de síntesis QMF de 64 bandas (QMF inverso) 405. Los dos bancos de filtros 402 y 405 tienen los mismos parámetros físicos AtS = AtA, y AfS, = AfA, y la unidad de procesamiento HFR 404 normalmente deja pasar las sub bandas inferiores no modificadas correspondientes a la señal principal de bajo ancho de banda. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las sub bandas superiores del banco de síntesis QMF 405 de 64 bandas con las bandas de salida de la unidad de transposición múltiple 403, sujeto a la conformación y modificación espectral realizada por la unidad de procesamiento HFR 404. El transponedor múltiple 403 toma como entrada la señal principal descodificada y genera una multitud de señales de sub banda que representan el análisis de las 64 bandas de QMF de una superposición o combinación de varios componentes de la señal transpuesta. En otras palabras, la señal en la salida del transponedor múltiple 403 debe corresponder a las señales de sub banda de síntesis transpuestas que pueden llevarse a un banco de filtros de síntesis 103, que en el caso de la figura 4 está representado por el banco de filtros de QMF inverso 405.
Las posibles realizaciones de un transponedor múltiple 403 se describen en el contexto de las figuras 5 y 6. El destino del transponedor múltiple 403 es que, si el procesamiento HFR 404 se omite, cada componente corresponde a una transposición física entera sin extensión de tiempo de la señal principal, (Q = 2,3, ..., y S<p = 1). Para componentes transitorios de la señal principal, el procesamiento HFR a veces puede compensar la mala respuesta transitoria del transponedor múltiple 403, pero generalmente solo se puede alcanzar una calidad consistentemente alta si la respuesta transitoria del transponedor múltiple es satisfactoria. Como se describe en el presente documento, una señal de control del transponedor 104 puede afectar el funcionamiento del transponedor múltiple 403, y así garantizar una respuesta transitoria satisfactoria del transponedor múltiple 403. Alternativamente, o, además, el esquema de ponderación geométrica anterior (ver, por ejemplo, la fórmula (5) y/o la fórmula (14) puede contribuir a mejorar la respuesta transitoria del transponedor armónico 403.
La figura 5 ilustra un escenario de ejemplo para el funcionamiento de una unidad de transposición basada en bloques de sub banda de orden múltiple 403 aplicando un banco de filtros de análisis separado 502-2, 502-3, 502-4 por orden de transposición. En el ejemplo ilustrado, tres órdenes de transposición Q9 = 2,3,4 deben producirse y entregarse en el dominio de un banco QMF de 64 bandas que opera a una velocidad de muestreo de salida 2fs. La unidad de mezcla 504 selecciona y combina las sub bandas relevantes a partir de cada rama de factor de transposición en una sola multitud de sub bandas QMF para alimentar a la unidad de procesamiento HFR.
Considérese en primer lugar el caso de Q9 = 2. El destino es específicamente que la cadena de procesamiento de un análisis de QMF de 64 bandas 502-2, una unidad de procesamiento de sub banda 503-2 y una síntesis QMF de 64 bandas 405 dé como resultado una transposición física de Q9 = 2 con S9 = 1 (es decir, sin extensión).Al identificar estos tres bloques con las unidades 101, 102 y 103 de la figura 1, respectivamente, se encuentra que Ats/AtA = 1V y Afs/AfA = 2, de manera que las fórmulas (1) -(3) dan como resultado las siguientes especificaciones para la unidad de procesamiento de sub banda 503-2. La unidad de procesamiento de sub bandas 503-2 tiene que realizar una extensión de la sub banda de S = 2, una transposición de la sub banda de Q = 1(es decir, ninguno) y una correspondencia entre sub bandas de origen con índice n y sub bandas de destino con índice m dado por n = m (véase la fórmula (3)).
Para el caso de Q9 = 3, el sistema de ejemplo incluye un convertidor de velocidad de muestreo 501-3 que convierte la velocidad de muestreo de entrada hacia abajo por medio de un factor 3/2 desde a 2fs/3. El destino es específicamente que la cadena de procesamiento del análisis QMF de 64 bandas 502-3, la unidad 503-3 de procesamiento de sub banda y una síntesis de QMF de 64 bandas 405 resulten en una transposición física de Q9 = 3 con S<p = 1 (es decir, sin extensión). Al identificar los tres bloques anteriores con las unidades 101, 102 y 103 de la figura 1, respectivamente, se encuentra que debido al volver a muestrear Ats/AtA = 1/3 y Afs/AfA = 3 de modo que las fórmulas (1) -(3) proporcionan las siguientes especificaciones para la unidad de procesamiento de sub banda 503-3. La unidad de procesamiento de sub banda 503-3 tiene que realizar una extensión de la sub banda de S = 3, una transposición de la sub banda de Q = 1 (es decir, ninguna) y una correspondencia entre sub bandas de origen con índice n y sub bandas de destino con índice m dado por n = m (véase la fórmula (3)).
Para el caso Q9 = 4, el sistema de ejemplo incluye un convertidor de velocidad de muestreo 501-4 que convierte la frecuencia de muestreo de entrada hacia abajo por un factor dos de fs a fs/2. El destino es específicamente que la cadena de procesamiento del análisis QMF de 64 bandas 502-4, la unidad 503-4 de procesamiento de sub banda y una síntesis QMF de 64 bandas 405 resulten en una transposición física de Q9 = 4 con S9 = 1 (es decir, sin extensión). Al identificar estos tres bloques de la cadena de procesamiento con las unidades 101, 102 y 103 de la figura 1, respectivamente, se encuentra debido al re muestreo que Ats/AtA = 1/4 y Afs/AfA = 4 de modo que las fórmulas (1) -(3) proporcionan las especificaciones siguientes para la unidad de procesamiento de sub banda 503-4. La unidad de procesamiento de sub banda 503-4 tiene que realizar una extensión de la sub banda de S = 4, una transposición de la sub banda de Q = 1 (es decir, ninguna) y una correspondencia entre sub bandas de origen con n y sub bandas destino con índice m dado por n = m
Como conclusión para el escenario de ejemplo de la figura 5, las unidades de procesamiento de sub banda 504-2 a 503- 4 realizan extensiones de señal de sub banda pura y emplean el procesamiento de bloque de sub bandas no lineal de entrada única descrito en el contexto de la figura 2. Cuando está presente, la señal de control 104 puede afectar simultáneamente el funcionamiento de las tres unidades de procesamiento de sub banda. En particular, la señal de control 104 se puede utilizar para conmutar simultáneamente entre el procesamiento de longitud de bloque largo y el procesamiento de longitud de bloque corto dependiendo del tipo (transitorio o no transitorio) del extracto de la señal de entrada. Alternativamente, o, además, cuando las tres unidades de procesamiento de sub banda 504-2 a 504- 4 utilizan un parámetro de ponderación de magnitud geométrica distinto de cero p > 0, la respuesta transitoria del transponedor múltiple mejorará en comparación con el caso en el que p = 0.
La figura 6 ilustra un escenario de ejemplo para el funcionamiento eficiente de una transposición basada en bloque de sub bandas de orden múltiple que aplica un único banco de filtros de análisis QMF de 64 bandas. De hecho, el uso de tres bancos de análisis QMF separados y dos convertidores de velocidad de muestreo en la figura 5 da como resultado una complejidad computacional bastante alta, así como algunas desventajas de la realización para el procesamiento basado en tramas debido a la conversión de la velocidad de muestreo 501-3, es decir, una conversión de la velocidad de muestreo fraccional. Por lo tanto, se sugiere reemplazar las dos ramas de la transposición que comprenden las unidades 501-3 —► 502-3 —► 503-3y 501-4 —► 502-4 —► 503-4 pQr |as unidades de procesamiento de sub banda 603-3 y 603-4, respectivamente, mientras que la rama se mantiene sin cambios en comparación con la figura 5.Los tres órdenes de transposición se realizan en un dominio de banco de filtros con referencia a la figura 1, donde Ats/AtA = 1/2 y Afs/AfA = 2. En otras palabras, se utiliza un único banco de filtros de análisis 502-2 y un único banco de filtros de síntesis 405, lo que reduce la complejidad computacional general del transponedor múltiple.
Para el caso Q<p = 3, S<p = 1, las especificaciones para la unidad de procesamiento de sub banda 603-3 dadas por las fórmulas (1) -(3) son que la unidad de procesamiento de sub banda 603-3 tiene que realizar una extensión de sub bandas de S = 2 y una transposición de sub bandas de Q = 3/2, y que la correspondencia entre las sub bandas de origen con índice n y las sub bandas de destino con índice m viene dada por h m2hi/ 3- Para el caso Q<p = 4, S<p = 1, las especificaciones para la unidad de procesamiento de sub banda 603-4 dadas por las fórmulas (1) -(3) son que la unidad de procesamiento de sub banda 603-4 tiene que realizar una extensión de sub bandas de S = 2 y una transposición de sub bandas de Q=2, y que la correspondencia entre sub bandas de origen con índice n y sub bandas de destino con índice m viene dada por .
Se puede ver que la fórmula (3) no proporciona necesariamente un índice de valor entero n para una sub banda destino con el índice m. Como tal, puede ser beneficioso considerar dos sub bandas de origen contiguas para la determinación de una sub banda destino como se describió anteriormente (usando la fórmula (14)). En particular, esto puede ser beneficioso para las sub bandas de destino con índice m, para las cuales la fórmula (3) proporciona un valor no entero para el índice n. Por otro lado, las sub bandas destino con índice m, para las cuales la fórmula (3) proporciona un valor entero para el índice n, pueden determinarse a partir de la única sub banda de origen con índice n (usando la fórmula (5)). En otras palabras, se sugiere que se puede lograr una transposición armónica de calidad suficientemente alta mediante el uso de unidades de procesamiento de sub banda 603-3 y 603-4 utilizando ambas el procesamiento de bloque de sub bandas no lineales con dos entradas de sub banda como se describió en el contexto de la figura 3. Además, cuando está presente, la señal de control 104 puede afectar simultáneamente al funcionamiento de las tres unidades de procesamiento de sub banda. Alternativamente, o, además, cuando las tres unidades 503-2, 603-3, 603-4 hacen uso de un parámetro ponderado de magnitud geométrica p > 0, la respuesta transitoria del transponedor múltiple puede ser mejorada en comparación con el caso donde p = 0.
La figura 7 ilustra un ejemplo de respuesta transitoria para un tramo de tiempo basado en un bloque de sub bandas de factor dos. El panel superior muestra la señal de entrada, que es un repiqueteo muestreado a 16 kHz. Un sistema basado en la estructura de la figura 1 está diseñado con un banco de filtros de análisis QMF de 64 bandas 101 y un banco de filtros de síntesis QMF de 64 bandas 103. La unidad de procesamiento de sub banda 102 está configurada para realizar una extensión de sub banda de un factor S = 2, sin transposición de sub bandas (Q = 1) y un mapeo directo uno a uno de las sub bandas origen a destino. El paso del bloque de análisis es p = 1 y el radio del tamaño del bloque es R = 7, por lo que la longitud del bloque es L = 15 muestras de sub bandas que corresponde a 15.64 = 960 muestras en el dominio de la señal (dominio en el tiempo). La ventana w es un coseno elevado, por ejemplo, un coseno elevado al cuadrado. El panel central de la figura 7 representa la señal de salida de la extensión del tiempo que se extiende cuando se aplica una pura modificación de fase mediante la unidad de procesamiento de sub banda 102, es decir, se usa el parámetro de ponderación p = 0 para el procesamiento no lineal de bloques de acuerdo con la fórmula (5). El panel inferior representa la señal de salida de la extensión de tiempo cuando se utiliza el parámetro de ponderación de magnitud geométrica p = 1/2 para el procesamiento no lineal de bloques según la fórmula (5). Como puede verse, la respuesta transitoria es significativamente mejor en el último caso. En particular, se puede ver que el procesamiento de sub banda que utiliza el parámetro de ponderación p = 0 produce efectos 701 que se reducen significativamente (véase la referencia numérica 702) con el procesamiento de sub banda utilizando el parámetro de ponderación p = 1/2.
En el presente documento, se ha descrito un método y un sistema para HFR basada en transposición armónica y/o para la extensión de tiempo. El método y el sistema pueden realizarse con una complejidad computacional significativamente reducida en comparación con la HFR basada en la transposición armónica convencional, mientras que proporciona una transposición armónica de alta calidad para señales estacionarias y también para transitorias. La HFR basada en la transposición armónica utiliza el procesamiento de sub banda no lineal basado en bloques. Se propone el uso de datos de control dependientes de la señal para adaptar el procesamiento no lineal de sub bandas al tipo, por ejemplo. transitoria o no transitoria, de la señal. Además, el uso de un parámetro de ponderación geométrica se sugiere para mejorar la respuesta transitoria de la transposición armónica utilizando un procesamiento no lineal de sub bandas basado en bloques. Finalmente, se describe un método y un sistema de baja complejidad para HFR basado en la transposición armónica que utiliza un único par de bancos de filtros de análisis/síntesis para la transposición de armónicos y el procesamiento HFR. Los métodos y sistemas descritos pueden ser empleados en diversos dispositivos de descodificación, por ejemplo, en receptores multimedia, descodificadores de video/audio, dispositivos móviles, reproductores de audio, reproductores de video, etc.
Los métodos y sistemas para la transposición y/o reconstrucción de alta frecuencia y/o extensión de tiempo descritos en el presente documento pueden realizarse mediante software, firmware y/o hardware. Ciertos componentes pueden, por ejemplo. ser realizados como software ejecutándose en un procesador digital de señal o microprocesador. Otros componentes pueden, por ejemplo. Ser realizados como hardware o como circuitos integrados de aplicación específica. Las señales encontradas en los métodos y sistemas descritos pueden almacenarse en medios tales como memoria de acceso aleatorio o medios de almacenamiento óptico. Pueden transferirse a través de redes, como redes de radio, redes satelitales, redes inalámbricas o redes alámbricas, por ejemplo. Internet. Los dispositivos típicos que hacen uso de los métodos y sistemas descritos en el presente documento son dispositivos electrónicos portátiles u otros equipos de consumo que se utilizan para almacenar y/o procesar señales de audio. Los métodos y el sistema también se pueden utilizar en sistemas de ordenador, por ejemplo, servidores web de internet, que almacenan y proporcionan señales de audio, por ejemplo, señales musicales, para su descarga.

Claims (7)

REIVINDICACIONES
1. Un sistema configurado para generar una señal transpuesta en frecuencia y/o extendida en el tiempo a partir de una señal de entrada de audio, que comprende:
un banco de filtros de análisis (101) configurado para generar una pluralidad de señales de sub bandas de análisis a partir de la señal de entrada de audio; en el que cada señal de sub banda de análisis comprende una pluralidad de muestras de análisis de valor complejo en diferentes momentos, teniendo cada muestra de análisis una fase y una magnitud;
una unidad de procesamiento de sub banda (102) configurada para determinar una pluralidad de señales de sub bandas de síntesis a partir de la pluralidad de señales de sub bandas de análisis, en donde la unidad de procesamiento de las sub bandas (102) está configurada para determinar una señal de sub banda de síntesis entre la pluralidad de señales de sub bandas de síntesis a partir de una señal de sub banda de análisis entre la pluralidad de señales de sub bandas de análisis utilizando un factor de transposición de sub bandas Q y un factor de extensión de sub bandas S; al menos uno de Q o S es mayor que uno; donde la unidad de procesamiento de sub banda (102) comprende
un extractor de bloques (201) configurado para repetidamente
derivar una trama de L muestras de entrada a partir de la pluralidad de muestras de análisis de valor complejo de la señal de sub banda de análisis; siendo la longitud de trama L mayor que uno; y aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis de valor complejo, antes de derivar una trama siguiente de L muestras de entrada;
generando así un conjunto de tramas de L muestras de entrada; en donde, cuando Q es mayor que 1, el extractor de bloques (201) está configurado para muestrear en sentido descendente la pluralidad de muestras de análisis de valor complejo mediante el factor de transposición de sub bandas Q;
una unidad de procesamiento de trama no lineal (202) configurada para determinar una trama de muestras procesadas a partir de una trama de L muestras de entrada del conjunto de tramas, determinando para cada muestra procesada de la trama:
la fase de la muestra procesada, desplazando la fase de la muestra de entrada correspondiente mediante un valor de desplazamiento de fase constante, que está basado en la fase de una muestra de entrada predeterminada de la trama de L muestras de entrada, donde la muestra de entrada predeterminada se mantiene fija para la determinación de todas las muestras procesadas de la trama; y
la magnitud de la muestra procesada basada en la magnitud de la muestra de entrada correspondiente y basada en la magnitud de una muestra de entrada predeterminada de la trama de muestras de entrada L; y una unidad de superposición y adición (204) configurada para determinar la señal de la sub banda de síntesis mediante la superposición y la adición de las muestras de un conjunto de tramas de muestras procesadas; en donde la unidad de superposición y adición (204) aplica un tamaño de salto a tramas sucesivos de muestras procesadas, siendo el tamaño de salto igual al tamaño del salto del bloque p multiplicado por el factor de extensión de sub bandas S; y
un banco de filtros de síntesis (103) configurado para generar la señal extendida en el tiempo y/o transpuesta en frecuencia a partir de la pluralidad de señales de sub bandas de síntesis.
2. El sistema de la reivindicación 1, en el que el banco de filtros de análisis (101) es un banco de filtros de espejo en cuadratura, una transformada discreta de Fourier en ventana o una transformada wavelet; y en el que el banco de filtros de síntesis (103) es un banco de filtros correspondiente invertido o transformado.
3. El sistema de la reivindicación 2, en el que
el banco de filtros de análisis (101) es un banco de filtros de espejo de cuadratura de 64 puntos; y el banco de filtros de síntesis (103) es un banco de filtros de espejo en cuadratura de 64 puntos, invertido.
4. El sistema de cualquier reivindicación anterior, en el que
el banco de filtros de análisis (101) está configurado para aplicar un paso de tiempo de análisis AtA a la señal de audio de entrada;
el banco de filtros de análisis (101) tiene un espaciado de frecuencia de análisis AfA;
el banco de filtros de análisis (101) tiene un número N de sub bandas de análisis, con N > 1, donde n es un índice de sub banda de análisis con n = 0, N - 1;
una sub banda de análisis de las N sub bandas de análisis está asociada con una banda de frecuencia de la señal de audio de entrada;
el banco de filtros de síntesis (103) está configurado para aplicar un paso de tiempo de síntesis Ats a la señal de la sub banda de síntesis;
el banco de filtros de síntesis (103) tiene un espaciado de frecuencia de síntesis Afs;
el banco de filtros de síntesis (103) tiene un número M de sub bandas de síntesis, con M > 1, donde m es un índice de sub banda de síntesis con m = 0, ..., M - 1; y
una sub banda de síntesis de las M sub bandas de síntesis está asociada con una banda de frecuencia de la señal extendida en el tiempo y/o transpuesta de frecuencia.
5. El sistema de la reivindicación 4, en el que
el sistema está configurado para generar una señal que es extendida en el tiempo mediante un factor de extensión en el tiempo físico S<p y/o transpuesta en frecuencia mediante un factor de transposición de frecuencia física Q<p;
el factor de extensión de la sub banda viene dado por
Figure imgf000021_0001
el factor de transposición de la sub banda viene dado por
Figure imgf000021_0002
el índice de la sub banda de análisis n asociado con la señal de la sub banda de análisis y el índice de la sub banda de síntesis m asociado con la señal de la sub banda de síntesis están relacionados por
Figure imgf000021_0003
6. Un método para generar una señal extendida en el tiempo y/o transpuesta en frecuencia a partir de una de señal de audio de entrada, que comprende:
proporcionar una señal de sub banda de análisis a partir de la señal de audio de entrada; en el que la señal de la sub banda de análisis comprende una pluralidad de muestras de análisis de valor complejo en diferentes momentos, teniendo cada muestra de análisis una fase y una magnitud;
derivar una trama de L muestras de entrada a partir de la pluralidad de muestras de análisis de valor complejo de la señal de la sub banda de análisis; siendo la longitud de la trama L mayor que uno;
aplicar un tamaño de salto de bloque de p muestras a la pluralidad de muestras de análisis de valor complejo, antes de derivar una trama siguiente de L muestras de entrada; generando así un conjunto de tramas de L muestras de entrada;
determinar una trama de muestras procesadas a partir de una trama de L muestras de entrada del conjunto de tramas, determinando para cada muestra procesada de la trama:
la fase de la muestra procesada desplazando la fase de la muestra de entrada correspondiente mediante un valor de desplazamiento de fase constante, que está basado en la fase de una muestra de entrada predeterminada de la trama de L muestras de entrada, donde la muestra de entrada predeterminada se mantiene fija para la determinación de todas las muestras procesadas de la trama; y
la magnitud de la muestra procesada en función de la magnitud de la muestra de entrada correspondiente y en función de la magnitud de una muestra de entrada predeterminada de la trama de L muestras de entrada;
determinar una señal de la sub banda de síntesis mediante la superposición y adición de las muestras de un conjunto de tramas de muestras procesadas; y
generar la señal extendida en el tiempo extendido y/o transpuesta en frecuencia a partir de la señal de la sub banda de síntesis.
7. Un programa de ordenador que tiene instrucciones que, cuando se ejecutan mediante un dispositivo o sistema de ordenador, hacen que dicho dispositivo o sistema de ordenador lleve a cabo el método según la reivindicación 6.
ES19175681T 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada Active ES2836756T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US29624110P 2010-01-19 2010-01-19
US33154510P 2010-05-05 2010-05-05

Publications (1)

Publication Number Publication Date
ES2836756T3 true ES2836756T3 (es) 2021-06-28

Family

ID=43531026

Family Applications (6)

Application Number Title Priority Date Filing Date
ES11700033T Active ES2734179T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada
ES22189432T Active ES2955432T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de subbandas mejorada
ES22189443T Active ES2955433T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de subbandas mejorada
ES19175681T Active ES2836756T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada
ES19175682T Active ES2841924T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada
ES20206463T Active ES2930203T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES11700033T Active ES2734179T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada
ES22189432T Active ES2955432T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de subbandas mejorada
ES22189443T Active ES2955433T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de subbandas mejorada

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES19175682T Active ES2841924T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada
ES20206463T Active ES2930203T3 (es) 2010-01-19 2011-01-05 Transposición armónica basada en bloque de sub bandas mejorada

Country Status (17)

Country Link
US (10) US8898067B2 (es)
EP (7) EP4120264B1 (es)
JP (8) JP5329717B2 (es)
KR (13) KR101858948B1 (es)
CN (4) CN104318928B (es)
AU (1) AU2011208899B2 (es)
BR (6) BR122020020536B1 (es)
CA (9) CA3107943C (es)
CL (1) CL2012001990A1 (es)
ES (6) ES2734179T3 (es)
MX (1) MX2012007942A (es)
MY (2) MY164396A (es)
PL (6) PL3564954T3 (es)
RU (3) RU2518682C2 (es)
SG (3) SG182269A1 (es)
UA (1) UA102347C2 (es)
WO (1) WO2011089029A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
CA3220202A1 (en) * 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
JP2014041240A (ja) * 2012-08-22 2014-03-06 Pioneer Electronic Corp タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
KR102329309B1 (ko) * 2013-09-12 2021-11-19 돌비 인터네셔널 에이비 Qmf 기반 처리 데이터의 시간 정렬
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
BR112018005391B1 (pt) * 2015-09-22 2023-11-21 Koninklijke Philips N.V Aparelho para processamento de sinais de áudio, método de processamento de sinais de áudio, e dispositivo
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
KR102615903B1 (ko) * 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들
US11361506B2 (en) 2018-04-09 2022-06-14 Dolby Laboratories Licensing Corporation HDR image representations using neural network mappings
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
WO2019207036A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
RU2256293C2 (ru) 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3442974B2 (ja) 1997-07-30 2003-09-02 本田技研工業株式会社 吸収式冷凍機の精留装置
US6266003B1 (en) * 1998-08-28 2001-07-24 Sigma Audio Research Limited Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
AUPP829899A0 (en) * 1999-01-27 1999-02-18 Motorola Australia Pty Ltd Method and apparatus for time-warping a digitised waveform to have an approximately fixed period
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
JP3848181B2 (ja) * 2002-03-07 2006-11-22 キヤノン株式会社 音声合成装置及びその方法、プログラム
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
BRPI0306434B1 (pt) 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
RU2271578C2 (ru) * 2003-01-31 2006-03-10 Ооо "Центр Речевых Технологий" Способ распознавания речевых команд управления
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
JP2006070768A (ja) 2004-09-01 2006-03-16 Honda Motor Co Ltd 蒸発燃料処理装置
KR101220621B1 (ko) 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
US7472041B2 (en) 2005-08-26 2008-12-30 Step Communications Corporation Method and apparatus for accommodating device and/or signal mismatch in a sensor array
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
JP4760278B2 (ja) * 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
JP4693584B2 (ja) * 2005-10-18 2011-06-01 三洋電機株式会社 アクセス制御装置
TWI311856B (en) 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
EP4325723A3 (en) 2006-10-25 2024-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating time-domain audio samples
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
KR101239812B1 (ko) 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
RU2443028C2 (ru) * 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
TWI675367B (zh) 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
JP2013153596A (ja) * 2012-01-25 2013-08-08 Hitachi Ulsi Systems Co Ltd 充放電監視装置およびバッテリパック
CN105700923A (zh) 2016-01-08 2016-06-22 深圳市创想天空科技股份有限公司 安装应用程序的方法及系统

Also Published As

Publication number Publication date
US10109296B2 (en) 2018-10-23
JP6644856B2 (ja) 2020-02-12
KR20170060174A (ko) 2017-05-31
ES2955432T3 (es) 2023-12-01
EP2526550A1 (en) 2012-11-28
CA3200142C (en) 2024-02-20
CA3074099A1 (en) 2011-07-28
KR20180105757A (ko) 2018-09-28
PL4120263T3 (pl) 2023-11-20
RU2518682C2 (ru) 2014-06-10
CA2784564C (en) 2016-11-29
CN104318929A (zh) 2015-01-28
JP7475410B2 (ja) 2024-04-26
BR112012017651B1 (pt) 2021-01-26
KR20200030641A (ko) 2020-03-20
JP2016006526A (ja) 2016-01-14
CA3200142A1 (en) 2011-07-28
AU2011208899B2 (en) 2014-02-13
ES2841924T3 (es) 2021-07-12
EP3806096B1 (en) 2022-08-10
PL4120264T3 (pl) 2023-11-20
JP5329717B2 (ja) 2013-10-30
PL3564955T3 (pl) 2021-04-19
RU2665298C1 (ru) 2018-08-28
CN102741921B (zh) 2014-08-27
KR20170116166A (ko) 2017-10-18
US8898067B2 (en) 2014-11-25
US9741362B2 (en) 2017-08-22
SG10201408425QA (en) 2015-01-29
SG182269A1 (en) 2012-08-30
KR20120123338A (ko) 2012-11-08
CN104318928B (zh) 2017-09-12
KR101740912B1 (ko) 2017-05-29
CA3008914C (en) 2019-05-14
CA2945730A1 (en) 2011-07-28
EP3564955B1 (en) 2020-11-25
US20120278088A1 (en) 2012-11-01
KR101858948B1 (ko) 2018-05-18
JP2013516652A (ja) 2013-05-13
PL2526550T3 (pl) 2019-11-29
RU2014100648A (ru) 2015-07-20
AU2011208899A1 (en) 2012-06-14
CN102741921A (zh) 2012-10-17
BR112012017651A2 (pt) 2016-04-19
RU2644527C2 (ru) 2018-02-12
KR20230003596A (ko) 2023-01-06
RU2018130366A3 (es) 2022-03-17
US9431025B2 (en) 2016-08-30
CA3038582C (en) 2020-04-14
EP3564955A1 (en) 2019-11-06
KR102020334B1 (ko) 2019-09-10
CA3166284A1 (en) 2011-07-28
PL3564954T3 (pl) 2021-04-06
CA3107943C (en) 2022-09-06
CN104318930A (zh) 2015-01-28
MX2012007942A (es) 2012-08-03
MY164396A (en) 2017-12-15
CN104318928A (zh) 2015-01-28
KR20180053768A (ko) 2018-05-23
EP4120263B1 (en) 2023-08-09
WO2011089029A1 (en) 2011-07-28
US20180075865A1 (en) 2018-03-15
CN104318929B (zh) 2017-05-31
MY197452A (en) 2023-06-19
KR102091677B1 (ko) 2020-03-20
JP2023011648A (ja) 2023-01-24
JP6834034B2 (ja) 2021-02-24
KR20210002123A (ko) 2021-01-06
JP7160968B2 (ja) 2022-10-25
CA3225485A1 (en) 2011-07-28
JP2020064323A (ja) 2020-04-23
KR101902863B1 (ko) 2018-10-01
US20160343386A1 (en) 2016-11-24
JP6426244B2 (ja) 2018-11-21
ES2930203T3 (es) 2022-12-07
CA3107943A1 (en) 2011-07-28
EP4120264B1 (en) 2023-08-09
US9858945B2 (en) 2018-01-02
JP2019035971A (ja) 2019-03-07
KR20190104457A (ko) 2019-09-09
KR101343795B1 (ko) 2013-12-23
US20200388300A1 (en) 2020-12-10
CA3166284C (en) 2023-07-18
KR20130114270A (ko) 2013-10-16
US20230238017A1 (en) 2023-07-27
CL2012001990A1 (es) 2013-04-26
JP2017215607A (ja) 2017-12-07
KR20210158403A (ko) 2021-12-30
KR101663578B1 (ko) 2016-10-10
JP2014002393A (ja) 2014-01-09
EP3564954B1 (en) 2020-11-11
KR20160119271A (ko) 2016-10-12
KR102343135B1 (ko) 2021-12-24
EP3564954A1 (en) 2019-11-06
EP4120264A1 (en) 2023-01-18
US11341984B2 (en) 2022-05-24
CA3008914A1 (en) 2011-07-28
US11646047B2 (en) 2023-05-09
SG10202101744YA (en) 2021-04-29
US20220366929A1 (en) 2022-11-17
PL3806096T3 (pl) 2023-05-08
KR101964179B1 (ko) 2019-04-01
EP2526550B1 (en) 2019-05-22
BR122019025143B1 (pt) 2021-01-19
CA2784564A1 (en) 2011-07-28
CA3038582A1 (en) 2011-07-28
JP6189376B2 (ja) 2017-08-30
KR101783818B1 (ko) 2017-10-10
CA2945730C (en) 2018-07-31
BR122019025134B1 (pt) 2021-01-26
RU2018130366A (ru) 2020-02-21
KR102198688B1 (ko) 2021-01-05
EP3806096A1 (en) 2021-04-14
US20240127845A1 (en) 2024-04-18
BR122019025131B1 (pt) 2021-01-19
EP4250290A1 (en) 2023-09-27
EP4120263A1 (en) 2023-01-18
CA3074099C (en) 2021-03-23
CN104318930B (zh) 2017-09-01
ES2955433T3 (es) 2023-12-01
KR102478321B1 (ko) 2022-12-19
RU2012128847A (ru) 2014-01-20
US20190019528A1 (en) 2019-01-17
BR122020020536B1 (pt) 2021-04-27
JP5792234B2 (ja) 2015-10-07
US20170309295A1 (en) 2017-10-26
US11935555B2 (en) 2024-03-19
BR122019025154B1 (pt) 2021-04-13
UA102347C2 (ru) 2013-06-25
JP2021073535A (ja) 2021-05-13
ES2734179T3 (es) 2019-12-04
US20150032461A1 (en) 2015-01-29
US10699728B2 (en) 2020-06-30
KR20190034697A (ko) 2019-04-02

Similar Documents

Publication Publication Date Title
ES2836756T3 (es) Transposición armónica basada en bloque de sub bandas mejorada
AU2023202547B2 (en) Improved Subband Block Based Harmonic Transposition
AU2019240701B2 (en) Improved Subband Block Based Harmonic Transposition