ES2993572T3

ES2993572T3 - Cross product enhanced subband block based harmonic transposition

Info

Publication number: ES2993572T3
Application number: ES22202639T
Authority: ES
Inventors: Lars Villemoes
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2010-09-16
Filing date: 2011-09-05
Publication date: 2025-01-02
Anticipated expiration: 2031-09-05
Also published as: US9172342B2; KR101980070B1; CN104851429B; KR102564590B1; KR20220123752A; CL2013000717A1; US20170213563A1; US9735750B2; EP3503100A1; HUE072207T2; DK3975177T3; JP2016173603A; JP2020190757A; BR122019025121B1; CA3168514C; ES3036071T3; CA3043428A1; EP4148732B1; IL259070A; KR20180058847A

Abstract

La invención proporciona una implementación eficiente de reconstrucción de alta frecuencia (HFR) mejorada por productos cruzados, en la que se genera un nuevo componente en la frecuencia QΩ + rΩ0 sobre la base de los componentes existentes en Ω y Ω + Ω0. La invención proporciona una transposición armónica basada en bloques, en la que se procesa un bloque de tiempo de muestras de subbanda complejas con una modificación de fase común. La superposición de varias muestras modificadas tiene el efecto neto de limitar los productos de intermodulación no deseados, lo que permite utilizar una resolución de frecuencia más gruesa y/o un menor grado de sobremuestreo. En una realización, la invención incluye además una función de ventana adecuada para su uso con HFR mejorada por productos cruzados basada en bloques. Una realización de hardware de la invención puede incluir un banco de filtros de análisis (101), una unidad de procesamiento de subbanda (102) configurable mediante datos de control (104) y un banco de filtros de síntesis (103). (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Transposición armónica basada en bloque de subbanda mejorado de producto cruzado

Referencia cruzada a solicitud relacionada

Esta solicitud es una solicitud divisional europea de la solicitud de patente europea EP18198247.1 (referencia: D10079EP02), para la cual un formulario 1001 de la OEP se presentó el 2 de octubre de 2018.

Campo técnico

La presente invención se refiere a sistemas de codificación de origen de audio que hacen uso de un método de 5 transposición armónica para reconstrucción de alta frecuencia (HFR), a procesadores de efectos digitales, tales como excitadores que generan distorsión armónica para agregar brillo a una señal procesada y a estiradores de tiempo que prolongan una duración de señal con contenido espectral mantenido.

Antecedentes de la invención

El documento WO2010/081892 A2 y Huan Zhou et al. “Finalization of CE on QMF based harmonic transposer”, 93. Reunión MPEG: 26-7-2010, Ginebra (Motion Picture Expert Group o ISO/IEC JTC/SC29(WG11)), n° M17802, ambos describen transpositores armónicos basados en QMF con transposición de producto cruzado.

En el documento WO98/57436, el concepto de transposición se estableció como un método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un ahorro sustancial en la tasa de bits al utilizar este concepto en la codificación de audio. En un sistema de codificación de audio basado en HFR, se presenta una señal de bajo ancho de banda a un codificador de forma de onda central y las frecuencias más altas se regeneran utilizando transposición e información lateral adicional de tasa de bits muy baja que describe la forma espectral objetivo en el lado del decodificador. Para tasas de bits bajas, donde el ancho de banda de la señal codificada principal es estrecho, es cada vez más importante recrear una banda alta con características perceptualmente agradables. La transposición armónica definida en el documento WO98/57436 rinde muy bien para material musical complejo en una situación con baja frecuencia de cruce. El principio de una transposición armónica es que una sinusoide con frecuencia o se mapea a una sinusoide con frecuencia Q9“ donde Q9 > 1 es un número entero que define el orden de la transposición. En contraste con esto, una HFR basada en modulación de banda lateral única (SSB) mapea una sinusoide con frecuencia o a una sinusoide con frecuencia o Aro donde Aro es un desplazamiento de frecuencia fijo. Dada una señal principal con un ancho de banda bajo, un artefacto de timbre disonante resultará de la transposición de SSB.

Con el fin de alcanzar la mejor calidad de audio posible, los métodos de HFR armónicos de alta calidad del estado de la técnica emplean complejos bancos de filtros modulados con una resolución de frecuencia muy fina y un alto grado de sobremuestreo para alcanzar la calidad de audio requerida. La resolución fina es necesaria para evitar la distorsión de intermodulación no deseada que surge del tratamiento no lineal de sumas de sinusoides. Con subbandas suficientemente estrechas, los métodos de alta calidad apuntan a tener como máximo una sinusoide en cada una de las subbandas. Es necesario un alto grado de sobremuestreo en el tiempo para evitar distorsión de tipo de desdoble y es necesario un cierto grado de sobremuestreo en la frecuencia para evitar ecos previos para señales transitorias. El inconveniente obvio es que la complejidad computacional llega a ser muy alta.

Otro inconveniente común asociado con los transpositores armónicos se hace evidente para las señales con una estructura periódica prominente. Tales señales son sobreposiciones de sinusoides relacionadas armónicamente con frecuencias Q, 2Q, 3Q, ..., donde Q es la frecuencia fundamental. Tras la transposición armónica de orden Q<p, las sinusoides de salida tienen frecuencias Q9Q, 2Q9Q, 3Q9Q, ..., que, en caso de Q9 > 1, es solo un subconjunto estricto de las series completamente armónicas deseadas. En términos de calidad de audio resultante, se percibirá habitualmente un tono “fantasma” correspondiente a la frecuencia fundamental transpuesta Q9Q. A menudo, la transposición armónica resulta en un carácter sonoro “metálico” de la señal de audio codificada y decodificada.

En el documento WO2010/081892, el método de productos cruzados se desarrolló para abordar el problema del tono fantasma anterior en el caso de una transposición de alta calidad. Dada la información parcial o total transmitida sobre el valor de frecuencia fundamental de la parte armónica dominante de la señal a transponer con mayor fidelidad, las modificaciones de subbanda no lineales se complementan con combinaciones no lineales de al menos dos subbandas de análisis diferentes, donde las distancias entre los índices de subbanda de análisis están relacionados con la frecuencia fundamental. El resultado es regenerar los parciales faltantes en la salida transpuesta, lo que, sin embargo, ocurre a un costo computacional considerable.

Sumario de la invención

En vista de los inconvenientes anteriores de los métodos de HFR disponibles, un objeto de la presente invención es proporcionar una implementación más eficiente de HFR mejorado de productos cruzados. En particular, es un objeto proporcionar un método tal que permita una reproducción de audio de alta fidelidad con un esfuerzo computacional reducido en comparación con las técnicas disponibles.

La presente invención logra al menos uno de estos objetos proporcionando dispositivos y métodos como se establece en las reivindicaciones independientes.

En un primer aspecto, la invención proporciona un sistema configurado para generar una señal estirada en tiempo y/o transpuesta en frecuencia a partir de una señal de entrada de acuerdo con la reivindicación 1.

En un segundo aspecto, la invención proporciona un método para generar una señal estirada en tiempo y/o transpuesta en frecuencia a partir de una señal de entrada de acuerdo con la reivindicación 5.

Un tercer aspecto de la invención proporciona un producto de programa de ordenador que incluye un medio legible por ordenador (o soporte de datos) que almacena instrucciones de software para hacer que un ordenador programable ejecute el método de acuerdo con el segundo aspecto de acuerdo con la reivindicación 7.

La invención se basa en la constatación de que el concepto general de HFR mejorado de productos cruzados proporcionará mejores resultados cuando los datos se procesen organizados en bloques de muestras de subbandas complejas. Entre otras cosas, esto hace posible aplicar un desplazamiento de fase por trama a las muestras, que se ha encontrado que reduce los productos de intermodulación en algunas situaciones. También es posible aplicar un ajuste de magnitud, que puede llevar a efectos ventajosos similares. La implementación inventiva de HFR mejorado de productos cruzados incluye transposición armónica basada en bloque de subbanda, que puede reducir significativamente los productos de intermodulación. Por consiguiente, se puede utilizar un banco de filtros con una resolución de frecuencia más gruesa y/o un menor grado de sobremuestreo (tal como un banco de filtros de QMF) al tiempo que se conserva una alta calidad de salida. En el procesamiento basado en bloques de subbandas, un bloque de tiempo de muestras de subbandas complejas se procesa con una modificación de fase común y la superposición de varias muestras modificadas para crear una muestra de subbanda de salida, tiene el efecto neto de suprimir los productos de intermodulación que, de otra manera, ocurriría cuando la señal de subbanda de entrada consta de varias sinusoides. La transposición basada en el procesamiento de subbanda basado en bloques, tiene una complejidad computacional mucho menor que los transpositores de alta resolución y alcanza casi la misma calidad para muchas señales.

Para los fines de esta divulgación, se aprecia que la unidad de procesamiento no lineal utiliza como entrada Y tramas “correspondientes” de muestras de entrada en el sentido de que las tramas son síncronas o casi síncronas. P ej., las muestras en las respectivas tramas pueden relacionarse con intervalos de tiempo que tienen un solapamiento sustancial de tiempo entre las tramas. El término “correspondiente” también se utiliza con respecto a las muestras para indicar que éstas son síncronas o aproximadamente así. Además, el término “trama” se utilizará indistintamente con “bloque”. En consecuencia, el “tamaño de salto de bloque” puede ser igual a la longitud de trama (posiblemente ajustado con respecto al submuestreo, si se aplica) o puede ser más pequeño que la longitud de trama (posiblemente ajustado con respecto al submuestreo, si se aplica), en cuyo caso las tramas consecutivas se solapan en el sentido de que una muestra de entrada puede pertenecer a más de una trama. El sistema no necesariamente genera cada una de las muestras procesada en una trama al determinar su fase y magnitud, en base a la fase y la magnitud de todas las Y tramas correspondientes de las muestras de entrada; sin salir de la invención, el sistema puede generar la fase y/o la magnitud de algunas muestras procesadas en base a un número menor de correspondientes muestras de entrada, o en base a solo en una muestra de entrada.

En una realización, el banco de filtros de análisis es un banco de filtros de espejo en cuadratura (QMF) o un banco de pseudoQMF con cualquier número de tomas y puntos. Puede ser, por ejemplo, un banco de QMF de 64 puntos. El banco de filtros de análisis puede elegirse, además, de la clase de transformadas de Fourier discretas en ventana o transformadas ondículas. Ventajosamente, el banco de filtros de síntesis coincide con el banco de filtros de análisis al ser, respectivamente, un banco de QMF inverso, un banco de pseudo-QMF inverso, etc. Es sabido que dichos bancos de filtros pueden tener una resolución de frecuencia relativamente gruesa y/o un grado relativamente bajo de sobremuestreo. A diferencia de la técnica anterior, la invención puede realizarse utilizando tales componentes relativamente más simples sin que necesariamente sufran de una calidad de producción disminuida; por consiguiente, tales realizaciones representan una ventaja económica sobre la técnica anterior.

En una realización, uno o más de lo siguiente es cierto del banco de filtros de análisis:

• un trecho de tiempo de análisis es Ato;

• una separación de frecuencias de análisis es AfA;

• el banco de filtros de análisis incluye N > 1 subbandas de análisis indexadas por un índice n = 0, N-1 de subbandas de análisis;

• una subbanda de análisis está asociada con una banda de frecuencia de la señal de entrada.

En una realización, uno o más de lo siguiente es cierto del banco de filtros de síntesis:

• un trecho de tiempo de síntesis es Ats;

• una separación de frecuencias de síntesis es AfS;

• el banco de filtros de síntesis incluye M > 1 subbandas de análisis indexadas por un índice m = 0, ..., M-1 de subbandas de análisis;

• una subbanda de síntesis está asociada con una banda de frecuencia de la señal estirada en tiempo y/o transpuesta en frecuencia.

La unidad de procesamiento de trama no lineal está adaptada para ingresar dos tramas (Y = 2) con el fin de generar una trama de muestras procesadas y, la unidad de procesamiento de subbanda, incluye una unidad de control de procesamiento cruzado para generar datos de control de procesamiento cruzado. Al especificar mediante ello las características cuantitativas y/o cualitativas del procesamiento de subbanda, la invención logra flexibilidad y adaptabilidad. Los datos de control pueden especificar subbandas (p. ej., identificadas por índices) que difieren en frecuencia en una frecuencia fundamental de la señal de entrada. En otras palabras, los índices que identifican las subbandas pueden diferir en un número entero que se aproxima a la relación de dicha frecuencia fundamental dividida por la separación de la frecuencia de análisis. Esto conducirá a una salida psicoacústicamente agradable, ya que los nuevos componentes espectrales generados por la transposición armónica serán compatibles con la serie de armónicas naturales.

En un desarrollo adicional de la realización anterior, los índices de subbanda de análisis (entrada) y de síntesis (salida) se eligen para satisfacer la ecuación (16) a continuación. Un parámetroaque aparece en esta ecuación lo hace aplicable a bancos de filtros apilados de forma extraña y uniforme. Cuando los índices de subbanda obtenidos como una solución aproximada (p. ej., mínimos cuadrados) a la ecuación (16), el nuevo componente espectral obtenido por transposición armónica, probablemente, sea compatible con la serie de armónicas naturales. Por consiguiente, es probable que la HFR proporcione una reconstrucción fiel de una señal original a la que se haya eliminado su contenido de alta frecuencia.

Un desarrollo adicional de la realización anterior proporciona una manera de seleccionar el parámetro r que aparece en la ecuación (16) y que representa el orden de la transposición del producto cruzado. Dado un índice m de subbanda de salida, cada uno de los valores del orden r de transposición determinará dos índices rn, n<2>de subbanda de análisis. Este desarrollo adicional evalúa las magnitudes de las dos subbandas para un número r de opciones y selecciona ese valor que da maximizado el mínimo de las dos magnitudes de subbanda de análisis. Esta forma de seleccionar índices puede evitar la necesidad de restaurar suficiente magnitud al amplificar los componentes débiles de la señal de entrada, lo que puede llevar a una calidad de salida deficiente. A este respecto, las magnitudes de subbanda pueden calcularse de manera en sí conocida, tal como por la raíz cuadrada de las muestras de entrada al cuadrado que forman una trama (bloque) o parte de una trama. Una magnitud de subbanda también puede calcularse como una magnitud de una muestra central o casi central en una trama. Un cálculo tal puede proporcionar una medida de magnitud simple pero adecuada.

En un desarrollo adicional de la realización anterior, una subbanda de síntesis puede recibir contribuciones de instancias de transposición armónica de acuerdo con el procesamiento directo y el procesamiento basado en productos cruzados. A este respecto, se pueden aplicar criterios de decisión para determinar si se utilizará o no una posibilidad particular de regeneración de un parcial faltante mediante procesamiento basado en productos cruzados. Por ejemplo, este desarrollo adicional puede adaptarse para abstenerse de utilizar una unidad de procesamiento de subbanda cruzado si se cumple una de las siguientes condiciones:

a) la relación de la magnitud M<s>de la subbanda de análisis del término de origen directo que produce la subbanda de síntesis y la menor magnitud Mc en un par óptimo de términos de origen cruzados que producen la subbanda de síntesis, es mayor que una constante predeterminada;

b) la subbanda de síntesis ya recibe una contribución significativa de una unidad de procesamiento directo; c) una frecuencia fundamental Qo es menor que la separación AfA del banco de filtro de análisis.

En una realización, la invención incluye el submuestreo (decimación) de la señal de entrada. En verdad, una o más de las tramas de las muestras de entrada se pueden determinar submuestreando las muestras de análisis de valor complejo en una subbanda, como se puede hacer mediante el extractor de bloque.

En un desarrollo adicional de la realización anterior, los factores de submuestreo a aplicar satisfacen la ecuación (15) a continuación. No se permite que ambos factores de submuestreo sean cero, ya que esto corresponde a un caso trivial. La ecuación (15) define una relación entre los factores D<1>, D<2>de submuestreo con el factor S de estiramiento de subbanda y el factor Q de transposición de subbanda y, además, con los coeficientes T<1>, T<2>de fase que aparecen en una expresión (13) para determinar la fase de una muestra procesada. Esto asegura una coincidencia de la fase de las muestras procesadas con los otros componentes de la señal de entrada, a la que se agregarán las muestras procesadas.

En una realización, las tramas de muestras procesadas se establecen en ventanas antes de que se solapen y se agreguen. Una unidad de establecimiento de ventana puede adaptarse para aplicar una función de ventana de longitud finita a tramas de muestras procesadas. Funciones de ventana adecuadas se enumeran en las reivindicaciones adjuntas.

El inventor se ha dado cuenta de que los métodos de productos cruzados del tipo dado a conocer en el documento WO2010/081892 no son totalmente compatibles desde el principio con las técnicas de procesamiento basadas en bloque de subbanda. Aunque tal método puede aplicarse satisfactoriamente a una de las muestras de subbandas en un bloque, podría llevar a artefactos de desdoblamiento si se extendiese de manera directa a las otras muestras del bloque. Para este fin, una realización aplica funciones de ventana que comprenden muestras de ventana que se suman -cuando se ponderan con pesos complejos y se desplazan en un tamaño de salto- a una secuencia sustancialmente constante. El tamaño del salto puede ser el producto del tamaño h del salto del bloque y el factor S de estiramiento de subbanda. El uso de tales funciones de ventana reduce el impacto de los artefactos de desdoblamiento. Alternativa o adicionalmente, tales funciones de ventana también pueden permitir otras medidas para reducir artefactos, tales como rotaciones de fase de muestras procesadas. Preferiblemente, los pesos complejos consecutivos, que se aplican para evaluar la condición en las muestras de ventana, difieren solo en una rotación de fase fija. Además, preferiblemente, dicha rotación de fase fija es proporcional a una frecuencia fundamental de la señal de entrada. La rotación de fase también puede ser proporcional al orden de la transposición de productos cruzados a aplicar y/o al parámetro de transposición física y/o a la diferencia de los factores de submuestreo y/o al trecho de tiempo de análisis. La rotación de fase puede darse por la ecuación (21), al menos en un sentido aproximado.

En una realización, la presente invención permite la transposición armónica mejorada de productos cruzados modificando el establecimiento de ventanas de síntesis en respuesta a un parámetro de frecuencia fundamental. En una realización, tramas sucesivas de muestras procesadas se agregan con un cierto solapamiento. Para lograr el solapamiento adecuado, las tramas de las tramas procesadas se desplazan adecuadamente por un tamaño de salto, que es el tamaño h de salto de bloque sobreescalado por el factor S de estiramiento de subbanda. Por consiguiente, si el solapamiento de tramas consecutivas de muestras de entrada es L - h, entonces el solapamiento de tramas consecutivas de muestras procesadas puede ser S(L - h).

En un ejemplo ilustrativo que no es parte de la invención, el sistema de acuerdo con la invención es operable no solo para generar una muestra procesada en base a Y = 2 muestras de entrada, sino también en base solo a Y = 1 muestra. Por consiguiente, el sistema puede regenerar parciales faltantes no solo mediante un enfoque basado en productos cruzados (tal como mediante la ecuación (13)), sino también mediante un enfoque de subbanda directa (tal como mediante la ecuación (5) u (11)). Preferiblemente, una unidad de control está configurada para controlar el funcionamiento del sistema, incluyendo el enfoque que se utilizará para regenerar un parcial faltante particular.

En otro ejemplo ilustrativo que no es parte de la invención, el sistema está, además, adaptado para generar una muestra procesada sobre la base de más de tres muestras, es decir, para Y > 3. Por ejemplo, una muestra procesada puede obtenerse mediante múltiples casos de transposición armónica basada en productos cruzados, puede contribuir a una muestra procesada por múltiples instancias de procesamiento directo de subbanda, o por una combinación de transposición de productos cruzados y transposición directa. Esta opción de adaptar el método de transposición proporciona una HFR potente y versátil. En consecuencia, esta realización es operable para llevar a cabo el método de acuerdo con el segundo aspecto de la invención para Y = 3, 4, 5, etc.

Una realización está configurada para determinar una muestra procesada como un número complejo que tiene una magnitud que es un valor medio de las respectivas magnitudes de las correspondientes muestras de entrada. El valor medio puede ser una media aritmética (ponderada), geométrica (ponderada) o armónica (ponderada) de dos o más muestras de entrada. En el caso Y = 2, la media se basa en dos muestras de entrada complejas. Preferiblemente, la magnitud de la muestra procesada es un valor geométrico ponderado. Más preferiblemente, el valor geométrico es ponderado por los parámetros p y 1-p, como en la ecuación (13). En este caso, el parámetro p de ponderación de la magnitud geométrica es un número real inversamente proporcional al factor Q de transposición de subbanda. El parámetro p puede, además, ser inversamente proporcional al factor S de estiramiento.

En la invención, el sistema está adaptado para determinar una muestra procesada como un número complejo que tiene una fase que es una combinación lineal de respectivas fases de correspondientes muestras de entrada en las tramas de las muestras de entrada. En particular, la combinación lineal comprende fases relacionadas con dos muestras (Y = 2) de entrada. La combinación lineal de dos fases aplica coeficientes de número entero distinto de cero, la suma de los cuales es igual al factor S de estiramiento multiplicado por el factor Q de transposición de subbanda. Opcionalmente, la fase obtenida mediante dicha combinación lineal se ajusta adicionalmente mediante un parámetro de corrección de fase fija. La fase de la muestra procesada puede darse por la ecuación (13).

En la invención, el extractor de bloque (o una etapa análoga en un método de acuerdo con la invención), está adaptado para interpolar dos o más muestras de análisis de una señal de subbanda de análisis para obtener una muestra de entrada que se incluirá en una trama (bloque). Dicha interpolación puede permitir la mezcla descendente de la señal de entrada por un factor de número no entero. Las muestras de análisis a interpolar pueden o no ser consecutivas.

En una realización, la configuración del procesamiento de subbanda puede controlarse mediante datos de control proporcionados desde fuera de la unidad que efectúa el procesamiento. Los datos de control pueden referirse a propiedades acústicas momentáneas de la señal de entrada. Por ejemplo, el propio sistema puede incluir una sección adaptada para determinar las propiedades acústicas momentáneas de la señal, tal como la frecuencia fundamental (dominante) de la señal. El conocimiento de la frecuencia fundamental proporciona una guía para seleccionar las subbandas de análisis a partir de las cuales se derivarán las muestras procesadas. Adecuadamente, la separación de las subbandas de análisis es proporcional a dicha frecuencia fundamental de la señal de entrada. Como alternativa, los datos de control también pueden proporcionarse desde fuera del sistema, preferiblemente al incluirlos en un formato de codificación adecuado para la transmisión como un tren de bits a través de una red de comunicación digital. Además de los datos de control, dicho formato de codificación puede incluir información relacionada con los componentes de baja frecuencia de una señal (p. ej., componentes en la pos. 701 en la figura 7). Sin embargo, en aras de la economía de ancho de banda, el formato preferiblemente no incluye información completa relacionada con componentes de alta frecuencia (pos. 702), que puede ser regenerada por la invención. La invención puede proporcionar en particular un sistema de decodificación con una unidad de recepción de datos de control configurada para recibir dichos datos de control, ya sea incluidos en un tren de bits recibido que también codifica la señal de entrada o recibidos como una señal separada o tren de bits.

Una realización proporciona una técnica para realizar de manera eficiente los cálculos ocasionados por el método inventivo. Para este fin, una implementación de hardware puede incluir un prenormalizador para reescalar las magnitudes de las correspondientes muestras de entrada en algunas de las Y tramas en las que se basará una trama de muestras procesadas. Después de tal reescalado, se puede calcular una muestra procesada como un producto complejo (ponderado) de muestras reescaladas y, posiblemente, de entrada no reescaladas. Una muestra de entrada que aparece como un factor reescalado en el producto, normalmente no necesita volver a aparecer como un factor no reescalado. Con la posible excepción del parámetro 9 de corrección de fase, es posible evaluar la ecuación (13) como un producto de muestras de entrada complejas (posiblemente reescaladas). Esto representa una ventaja computacional en comparación con tratamientos separados de la magnitud y de la fase de una muestra procesada.

En una realización, un sistema configurado para el caso Y = 2 comprende dos extractores de bloque adaptados para formar una trama de muestras de entrada cada una, en funcionamiento paralelo.

En un ejemplo ilustrativo que no es parte de la invención que representa Y > 3, un sistema puede comprender una pluralidad de unidades de procesamiento de subbanda, cada una de las cuales está configurada para determinar una señal de subbanda de síntesis intermedia utilizando un factor de transposición de subbanda diferente y/o un factor de estiramiento de subbanda diferente y/o un método de transposición que difiere por ser basado en productos cruzados o directo. Las unidades de procesamiento de subbanda pueden estar dispuestas en paralelo, para funcionamiento en paralelo. En este ejemplo, el sistema puede comprender además una unidad de fusión dispuesta aguas abajo de las unidades de procesamiento de subbanda y aguas arriba del banco de filtros de síntesis. La unidad de fusión puede adaptarse para fusionar (p. ej., mezclando juntas) las correspondientes señales de subbanda de síntesis intermedias para obtener la señal de subbanda de síntesis. Como ya se apreció, la subbanda de síntesis intermedia que se fusiona, puede haber sido obtenida por transposición armónica directa y basada en productos cruzados. Un sistema de acuerdo con el ejemplo puede comprender, además, un decodificador central para decodificar un tren de bits en una señal de entrada. También puede comprender una unidad de procesamiento de HFR adaptada para aplicar información de banda espectral, en particular mediante la realización de conformación espectral. El funcionamiento de la unidad de procesamiento de HFR puede controlarse mediante información codificada en el tren de bits.

Una realización proporciona HFR de señales multidimensionales, p. ej., en un sistema para reproducir audio en un formato estéreo que comprende Z canales, como izquierda, derecha, centro, envolvente, etc. En una posible implementación para procesar una señal de entrada con una pluralidad de canales, las muestras procesadas de cada uno de los canales se basan en el mismo número de muestras de entrada, aunque el factor S de estiramiento y el factor Q de transposición para cada una de las bandas pueden variar entre canales. Para este fin, la implementación puede comprender un banco de filtros de análisis para producir Y señales de subbanda de análisis desde cada uno de los canales, una unidad de procesamiento de subbanda para generar Z señales de subbanda y un banco de filtros de síntesis para generar Z señales estiradas en tiempo y/o transpuestas en frecuencia que forman la señal de salida.

En variaciones a la realización anterior, la señal de salida puede comprender canales de salida que se basan en diferentes números de señales de subbanda de análisis. Por ejemplo, puede ser aconsejable dedicar una mayor cantidad de recursos computacionales a HFR de canales acústicamente prominentes; p. ej., los canales que se reproducirán mediante fuentes de audio ubicadas frente a un oyente pueden ser favorecidos sobre canales envolventes o traseros.

Breve descripción de los dibujos

La presente invención se describirá ahora as modo de ejemplos ilustrativos, sin limitar el alcance de la invención, con referencia a los dibujos que se acompañan.

La figura 1 ilustra el principio de la transposición armónica basada en bloques de subbandas.

La figura 2 ilustra el principio del procesamiento de bloque de subbanda no lineal con una entrada de subbanda. La figura 3 ilustra el funcionamiento del procesamiento de bloque de subbanda no lineal con dos entradas de subbanda.

La figura 4 ilustra el funcionamiento de la transposición armónica basada en subbanda mejorada de productos cruzados.

La figura 5 ilustra un escenario de ejemplo para la aplicación de la transposición basada en bloques de subbanda utilizando varios órdenes de transposición en un códec de audio mejorado de HFR.

La figura 6 ilustra un escenario de ejemplo para el funcionamiento de una transposición basada en bloques de subbandas de orden múltiple que aplica un banco de filtros de análisis de QMF de 64 bandas.

Las figuras 7 y 8 ilustran los resultados experimentales del método de transposición basado en bloques de subbandas descrito.

La figura 9 muestra un detalle de la unidad de procesamiento no lineal de la figura 2, que incluye un prenormalizador y un multiplicador.

Descripción de realizaciones preferidas

Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención TRANSPOSICIÓN ARMÓNICA BASADA EN BLOQUE DE SUBBANDA MEJORADO DE PRODUCTOS CRUZADOS. Se entiende que para otros expertos en la técnica serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento. La intención es, por lo tanto, que la invención esté limitada solo por el alcance de las reivindicaciones de patente adjuntas y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.

La figura 1 ilustra el principio de la transposición basada en bloque de subbanda, el estiramiento de tiempo o una combinación de transposición y estiramiento de tiempo. La señal del dominio del tiempo de entrada se alimenta a un banco 101 de filtros de análisis que proporciona una multitud de señales de subbanda de valor complejo. Éstas se envían a la unidad 102 de procesamiento de subbanda, cuyo funcionamiento puede verse influido por los datos 104 de control. Cada una de las subbandas de salida se puede obtener del procesamiento de una o de dos subbandas de entrada, o incluso como una superposición del resultado de varias de dichas subbandas procesadas. La multitud de subbandas de salida de valor complejo se alimenta a un banco 103 de filtros de síntesis, que a su vez genera la señal del dominio del tiempo modificada. Los datos 104 de control opcionales describen la configuración y los parámetros del procesamiento de subbanda, que pueden adaptarse a la señal a transponer. Para el caso de la transposición mejorada de productos cruzados, estos datos pueden transportar información relacionada con una frecuencia fundamental dominante.

La figura 2 ilustra el funcionamiento del procesamiento de bloque de subbanda no lineal con una entrada de subbanda con propósitos de ilustración sin ser parte de la invención. Dados los valores objetivo del estiramiento de tiempo y de la transposición física, y los parámetros físicos de los bancos 101 y 103 de filtros de análisis y de síntesis, se deducen los parámetros del estiramiento de tiempo y de la transposición de subbanda, así como un índice de subbanda de origen para cada uno de los índices de subbanda objetivo. El objetivo del procesamiento de bloque de subbanda es realizar la correspondiente transposición, el estiramiento de tiempo o una combinación de transposición y de estiramiento de tiempo de la señal de subbanda de origen de valor complejo para producir la señal de subbanda objetivo.

Un extractor 201 de bloque muestrea una trama finita de muestras de la señal de entrada de valor complejo. La trama se define mediante una posición de puntero de entrada y el factor de transposición de subbanda. Esta trama se somete a un procesamiento no lineal en la sección 202 de procesamiento y luego se establecen ventanas con ventanas de longitud finita y posiblemente variable en la sección 203 de establecimiento de ventana. Las muestras resultantes se agregan a las muestras de salida anteriores en una unidad 204 de solapamiento y adición donde la posición de la trama de salida se define por una posición del puntero de salida. El puntero de entrada se incrementa en una cantidad fija y el puntero de salida se incrementa por el factor de estiramiento de subbanda multiplicado por la misma cantidad. Una iteración de esta cadena de operaciones producirá una señal de salida cuya duración será el factor de estiramiento de subbanda multiplicado por la duración de la señal de la subbanda de entrada, hasta la longitud de la ventana de síntesis, y con frecuencias complejas transpuestas por el factor de transposición de subbanda. La señal 104 de control puede influir en cada una de las tres secciones 201, 202, 203.

La figura 3 ilustra el funcionamiento del procesamiento de bloque de subbanda no lineal con dos entradas de subbanda de acuerdo con la invención. Dados los valores objetivo de estiramiento de tiempo y de la transposición físicos, y los parámetros físicos de los bancos 101 y 103 de filtros de análisis y de síntesis, se deducen parámetros del estiramiento de tiempo y de la transposición de subbanda, así como dos índices de subbanda de origen para cada uno de los índices de subbanda objetivo. En caso de que el procesamiento de bloque de subbanda no lineal se utilice para la creación de parciales faltantes mediante la adición de productos cruzados, la configuración de las secciones 301-1, 301-2, 302, 303, así como los valores de los dos índices de subbanda de origen pueden depender de la salida 403 de una unidad 404 de control de procesamiento cruzado. El objetivo del procesamiento de bloque de subbanda es realizar la correspondiente transposición, estiramiento de tiempo o una combinación de transposición y estiramiento de tiempo de la combinación de las dos señales de subbanda de origen de valor complejo para producir la señal de subbanda objetivo. Un primer extractor 301-1 de bloques muestrea una trama de tiempo finito de muestras de la primera subbanda de origen de valor complejo y el segundo extractor 301-2 de bloques muestrea una trama finita de muestras de la segunda subbanda de origen de valor complejo. Las tramas están definidas por una posición de puntero de entrada común y el factor de transposición de subbanda. Las dos tramas se someten a un procesamiento no lineal en 302 y, luego, se establecen ventanas por una ventana de longitud finita en la sección 303 de establecimiento de ventana. La unidad 204 de solapamiento y adición puede tener una estructura similar o idéntica a la que se muestra en la figura 2. Una iteración de esta cadena de operaciones producirá una señal de salida cuya duración es el factor de estiramiento de subbanda multiplicado por la más larga de las dos señales de subbanda de entrada (hasta la longitud de la ventana de síntesis). En caso de que las dos señales de subbanda de entrada transporten las mismas frecuencias, la señal de salida tendrá frecuencias complejas transpuestas por el factor de transposición de subbanda. En el caso de que las dos subbandas las señales transporten diferentes frecuencias, la presente invención enseña que el establecimiento de ventana 303 puede adaptarse para generar una señal de salida que tiene una frecuencia objetivo adecuada para la generación de parciales faltantes en la señal transpuesta.

La figura 4 ilustra el principio de la transposición basada en bloque de subbanda mejorada de productos cruzados, estiramiento de tiempo, o una combinación de transposición y de estiramiento de tiempo. La unidad 401 de procesamiento de subbanda directa puede ser del tipo ya descrito con referencia a la figura 2 (sección 202) o la figura 3. Una unidad 402 de procesamiento de subbanda cruzada también se alimenta con la multitud de señales de subbanda de valor complejo y su funcionamiento es influenciado por los datos 403 de control de procesamiento cruzado. La unidad 402 de procesamiento de subbanda cruzado realiza el procesamiento de bloque de subbanda no lineal del tipo con dos entradas de subbanda descritas en la figura 3, y las subbandas objetivo de salida se agregan a las del procesamiento 401 directo de subbandas en el sumador 405. Los datos 403 de control de procesamiento cruzado pueden variar para cada una de las posiciones del puntero de entrada y consisten en al menos

• una lista seleccionada de índices de subbanda objetivo;

• un par de índices de subbanda de origen para cada uno de los índices de subbanda objetivo seleccionado; y

• una ventana de síntesis de longitud finita.

Una unidad 404 de control de procesamiento de cruzado proporciona estos datos 403 de control procesamiento cruzado dada una parte de los datos 104 de control que describen una frecuencia fundamental y la multitud de señales de subbanda de valor complejo emitidas desde el banco 101 de filtros de análisis. Los datos 104 de control, también pueden transportar otros parámetros de configuración dependientes de la señal que influyen en el procesamiento de productos cruzados.

En el siguiente texto, una descripción de los principios del bloque de subbanda de productos cruzados mejorados basado en el estiramiento de tiempo y la transposición se esbozará con referencia a las figuras 1-4, y agregando la terminología matemática apropiada.

Los dos principales parámetros de configuración de la trasposición de armónicas en general y/o de estiramiento de tiempo son

• S9: el factor de estiramiento de tiempo físico deseado; y

• Q9: el factor de transposición física deseado.

Los bancos 101 y 103 de filtros pueden ser de cualquier tipo exponencial complejo modulado tal como QMF o una DFT de ventana o una transformada ondícula. El banco 101 de filtros de análisis y el banco 103 de filtros de síntesis se pueden apilar de manera uniforme o extraña en la modulación y se pueden definir a partir de una amplia gama de prototipos de filtros y/o ventanas. Si bien todas estas elecciones de segundo orden afectan a los detalles en el diseño posterior, tales como correcciones de fase y gestión de mapeo de subbandas, los principales parámetros de diseño del sistema para el procesamiento de subbandas se pueden derivar típicamente a partir de los dos cocientes Aís/Aía y AfS/AfA de los siguientes cuatro parámetros de banco de filtros, todos medidos en unidades físicas. En los cocientes anteriores,

• AtA es la etapa de tiempo de muestra de subbanda o trecho de tiempo del banco 101 de filtros de análisis (p. ej., medido en segundos [s]);

• AfA es la separación de subbanda de frecuencia del banco 101 de filtros de análisis (p. ej., medida en hercios [1/s]);

• AtS es la etapa de tiempo de muestra de subbanda o trecho de tiempo del banco 103 de filtros de síntesis (p. ej., medido en segundos [s]); y

• AfS es la separación de frecuencia de subbanda del banco 103 de filtros de síntesis (p. ej., medida en hercios [1/s]).

Para la configuración de la unidad 102 de procesamiento de subbanda, deben calcularse los siguientes parámetros:

• S: el factor de estiramiento de subbanda, es decir, el factor de estiramiento que se aplica dentro de la unidad 102 de procesamiento de subbanda como una relación de las muestras de entrada y de salida para lograr un estiramiento de tiempo física general de la señal del dominio del tiempo por S9;

• Q: el factor de transposición de subbanda, es decir, el factor de transposición que se aplica dentro de la unidad 102 de procesamiento de subbanda para lograr una transposición de frecuencia física general de la señal de dominio del tiempo por el factor Q9; y

• la correspondencia entre los índices de subbanda de origen y objetivo, en donde n denota un índice de una subbanda de análisis que ingresa en la unidad 102 de procesamiento de subbanda y m denota un índice de una subbanda de síntesis correspondiente en la salida de la unidad 102 de procesamiento de subbanda.

Con el fin de determinar el factor S de estiramiento de subbanda, se observa que una señal de entrada al banco 101 de filtros de análisis de la duración D física, corresponde a un número D/Aía de muestras de subbanda de análisis en la entrada a la unidad 102 de procesamiento de subbanda. Estas D/A<ía>muestras se estirarán a S ■ D / A<ía>muestras por la unidad 102 de procesamiento de subbanda que aplica el factor S de estiramiento de subbandas. En la salida del banco 103 de filtros de síntesis estas S ■ D / A<ía>muestras resultan en una señal de salida que tiene una duración física de Aís ■ S ■ D / Aía. Dado que esta última duración debe cumplir con el valor especificado S9 ■ D, es decir, ya que la duración de la señal de salida de dominio del tiempo debería ser estirada en tiempo en comparación con la señal de entrada de dominio del tiempo por el factor S de estiramiento de tiempo físico S9, se obtiene la siguiente regla de diseño:

Con el fin de determinar la subbanda factor Q de trasposición que se aplica dentro de la unidad 102 de procesamiento de subbanda a fin de lograr una transposición Q<p física, se observa que una sinusoide de entrada al banco 101 de filtros de análisis de frecuencia Q física resultará en una señal de subbanda de análisis compleja con una frecuencia angular de tiempo discreto o = 2<tc>Q • AtA y la contribución principal se produce dentro de la subbanda de análisis con índice n = Q/AfA. Una sinusoide de salida en la salida del banco 103 de filtros de síntesis de la frecuencia Q<p • Q física transpuesta deseada, resultará de la alimentación de la subbanda de síntesis con el índice m = Q<p • Q / Afs con una señal de subbanda compleja de frecuencia 2^Q9 • Q • Ats angular discreta. En este contexto, se debe tener cuidado para evitar la síntesis de frecuencias de salida desdobladas diferentes de Q<p • Q. Típicamente esto puede evitarse haciendo elecciones apropiadas de segundo orden como se discutió, p. ej., seleccionando bancos de filtros de análisis y/o de síntesis apropiados. La frecuencia 2^Q9 • Q • Ats discreta en la salida de la unidad 102 de procesamiento de subbanda debe corresponder a la frecuencia o = 2tcQ • AtA de tiempo discreta en la entrada de la unidad 102 de procesamiento de subbanda multiplicada por el factor Q de transposición de subbanda. Es decir, al igualar 2^QQAtA y 2^Q9 • Q • Ats, se puede determinar la siguiente relación entre el factor Q<p de transposición física y el factor Q de transposición de subbanda:

Del mismo modo, el índice n de subbanda de origen o de análisis apropiado de la unidad 102 de procesamiento de subbanda para un índice m de subbanda objetivo o de síntesis dado debe cumplir

En una realización, se cumple que Afs/AfA = Q<p, es decir, la separación de frecuencias del banco 103 de filtros de síntesis corresponde a la separación de frecuencias del banco 101 de filtros de análisis multiplicado por el factor de transposición física, y se puede aplicar el mapeo uno a uno de índice n = m de subbanda de análisis a de síntesis. En otras realizaciones, el mapeo de índice de subbanda puede depender de los detalles de los parámetros del banco de filtros. En particular, si la fracción de la separación de frecuencia del banco 103 de filtros de síntesis y del banco 101 de filtros de análisis es diferente del factor Q<p de transposición física, se pueden asignar una o dos subbandas de origen a una subbanda objetivo dada. En el caso de dos subbandas de origen, puede ser preferible utilizar dos subbandas de origen adyacentes con el índice n, n 1, respectivamente. Es decir, la primera y la segunda subbanda de origen vienen dadas por (n(m), n(m) 1) o (n(m) 1, n(m)).

La subbanda de procesamiento de la figura 2 con una única subbanda de origen, se describe a continuación como una función de los parámetros S y Q de procesamiento de subbanda. Sea x(k) la señal de entrada al extractor 201 de bloque, y sea h el trecho de bloque de entrada. Es decir, x(k) es una señal de subbanda de análisis de valor complejo de una subbanda de análisis con índice n. El bloque extraído por el extractor 201 de bloque puede, sin pérdida de generalidad, considerarse como definido por las L = R<1>+ R<2>muestras

en donde el número entero l es un índice de conteo de bloques, L es la longitud del bloque y R<1>, R<2>son números enteros no negativos. Apréciese que para Q = 1, el bloque se extrae de muestras consecutivas, pero para Q > 1, se lleva a cabo un submuestreo de tal manera que las direcciones de entrada se estiran por el factor Q. Si Q es un número entero, esta operación suele ser sencilla de realizar, mientras que puede requerirse un método de interpolación para valores no enteros de Q. Esta declaración es relevante también para los valores de número no entero del incremento h, es decir, de el trecho de bloque de entrada. En una realización, los filtros de interpolación cortos, p. ej., filtros que tienen dos tomas de filtro, pueden aplicarse a la señal de subbanda de valor complejo. Por ejemplo, si se requiere una muestra en el índice k 0,5 de tiempo fraccionario, una interpolación de dos tomas de la forma x(k+0,5) = ax(k) bx(k+1), donde los coeficientes a, b pueden ser constantes o pueden depender de un índice de subbanda (véanse, p. ej., el documento WO2004/097794 y el documento WO2007/085275), puede garantizar una calidad suficiente.

Un caso especial interesante de la fórmula (4) es R<1>= 0, R<2>= 1 donde el bloque extraído consiste en una sola muestra, es decir la longitud de bloque es L = 1.

Con la representación polar de un número complejo z = |z| exp(izz), en donde |z| es la magnitud del número complejo y zz es la fase del número complejo, la unidad 202 de procesamiento no lineal que produce la trama yl de salida a partir de la trama<xi>de entrada se define ventajosamente por el factor de modificación de fase T = SQ a través de

donde p e [0, 1] es un parámetro de ponderación de magnitud geométrica. El caso p = 0 corresponde a una modificación de fase pura del bloque extraído. Un valor particularmente atractivo de la ponderación de la magnitud es p = 1 - 1/T para el que se obtiene un cierto alivio de complejidad computacional independientemente de la longitud del bloque L, y la respuesta transitoria resultante se mejora algo con respecto al caso p = 0. El parámetro 9 de corrección de fase depende de los detalles del banco de filtros y de los índices de subbanda de origen y objetivo. En una realización, el parámetro 9 de corrección de fase puede determinarse experimentalmente barriendo un conjunto de sinusoides de entrada. Además, el parámetro 9 de corrección de fase se puede derivar estudiando la diferencia de fase de sinusoides complejas de subbanda objetivo adyacentes u optimizando el rendimiento para un tipo de impulso de Dirac de la señal de entrada. Finalmente, con un diseño adecuado de los bancos 101 y 103 de filtros de análisis y de síntesis, el parámetro 9 de corrección de fase puede ajustarse a cero, u omitirse. El factor T de modificación de fase debe ser un número entero tal que los coeficientes T-1 y 1 sean números enteros en la combinación lineal de fases en la primera línea de la fórmula (5). Con esta suposición, es decir, con la suposición de que el factor T de modificación de fase es un número entero, el resultado de la modificación no lineal está bien definido aunque las fases son ambiguas por la identificación módulo 2tc.

En palabras, la fórmula (5) especifica que la fase de una muestra de trama de salida se determina mediante el desplazamiento de la fase de una correspondiente muestra de trama de entrada por un valor de desplazamiento constante. Este valor de desplazamiento constante puede depender del factor T de modificación, que a su vez depende del factor de estiramiento de subbanda y/o del factor de transposición de subbanda. Además, el valor de desplazamiento constante puede depender de la fase de una muestra de trama de entrada particular desde la trama de entrada. Esta muestra de trama de entrada particular se mantiene fija para la determinación de la fase de todas las muestras de trama de salida de un bloque dado. En el caso de la fórmula (5), la fase de la muestra central de la trama de entrada se utiliza como la fase de la muestra de trama de entrada particular.

La segunda línea de la fórmula (5), especifica que la magnitud de una muestra de la trama de salida puede depender de la magnitud de la correspondiente muestra de la trama de entrada. Además, la magnitud de una muestra de la trama de salida puede depender de la magnitud de una muestra de trama de entrada particular. Esta muestra de trama de entrada particular puede utilizarse para la determinación de la magnitud de todas las muestras de trama de salida. En el caso de la fórmula (5), la muestra central de la trama de entrada se utiliza como muestra de trama de entrada particular. En una realización, la magnitud de una muestra de la trama de salida puede corresponder a la media geométrica de la magnitud de la correspondiente muestra de la trama de entrada y la muestra de la trama de entrada particular.

En la unidad 203 de establecimiento de ventana, una ventana w de longitud L se aplica sobre la trama de salida, resultando en la trama de salida de ventana

zl(k) = w(k)y,(k), k = -R í,...R2- 1 . (6)

Finalmente, se asume que todas las tramas están extendidas por ceros y la operación 204 de solapamiento y adición se define por

z(k)- 'YJz¡(k-Shl), (1)

i

en donde se debe apreciar que la unidad 204 de solapamiento y adición aplica un trecho de bloque de Sh, es decir, un trecho de tiempo que es S veces más alto que el trecho h de bloque de entrada. Debido a esta diferencia en los trechos de tiempo de las fórmulas (4) y (7), la duración de la señal z(k) de salida es S multiplicado por la duración de la señal x(k) de entrada, es decir, la señal de subbanda de síntesis se ha estirado por el factor S de estiramiento de subbanda en comparación con la señal de subbanda de análisis. Se debe apreciar que esta observación se aplica normalmente si la longitud L de la ventana es despreciable en comparación con la duración de la señal.

Para el caso en el que una sinusoide compleja se utiliza como entrada al procesamiento 102 de subbanda, es decir, un análisis de señal de subbanda correspondiente a una sinusoide compleja

x(k) = Cexp(uok), (8)

puede determinarse al aplicar las fórmulas (4) - (7) que la salida del procesamiento 102 de subbanda, es decir, la correspondiente señal de subbanda de síntesis, viene dada por

z(k) —|C|exp[/(7VC0 Q(’’ lí ] \y \w (k — Shl) .

i<(>9<)>

independientemente de p. Por consiguiente, una sinusoide compleja de frecuencia de tiempo discreta o se transformará en una sinusoide compleja con frecuencia Qo de tiempo discreta proporcionar los desplazamientos de ventana de síntesis con un trecho de Sh sumada hasta el mismo valor K constante para todo k,

Ew(k - Shl) - K .(10)

Es ilustrativo considerar el caso especial de la transposición pura donde S = 1 y T = Q. Si el trecho del bloque de entrada es h = 1 y R<1>= 0, R<2>= 1, todo lo anterior, es decir, notablemente la fórmula (5), se reduce a la regla de modificación de fase por punto o basada en muestra

La unidad 102 de procesamiento de subbanda puede utilizar los datos 104 de control para establecer ciertos parámetros de procesamiento, p. ej. la longitud de bloque de los extractores de bloque.

En lo siguiente, la descripción del procesamiento de subbanda se extenderá para cubrir el caso de la figura 3 con dos subbanda de entrada. Sea x(1)(k) la señal de subbanda de entrada al primer extractor 301-1 de bloque y sea x(2)(k) la señal de subbanda de entrada al segundo extractor 301-2 de bloque. Cada uno de los extractores puede utilizar un factor de submuestreo diferente, lo que conduce a los bloques extraídos

\x\'\k) = x{'\D,k hl)

\ ‘1k=-R,,...R1-1(12)

[x'¡n {k) = xp-'{D1k hl)\'

El procesamiento 302 no lineal produce la trama yl de salida y puede estar definido por

el procesamiento en 303 se describe de nuevo por (6) y (7) y 204 es idéntico al procesamiento de solapamiento y adición descrito en el contexto del caso de entrada única.

La definición de los parámetros D<1>, D<2>, p de número real no negativo y los parámetros T<1>, T<2>de numero entero no negativo y la ventana w de síntesis, ahora depende del modo de funcionamiento deseado. Apréciese que, si la misma subbanda se alimenta a ambas entradas, x(1)(k) = x(2)(k) y D<1>= Q, D<2>= 0, T<1>= 1, T<2>= T-1, las operaciones en (12) y (13) se reducen a las de (4) y (5) en el caso de entrada única.

En una realización, en donde la relación de la separación AfS de frecuencia del banco 103 de filtros de síntesis y la separación AfA de frecuencia del banco 101 de filtros de análisis es diferente del factor Q9 de transposición física deseado, puede ser beneficioso determinar las muestras de una subbanda de síntesis con el índice m a partir de dos subbandas de análisis con el índice n, n+1, respectivamente. Para un índice m dado, el correspondiente índice n puede estar dado por el valor de número entero obtenido truncando el valor n de índice de análisis dado por la fórmula (3). Una de las señales de subbanda de análisis, p. ej., la señal de subbanda de análisis correspondiente al índice n, se alimenta al primer extractor 301-1 de bloque y la otra señal de subbanda de análisis, p. ej. la correspondiente al índice n+1, se alimenta al segundo extractor 301-2 de bloque. En base a estas dos señales de subbanda de análisis, una señal de subbanda de síntesis correspondiente al índice m se determina de acuerdo con el procesamiento descrito anteriormente. La asignación de las señales de subbanda de análisis adyacentes a los dos extractores 301-1 y 302-1 de bloque, puede ser en base al resto que se obtiene al truncar el valor de índice de la fórmula (3), es decir, la diferencia del valor de índice exacto dado por la fórmula (3) y el valor n de número entero truncado obtenido de la fórmula (3). Si el resto es mayor que 0,5, entonces la señal de subbanda de análisis correspondiente al índice n puede asignarse al segundo extractor 301-2 de bloque, de lo contrario, esta señal de subbanda de análisis se puede asignar al primer extractor 301-1 de bloque. En este modo de funcionamiento, los parámetros pueden ser diseñados de tal manera que las señales de subbanda de entrada que comparten la misma frecuencia o compleja,

Jxn,(£) = C,exp(¿o£) |

|x (2’(i) = C2 exp(/fflír)j

conducen a una salida de subbanda, siendo la señal una sinusoide compleja con una frecuencia Qo de tiempo discreta. Resulta que esto sucede si se cumplen las siguientes relaciones:

Para el modo de funcionamiento de generación de parciales faltantes por medio de productos cruzados, los criterios de diseño son diferentes. Volviendo al parámetro Q9 de transposición física, el objetivo de una adición de productos cruzados es producir una salida en las frecuencias Q<pQ rQ<0>para r = 1, ..., Q<p-1 dadas entradas en las frecuencias Q y Q+Q<0>, donde Q<0>es una frecuencia fundamental que pertenece a una componente de tono dominante de la señal de entrada. Como se describe en el documento WO2010/081892, la adición selectiva de esos términos dará como resultado la finalización de la serie de armónicas y una reducción significativa del artefacto de tono fantasma.

Ahora se esbozará un algoritmo constructivo para el funcionamiento del procesamiento 404 de control cruzado. Dado un índice m de subbanda de salida objetivo, el parámetro r = 1, ..., Q9-1 y la frecuencia fundamental Q<0>, se pueden deducir los índices n y n<2>de subbanda de origen apropiados mediante la resolución del siguiente sistema de ecuaciones en un sentido aproximado,

dondea= 1/2 para la modulación de bancos de filtros extrañamente apilados (como se utiliza generalmente para los bancos de filtros de QMF y de MDCT) ya= 0 para la modulación de bancos de filtros apilados uniformemente (como se utiliza generalmente para los bancos de filtros de FFT).

Con las definiciones

• p = Q<0>/AfA: la frecuencia fundamental medida en unidades de separación de frecuencia del banco de filtros de análisis;

• F = AfS/AfA: el cociente de la separación frecuencias de subbanda de síntesis y de análisis; y

n<,>---(-m--+---a--)-F---~--r--p---a

•Q<p: el valor de número real objetivo para un índice de origen inferior de valor de número entero,

se da un ejemplo de solución aproximada ventajosa para (16) al seleccionar m como el número entero más cercano a nf, y n<2>como el número entero más cercano a nf p.

Si la frecuencia fundamental es menor que la separación del banco de filtros de análisis, es decir, si p < 1, puede ser ventajoso cancelar la adición de un producto cruzado.

Como se enseña en el documento WO2010/081892, un producto cruzado no debe añadirse a una subbanda de salida que ya tiene una contribución principal significativa de la transposición sin productos cruzados. Además, en la mayoría de los casos, r = 1, ..., Q9-1 debería contribuir a salida del producto cruzado. Aquí, estas reglas se pueden llevar a cabo realizando las siguientes tres etapas para cada uno de los índices m de subbanda de salida objetivo:

1. Calcular la Mc máxima en todas las elecciones de r = 1, ..., Q9-1 del mínimo de las magnitudes |x(1)| y |x(2)| de subbanda de origen candidata evaluada en (o desde la vecindad de) el intervalo k = hl de tiempo central, en donde las subbandas de origen x(1) y x(2) pueden estar dadas por los índices m y n<2>como en la ecuación (16);

2. Calcular la magnitud correspondiente de Ms para el término |x| de origen directo obtenido de una subbanda denas —F m

origen con índice-v(refiérase a la ecuación 3);

3. Activar el término cruzado de una elección ganadora para Me en el punto 1 anterior solo si Me > qMs, donde q es un valor de umbral predeterminado.

Variaciones en este procedimiento pueden ser deseables dependiendo de los parámetros de configuración del sistema en particular. Una tal variación es reemplazar la umbralización dura del punto 3 con normas más suaves en función del cociente Mc/Ms. Otra variación es expandir la maximización en el punto 1 a más de Q<p-1 elecciones, por ejemplo definidas por una lista finita de valores candidatos para la frecuencia fundamental medida en unidades p de separación de frecuencia de análisis. Otra variación más es aplicar diferentes medidas de las magnitudes de subbanda, tales como la magnitud de una muestra fija, una magnitud máxima, una magnitud media, una magnitud en sentido lp-norma, etc.

La lista de bandas m de origen objetivo seleccionadas para la adición de un producto cruzado junto con los valores de n y n<2>constituye una parte principal de los datos 403 de control de procesamiento cruzado. Lo que queda por describir son los parámetros D<1>, D<2>, p de configuración, los parámetros T<1>, T<2>de número entero no negativo que aparecen en la rotación (13) de fase y la ventana w de síntesis a ser utilizada en el procesamiento 402 de subbanda cruzado. Insertar el modelo sinusoidal para la situación de producto cruzado conduce a las siguientes señales de subbanda de origen:

dondeo= 2^QAtA y00= 2^Ü0AtA. Asimismo, la subbanda de salida deseada es de la forma

Los cálculos revelan que esta salida objetivo se puede lograr si (15) se cumple conjuntamente con

T2 _ r

(19)

t,+ t2 q9'

Las condiciones (15) y (19) son equivalentes a

que define los factores T<1>, T<2>de número entero para la modificación de fase en (13) y proporciona algo de libertad de diseño en la fijación de los valores de los factores D<1>, D<2>de submuestreo. El parámetro de ponderación de magnitud se puede elegir ventajosamente para p = r/Q9. Como puede verse, estos parámetros de configuración solo dependen de la frecuencia Q<0>fundamental a través de la selección de r. Sin embargo, para que (18) se mantenga, emerge una nueva condición en la ventana w de síntesis, a saber

Una ventana w de síntesis que satisface (21) debe proporcionarse bien exacta o aproximadamente como la última pieza de datos 403 de control de procesamiento cruzado.

Se aprecia que el algoritmo anterior para el cálculo de datos 403 de control de procesamiento cruzado sobre la base de parámetros de entrada, tales como un índice m de subbanda de salida objetivo y una frecuencia Q<0>fundamental, es de una naturaleza puramente a modo de ejemplo y como tal no limita el alcance de la invención. Las variaciones de esta divulgación dentro del conocimiento de la persona experta y la experimentación rutinaria -p. ej., un método adicional de procesamiento basado en bloques de subbanda que proporciona una señal (18) como salida en respuesta a las señales (17) de entrada- caen completamente dentro del alcance de la invención.

La figura 5 ilustra un escenario de ejemplo para la aplicación de la transposición basada en bloque de subbanda utilizando varios órdenes de transposición en un códec de audio mejorado de HFR. Se recibe un tren de bits transmitido en un decodificador 501 principal, que proporciona una señal principal decodificada de bajo ancho de banda a una frecuencia fs de muestreo. La señal principal decodificada de bajo ancho de banda se remuestrea a la frecuencia 2fs de muestreo de salida por medio de un banco 502 de análisis de QMF de 32 bandas modulado complejo seguido de un banco 505 de síntesis de QMF de 64 bandas (QMF inverso). Los dos bancos 502 y 505 de filtros comparten los mismos parámetros físicos A<ís>= A<ía>y AfS = AfA, y la unidad 504 de procesamiento de HFR simplemente deja pasar las subbandas inferiores no modificadas correspondientes a la señal principal de bajo ancho de banda. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las subbandas más altas del banco 505 de síntesis de QMF de 64 bandas con las bandas de salida de una unidad 503 de transposición múltiple, sujeto a la conformación y modificación espectral realizada por una unidad 504 de procesamiento de HFR. El transpositor 503 toma como entrada la señal principal decodificada y genera una multitud de señales de subbanda que representan el análisis de la banda de QMF 64 de una superposición o combinación de varias componentes de señales transpuestas. El objetivo es que, si se omite el procesamiento de HFR, cada uno de los componentes corresponde a una transposición física de número entero sin un estiramiento de tiempo de la señal principal (Q<p = 2, 3, ..., y S9 = 1). En el escenario de la invención, la señal de control del transpositor 104 contiene datos que describen una frecuencia fundamental. Estos datos pueden ser transmitidos a través del tren de bits desde el codificador de audio correspondiente, deducidos por la detección de tono en el decodificador, u obtenidos a partir de una combinación de información transmitida y detectada.

La figura 6 ilustra un escenario de ejemplo para el funcionamiento de una transposición basada en bloques de subbandas de orden múltiple que aplica un solo banco de filtros de análisis de<q>M<f>de 64 bandas. En este caso, tres órdenes de transposición Q<p = 2, 3, 4 deben producirse y entregarse en el dominio de un QMF de 64 bandas que funciona a una tasa 2fs de muestreo de salida. La unidad 603 de fusión simplemente selecciona y combina las subbandas relevantes de cada una de las ramas del factor de transposición en una sola multitud de subbandas de QMF para alimentar a la unidad de procesamiento de HFR. El objetivo es específicamente que la cadena de procesamiento de un análisis 601 de QMF de 64 bandas, una unidad 602-Q<p de procesamiento de subbandas y una síntesis 505 de QMF de 64 bandas da como resultado una transposición física de Q9 con S9 = 1 (es decir, sin estiramiento). La identificación de estos tres bloques con 101, 102 y 103 de la figura 1, se encuentra que Aía = 64fs y AfA = fs/128, de modo que Aís/Aía = 1/2 y F = Afs/AA = 2. Un diseño de parámetros de configuración específicos para 602-Q9 se describirá por separado para cada uno de los casos Q9 = 2, 3, 4. Para todos los casos, el trecho de análisis se elige para ser h = 1 y se supone que se conoce el parámetro p = Qtj/AfA = 128Qt)/fs de frecuencia fundamental normalizada.

Considérese primero el caso Q9 = 2. Entonces 602-2 tiene que realizar un estiramiento de subbanda de S = 2, una transposición de subbanda de Q = 1 (es decir, ninguna) y la correspondencia entre subbandas de origen n y objetivo m es dado por n = m para el procesamiento de subbanda directo. En el escenario inventivo de la adición de productos cruzados, solo hay un tipo de producto cruzado a considerar, a saber, r = 1 (véase más arriba, después de la ecuación (15)), y las ecuaciones (20) se reducen a T<1>= T<2>= 1 y D<1>+ D<2>= 1. Una solución ejemplar consiste en elegir D<1>= 0 y D<2>= 1. Para la ventana de síntesis de procesamiento directo, una ventana rectangular de longitud uniforme L = 10 con R<1>= R<2>= 5 puede utilizarse ya que satisface la condición (10). Para la ventana de síntesis de procesamiento cruzado, se puede utilizar una ventana de toma L = 2 corta, con R<1>= R<2>= 1, para mantener la complejidad adicional de la adición de productos cruzados al mínimo. Después de todo, el efecto beneficioso de utilizar un bloque largo para el procesamiento de subbanda es más notable en el caso de señales de audio complejas, donde se suprimen los términos de intermodulación no deseados; para el caso de un tono dominante, es menos probable que ocurran tales artefactos. La ventana de toma L = 2 es la más corta que puede satisfacer (10) ya que h = 1 y S = 2. Sin embargo, según la presente invención, la ventana satisface ventajosamente (21). Para los parámetros disponibles, asciende a

que se cumple al elegir w(0) = 1 y w(-1) = exp(ia) = exp(ircp/2).

Para el caso Q9 = 3 las especificaciones para 602-3 dadas por (1)-(3) son que tiene que realizar un estiramiento de subbanda de S = 2, una transposición de subbanda de Q = 3/2 y que la correspondencia entre subbandas de origen n y objetivo m para el procesamiento del término directo viene dada por n = 2 m/3. Hay dos tipos de términos de productos cruzados r = 1, 2, y las ecuaciones (20) se reducen a

Una solución ejemplar consiste en elegir los parámetros de submuestreo como

• Di = 0 y D<2>= 3/2 para r = 1;

• Di = 3/2 y D<2>= 0 para r = 2.

Para la ventana w de síntesis de procesamiento directo, puede utilizarse una ventana rectangular de longitud par L = 8 con Ri = R<2>= 4. Para la ventana de síntesis de procesamiento cruzado, se puede utilizar una ventana de toma L = 2 corta, con Ri = R<2>= 1, y que satisfaga

lo que se cumple al elegir w(0) = 1 y w(-1) = exp(ia).

Para el caso Q9 = 4, las especificaciones para 602-4 dadas por (1)-(3) son que tiene que realizar un estiramiento de subbanda de S = 2, una transposición de subbanda de Q = 2 y que la correspondencia entre las subbandas de origen n y objetivo m para el procesamiento del término directo se da por n = 2m. Hay tres tipos de términos de productos cruzados r = 1, 2, 3, y las ecuaciones (20) se reducen a

Una solución ejemplar consiste en elegir

• D<1>= 0 y D<2>= 2 para r = 1;

• D<1>= 0 y D<2>= 1 para r = 2;

• D<1>= 2 y D<2>= 0 para r = 3.

Para la ventana w de síntesis de procesamiento directo, puede utilizarse una ventana rectangular de longitud par L = 6 con R<1>= R<2>= 3. Para la ventana de síntesis de procesamiento cruzado, se puede utilizar una ventana de toma L = 2 corta, con R<1>= R<2>= 1, y que satisfaga

lo que se cumple al elegir w(0) = 1 y w(-1) = exp(ia).

En cada uno de los casos anteriores, donde más de un valor r es aplicable, se llevará a cabo una selección, p. ej., de manera similar al procedimiento de tres etapas descrito antes de la ecuación (17).

La figura 7 representa el espectro de amplitud de una señal armónica con frecuencia Q<0>= 564,7 Hz fundamental. La parte 701 de baja frecuencia de la señal se utilizará como entrada para una transposición múltiple. El propósito del transpositor es generar una señal lo más cerca posible de la parte 702 de alta frecuencia de la señal de entrada, de modo que la transmisión de la parte 702 de alta frecuencia no sea imperativa y la tasa de bits disponible se pueda utilizar económicamente.

La figura 8 representa el espectro de amplitud de las salidas de un transpositor que tiene la parte 701 de baja frecuencia de la señal de la figura 7 como entrada. El transpositor múltiple está construido utilizando bancos de filtros de QMF de 64 bandas, frecuencia fs = 14400 Hz de muestreo de entrada y de acuerdo con la descripción de la figura 5. Sin embargo, para mayor claridad, solo se consideran los dos órdenes Q9 = 2, 3 de transposición. Los tres paneles 801-803 diferentes representan la salida final obtenida al utilizar diferentes configuraciones de los datos de control de procesamiento cruzado.

El panel 801 superior representa el espectro de salida obtenido si todo el procesamiento de productos cruzados se cancela y sólo está activo el procesamiento 401 de subbanda directo. Este será el caso si el control 404 de procesamiento cruzado no recibe tono o p = 0. La transposición por Q9 = 2 genera la salida en el rango de 4 a 8 kHz y la transposición por Q9 = 3 genera la salida en el rango de 8 a 12 kHz. Como puede verse, los parciales creados están cada vez más alejados y la salida se desvía significativamente de la señal 702 de alta frecuencia objetivo. En la salida de audio resultante estarán presentes artefactos de tono “fantasma” doble y triple audibles.

El panel intermedio 802 representa el espectro de salida obtenido si el procesamiento de productos cruzados está activo, se utiliza el parámetro p = 5 de tono (que es una aproximación a 128Qt)/fs = 5,0196), pero una ventana de síntesis simple de dos tomas con w(0) = w(-1) = 1, que satisface la condición (10), se utiliza para el procesamiento de subbanda cruzado. Esto equivale a una combinación sencilla de procesamiento basado en bloques de subbandas y transposición armónica mejorada de productos cruzados. Como puede verse, los componentes de señal de salida adicionales en comparación con 801, no se alinean bien con la serie de armónicas deseada. Esto muestra que conduce a una calidad de audio insuficiente para utilizar el procedimiento heredado del diseño del procesamiento de subbanda directo para el procesamiento de productos cruzados.

El panel 803 inferior representa el espectro de salida obtenido a partir del mismo escenario como para el panel intermedio 802, pero ahora con las ventanas de síntesis de procesamiento de subbanda cruzado dadas por las fórmulas descritas en los casos Q9 = 2, 3 de la figura 5. Es decir, una ventana de dos tomas de la forma w(0) = 1 y w(-1) = exp(ia) que satisface (21) y con la característica enseñada por la presente invención de que depende del valor de p. Como puede verse, la señal de salida combinada se alinea muy bien con la serie de armónicos deseada de 702.

La figura 9 muestra una parte de la unidad 202 de procesamiento de trama de procesamiento no lineal que incluye secciones configuradas para recibir dos muestras u<1>, u<2>de entrada y generar en base a éstas una muestra w procesada, cuya magnitud está dada por una geometría media de las magnitudes de las muestras de entrada y cuya fase es una combinación lineal de las fases de las muestras de entrada, es decir,

Es posible obtener la muestra w procesada de acuerdo con esta especificación, prenormalizando cada una de las muestras u<1>, u<2>de entrada en un prenormalizador 901, 902 respectivo y multiplicando las muestras de entrada prenormalizadas vi = ui/|ui|a, V<2>= U<2>/|U<2>|b en un multiplicador 910 ponderado, que genera una salida . Claramente, el funcionamiento de los prenormalizadores 901, 902 y el multiplicador 910 ponderado está determinado por los parámetros de entrada a, b, a y p. Es fácil verificar que las ecuaciones (22) se cumplirán si a = T<1>, p = T<2>, a = 1-p / T<1>, b = 1-(1-p) / T<2>. El experto en la materia podrá generalizar fácilmente este diseño a un número N<0>arbitrario de muestras de entrada, en donde un multiplicador se suministra con N<0>muestras de entrada, de las cuales algunas o todas han sido sometidas a la prenormalización. Se observa, entonces, que una prenormalización común (a = b, lo que implica que los prenormalizadores 901, 902 producen resultados idénticos) es posible si el parámetro p se establece en p = T<1>/ (T<1>+ T<2>). Esto resulta en una ventaja computacional cuando se consideran muchas subbandas, ya que una etapa de prenormalización común puede efectuarse en todas las subbandas candidatas antes de la multiplicación. En una implementación de hardware ventajosa, una pluralidad de prenormalizadores que funcionan de manera idéntica se reemplaza por una sola unidad que alterna muestras de diferentes subbandas en una forma de división de tiempo.

Otras realizaciones de la presente invención resultarán evidentes para un experto en la técnica después de leer la descripción anterior. Aunque la presente descripción y los dibujos describen realizaciones y ejemplos, la invención no está restringida a estos ejemplos específicos. Se pueden realizar numerosas modificaciones y variaciones sin apartarse del alcance de la presente invención, que se define en las reivindicaciones adjuntas.

Los sistemas y métodos divulgados anteriormente en el presente documento pueden implementarse como software, firmware, hardware o una combinación de los mismos. Ciertos componentes o todos los componentes pueden implementarse como software ejecutado por un procesador de señal digital o microprocesador, o implementarse como hardware o como un circuito integrado de aplicación específica. Dicho software puede distribuirse en medios legibles por ordenador, que pueden comprender medios de almacenamiento de ordenador (o medios no transitorios) y medios de comunicación (o medios transitorios). Como es bien conocido por los expertos en la técnica, los medios de almacenamiento de ordenador incluyen medios volátiles y no volátiles, extraíbles y no extraíbles implementados en cualquier método o tecnología para el almacenamiento de información, como instrucciones legibles por ordenador, estructuras de datos, módulos de programas u otros datos. Los medios de almacenamiento de ordenador incluyen, pero no se limitan a, RAM, ROM, EEPROM, memoria flash u otra tecnología de memoria, CD-ROM, discos versátiles digitales (DVD) u otro almacenamiento en disco óptico, casetes magnéticos, cinta magnética, almacenamiento en disco magnético u otros dispositivos de almacenamiento magnético, o cualquier otro medio que pueda ser utilizado para almacenar la información deseada y al que se puede acceder por un ordenador. Además, es bien conocido por los expertos que los medios de comunicación típicamente incorporan instrucciones legibles por ordenador, estructuras de datos, módulos de programas u otros datos en una señal de datos modulada como una onda portadora u otro mecanismo de transporte e incluye cualquier medio de entrega de información.

Claims

REIVINDICACIONES 1. Un sistema configurado para generar una señal estirada en tiempo y/o transpuesta en frecuencia a partir de una señal de audio de entrada, comprendiendo el sistema: - un banco (101) de filtros de análisis configurado para derivar un número Y = 2 de señales de subbanda de análisis a partir de la señal de audio de entrada, en donde cada señal de subbanda de análisis comprende una pluralidad de muestras de análisis de valor complejo, que tienen, cada una, una fase y una magnitud; - una unidad (102) de procesamiento de subbanda configurada para generar una señal de subbanda de síntesis a partir de las Y señales de subbanda de análisis utilizando un factor Q de transposición de subbanda y un factor S de estiramiento de subbanda, siendo al menos uno de Q y S mayor que uno, en donde la unidad (102) de procesamiento de subbanda comprende: un extractor (201) de bloque configurado para: i) formar Y tramas de L muestras de entrada, extrayéndose cada trama desde dicha pluralidad de muestras de análisis de valor complejo en una señal de subbanda de análisis y siendo la longitud de trama L > 1, en donde al menos una de las L muestras de entrada se deriva mediante interpolación de dos o más de la pluralidad de muestras de análisis de valor complejo; y ii) aplicar un tamaño de salto de bloque de h muestras a dicha pluralidad de muestras de análisis, antes de formar una trama subsiguiente de L muestras de entrada, generando mediante ello una secuencia de tramas de muestras de entrada; una unidad (202) de procesamiento de trama no lineal configurada para generar, en base a correspondientes Y tramas de muestras de entrada formadas por el extractor de bloque, una trama de muestras procesadas mediante determinación de una fase y una magnitud para cada una de las muestras procesadas de la trama, en donde, para al menos una muestra procesada: i) la fase de la muestra procesada se basa en una combinación lineal, con coeficientes de número entero no negativo (T<1>, T<2>), de respectivas fases de la correspondiente muestra de entrada en unas tramas primera y segunda de muestras de entrada; y ii) la magnitud de la muestra procesada como valor medio de la magnitud de la correspondiente muestra de entrada en una primera trama de muestras de entrada y la magnitud de la correspondiente muestra de entrada en una segunda trama de muestras de entrada; y una unidad (204) de solapamiento y adición configurada para determinar la señal de subbanda de síntesis mediante solapamiento y adición de las muestras de una secuencia de tramas de muestras procesadas; y - un banco (103) de filtros de síntesis configurado para generar la señal estirada en tiempo y/o transpuesta en frecuencia a partir de la señal de subbanda de síntesis, en donde el extractor (201) de bloque está configurado para derivar al menos una trama de muestras de entrada mediante submuestreo de las muestras de análisis de valor complejo en una señal de subbanda de análisis.
2. El sistema de la reivindicación 1, en donde: el banco (101) de filtros de análisis aplica un trecho Ato de tiempo de análisis a la señal de audio de entrada; el banco de filtros de análisis tiene una separación Ato de frecuencia de análisis; el banco de filtros de análisis tiene un número N de subbandas de análisis, con N > 1, donde n es un índice de subbanda de análisis con n = 0, ..., N-1; una subbanda de análisis de las N subbandas de análisis está asociada con una banda de frecuencia de la señal de audio de entrada; el banco (103) de filtros de síntesis aplica un trecho AtS de tiempo de síntesis a la señal de subbanda de síntesis; el banco de filtros de síntesis tiene una separación AfS de frecuencia de síntesis; el banco de filtros de síntesis tiene un número M de subbandas de síntesis, con M > 1, donde m es un índice de subbanda de síntesis con m = 0, ..., M-1; y una subbanda de síntesis de las M subbandas de síntesis está asociada con una banda de frecuencia de la señal estirada en tiempo y/o transpuesta en frecuencia.
3. El sistema de la reivindicación 2, en donde la unidad (102) de procesamiento de subbanda comprende, además, una unidad (404) de control de procesamiento cruzado configurada para generar datos (403) de control de procesamiento cruzado que definen índices m, n<2>de subbanda asociados con las señales de subbanda de análisis y el índice m de subbanda de síntesis, cuyos índices de subbanda están relacionados por ser soluciones de número entero aproximadas de

donde Qo es una frecuencia fundamental de la señal de audio de entrada, ct = 0 o 1/2, e = y Q<p > 1 es un número entero que define el factor deseado de transposición física, y r es un número entero que satisface 1 < r < Q<p-1.
4. El sistema de una cualquiera de las reivindicaciones anteriores, en donde la unidad (102) de procesamiento no lineal comprende: un prenormalizador (901, 902) configurado para reescalar las magnitudes de las correspondientes muestras de entrada um en al menos una de las Y tramas de muestras de entrada (vm = um/|um|pm); y un multiplicador complejo (910) configurado para determinar la muestra procesada mediante cálculo de un I I » . I I ' producto complejo ponderado W,v <-WJde factores igual a la correspondiente muestra de entrada en las Y tramas de muestras de entrada, derivándose al menos uno de los factores (vm, m e M t 0) a partir de una muestra con una magnitud reescalada por el prenormalizador, siendo P y y parámetros de entrada predeterminados.
5. Un método para generar una señal estirada en tiempo y/o transpuesta en frecuencia a partir de una señal de audio de entrada, comprendiendo el método: derivar un número Y = 2 de señales de subbanda de análisis a partir de la señal de audio de entrada, en donde cada señal de subbanda de análisis comprende una pluralidad de muestras de análisis de valor complejo, que tienen, cada una, una fase y una magnitud; formar Y tramas de L muestras de entrada, extrayéndose cada trama desde dicha pluralidad de muestras de análisis de valor complejo en una señal de subbanda de análisis y siendo la longitud de trama L > 1, en donde al menos una de las L muestras de entrada se deriva mediante interpolación de dos o más de la pluralidad de muestras de análisis de valor complejo; aplicar un tamaño de salto de bloque de h muestras a dicha pluralidad de muestras de análisis, antes de derivar una trama subsiguiente de L muestras de entrada, generando mediante ello una secuencia de tramas de muestras de entrada; generar, en base a correspondientes Y tramas de muestras de entrada, una trama de muestras procesadas mediante determinación de una fase y una magnitud para cada una de las muestras procesadas de la trama, en donde, para al menos una muestra procesada: i) la fase de la muestra procesada se basa en una combinación lineal, con coeficientes de número entero no negativo (T<1>, T<2>), de respectivas fases de la correspondiente muestra de entrada en unas tramas primera y segunda de muestras de entrada; y ii) la magnitud de la muestra procesada como valor medio de la magnitud de la correspondiente muestra de entrada en una primera trama de muestras de entrada y la magnitud de la correspondiente muestra de entrada en una segunda trama de muestras de entrada; determinar la señal de subbanda de síntesis mediante solapamiento y adición de las muestras de una secuencia de tramas de muestras procesadas; y generar la señal estirada en tiempo y/o transpuesta en frecuencia a partir de la señal de subbanda de síntesis, en donde dicha formación de tramas de muestras de entrada incluye submuestrear muestras de análisis de valor complejo en una señal de subbanda de análisis.
6. El método de la reivindicación 5, en donde dicha generación de una trama de muestras procesadas comprende: reescalar una magnitud de al menos una muestra de entrada; y calcular una muestra procesada como un producto ponderado complejo \ne nAT»:mIekM-/de factores igual a la correspondiente muestra de entrada um en las Y tramas de muestras de entrada, en donde al menos uno de los factores (vm = um/|um|p, m e M t 0) es una muestra de entrada con una magnitud reescalada, siendo p y y parámetros de entrada predeterminados.
7. Un producto de programa de ordenador que incluye instrucciones legibles por ordenador para realizar el método establecido en la reivindicación 5 o la reivindicación 6, cuando se ejecuta en un ordenador.