ES2901735T3 - Transposición armónica mejorada de productos de cruce - Google Patents

Transposición armónica mejorada de productos de cruce Download PDF

Info

Publication number
ES2901735T3
ES2901735T3 ES19171999T ES19171999T ES2901735T3 ES 2901735 T3 ES2901735 T3 ES 2901735T3 ES 19171999 T ES19171999 T ES 19171999T ES 19171999 T ES19171999 T ES 19171999T ES 2901735 T3 ES2901735 T3 ES 2901735T3
Authority
ES
Spain
Prior art keywords
subband
analysis
synthesis
frequency
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19171999T
Other languages
English (en)
Inventor
Lars Villemoes
Per Hedelin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2901735T3 publication Critical patent/ES2901735T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Abstract

Un sistema para decodificar una señal de audio, el sistema comprendiendo: - un decodificador (101) de núcleo para decodificar una componente de baja frecuencia de la señal de audio; - un banco (301) de filtros de análisis para proporcionar una pluralidad de señales de subbanda de análisis de la componente de baja frecuencia de la señal de audio; - una unidad de recepción de selección de subbanda para recibir la información asociada con una frecuencia W fundamental de la seña de audio, y para seleccionar, en respuesta a la información, una primera (801) y una segunda (802) señal de subbanda de análisis a partir de la pluralidad de señales de subbanda de análisis, a partir de la cual se genera una señal (803) de subbanda de síntesis; - una unidad (302) de procesamiento no lineal para generar la señal de subbanda de síntesis con una frecuencia de síntesis, una magnitud y una fase por la que: - determinar la magnitud de la señal de subbanda de síntesis a partir de un valor medio generalizado de las magnitudes de la primera y segunda señal de subbanda de análisis; y - determinar la fase de la señal de subbanda de síntesis a partir de una suma ponderada de las fases de la primera y segunda señal de subbanda de análisis; y - un banco (303) de filtros de síntesis para generar una componente de alta frecuencia de la señal de audio a partir de la señal de subbanda de síntesis; en donde la información asociada con una frecuencia W fundamental de la señal de audio se recibe en un flujo de bits codificado.

Description

DESCRIPCIÓN
Transposición armónica mejorada de productos de cruce
Referencia cruzada con solicitudes relacionadas
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea 13164569.9 (referencia: D08072EP02), para la cual se presentó el formulario EOP 1001 el 19 de abril de 2013. El documento EP 13164569.9 es en sí una solicitud divisional europea de la solicitud de patente Euro-PCT EP 10701342.7 (referencia: D08072EP01, presentada el 15 de enero de 2010 y concedida como EP 2380172 el 24 de julio de 2013.
Campo técnico
La presente invención se relaciona con los sistemas de codificación de audio que hacen uso de un método de transposición armónica para la reconstrucción de altas frecuencias (HFR).
Antecedentes de la invención
Las tecnologías HFR, tales como la tecnología de Replicación de Banda Espectral (SBR), permiten mejorar de manera significativa la eficiencia de codificación de los códec de audio tradicionales. En combinación con la Codificación de Audio Avanzada (AAC) MPEG-4 forma un muy eficiente códec de audio, que ya está en uso dentro del Sistema de Radio por Satélite XM y la Radio Digital Mundial. La combinación de AAC y SBR es denominada aacPlus. Es parte del estándar MPEG-4 donde es referido como el Perfil AAC de Alta Eficiencia. En general, la tecnología h Fr se puede combinar con un códec de audio perceptivo de una manera compatible hacia atrás y hacia delante, ofreciendo así la posibilidad de mejorar los sistemas de difusión ya establecidos como el MPEG capa 2 usado en el sistema DAB Eureka. Los métodos de transposición HFR se pueden combinar también con códec de voz para permitir voz de banda ancha a tasas de bits ultra bajas.
La idea básica detrás de la HFR es la observación de que normalmente hay presente una fuerte correlación entre las características del rango de alta frecuencia de una señal y las características del rango de baja frecuencia de la misma señal. Por tanto, una buena aproximación para la representación del rango de entrada original de alta frecuencia de una señal puede ser alcanzado mediante una transposición de señal desde el rango de baja frecuencia al rango de alta frecuencia.
Este concepto de transposición fue establecido en el documento WO 98/57436, como un método para recrear una banda de alta frecuencia desde una banda de frecuencia inferior de una señal de audio. Se puede obtener un ahorro sustancial en la tasa de bits usando este concepto en la codificación de audio y/o la codificación de voz. A continuación, se hará referencia a la codificación de audio, pero se debería observar que los métodos y sistemas descritos son igualmente aplicables a la codificación de voz y la codificación de audio y voz unificada (USAC).
En un sistema de codificación de audio basado en HFR, se presenta una señal de bajo ancho de banda a un codificador de forma de onda de núcleo y se regeneran las frecuencias superiores en el lado del decodificador usando una transposición de la señal de bajo ancho de banda e información complementaria adicional, que se codifica normalmente a tasas de bits muy bajas y que describe la forma espectral objetivo. Para tasas de bits bajas, donde el ancho de banda de la señal codificada del núcleo es estrecho, resulta cada vez más importante recrear una banda superior, esto es el rango superior de frecuencia de la señal de audio, con características perceptualmente agradables. Se mencionan dos variantes de métodos de reconstrucción de frecuencia armónica a continuación, una es referida como transposición armónica y la otra es referida como modulación de banda lateral única.
El principio de la transposición armónica definido en el documento WO 98/57436 es que una sinusoide con una frecuencia w se hace corresponder con una sinusoide con frecuencia Tw donde T > 1 es un número entero que define el orden de transposición. Una característica atractiva de la transposición armónica es que extiende un rango de frecuencia de origen en un rango de frecuencia objetivo por un factor igual al orden de transposición, esto es por un factor igual a T. La transposición armónica se desempeña bien para material musical complejo. Además, la transposición armónica muestra unas bajas frecuencias de corte, esto es se puede generar un gran rango de alta frecuencia por encima de la frecuencia de corte a partir de un relativamente pequeño rango de baja frecuencia por debajo de la frecuencia de corte.
En contraste a la transposición armónica, una modulación de banda lateral única (SSB) basada en HFR hace corresponder una sinusoide con la frecuencia w a una sinusoide con frecuencia w Aw donde Aw es un desplazamiento de frecuencia fijo. Se ha observado que, dada una señal de núcleo con un bajo ancho de banda, puede producirse un artefacto de sonido disonante a partir de la transposición SSB. Se debería observar también que para una frecuencia de corte baja, esto es un rango de frecuencia de origen pequeño, la transposición armónica requerirá un menor número de correcciones para completar un rango de frecuencia objetivo deseado que la transposición basada en SSB. A modo de ejemplo, si se debe completar el rango de alta frecuencia de (w, 4w], entonces usar un orden de transposición T = 4 de la transposición armónica puede completar este rango de frecuencia a partir de un rango de baja frecuencia de (%w, w]. Por otro lado, una transposición basada en SSB que usa el mismo rango de baja frecuencia debe usar un desplazamiento de frecuencia Aw = % w y es necesario repetir el proceso cuatro veces para completar el rango de alta frecuencia (w, 4w].
Por otro lado, como ya se apuntó en el documento WO 02/052545 A1, la transposición armónica tiene inconvenientes para las señales con una estructura periódica prominente. Dichas señales son superposiciones de las sinusoides relacionadas de manera armónica con frecuencias O, 20, 30, ..., donde O es la frecuencia fundamental.
Tras la transposición armónica de orden T, las sinusoides de salida tienen frecuencias TO, 2T0, 3T0, ..., que, en caso de T > 1, es sólo un subconjunto estricto de las series armónicas completas deseadas. En términos de calidad de audio resultante normalmente se percibirá un tono “fantasma” correspondiente a la frecuencia fundamental transpuesta TO. A menudo la transposición armónica resulta en un carácter de sonido “metálico” de la señal de audio codificada y decodificada. La situación se puede aliviar en un cierto grado añadiendo varios órdenes de transposición T = 2, 3, ..., Tmax a la HFR, pero este método es computacionalmente complejo si se han de evitar la mayoría de los saltos espectrales.
Una solución alternativa para evitar la aparición de los tonos “fantasma” al usar la transposición armónica se ha presentado en el documento WO 02/052545 A1. La solución consiste en usar dos tipos de transposición, esto es una transposición armónica típica y una “transposición de pulso” especial. El método descrito enseña a cambiar a la “transposición de pulso” dedicada para las partes de la señal de audio que se detectan que son periódicas con una naturaleza de tren de pulsos. El problema con este enfoque es que la solicitud de “transposición de pulso” en el material de música complejo a menudo degrada la calidad comparado con la transposición armónica basada en un banco de filtros de gran resolución. Por lo tanto, los mecanismos de detección se han de sintonizar de forma bastante conservadora de manera tal que la transposición de pulso no se use para el material complejo. Inevitablemente, los instrumentos y voces de tono único se clasificarán a veces como señales complejas, invocando la transposición armónica y por lo tanto faltando armónicos. Además, si se produce el cambio en el medio de una señal de un solo tono, o de una señal con un tono dominante en un fondo complejo más débil, el cambio en sí entre los dos métodos de transposición que tienen propiedades de relleno de espectro muy diferentes generará artefactos audibles. Otra variante para realizar la reconstrucción de frecuencia de armónico se propone en el documento US 2004/0028244 A1.
Compendio de la invención
La invención se define como en las reivindicaciones independientes adjuntas. Otras realizaciones se definen en las reivindicaciones dependientes.
La presente invención proporciona un método y un sistema para completar las series armónicas que resultan de la transposición armónica de una señal periódica. La transposición en el dominio de la frecuencia comprende el paso de hacer corresponder las señales de subbandas no linealmente modificadas de un banco de filtros de análisis en las subbandas seleccionadas de un banco de filtros de síntesis. La modificación no lineal comprende una modificación de fase o una rotación de fase lo cual en un dominio de banco de filtros complejos puede ser obtenido mediante una ley de potencia seguida por un ajuste de magnitud. Mientras que la transposición de la técnica anterior modifica una subbanda de análisis cada vez de manera separada, la presente invención enseña a añadir una combinación no lineal de al menos dos diferentes subbandas de análisis para cada subbanda de síntesis. El espaciado entre las subbandas de análisis a ser combinadas puede estar relacionado con la frecuencia fundamenta de una componente dominante de la señal a ser transpuesta.
En la forma más general, la descripción matemática de la invención es que se usa un conjunto de componentes w1 , W2 , ..., Wk para crear una nueva componente de frecuencia.
W = T1 W1 + T 2W2+ ... Tk Wk,
donde los coeficientes T1, T2..., Tk son órdenes de transposición enteros cuya suma es el orden de transposición total T = T1 + T2 +... Tk. Este efecto es obtenido mediante la modificación de las fases de las K señales de subbandas elegidas de manera adecuada por lo factores T1, T2..., Tk y recombinando el resultado en una señal con una fase igual a la suma de las fases modificadas. Es importante observar que todas estas operaciones de fase están bien definidas y no son ambiguas ya que los órdenes de transposición individuales son enteros, y algunos de estos enteros podrían incluso ser negativos siempre que el orden de transposición total satisfaga T > 1.
Los métodos de la técnica anterior corresponden al caso K = 1, y la invención actual enseña a usar K > 2.
El texto descriptivo trata principalmente el caso K = 2, T > 2 como suficiente para solucionar la mayoría de los problemas específicos. Pero se debería observar que los casos K > 2 se consideran que están igualmente descritos y cubiertos por el presente documento.
Breve descripción de los dibujos
La presente invención será descrita ahora a modo de ejemplos ilustrativos, no limitando el alcance de la invención. Será descrita con referencia a los dibujos adjuntos, en los cuales:
La Fig. 1 ilustra la operación de un decodificador de audio mejorado HFR;
La Fig. 2 ilustra la operación de un transponedor armónico que usa varios órdenes;
La Fig. 3 ilustra la operación de un transponedor armónico en el dominio de la frecuencia (FD); La Fig. 4 ilustra la operación del uso inventivo de procesamiento de términos de cruce;
La Fig. 5 ilustra el procesamiento directo de la técnica anterior;
La Fig. 6 ilustra el procesamiento no lineal directo de la técnica anterior de una subbanda única;
La Fig. 7 ilustra los componentes del procesamiento de términos de cruce inventivo;
La Fig. 8 ilustra la operación de un bloque de procesamiento de términos de cruce;
La Fig. 9 ilustra el procesamiento no lineal inventivo contenido en cada uno de los sistemas MISO de la Fig. 8; Las Fig. 10 - 18 ilustra el efecto de la invención para la transposición armónica de las señales periódicas ejemplares;
La Fig. 19 ilustra la resolución tiempo-frecuencia de una Transformada de Fourier de Tiempo Reducido (STFT). La Fig. 20 ilustra la progresión ejemplar en el tiempo de una función de ventana y su transformada de Fourier usada en el lado de síntesis;
La Fig. 21 ilustra la STFT de una señal de entrada sinusoidal;
La Fig. 22 ilustra la función de ventana y su transformada de Fourier según la Fig. 20 usada en el lado de análisis; Las Fig. 23 y 24 ilustran la determinación de las subbandas apropiadas del banco de filtros de análisis para la mejora de los términos de cruce de la subbanda de la banda del filtro de síntesis;
Las Fig. 25, 26, y 27 ilustran resultados experimentales del método descrito de transposición armónica de los términos directos y de cruce;
Las Fig. 28 y 29 ilustran las realizaciones de un codificador y un decodificador, respectivamente, que usan los esquemas de transposición armónica mejorados explicados en términos generales en el presente documento; y La Fig. 30 ilustra una realización de una unidad de transposición mostrada en las Fig. 28 y 29.
Descripción de las realizaciones preferidas
Las realizaciones anteriormente descritas son simplemente ilustrativas para los principios de la presente invención para la así denominada TRANSPOSICIÓN ARMÓNICA MEJORADA DE PRODUCTOS DE CRUCE. Se entiende que serán evidentes las modificaciones y variaciones de las disposiciones y los detalles descritos en la presente memoria para aquellos expertos en la técnica. Es la intención, por lo tanto, estar limitado sólo por el alcance de las próximas reivindicaciones de patente y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en la presente memoria.
La Fig. 1 ilustra la operación de un decodificador de audio mejorado HFR. El decodificador 101 de audio de núcleo emite una señal de audio de bajo ancho de banda que se alimenta a un muestreador ascendente 104 que se puede requerir para producir una contribución de salida de audio final a la tasa de muestreo completa deseada. Dicho muestreo ascendente se requiere para los sistemas de doble tasa, donde el códec de audio de núcleo limitado en banda está operando a la mitad de la tasa de muestreo de audio externa, mientras que la parte HFR se procesa a la frecuencia de muestreo completa. Por consiguiente, para un sistema de tasa única, se omite este muestreador ascendente 104. La emisión de bajo ancho de banda 101 se envía también al transponedor o unidad 102 de transposición que emite la señal transpuesta, esto es la señal que comprende el rango de alta frecuencia deseado. A esta señal transpuesta se le puede dar forma en el tiempo y la frecuencia mediante el ajustador 103 de envolvente. La emisión de audio final es la suma de la señal de núcleo de bajo ancho de banda y la señal transpuesta ajustada de la envolvente.
La Fig. 2 ilustra la operación de un transponedor 201 armónico, que corresponde al transponedor 102 de la Fig. 1, que comprende diversos transponedores de diferentes órdenes T de transposición. La señal a ser transpuesta se pasa al banco de transponedores 201-2, 201-3, ..., 201-Tmax individuales que tienen órdenes de transposición T = 2, 3, ... Tmax, respectivamente. Normalmente un orden Tmax = 3 de transposición es suficiente para la mayoría de las aplicaciones de codificación de audio. Las contribuciones de los diferentes transponedores 201-2, 201-3, ..., 201 Tmax se suman en 202 para producir la salida combinada del transponedor. En una primera realización, la operación de suma puede comprender la adición de las contribuciones individuales. En otra realización, las contribuciones se ponderan con diferentes pesos, de manera que el efecto de la adición de las múltiples contribuciones a ciertas frecuencias se mitiga. Por ejemplo, las contribuciones de tercer orden se pueden añadir con una ganancia inferior que las contribuciones de segundo orden. Finalmente, la unidad 202 de suma puede añadir las contribuciones de manera selectiva dependiendo de la frecuencia de salida. Por ejemplo, la transposición de segundo orden se puede usar para un primer rango de frecuencia objetivo inferior, y la transposición de tercer orden se puede usar para un segundo rango de frecuencia objetivo superior.
La Fig. 3 ilustra la operación de un transponedor armónico del dominio de la frecuencia (FD), tal como uno de los bloques individuales de 201, esto es uno de los transponedores 201-T de orden de transposición T. Un banco 301 de filtros de análisis emite las subbandas complejas que se envían al procesamiento 302 no lineal, que modifica la fase y/o la amplitud de la señal de subbanda según el orden T de transposición elegido. Las subbandas modificadas se alimentan al banco 303 de filtros de síntesis que emite la señal transpuesta en el dominio del tiempo. En el caso de múltiples transponedores paralelos de diferentes órdenes de transposición tal como se muestra en la Fig. 2, algunas operaciones del banco de filtros se pueden compartir entre los diferentes transponedores 201-2, 201-3, ..., 201-Tmax. La compartición de las operaciones del banco de filtros se puede hacer para análisis o síntesis. En el caso de la síntesis 303 compartida, la suma 202 se puede realizar en el dominio de la subbanda, esto es antes de la síntesis 303.
La Fig. 4 ilustra la operación del procesamiento 402 de los términos de cruce además del procesamiento 401 directo. El procesamiento 402 de los términos de cruce y el procesamiento 401 directo se realiza en paralelo dentro del bloque 302 de procesamiento no lineal del transponedor armónico del dominio de la frecuencia de la Fig. 3. Las señales de salida transpuestas se combinan, por ejemplo se suman, para proporcionar una señal conjunta transpuesta. Esta combinación de señales de salida transpuesta puede consistir en la superposición de las señales de salida transpuestas. De manera opcional, la adición selectiva de los términos de cruce se puede implementar en el cálculo de la ganancia.
La Fig. 5 ilustra en más detalle la operación del bloque 401 de procesamiento directo de la Fig. 4 dentro del transponedor armónico en el dominio de la frecuencia de la Fig. 3. Las unidades 401-1, ..., 401-n, ..., 401-N de Entrada Única Salida Única (SISO) hacen corresponder cada subbanda de análisis de un rango de origen en una subbanda de síntesis de un rango objetivo. Según la Fig. 5, una subbanda de análisis de índice n es hecha corresponder por la unidad 401-n SISO a una subbanda de síntesis del mismo índice n. Se debería observar que el rango de frecuencia de la subbanda con índice n en el banco de filtros de síntesis puede variar dependiendo de la versión o el tipo exacto de la transposición armónica. En la versión o tipo ilustrado en la Fig. 5, el espaciado de frecuencia del banco 301 de análisis es un factor T menor que el del banco 303 de síntesis. Por tanto, el índice n en el banco 303 de síntesis corresponde a una frecuencia, que es T veces mayor que la frecuencia de la subbanda con el mismo índice n en el banco 301 de análisis. A modo de ejemplo, se transpone una subbanda de análisis [(n-1)w, nw] en una subbanda de síntesis [(n-1)Tw, nTw].
La Fig. 6 ilustra el procesamiento no lineal directo de una subbanda contenida en cada una de las unidades SISO de 401-n. La no linealidad del bloque 601 realiza una multiplicación de la fase de la señal de subbanda compleja por un factor igual al orden T de transposición. La unidad 602 de ganancia opcional modifica la magnitud de la señal de subbanda de fase modificada. En términos matemáticos, la salida y de la unidad 401 -n SISO se puede escribir como una función de la entrada x al sistema 401-n SISO y el parámetro g de ganancia como sigue:
y = g-v , donde v = xl\x\ . (1)
Esto se puede escribir también como:
Figure imgf000005_0001
En otras palabras, la fase de la señal x de subbanda compleja es multiplicada por el orden T de transposición y la amplitud de la señal x de subbanda compleja es modificada por el parámetro g de ganancia.
La Fig. 7 ilustra las componentes del procesamiento 402 de términos de cruce para una transposición armónica de orden T. Existen T - 1 bloques de procesamiento de términos de cruce en paralelo, 701-1, ..., 701 -r, ... 701-(T-1), cuyas salidas se suman en la unidad 702 de suma para producir una salida combinada. Como ya se apuntó en la sección introductoria, es un objetivo hacer corresponder una pareja de sinusoides con frecuencias (w, w+Q) a una sinusoide con frecuencia (T-r)w r(w+Q) = Tw rQ, en donde la variable r varía desde 1 a T-1. En otras palabras, las dos subbandas del banco 301 de filtros de análisis se han de hacer corresponder a una subbanda del rango de alta frecuencia. Para un valor concreto de r y un orden T de transposición dado, este paso de correspondencia se realiza en el bloque 701-r de procesamiento de términos de cruce.
La Fig. 8 ilustra la operación de un bloque 701-r de procesamiento de términos de cruce para un valor fijo r = 1, 2, ..., T-1. Cada subbanda 803 de salida se obtiene en una unidad 800-n de múltiples entradas salida única (MISO) a partir de las dos subbandas 801 y 802 de entrada. Para una subbanda 803 de salida de índice n, las dos entradas de la unidad 800-n MISO son subbandas n - p1, 801, y n p2, 802, donde p1 y p2 son desplazamientos de índice enteros positivos, que dependen del orden T de transposición, la variable r, y el parámetro Ó de tono mejorado de productos de cruce. La convención de numeración de la subbanda de análisis y síntesis se mantiene en línea con el de la Fig. 5, esto es, el espaciado en la frecuencia del banco 301 de análisis es un factor T menor que el del banco 303 de síntesis y por consiguiente los comentarios anteriores dados sobre las variaciones del factor T siguen siendo relevantes.
En relación con el uso del procesamiento de términos de cruce, se deberían considerar las siguientes observaciones. El parámetro Ó de tono no tiene que ser conocido con una gran precisión, y ciertamente no con una mejor resolución de frecuencia que la resolución de frecuencia obtenida mediante el banco 301 de filtros de análisis. De hecho, en algunas realizaciones de la presente invención, el parámetro Ó de tono mejorado de productos de cruce subyacente no se introduce en el decodificador para nada. En su lugar, la pareja elegida de desplazamientos (p1, p2) de índice enteros se selecciona a partir de una lista de posibles candidatos siguiendo un criterio de optimización tal como la maximización de la magnitud de salida de productos de cruce, esto es la maximización de la energía de la salida de productos de cruce. A modo de ejemplo, para los valores dados de T y r, se podría usar una lista de candidatos dada por la fórmula (p-i, P2) = (rl, (T-r)l),I £ L, donde L es una lista de enteros positivos. Esto se muestra con mayor detalle más adelante en el contexto de la fórmula (11). Todos los enteros positivos son en principio candidatos válidos. En algunos casos la información de tono puede ayudar a identificar que l elegir como desplazamientos de índice apropiados.
Además, incluso aunque el procesamiento de los productos de cruce de ejemplo ilustrado en la Fig. 8 sugiere que los desplazamientos (p1, p2) de índice aplicados son los mismos para un cierto rango de subbandas de salida, por ejemplo, las subbandas (n-1), n y (n+1) de síntesis están compuestas a partir de subbandas de análisis que tienen una distancia p1 p2 fija, este no debe ser necesariamente el caso. De hecho, los desplazamientos (p1, p2) de índice pueden diferir para cada una y todas las subbandas de salida. Esto significa que para cada subbanda n se puede seleccionar un valor Ó diferente del parámetro de tono de mejora de productos de cruce.
La Fig. 9 ilustra el procesamiento no lineal contenido en cada una de las unidades 800-n MISO. La operación 901 de producto crea una señal de subbanda con una fase igual a la suma ponderada de las fases de las dos señales de subbanda de entrada complejas y una magnitud igual al valor medio generalizado de las magnitudes de las dos muestras de subbanda de entrada. La unidad 902 de ganancia opcional modifica la magnitud de las muestras de subbanda de fase modificada. En términos matemático, la salida y se puede escribir como una función de las entradas u1801 y u2802 a la unidad 800-n MISO y el parámetro g de ganancia como sigue,
Figure imgf000006_0001
para m= 1,2. (2)
Esto se puede escribir también como:
Figure imgf000006_0002
donde p(|u1|, |u2|) es una función de generación de magnitud En otras palabras, la fase de la señal u1 de subbanda compleja es multiplicada por el orden T - r de transposición y la fase de la señal u2 de subbanda compleja es multiplicada por el orden r de transposición. La suma de las dos fases se usa como la fase de la salida y cuya magnitud es obtenida mediante la función de generación de la magnitud. Comparando con la fórmula (2) la función de generación de la magnitud se expresa como la media geométrica de las magnitudes modificada por el parámetro g de ganancia, esto es p(|m|, |u2|) = g |u1 |1-r/T|u2 |r/T. Permitir al parámetro de ganancia depender de las entradas cubre por supuesto todas las posibilidades.
Se debería observar que la fórmula (2) resulta a partir del objetivo subyacente en que se han de hacer corresponder un par de sinusoides con frecuencias (w, w Ó) a una sinusoide con frecuencia Tw rÓ, que se puede escribir también como (T - r)w r(w Ó).
En el texto siguiente, se explicará en términos generales la descripción matemática de la presente invención. Por simplicidad, se consideran las señales de tiempo continuo. Se supone que el banco 303 de filtros de síntesis consigue la reconstrucción perfecta a partir de un banco 301 de filtros de análisis modulados complejos correspondiente con una función de ventana simétrica o filtro de valor real o un filtro w(t) prototipo. El banco de filtros de síntesis usará a menudo, pero no siempre, la misma ventana en el proceso de síntesis. La modulación se supone que es de un tipo apilado uniformemente, el paso se normaliza a uno y el espaciado de la frecuencia angular de las subbandas de síntesis se normaliza a n. Por tanto, se conseguirá una señal s(t) objetivo en la salida del banco del filtro de síntesis si las señales de subbanda de entrada al banco del filtro de síntesis están dadas mediante las señales yn (k) de subbanda de síntesis.
Figure imgf000007_0001
Observe que la fórmula (3) es un modelo matemático en tiempo continúo normalizado de las operaciones normales en un banco de filtros de análisis de subbanda modulados complejos, tal como una Transformada de Fourier Discreta (DFT) con ventana, también denotada como Transformada de Fourier de tiempo reducido (STFT). Con una pequeña modificación en el argumento de la exponencial compleja de la fórmula (3), se obtienen modelos en tiempo continuo para el Banco de Filtros de Espejo en Cuadratura (QMF) (pseudo) modulados complejos y la Transformada de Coseno Discreta Modificada Complejizada (CMDCT), también denotada como d Ft en ventana apilada particularmente en ventana. El índice n de subbanda funciona a través de todos los números enteros negativos para el caso de tiempo continuo. Para las contrapartes en tiempo discreto, la variable t de tiempo se muestrea en el paso 1 / N, y el índice n de subbanda es limitado por N, donde N es el número de subbandas en el banco de filtros, que es igual al paso de tiempo discreto del banco de filtros. En el caso de tiempo discreto, se requiere también un factor de normalización relacionado con N en la operación de transformada si no se incorpora en el escalado de la ventana. Para una señal de valor real, existen tantas muestras de subbanda complejas fuera como muestras de valor real dentro para el modelo del banco de filtro elegido. Por lo tanto, existe un sobre muestreo total (o una redundancia) por un factor de dos. Los bancos de filtros con un mayor grado de sobre muestreo se pueden emplear también, pero el sobre muestreo se mantiene pequeño en la presente descripción de las realizaciones por claridad de exposición. Los pasos principales involucrados en el análisis del banco de filtros modulados correspondiente a la fórmula (3) son que la señal es multiplicada por una ventana centrada alrededor del tiempo t = k, y la señal en ventana resultante se correlaciona con cada una de las sinusoides complejas exp[-inn(t-k)]. En implementaciones de tiempo discreto esta correlación se implementa de manera eficiente a través de la Transformada Rápida de Fourier. Los siguientes pasos algorítmicos para el banco de filtros de síntesis son bien conocidos para aquellos expertos en la técnica, y consisten de operaciones de modulación de síntesis, de ventana de síntesis, y de adición de superposición.
La Fig. 19 ilustra la posición en el tiempo y la frecuencia correspondiente a la información transportada por la muestra yn(k) de subbanda para la selección de los valores del índice k de tiempo y el índice n de subbanda. Como ejemplo, la muestra y5 (4) de subbanda es representada mediante el rectángulo 1901 oscuro.
Para una sinusoide, s(t) = Acos(wt 0) = Re{Cexp(iwt)}, las señales de subbanda de (3) son para una n suficientemente grande con una buena aproximación dada por
Figure imgf000007_0002
donde el sombrero denota la transformada de Fourier, esto es w es la transformada de Fourier de la función w de ventana.
Estrictamente hablando, la fórmula (4) es cierta sólo si añade un término con -w en lugar de w. Este término se abandona en base a la suposición de que la respuesta en frecuencia de la ventana decae suficientemente rápido, y que la suma de w y n no está cerca de cero.
La Fig. 20 representa la apariencia típica de una ventana w, 2001, y su transformada w de Fourier, 2002.
La Fig. 21 ilustra el análisis de una única sinusoide que corresponde a la fórmula (4). Las subbandas que se ven afectadas principalmente por la sinusoide a la frecuencia w son aquellas con índice n de manera tal que nn - w sea pequeño. Para el ejemplo de la Fig. 21, la frecuencia es w=625n tal como se indica mediante la línea 2101 horizontal discontinua. En ese caso, las tres subbandas para n = 5, 6, 7, representadas por los signos 2102, 2103, 2104 de referencia, contienen, respectivamente señales de subbanda distintas de cero significativas. El conformado de estas tres subbandas refleja la amplitud relativa de las sinusoides complejas dentro de cada subbanda obtenida a partir de la fórmula (4). Un tono más oscuro implica una mayor amplitud. En el ejemplo concreto, esto implica que la amplitud de la subbanda 5, esto es 2102, es inferior comparada con la amplitud de la subbanda 7, esto es 2104, que de nuevo es inferior que la amplitud de la subbanda 6, esto es 2103. Es importante observar que pueden ser necesarias en general diversas subbandas distintas de cero para ser capaz de sintetizar una sinusoide de alta calidad en la salida del banco de filtros de síntesis, especialmente en los casos en los que la ventana tiene una apariencia como la ventana 2001 de la Fig. 20, con una duración de tiempo relativamente corta y lóbulos laterales significativos en frecuencia.
Las señales yn(k) de la subbanda de síntesis se pueden determinar también como resultado del banco 301 de filtros de análisis y el procesamiento no lineal esto es el transponedor 302 armónico ilustrado en la Fig. 3. En el lado del banco de filtros de análisis, las señales xn(k) de subbanda de análisis se pueden representar como una función de la señal z(t) de origen. Para una transposición de orden T, se aplica un banco de filtros de análisis modulados complejos con ventana wT(t) = w(t/T)/T, un paso uno, y un paso de frecuencia de modulación, que es T veces más preciso que el paso de frecuencia del banco de síntesis, en la señal z(t) de origen. La Fig. 22 ilustra la apariencia de la ventana wt 2201 escalada y su transformada 2202 de Fourier. Comparada con la Fig. 20, la ventana 2201 de tiempo se despliega y la ventana 2202 de frecuencia se comprime.
El análisis mediante el banco de filtros modificado da lugar a las señales xn(k) de subbanda:
oo
*_(*)= } z(í)wr0-fc)
Figure imgf000008_0001
Para una sinusoide, z(t) = Bcos(^t 9) = Re{Dexp(i^t)}, se encuentra que las señales de subbanda de (5) para una n suficientemente grande con una buena aproximación vienen dadas por
a„ (k) - D exp(ifc£) w{tm - T4) • (6)
Por tanto, enviar estas señales de subbanda al transponedor 302 armónico y aplicando la regla (1) a (6) de transposición produce
Figure imgf000008_0002
Las señales yn(k) de subbanda de síntesis dadas por la fórmula (4) y las señales de subbanda no lineales obtenidas a través de la transposición 5\(k) armónica dadas por la fórmula (7) idealmente deberían coincidir.
Para órdenes T de transposición impares, el factor que contiene la influencia de la ventana en (7) es igual a uno, ya que la transformada de Fourier de la ventana es de valor real por suposición, y T - 1 es un número par. Por lo tanto, la fórmula (7) se puede hacer corresponder exactamente con la fórmula (4) con w = T£, para todas las subbandas, de manera tal que la salida del banco de filtros de síntesis con las señales de subbanda de entrada según la fórmula (7) es una sinusoide con una frecuencia oo = Tí;, una amplitud A = gB, y una fase 9 = T9, en donde B y 9 se
determinan a partir de la fórmula: D = Bexp(¡9), que tras la inserción produce
Figure imgf000008_0003
Por tanto, se obtiene una transposición armónica de orden T de la señal z(t) de origen sinusoidal.
Para T pares, la coincidencia es más aproximada, pero aún se mantiene en la parte de valor positivo de la respuesta ^ en frecuencia de la ventana, que para una ventana de valor real simétrica incluye el lóbulo principal más importante. Esto implica que también para valores pares de T se obtiene una transposición armónica de la señal z(t) de origen sinusoidal. En el caso particular de una ventana Gaussiana, es siempre positivo y por consiguiente, no existe diferencia en el rendimiento para órdenes pares o impares de la transposición.
De manera similar a la fórmula (6), el análisis de una sinusoide con frecuencia í; O, esto es la señal de origen sinusoidal = B' cos((£ + Q)f + <p') =Re{Eexp(í(^ n ) í ) ) es
x'n(k) - E exp(ik (£ + Q ))w(n7T-T(l Q ) j . ( 8 )
Por lo tanto, alimentando las dos señales u1 = xn-p1(k), que corresponde a la señal 801 en la Fig. 8, y u2 = x'n+p2(k), que corresponde a la señal 802 en la Fig. 8, en el procesamiento 800-n de productos de cruce ilustrado en la Fig. 8 y aplicando la fórmula (2) de productos de cruce produce la señal 803 de subbanda de salida
Figure imgf000008_0004
donde
Figure imgf000008_0005
A partir de la fórmula (9) se puede ver que la evolución de la fase de la señal 803 de subbanda de salida del sistema 800-n MISO sigue la evolución de fase de un análisis de una sinusoide de frecuencia T^ rü. Esto se mantiene independientemente de la elección de los desplazamientos p1 y p2 de índice. De hecho, si la señal (9) de subbanda se alimenta en un canal n de subbanda correspondiente a la frecuencia T^ rü, esto es si nn “ T^ rü, entonces la salida será una contribución a la generación de una sinusoide en la frecuencia T^ rü. Sin embargo, es ventajoso estar seguro que cada contribución es significativa, y que las contribuciones se suman de una manera beneficiosa. Estos aspectos se discutirán a continuación.
Dado un parámetro O de tono de mejora de producto de cruce las elecciones adecuadas para los desplazamientos pi y p2 de índice se pueden derivar en orden para la magnitud M(n, íj) compleja de (10) para aproximar w (ru r-(T 4 K l) ) para un rango de subbandas n, en cuyo caso la salida final se aproximará a una sinusoide en la frecuencia T^ rO. Una primera consideración sobre los lóbulos principales impone todos los tres valores de (n -p1)n - T ,^ (n p2)n - T(Z O), nn - (T^ rO) sean menores de manera simultánea, lo que lleva a las igualdades aproximadas
Figure imgf000009_0001
Esto significa que cuando se conoce el parámetro O de tono mejorado de productos de cruce, los desplazamientos de índice se pueden aproximar mediante la fórmula (11), permitiendo de este modo una selección simple de las subbandas de análisis. Se puede realizar un análisis más completo de los efectos de la elección de los desplazamientos p1 y p2 según la fórmula (11) sobre la magnitud del parámetro M(n, Z) según la fórmula (10) para casos especiales importantes de funciones w(t) de ventana tales como la ventana Gaussiana y una ventana de seno. Se encuentra que la aproximación deseada de w(nn (7 c /'Q)) es mUy kuena para diversas subbandas con nn = TZ rO.
Se debería observar que la relación (11) se calibra a la situación ejemplar donde el banco 301 de filtros de análisis tiene un espaciado de subbanda de frecuencia angular de n/T. En el caso general, la interpretación resultante de (11) es que la extensión p1 + p2 de origen de términos de cruce es un número entero que aproxima la frecuencia O fundamental subyacente, medida en unidades de espaciado de subbanda del banco de filtros de análisis, y que la pareja (p1, p2) se elige como un múltiple de (r, T -r).
Para la determinación de la pareja (p1, p2) de desplazamientos de índice en el decodificador se pueden usar los siguientes modos:
1. 1. Un valor de O se puede derivar en el proceso de codificación y transmitirse explícitamente al decodificador con una precisión suficiente para derivar los valores enteros de p1 y p2 por medio de un procedimiento de redondeado adecuado, que puede seguir los principios de que
o p1 p2 se aproxima a O/Aw, donde Aw es el espaciado de la frecuencia angular del banco de filtros de análisis; y
o p1/p2 se elige para aproximarse a r/(T - r).
2. 2. Para cada muestra de subbanda de objetivo, la pareja (p1, p2) de desplazamientos de índice se puede derivar en el decodificador a partir de una lista predeterminada de valores candidatos tales como
(p-i, p2) = (rl, (T - r)l), I G L, r £ {1, 2, ..., T - 1}, donde L es una lista de números enteros positivos. La selección se puede basar en una optimización de la magnitud de salida de términos de cruce, por ejemplo, una maximización de la energía de la salida de los términos de cruce.
3. 3. Para cada muestra de subbanda objetivo, la pareja (p1, p2) de desplazamientos de índice se puede derivar a partir de una lista reducida de valores de candidatos mediante una optimización de la magnitud de salida de los términos de cruce, donde la lista reducida de valores de candidatos se deriva en el proceso de codificación y se transmite al decodificador.
Se debería observar que la modificación de fase de las señales de subbanda u1 y u2 se realiza con un peso (T-r) y r, respectivamente, pero las distancias p1 y p2 de índice de subbanda se eligen proporcionales a r y (T - r), respectivamente. Por tanto, la subbanda más cercana a la subbanda n de síntesis recibe la modificación de fase más fuerte.
Un método ventajoso para el procedimiento de optimización para los modos 2 y 3 explicados en términos generales anteriormente puede ser considerar la optimización Max-Min:
Figure imgf000009_0002
y para usar la pareja ganadora entre sí con su valor correspondiente de r para construir la contribución del producto de cruce para un índice n de subbanda objetivo dado. En los modos orientados de búsqueda del decodificador 2 y parcialmente también en el 3, la adición de términos de cruce para diferentes valores de r se hace preferiblemente de manera independiente, ya que puede existir riesgo de añadir contenido a la misma subbanda varias veces. Si, por otro lado, se usa la frecuencia O fundamental para seleccionar las subbandas como en el modo 1 o si sólo se permiten un rango reducido de distancias de índice de subbanda como puede ser el caso en el modo 2, se puede evitar este problema concreto de añadir contenido a la misma subbanda varias veces.
Además, se debería observar también que para las realizaciones de los esquemas de procesamiento de términos de cruce explicados en términos generales anteriormente puede ser beneficiosa una modificación del decodificador adicional de la ganancia g de los productos de cruce. Por ejemplo, las señales u1, u2 de subbanda de entrada se refieren a la unidad MISO de productos de cruce dada por la fórmula (2) y la señal x de subbanda de entrada a la unidad SISO de transposición dada por la fórmula (1). Si las tres señales se han de alimentar a la misma subbanda de síntesis de salida como se muestra en la Fig. 4, donde el procesamiento 401 directo y el procesamiento 402 de productos de cruce proporciona los componentes para la misma subbanda de síntesis de salida, puede ser deseable establecer la ganancia g de los productos de cruce a cero, esto es la unidad 902 de ganancia de la Fig. 9, si
min(|ií1|,|ií,|) < q\x \ , (13)
para un umbral predefinido q > 1. En otras palabras, la adición del producto de cruce se realiza sólo si la magnitud |x| de subbanda de entrada del término directo es pequeña comparada con ambos términos de entrada del producto de cruce. En este contexto, x es la muestra de subbanda de análisis para el procesamiento de término directo que lleva a una salida en la misma subbanda de síntesis que el producto de cruce bajo consideración. Esto puede ser una precaución para no mejorar más un componente armónico que ya ha sido equipado por la transposición directa.
A continuación, el método de transposición armónica explicado en términos generales en el presente documento se describirá para las configuraciones espectrales ejemplares para ilustrar las mejoras sobre la técnica anterior. La Fig. 10 ilustra el efecto de la transposición armónica directa de orden T = 2. El diagrama 1001 superior representa las componentes de frecuencia parciales de la señal original mediante flechas verticales posicionadas en múltiplos de la frecuencia O fundamental. Éste ilustra la señal de origen, por ejemplo, en el lado del codificador. El diagrama 1001 se segmenta en un rango de frecuencia de origen del lado izquierdo con frecuencias O, 20, 30, 40, 50 parciales y un rango de frecuencia objetivo del lado derecho con frecuencias 6O, 7O, 8O parciales. El rango de frecuencia de origen se codificará y transmitirá normalmente al decodificador. Por otro lado, el rango de frecuencia objetivo del lado derecho, que comprende las frecuencias 6O, 7O, 8O parciales por encima de la frecuencia 1005 de corte del método HFR, normalmente no se transmitirá al decodificador. Es un objetivo del método de transposición armónico reconstruir el rango de frecuencia objetivo por encima de la frecuencia 1005 de corte de la señal de origen a partir del rango de frecuencia de origen. Por consiguiente, el rango de frecuencia objetivo, y especialmente las frecuencias 6O, 7O, 8O parciales en el diagrama 1001 no están disponibles como entrada al transponedor.
Como se explicó en términos generales anteriormente, es un objetivo del método de transposición armónico regenerar las componentes 6O, 7O, 8O de señal de la señal de origen a partir de las componentes de frecuencia disponibles en el rango de frecuencia de origen. El diagrama 1002 inferior muestra la salida del transponedor en el rango de frecuencia objetivo del lado derecho. Dicho transponedor se puede ubicar por ejemplo en el lado del decodificador. Las parciales a frecuencias 6O y 8O se regeneran a partir de las parciales a frecuencias 3O y 4O mediante transposición armónica usando un orden de transposición T = 2. Como resultado del efecto de extensión espectral de la transposición armónica, representada aquí por las flechas 1003 y 1004 punteadas, se pierde la parcial objetivo a 7O. Esta parcial objetivo a 7O no se puede generar usando el método de transposición armónico de la técnica anterior subyacente.
La Figura 11 ilustra el efecto de la invención para la transposición armónica de una señal periódica en el caso en que un transponedor armónico de segundo orden sea mejorado mediante un término de cruce único, esto es T = 2 y r = 1. Tal como se explicó en términos generales en el contexto de la Fig. 10, se usa un transponedor para generar las parciales 6O, 7O, 8O en el rango de frecuencia objetivo por encima de la frecuencia 1105 de corte en el diagrama 1102 inferior a partir de las parciales O, 2O, 3O, 4O, 50 en el rango de frecuencia de origen por debajo de la frecuencia 1105 de corte del diagrama 1101. Además de la salida del transponedor de la técnica anterior de la Figura 10, la componente de frecuencia parcial a 70 se regenera a partir de una combinación de las parciales de origen a 30 y 40. El efecto de la adición del producto de cruce es representado por las flechas 1103 y 1104 punteadas. En términos de fórmulas, una tiene w = 30 y por lo tanto (T - r)w r(w O) = Tw rO = 60 0 = 70. Como se puede ver a partir de este ejemplo, todas las parciales objetivo se pueden regenerar usando el método HFR inventivo explicado en términos generales en el presente documento.
La Fig. 12 ilustra una posible implementación de un transponedor armónico de segundo orden de la técnica anterior en un banco de filtros modulados para la configuración espectral de la Fig. 10. Las respuestas de frecuencia estilizadas de las subbandas del banco de filtros de análisis son mostradas por las líneas punteadas, por ejemplo el signo 1206 de referencia, en el diagrama 1201 superior. Las subbandas son enumeradas mediante el índice de subbanda, de los cuales los índices 5, 10 y 15 se muestran en la Fig. 12. Para el ejemplo dado, la frecuencia O fundamental es igual a 3,5 veces el espaciado de la frecuencia de la subbanda de análisis. Esto es ilustrado mediante el hecho de que la O parcial en el diagrama 1201 se posiciona entre las dos subbandas con el índice 3 y 4 de subbanda. La 20 parcial se posiciona en el centro de la subbanda con índice 7 de subbanda y así sucesivamente.
El diagrama 1202 inferior muestra las parciales 60 y 80 regeneradas superpuestas con las respuestas de frecuencia estilizadas, por ejemplo el signo 1207 de referencia, de las subbandas del banco de filtros de síntesis. Como se describió anteriormente, estas subbandas tienen un espaciado de frecuencia T = 2 veces más grande. Por consiguiente, también las respuestas de frecuencia son escaladas por el factor T = 2. Como se explicó en términos generales anteriormente, el método de procesamiento de términos directos de la técnica anterior modifica la fase de cada subbanda de análisis, esto es de cada subbanda por debajo de la frecuencia 1205 de corte en el diagrama 1201, por un factor T = 2 y hace corresponder el resultado en la subbanda de síntesis con el mismo índice, esto es una subbanda por encima de la frecuencia 1205 de corte en el diagrama 1202. Esto es simbolizado en la Fig. 12 mediante flechas punteadas diagonales, por ejemplo, la flecha 1208 para la subbanda 1206 de análisis y la subbanda 1207 de síntesis. El resultado de este procesamiento del término directo para las subbandas con índices 9 a 16 de subbanda a partir de la subbanda 1201 de análisis es la regeneración de las dos parciales objetivo a las frecuencias 60 y 80 en la subbanda 1202 de síntesis a partir de las parciales de origen a las frecuencias 30 y 40. Como se puede ver a partir de la Fig. 12, la contribución principal de la parcial 60 objetivo viene de las subbandas con los índices 10 y 11 de subbanda, esto es los signos 1209 y 1210 de referencia, y la contribución principal a la parcial 80 objetivo viene de la subbanda con índice 14 de subbanda, esto es el signo 1211 de referencia.
La Fig. 13 ilustra una posible implementación de un paso adicional de procesamiento de términos de cruce en el banco de filtros modulados de la Fig. 12. El paso de procesamiento de términos de cruce corresponde al descrito para señales periódicas con la frecuencia 0 fundamental en relación a la Fig. 11. El diagrama 1301 superior ilustra las subbandas de análisis, de las cuales el rango de frecuencia de origen se ha de transponer en el rango de frecuencia objetivo de las subbandas de síntesis en el diagrama 1302 inferior. Se considera el caso concreto de la generación de las subbandas 1315 y 1316 de síntesis, que rodean a la parcial 70, a partir de las subbandas de análisis. Para un orden de transposición T = 2, se puede seleccionar un posible valor r = 1. Elegir la lista de valores
(p-i, p2) candidatos como un múltiplo (r, T - r) = (1, 1) de manera tal que pi p2 aproxima (Q/3.5) , esto es la frecuencia 0 fundamental en unidades de espaciado de frecuencia de subbanda de análisis, lleva a la elección p1 = p2 = 2. Como se explicó en términos generales en el contexto de la Fig. 8, una subbanda de síntesis con el índice n de subbanda se puede generar a partir del producto de términos de cruce de las subbandas de análisis con el índice de subbandas (n-p1) y (n+p2). Por lo tanto. Para la subbanda de síntesis con el índice 12 de subbanda, esto es el signo 1315 de referencia, un producto de cruce se forma a partir de las subbandas de análisis con el índice de subbanda (n - p1) = 12 - 2 = 10, esto es el signo 1311 de referencia, y (n p2) = 12 2 = 14, esto es el signo 1313 de referencia. Para la subbanda de síntesis con índice 13 de subbanda, se forma un producto de cruce a partir de las subbandas de análisis con un índice (n - p1) = 13 - 2 = 11, esto es el signo 1312 de referencia, y (n p2) = 13 2 = 15, esto es el signo 1314 de referencia. Este proceso de generación del producto de cruce es simbolizado mediante las parejas de flechas discontinuas / punteadas diagonales, esto es las parejas 1308, 1309 y 1306, 1307, respectivamente de signos de referencia.
Como se puede ver a partir de la Fig. 13, la parcial 70 se coloca principalmente dentro de la subbanda 1315 con índice 12 y sólo de manera secundaria en la subbanda 1316 con índice 13. Por consiguiente, para unas respuestas del filtro más realistas, existirán más términos directos y/o de cruce alrededor de la subbanda 1315 de síntesis con índice 12 que se añadirán de manera beneficiosa a la síntesis de una sinusoide de alta calidad a la frecuencia (T -r)w r(w 0) = Tw r0 = 60 0 = 70 que los términos alrededor de la subbanda 1316 de síntesis con índice 13. Además, como se destacó en el contexto de la fórmula (13), una adición ciega de todos los términos de cruce con p1 = p2 = 2 podría llevar a componentes de señal no deseados para señales de entrada menos periódicas y académicas. Por consiguiente, este fenómeno de componentes de señal no deseados puede requerir la aplicación de una regla de cancelación de productos de cruce adaptativa tal como la regla dada por la fórmula (13).
La Fig. 14 ilustra el efecto de la transposición armónica de la técnica anterior de orden T = 3. El diagrama 1401 superior representa los componentes de frecuencia parciales de la señal original mediante flechas verticales posicionadas a múltiplos de la frecuencia 0 fundamental. Las parciales 60,70, 80, 90 están en el rango objetivo por encima de la frecuencia 1405 de corte del método HFR y por lo tanto no están disponibles como entradas al transponedor. El objetivo de la transposición armónica es regenerar estás componentes de señal a partir de la señal en el rango de origen. El diagrama 1402 inferior muestra la salida del transponedor en el rango de frecuencia objetivo. Las parciales a frecuencias 60, esto es el signo 1407 de referencia, y 90, esto es el signo 1410 de referencia, se han regenerado a partir de las parciales a las frecuencias 20, esto es el signo 1406 de referencia, y 30, esto es el signo 1409 de referencia. Como resultado del efecto de expansión espectral de la transposición armónica, representada aquí mediante las flechas 1408 y 1411 punteadas, respectivamente, las parciales objetivo a 70 y 80 se pierden.
La Fig. 15 ilustra el efecto de la invención para la transposición armónica de una señal periódica en el caso en que un transponedor armónico de tercer orden sea mejorado mediante la adición de dos términos de cruce diferentes, esto es T = 3 y r = 1, 2. Además de la salida del transponedor de la técnica anterior de la Fig. 14, la componente 1508 de frecuencia parcial en 70 es regenerada mediante el término de cruce para r = 1 a partir de una combinación de las parciales 1506 y 1507 de origen a 20 y 30. El efecto de la adición de productos de cruce es representado mediante las flechas 1510 y 1511 punteadas. En términos de fórmulas, se tiene que con w = 20, (T - r)w r(w 0) = Tw r 0 = 60 0 = 70. Igualmente, la componente 1509 de frecuencia parcial a 80 es regenerada por el término de cruce para r = 2. Esta componente 1509 de frecuencia parcial en el rango objetivo del diagrama 1502 inferior es generado a partir de las componentes parciales 1506 a 20 y 1507 a 30 en el rango de frecuencia de origen del diagrama 1501 superior. La generación del producto de términos de cruce es representada mediante las flechas 1512 y 1513. En términos de fórmulas, se tiene que (T - r)w r(w O) = Tw r O = 60 20 = 80. Como se puede ver, todas las parciales objetivo se pueden regenerar usando el método HFR inventivo descrito en el presente documento.
La Fig. 16 ilustra una posible implementación de un transponedor armónico de tercer orden de la técnica anterior en un banco de filtros modulados para la situación espectral de la Fig. 14. Las respuestas de frecuencia estilizada de las subbandas del banco de filtros de análisis son mostradas por líneas punteadas en el diagrama 1601 superior. Las subbandas son enumeradas por los índices 1 a 17 de subbanda de los cuales la subbandas 1606, con índice 7, la 1607, con índice 10 y la 1608, con índice 11 son referenciadas de una manera ejemplar. Para el ejemplo dado, la frecuencia 0 fundamental es igual a 3,5 veces el espaciado Aw de frecuencia de la subbanda de análisis. El diagrama 1602 inferior muestra la frecuencia parcial regenerada superpuesta con las respuestas de frecuencia estilizada de las subbandas del banco de filtros de síntesis seleccionadas. A modo de ejemplo, se referencian la subbanda 1609, con índice 7, la 1610, con índice 10 de subbanda y la 1611, con índice 11 de subbanda. Como se describe anteriormente, estas subbandas tienen un espaciado Aw de frecuencia T = 3 veces más grande. Correspondientemente, también se escalan las respuestas en frecuencia, por consiguiente.
El procesamiento de términos directos de la técnica anterior modifica la fase de las señales de subbanda por un factor T = 3 para cada subbanda de análisis y hace corresponder el resultado en la subbanda de síntesis con el mismo índice, tal como se simboliza mediante las flechas punteadas diagonales. El resultado de este procesamiento de términos directos para las subbandas 6 a 11 es la regeneración de las dos frecuencias parciales objetivo 60 y 90 a partir de las parciales de origen a frecuencia 20 y 30. Tal como se puede ver a partir de la Fig. 16, la contribución principal a la parcial 60 objetivo viene de la subbanda con índice 7, esto es el signo 1606 de referencia, y las contribuciones principales a la parcial 90 objetivo viene de las subbandas con índice 10 y 11, esto es los signos 1607 y 1608 de referencia, respectivamente.
La Fig. 17 ilustra una posible implementación de un paso de procesamiento de términos de cruce adicional para r = 1 en el banco de filtros modulados de la Fig. 16 que lleva a la regeneración de la parcial a 70. Tal como se explicó en términos generales en el contexto de la Fig. 8 los desplazamientos (p1 , p2) de índice pueden ser seleccionados como un múltiplo de (r, T - r) = (1, 2), de manera tal que p1 + p2 se aproxima a 3,5, esto es la frecuencia 0 fundamental en unidades del espaciado Aw de frecuencia de subbanda de análisis. En otras palabras, la distancia relativa, esto es la distancia en el eje de frecuencia dividida por el espaciado Aw de frecuencia de subbanda de análisis, entre las dos subbandas de análisis que contribuyen a la subbanda de síntesis que se ha de generar, debería aproximar mejor la frecuencia fundamental relativa, esto es la frecuencia 0 fundamental dividida entre el espaciado Aw de frecuencia de subbanda de análisis. Esto es expresado también mediante las fórmulas (11) y lleva a la elección p1 = 1, p2 = 2.
Tal como se muestra en la Fig. 17, la subbanda de síntesis con índice 8, esto es el signo 1710 de referencia, se obtiene a partir de un producto de cruce formado a partir de las subbandas de análisis con índice (n - p1) = 8 - 1 = 7, esto es el signo 1706 de referencia, y (n p2) = 8 2 = 10, esto es el signo 1708 de referencia. Para la subbanda de síntesis con índice 9, se forma un producto de cruce a partir de las subbandas de análisis con índice (n - p1) = 9 - 1 = 8, esto es el signo 1707 de referencia, y (n p2) = 9 2 = 11, esto es el signo 1709 de referencia. Este proceso de formación de productos de cruce es simbolizado mediante las parejas de flechas discontinuas/punteadas diagonales, esto es las parejas 1712, 1713 y 1714, 1715 de flechas, respectivamente. Se puede ver a partir de la Fig. 17 que la frecuencia 70 parcial se posiciona de manera más prominente en la subbanda 1710 que en la subbanda 1711. Por consiguiente, se ha de esperar que para unas respuestas realistas del filtro, existirán más términos de cruce alrededor de la subbanda de síntesis con índice 8, esto es la subbanda 1710, que se añaden de manera beneficiosa a la síntesis de una sinusoide de alta calidad a la frecuencia (T - r)w r(w 0) = Tw r 0 = 60 0 = 70.
La Fig. 18 ilustra una posible implementación de un paso de procesamiento de términos de cruce adicional para r = 2 en el banco de filtros modulados de la Fig. 16 que lleva a la regeneración de la frecuencia parcial en 80. Los desplazamientos (p1, p2) de índice se pueden seleccionar como un múltiplo de (r, T - r) = (2, 1), de manera tal que p1 + p2 se aproxime a 3,5, esto es la frecuencia 0 fundamental en unidades de espaciado Aw de frecuencia de subbanda de análisis. Esto lleva a la elección p1 = 2, p2 = 1. Como se muestra en la Fig. 18, la subbanda de síntesis con índice 9, esto es el signo 1810 de referencia, se obtiene a partir del producto de cruce formado a partir de las subbandas de análisis con índice (n - p1) = 9 - 2 = 7, esto es el signo 1806 de referencia, y (n p2) = 9 1 = 10, esto es el signo 1808 de referencia. Para la subbanda de síntesis con índice 10, se forma un producto de cruce a partir de las subbandas de análisis con índice (n - p1) = 10 - 2 = 8, esto es el signo 1807 de referencia, y (n p2) = 10 1 = 11, esto es el signo 1809 de referencia. Este proceso de formación de productos de cruce es simbolizado mediante las parejas de flechas discontinuas/punteadas diagonales, esto es las parejas 1812, 1813 y 1814, 1815 de flechas, respectivamente. Se puede ver a partir de la Fig. 18 que la frecuencia 80 parcial se posiciona ligeramente de manera más prominente en la subbanda 1810 que en la subbanda 1811. Por consiguiente, se ha de esperar que para tener respuestas del filtro realistas, existirán más términos directos y/o de cruce alrededor de la subbanda de síntesis con índice 9, esto es la subbanda 1810, que se añaden de manera beneficiosa para la síntesis de una sinusoide de alta calidad a la frecuencia (T - r)w r(w 0) = Tw r 0 = 20 60 = 80.
A continuación, se hace referencia a las Figuras 23 y 24 que ilustran la optimización Max-Min en base al procedimiento (12) de selección para la pareja (p1, p2) de desplazamiento de índice y r según esta regla para T = 3. El índice de subbanda objetivo elegido es n = 18 y el diagrama superior suministra un ejemplo de la magnitud de una señal de subbanda para un 'índice de tiempo dado. La lista de enteros posibles está dada aquí por los siete valores L = {2, 3, ..., 8}.
La Fig. 23 ilustra la búsqueda para candidatos con r = 1. La subbanda objetivo o de análisis se muestra con el índice n = 18. La línea 2301 punteada destaca la subbanda con el índice n = 18 en el rango de subbanda de análisis superior y el rango de subbanda de síntesis inferior. Las posibles parejas de desplazamiento de índice son (p1p2) = {(2, 4), (3, 6), ..., (8,16)}, para l = 2, 3, ..., 8, respectivamente, y las correspondientes parejas de índice de muestra de magnitud de subbanda de análisis, esto es la lista de parejas de índice de subbanda que se consideran para determinar el término de cruce óptimo, son {(16, 22), (15, 24), ..., (10, 34)}. El conjunto de flechas ilustra las parejas bajo consideración. Como un ejemplo, se muestra la pareja (15, 24) denotada por los signos 2302 y 2303 de referencia. La evaluación del mínimo de estas parejas de magnitud da la lista (0, 4, 1, 0, 0, 0, 0) para las respectivas magnitudes mínimas para la posible lista de términos de cruce. Ya que la segunda entrada para l = 3 es máxima, la pareja (15, 24) gana de entre los candidatos con r = 1, y esta selección es representada mediante las flechas gruesas.
La Fig. 24 ilustra de manera similar la búsqueda para candidatos con r = 2. La subbanda objetivo o de síntesis se muestra con el índice n = 18. La línea 2401 punteada destaca la subbanda con el índice n = 18 en el rango de subbanda de análisis superior y el rango de subbanda de síntesis inferior. En este caso, las posibles parejas de desplazamiento de índice son (p1, p2) = {(4, 2), (6, 3), ..., (16, 8)} y las correspondientes parejas de índice de muestra de magnitud de subbanda de análisis son {(14, 20), (12, 21), ..., (2, 26)}, de las cuales la pareja (6, 24) es representada mediante los signos 2402 y 2403 de referencia. La evaluación del mínimo de estas parejas de magnitud da la lista (0, 0, 0, 0, 3, 1, 0). Ya que la quinta entrada es máxima, esto es l = 6, la pareja (6, 24) gana de entre los candidatos con r = 2, tal como se representa mediante las flechas gruesas. En general, ya que el mínimo de la pareja de magnitud correspondiente es menor que el de la pareja de subbanda seleccionada para r = 1, la selección final para el índice n = 18 de subbanda objetivo cae en la pareja (15, 24) y r = 1.
Se debería observar además que cuando la señal z(t) de entrada es una serie armónica con una frecuencia O fundamental, esto es con una frecuencia fundamental que corresponde con el parámetro de tono mejorado de producto de cruce, y O es suficientemente grande comparado con la resolución de frecuencia del banco de filtros de análisis, las señales xn(k) de subbanda de análisis dadas por la fórmula (6) y x'n(k) dada por la fórmula (8) son buenas aproximaciones del análisis de la señal z(t) de entrada donde la aproximación es válida en diferentes regiones de subbanda. A continuación, a partir de la comparación de las fórmulas (6) y (8-10) de que una evolución de fase armónica a lo largo del eje de frecuencia de la señal z(t) de entrada será extrapolada de manera correcta mediante la presente invención. Esto se sostiene en particular para un tren de pulsos puro. Para la calidad de audio de salida, ésta es una característica atractiva para señales de tren de pulsos, como aquellos producidos por las voces humanas y algunos instrumentos musicales.
Las Figuras 25, 26 y 27 ilustran el rendimiento de una implementación ejemplar de la transposición inventiva para una señal armónica en el caso T =3. La señal tiene una frecuencia fundamental de 282,35 Hz y su espectro de magnitud en el rango objetivo considerado de 10 a 15 kHz se representa en la Fig. 25. Un banco de filtros de N = 512 subbandas se usa a una frecuencia de muestreo de 48 kHz para implementar las transposiciones. El espectro de magnitud de la salida de un transponedor directo de tercer orden (T=3) se representa en la Fig. 26. Como se puede ver, cada tercer armónico se reproduce con gran fidelidad tal como se predijo por la teoría explicada en términos generales anteriormente, y el tono percibido será de 847 Hz, tres veces el original. La Fig. 27 muestra la salida de un transponedor que aplica productos de términos de cruce. Todos los armónicos se han recreado hasta las imperfecciones debido a los aspectos aproximados de la teoría. Para este caso, los lóbulos laterales son de aproximadamente 40 dB por debajo del nivel de señal y esto es más que suficiente para la regeneración del contenido de alta frecuencia que es perceptualmente indistinguible de la señal armónica original.
A continuación, se hace referencia a la Fig. 28 y la Fig. 29 que ilustran un codificador 2800 ejemplar y un decodificador 2900 ejemplar, respectivamente, para codificación de voz y audio unificada (USAC). La estructura general del codificador 2800 y del decodificador 2900 USAC se describen a continuación: Primero existe un pre/post procesamiento que consiste de una unidad funcional MPEG envolvente (MPEGS) para manipular procesamiento estéreo o multi canal y una unidad 2801 y 2901 SBR mejorada (eSBR), respectivamente, que manipula la representación paramétrica de las frecuencias de audio superiores en la señal de entrada y que puede hacer uso de los métodos de transposición armónica explicados en términos generales en el presente documento. Entonces existen dos ramificaciones, una consistente de una ruta de herramienta de Codificación de Audio Avanzada (AAC) modificada y la otra consistente de una codificación de predicción lineal (dominio LP o LPC) basada en la ruta, que a su vez presente bien una representación en el dominio de la frecuencia o una representación en el dominio del tiempo del LPC residual. Todos los espectros transmitidos para ambas, la AAC y la LPC, se pueden representar en el dominio MDCT que sigue a la cuantificación y codificación aritmética. La representación en el dominio del tiempo usa un esquema de codificación por excitación ACELP.
La unidad 2801 de Replicación de Banda Espectral mejorada (eSBR) del codificador 2800 puede comprender los sistemas de reconstrucción de alta frecuencia explicados en términos generales en el presente documento. En concreto, la unidad 2801 eSBR puede comprender un banco 301 de filtros de análisis para generar una pluralidad de señales de subbanda de análisis. Estas señales de subbanda de análisis se pueden transponer entonces en una unidad 302 no lineal para generar una pluralidad de señales de subbanda de síntesis, que se pueden introducir después a un banco 303 de filtros de síntesis para generar una componente de alta frecuencia. En la unidad 2801 eSBR, en el lado de codificación, se puede determinar un conjunto de información sobre cómo generar una componente de alta frecuencia a partir de la componente de baja frecuencia que mejor coincide con la componente de alta frecuencia de la señal original, Este conjunto de información puede comprender información sobre las características de la señal, tal como la frecuencia Ó fundamental predominante, sobre la envolvente espectral de la componente de alta frecuencia, y puede comprender información sobre cómo combinar mejor las señales de subbanda de análisis, esto es información tal como el conjunto limitado de parejas (p1, p2) de desplazamiento de índice. Los datos codificados relacionados con este primer conjunto de información se combinan con la otra información codificada en un multiplexor de flujo de bits y se envían como un flujo de audio codificado al decodificador 2900 correspondiente.
El decodificador 2900 mostrado en la Fig. 29 comprende también una unidad de Replicación de Ancho de Banda Espectral mejorada (eSBR) 2901. Esta unidad 2901 eSBR recibe el flujo de bits de audio codificado o la señal codificada del codificador 2800 y usa los métodos explicados en términos generales en el presente documento para generar una componente de alta frecuencia de la señal, que se combina con la componente de baja frecuencia decodificada para producir una señal decodificada. La unidad 2901 eSBR puede comprender las diferentes componentes explicadas en términos generales en el presente documento. En concreto, puede comprender un banco 301 de filtros de análisis, una unidad 302 de procesamiento no lineal y un banco 303 de filtros de síntesis. La unidad 2901 eSBR puede usar información en la componente de alta frecuencia proporcionada por el codificador 2800 para realizar la reconstrucción de alta frecuencia. Dicha información puede ser una frecuencia Ó fundamental de la señal, la envolvente espectral de la componente de alta frecuencia original y/o la información sobre las subbandas de análisis que se han de usar para generar las señales de subbanda de síntesis y por último la componente de alta frecuencia de la señal decodificada.
Además, las Fig. 28 y 29 ilustran posibles componentes adicionales de un codificador/decodificador USAC, tales como:
• una herramienta de demultiplexor de carga útil de flujo de bits, que separa la carga útil del flujo de bits en partes para cada herramienta, y proporciona cada una de las herramientas con la información de la carga útil del flujo de bits relacionada con esa herramienta;
• una herramienta de decodificación sin ruido de factor de escala, que toma la información del demultiplexor de la carga útil del flujo de bits, analiza esa información, y decodifica los factores de escala codificados en Huffman y DPCM;
• una herramienta de decodificación sin ruido espectral, que toma la información del demultiplexor de la carga útil del flujo de bits, analiza esa información, decodifica los datos codificados de manera aritmética, y reconstruye los espectros cuantificados;
• una herramienta cuantificadora inversa, que toma los valores cuantificados para los espectros, y convierte los valores enteros a los espectros reconstruidos, no escalados; este cuantificador es preferiblemente un cuantificador de compresión, cuyo factor de compresión depende del modo de codificación de núcleo elegido;
• una herramienta de llenado de ruido, que se usa para rellenar huecos espectrales en los espectros decodificados, que se producen cuando los valores espectrales se cuantifican a cero por ejemplo debido a una restricción fuerte sobre la demanda de bits en el codificador;
• una herramienta de reescalado, que convierte la representación entera de los factores de escala a los valores reales, y multiplica los espectros cuantificados de manera inversa no escalados por los factores de escala;
• una herramienta M/S, tal como se describe en la ISO/IEC 14496-3;
• una herramienta de conformado de ruido temporal (TNS), tal como se describe en la ISO/IEC 14496-3;
• una herramienta de conmutación de banco / bloque de filtros, que aplica la inversa de la correspondencia de frecuencia que fue llevada a cabo en el codificador; se usa preferiblemente una transformada de coseno discreta modificada (IMDCT) para la herramienta de banco de filtros;
• una herramienta de conmutación de banco / bloque de filtros distorsionados en tiempo, que reemplaza la herramienta de conmutación de banco / bloque de filtros normal cuando se habilita el modo de distorsión; el banco de filtros preferiblemente es el mismo (IMDCT) que para el banco de filtros normal, de manera adicional las muestras en el dominio de tiempo con ventana se hacen corresponder a partir del dominio de tiempo distorsionado al dominio de tiempo lineal mediante el muestreo variante en el tiempo;
• una herramienta de Envolvente MPEG (MPEGS), que produce múltiples señales a partir de una o más señales de entrada aplicando un procedimiento de mezcla ascendente sofisticado a la señal o señales de entrada controladas por los parámetros espaciales apropiados; en el contexto USAC, MPEGS se usa preferiblemente para codificar una señal multicanal, transmitiendo información lateral paramétrica junto a la señal de mezcla descendente transmitida;
• una herramienta Clasificadora de Señal, que analiza la señal de entrada original y genera a partir de ésta la información de control que desencadena la selección de los diferentes modos de codificación; el análisis de la señal de entrada es normalmente una implementación dependiente e intentará elegir el modo de codificación de núcleo óptimo para una trama de señal de entrada dada; la salida del clasificador de señal se puede usar de manera opcional para influenciar el comportamiento de las otras herramientas, por ejemplo los bancos de filtros distorsionados en tiempo de envolvente MPEG, de SBR mejorada.
• una herramienta de filtro LPC, que produce una señal en el dominio del tiempo a partir de una señal en el dominio de excitación mediante el filtrado de la señal de excitación reconstruida a través del filtro de síntesis de predicción lineal; y
• una herramienta ACELP, que proporciona una manera de representar de manera eficiente una señal de excitación en el dominio del tiempo combinando un predictor a largo plazo (palabra clave adaptativa) con una secuencia como un pulso (palabra clave de innovación).
La Fig. 30 ilustra una realización de las unidades eSBR mostradas en las Fig. 28 y 29. La unidad 3000 eSBR se describirá a continuación en el contexto de un decodificador, donde la entrada a la unidad 3000 eSBR es la componente de baja frecuencia, también conocida como la banda baja, de una señal y la posible información adicional respecto las características de señal específicas, tales como la frecuencia O fundamental, y/o los posibles valores (p1, p2) de desplazamiento de índice. En el lado del codificador, la entrada a la unidad eSBR normalmente será la señal completa, donde la salida será información adicional respecto a las características de señal y/o los valores de desplazamiento de índice.
En la Fig. 30 la componente 3013 de baja frecuencia es alimentada a un banco de filtros QMF, para generar las bandas de frecuencia QMF. Estas bandas de frecuencia QMF no se deben confundir con las subbandas de análisis explicadas en términos generales en este documento. Las bandas de frecuencia QMF se usan con el propósito de manipular y combinar la componente de baja y alta frecuencia de la señal en el dominio de la frecuencia, en lugar de en el dominio de tiempo. La componente 3014 de baja frecuencia es alimentada dentro de la unidad 3004 de transposición que corresponde a los sistemas para la reconstrucción de la alta frecuencia explicados en términos generales en el presente documento. La unidad 3004 de transposición puede recibir también información 3011 adicional, tal como la frecuencia O fundamental de la señal codificada y/o las posibles parejas (p1, p2) de desplazamiento de índice para la selección de subbanda. La unidad 3004 de transposición genera una componente 3012 de alta frecuencia, también conocida como banda superior, de la señal, que se transforma al dominio de la frecuencia mediante un banco 3003 de filtros QMF. Tanto, la componente de baja frecuencia transformada QMF como la componente de alta frecuencia transformada QMF se alimentan en la unidad 3005 de manipulación y combinación. Esta unidad 3005 puede realizar un ajuste de envolvente de la componente de alta frecuencia y combina la componente de alta frecuencia ajustada y la componente de baja frecuencia. La señal de salida combinada se vuelve a transformar al dominio del tiempo mediante un banco 3001 de filtros QMF.
Normalmente los bancos de filtros QMF comprende 64 bandas de frecuencias QMF. Se debería observar, sin embargo, que puede ser beneficioso muestrear de manera descendente la componente 3013 de baja frecuencia, de manera tal que el banco 3002 de filtros QMF sólo requiera 32 bandas de frecuencia QMF. En dichos casos, la componente 3013 de baja frecuencia tiene un ancho de banda de fS/4 donde fS es la frecuencia de muestreo de la señal. Por otro lado, la componente 3012 de alta frecuencia tiene un ancho de banda de fS2.
El método y sistema descrito en el presente documento se puede implementar como software, firmware y/o hardware. Ciertos componentes se pueden implementar por ejemplo como software que se ejecuta en un procesador de señal digital o un microprocesador. Se pueden implementar otros componentes por ejemplo como hardware y o como circuitos integrados específicos de aplicación. Las señales encontradas en los métodos y sistemas descritos se pueden almacenar en medios tales como redes de radio, redes de satélite, redes inalámbricas o redes por cable, por ejemplo, internet. Los dispositivos típicos que hacen uso del método y sistema descrito en el presente documento son cajas descodificadoras u otro equipo de las instalaciones del cliente que decodifique señales de audio. En el lado de la codificación, se puede usar el método y sistema en estaciones de difusión, por ejemplo, en sistemas de cabecera de video.
El presente documento explica en términos generales el método y sistema para realizar la reconstrucción en alta frecuencia de una señal basada en la componente en baja frecuencia de esa señal. Usando combinaciones de subbandas desde la componente de baja frecuencia, el método y sistema permiten la reconstrucción de las frecuencias y las bandas de frecuencia que no se pueden generar mediante los métodos de transposición conocidos en la técnica. Además, el método y sistema HTR descrito permite el uso de frecuencia de corte bajas y/o la generación de grandes bandas de frecuencia a partir de bandas de baja frecuencia estrechas.

Claims (12)

REIVINDICACIONES
1. Un sistema para decodificar una señal de audio, el sistema comprendiendo:
- un decodificador (101) de núcleo para decodificar una componente de baja frecuencia de la señal de audio; - un banco (301) de filtros de análisis para proporcionar una pluralidad de señales de subbanda de análisis de la componente de baja frecuencia de la señal de audio;
- una unidad de recepción de selección de subbanda para recibir la información asociada con una frecuencia Q fundamental de la seña de audio, y para seleccionar, en respuesta a la información, una primera (801) y una segunda (802) señal de subbanda de análisis a partir de la pluralidad de señales de subbanda de análisis, a partir de la cual se genera una señal (803) de subbanda de síntesis;
- una unidad (302) de procesamiento no lineal para generar la señal de subbanda de síntesis con una frecuencia de síntesis, una magnitud y una fase por la que:
- determinar la magnitud de la señal de subbanda de síntesis a partir de un valor medio generalizado de las magnitudes de la primera y segunda señal de subbanda de análisis; y
- determinar la fase de la señal de subbanda de síntesis a partir de una suma ponderada de las fases de la primera y segunda señal de subbanda de análisis; y
- un banco (303) de filtros de síntesis para generar una componente de alta frecuencia de la señal de audio a partir de la señal de subbanda de síntesis;
en donde la información asociada con una frecuencia Q fundamental de la señal de audio se recibe en un flujo de bits codificado.
2. El sistema según la reivindicación 1, en donde
- el banco (301) de filtros de análisis tiene N subbandas de análisis con un espaciado de subbanda constante de esencialmente Aw;
- una subbanda de análisis se asocia con un índice n de subbanda de análisis, con ne {1, N};
- el banco (303) de filtros de síntesis tiene una subbanda de síntesis;
- la subbanda de síntesis se asocia con un índice n de subbanda de síntesis; y
- la subbanda de síntesis y la subbanda de análisis con índice n comprenden cada una los rangos de frecuencia que se relacionan los unos con los otros a través de un factor T.
3. El sistema según la reivindicación 2, que comprende además:
- una ventana (2001) de análisis, que aísla un intervalo de tiempo predefinido de la componente de baja frecuencia alrededor de una instancia k de tiempo predefinida; y
- una ventana (2201) de síntesis que aísla un intervalo de tiempo predefinido de la componente de alta frecuencia alrededor de una instancia k de tiempo predefinida.
4. El sistema según la reivindicación 3, en donde
- la ventana (2201) de síntesis es una versión escalada en el tiempo de la ventana (2001) de análisis.
5. El sistema según la reivindicación 1, que comprende además:
- un muestreador ascendente (104) para realizar un muestreo ascendente de la componente de baja frecuencia para producir una componente de baja frecuencia sin muestrear;
- un ajustador (103) de envolvente para dar forma a la componente de alta frecuencia; y
- una unidad de suma de componentes para determinar una señal de audio decodificada como la suma de la componente de baja frecuencia muestreada de manera ascendente y la componente de alta frecuencia ajustada.
6. El sistema según la reivindicación 5, que comprende además:
- una unidad de recepción de envolvente para recibir la información relacionada con la envolvente de la componente de alta frecuencia de la señal de audio.
7. El sistema según la reivindicación 6, que comprende además:
- una unidad de entrada para recibir la señal de audio, comprendiendo la componente de baja frecuencia; y - una unidad de salida para proporcionar la señal de audio decodificada, comprendiendo la componente de baja frecuencia y la componente de alta frecuencia generada.
8. El sistema según la reivindicación 1, en donde la unidad (302) de procesamiento no lineal comprende una unidad (800-n) de múltiples entradas salida única de un primer y un segundo orden de transposición para generar la señal (803) de subbanda de síntesis con la frecuencia de síntesis a partir de la primera (801) y la segunda (802) señales de subbanda de análisis con una primera y una segunda frecuencia de análisis, respectivamente; en donde la frecuencia de síntesis corresponde a la primera frecuencia de análisis multiplicada por el primer orden de transposición más la segunda frecuencia de análisis multiplicada por el segundo orden de transposición.
9. El sistema según la reivindicación 8, en donde
- la primera frecuencia de análisis es w;
- la segunda frecuencia de análisis es (w O)
- el primer orden de transposición es (T -r);
- el segundo orden de transposición es r;
- T > 1; y
- 1 < r < T;
de manera tal que la frecuencia de síntesis es (T - r)w r(w O).
10. El sistema según la reivindicación1, en donde
- el banco (301) de filtros de análisis muestra un espaciado de frecuencia que se asocia con la frecuencia O fundamental de la señal de audio.
11. Un método para decodificar una señal de audio, el método comprendiendo:
- decodificar la componente de baja frecuencia de la señal de audio;
- proporcionar una pluralidad de señales de subbanda de análisis de la componente de baja frecuencia de la señal de audio;
- recibir la información asociada con una frecuencia Q fundamental de la señal de audio que permita la selección de una primera (801) y una segunda (802) señal de subbanda de análisis a partir de la pluralidad de señales de subbanda de análisis; generar una señal de subbanda de síntesis con una frecuencia de síntesis una magnitud y una fase por la que:
- determinar la magnitud de la señal de subbanda de síntesis a partir de un valor medio de las magnitudes de la primera y la segunda señal de subbanda de análisis; y
- determinar la fase de la señal de subbanda de síntesis a partir de la suma ponderada de las fases de la primera y la segunda señal de subbanda de análisis; y
generar (303) una componente de alta frecuencia de la señal de audio a partir de la señal de subbanda de síntesis; en donde la información asociada con una frecuencia Q fundamental de la señal de audio se recibe en un flujo de bits codificado.
12. Un medio de almacenamiento que comprende un programa de software adaptado para la ejecución en un procesador y para realizar los pasos del método de la reivindicación 11 cuando es llevado a cabo en un dispositivo de cálculo.
ES19171999T 2009-01-16 2010-01-15 Transposición armónica mejorada de productos de cruce Active ES2901735T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14522309P 2009-01-16 2009-01-16

Publications (1)

Publication Number Publication Date
ES2901735T3 true ES2901735T3 (es) 2022-03-23

Family

ID=42077387

Family Applications (7)

Application Number Title Priority Date Filing Date
ES10701342T Active ES2427278T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES13164569T Active ES2734361T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de productos de cruce
ES19171998T Active ES2904373T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES22199586T Active ES2966639T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES21209274T Active ES2938858T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES19171999T Active ES2901735T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de productos de cruce
ES19171997T Active ES2885804T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado

Family Applications Before (5)

Application Number Title Priority Date Filing Date
ES10701342T Active ES2427278T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES13164569T Active ES2734361T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de productos de cruce
ES19171998T Active ES2904373T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES22199586T Active ES2966639T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado
ES21209274T Active ES2938858T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES19171997T Active ES2885804T3 (es) 2009-01-16 2010-01-15 Transposición armónica mejorada de producto cruzado

Country Status (21)

Country Link
US (7) US8818541B2 (es)
EP (8) EP2620941B1 (es)
JP (2) JP5237465B2 (es)
KR (2) KR101256808B1 (es)
CN (2) CN102282612B (es)
AU (1) AU2010205583B2 (es)
BR (3) BR122019023704B1 (es)
CA (7) CA2926491C (es)
CL (1) CL2011001717A1 (es)
ES (7) ES2427278T3 (es)
HK (1) HK1162735A1 (es)
MX (1) MX2011007563A (es)
MY (1) MY180550A (es)
PL (6) PL3992966T3 (es)
RU (5) RU2495505C2 (es)
SG (1) SG172976A1 (es)
TR (1) TR201910073T4 (es)
TW (2) TWI430264B (es)
UA (1) UA99878C2 (es)
WO (1) WO2010081892A2 (es)
ZA (1) ZA201105923B (es)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2620941B1 (en) * 2009-01-16 2019-05-01 Dolby International AB Cross product enhanced harmonic transposition
BR122019023712B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
CA2966469C (en) 2009-01-28 2020-05-05 Dolby International Ab Improved harmonic transposition
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
WO2014060204A1 (en) * 2012-10-15 2014-04-24 Dolby International Ab System and method for reducing latency in transposer-based virtual bass systems
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
KR101405022B1 (ko) 2009-09-18 2014-06-10 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2507165T3 (es) * 2009-10-21 2014-10-14 Dolby International Ab Sobremuestreo en un banco de filtros de reemisor combinado
KR102091677B1 (ko) 2010-01-19 2020-03-20 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9117459B2 (en) 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
KR102073544B1 (ko) 2010-09-16 2020-02-05 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
AU2015202647B2 (en) * 2010-09-16 2017-05-11 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
TWI484479B (zh) 2011-02-14 2015-05-11 Fraunhofer Ges Forschung 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
CN103503061B (zh) 2011-02-14 2016-02-17 弗劳恩霍夫应用研究促进协会 在一频谱域中用以处理已解码音频信号的装置及方法
MX2013009304A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
EP2550653B1 (en) 2011-02-14 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
EP3239978B1 (en) 2011-02-14 2018-12-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
BR112013020592B1 (pt) 2011-02-14 2021-06-22 Fraunhofer-Gellschaft Zur Fôrderung Der Angewandten Forschung E. V. Codec de áudio utilizando síntese de ruído durante fases inativas
CN104916290B (zh) * 2011-02-18 2018-11-06 株式会社Ntt都科摩 语音解码装置、语音编码装置、语音解码方法以及语音编码方法
PL3040988T3 (pl) * 2011-11-02 2018-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Dekodowanie audio w oparciu o wydajną reprezentację współczynników autoregresji
EP2777042B1 (en) 2011-11-11 2019-08-14 Dolby International AB Upsampling using oversampled sbr
US20130162901A1 (en) * 2011-12-22 2013-06-27 Silicon Image, Inc. Ringing suppression in video scalers
US8917197B2 (en) * 2012-01-03 2014-12-23 Nucript LLC System and method for improving performance of photonic samplers
BR112014020562B1 (pt) * 2012-02-23 2022-06-14 Dolby International Ab Método, sistema e meio não-transitório legível por computador para determinar um primeiro valor de tonalidade agrupada
CN102584191B (zh) * 2012-03-22 2014-05-14 上海大学 用蛇纹石尾矿制备堇青石陶瓷的方法
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
RU2676870C1 (ru) * 2013-01-29 2019-01-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
US9881624B2 (en) 2013-05-15 2018-01-30 Samsung Electronics Co., Ltd. Method and device for encoding and decoding audio signal
JP6407150B2 (ja) 2013-06-11 2018-10-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
EP3608909B1 (en) 2013-12-27 2021-08-25 Sony Group Corporation Decoding apparatus and method, and program
DE102014003057B4 (de) * 2014-03-10 2018-06-14 Ask Industries Gmbh Verfahren zur Rekonstruierung hoher Frequenzen bei verlustbehafteter Audiokomprimierung
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016180704A1 (en) 2015-05-08 2016-11-17 Dolby International Ab Dialog enhancement complemented with frequency transposition
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN107122332B (zh) * 2017-05-02 2020-08-21 大连民族大学 一维信号二维谱变换方法、伪双谱及其应用
KR20210005164A (ko) * 2018-04-25 2021-01-13 돌비 인터네셔널 에이비 고주파 오디오 재구성 기술의 통합
CN109003621B (zh) * 2018-09-06 2021-06-04 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109036457B (zh) 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN110244290A (zh) * 2019-06-17 2019-09-17 电子科技大学 一种距离扩展目标的检测方法

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4048443A (en) 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
KR100289733B1 (ko) 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
JP3606388B2 (ja) 1994-10-31 2005-01-05 ソニー株式会社 オーデイオデータ再生方法及びオーデイオデータ再生装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
TW303410B (en) 1996-04-19 1997-04-21 Kok Hua Liow Improved construction products and methods
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
US5856674A (en) 1997-09-16 1999-01-05 Eaton Corporation Filament for ion implanter plasma shower
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CN1192355C (zh) 1999-11-16 2005-03-09 皇家菲利浦电子有限公司 宽带音频传输系统
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE60000185T2 (de) * 2000-05-26 2002-11-28 Lucent Technologies Inc Verfahren und Vorrichtung zur Audiokodierung und -dekodierung mittels Verschachtelung geglätteter Hüllkurven kritischer Bänder höherer Frequenzen
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
FR2821475B1 (fr) 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
FR2821501B1 (fr) 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
WO2003003345A1 (fr) 2001-06-29 2003-01-09 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation des composantes de frequence d'un signal
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
CN1286087C (zh) 2002-08-01 2006-11-22 松下电器产业株式会社 音频解码装置和音频解码方法
JP3879922B2 (ja) 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
SE0301272D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Adaptive voice enhancement for low bit rate audio coding
EP2071565B1 (en) * 2003-09-16 2011-05-04 Panasonic Corporation Coding apparatus and decoding apparatus
US7451091B2 (en) * 2003-10-07 2008-11-11 Matsushita Electric Industrial Co., Ltd. Method for determining time borders and frequency resolutions for spectral envelope coding
EP2221807B1 (en) 2003-10-23 2013-03-20 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
JP4741476B2 (ja) * 2004-04-23 2011-08-03 パナソニック株式会社 符号化装置
BRPI0517716B1 (pt) * 2004-11-05 2019-03-12 Panasonic Intellectual Property Management Co., Ltd. Aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação.
BRPI0608269B8 (pt) * 2005-04-01 2019-09-03 Qualcomm Inc método e aparelho para quantização vetorial de uma representação de envelope espectral
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
KR100717058B1 (ko) 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP2007171339A (ja) * 2005-12-20 2007-07-05 Kenwood Corp オーディオ信号処理装置
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US20080109215A1 (en) 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
JP2008033269A (ja) 2006-06-26 2008-02-14 Sony Corp デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
TWI308740B (en) 2007-01-23 2009-04-11 Ind Tech Res Inst Method of a voice signal processing
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4905241B2 (ja) * 2007-04-27 2012-03-28 ヤマハ株式会社 高調波生成装置、低音増強装置、およびコンピュータプログラム
US7886303B2 (en) * 2007-05-18 2011-02-08 Mediatek Inc. Method for dynamically adjusting audio decoding process
CN101105940A (zh) 2007-06-27 2008-01-16 北京中星微电子有限公司 音频编解码的量化方法、反变换方法及音频编解码装置
EP2620941B1 (en) * 2009-01-16 2019-05-01 Dolby International AB Cross product enhanced harmonic transposition

Also Published As

Publication number Publication date
JP5597738B2 (ja) 2014-10-01
KR101256808B1 (ko) 2013-04-22
CA3124108A1 (en) 2010-07-22
EP3992966B1 (en) 2022-11-23
JP2012515362A (ja) 2012-07-05
BRPI1007050A2 (pt) 2019-03-26
BRPI1007050B1 (pt) 2020-04-22
JP5237465B2 (ja) 2013-07-17
HK1162735A1 (en) 2012-08-31
EP2380172B1 (en) 2013-07-24
SG172976A1 (en) 2011-08-29
EP4300495A2 (en) 2024-01-03
TW201128634A (en) 2011-08-16
US10586550B2 (en) 2020-03-10
EP3598445B1 (en) 2021-07-07
UA99878C2 (ru) 2012-10-10
CA3231911A1 (en) 2010-07-22
EP3598446B1 (en) 2021-12-22
EP3598447B1 (en) 2021-12-01
ZA201105923B (en) 2012-11-28
ES2885804T3 (es) 2021-12-15
CA2748003A1 (en) 2010-07-22
US20230298606A1 (en) 2023-09-21
CA3162807C (en) 2024-04-23
CA3009237A1 (en) 2010-07-22
EP4145446B1 (en) 2023-11-22
JP2013148920A (ja) 2013-08-01
ES2734361T3 (es) 2019-12-05
CA3084938A1 (en) 2010-07-22
CA2926491A1 (en) 2010-07-22
TWI523005B (zh) 2016-02-21
TWI430264B (zh) 2014-03-11
CA3124108C (en) 2022-08-02
EP2380172A2 (en) 2011-10-26
BR122019023704B1 (pt) 2020-05-05
EP2620941B1 (en) 2019-05-01
AU2010205583A1 (en) 2011-07-07
CA3009237C (en) 2020-08-25
RU2018130424A3 (es) 2021-11-15
RU2638748C2 (ru) 2017-12-15
US20180033446A1 (en) 2018-02-01
PL4145446T3 (pl) 2024-04-08
KR101589942B1 (ko) 2016-01-29
CN103632678A (zh) 2014-03-12
RU2495505C2 (ru) 2013-10-10
WO2010081892A2 (en) 2010-07-22
US20210366500A1 (en) 2021-11-25
TR201910073T4 (tr) 2019-07-22
US10192565B2 (en) 2019-01-29
CN103632678B (zh) 2017-06-06
ES2938858T3 (es) 2023-04-17
WO2010081892A3 (en) 2010-11-18
RU2667629C1 (ru) 2018-09-21
ES2427278T3 (es) 2013-10-29
AU2010205583B2 (en) 2013-02-07
KR20130006723A (ko) 2013-01-17
EP3992966A1 (en) 2022-05-04
US11682410B2 (en) 2023-06-20
US20140297295A1 (en) 2014-10-02
CA2748003C (en) 2016-05-24
PL3598445T3 (pl) 2021-12-27
EP2620941A1 (en) 2013-07-31
US20190115038A1 (en) 2019-04-18
PL3598446T3 (pl) 2022-03-28
US11031025B2 (en) 2021-06-08
RU2646314C1 (ru) 2018-03-02
US20200273476A1 (en) 2020-08-27
CN102282612B (zh) 2013-07-24
CL2011001717A1 (es) 2012-07-20
PL3598447T3 (pl) 2022-02-14
TW201413709A (zh) 2014-04-01
KR20110128275A (ko) 2011-11-29
CA3162807A1 (en) 2010-07-22
RU2011133894A (ru) 2013-03-10
EP4145446A1 (en) 2023-03-08
US20110305352A1 (en) 2011-12-15
ES2904373T3 (es) 2022-04-04
RU2018130424A (ru) 2020-02-25
US9799346B2 (en) 2017-10-24
EP4300495A3 (en) 2024-02-21
US8818541B2 (en) 2014-08-26
MY180550A (en) 2020-12-02
CA2926491C (en) 2018-08-07
RU2013119725A (ru) 2014-11-10
BR122019023684B1 (pt) 2020-05-05
PL2620941T3 (pl) 2019-11-29
ES2966639T3 (es) 2024-04-23
CN102282612A (zh) 2011-12-14
EP3598446A1 (en) 2020-01-22
CA3084938C (en) 2021-08-24
EP3598447A1 (en) 2020-01-22
RU2765618C2 (ru) 2022-02-01
MX2011007563A (es) 2011-09-06
EP3598445A1 (en) 2020-01-22
US11935551B2 (en) 2024-03-19
PL3992966T3 (pl) 2023-03-20

Similar Documents

Publication Publication Date Title
ES2901735T3 (es) Transposición armónica mejorada de productos de cruce
AU2013201597B2 (en) Cross product enhanced harmonic transposition