ES2936307T3 - Sobremuestreo en un banco de filtros de reemisor combinado - Google Patents

Sobremuestreo en un banco de filtros de reemisor combinado Download PDF

Info

Publication number
ES2936307T3
ES2936307T3 ES21210177T ES21210177T ES2936307T3 ES 2936307 T3 ES2936307 T3 ES 2936307T3 ES 21210177 T ES21210177 T ES 21210177T ES 21210177 T ES21210177 T ES 21210177T ES 2936307 T3 ES2936307 T3 ES 2936307T3
Authority
ES
Spain
Prior art keywords
synthesis
analysis
window
order
frequency resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21210177T
Other languages
English (en)
Inventor
Lars Villemoes
Per Ekstrand
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2936307T3 publication Critical patent/ES2936307T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

La presente invención se refiere a la codificación de señales de audio y, en particular, a los métodos de reconstrucción de alta frecuencia que incluyen un transpositor de armónicos en el dominio de la frecuencia. Se describe un sistema y método para generar un componente de alta frecuencia de una señal a partir de un componente de baja frecuencia de la señal. El sistema comprende un banco de filtros de análisis (501) que comprende una unidad de transformación de análisis (601) que tiene una resolución de frecuencia de Δf; y una ventana de análisis (611) que tiene una duración de DA; estando configurado el banco de filtros de análisis (501) para proporcionar un conjunto de señales de subbanda de análisis desde el componente de baja frecuencia de la señal; una unidad de procesamiento no lineal (502, 650) configurada para determinar un conjunto de señales de subbanda de síntesis en función de una parte del conjunto de señales de subbanda de análisis, en el que la parte del conjunto de señales de subbanda de análisis está desfasada por un orden de transposición T; y un banco de filtros de síntesis (504) que comprende una unidad de transformación de síntesis (602) que tiene una resolución de frecuencia de QΔf; y una ventana de síntesis (612) que tiene una duración de DS; estando configurado el banco de filtros de síntesis (504) para generar el componente de alta frecuencia de la señal a partir del conjunto de señales de subbanda de síntesis; donde Q es un factor de resolución de frecuencia con Q >= 1 y menor que el orden de transposición T ; y donde el valor del producto de la resolución de frecuencia Δf y la duración DA del banco de filtros de análisis se selecciona en base al factor de resolución de frecuencia Q. y un banco de filtros de síntesis (504) que comprende una unidad de transformación de síntesis (602) que tiene una resolución de frecuencia de QΔf; y una ventana de síntesis (612) que tiene una duración de DS; estando configurado el banco de filtros de síntesis (504) para generar el componente de alta frecuencia de la señal a partir del conjunto de señales de subbanda de síntesis; donde Q es un factor de resolución de frecuencia con Q >= 1 y menor que el orden de transposición T ; y donde el valor del producto de la resolución de frecuencia Δf y la duración DA del banco de filtros de análisis se selecciona en base al factor de resolución de frecuencia Q. y un banco de filtros de síntesis (504) que comprende una unidad de transformación de síntesis (602) que tiene una resolución de frecuencia de QΔf; y una ventana de síntesis (612) que tiene una duración de DS; estando configurado el banco de filtros de síntesis (504) para generar el componente de alta frecuencia de la señal a partir del conjunto de señales de subbanda de síntesis; donde Q es un factor de resolución de frecuencia con Q >= 1 y menor que el orden de transposición T ; y donde el valor del producto de la resolución de frecuencia Δf y la duración DA del banco de filtros de análisis se selecciona en base al factor de resolución de frecuencia Q. donde Q es un factor de resolución de frecuencia con Q >= 1 y menor que el orden de transposición T ; y donde el valor del producto de la resolución de frecuencia Δf y la duración DA del banco de filtros de análisis se selecciona en base al factor de resolución de frecuencia Q. donde Q es un factor de resolución de frecuencia con Q >= 1 y menor que el orden de transposición T ; y donde el valor del producto de la resolución de frecuencia Δf y la duración DA del banco de filtros de análisis se selecciona en base al factor de resolución de frecuencia Q. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Sobremuestreo en un banco de filtros de reemisor combinado
Referencia cruzada a solicitudes relacionadas
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea EP 20172571.0 (referencia: D09105EP04), para la cual se presentó el formulario OEP 1001 el 1 de mayo de 2020.
Campo técnico
La presente invención se refiere a la codificación de señales de audio, y en particular a métodos de reconstrucción de alta frecuencia que incluyen un reemisor armónico de dominio de frecuencia.
Antecedentes de la invención
Las tecnologías HFR, tales como la tecnología de replicación de banda espectral (SBR), permiten mejorar significativamente la eficiencia de codificación de los códecs de audio perceptuales tradicionales. En combinación con codificación de audio avanzada (AAC) de MPEG-4, la tecnología HFR forma unos códecs de audio muy eficientes, que ya están en uso en el sistema de XM Satellite Radio y Digital Radio Mondiale, y también estandarizadas en 3GPP, DVD Forum, y otros. La combinación de AAC y SBR se denomina aacPlus. Es parte del estándar MPEG-4, en el que se denomina como el perfil AAC de alta eficiencia (HE-AAC). En general, la tecnología HFR puede combinarse con cualquier códec de audio perceptual de manera compatible hacia atrás y hacia delante, ofreciendo así la posibilidad de actualizar sistemas de difusión ya establecidos, como el MPEG Capa 2 usado en el sistema de Eureka DAB. Los métodos de transposición HFR también pueden combinarse con códecs de voz para permitir un habla de banda ancha a velocidades de bits ultrabajas.
La idea básica detrás de la HFR es la observación de que normalmente está presente una correlación fuerte entre las características del intervalo de alta frecuencia de una señal y las características del intervalo de baja frecuencia de la misma señal. Por lo tanto, una buena aproximación para una representación del intervalo de alta frecuencia de entrada original de una señal puede conseguirse por una transposición de señal desde el intervalo de baja frecuencia al intervalo de alta frecuencia.
Este concepto de transposición se estableció en el documento WO 98/57436, que se incorpora por referencia, como un método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Puede obtenerse un ahorro sustancial en velocidad de bits usando este concepto en la codificación de audio y/o codificación de voz. A continuación, se hará referencia a la codificación de audio, pero se ha de observar que los métodos y los sistemas descritos pueden aplicarse igualmente a la codificación de voz y en la codificación de voz y audio unificada (USAC).
En un sistema de codificación de audio basado en HFR, una señal de bajo ancho de banda se presenta en un codificador de forma de onda central para su codificación, y las frecuencias más altas se regeneran en el lado del decodificador usando la transposición de la señal de bajo ancho de banda e información lateral adicional, que se codifica comúnmente a velocidades de bits muy bajas y que describe la forma espectral diana. Para bajas velocidades de bits, donde el ancho de banda de la señal codificada central es estrecho, es cada vez más importante reproducir o sintetizar una banda alta, es decir, el intervalo de alta frecuencia de la señal de audio, con características perceptualmente agradables.
Uno de los problemas subyacentes que existen con los métodos de la HFR armónica son las restricciones contrarias de una resolución de alta frecuencia pretendida con el fin de conseguir una transposición de alta calidad para sonidos fijos, y la respuesta temporal del sistema para sonidos transitorios o percusivos. En otras palabras, aunque el uso de una resolución de alta frecuencia es beneficioso para la transposición de señales fijas, tal resolución de alta frecuencia típicamente requiere grandes tamaños de ventana que son perjudiciales cuando se trata de porciones transitorias de una señal. Un enfoque para abordar este problema puede ser cambiar de forma adaptativa las ventanas del reemisor, por ejemplo, usando intercambio de ventana, en función de las características de la señal de entrada. Típicamente se usarán ventanas largas para porciones fijas de una señal, con el fin de conseguir una resolución de alta frecuencia, mientras que se usarán ventanas cortas para porciones transitorias de la señal, para implementar una buena respuesta transitoria, es decir, una buena resolución temporal, del reemisor. Sin embargo, este enfoque tiene el inconveniente de que tienen que incorporarse medidas del análisis de señales, tal como detección transitoria o similares, en el sistema de transposición. Tales medidas de análisis de señal implican a menudo una etapa de decisión, por ejemplo, una decisión sobre la presencia de una transitoria, que desencadena un intercambio del procesamiento de señal. Además, tales medidas típicamente afectan a la fiabilidad del sistema y pueden introducir artefactos de señal al intercambiar el procesamiento de señal, por ejemplo, al intercambiar entre los tamaños de ventana.
Con el fin de conseguir una calidad de audio mejorada y para sintetizar el ancho de banda requerido de la señal de banda alta, los métodos de HFR armónica típicamente emplean varios órdenes de transposición. Con el fin de implementar una pluralidad de transposiciones de diferente orden de transposición, las soluciones de la técnica anterior requieren una pluralidad de bancos de filtros en la etapa de análisis o la etapa de síntesis, o en ambas etapas.
Típicamente, se requiere un banco de filtros diferente para cada orden de transposición diferente. Además, en situaciones en las que el codificador de forma de onda central opera a una tasa de muestreo inferior que la tasa de muestreo de la señal de salida final, existe típicamente la necesidad adicional de convertir la señal central en la tasa de muestreo de la señal de salida, y este muestreo superior de la señal central se consigue normalmente añadiendo otro banco de filtros más. Con todo, la complejidad computacional aumenta significativamente con un número en aumento de diferentes órdenes de transposición.
El presente documento aborda los problemas que se han mencionado anteriormente con respecto al rendimiento transitorio de la transposición armónica y con respecto a la complejidad computacional. Como resultado, se consigue una mejor transposición armónica a una baja complejidad adicional.
Compendio de la invención
De acuerdo con un aspecto, se propone un sistema según la reivindicación independiente 1. De acuerdo con aspectos adicionales, se proponen métodos según las reivindicaciones independientes 9 y 10 así como medios de almacenamiento según la reivindicación independiente 11.
Debe señalarse también que los métodos y sistemas, incluyendo sus realizaciones preferidas tal como se esbozan en la presente solicitud de patente, se pueden utilizar independientemente o en combinación con los otros métodos y sistemas descritos en este documento.
Breve descripción de los dibujos
La presente invención se describirá ahora a modo de ejemplos ilustrativos, que no limitan el alcance de la invención, con referencia a los dibujos adjuntos, en los que:
La figura 1 ilustra la operación de un reemisor armónico de dominio de frecuencia (FD, Frequency Domain) de orden único ejemplar;
la figura 2 ilustra la operación de un reemisor armónico ejemplar que usa varios órdenes;
la figura 3 ilustra la operación de la técnica anterior de un reemisor armónico ejemplar que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de análisis común;
la figura 4 ilustra la operación de la técnica anterior de un reemisor armónico ejemplar que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de síntesis común;
la figura 5 ilustra la operación de un reemisor armónico ejemplar que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de síntesis común y un banco de filtros de síntesis común;
la figura 5b ilustra un ejemplo para el mapeo de señales de sub-banda para un esquema de reemisor múltiple de acuerdo con la figura 5;
la figura 6a ilustra un reemisor múltiple ejemplar del orden T = 2, 3, 4 que usa un banco de filtros de análisis común y bancos de filtros de síntesis separados;
la figura 6b ilustra un reemisor múltiple ejemplar del orden T = 2, 3, 4 que usa un banco de filtros de análisis común y un banco de filtros de síntesis común;
la figura 7 ilustra un ejemplo para el mapeo de señales de sub-banda para un reemisor múltiple de acuerdo con la figura 6b;
la figura 8 ilustra un Dirac en una posición particular como aparece en las ventanas de análisis y de síntesis de un reemisor armónico;
la figura 9 ilustra un Dirac en una posición diferente como aparece en las ventanas de análisis y de síntesis de un reemisor armónico; y
la figura 10 ilustra un Dirac para la posición de la figura 9 como aparecerá al usar el sobremuestreo del dominio de frecuencia.
Descripción de realizaciones preferidas
Las realizaciones descritas a continuación son únicamente ilustrativas para los principios de la presente invención para el sobremuestreo en un banco de filtros de reemisor combinado. Se entenderá que serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento para los expertos en la técnica. Por lo tanto, es la intención que se limite únicamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
La figura 1 ilustra la operación de un reemisor armónico de dominio de frecuencia (FD) 100. En una forma básica, un reemisor armónico de 7ésim° orden es una unidad que desplaza todas las componentes de señal H(f) de la señal de entrada, es decir, una sub-banda de la señal en el dominio de frecuencia, a H(Tf). Es decir, la componente de frecuencia H(f) de la señal de entrada se desplaza hasta una frecuencia T veces superior. Con el fin de implementar tal transposición en el dominio de frecuencia, un banco de filtros de análisis 101 transforma la señal de entrada del dominio temporal en el dominio de la frecuencia y transmite sub-bandas complejas o señales de sub-banda, también denominadas como sub-bandas de análisis o señales de sub-banda de análisis. El banco de filtros de análisis típicamente comprende una transformada de análisis, por ejemplo una FFT, DFT o una transformada de ondícula, y una ventana de análisis deslizante. Las señales de sub-banda de análisis se remiten a un procesamiento no lineal 102 que modifica la fase y/o la amplitud de acuerdo con el orden de transposición T escogido. Típicamente, el procesamiento no lineal transmite varias señales de sub-banda que es igual al número de señales de sub-banda de entrada, es decir, igual al número de señales de sub-banda de análisis. Las sub-bandas o las señales de sub-banda modificadas, que también se denominan como las sub-bandas de síntesis o señales de sub-banda de síntesis, se suministran a un banco de filtros de síntesis 103 que transforma las señales de sub-banda del dominio de la frecuencia en el dominio temporal y transmite la señal de dominio temporal transpuesta. El banco de filtros de síntesis 103 comprende típicamente una transformada inversa, por ejemplo, una FFT inversa, una DFT inversa o una transformada de ondícula inversa, en combinación con una ventana de síntesis deslizante.
Típicamente, cada banco de filtros tiene una resolución de frecuencia física Af medida en Hercios y un parámetro de avance del tiempo físico At medido en segundos, en el que la resolución de frecuencia física Af se asocia normalmente con la resolución de frecuencia de la función de la transformada y el parámetro de avance del tiempo físico At se asocia normalmente con el intervalo de tiempo entre las funciones de ventana sucesivas. Estos dos parámetros, es decir, la resolución de frecuencia y el avance de tiempo, definen los parámetros de tiempo discreto del banco de filtros dada la tasa de muestreo seleccionada. Escogiendo los parámetros de avance del tiempo físico, es decir, el parámetro de avance de tiempo medido en unidades de tiempo, por ejemplo, segundos, de los bancos de filtros de análisis y de síntesis para que sean idénticos, puede obtenerse una señal de salida del reemisor 100 que tiene la misma tasa de muestreo que la señal de entrada. Además, omitiendo el procesamiento no lineal 102 puede conseguirse una reconstrucción perfecta de la señal de entrada en la salida. Esto requiere un diseño cuidadoso de los bancos de filtros de análisis y de síntesis. Por otra parte, si la tasa de muestreo de salida se selecciona para que sea diferente de la tasa de muestreo de entrada, puede obtenerse una conversión de la tasa de muestreo. Este modo de operación puede ser necesario en el caso en el que el ancho de banda deseado de la señal de salida y sea superior a la mitad de la tasa de muestreo de la señal de entrada x, es decir, cuando el ancho de banda de salida deseado excede la frecuencia de Nyquist de la señal de entrada.
La figura 2 ilustra la operación de un reemisor múltiple o un sistema de reemisor múltiple 200 que comprende varios reemisores armónicos 201-1,..., 201-P de diferentes órdenes. La señal de entrada que se va a transponer se pasa a un banco de P reemisores individuales 201-1, 201-2,..., 201-P. Los reemisores individuales 201-1, 201-2.... 201-P realizan una transposición armónica de la señal de entrada como se representa en el contexto de la figura 1. Típicamente, cada uno de los reemisores individuales 201-1, 201-2,..., 201-P realiza una transposición armónica de un orden de transposición diferente T. A modo de ejemplo, el reemisor 201-1 puede realizar una transposición del orden T = 1, el reemisor 201-2 puede realizar una transposición del orden T = 2,..., y el reemisor 201-P puede realizar una transposición del orden T = P. Sin embargo, en términos genéricos, cualquiera de los reemisores 201-1,..., 201-P puede realizar una transposición armónica de un orden de transposición arbitrario T. Las contribuciones, es decir, las señales de salida de los reemisores individuales 201-1, 201-2,..., 201-P pueden sumarse en el combinador 202 para producir la salida del reemisor combinada.
Se ha de observar que cada reemisor 201-1, 201-2,..., 201-P requiere un banco de filtros de análisis y de síntesis como se representa en la figura 1. Además, la implementación habitual de los reemisores individuales 201-1,201-2,..., 201-P cambiará típicamente la tasa de muestreo de la señal de entrada procesada en diferentes cantidades. A modo de ejemplo, la tasa de muestreo de la señal de salida del reemisor 201-P puede ser T veces superior a la tasa de muestreo de la señal de entrada con respecto al reemisor 201-P, en el que T es el orden de transposición aplicado por el reemisor 201-P. Esto puede deberse al factor de expansión del ancho de banda de T usado en el reemisor 201-P, es decir, debido al uso de un banco de filtros de síntesis que tiene T veces más subcanales que el banco de filtros de análisis. Haciendo esto, la tasa de muestreo y la frecuencia de Nyquist aumentan en un factor T. Como consecuencia, las señales de dominio temporal individuales pueden necesitar muestrearse de nuevo con el fin de permitir una combinación de las diferentes señales de salida en el combinador 202. El remuestreo de las señales de dominio temporal puede realizarse en el lado de entrada o en el lado de salida de cada reemisor individual 201-1,201­ 2,..., 201-P.
La figura 3 ilustra una configuración ejemplar de un reemisor armónico múltiple o un sistema de reemisor múltiple 300 que realiza varios órdenes de transposición y que usa un banco de filtros de análisis común 301. Un punto de partida para el diseño del reemisor múltiple 300 puede ser diseñar los reemisores individuales 201-1, 201-2,.., 201-P de la figura 2 de tal forma que los bancos de filtros de análisis (signo de referencia 101 en la figura 1) de todos los reemisores 201-1, 201-2,.., 201-P sean idénticos y puedan reemplazarse por un único banco de filtros de análisis 301. Como consecuencia, la señal de entrada de dominio temporal se transforma en un único conjunto de señales de sub-banda de dominio de frecuencia, es decir, un único conjunto de señales de sub-banda de análisis. Estas señales de sub­ banda se remiten a diferentes unidades de procesamiento no lineales 302-1,302-2,..., 302-P para diferentes órdenes de transposición. Como se ha descrito anteriormente en el contexto de la figura 1, cada unidad de procesamiento no lineal realiza una modificación de la fase y/o amplitud de las señales de sub-banda, y esta modificación difiere para los diferentes órdenes de transposición. Posteriormente, las señales de sub-banda o sub-bandas modificadas de forma diferente tienen que reemitirse a diferentes bancos de filtros de síntesis 303-1,303-2,..., 303-P correspondientes a las diferentes unidades de procesamiento no lineales 302-1,302-2,..., 302-P. Como resultado, se obtienen P señales de salida de dominio temporal transpuestas de forma diferente que se suman en el combinador 304 para producir la salida del reemisor combinada.
Se ha de observar que si los bancos de filtros de síntesis 303-1, 303-2,... , 303-P correspondientes a los diferentes órdenes de transposición operan en diferentes tasas de muestreo, por ejemplo, usando diferentes grados de expansión de ancho de banda, las señales de salida de dominio temporal de los diferentes bancos de filtros de síntesis 303-1, 303-2, ..., 303-P han de remuestrearse de forma diferente con el fin de alinear las P señales de salida con respecto a una rejilla temporal común, antes de su suma en el combinador 304.
La figura 4 ilustra una operación ejemplar de un reemisor armónico múltiple 400 que usa varios órdenes de transposición, usando al mismo tiempo un banco de filtros de síntesis común 404. El punto de partida para el diseño de tal reemisor múltiple 400 puede ser el diseño de los reemisores individuales 201-1, 201-2, .., 201-P de la figura 2 de tal forma que los bancos de filtros de síntesis de todos los reemisores sean idénticos y puedan reemplazarse por un único banco de filtros de síntesis 404. Se ha de observar que de una forma análoga a la situación mostrada en la figura 3, las unidades de procesamiento no lineales 402-1, 402-2,..., 402-P son diferentes para cada orden de transposición. Además, los bancos de filtros de análisis 401-1, 401-2,... , 401-P son diferentes para los diferentes órdenes de transposición. Como tal, un conjunto de P bancos de filtros de análisis 401-1,401-2,..., 401-P determina P conjuntos de señales de sub-banda de análisis. Estos P conjuntos de señales de sub-banda de análisis se remiten a las unidades de procesamiento no lineales correspondientes 402-1, 402-2....402-P para producir P conjuntos de señales de sub-banda modificadas. Estos P conjuntos de señales de sub-banda pueden combinarse en el dominio de frecuencia en el combinador 403 para producir un conjunto combinado de señales de sub-banda como una entrada al único banco de filtros de síntesis 404. Esta combinación en el combinador 403 puede comprender el suministro de señales de sub-banda procesadas de forma diferente en diferentes intervalos de sub-banda y/o la superposición de contribuciones de señales de sub-banda a intervalos de sub-banda de solapamiento. En otras palabras, las diferentes señales de sub-banda de análisis que se han procesado con diferentes órdenes de transposición pueden incluir intervalos de frecuencia de solapamiento. A modo de ejemplo, un segundo reemisor de orden puede transponer la sub-banda de análisis [2A,2B] con respecto al intervalo de sub-banda [4A,4B]. Al mismo tiempo, un reemisor de cuarto orden puede transponer la sub-banda de análisis [A,B] con respecto al mismo intervalo de sub-banda [4A,4B]. En tales casos, las contribuciones superpuestas pueden combinarse, por ejemplo, añadirse y/o promediarse, por el combinador 403. La señal de salida de dominio temporal del reemisor múltiple 400 se obtiene a partir del banco de filtros de síntesis común 404. De una manera similar a como se ha descrito anteriormente, si los bancos de filtros de análisis 401-1, 401-2,..., 401-P operan en diferentes tasas de muestreo, las señales de dominio temporal introducidas en los diferentes bancos de filtros de análisis 401-1,401-2,..., 401-P pueden necesitar remuestrearse con el fin de alinear las señales de salida de las diferentes unidades de procesamiento no lineales 402-1,402-2, ..., 402-P con respecto a la misma rejilla temporal.
La figura 5 ilustra la operación de un reemisor armónico múltiple 500 que usa varios órdenes de transposición y que comprende un único banco de filtros de análisis común 501 y un único banco de filtros de síntesis común 504. En este caso, los reemisores individuales 201-1, 201-2,.., 201-P de la figura 2 deben diseñarse de tal forma que tanto los bancos de filtros de análisis como los bancos de filtros de síntesis de todos los P reemisores armónicos sean idénticos. Si la condición de los bancos de filtros de análisis y de síntesis idénticos para los diferentes P reemisores armónicos se cumple, entonces los bancos de filtros idénticos pueden reemplazarse por un único banco de filtros de análisis 501 y un único banco de filtros de síntesis 504. Las unidades de procesamiento no lineales avanzadas 502-1, 502-2,..., 502-P transmiten diferentes contribuciones a intervalos de frecuencia de solapamiento parcial que se combinan en el combinador 503 para producir una entrada combinada con respecto a las sub-bandas respectivas del banco de filtros de síntesis 504. De forma similar al reemisor armónico múltiple 400 representado en la figura 4, la combinación en el combinador 503 puede comprender el suministro de las diferentes señales de salida de la pluralidad de unidades de procesamiento no lineales 502-1,502-2,..., 502-P a diferentes intervalos de sub-banda, y la superposición de múltiples salidas de contribución a intervalos de sub-banda de solapamiento.
Como ya se ha indicado anteriormente, el procesamiento no lineal 102 típicamente proporciona varias sub-bandas a su salida que corresponde al número de sub-bandas a la entrada. El procesamiento no lineal 102 típicamente modifica la fase y/o la amplitud de la sub-banda o la señal de sub-banda de acuerdo con el orden de transposición subyacente T. A modo de ejemplo, una sub-banda a la entrada se convierte en una sub-banda a la salida con una frecuencia T veces superior, es decir, una sub-banda a la salida con respecto al procesamiento no lineal 102, es decir, la sub-banda
[{k-X-W,{k \w }
de análisis ¿ ¿ puede transponerse con respecto a una sub-banda a la salida del procesamiento no
[(i-V A /',(ír :W ]
lineal 102, es decir, la sub-banda de síntesis, ¿ 2 en la que k es un número de índice de sub­ banda y Af si la resolución de frecuencia del banco de filtros de análisis. Con el fin de permitir el uso de bancos de filtros de análisis comunes 501 y bancos de filtros de síntesis comunes 504, una o más de las unidades de procesamiento avanzadas 502-1,502-2,..., 502-P pueden configurarse para proporcionar varias sub-bandas de salida que pueden ser diferentes del número de sub-bandas de entrada.
A continuación, se describirán los principios del procesamiento no lineal avanzado en las unidades de procesamiento no lineales 502-1, 502-2,..., 502-P. Para este fin, se asume que
- el banco de filtros de análisis y el banco de filtros de síntesis comparten el mismo parámetro de avance del tiempo físico At;
- el banco de filtros de análisis tiene una resolución de frecuencia física Af;
- el banco de filtros de síntesis tiene una resolución de frecuencia física QAf donde el factor de resolución Q > 1 es un número entero.
Además, se asume que los bancos de filtros se apilan de modo par, es decir, la sub-banda con índice cero se centra alrededor de la frecuencia cero, de tal forma que las frecuencias centrales del banco de filtros de análisis se dan por kAf, donde el índice de sub-banda de análisis k =1,..., Ka-1 y Ka es el número de sub-bandas del banco de filtros de análisis. Las frecuencias centrales del banco de filtros de síntesis se dan por kQAf, donde el índice de sub-banda de síntesis n = 1 , . , Ns-1 y Ns es el número de sub-bandas del banco de filtros de síntesis.
Al realizar una transposición convencional del orden de números enteros T>1 como se muestra en la figura 1, el factor de resolución Q se selecciona como Q = T y la sub-banda de análisis procesada de forma no lineal k se mapea en la sub-banda de síntesis con el mismo índice n = k. El procesamiento no lineal 102 típicamente comprende multiplicar la fase de una sub-banda o una señal de sub-banda por el factor T. Es decir, para cada muestra de las sub-bandas del banco de filtros se puede escribir
0s(k) = T0Á(k) , (1)
donde QA(k) es la fase de una muestra (compleja) de la sub-banda de análisis k y Qs(k) es la fase de una muestra (compleja) de la sub-banda de síntesis k. La magnitud o amplitud de una muestra de la sub-banda puede mantenerse inalterada o puede aumentar o reducirse por un factor de ganancia constante. Debido al hecho de que T es un número entero, la operación de la ecuación (1) es independiente de la definición del ángulo de fase.
En los reemisores múltiples convencionales, el factor de resolución Q de un banco de filtros de análisis/síntesis se selecciona para que sea igual al orden de transposición T del reemisor respectivo, es decir, Q = T. En este caso, la resolución de frecuencia del banco de filtros de síntesis es TAf y, por lo tanto, depende del orden de transposición T. En consecuencia, es necesario usar diferentes bancos de filtros para diferentes órdenes de transposición T en la etapa de análisis o de síntesis. Esto se debe a que el orden de transposición T define el cociente de las resoluciones de frecuencia físicas, es decir, el cociente de la resolución de frecuencia Af del banco de filtros de análisis y la resolución de frecuencia TAf del banco de filtros de síntesis.
Con el fin de poder usar un banco de filtros de análisis común 501 y un banco de filtros de síntesis común 504 para una pluralidad de diferentes órdenes de transposición T, se propone ajustar la resolución de frecuencia del banco de filtros de síntesis 504 a QAf, es decir, se propone hacer la resolución de frecuencia del banco de filtros de síntesis 504 independiente del orden de transposición T. Entonces, surge la cuestión de cómo implementar una transposición del orden T cuando el factor de resolución Q, es decir, el cociente Q de la resolución de frecuencia física del banco de filtros de análisis y de síntesis, no obedece necesariamente a la relación Q = T.
Como se ha descrito anteriormente, un principio de la transposición armónica es que la entrada a la sub-banda del banco de filtros de síntesis n con frecuencia central nQAf se determina a partir de una sub-banda de análisis a una frecuencia central T veces inferior, es decir, a la frecuencia central nQAf/T. Las frecuencias centrales de las sub­ bandas de análisis se identifican a través del índice de sub-banda de análisis k como kAf. Ambas expresiones para la frecuencia central del índice de sub-banda de análisis, es decir, nQAf/T y kAf, pueden igualarse. Teniendo en cuenta n Q
que el índice n es un valor de número entero, la expresión T es un número racional que puede expresarse como la suma de un índice de sub-banda de análisis de número entero k y un resto r e {0,1/T,2/T,...,(T-1)/T} de tal forma que
Figure imgf000006_0001
Como tal, puede estipularse que la entrada a una sub-banda de síntesis con el índice de sub-banda de síntesis n puede derivarse, usando una transposición del orden T, a partir de la sub-banda de análisis con el índice k dado por nQ_
la ecuación (2). En vista del hecho de que T es un número racional, el resto r puede ser distinto de 0 y el valor k+r puede ser mayor que el índice de sub-banda de análisis k y menor que el índice de sub-banda de análisis k+1, es decir, k<k r<k 1. En consecuencia, la entrada a una sub-banda de síntesis con el índice de sub-banda de síntesis n debe derivarse, usando una transposición del orden T, de las sub-bandas de análisis con el índice de sub-banda de análisis k y k+1, en la que k se da por la ecuación (2). En otras palabras, la entrada de una sub-banda de síntesis puede derivarse de dos sub-bandas de análisis consecutivas.
Como consecuencia de lo anterior, el procesamiento no lineal avanzado realizado en una unidad de procesamiento no lineal 502-1, 502-2,..., 502-P puede comprender la etapa de considerar dos sub-bandas de análisis vecinas con índice k y k+1 para proporcionar la salida para la sub-banda de síntesis n. Para un orden de transposición T, la modificación de fase realizada por la unidad de procesamiento no lineal 502-1, 502-2,..., 502-P puede definirse, por ejemplo, por la regla de interpolación lineal,
0S («) = 7X1 - r)0A (k) TrdÁ {k 1), (3)
donde 9 A (k) es la fase de una muestra de la sub-banda de análisis k, 0 A (k+1) es la fase de una muestra de la sub­ banda de análisis k+1, y 9 s (n) es la fase de una muestra de la sub-banda de síntesis n. Si el resto r está cerca de cero, es decir, si el valor k+r está cerca de k, entonces la contribución principal de la fase de la muestra de sub-banda de síntesis se deriva de la fase de la muestra de sub-banda de análisis de la sub-banda k. Por otra parte, si el resto r está cerca de uno, es decir, si el valor k+r está cerca de k+1, entonces la contribución principal de la fase de la muestra de sub-banda de síntesis se deriva de la fase de la muestra de sub-banda de análisis de la sub-banda k+1. Se ha de observar que los multiplicadores de fase T(1-r) y Tr son ambos números enteros de tal forma que las modificaciones de fase de la ecuación (3) se definen bien y son independientes de la definición del ángulo de fase.
En lo que respecta a las magnitudes de las muestras de sub-banda, puede seleccionarse el siguiente valor medio geométrico para la determinación de la magnitud de las muestras de sub-banda de síntesis,
as{n) = aA{k)il~r)aA{k+ V f, (4)
donde as(n) representa la magnitud de una muestra de la sub-banda de síntesis n, aA(k) representa la magnitud de una muestra de la sub-banda de análisis k, y aA(k+1) representa la magnitud de una muestra de la sub-banda de análisis k+1. Se ha de observar que pueden contemplarse otras reglas de interpolación para la fase y/o la magnitud.
Para el caso de un banco de filtros apilados de modo impar, donde las frecuencias centrales del banco de filtros de
( n 1 w
análisis se dan por 2 con k = 1,..., Ka-1 , y las frecuencias centrales de bancos de filtros de síntesis se dan
( , n — U Q ¥
por 2 T con n = 1,..., Ns-1, una ecuación correspondiente con respecto a la ecuación (2) puede derivarse
( , n — U Q ¥
equiparando la frecuencia central de bancos de filtros de síntesis transpuesta 2 T y la frecuencia central
( k + 1 ) W
de bancos de filtros de análisis 2 . Asumiendo un índice de número entero k y un resto r e [0,1] puede obtenerse la siguiente ecuación para bancos de filtros apilados de modo impar:
Figure imgf000007_0001
El experto en la técnica apreciará que si T - Q, es decir, la diferencia entre el orden de transposición y el factor de resolución, es par, T(1-r) y Tr son ambos números enteros y pueden usarse las reglas de interpolación de las ecuaciones (3) y (4).
El mapeo de sub-bandas de análisis en sub-bandas de síntesis se ilustra en la figura 5b. La figura 5b muestra cuatro diagramas para diferentes órdenes de transposición T = 1 a T = 4. Cada diagrama ilustra cómo las ubicaciones de procedencia 510, es decir, las sub-bandas de análisis, se mapean en las ubicaciones de destino 530, es decir, las sub-bandas de síntesis. Con fines de ilustración, se asume que el factor de resolución Q es igual a uno. En otras palabras, la figura 5b ilustra el mapeo de las señales de sub-banda de análisis con respecto a señales de sub-banda de síntesis usando la Ec. (2) y (3). En el ejemplo ilustrado, el banco de filtros de análisis/síntesis se apila de modo par, con Q = 1 y el máximo orden de transposición T = 4.
En el caso ilustrado, la ecuación (2) puede escribirse como
Figure imgf000008_0001
. En consecuencia, para un orden de transposición T = 1, se mapea una sub-banda de análisis con un índice k con respecto a una sub-banda de síntesis correspondiente n y el resto r es siempre cero. Esto puede observarse en la figura 5b, donde, por ejemplo, se mapea la ubicación de procedencia 511 una a una con respecto a una ubicación de destino 531.
En el caso de un orden de transposición T = 2, el resto r tiene en cuenta los valores 0 y 1/2 y se mapea ubicación de procedencia con respecto a una pluralidad de ubicaciones de destino. Al invertir la perspectiva, puede señalarse que cada ubicación de destino 532, 535 recibe una contribución de hasta dos ubicaciones de procedencia. Esto puede observarse en la figura 5b, donde la ubicación de destino 535 recibe una contribución de las ubicaciones de procedencia 512 y 515. Sin embargo, la ubicación de destino 532 recibe una contribución únicamente de la ubicación de procedencia 512. Si se asume que la ubicación de destino 532 tiene un índice par n, por ejemplo n = 10, entonces la ecuación (2) especifica que la ubicación de destino 532 recibe una contribución de la ubicación de procedencia 512 con un índice k = n/2, por ejemplo k = 5. El resto r es cero, es decir, no hay ninguna contribución de la ubicación de procedencia 515 con índice k+1, por ejemplo, k+1 = 6. Esto cambia para la ubicación de destino 535 con un índice impar n, por ejemplo n = 11. En este caso, la ecuación (2) especifica que la ubicación de destino 535 recibe contribuciones desde la ubicación de procedencia 512 (índice k = 5) y la ubicación de procedencia 515 (índice k+1 = 6). Esto se aplica de forma similar a órdenes de transposición T mayores, por ejemplo, T = 3 y T = 4, como se muestra en la figura 5b.
Una interpretación adicional del procesamiento no lineal avanzado anterior puede ser como se indica a continuación. El procesamiento no lineal avanzado puede entenderse como una combinación de una transposición de un orden dado T en señales de sub-banda intermedia en una rejilla de frecuencia intermedia TAf y un mapeo posterior de las señales de sub-banda intermedia con respecto a una rejilla de frecuencia definida por un banco de filtros de síntesis común, es decir, por una rejilla de frecuencia QAf. Con el fin de ilustrar esta interpretación, se hace referencia de nuevo a la figura 5b. Sin embargo, para esta ilustración, las ubicaciones de procedencia 510 se consideran sub-bandas intermedias obtenidas de las sub-bandas de análisis usando un orden de transposición T. Estas sub-bandas intermedias tienen una rejilla de frecuencia dada por TAf. Para generar señales de sub-banda de síntesis en una rejilla de frecuencia predefinida QAf dada por las ubicaciones de destino 530, las ubicaciones de procedencia 510, es decir, las sub-bandas intermedias que tienen la rejilla de frecuencia TAf, han de mapearse sobre la rejilla de frecuencia predefinida QAf. Esto puede realizarse determinando una ubicación de destino 530, es decir, una señal de sub-banda de síntesis en la rejilla de frecuencia QAf, interpolando una o dos ubicaciones de procedencia 510, es decir, las señales de sub-banda intermedia en la rejilla de frecuencia TAf. En una realización preferida, se usa interpolación lineal, en la que las ponderaciones de la interpolación son inversamente proporcionales a la diferencia entre la frecuencia central de la ubicación de destino 530 y la ubicación de procedencia correspondiente 510. A modo de ejemplo, si la diferencia es cero, entonces la ponderación es 1, y si la diferencia es TAf, entonces la ponderación es 0.
En resumen, se ha descrito un método de procesamiento no lineal que permite la determinación de contribuciones a una sub-banda de síntesis por medio de la transposición de varias sub-bandas de análisis. El método de procesamiento no lineal permite el uso de bancos de filtros de sub-banda de análisis y de síntesis comunes individuales para diferentes órdenes de transposición, reduciendo de esta manera significativamente la complejidad computacional de los reemisores armónicos múltiples.
Las figuras 6a y 6b ilustran bancos de filtros de análisis/síntesis ejemplares que usan una FFT/DFT de M = 1024 puntos (T ransformada Rápida de Fourier o T ransformada Discreta de Fourier) para órdenes de transposición múltiples de T = 2,3,4. La figura 6a ilustra el caso convencional de un reemisor armónico múltiple 600 que usa un banco de filtros de análisis común 601 y bancos de filtros de síntesis separados 602, 603, 604 para cada factor de transposición T = 2,3,4. La figura 6a muestra las ventanas de análisis va 611 y las ventanas de síntesis vs 612, 613, 614 aplicadas al banco de filtros de análisis 601 y los bancos de filtros de síntesis 602, 603, 604, respectivamente. En el ejemplo ilustrado, la ventana de análisis va 611 tiene una longitud La =1024 que es igual al tamaño M de la FFT o la DFT de los bancos de filtros de análisis/síntesis 601, 602, 603, 604. De una forma similar, las ventanas de síntesis vs 612, 613, 614 tienen una longitud de Ls = 1024 que es igual al tamaño M de la FFT o la DFT.
La figura 6a también ilustra el tamaño de salto Asa empleado por el banco de filtros de análisis 601 y el tamaño de salto Ass empleado por los bancos de filtros de síntesis 602, 603, 604, respectivamente. El tamaño de salto As corresponde al número de muestras de datos por las que la ventana respectiva 611, 612, 613, 614 se desplaza entre las etapas de transformación sucesivas. El tamaño de salto As se refiere al avance del tiempo físico At a través de la tasa de muestreo de la señal subyacente, es decir, As = fsAt, en la que fs es la tasa de muestreo.
Puede observarse que la ventana de análisis 611 se mueve por un tamaño de salto 621 de 128 muestras. La ventana de síntesis 612 correspondiente a una transposición del orden T = 2 se mueve por un tamaño de salto 622 de 256 muestras, es decir, un tamaño de salto 622 que es dos veces el tamaño de salto 621 de la ventana de análisis 611. Como se ha indicado anteriormente, esto conduce a una extensión de tiempo de la señal por el factor T = 2. Como alternativa, si se asume una tasa de muestreo T = 2 veces superior, la diferencia entre el tamaño de salto de análisis 621 y el tamaño de salto de síntesis 622 conduce a una transposición armónica del orden T = 2. Es decir, una extensión de tiempo en un orden T puede convertirse en una transposición armónica realizando una conversión de la tasa de muestreo del orden T.
De una manera similar, puede observarse que el tamaño de salto de síntesis 623 asociado con el reemisor armónico del orden T = 3 es T = 3 veces mayor que el tamaño de salto de análisis 621, y el tamaño de salto de síntesis 624 asociado con el reemisor armónico del orden T = 4 es T = 4 veces mayor que el tamaño de salto de análisis 621. Para alinear las tasas de muestreo del reemisor de 3er orden y el reemisor de 4° orden con la tasa de muestreo de salida del reemisor de 2° orden, el reemisor de 3er orden y el reemisor de 4° orden comprenden un submuestreador de factor 3/2 633 y un submuestreador de factor 2 634, respectivamente. En términos generales, el reemisor de orden comprenderá un submuestreador de factor T/2, si se solicita una tasa de muestreo de salida, que es 2 veces mayor que la tasa de muestreo de entrada. Es decir, no se requiere ningún submuestreo para el reemisor armónico de orden T = 2.
Finalmente, la figura 6a ilustra las unidades de modificación de fase separadas 642, 643, 644 para el orden de transposición T = 2, 3, 4, respectivamente. Estas unidades de modificación de fase 642, 643, 644 realizan una multiplicación de la fase de las señales de sub-banda respectivas por el orden de transposición T = 2, 3, 4, respectivamente (véase la ecuación (1)).
Puede obtenerse una estructura de bancos de filtros combinados eficaz para el reemisor limitando el reemisor múltiple de la figura 6a a un único banco de filtros de análisis 601 y un único banco de filtros de síntesis 602. Después, los armónicos de 3er y 4° orden se producen en una unidad de procesamiento no lineal 650 dentro de un banco de filtros de 2° orden como se representa en la figura 6b. La figura 6b muestra un banco de filtros de análisis que comprende una unidad de FFT directa de 1024 puntos 601 y una ventana de análisis 611 que se aplica a la señal de entrada x con un tamaño de salto de análisis 621. El banco de filtros de síntesis comprende una unidad de FFT inversa de 1024 puntos 602 y una ventana de síntesis 612 que se aplica con un tamaño de salto de síntesis 622. En el ejemplo ilustrado, el tamaño de salto de síntesis 622 es dos veces el tamaño de salto de análisis 621. Además, se asume que la tasa de muestreo de la señal de salida y será dos veces la tasa de muestreo de la señal de entrada x.
El banco de filtros de análisis/síntesis de la figura 6b comprende un único banco de filtros de análisis y un único banco de filtros de síntesis. Usando el procesamiento no lineal avanzado 650 de acuerdo con los métodos representados en el contexto de la figura 5 y la figura 5b, es decir, el procesamiento no lineal avanzado realizado en las unidades 502­ 1,..., 502-P, este banco de filtros de análisis/síntesis puede usarse para proporcionar un reemisor múltiple, es decir, un reemisor armónico para una pluralidad de órdenes de transposición T.
Como se ha representado en el contexto de las figuras 5 y 5b, el mapeo una a una de las sub-bandas de análisis con respecto a las sub-bandas de síntesis correspondientes que implica una multiplicación de la fase de las señales de sub-banda por la orden de transposición respectiva T, puede generalizarse con respecto a las reglas de interpolación (véanse las Ecuaciones (3) y (4)) que implican una o más señales de sub-banda. Se ha descrito que si la separación física QAf de las sub-bandas de bancos de filtros de síntesis es Q veces la separación física Af del banco de filtros de análisis, la entrada a la banda de síntesis con índice n se obtiene a partir de las bandas de análisis con índices k y k + 1. La relación entre los índices n y k se da por la ecuación (2) o (5), dependiendo de si los bancos de filtros se apilan de modo par o impar. Se aplica una interpolación geométrica para las magnitudes con las potencias 1-r y r (ecuación (4)), y las fases se combinan de forma lineal con las ponderaciones T(1-r) y Tr (ecuación (3)). Para el caso ilustrado en el que Q = 2, los mapeos de fase para cada factor de transposición se ilustran gráficamente en la figura 7.
De una manera similar al caso de Q = 1 ilustrado en la figura 5, una sub-banda de destino o una ubicación de destino 730 recibe contribuciones de hasta dos sub-bandas de procedencia o ubicaciones de procedencia 710. En el caso T = Q = 2, cada ubicación de procedencia de fase modificada 711 se asigna a una ubicación de destino correspondiente 731. Para órdenes de transposición superiores T>Q, puede obtenerse una ubicación de destino 735 a partir de una ubicación de procedencia de fase modificada correspondiente 715. Este es el caso si el resto r obtenidos a partir de la ecuación (2) o (5) es cero. De otro modo, se obtiene una ubicación de destino 732 interpolando dos ubicaciones de procedencia de fase modificada 712 y 715.
El procesamiento no lineal que se ha mencionado anteriormente se realiza en la unidad de reemisor múltiple 650 que determina las ubicaciones de destino 730 para las diferentes órdenes de transposición T = 2, 3, 4 usando las unidades de procesamiento no lineal avanzado 502-2, 502-3, 502-4. Posteriormente, las ubicaciones de destino correspondientes 730 se combinan en una unidad de combinador 503 para producir un único conjunto de señales de sub-banda de síntesis que se suministran al banco de filtros de síntesis. Como se ha indicado anteriormente, la unidad de combinador 503 se configura para combinar una pluralidad de contribuciones en intervalos de frecuencia de solapamiento a partir de la salida de las diferentes unidades de procesamiento no lineal 502-2, 502-3, 502-4.
A continuación, se describe la transposición armónica de señales transitorias que usan reemisores armónicos. En este contexto, se ha de observar que la transposición armónica del orden T que usa bancos de filtros de análisis/síntesis puede interpretarse como una extensión del tiempo de una señal subyacente por un factor de transposición de número entero T seguido de un submuestreo y/o una conversión de la tasa de muestreo. La extensión del tiempo se realiza de tal forma que las frecuencias de sinusoides que componen la señal de entrada se mantengan. Dicha extensión de tiempo puede realizarse usando el banco de filtros de análisis/síntesis en combinación con una modificación intermedia de las fases de las señales de sub-banda en base al orden de transposición T. Como se ha indicado anteriormente, el banco de filtros de análisis puede ser un banco de filtros de DFT en ventana con una ventana de análisis va, y el banco de filtros de síntesis puede ser un banco de filtros de DFT inversa en ventana con una ventana de síntesis vs. Dicha transformada de análisis/síntesis también se denomina como Transformada de Fourier de Tiempo Reducido (STFT, Short-Time Fourier Transform).
Se realiza una transformada de Fourier de tiempo reducido en una señal de entrada de dominio temporal x para obtener una sucesión de cuadros espectrales solapados. Con el fin de reducir al mínimo los posibles efectos de la banda lateral, deben seleccionarse ventanas de análisis/síntesis apropiadas, por ejemplo, ventanas Gaussianas, ventanas de coseno, ventanas de Hamming, ventanas de Hann, ventanas rectangulares, ventanas de Bartlett, ventanas de Blackman, y otras. El retardo temporal en el que cada cuadro espectral se recoge de la señal de entrada x se denomina como el tamaño de salto As o el avance del tiempo físico At. La STFT de la señal de entrada x se denomina como la etapa de análisis y conduce a una representación del dominio de la frecuencia de la señal de entrada x. La representación del dominio de la frecuencia comprende una pluralidad de señales de sub-banda, en la que cada señal de sub-banda representa una determinada componente de frecuencia de la señal de entrada.
Con el fin de la extensión del tiempo de la señal de entrada, cada señal de sub-banda puede extenderse en el tiempo, por ejemplo, retrasando las muestras de las señales de sub-banda. Esto puede conseguirse usando un tamaño de salto de síntesis que sea superior al tamaño de salto de análisis. La señal de dominio temporal puede reconstruirse realizando una transformada de Fourier (Rápida) inversa en todos los cuadros seguida de una acumulación sucesiva de los cuadros. Esta operación de la etapa de síntesis se denomina como operación de solapamiento-suma. La señal de salida resultante es una versión extendida en el tiempo de la señal de entrada que comprende las mismas componentes de frecuencia que la señal de entrada. En otras palabras, la señal de salida resultante tiene la misma composición espectral que la señal de entrada, pero es menor que la señal de entrada, es decir, su progresión se extiende en el tiempo.
Entonces, puede obtenerse posteriormente la transposición a frecuencias mayores, o de forma integrada, a través de submuestreo de las señales extendidas, o realizando una conversión de la tasa de muestra de la señal de salida extendida en el tiempo. Como resultado, la señal transpuesta tiene la longitud en el tiempo de la señal inicial, pero comprende componentes de frecuencia que se desplazan hacia arriba por un factor de transposición predefinido.
En vista de lo anterior, la transposición armónica de señales transitorias usando reemisores armónicos se describe considerando como un punto de partida la extensión del tiempo de una señal transitoria prototipo, es decir, un pulso de Dirac de tiempo discreto en el instante de tiempo t = fe,
Figure imgf000010_0001
La transformada de Fourier de tal pulso de Dirac tiene una magnitud y una fase lineal con una pendiente proporcional a te.
Figure imgf000010_0002
m
^ m ~ 2 ^ . .
en la que M es la frecuencia central de la mésima señal de sub-banda del análisis STFT y M es el tamaño de la transformada discreta de Fourier (DFT). Tal transformada de Fourier puede considerarse como la etapa de análisis del banco de filtros de análisis que se ha descrito anteriormente, en la que se usa una ventana de análisis plana va de una duración infinita. Con el fin de generar una señal de salida y que se extiende en el tiempo por un factor T, es decir, un pulso de Dirac 8 (t-Tto) en el instante de tiempo t = Tto, la fase de las señales de sub-banda de análisis deben multiplicarse por el factor T para obtener la señal de sub-banda de síntesis Y(Qm) = exp(-jQmTto) que produce el pulso de Dirac deseado 8(t-Tto) como una salida de una transformada inversa de Fourier.
Sin embargo, se ha de observar que las consideraciones anteriores se refieren a una etapa de análisis/síntesis que usa ventanas de análisis y de síntesis de longitudes infinitas. De hecho, un reemisor teórico con una ventana de duración infinita dará el tramo correcto de un pulso de Dirac 8(t-to). Para un análisis en ventana de duración finita, la situación se confunde por el hecho de que cada bloque de análisis se va a interpretar como un intervalo periódico de una señal periódica con un periodo igual al tamaño de la DFT.
Esto se ilustra en la figura 8, que muestra el análisis y la síntesis 800 de un pulso de Dirac 8 (t-to). La parte superior de la figura 8 muestra la entrada a la etapa de análisis 810 y la parte inferior de la figura 8 muestra la salida de la etapa de síntesis 820. Los gráficos superior e inferior representan el dominio temporal. La ventana de análisis estilizada 811 y la ventana de síntesis 821 se representan como ventanas triangulares (Bartlett). El pulso de entrada S(t-to) 812 en el instante de tiempo t = fo se representa en el gráfico superior 810 como una flecha vertical. Se asume que el bloque de la transformada DFT es de un tamaño M = L = La = Ls, es decir, el tamaño de la transformada DFT se selecciona para que sea igual al tamaño de las ventanas. La multiplicación de fase de las señales de sub-banda por el factor T producirá el análisis DFT de un pulso de Dirac 8(t-Tfo) en t = Tto, sin embargo, de un pulso de Dirac periodizado con respecto a un tren de pulsos de Dirac con un periodo L. Esto se debe a la longitud finita de la ventana aplicada y la Transformada de Fourier. El tren de pulsos periodizado con el periodo L se representa por las flechas discontinuas 823, 824 en el gráfico inferior.
En un sistema del mundo real, el tren de pulsos contiene realmente sólo unos pocos pulsos (dependiendo del factor de transposición), un pulso principal, es decir, el término deseado, unos pocos pre-pulsos y unos pocos post-pulsos, es decir, los términos no deseados. Los pre-pulsos y los post-pulsos surgen debido a que la DFT es periódica (con L). Cuando se localiza un pulso en una ventana de análisis, de manera que la fase compleja se envuelva al multiplicarse por T (es decir, el pulso se desplaza fuera del extremo de la ventana y vuelve de nuevo al principio), surge un pulso no deseado dentro de la ventana de síntesis. Los pulsos no deseados pueden tener, o no, la misma polaridad que el pulso de entrada, dependiendo de la localización en la ventana de análisis y el factor de transposición.
En el ejemplo de la figura 8, la ventana de síntesis usa una ventana finita vs 821. La ventana de síntesis finita 821 recoge el pulso deseado S(t-Tto) en t = Tto que se representa como una flecha sólida 822 y cancela las otras contribuciones no deseadas que se muestran como flechas discontinuas 823, 824.
Puesto que la etapa de análisis y de síntesis desplazan a lo largo del tiempo el eje de tiempo de acuerdo con el factor de salto As o el avance de tiempo At, el pulso S(t-tü) 812 tendrá otra posición con respecto al centro de la ventana de análisis respectiva 811. Como se ha indicado anteriormente, la operación para conseguir la extensión en el tiempo consiste en mover el pulso 812 hasta T veces su posición con respecto al centro de la ventana. Siempre que esta posición esté dentro de la ventana 821, esta operación de extensión de tiempo garantiza que todas las contribuciones constituyen un único pulso sintetizado extendido en el tiempo S(t-Tto) en t = Tto.
Sin embargo, tiene lugar un problema para la situación de la figura 9, donde el pulso S(t-to) 912 se mueve adicionalmente fuera hacia el borde del bloque de la DFT. La figura 9 ilustra una configuración de análisis/síntesis similar 900 que en la figura 8. El gráfico superior 91 ü muestra la entrada a la etapa de análisis y la ventana de análisis 911, y el gráfico inferior 920 ilustra la salida de la etapa de síntesis y la ventana de síntesis 921. Al extender en el tiempo el pulso de Dirac de entrada 912 en un factor T, el pulso de Dirac extendido en el tiempo 922, es decir, S(t-Tto), se coloca fuera de la ventana de síntesis 921. Al mismo tiempo, otro pulso de Dirac 924 del tren de pulsos, es decir, S(t-Tto L) en el instante de tiempo t = Tto - L, se recoge por la ventana de síntesis. En otras palabras, el pulso de Dirac de entrada 912 no se retrasa a un instante de tiempo posterior T veces, sino que se desplaza hacia delante a un instante de tiempo que se encuentra antes del pulso de Dirac de entrada 912. El efecto final sobre la señal de audio es la aparición de un pre-eco a una distancia de tiempo de la escala de las ventanas del reemisor muy extensas, es decir, en un instante de tiempo t = Tto- L que es L - (T-1)fo antes que el pulso de Dirac de entrada 912.
El principio de la solución a este problema se describe en referencia a la figura 10. La figura 10 ilustra un escenario de análisis/síntesis 1000 similar a la figura 9. El gráfico superior 1010 muestra la entrada a la etapa de análisis con la ventana de análisis 1011, y el gráfico inferior 1020 muestra la salida de la etapa de síntesis con la ventana de síntesis 1021. El tamaño de la DFT se adapta para evitar pre-ecos. Esto se consigue ajustando el tamaño M de la DFT de tal forma que no se recojan imágenes de pulsos de Dirac no deseados del tren de pulsos resultante por la ventana de síntesis. El tamaño de la transformada DFT 1001 aumenta a M = FL, donde L es la longitud de la función de la ventana 1002 y el factor F es un factor de sobremuestreo de dominio de frecuencia. En otras palabras, el tamaño de la transformada DFT 1001 se selecciona para que sea mayor que el tamaño de la ventana 1002. En particular, el tamaño de la transformada DFT 1001 puede seleccionarse para que sea mayor que el tamaño de la ventana 1002 de la ventana de síntesis. Debido a la longitud aumentada 1001 de la transformada DFT, el periodo del tren de pulsos que comprende los pulsos de Dirac 1022, 1024 es FL. Seleccionando un valor suficientemente grande de F, es decir, seleccionando un factor de sobremuestreo de dominio de frecuencia suficientemente grande, pueden cancelarse las contribuciones no deseadas al tramo de pulsos. Esto se muestra en la figura 10, donde el pulso de Dirac 1024 en el instante de tiempo t = Tto-FL está fuera de la ventana de síntesis 1021. Por lo tanto, el pulso de Dirac 1024 no se recoge por la ventana de síntesis 1021 y, en consecuencia, pueden evitarse los pre-ecos.
Se ha de observar que en una realización preferida, la ventana de síntesis y la ventana de análisis tienen longitudes "nominales" iguales (medidas en el número de muestras). Sin embargo, al usar un remuestreo implícito de la señal de salida descartando o insertando muestras en las bandas de frecuencia de la transformada o el banco de filtros, el tamaño de la ventana de síntesis (medido en el número de muestras) será típicamente diferente del tamaño de análisis, dependiendo del remuestreo y/o el factor de transposición.
El valor mínimo de F, es decir, el factor de sobremuestreo de dominio de frecuencia mínimo, puede deducirse a partir de la figura 10. La condición para no recoger imágenes de pulsos de Dirac no deseados puede formularse como se L
t - 10 <
indica a continuación: Para cualquier pulso de entrada S(t-to) en la posición 2 , es decir, para cualquier pulso de entrada comprendido dentro de la ventana de análisis 1011, la imagen no deseada S(t - Tto FL) en el instante de L
1 = -----tiempo t = Tto - FL debe localizarse a la izquierda del borde izquierdo de la ventana de síntesis en 2 . De forma
T L - F L < - L
equivalente, la condición 2 2 debe cumplirse, lo que conduce a la regla
Figure imgf000012_0001
Como puede observarse a partir de la fórmula (6), el factor de sobremuestreo de dominio de frecuencia mínimo F es una función del orden de transposición T. Más específicamente, el factor de sobremuestreo de dominio de frecuencia mínimo F es proporcional al orden de transposición T.
Repitiendo la línea de pensamiento anterior para el caso en el que las ventanas de análisis y de síntesis tienen diferentes longitudes, se obtiene una fórmula más general. Se permite que La y Ls sean las longitudes de las ventanas de análisis y de síntesis (medidas en el número de muestras), respectivamente, y se permite que M sea del tamaño de DFT empleado. La regla general que extiende la fórmula (6) es entonces
Figure imgf000012_0002
De hecho, que esta regla es una extensión de (6) puede verificarse insertando M = FL, y La = Ls = L en (7) y dividiendo por L en ambos lados de la ecuación resultante.
El análisis anterior se realiza para un modelo bastante especial de un transitorio, es decir, un pulso de Dirac. Sin embargo, el razonamiento puede extenderse para demostrar que al usar la extensión en el tiempo que se ha descrito anteriormente y/o el esquema de transposición armónica, las señales de entrada que tienen una envolvente espectral casi plana y que desaparecen fuera de un intervalo de tiempo [a,b] se extenderán a señales de salida que son pequeñas fuera del intervalo [Ta, Tb]. También puede verificarse, estudiando los espectrogramas de señales de audio y/o voz reales, que los pre-ecos desaparecen en las señales extendidas o transpuestas cuando la regla que se ha descrito anteriormente para seleccionar un factor de sobremuestreo de dominio de frecuencia apropiado se respeta. Un análisis más cuantitativo también revela que los pre-ecos aún se reducen al usar factores de sobremuestreo de dominio de frecuencia que son ligeramente inferiores al valor impuesto por la condición de la fórmula (6) o (7). Esto se debe al hecho de que las funciones de ventana típicas vs son pequeñas cerca de sus bordes, atenuando así pre­ ecos no deseados que se sitúan cerca de los bordes de las funciones de ventana.
En resumen, un modo de mejorar la respuesta transitoria de los reemisores armónicos de dominio de frecuencia, o extensores de tiempo, se ha descrito introduciendo una transformada sobremuestreada, donde la cantidad de sobremuestreo es una función del factor de transposición escogido. La respuesta transitoria mejorada del reemisor se obtiene por medio del sobremuestreo del dominio de frecuencia.
En el reemisor múltiple de la figura 6, el sobremuestreo de dominio de frecuencia puede implementarse usando núcleos de DFT 601,602, 603, 604 de longitud 1024F y completando con ceros las ventanas de análisis y de síntesis simétricamente a esta longitud. Se ha de observar que por motivos de complejidad, es beneficioso mantener la cantidad de sobremuestreo bajo. Si la fórmula (6) se aplica al reemisor múltiple de la figura 6, debe aplicarse un factor de sobremuestreo F = 2,5 para incluir todos los factores de transposición T = 2, 3, 4. Sin embargo, puede mostrarse que el uso de F = 2,0 ya conduce a una mejora de la calidad significativa para las señales de audio real.
A continuación, y según la presente invención, se describe el uso del sobremuestreo de dominio de frecuencia en el contexto de los bancos de filtros de análisis/síntesis combinados, tal como se describe en el contexto de las figuras 5 o la figura 6b.
En general, para un banco de filtros de transposición combinado donde la separación física QAf de las sub-bandas del banco de filtros de síntesis es Q veces la separación física Af del banco de filtros de análisis y donde la duración de la ventana de análisis física Da (medida en unidades de tiempo, por ejemplo segundos) es también Q veces la del banco de filtros de síntesis, Da = QDs, el análisis para un pulso de Dirac como anteriormente se aplicará para todos los factores de transposición T = Q, Q+1, Q+2,... como si T = Q. En otras palabras, la regla para el grado de sobremuestreo de dominio de frecuencia requerido en un banco de filtros de transposición combinado se da por T +1 F
En particular, se ha de observar que para T>Q, el factor de sobremuestreo de dominio de frecuencia 2 es suficiente, al mismo tiempo que se asegura aún la supresión de artefactos en las señales transitorias causados por la transposición armónica de orden T. Es decir, usando las reglas de sobremuestreo anteriores para el banco de filtros combinado, puede observarse que incluso al usar órdenes de transposición mayores T>Q, no se requiere aumentar adicionalmente el factor de sobremuestreo F. Como se indica por la ecuación (6b), es suficiente en la implementación del banco de filtros combinado de la figura 6b usar un factor de sobremuestreo F = 1,5 con el fin de evitar la aparición de pre-ecos. Este valor es menor que el factor de sobremuestreo F = 2,5 requerido para el reemisor múltiple de la figura 6. En consecuencia, la complejidad de realizar el sobremuestreo de dominio de frecuencia para mejorar el rendimiento transitorio de los reemisores armónicos múltiples puede reducirse al usar un banco de filtros de análisis/síntesis combinado (en lugar de bancos de filtros de análisis y/o síntesis separados para los diferentes órdenes de transposición).
En un escenario más general, la duración de tiempo física de las ventanas de análisis y de síntesis Da y Ds, respectivamente, pueden seleccionarse de forma arbitraria. Entonces, la separación física Af de las sub-bandas del banco de filtros de análisis debe satisfacer
Figure imgf000013_0001
para evitar los artefactos descritos causados por la transposición armónica. Se ha de observar que la duración de una ventana D típicamente difiere de la longitud de una ventana L. Mientras que la longitud de una ventana L corresponde al número de muestras de señal cubiertas por la ventana, la duración de la ventana D corresponde al intervalo de tiempo de la señal cubierta por la ventana. Como se ilustra en la figura 6a, las ventanas 611,612, 613, 614 tienen una longitud equivalente de L = 1024 muestras. Sin embargo, la duración Da de la ventana de análisis 611 es T veces la duración Ds de la ventana de síntesis 612, 613, 614, en la que T es el orden de transposición respectivo y el factor de resolución del banco de filtros de síntesis respectivo. De una manera similar, la duración Da de la ventana de análisis 611 en la figura 6b es Q veces la duración Ds de la ventana de síntesis 612, en la que Q es el factor de resolución del banco de filtros de síntesis. La duración de una ventana D se refiere a la longitud de la ventana L a través de la
D = —
frecuencia de muestreo fs, es decir, particularmente ■'* . De una manera similar, la resolución de frecuencia de una transformada Af se refiere al número de puntos o longitud M de la transformada a través de la frecuencia de
A f = —
muestreo fs, es decir, particularmente M Además, el avance del tiempo físico At de un banco de filtros se refiere al tamaño de salto As del banco de filtros a través de la frecuencia de muestreo fs, es decir, particularmente
A . t = As
f s .
Usando las relaciones anteriores, la ecuación (6b) puede escribirse como
Figure imgf000013_0002
es decir, el producto de la resolución de frecuencia y la longitud de ventana del banco de filtros de análisis y/o la resolución de frecuencia y la longitud de ventana del banco de filtros de síntesis deben seleccionarse para que sean 2 2
menores o igual a Q 1 . Para T>Q, el producto AfDA y/o QAfDs puede seleccionarse para que sea mayor de T + 1 , reduciendo así la complejidad computacional de los bancos de filtros.
En el presente documento se han descrito diversos métodos para realizar la transposición armónica de señales, preferiblemente señales de audio y/o voz. Se ha puesto énfasis particular sobre la complejidad computacional de los reemisores armónicos múltiples. En este contexto, se ha descrito un reemisor múltiple, que está configurado para realizar múltiples órdenes de transposición usando un banco de filtros de análisis/síntesis combinado, es decir, un banco de filtros que comprende un único banco de filtros de análisis y un único banco de filtros de síntesis. Un reemisor múltiple que usa un banco de filtros de análisis/síntesis combinado ha reducido la complejidad computacional en comparación con un reemisor múltiple convencional. Además, se ha descrito el sobremuestreo del dominio de frecuencia en el contexto de bancos de filtros de análisis/síntesis combinados. Puede usarse un sobremuestreo del dominio de frecuencia para reducir o eliminar los artefactos causados en las señales transitorias por la transposición armónica. Se ha mostrado que el sobremuestreo de dominio de frecuencia puede implementarse con una complejidad computacional reducida dentro de bancos de filtros de análisis/síntesis combinados, en comparación con las implementaciones de reemisores múltiples convencionales.
Aunque se han descrito en el presente documento realizaciones específicas de la presente invención y aplicaciones de la invención, será evidente para los expertos en la técnica que son posibles muchas variaciones en las realizaciones y aplicaciones descritas en el presente documento sin apartarse del alcance de la invención descrita y reivindicada en el presente documento. Se entenderá que aunque se han mostrado y se han descrito ciertas formas de la invención, la invención no se limitará a las realizaciones específicas descritas y mostradas o los métodos específicos descritos. Los métodos y sistemas descritos en el documento presente pueden implementarse como software, firmware y/o hardware. Ciertos componentes pueden implementarse, por ejemplo, como software que se ejecuta en un procesador de señales digitales o microprocesador. Otros componentes pueden implementarse, por ejemplo, como hardware y/o como circuitos integrados específicos de aplicación. Las señales encontradas en los procedimientos y sistemas descritos pueden almacenarse en medios tales como una memoria de acceso aleatorio o medios de almacenamiento ópticos. Pueden transferirse a través de redes, tales como redes de radio, redes de satélite, redes inalámbricas o redes cableadas, por ejemplo Internet. Los dispositivos típicos que hacen uso de los métodos que se describen en el presente documento son, por ejemplo, reproductores multimedia o receptores de televisión que descodifican señales de audio. En el lado de codificación, los sistemas y métodos pueden usarse, por ejemplo, en estaciones de radiodifusión y en sitios de producción multimedia.

Claims (11)

REIVINDICACIONES
1. Un sistema para generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de audio de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, que comprende:
una unidad de ventana de análisis configurada para aplicar una ventana de análisis (611) de una longitud de muestras La , extrayendo así un cuadro de la señal de entrada;
una unidad de transformación de análisis de orden M (601) y que tiene una resolución de frecuencia A f configurada para transformar las muestras La en M coeficientes complejos;
una unidad de procesamiento no lineal (643, 644, 650), configurada para alterar la fase de los coeficientes complejos utilizando el orden de transposición T;
una unidad de transformación de síntesis (602) de orden M y que tiene una resolución de frecuencia Qúf, configurada para transformar los coeficientes alterados en M muestras de dominio temporal; en donde Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T; y
una unidad de ventana de síntesis configurada para aplicar una ventana de síntesis (612) de una longitud de muestras Ls a las M muestras de dominio temporal, generando así un cuadro de la señal de salida;
F> Q +1
en donde la orden de transformación M es M = F- Ls, donde y donde, cuando el orden de transposición T F Z7 < - T -- + -- l -es mayor que el factor de resolución de frecuencia Q, 1 .
2. El sistema de la reivindicación 1, en el que la diferencia entre M y la longitud promedio de la ventana de análisis (611) y la ventana de síntesis (612) es proporcional a (Q -1).
3. El sistema de la reivindicación 1 o la reivindicación 2, en el que M es menor que (TLa +Ls)/2.
4. El sistema de cualquier reivindicación anterior, en el que
la unidad de transformación de análisis (601) realiza una de una Transformada de Fourier, una Transformada Rápida de Fourier, una Transformada Discreta de Fourier, una Transformada de Ondícula; y
la unidad de transformación de síntesis (602) realiza la transformada inversa correspondiente.
5. El sistema de cualquier reivindicación anterior, en el que la ventana de análisis (611) y/o síntesis (612) es una de: ventana gaussiana;
ventana cosenoidal
ventana Hamming;
ventana Hann;
ventana rectangular;
ventana de Bartlett;
ventana de Blackman.
6. El sistema de cualquier reivindicación anterior, en el que
una tasa de muestreo de la señal de audio es fÁ,
la ventana de análisis (611) se desplaza por un tamaño de salto de análisis de muestras Asa a lo largo de la señal de audio;
la resolución de frecuencia de la unidad de transformada de análisis (601) es
Figure imgf000015_0001
una duración de la ventana de análisis (611) es
A *i, = A s Á ,
f
un avance del tiempo físico de la ventana de análisis (611) es J A
7. El sistema de cualquier reivindicación anterior, en el que
una tasa de muestreo de la componente de alta frecuencia es fs = QfA,
la ventana de síntesis (612) se desplaza por un tamaño de salto de síntesis de muestras Ass a lo largo de la componente de alta frecuencia;
OAf =A - la resolución de frecuencia de la unidad de transformación de síntesis (602) es M '
Ds = ' r
una duración de la ventana de síntesis (612) es f s ; y
un avance del tiempo físico de la ventana de síntesis (612) es
Figure imgf000016_0001
8. El sistema de cualquier reivindicación anterior, en el que el sistema se usa para codificación o decodificación unificada de voz y audio.
9. Un método para generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de audio de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, comprendiendo el método:
aplicar una ventana de análisis (611) de una longitud de muestras La , extrayendo así un cuadro de la señal de entrada; transformar el cuadro de muestras La de la señal de entrada en M coeficientes complejos usando una transformación de análisis de orden M y resolución de frecuencia ñf;
alterar la fase de los coeficientes complejos usando el orden de transposición T;
transformar los coeficientes alterados en M muestras alteradas usando una transformación de síntesis de orden M y resolución de frecuencia Qñf; en donde
Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T; y
aplicar una ventana de síntesis (612) de una longitud de muestras Ls a las M muestras alteradas, generando así un cuadro de la señal de salida;
Figure imgf000016_0002
en donde la orden de transformación M es M = F- Ls, y en donde y
F <- T -- + -- l -en donde, cuando el orden de transposición T es mayor que el factor de resolución de frecuencia Q, 2 .
10. Un método para diseñar un reemisor configurado con el fin de generar una señal de salida que comprende una componente de alta frecuencia a partir de una señal de entrada que comprende una componente de baja frecuencia usando un orden de transposición T, comprendiendo el método:
proporcionar una unidad de ventana de análisis configurada para aplicar una ventana de análisis (611) de una longitud de muestras La , extrayendo así un cuadro de la señal de entrada;
proporcionar una unidad de transformación de análisis de orden M (601) y con una resolución de frecuencia ñ f configurada para transformar las muestras La en M coeficientes complejos;
proporcionar una unidad de procesamiento no lineal (643, 644, 650), configurada para alterar la fase de los coeficientes complejos utilizando el orden de transposición T;
proporcionar una unidad de transformación de síntesis (602) de orden M y con una resolución de frecuencia Qñf, configurada para transformar los coeficientes alterados en M muestras alteradas; en donde Q es un factor de resolución de frecuencia menor o igual que el orden de transposición T;
proporcionar una unidad de ventana de síntesis configurada para aplicar una ventana de síntesis (612) de una longitud de muestras Ls a las M muestras alteradas, generando así un cuadro de la señal de salida; y seleccionar la orden de
F > 1
transformación M = F • Ls, y en donde 2 i y
Figure imgf000017_0001
en donde, cuando el orden de transposición T es mayor que el factor de resolución de frecuencia Q,
11. Un medio de almacenamiento que comprende software para un procesador o microprocesador de señal digital, que cuando se ejecuta en el procesador o microprocesador de señal digital hace que realice el método de la reivindicación 9 o de la reivindicación 10.
ES21210177T 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado Active ES2936307T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US25377509P 2009-10-21 2009-10-21
US33078610P 2010-05-03 2010-05-03

Publications (1)

Publication Number Publication Date
ES2936307T3 true ES2936307T3 (es) 2023-03-16

Family

ID=42542966

Family Applications (6)

Application Number Title Priority Date Filing Date
ES17192422T Active ES2805349T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES14173151.3T Active ES2656668T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES21210177T Active ES2936307T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES10730734.0T Active ES2507165T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES20172571T Active ES2906085T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES22204414T Active ES2963061T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES17192422T Active ES2805349T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES14173151.3T Active ES2656668T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado

Family Applications After (3)

Application Number Title Priority Date Filing Date
ES10730734.0T Active ES2507165T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES20172571T Active ES2906085T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado
ES22204414T Active ES2963061T3 (es) 2009-10-21 2010-05-25 Sobremuestreo en un banco de filtros de reemisor combinado

Country Status (11)

Country Link
US (8) US8886346B2 (es)
EP (7) EP3723090B1 (es)
JP (3) JP5345737B2 (es)
KR (1) KR101309671B1 (es)
CN (3) CN102576541B (es)
BR (2) BR112012009375B1 (es)
ES (6) ES2805349T3 (es)
HK (2) HK1168189A1 (es)
PL (5) PL3723090T3 (es)
RU (1) RU2494478C1 (es)
WO (1) WO2011047887A1 (es)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7928310B2 (en) * 2002-11-12 2011-04-19 MediaLab Solutions Inc. Systems and methods for portable audio synthesis
PL4231290T3 (pl) * 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
ES2805349T3 (es) 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5649084B2 (ja) * 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
CN102985970B (zh) * 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准
PL2545553T3 (pl) 2010-03-09 2015-01-30 Fraunhofer Ges Forschung Urządzenie i sposób do przetwarzania sygnału audio z użyciem zrównania granicy obszaru
MX2012011828A (es) * 2010-04-16 2013-02-27 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda.
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
PL3544007T3 (pl) * 2010-07-19 2020-11-02 Dolby International Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
EP2717261A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
US9494035B2 (en) 2012-11-06 2016-11-15 Evolution Engineering Inc. Fluid pressure pulse generator and method of using same
CA2894621C (en) 2012-12-17 2019-04-30 Evolution Engineering Inc. Mud pulse telemetry apparatus with a pressure transducer and method of operating same
US9574441B2 (en) 2012-12-17 2017-02-21 Evolution Engineering Inc. Downhole telemetry signal modulation using pressure pulses of multiple pulse heights
US10753201B2 (en) 2012-12-17 2020-08-25 Evolution Engineering Inc. Mud pulse telemetry apparatus with a pressure transducer and method of operating same
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9577798B1 (en) * 2014-04-30 2017-02-21 Keysight Technologies, Inc. Real-time separation of signal components in spectrum analyzer
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
CA2895683A1 (en) 2014-06-27 2015-12-27 Evolution Engineering Inc. Fluid pressure pulse generator for a downhole telemetry tool
CA2895680A1 (en) 2014-06-27 2015-12-27 Evolution Engineering Inc. Fluid pressure pulse generator for a downhole telemetry tool
US9631488B2 (en) 2014-06-27 2017-04-25 Evolution Engineering Inc. Fluid pressure pulse generator for a downhole telemetry tool
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9704497B2 (en) * 2015-07-06 2017-07-11 Apple Inc. Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques
CN107919136B (zh) * 2017-11-13 2021-07-09 河海大学 一种基于高斯混合模型的数字语音采样频率估计方法
DE102018206159B3 (de) * 2018-04-20 2019-09-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Paket-Detektor/Decoder für ein Funkübertragungssystem
EP3785260A1 (en) * 2018-04-25 2021-03-03 Dolby International AB Integration of high frequency audio reconstruction techniques
US11322127B2 (en) * 2019-07-17 2022-05-03 Silencer Devices, LLC. Noise cancellation with improved frequency resolution
US11889280B2 (en) * 2021-10-05 2024-01-30 Cirrus Logic Inc. Filters and filter chains

Family Cites Families (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4060848A (en) * 1970-12-28 1977-11-29 Gilbert Peter Hyatt Electronic calculator system having audio messages for operator interaction
US4016540A (en) * 1970-12-28 1977-04-05 Gilbert Peter Hyatt Apparatus and method for providing interactive audio communication
JPS5237465B2 (es) 1973-03-28 1977-09-22
US4395700A (en) * 1980-08-15 1983-07-26 Environmental Research Institute Of Michigan Image analyzer with variable line storage
FR2628918B1 (fr) * 1988-03-15 1990-08-10 France Etat Dispositif annuleur d'echo a filtrage en sous-bandes de frequence
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
US5235623A (en) * 1989-11-14 1993-08-10 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US6073100A (en) * 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6026356A (en) * 1997-07-03 2000-02-15 Nortel Networks Corporation Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JP3164038B2 (ja) * 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6493665B1 (en) * 1998-08-24 2002-12-10 Conexant Systems, Inc. Speech classification and parameter weighting used in codebook search
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
DE10030583A1 (de) * 2000-06-21 2002-01-10 Marconi Comm Gmbh Vorrichtung und Verfahren zum Verarbeiten von Frequenzsignalen
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
EP1388143A2 (en) * 2001-05-16 2004-02-11 Telefonaktiebolaget LM Ericsson (publ) A method for removing aliasing in wave table based synthesisers
US7369989B2 (en) * 2001-06-08 2008-05-06 Stmicroelectronics Asia Pacific Pte, Ltd. Unified filter bank for audio coding
US20040254797A1 (en) * 2001-08-21 2004-12-16 Niamut Omar Aziz Audio coding with non-uniform filter bank
EP1440433B1 (en) * 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
FI20012313A (fi) * 2001-11-26 2003-05-27 Genelec Oy Menetelmä matalataajuista ääntä muokkaavan modaalisen ekvalisaattorin suunnittelemiseksi
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US20030138117A1 (en) * 2002-01-22 2003-07-24 Goff Eugene F. System and method for the automated detection, identification and reduction of multi-channel acoustical feedback
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
FI20020865A (fi) * 2002-05-07 2003-11-08 Genelec Oy Menetelmä matalataajuisen modaalisen ekvalisaattorin suunnittelemiseksi erityisesti lähekkäin sijaitsevia moodeja varten
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
AU2003247040A1 (en) * 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
JP3646939B1 (ja) 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
US7248711B2 (en) 2003-03-06 2007-07-24 Phonak Ag Method for frequency transposition and use of the method in a hearing device and a communication device
JP4076887B2 (ja) * 2003-03-24 2008-04-16 ローランド株式会社 ボコーダ装置
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
EP1507334A1 (fr) * 2003-08-12 2005-02-16 STMicroelectronics S.A. Composant électronique permettant notamment le décodage de signaux modulés par une modulation numérique en quadrature sur un grand nombre de porteuses orthogonales
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7519538B2 (en) 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
KR20050064442A (ko) * 2003-12-23 2005-06-29 삼성전자주식회사 이동통신 시스템에서 입체음향 신호 생성 장치 및 방법
CN1910656B (zh) * 2004-01-20 2010-11-03 杜比实验室特许公司 基于块分组的音频编码
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1662100B (zh) * 2004-02-24 2010-12-08 三洋电机株式会社 低音强调电路以及低音强调处理方法
EP2065885B1 (en) * 2004-03-01 2010-07-28 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7587254B2 (en) * 2004-04-23 2009-09-08 Nokia Corporation Dynamic range control and equalization of digital audio using warped processing
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
JP4580210B2 (ja) * 2004-10-19 2010-11-10 ソニー株式会社 音声信号処理装置および音声信号処理方法
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
BRPI0517780A2 (pt) * 2004-11-05 2011-04-19 Matsushita Electric Ind Co Ltd aparelho de decodificação escalável e aparelho de codificação escalável
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
TWI319565B (en) * 2005-04-01 2010-01-11 Qualcomm Inc Methods, and apparatus for generating highband excitation signal
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
EP1722360B1 (en) * 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
EP1742509B1 (en) * 2005-07-08 2013-08-14 Oticon A/S A system and method for eliminating feedback and noise in a hearing device
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7197453B2 (en) * 2005-07-29 2007-03-27 Texas Instruments Incorporated System and method for optimizing the operation of an oversampled discrete Fourier transform filter bank
JP4701931B2 (ja) 2005-09-02 2011-06-15 日本電気株式会社 信号処理の方法及び装置並びにコンピュータプログラム
US20070083377A1 (en) * 2005-10-12 2007-04-12 Steven Trautmann Time scale modification of audio using bark bands
KR100851972B1 (ko) * 2005-10-12 2008-08-12 삼성전자주식회사 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치
EP1943643B1 (en) * 2005-11-04 2019-10-09 Nokia Technologies Oy Audio compression
US7774396B2 (en) * 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
EP1971978B1 (en) * 2006-01-09 2010-08-04 Nokia Corporation Controlling the decoding of binaural audio signals
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US8920343B2 (en) * 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
EP2095560B1 (en) * 2006-10-11 2015-09-09 The Nielsen Company (US), LLC Methods and apparatus for embedding codes in compressed audio data streams
CN101163240A (zh) * 2006-10-13 2008-04-16 国际商业机器公司 一种滤波装置及其方法
US7647229B2 (en) * 2006-10-18 2010-01-12 Nokia Corporation Time scaling of multi-channel audio signals
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP4300825A3 (en) * 2006-10-25 2024-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating time-domain audio samples
WO2008053970A1 (fr) * 2006-11-02 2008-05-08 Panasonic Corporation Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
US7756350B2 (en) * 2006-11-13 2010-07-13 Global Ip Solutions, Inc. Lossless encoding and decoding of digital data
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP2096632A4 (en) * 2006-11-29 2012-06-27 Panasonic Corp DECODING DEVICE AND AUDIO DECODING METHOD
KR101377135B1 (ko) * 2007-01-02 2014-03-21 삼성전자주식회사 오디오 신호의 저주파 및 중주파 성분 보강 방법 및 그장치
SG144752A1 (en) * 2007-01-12 2008-08-28 Sony Corp Audio enhancement method and system
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
GB0710211D0 (en) * 2007-05-29 2007-07-11 Intrasonics Ltd AMR Spectrography
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
DE602007003220D1 (de) * 2007-08-13 2009-12-24 Harman Becker Automotive Sys Rauschverringerung mittels Kombination aus Strahlformung und Nachfilterung
US7522074B2 (en) * 2007-09-17 2009-04-21 Samplify Systems, Inc. Enhanced control for compression and decompression of sampled signals
WO2009038056A1 (ja) * 2007-09-20 2009-03-26 National University Corporation University Of Toyama 信号解析方法、信号解析装置、及び信号解析プログラム
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
ATE456908T1 (de) * 2007-11-12 2010-02-15 Harman Becker Automotive Sys Mischung von ersten und zweiten tonsignalen
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
US8000487B2 (en) * 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR20100008749A (ko) * 2008-07-16 2010-01-26 삼성전자주식회사 스위칭 파워 증폭 장치 및 그 제어 방법
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
PL4231290T3 (pl) * 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
CN101430882B (zh) * 2008-12-22 2012-11-28 无锡中星微电子有限公司 一种抑制风噪声的方法及装置
PL3598447T3 (pl) * 2009-01-16 2022-02-14 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
AU2010206911B2 (en) * 2009-01-20 2013-08-01 Med-El Elektromedizinische Geraete Gmbh High accuracy tonotopic and periodic coding with enhanced harmonic resolution
BR122019023713B1 (pt) * 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
CA3107567C (en) * 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
US8526650B2 (en) * 2009-05-06 2013-09-03 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
TWI556227B (zh) * 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8971551B2 (en) * 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
EP3352168B1 (en) * 2009-06-23 2020-09-16 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
EP2491556B1 (en) * 2009-10-20 2024-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, corresponding method and computer program
AU2010309894B2 (en) * 2009-10-20 2014-03-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and CELP coding adapted therefore
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5844266B2 (ja) * 2009-10-21 2016-01-13 ドルビー・インターナショナル・アクチボラゲットDolby International Ab 適応オーバーサンプリングを用いる高周波数オーディオ信号を発生させるための装置および方法
BR112012014856B1 (pt) * 2009-12-16 2022-10-18 Dolby International Ab Método para fundir conjuntos de fonte de parâmetros de sbr a conjuntos-alvo de parâmetros de sbr, meio de armazenamento não transitório e unidade de fusão de parâmetros de sbr

Also Published As

Publication number Publication date
CN102576541A (zh) 2012-07-11
RU2494478C1 (ru) 2013-09-27
CN103559889B (zh) 2017-05-24
CN103559890B (zh) 2017-05-24
US20120195442A1 (en) 2012-08-02
EP2800094A1 (en) 2014-11-05
US8886346B2 (en) 2014-11-11
US10947594B2 (en) 2021-03-16
US10584386B2 (en) 2020-03-10
EP2800094B1 (en) 2017-11-22
KR20120054083A (ko) 2012-05-29
EP3723090A1 (en) 2020-10-14
EP2491557B1 (en) 2014-07-30
JP5345737B2 (ja) 2013-11-20
EP2491557A1 (en) 2012-08-29
EP4152320B1 (en) 2023-10-18
EP3998606B8 (en) 2022-12-07
ES2507165T3 (es) 2014-10-14
JP2013257591A (ja) 2013-12-26
EP4276823A2 (en) 2023-11-15
PL3998606T3 (pl) 2023-03-06
HK1198561A1 (en) 2015-05-15
PL4152320T3 (pl) 2024-02-19
BR112012009375A2 (pt) 2016-06-07
US9830928B2 (en) 2017-11-28
JP2015018273A (ja) 2015-01-29
KR101309671B1 (ko) 2013-09-23
BR112012009375B1 (pt) 2020-09-24
US20190119753A1 (en) 2019-04-25
JP2013506148A (ja) 2013-02-21
ES2906085T3 (es) 2022-04-13
PL3291231T3 (pl) 2020-09-21
US20180047411A1 (en) 2018-02-15
EP3291231A1 (en) 2018-03-07
EP3723090B1 (en) 2021-12-15
HK1168189A1 (en) 2012-12-21
US10186280B2 (en) 2019-01-22
US20200270696A1 (en) 2020-08-27
JP5613802B2 (ja) 2014-10-29
WO2011047887A8 (en) 2011-06-23
US11591657B2 (en) 2023-02-28
EP4152320A1 (en) 2023-03-22
ES2805349T3 (es) 2021-02-11
US20230160015A1 (en) 2023-05-25
JP5950974B2 (ja) 2016-07-13
US20210269880A1 (en) 2021-09-02
CN102576541B (zh) 2013-09-18
PL3723090T3 (pl) 2022-03-21
EP3998606A1 (en) 2022-05-18
US20150058025A1 (en) 2015-02-26
EP4276823A3 (en) 2023-12-20
CN103559890A (zh) 2014-02-05
BR122020007866B1 (pt) 2021-06-01
US9384750B2 (en) 2016-07-05
EP3998606B1 (en) 2022-11-02
PL2800094T3 (pl) 2018-03-30
ES2963061T3 (es) 2024-03-25
CN103559889A (zh) 2014-02-05
EP3291231B1 (en) 2020-06-10
ES2656668T3 (es) 2018-02-28
WO2011047887A1 (en) 2011-04-28
US20160275965A1 (en) 2016-09-22

Similar Documents

Publication Publication Date Title
ES2936307T3 (es) Sobremuestreo en un banco de filtros de reemisor combinado
ES2930054T3 (es) Transposición armónica mejorada