ES2755489T3 - Métodos de extensión de transformadas de frecuencia para resolver características en el dominio espaciotemporal - Google Patents

Métodos de extensión de transformadas de frecuencia para resolver características en el dominio espaciotemporal Download PDF

Info

Publication number
ES2755489T3
ES2755489T3 ES16715447T ES16715447T ES2755489T3 ES 2755489 T3 ES2755489 T3 ES 2755489T3 ES 16715447 T ES16715447 T ES 16715447T ES 16715447 T ES16715447 T ES 16715447T ES 2755489 T3 ES2755489 T3 ES 2755489T3
Authority
ES
Spain
Prior art keywords
frequency
time
signal
transform
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16715447T
Other languages
English (en)
Inventor
Stephan M Bernsee
Denis Gökdag
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zynaptiq GmbH
Original Assignee
Zynaptiq GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zynaptiq GmbH filed Critical Zynaptiq GmbH
Application granted granted Critical
Publication of ES2755489T3 publication Critical patent/ES2755489T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R23/00Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
    • G01R23/16Spectrum analysis; Fourier analysis
    • G01R23/165Spectrum analysis; Fourier analysis using filters
    • G01R23/167Spectrum analysis; Fourier analysis using filters with digital filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms

Landscapes

  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Complex Calculations (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

Un método (600) implementado en un sistema informático para procesar una señal electromagnética digitalizada para identificar características de señal no deseadas que comprende generar por medio de un microprocesador configurado de forma particular una representación de tiempo - frecuencia modificada de una señal de entrada al recibir la señal de entrada (602) como una pluralidad de tramas de transformada en un dominio del tiempo (604) en el microprocesador, en donde cada trama de transformada incluye una pluralidad de muestras de señal; transformar cada trama de transformada de la señal de entrada a un dominio de la frecuencia usando una transformada de frecuencia (606); caracterizada adicionalmente la etapa de generación por introducir una dimensión de tiempo en la transformada de frecuencia para generar ondas parciales periódicas de frecuencia constante y de magnitud constante para cada banda de frecuencia de la transformada de frecuencia de la señal de entrada para cada una de las tramas de transformada (608) para formar una representación de tiempo - frecuencia para cada trama de transformada; aplicar un filtro de alisado a la representación de tiempo - frecuencia para introducir una sincronización entre las ondas parciales periódicas de bandas de frecuencia adyacentes y para generar una representación de tiempo - frecuencia alisada que incluye paquetes de ondas no periódicas a través de las bandas de frecuencia convertidas a partir de las ondas parciales periódicas por la sincronización (612), en donde las características de señal no deseadas se amplían en bandas de frecuencia correspondientes de la representación de tiempo - frecuencia alisada para cada muestra de señal en la que tuvieron lugar las características de señal no deseadas en la señal de entrada en el dominio del tiempo; y formular valores de tiempo - frecuencia a partir de los paquetes de ondas no periódicas para cada banda de frecuencia en cada muestra de señal (616); y emitir para su almacenamiento en un dispositivo de memoria acoplado con el microprocesador o visualizar en un dispositivo de visualización dentro del sistema informático, o ambos, los valores de tiempo - frecuencia o representaciones de los mismos, o ambos, que identifican las características de señal no deseadas en muestras de tiempo discretas (620).

Description

DESCRIPCIÓN
Métodos de extensión de transformadas de frecuencia para resolver características en el dominio espaciotemporal
Campo
La presente divulgación se dirige al procesamiento de señal y, más en concreto, algunas realizaciones se refieren a la transformada de frecuencia y modificación de señales en el dominio del tiempo, así como aplicaciones al análisis, modificación y síntesis de señales de audio.
Antecedentes
Diversas transformadas de frecuencia, incluyendo la Transformada Rápida de Fourier (FFT) y algoritmos de transformada relacionados, tales como los métodos de transformada de seno y de coseno, transformada Rápida de Fourier dispersa, transformada de Hartley, o Análisis de Señal de Mínimos Cuadrados (LSSA), se basan generalmente en representaciones sinusoidales de una señal electromagnética espaciotemporal. Por ejemplo, las transformadas de frecuencia se han empleado en el pasado para transformar una señal de entrada digitalizada en el dominio del tiempo en frecuencias de componente en el dominio de la frecuencia. Entonces, las frecuencias de componente se pueden visualizar o modificar, de tal forma que una porción de la señal de entrada se puede suprimir, potenciar o cambiar, o se pueden generar señales nuevas. No obstante, la conversión convencional al dominio de la frecuencia excluye un acceso simultáneo a información estructural de la señal de entrada en el dominio del tiempo.
Cuando se expresa una señal en el dominio de la frecuencia como una suma de ondas periódicas tales como sinusoides, la resolución de frecuencia y la resolución de tiempo son propiedades recíprocas, un hecho que a menudo se compara con los efectos del principio de incertidumbre de Heisenberg en física, y también denominado habitualmente el principio de incertidumbre de Heisenberg en el procesamiento de señal. El número de mediciones en el dominio del tiempo de duración uniforme ("muestras") o el número de mediciones de frecuencia de ancho de banda uniforme en la transformada de frecuencia ("contenedores") determina tanto la resolución de frecuencia como la resolución de tiempo dentro del intervalo de análisis. No se pueden obtener de forma simultánea una resolución de frecuencia alta y una resolución de tiempo alta. Por ejemplo, cuando el número de mediciones en el dominio del tiempo incluidas en un análisis es alto, la transformada de frecuencia es relativamente grande. A la inversa, cuando el número de mediciones en el dominio del tiempo es bajo, la transformada de frecuencia es relativamente pequeña. La representación en el dominio de la frecuencia resultante de la señal es un promedio a través de la totalidad del intervalo de análisis. Por lo tanto, las transformadas grandes pueden dar como resultado una resolución de frecuencia buena, pero una resolución de tiempo pobre. A la inversa, las transformadas pequeñas pueden proporcionar una resolución de tiempo buena, pero pueden sacrificar la resolución de frecuencia. El principio de incertidumbre limita la utilidad de las transformadas de frecuencia para analizar señales que están localizadas en el tiempo, notablemente transitorios, o cualquier señal de medida finita.
Sigue existiendo la necesidad de desarrollar métodos para proporcionar de forma simultánea una resolución alta tanto en el dominio de la frecuencia como en el dominio espaciotemporal.
Sumario
Como se ha hecho notar, los métodos de procesamiento de señal son limitados en su capacidad de proporcionar representaciones en el dominio de la frecuencia "precisas en cuanto a las muestras" de una señal electromagnética para el análisis. "Preciso en cuanto a las muestras" quiere decir que la distribución de frecuencia para una muestra de señal particular o discreta (es decir, para un incremento de una sola vez en la trama de transformada) se encuentra tan cerca de la magnitud y fase de frecuencia real de las frecuencias que muestra energía en esa instancia particular de tiempo a medida que la señal se propaga en el dominio del tiempo. En realidad, cuando la trama de tiempo capturada de la señal se digitaliza y se transforma por algoritmos matemáticos al dominio de la frecuencia, la distribución de frecuencia se promedia a través de todos los incrementos de muestra del dominio del tiempo. Por lo tanto, el análisis de frecuencia resultante no es preciso en cuanto a las muestras cuando se usa un método de transformada de Fourier convencional. El proceso divulgado en el presente documento procesa la señal digitalizada de una forma tal que las distribuciones de frecuencia en el dominio de la frecuencia están vinculadas a cada una de las muestras discretas en la trama en lugar de promedios a lo largo de la totalidad de la trama.
Este resultado preciso en cuanto a las muestras se logra mediante la creación de una extensión de matriz de tiempo - frecuencia después de que la señal de entrada se haya transformado del dominio del tiempo al dominio de la frecuencia. Se usan entonces algoritmos de alisado para crear un acoplamiento de fase de frecuencia cruzada entre contenedores de frecuencia adyacentes a través de la totalidad de la trama. Tienen lugar amplificaciones y cancelaciones locales de tal forma que se revelan sucesos que tienen lugar de forma síncrona a través de varias frecuencias en una muestra de tiempo particular que proporciona una resolución de frecuencia específica de cada muestra de tiempo en la trama. La edición de señal se puede realizar en el dominio de tiempo - frecuencia creado de este modo para proporcionar una manipulación de frecuencia particular a un intervalo de muestra (es decir, análisis y edición preciso en cuanto a las muestras).
En una implementación, un método para procesar una señal electromagnética para identificar características de señal no deseadas en muestras de señal discretas incluye las siguientes operaciones. Un microprocesador configurado de forma particular genera una representación de tiempo - frecuencia de una señal de entrada. Esto se logra al recibir en primer lugar la señal de entrada como una pluralidad de tramas de transformada en un
El artículo "Blocking artifacts in speech/audio: Dynamic auditory model-based characterization and optimal timefrequency smoothing' de C. S. Seelamantula y col. expone que las técnicas de superposición y adición (OLA) convencionales suprimen los artefactos por efecto de bloques (tales como sonidos de chasquido en las fronteras de trama) en el procesamiento de audio/velocidad, pero aumenta la carga computacional. El artículo revisa algunos aspectos de los artefactos por efecto de bloques tales como alisado de tiempo - frecuencia y supresión de los artefactos por efecto de bloques. En un aspecto, se toma una transformada rápida de Fourier (FFT) de segmentos no superpuestos de audio y se aplica un alisado a los coeficientes generados por la FFT con el fin de eliminar los problemas que tienen lugar debido a la falta de superposición.
dominio del tiempo, en donde cada trama de transformada incluye una pluralidad de muestras de señal que se corresponden con instancias de tiempo discretas a través de cada trama de transformada. Cada trama de transformada se convierte entonces a un dominio de la frecuencia usando una transformada de frecuencia, en donde la señal de entrada se representa sobre una cuadrícula de bandas de frecuencia mediante mediciones de fase y magnitud para cada banda de frecuencia. A continuación, las matrices se formulan con un eje de frecuencia y un eje de tiempo que contienen ondas sinusoidales que se corresponden con partes real e imaginaria de la información de frecuencia, magnitud y fase a través de cada trama de transformada, en donde cada onda sinusoidal contiene N muestras en el dominio del tiempo de la señal de entrada. Un filtro de alisado se aplica a lo largo del eje de frecuencia de las matrices para introducir una sincronización entre regiones de frecuencia adyacentes para cada muestra de señal discreta para alisar las matrices a lo largo del eje de frecuencia, de tal forma que las energías de las ondas a partir de las regiones de frecuencia adyacentes se filtran una en otra. Por lo tanto, las características de señal no deseadas se amplían en bandas de frecuencia correspondientes de la representación de tiempo - frecuencia alisada para cada instancia de tiempo en la que tuvieron lugar las características de señal no deseadas en la señal de entrada en el dominio del tiempo. Entonces las magnitudes y fases de tiempo - frecuencia se formulan a partir de las matrices alisadas. Los valores o representaciones, o ambos, de las magnitudes y fases de tiempo - frecuencia que resaltan características de señal no deseadas en bandas de frecuencia individuales para muestras de señal discretas se emiten para su almacenamiento en un dispositivo de memoria acoplado con el microprocesador o se visualizan en un dispositivo de visualización acoplado con el microprocesador.
Además, las magnitudes de tiempo - frecuencia se pueden modificar por medio del microprocesador, que puede adicionalmente transformar inversamente las magnitudes y fases de tiempo - frecuencia modificadas a una representación en el dominio del tiempo modificada de la señal de entrada. La representación en el dominio del tiempo modificada creada de este modo se puede emitir a partir del microprocesador. Las magnitudes de tiempo - frecuencia pueden indicar una señal no deseada en la magnitud de tiempo - frecuencia modificada. La magnitud o fase, o ambas, de la señal no deseada se pueden alterar como parte del proceso de modificación o bien a través de una entrada de usuario o bien por medio de un proceso de detección de patrones automática.
En otra realización, un método para procesar una señal electromagnética digitalizada para identificar características de señal no deseadas se implementa en un sistema informático. Un microprocesador configurado de forma particular genera una representación de tiempo - frecuencia modificada de una señal de entrada al realizar las siguientes operaciones. La señal de entrada se recibe como una pluralidad de tramas de transformada en un dominio del tiempo en el microprocesador, en donde cada trama de transformada incluye una pluralidad de muestras de señal. Cada trama de transformada de la señal de entrada se transforma a un dominio de la frecuencia usando una transformada de frecuencia. Se introduce una dimensión de tiempo en la transformada de frecuencia para generar ondas parciales periódicas de frecuencia constante y de magnitud constante para cada banda de frecuencia de la transformada de frecuencia de la señal de entrada para cada una de las tramas de transformada para formar una representación de tiempo - frecuencia para cada trama de transformada. Un filtro de alisado se aplica a la representación de tiempo - frecuencia para introducir una sincronización entre las ondas parciales periódicas de bandas de frecuencia adyacentes y para generar una representación de tiempo - frecuencia alisada que incluye paquetes de ondas no periódicas a través de las bandas de frecuencia convertidas a partir de las ondas parciales periódicas por la sincronización. Las características de señal no deseadas se amplían en bandas de frecuencia correspondientes de la representación de tiempo - frecuencia alisada para cada muestra de señal en la que tuvieron lugar las características de señal no deseadas en la señal de entrada en el dominio del tiempo. Los valores de tiempo - frecuencia se formulan a partir de los paquetes de ondas no periódicas para cada banda de frecuencia en cada muestra de señal. Los valores de tiempo - frecuencia o representaciones de los mismos, o ambos, que identifican las características de señal no deseadas en muestras de tiempo discretas se pueden visualizar entonces en un dispositivo de visualización dentro del sistema informático. Los valores de tiempo - frecuencia se pueden editar adicionalmente para modificar características de señal no deseadas en la representación de tiempo - frecuencia alisada. Una señal en el dominio del tiempo modificada de los valores de tiempo - frecuencia editados se puede generar por medio del microprocesador y visualizarse adicionalmente como una representación en un dispositivo de visualización.
En una realización adicional, un medio de almacenamiento legible por ordenador no transitorio contiene instrucciones para crear una instancia de un ordenador de propósito especial para procesar una señal electromagnética digitalizada para eliminar características de señal no deseadas de la señal electromagnética. Las instrucciones implementan un proceso informático que comprende las siguientes etapas. Se recibe la señal de entrada que comprende una pluralidad de tramas de transformada en un dominio del tiempo. La señal de entrada se transforma a un dominio de la frecuencia usando una transformada de frecuencia. Se generan matrices de tiempo - frecuencia que se corresponden con tramas de transformada respectivas a partir de la transformada de frecuencia que contienen funciones de base de la transformada de frecuencia ajustada para magnitudes y fases de transformada respectivas. Las matrices de tiempo - frecuencia tienen una primera dimensión de tiempo en instancias de tiempo de muestra t y una segunda dimensión de frecuencia en contenedores de ancho de banda k para cada trama de transformada. Un algoritmo de procesamiento de acoplamiento de fase de frecuencia cruzada se puede aplicar entre frecuencias adyacentes para introducir una sincronización entre las frecuencias adyacentes y para generar matrices de tiempo - frecuencia alisadas. Las características de señal no deseadas se amplían en contenedores de ancho de banda k correspondientes de las matrices de tiempo - frecuencia alisadas para cada muestra de tiempo t en la que tuvieron lugar las características de señal no deseadas en la señal de entrada en el dominio del tiempo. Los valores de tiempo - frecuencia o representaciones de los mismos, o ambos, a partir de las matrices de tiempo - frecuencia alisadas que identifican las características de señal no deseadas para las muestras de tiempo t relevantes se pueden emitir para su almacenamiento o para su visualización en un dispositivo de visualización. Las matrices de tiempo - frecuencia modificadas pueden ser adicionalmente a partir de las magnitudes y fases variables en el tiempo modificadas. Una señal en el dominio del tiempo modificada de la señal de entrada se puede generar a partir de las matrices de tiempo - frecuencia modificadas que reflejan ediciones en las características de señal no deseadas. La señal en el dominio del tiempo modificada se puede emitir adicionalmente para su almacenamiento o para su visualización en un dispositivo de visualización.
Algunas realizaciones y características adiciones se exponen en parte en la descripción que sigue y se harán evidentes a los expertos en la materia tras el examen de la memoria descriptiva o se pueden aprender mediante la práctica de la materia objeto divulgada. Una comprensión adicional de la naturaleza y ventajas de la presente divulgación se puede lograr por referencia a las porciones restantes de la memoria descriptiva y los dibujos, lo que forma parte de la presente divulgación.
Breve descripción de los dibujos
La descripción se entenderá más plenamente con referencia a las siguientes figuras y gráficos de datos, que se presentan como diversas realizaciones de la divulgación y no se deberían interpretar como una exposición completa del alcance de la divulgación, en donde:
La figura 1 ilustra un procedimiento de Transformada de Fourier de Tiempo Corto (STFT) convencional para analizar y reconstruir una señal.
La figura 2 ilustra una señal de entrada de acuerdo con algunas realizaciones de la presente divulgación.
La figura 3 ilustra una transformada de frecuencia de la señal de entrada de la figura 2 como se representa por sus magnitudes de FFT.
La figura 4A ilustra una primera componente de tiempo o contenido espectral de la señal de entrada de la figura 2. La figura 4B ilustra una segunda componente de tiempo o contenido espectral de la señal de entrada de la figura 2.
La figura 4C ilustra una tercera componente de tiempo o contenido espectral de la señal de entrada de la figura 2. La figura 4D ilustra una cuarta componente de tiempo o contenido espectral de la señal de entrada de la figura 2. La figura 5A ilustra las magnitudes de la transformada de frecuencia de la primera componente de tiempo de la señal de entrada de la figura 2.
La figura 5B ilustra las magnitudes de la transformada de frecuencia de la segunda componente de tiempo de la señal de entrada de la figura 2.
La figura 5C ilustra las magnitudes de la transformada de frecuencia de la tercera componente de tiempo de la señal de entrada de la figura 2.
La figura 5D ilustra las magnitudes de la transformada de frecuencia de la cuarta componente de tiempo de la señal de entrada de la figura 2.
La figura 6 es un diagrama de flujo que detalla un proceso ilustrativo para transformar una señal del dominio del tiempo al dominio de tiempo - frecuencia para una edición espectral de acuerdo con algunas realizaciones de la presente divulgación.
La figura 7 ilustra una transformada de frecuencia convencional con magnitudes extendidas para todos los instantes de tiempo dentro de una trama de transformada única.
La figura 8 ilustra la transformada de incertidumbre reducida de la señal de entrada de la figura 2 con un parámetro de localización de tiempo - frecuencia local A igual a 0,7 de acuerdo con algunas realizaciones de la presente divulgación.
La figura 9 ilustra la transformada de incertidumbre reducida de la señal de entrada de la figura 2 con un parámetro de localización de tiempo - frecuencia local adaptativo A de acuerdo con algunas realizaciones de la presente divulgación.
La figura 10 ilustra la parte de valor real de una señal de fluctuación en el dominio del tiempo después de una transformada de frecuencia y después de la extensión de matriz de frecuencia a tiempo - frecuencia para una trama de transformada única de acuerdo con algunas realizaciones de la presente divulgación.
La figura 11 ilustra la parte de valor real de una señal de fluctuación en el dominio del tiempo después de una transformada de frecuencia y después de la extensión de matriz de frecuencia a tiempo - frecuencia con alisado exponencial a lo largo del eje de los contenedores de frecuencia k de acuerdo con algunas realizaciones de la presente divulgación.
La figura 12 ilustra la magnitud de la figura 11 de acuerdo con algunas realizaciones de la presente divulgación como se obtiene de la matriz tanto real como imaginaria
La figura 13 ilustra una comparación entre una secuencia de STFT visualmente similar (parte superior), en donde N = 256 y la resolución por contenedor es 172,26 Hz a una tasa de muestras (SR) de 44,1 kHz, y una transformada de incertidumbre reducida adaptativa (parte inferior), en donde N = 4096 y la resolución por contenedor es 10,77 Hz a una SR de 44,1 kHz, de acuerdo con algunas realizaciones de la presente divulgación.
La figura 14 ilustra una comparación entre una secuencia de STFT de resolución de tiempo alta (parte superior), en donde N = 32 y la resolución por contenedor es 1378,13 Hz a una SR de 44,1 kHz, y una transformada de incertidumbre reducida adaptativa (parte inferior), en donde N = 4096 y la resolución por contenedor es 10,77 Hz a una SR de 44,1 kHz, de acuerdo con algunas realizaciones de la presente divulgación.
La figura 15 ilustra una comparación entre una secuencia de STFT del mismo tamaño (parte superior) y una transformada de incertidumbre reducida adaptativa (parte inferior), en donde N = 4096 y ambas transformadas tienen una resolución de 10,77 Hz por contenedor a una SR de 44,1 kHz, de acuerdo con algunas realizaciones de la presente divulgación.
La figura 16A es un diagrama esquemático de un sistema informático de propósito especial particularmente configurado para procesar y modificar una señal de entrada de acuerdo con algunas realizaciones de la presente divulgación.
La figura 16B es un diagrama de sistema simplificado para un dispositivo de procesamiento para modificar una señal de entrada de acuerdo con algunas realizaciones de la presente divulgación.
La figura 17 es una ilustración ilustrativa de un método de procesamiento de la técnica anterior para transformar una señal del dominio del tiempo al dominio de la frecuencia para una edición espectral.
La figura 18 es una ilustración ilustrativa de un método de división en ventanas de superposición de STFT de la técnica anterior para transformar una señal del dominio del tiempo al dominio de la frecuencia para una edición espectral.
La figura 19 es una ilustración ilustrativa de un entorno de herramientas de edición espectral de la técnica anterior para editar o modificar una señal transformada al dominio de la frecuencia
La figura 20 es una ilustración ilustrativa de un método de procesamiento para transformar una señal del dominio del tiempo al dominio de tiempo - frecuencia para una edición espectral de acuerdo con algunas realizaciones de la presente divulgación.
Descripción detallada
La presente divulgación se puede entender por referencia a la siguiente descripción detallada, tomada junto con los dibujos como se describe posteriormente. Se hace notar que, para fines de claridad en la ilustración, determinados elementos en diversos dibujos pueden no estar dibujados a escala.
La presente divulgación proporciona un método de procesamiento de señal digital para una transformada de incertidumbre de Heisenberg reducida, lo que introduce una dimensión de tiempo de intratrama en la salida de las transformadas de frecuencia, creando eficazmente de ese modo una matriz de transformadas de frecuencia para cada una de las mediciones en el dominio del tiempo. En el análisis de frecuencia de las señales electromagnéticas, se hace referencia a una multitud de mediciones en el dominio del tiempo que experimentan un análisis de frecuencia simultáneo como "trama de transformada". Una señal de entrada puede incluir N mediciones en el dominio del tiempo por trama de transformada, en donde N es el tamaño de transformada. En concreto, la dimensión de tiempo de intratrama se añade a la salida de una única Transformada Rápida de Fourier (FFT) o cualquier otra transformada de frecuencia, o bien al unísono o bien como parte de una secuencia de Transformada de Fourier de Tiempo Corto (STFT) de tramas de transformada, lo que se analizará con respecto a la figura 1 posterior.
El principio de incertidumbre de Heisenberg rige la resolución de tiempo y la resolución de frecuencia de la transformada de frecuencia convencional. Los efectos del principio de incertidumbre sobre la resolución se pueden mitigar mediante el uso de un acoplamiento de fase de frecuencia cruzada (CFPC) a lo largo de una representación en el dominio de la frecuencia muy redundante. El CFPC puede usar un valor invariante con la señal, un parámetro de localización de tiempo - frecuencia local A o un A adaptativo que varía con las propiedades de la señal, y/o la ubicación de tiempo y frecuencia. Mediante la aplicación de un postprocesamiento de la transformada de frecuencia de la señal de entrada, se puede revelar información estructural de intratrama que está oculta en las transformadas de frecuencia convencionales. El presente método usa un CFPC de la misma ubicación para introducir una sincronización entre diferentes regiones de frecuencia. En concreto, mediante la creación explícita de una agrupación de sinusoides de valor complejo que se corresponden con las frecuencias, fases y magnitudes de la transformada de frecuencia para todos los instantes de tiempo muestreados t dentro de una trama de transformada y la aplicación de CFPC entre frecuencias adyacentes, el presente método puede soslayar el principio de incertidumbre, y proporcionar una estimada de magnitudes y fases instantáneas para todos los instantes de tiempo t dentro de una trama de transformada.
El presente método proporciona una extensión computacional en la salida de una transformada de frecuencia para crear una matriz de transformada de tiempo - frecuencia mediante la adición de una dimensión de tiempo. Los coeficientes de transformada de la matriz pueden incluir partes real e imaginaria de una exponencial o sinusoide compleja a cada frecuencia, u otras funciones de base adecuadas dentro de la trama de transformada analizada.
El presente método proporciona una resolución de tiempo de intratrama, que se controla independientemente de la resolución de frecuencia. La resolución de frecuencia depende del tamaño de la transformada, mientras que la localización en el tiempo o la resolución de tiempo no depende del tamaño de la transformada. En su lugar, la resolución de tiempo depende de un factor de alisado o un parámetro de localización de tiempo - frecuencia local A, que o bien se puede elegir manualmente, o bien se puede determinar adaptativamente basándose en criterios locales o en propiedades de señal.
El presente método elimina la necesidad y los efectos de una función de apodización ("división en ventanas") que se usa habitualmente para minimizar la filtración espectral en el método de STFT descrito posteriormente. La figura 1 ilustra un procedimiento de STFT convencional para analizar y reconstruir una señal electromagnética en el dominio del tiempo digitalizada. Una secuencia de FFT, denominada a menudo Transformada de Fourier de Tiempo Corto o STFT, se usa habitualmente para dividir una señal en fragmentos superpuestos de datos en el dominio del tiempo y transformar cada fragmento consecutivamente. Como se muestra, mediante el uso de las ventanas superpuestas 104, una señal de entrada 102 en un dominio del tiempo se divide habitualmente en segmentos divididos en ventanas originales 106 que se superponen parcialmente con los segmentos divididos en ventanas vecinos. Los segmentos divididos en ventanas 106 se denominan a menudo "tramas de transformada". La STFT se superpone a menudo con las ventanas durante al menos la mitad del ancho de ventana. La STFT requiere una superposición grande con el fin de conservar la totalidad de las componentes en la señal.
Cada trama de transformada incluye una multitud de mediciones en el dominio del tiempo. Entonces, se aplica una FFT a cada trama de transformada 106 para generar un segmento de espectro de frecuencia 108, que se puede usar entonces para una manipulación espectral para generar segmentos de espectro modificados 110. Por ejemplo, el segmento de espectro de frecuencia 108 se puede cambiar a segmentos de espectro modificados, de tal forma que una porción de la señal de entrada se puede suprimir, potenciar, cambiar o pueden generarse componentes nuevas. Cada segmento de espectro de frecuencia 108 proporciona una "trama congelada", es decir, una vista espectral promediada del segmento dividido en ventanas 106. Después de la manipulación espectral, cada segmento de espectro modificado 110 se transforma inversamente a los segmentos de ventana modificados 112, que se pueden modificar a partir de los segmentos divididos en ventanas originales 106. Una señal reconstruida 114 se puede obtener mediante la adición de los segmentos divididos en ventanas modificados 112.
El principio de incertidumbre se mantiene en vigor para cada uno de los segmentos divididos en ventanas 106, de tal forma que no se pueden obtener de forma simultánea una resolución de tiempo alta y una resolución de frecuencia alta. Se han desarrollado muchas configuraciones de la STFT para realizar una compensación recíproca entre una resolución, o bien la resolución de tiempo o bien la resolución de frecuencia y la resolución en el otro dominio. Por ejemplo, la STFT puede adaptar el tamaño de la transformada a la señal. La STFT también puede dividir la señal en diferentes bandas de frecuencia y usar un tamaño de transformada diferente para cada banda. La STFT puede modular adicionalmente la señal para proporcionar una representación alternativa del contenido de señal. La STFT también puede promediar la salida de transformadas adyacentes en el tiempo o la frecuencia. No obstante, la totalidad de estas implementaciones no reducen los efectos del principio de incertidumbre, sino que, en su lugar, soslayan el principio de incertidumbre al mejorar la resolución en un dominio (por ejemplo, tiempo o frecuencia) al tiempo que sacrifican la resolución en el otro dominio. La transformada de frecuencia tradicional no puede distinguir características localizadas en el tiempo dentro de una trama de transformada.
El enfoque de STFT disemina los cambios temporales en la señal a través de varias tramas de transformada adyacentes, y debido a la pérdida en la localización en el dominio del tiempo da lugar a que una manipulación en el dominio de la frecuencia se aplique a todas las mediciones en el dominio del tiempo dentro del segmento 106/112. Por esta razón, la manipulación de una representación espectral de STFT puede dar como resultado la modificación de más de una medición en el dominio del tiempo única tras la reconstrucción, de tal forma que la STFT no puede lograr una edición de espectro precisa en cuanto a las muestras.
Otros métodos existentes usan la Transformada de Ondícula o de Paquete de Ondículas, Método de Máxima Entropía, Transformadas Ortogonales superpuestas, Transformada de Gabor, o distribuciones de tiempo - frecuencia cuadráticas tales como la Distribución de Wigner-Ville y métodos relacionados para el análisis de tiempo - frecuencia. No obstante, estos métodos introducen grados variables de artefactos, tales como energía negativa, repliegue del espectro y distorsión de términos cruzados, en la señal medida. Estos pueden ser costosos de calcular, y pueden no prever fácilmente una representación físicamente significativa que soporta una modificación directa (tal como magnitud, frecuencia y fase). Asimismo, puede ser difícil invertir estos para dar una señal en el dominio del tiempo modificada tras la modificación del contenido analizado, y puede que los mismos no permitan la misma resolución en el dominio del tiempo que el presente método. Además, la noción de "frecuencia" implica inherentemente sinusoides, por lo que las mismas no están representando en un sentido estricto la señal en el dominio de la frecuencia, lo que hace que la manipulación manual por un usuario sea contraintuitiva
La figura 2 ilustra una señal de entrada de acuerdo con algunas realizaciones de la presente divulgación. En concreto, una señal de entrada 200 se mide en amplitud a lo largo del tiempo. La señal de entrada 200 muestra la amplitud en el dominio del tiempo. La señal de entrada 200 es una señal de prueba conocida en este ejemplo, con el fin de ilustrar cómo funciona el presente método. La señal de entrada 200 puede incluir la primera, la segunda, la tercera y la cuarta componentes de tiempo o contenidos espectrales 402, 404, 406 y 408 como se muestra en las figuras 4A-4D , respectivamente. En el dominio del tiempo, las contribuciones de 402, 404, 406 y 408 son difíciles de distinguir. Como se muestra en la figura 4A, la primera componente de tiempo 402 incluye dos sinusoides de frecuencia constante y de amplitud constante muy juntas. Para los fines de este ejemplo, las señales o características de señal "aberrantes", "irregulares", "transitorias" o por lo demás "no deseadas" están superpuestas a lo largo de las señales sinusoidales de amplitud constante. Tales señales aberrantes pueden ser indicativas de anomalías poco deseables de ruido o transitorias que afectan a la claridad y calidad de la señal de interés. Como alternativa, las señales no deseadas podrían ser meramente una parte de una señal grabada que se desea eliminar. Por ejemplo, en el contexto de una grabación de música, puede ser deseable eliminar el sonido creado por un instrumento particular en un conjunto de sonidos de instrumentos para fines meramente estéticos. Como se muestra en la figura 4b , la segunda componente de tiempo 404 incluye una sinusoide barrida linealmente (fluctuación), cuya frecuencia aumenta a lo largo del tiempo. La tercera componente de tiempo 406 incluye una sinusoide modulada en frecuencia de tiempo corto como se muestra en la figura 4C. La cuarta componente de tiempo 408 incluye un impulso en el dominio del tiempo único, que es una punta, como se muestra en la figura 4D. Si la señal es una señal de audio, la punta puede tener un sonido de chasquido, tal como el sonido introducido por una grabación arañada.
El presente método no requiere múltiples tramas de transformada como el método de STFT, debido a que no proporciona una vista de "trama congelada" del espectro. En su lugar, el presente método proporciona un espectro como una función del tiempo para cada trama de transformada. En algunas realizaciones, para acelerar la velocidad de procesamiento, la señal de entrada 200 se puede dividir en un número de tramas de transformada 202, por ejemplo, teniendo cada trama de transformada una longitud de un número N de muestras en el dominio del tiempo. En una realización ilustrativa, N puede tener una longitud de 4096 muestras en el dominio del tiempo. Estas tramas de transformada 202 pueden tener una superposición pequeña de tal modo que no hay discontinuidad alguna en la frontera entre dos tramas de transformada adyacentes. En algunas realizaciones, la superposición es menor que un 10 %. En algunas realizaciones, la superposición es menor que un 5 %. En algunas realizaciones, la superposición es menor que un 1 %.
La señal de entrada 200 se puede convertir en una señal en el dominio de la frecuencia, lo que se expresa en magnitudes y fases sobre una cuadrícula de contenedores de frecuencia (muestras de frecuencia). La transformada de frecuencia expresa la señal en términos de una suma de sinusoides a diversas frecuencias a lo largo de un intervalo de tiempo de medición dado. Las magnitudes y fases de la transformada de frecuencia se pueden medir o estimarse para determinar la mezcla apropiada que representa la señal en el dominio de la frecuencia. Debido a que las sinusoides son periódicas y solo incluyen frecuencias únicas, las sinusoides distribuyen información estructural con respecto a la evolución de la señal en el tiempo a través de la totalidad del intervalo de análisis, lo que hace imposible señalar el comienzo preciso de los cambios en la señal después de que haya tenido lugar la transformada de frecuencia.
La figura 3 ilustra una transformada de frecuencia de la señal de entrada de la figura 2 como se representa por sus magnitudes de FFT. Como se muestra, la transformada de frecuencia 300 se muestra en el contenedor de amplitud frente a frecuencia k. La transformada de frecuencia 300 puede incluir cuatro componentes de frecuencia 502, 504, 506 y 508 como se muestra en las figuras 5A - 5D que se corresponden con las cuatro componentes de tiempo 402, 404, 406 y 408 de las figuras 4A - 4D, respectivamente. Como se muestra en la figura 5A, una primera componente de frecuencia 502 tiene dos picos de frecuencia estrechos que se corresponden con las dos sinusoides en la primera componente de tiempo 402. Asimismo, una segunda componente de frecuencia 504 tiene una banda de frecuencia ancha que se corresponde con la segunda componente de tiempo 404 o fluctuación (véase la figura 5B). La magnitud de transformada es casi constante a través de todas las frecuencias. Adicionalmente, una tercera componente de frecuencia 506 que se corresponde con la tercera componente de tiempo 406 incluye una señal de magnitudes variables y frecuencias variables dentro de un rango o banda de frecuencia.
Una cuarta componente de frecuencia 508 que se corresponde con la cuarta componente de tiempo 408 tiene una magnitud constante a través de todos los contenedores de frecuencia. Esta tiene una localización máxima en el dominio del tiempo (una medición única) y, por lo tanto, no tiene localización alguna en el dominio de la frecuencia como es indicado por el principio de incertidumbre.
En una realización, cuando las muestras en el dominio del tiempo están separadas no uniformemente, se puede usar un algoritmo de Periodograma de Lomb-Scargle rápido para la transformada de frecuencia. El algoritmo de Periodograma de Lomb-Scargle proporciona un análisis espectral con menos filtración espectral que la FFT, y habitualmente es implementado por el ajuste de mínimos cuadrados de un conjunto de sinusoides de frecuencias diferentes a una señal dada por medio de una combinación de interpolación de Lagrange y FFT. Cuando las muestras en el dominio del tiempo están separadas uniformemente y la velocidad es importante, se puede usar la FFT. Los expertos en la materia apreciarán que también se pueden usar otras transformadas de frecuencia en lugar de la FFT.
Extensión de matriz de frecuencia a tiempo - frecuencia
Un método de procesamiento de señal 600 ilustrativo que utiliza una extensión de matriz de tiempo - frecuencia y alisado, por ejemplo, por medio de un CFPC, para modificar una señal de entrada y eliminar características no deseadas se describe posteriormente con respecto a la figura 6.
El presente método de procesamiento de señal 600 usa una extensión de matriz de frecuencia a tiempo - frecuencia. Una señal de entrada se recibe en primer lugar dentro del sistema de procesamiento. (Etapa 602) Por simplicidad en la siguiente descripción, una señal de entrada se puede asumir como una señal en el dominio del tiempo de valor real f(t), que puede ser transformada en espectros de frecuencia por una FFT. Se selecciona entonces una trama de transformada de una longitud de N muestras a partir de la señal de entrada. (Etapa 604) Una salida de transformada de Fourier discreta Xk se obtiene de la señal en el dominio del tiempo f (t), como se muestra en la ecuación (1), en donde t representa el instante de tiempo, N representa el tamaño de la transformada, y k representa número o contenedor de frecuencia, y 0 < t < N,
Figure imgf000008_0001
Ecuación (1)
en donde f (t) indica una señal de entrada, y Xk indica la transformada de Fourier en el número de frecuencia k. Xk puede ser una señal de valor complejo, que incluye una porción real Re (Xk) y una porción imaginaria Im (Xk). (Etapa 606) La magnitud |Xk| y fase $ (Xk) de transformada de Fourier se obtienen mediante la ecuación (2):
Xk| = VCRe (Xky Im (XkY )
0 (Xk) = arc tan 2 (Im (Xk)/Re (Xk))
Ecuación (2)
en donde arc tan 2 es una función arco tangente de conservación de cuadrante que computa el arco tangente del cociente (Im (Xk) / Re (Xk)). (Etapa 608)
La figura 7 ilustra una transformada de frecuencia convencional con magnitudes extendidas para todos los instantes de tiempo dentro de una trama de transformada única, que puede ser un segmento dividido en ventanas 106 como se muestra en la figura 1. Las magnitudes de transformada de frecuencia 700 ordinarias muestran unas magnitudes de transformada de frecuencia |Xk| en la ecuación (2) a través de un número N de los instantes o ranuras de tiempo o muestras de duración t dentro de la trama de transformada única. Las magnitudes son constantes para cada contenedor de frecuencia k a lo largo de un eje horizontal y son independientes de los instantes de tiempo t a lo largo de un eje vertical. Como se muestra en la figura 7, la transformada de frecuencia convencional da como resultado un espectro de líneas invariante con el tiempo proporcional a las magnitudes |Xk| de la transformada de frecuencia a través de todos los instantes de tiempo t.
La magnitud |Xk| y fase $ (Xk) de transformada resultantes se pueden usar directamente como entradas para la ecuación (3), que representa la extensión de matriz de frecuencia a tiempo - frecuencia. Las matrices de tiempo - frecuencia expandidas, incluyendo una matriz real Matre (t, k) y una matriz imaginaria Matre (t, k), contienen ondas de seno y de coseno. Las matrices crean ondas periódicas parciales individuales para todos los instantes o ranuras de tiempo t. Las matrices de tiempo - frecuencia expandidas lo son a través de todos los instantes de tiempo t y contenedores o números de frecuencia k y se pueden expresar en la ecuación (3) como se muestra posteriormente:
Matre (t, k) = |Xk| c o s (^ p - 0 ( * k))
Matim (t, k) = |Xk| s e n (^ p - <¡>(Xk))
Ecuación (3)
en donde N es habitualmente un número par, en la forma 2m (con unos tamaños típicos m = 10, 11, 12, 13 usados en el procesamiento de audio). (Etapa 610) Las muestras en el dominio del tiempo t son iguales a 0 ... N -1. El contenedor de frecuencia k tiene un número máximo de N / 2 1. Los contenedores de frecuencia se pueden separar a unas frecuencias dadas por k * TasaDeMuestras / N en Hz con el contenedor de frecuencia más bajo centrado en 0 Hz (CC) y el contenedor de frecuencia más alto a la frecuencia de Nyquist (es decir, TasaDeMuestras / 2 en Hz).
Cada una de las matrices tiene N * (N / 2 1) coeficientes de transformada, con una primera dimensión (por ejemplo, las filas) de la matriz que indica el tiempo t de tamaño N, y una segunda dimensión (por ejemplo, las columnas) de la matriz que representa el número de contenedores de frecuencia k de tamaño N / 2 1. En una realización, las matrices tanto Matre (t, k) como Matim (t, k) en la ecuación (3) usan magnitudes de Fourier |Xk| y valores de fase $ (Xk) a partir de la salida de transformada mostrada en la ecuación (2). Cada una de las dos matrices Matre (t, k) y Matim (t, k) incluye N ranuras de que contienen N /2 1 contenedores de frecuencia que se corresponden con cada una de las ondas sinusoidales complejas constituyentes en la señal de entrada f (t). Cada fila t en una matriz contiene una sinusoide que se ha ajustado para la fase de contenedor $ (Xk) y la magnitud de contenedor |Xk| de acuerdo con la salida de la transformada de frecuencia para el contenedor k.
En algunas realizaciones, Matim (t, k) se puede dejar fuera de los cálculos y su contribución se puede obtener a partir de Matre (t, k) a través de redundancia al tomar un desfase de 90°.
En algunas realizaciones, el cálculo de las matrices puede ser implícito. Por ejemplo, las matrices pueden no calcularse, conservando de este modo memoria. Los cómputos requeridos pueden estar contenidos en una fase posterior de la transformada.
En algunas realizaciones, en concreto cuando se usa la FFT, las fases y magnitudes pueden no calcularse explícitamente, sino que se pueden inferir de un coeficiente de transformada real e imaginario para cada número de frecuencia k directamente.
Los expertos en la materia apreciarán que magnitud y fase se usan solo para fines ilustrativos. Muchas transformadas de frecuencia, tales como la transformada de Hartley, no proporcionan fácilmente una parte real y una parte imaginaria.
Los expertos en la materia apreciarán que se pueden usar otras transformadas de frecuencia en lugar de la FFT. La señal de entrada también puede ser una señal de valor complejo, tal como en el procesamiento de señal de RADAR, y se pueden usar frecuencias de transformada tanto negativas como positivas.
Aplicación de acoplamiento de fase de frecuencia cruzada
El presente método también incluye aplicar un CFPC a continuación de la compleción de la frecuencia a la extensión de matriz de tiempo - frecuencia de la ecuación (3). (Etapa 612) El CFPC proporciona filtración (por ejemplo, filtración de energía) a regiones de frecuencia vecinas. Al lograr una filtración entre bandas de frecuencia vecinas, se añade a una frecuencia actual una determinada cantidad de la energía a partir de ondas de frecuencia vecinas. Dicho de otra forma, una cantidad pequeña de magnitudes y fases vecinas puede estar influyendo en la magnitud y fase en la banda actual. En concreto, el CFPC introduce una sincronización entre ondas parciales de bandas de frecuencia adyacentes, debido a que la energía de las ondas se filtra en frecuencias adyacentes. Los picos que se encuentran cerca entre sí en bandas vecinas se pueden sumar durante la sincronización, mientras que los picos que se encuentran cerca de una depresión se pueden cancelar.
La filtración de ondas constituyentes en contenedores vecinos da lugar a que la energía se sume o se cancele, creando en efecto un proceso de sincronización entre columnas de matriz adyacentes, lo que afecta a los picos vecinos. Esto da lugar a que ocurran amplificaciones y cancelaciones de tal forma que se revelan los sucesos que tienen lugar de forma síncrona a través de varias frecuencias. Este efecto de sincronización modifica las sinusoides localmente para abarcar más de una frecuencia única, escapando de ese modo del principio de incertidumbre, revelando información estructural que habitualmente es inaccesible en la transformada de frecuencia convencional.
El CFPC se puede lograr mediante la aplicación de un filtro de alisado o un filtro de promedio móvil a través de Las ondas en contenedores de frecuencia vecinos, tal como un filtro de promedio móvil exponencial, u otros filtros de promedio móvil. El filtro de alisado puede ser un filtro de paso bajo, que deja pasar señales con una frecuencia más baja que una determinada frecuencia de corte y atenúa las señales con frecuencias más altas que la frecuencia de corte. En el procesamiento de señal, el alisado o integración puede tener el efecto de una operación de filtrado de paso bajo, mientras que la agudización o diferenciación puede tener el efecto de una operación de filtrado de paso alto.
Los filtros de paso bajo pueden existir en muchas formas diferentes, incluyendo circuitos electrónicos (tales como un filtro de silbidos usado en audio), filtros antirrepliegue del espectro para acondicionar señales antes de una conversión de analógico a digital, filtros digitales para conjuntos de alisado de datos, borrosidad de imágenes, y así sucesivamente. Los filtros de paso bajo proporcionan una forma más lisa de una señal, eliminando las fluctuaciones a corto plazo y abandonando la tendencia a más largo plazo.
En una realización particular, el filtro de alisado puede ser un filtro de promedio móvil exponencial. Por ejemplo, para cada instante de tiempo t = 0 ... N -1, todos los contenedores k = 0 ... N /2 y las matrices Matre (t, k) y Matim (t, k) se pueden iterar mediante la aplicación del filtro de promedio móvil exponencial como se muestra en la ecuación (4) posterior:
Matre (t, k)' = a Matre (t, k) (1-a) Matre (t, k - 1)'
Matim (t, k)' = a Matim (t, k) (1-a) Matim (t, k - 1)'
Ecuación (4)
en donde Matre (t, k)' y Matim (t, k)' indican los valores de matriz alisada resultantes en la ranura de tiempo t, el contenedor de frecuencia k que se genera después del filtrado de paso bajo o alisado. En esta realización, el factor de alisado a se puede calcular a partir del parámetro de localización de tiempo - frecuencia A como se describe en la ecuación (5).
a = e'°g(A 0,0625) ( £ 12 o < A < 1
Ecuación (5)
En algunas realizaciones, el valor del parámetro de localización de tiempo - frecuencia local A puede variar en proporción a una curva de 1 / frecuencia, de tal forma que se puede obtener una resolución de frecuencia mejor para frecuencias bajas y se puede obtener una resolución de tiempo mejor para frecuencias altas.
En algunas realizaciones, el parámetro de localización de tiempo - frecuencia local A se puede calcular en proporción a una magnitud |Xk|' de un espectro blanqueado, de tal forma que una relación de pico a promedio local alta en la magnitud puede dar lugar a que el parámetro de localización de tiempo - frecuencia local A sea bajo para lograr una resolución de frecuencia alta y una relación de pico a promedio local baja puede dar lugar a que el parámetro de localización de tiempo - frecuencia local A sea alto para lograr una resolución de tiempo alta. La magnitud para el espectro blanqueado es la magnitud promedio cuando el CFPC se aplica a un espectro de ruido blanco.
Si no se creó matriz alguna mediante la ecuación (3), tal como en el método de STFT, el alisado puede incluir todos los cómputos previos requeridos en la ecuación (3). Para lograr una respuesta de fase nula a partir del filtro, uno se puede ejecutar en sentido tanto directo como inverso a través de todos los contenedores de frecuencia.
En algunas realizaciones, el filtro de promedio móvil exponencial puede ser sustituido por un filtro de respuesta a impulsos finitos (FIR) arbitraria, o un filtro de respuesta a impulsos infinitos (IIR) arbitraria.
En algunas realizaciones, el filtro de promedio móvil exponencial puede ser sustituido por un filtro de orden de rango, tal como la media, o un filtro de alisado tal como un filtro de alisado (polinómico) de Savitzky-Golay.
En algunas realizaciones, el filtro de promedio móvil exponencial puede ser sustituido por un filtro adaptativo que determina sus características en el instante o ranura de tiempo t, al tener en cuenta los resultados de las pasadas t -1 ranuras o contenedor de tiempo y frecuencia k.
Realización con A invariante con la Señal
En una realización, el CFPC puede ser logrado por filtrado de paso bajo o alisado a través de contenedores de frecuencia vecinos para cada ranura de tiempo t. El filtrado de paso bajo puede potenciar las áreas en donde los picos en contenedores de frecuencia adyacentes pueden coincidir al sumar la energía a través de todas las ondas parciales en contenedores de frecuencia adyacentes. Un alisado intenso (por ejemplo, alisado por más iteraciones de la ecuación (4)) puede favorecer sucesos localizados en el tiempo, mientras que, para señales con periodicidades puede ser adecuado poco alisado o ausencia de alisado. Por ejemplo, un transitorio abrupto en el dominio del tiempo puede aparecer en muchas ranuras de tiempo t. El alisado puede potenciar adicionalmente esta señal abrupta en el dominio del tiempo. Las ondas periódicas se pueden concentrar a lo largo de los mismos contenedores de frecuencia k a lo largo de un periodo de tiempo. El alisado por un filtrado de paso bajo intenso puede no potenciar las ondas periódicas.
Un usuario puede seleccionar manualmente un valor del parámetro de localización de tiempo - frecuencia local A, y entonces puede ajustar el valor del parámetro de localización de tiempo - frecuencia local A entre cero y uno para lograr la salida deseada. Este método manual puede proporcionar flexibilidad al usuario y también puede llevar menos tiempo que un método de A adaptativo descrito posteriormente. El resultado del enfoque de A invariante con la señal se puede expresar en magnitudes a lo largo de la frecuencia y el tiempo como se representa en la figura 8.
Realización con A adaptativo a la señal
En otra realización, un valor del parámetro de localización de tiempo - frecuencia local A puede ser creado automáticamente por un método de A adaptativo a la señal, que puede usar de forma simultánea valores diferentes para el parámetro de localización de tiempo - frecuencia local A para los cálculos, y entonces puede comparar los diferentes valores del parámetro de localización de tiempo - frecuencia local A para seleccionar una A basándose en determinados criterios. Por ejemplo, un ordenador puede incluir un algoritmo que permite que un procesador en el ordenador realice automáticamente cálculos de la magnitud Aa (t, k) mediante el uso de diversos valores A de forma simultánea, tal como de 0,1 a 0,9 a un incremento de 0,1 como un ejemplo. El algoritmo puede comparar las magnitudes Aa (t, k) resultantes a partir de los diversos valores A y seleccionar el valor A que produce la magnitud más grande o máxima. Como alternativa, se puede usar un cambio iterativo de A que refina una suposición inicial de A hasta que este produce una salida que maximiza la magnitud local en la posición t, k.
En una realización particular, el valor A seleccionado se puede usar para calcular el factor de alisado a, como se muestra en la ecuación (5), y entonces las dos matrices Matre (t, k)' y Matim (t, k)' se pueden obtener de la ecuación (4). La ecuación (6) dada posteriormente muestra que la magnitud Aa (t, k) se puede calcular a partir de las matrices. El algoritmo también puede asignar un valor A seleccionado a las matrices de salida o alisadas Matre (t, k)' y Matim (t, k)' basándose en la energía o magnitud de señal más grande:
Aa (t, k) = ca J ((M a tre( t ,k ) ')2 + ((Matlm( t,k ) ') 2
Ecuación (6)
en donde ca es una constante de normalización que determina la ganancia promedio como una función de A. La constante de normalización se puede obtener de forma heurística a partir de una pasada de prueba cuando el CFPC se aplica a un espectro de ruido blanco con el fin de normalizar la magnitud promedio resultante. La constante de normalización ca se puede obtener empíricamente por adelantado y almacenarse para cada A que se va a evaluar.
Este método de A adaptativo determina automáticamente el mejor valor A de acuerdo con los criterios, por ejemplo, la energía o magnitud de señal más grande. El procesamiento de este método de A adaptativo puede llevar un tiempo más largo en comparación con seleccionar manualmente un valor A. Considerando que los ordenadores se están volviendo cada vez más rápidos con el paso de los años, en la actualidad es factible el enfoque de A adaptativo a la señal. El resultado del enfoque de A adaptativo a la señal se puede expresar en magnitud a lo largo de la frecuencia y el tiempo como se representa en la figura 9.
En algunas realizaciones, una matriz se puede computar en un espacio tridimensional (3D), es decir, el espacio de tiempo - frecuencia-A. La matriz alisada se puede calcular para una cuadrícula muestreada lo bastante densa de los valores del parámetro de localización de tiempo - frecuencia local A a unos incrementos sustancialmente pequeños de valores A. Las rebanadas de magnitud de tiempo - frecuencia bidimensional (2D) resultante a partir de la ecuación (6) se pueden almacenar en otra dimensión de matriz. Esta matriz en 3D puede representar la señal de entrada como una densidad de energía variable a lo largo del espacio y la frecuencia y se puede usar para visualizar y manipular las señales de entrada en el espacio en 3D de acuerdo con su localización en el tiempo o la frecuencia.
Modificación de señales
Una vez que la señal se ha representado en el dominio de tiempo - frecuencia, esta se puede editar fácilmente a una resolución de cada banda de frecuencia así como a lo largo de cada muestra de tiempo individual. (Etapa 614) Debido a que cada frecuencia en el dominio del tiempo tiene una línea espectral correspondiente única en el dominio de tiempo - frecuencia, es fácil manipular, modificar, suprimir o potenciar los contenidos espectrales en un dominio de tiempo - frecuencia para eliminar los ruidos o arañazos en la señal de entrada original. Un usuario puede seleccionar partes de la representación en espectrograma de la señal y modificarlas usando herramientas de selección como se usan en el procesamiento de imagen, o herramientas de selección ayudadas por máquina, o a través de métodos de selección paramétrica basándose en criterios de señal.
En algunas implementaciones ilustrativas, un grupo de frecuencias se puede extraer o bien manual o bien automáticamente mediante la definición de una frontera de forma arbitraria en torno a las frecuencias, a la que también se hace referencia como "región de soporte" (ROS). La región fuera de la ROS se puede suprimir o extraer. En algunas realizaciones, cuando una representación de señal de valor complejo se encuentra disponible en la salida, la señal promedio dentro de la ROS se puede determinar usando una estimación de frecuencia instantánea como se describe en el análisis espectral de Hilbert. En concreto, el presente método se puede usar como una primera fase de una Transformada de Hilbert-Huang en lugar de computar funciones de modo intrínseco, y también se puede usar para computar el espectro de Hilbert como una función de A en lugar de usar la salida de un proceso de Descomposición en Valores Singulares.
Formulación de salida
El método proporciona adicionalmente una representación en el dominio del tiempo modificada de la postedición de señal de entrada. Las matrices alisadas Matre (t, k)' y Matim (t, k)' se pueden calcular al iterar a través de todos los instantes de tiempo t y todos los contenedores de frecuencia k, incluyendo contenedores editados, para formular la respuesta de magnitud y fase variable en el tiempo. (Etapa 616) Las magnitudes |Xt, k| y fases $ (Xt, k) de tiempo - frecuencia se pueden calcular a partir de las matrices alisadas mediante la ecuación (7) como lo siguiente:
|Xt, k| = c^(M atre( t , fe)')2 Matim( t , fe)')2)
0 (Xt, k ) = arc tan 2 (Matm (t, k)'/Matre (t, k)')
Ecuación (7)
en donde arc tan 2 es una función arco tangente de conservación de cuadrante que computa el arco tangente del cociente (Matm (t, k)' / Matre (t, k)'). Basándose en las magnitudes de tiempo - frecuencia |Xt, k| y las fases $ (Xt, k) de los valores de frecuencia editados obtenidos de la ecuación (7), se puede obtener una representación en el dominio del tiempo modificada f (t)' mediante la ecuación (8) (una Transformada de Fourier Discreta Inversa (IDFT)), que es la transformada de tiempo - frecuencia inversa para señales de valor real como se muestra posteriormente:
Figure imgf000012_0001
Ecuación (8)
en donde c es una constante de ajuste a escala que se puede requerir dependiendo de la transformada de frecuencia usada con el fin de mantener el mismo factor de ganancia para la señal. (Etapa 618) Dicho de otra forma, la representación en el dominio del tiempo modificada f(t)' no tiene ganancia o pérdida alguna de amplitud en comparación con la señal de entrada f (t).
Por lo tanto, esta representación en el dominio del tiempo modificada f (t)' puede ser el resultado de manipular los contenidos espectrales de la transformada a lo largo de los ejes de tiempo, frecuencia y magnitud al mismo tiempo. La representación en el dominio del tiempo modificada también puede proporcionar una base para diversas aplicaciones. La representación de transformada modificada se puede emitir para su visualización, para su uso por otro proceso, o usarse directamente para manipular los contenidos espectrales en el dominio del tiempo tal como se muestra en la figura 2, en el dominio de la frecuencia tal como se muestra en la figura 3, o ambos al mismo tiempo mediante la manipulación de la magnitud de tiempo - frecuencia tal como se muestra en la figura 8 o la figura 9. (Etapa 620) Después de visualizar o modificar la representación de transformada de incertidumbre reducida, la señal de salida modificada se obtiene de formas similares al enfoque de STFT, tales como las etapas 110 y 112 mostradas en la figura 1.
La figura 8 ilustra la transformada de incertidumbre reducida de la señal de entrada de la figura 2 con un parámetro de localización de tiempo - frecuencia local A igual a 0,7 de acuerdo con algunas realizaciones de la presente divulgación. Las magnitudes de transformada de tiempo - frecuencia |Xt, k| como se muestran en la ecuación (7) se muestran a lo largo del contenedor de frecuencia k y la ranura de tiempo t con N igual a 4096 (212) en la figura 8. La magnitud de tiempo - frecuencia 800 incluye cuatro componentes características 802, 804, 806 y 808 que se corresponden con cuatro componentes de tiempo, como se muestra en la figura 2. Por ejemplo, un primer contenido espectral (por ejemplo, la línea vertical 802) en un contenedor de frecuencia constante se corresponde con las sinusoides 402 mostradas en la figura 4A. Este es un caso en el que una resolución de frecuencia local es alta.
Un segundo contenido espectral (por ejemplo, la línea diagonal \ 804) se extiende linealmente desde un punto de inicio de la ranura de tiempo más baja de cero y el contenedor de frecuencia más bajo de cero a un punto de fin que tiene la ranura de tiempo más alta de N -1 y el contenedor de frecuencia de N / 2. La línea diagonal 804 se corresponde con la componente de fluctuación 404, como se muestra en la figura 4B.
Un tercer contenido espectral (por ejemplo, la onda sinusoidal de tiempo corto 806) en la ranura de tiempo inicial se corresponde con la señal modulada en frecuencia modulada de tiempo corto 406 como se muestra en la figura 4C. Un cuarto contenido espectral (por ejemplo, la línea horizontal 808) en una ranura de tiempo constante se corresponde con la punta 408 como se muestra en la figura 4D. Este es un caso en el que una resolución de tiempo local es alta.
La extensión de matriz de frecuencia a tiempo - frecuencia permite presentar clara o característicamente las cuatro componentes de tiempo diferentes en la magnitud de transformada de tiempo - frecuencia |Xt, k|, tal como se da en la ecuación (7). En contraposición, sin la extensión de matriz de frecuencia a tiempo - frecuencia, la magnitud de transformada de frecuencia |X k | convencional, tal como se da en la ecuación (2), no puede distinguir las cuatro componentes, como se muestra en la figura 7.
Como se ha ilustrado anteriormente, cada elemento distinto de contenido espectral (por ejemplo, 402, 404, 406 y 408) en el dominio del tiempo (véanse las figuras 4A - 4D) tiene un elemento único correspondiente de contenido espectral (por ejemplo, 802, 804, 806 y 808) en el dominio de magnitud de tiempo - frecuencia (véase la figura 8). Uno de los beneficios de esta correspondencia única entre el dominio del tiempo y el dominio de magnitud de tiempo - frecuencia es permitir una manipulación simultánea de los contenidos espectrales en el dominio de la frecuencia y el dominio del tiempo mediante la aplicación de cambios en el dominio de magnitud de tiempo - frecuencia.
La figura 9 ilustra la transformada de incertidumbre reducida de la señal de entrada de la figura 2 con un parámetro de localización de tiempo - frecuencia local A adaptativo a la señal de acuerdo con algunas realizaciones de la presente divulgación. En este ejemplo, el tamaño de la transformada N es igual a 4096. La magnitud de tiempo - frecuencia |Xt, k| se calcula a partir de la ecuación (7). La magnitud de tiempo - frecuencia |Xt, k| incluye cuatro componentes 902, 904, 906 y 908, que parecen similares a la componente 802, 804, 806 y 808, respectivamente, pero a una resolución mejor que la mostrada en la figura 8. Por ejemplo, la línea horizontal 908 mostrada en la figura 9 es más delgada que la línea horizontal 808 mostrada en la figura 8. Las sinusoides constantes 902 mostradas en la figura 9 aparecen con menos modulación que las sinusoides de frecuencia constante 802 mostradas en la figura 9.
Las figuras 10-12 proporcionan representaciones esquemáticas que ilustran cómo la extensión de matriz de frecuencia a tiempo - frecuencia genera ondas parciales, y cómo el CFPC cambia las ondas parciales de sinusoides periódicas a paquetes de ondas no periódicas para una señal de fluctuación. La figura 10 ilustra la parte de valor real de una señal de fluctuación en el dominio del tiempo después de una transformada de frecuencia y después de la extensión de matriz de frecuencia a tiempo - frecuencia para una trama de transformada única de acuerdo con algunas realizaciones de la presente divulgación. Como se muestra, la señal de fluctuación 1002 en la trama de transformada única se muestra en la parte inferior, mientras que la representación 1000 incluye sinusoides individuales 1004 que se han mostrado anteriormente la señal de fluctuación 1002. Las sinusoides periódicas individuales 1004 se obtienen de la ecuación (3) y cuya frecuencia y magnitud son constantes para cada contenedor de frecuencia a lo largo de la totalidad de la trama de transformada. La representación 1000 no revela información estructural alguna, lo que sugiere que la transformada tradicional no puede determinar características localizadas en el tiempo dentro de la trama de transformada. Este resultado es conforme con el principio de incertidumbre de Heisenberg, que expone que, para una onda periódica, la localización en frecuencia y tiempo son propiedades que solo se pueden determinar con una precisión recíproca.
Cuando se alisa a través del eje vertical, es decir, el eje de los contenedores de frecuencia k, tal como un alisado exponencial o cualquier otro alisado, las ondas vecinas se filtran una en otra, lo que da lugar a que ocurran amplificaciones y cancelaciones. La figura 11 ilustra la parte de valor real de una señal de fluctuación en el dominio del tiempo después de una transformada de frecuencia y después de la extensión de matriz de frecuencia a tiempo - frecuencia con alisado exponencial a lo largo del eje de los contenedores de frecuencia k de acuerdo con algunas realizaciones de la presente divulgación. El alisado cambia las sinusoides periódicas 1004 de la figura 10 a paquetes de ondas no periódicas más complejas 1102. Como se muestra, la representación alisada 1100 incluye una interferencia visible entre ondas 1004 adyacentes en la figura 10 a lo largo de una dirección diagonal 1104, como resultado de un alisado exponencial.
La figura 12 ilustra la magnitud de la figura 11 de acuerdo con algunas realizaciones de la presente divulgación. La representación de magnitud alisada 1200 muestra claramente la energía o magnitud 1202 moviéndose a través del espacio de tiempo - frecuencia.
Las figuras 13-13 proporcionan la comparación del presente método con el método de STFT. La figura 13 ilustra una comparación entre una secuencia de STFT visualmente similar (parte superior), en donde N = 256 y la resolución por contenedor es 172,26 Hz a una tasa de muestras (SR) de 44,1 kHz y una transformada de incertidumbre reducida adaptativa (parte inferior), en donde N = 4096 y la resolución por contenedor es 10,77 Hz a una SR de 44,1 kHz, de acuerdo con algunas realizaciones de la presente divulgación. La representación de STFT 1300A muestra la magnitud |Xk| en un dominio de tiempo - frecuencia en donde el eje horizontal es de tiempo mientras que el eje vertical es de frecuencia. La magnitud |Xk| se obtiene sin matrices en la ecuación (3), pero con filtrado de paso bajo como se muestra en las ecuaciones (4) y (5). La representación de STFT 1300A requiere múltiples tramas de transformada para el cálculo. La representación de STFT 1300A tiene una resolución de frecuencia de 44,1 k H z /256, que es de aproximadamente 172 Hz para cada contenedor de frecuencia a una tasa de muestreo de 44,1kHz.
La representación de incertidumbre reducida 1300B muestra la magnitud |Xt, k| en el dominio de tiempo - frecuencia en donde el eje horizontal es de tiempo mientras que el eje vertical es de frecuencia. La magnitud |Xt, k| se obtiene de la ecuación (7). La representación de incertidumbre reducida 1300B tiene una resolución de frecuencia de 44.1 kHz / 4096, que es de aproximadamente 11 Hz para cada contenedor de frecuencia a una tasa de muestreo de 44.1 kHz. La resolución de tiempo de la componente 1308B es mucho más alta que la resolución de tiempo de la componente 1308A, dando lugar a que 1308B tenga un ancho menor. Como se muestra, las resoluciones del presente método son mucho más altas que el método de STFT. Este ejemplo también muestra que el alisado sin extensión de tiempo a la transformada de frecuencia en la STFT no proporciona de forma simultánea una resolución de frecuencia alta y una resolución de tiempo alta.
La figura 14 ilustra una comparación entre una secuencia de STFT de resolución de tiempo alta (parte superior), en donde N = 32 y la resolución por contenedor es 1378,13 Hz a una SR de 44,1 kHz y una transformada de incertidumbre reducida adaptativa (parte inferior), en donde N = 4096 y la resolución por contenedor es 10,77 Hz a una SR de 44,1 kHz, de acuerdo con algunas realizaciones de la presente divulgación. La representación de STFT 1400A muestra la magnitud |Xk| en un dominio de tiempo - frecuencia. La representación de STFT 1400A (parte superior) proporciona una resolución de tiempo alta, pero una resolución de frecuencia pobre, por ejemplo, una resolución de 1378,13 Hz por contenedor a una Sr de 44,1 kHz. En concreto, la representación de STFt 1400A incluye cuatro componentes 1402A, 1404A, 1406A, y 1408A. Solo la punta 1408A es obvia en 1400A, como 1308B mostrada en la representación de transformada de incertidumbre reducida adaptativa 1300B. Las otras tres componentes 1402A, 1404A, y 1406A se basan, todas ellas, en sinusoides y parecen vagas y poco claras, a diferencia de las componentes 1302B, 1304B y 1306B correspondientes mostradas en la representación de transformada de incertidumbre reducida adaptativa 1300B (parte inferior).
La figura 15 ilustra una comparación entre una secuencia de STFT del mismo tamaño (parte superior) y una transformada de incertidumbre reducida adaptativa (parte inferior), en donde N = 4096 y ambas transformadas tienen una resolución de 10,77 Hz por contenedor a una SR de 44,1 kHz de acuerdo con algunas realizaciones de la presente divulgación. La representación de STFT 1500A muestra la magnitud |Xk| en un dominio de tiempo - frecuencia. La representación de STFT 1500A usa el mismo tamaño o la misma resolución de frecuencia que la transformada de incertidumbre reducida adaptativa y proporciona una resolución de frecuencia alta, pero tiene una resolución de tiempo pobre. En concreto, la representación de STFT 1500A incluye tres componentes 1502A, 1504A, 1506A. La componente 1502A es obvia o tiene una resolución de frecuencia alta. No obstante, no hay punta alguna que se corresponda con 1308B en la representación de STFT 1500A. La resolución de tiempo es muy pobre en la representación de STFT 1500A. En contraposición, la punta 1308B es obvia en la representación de transformada de incertidumbre reducida adaptativa 1300B. Esto indica que la transformada de incertidumbre reducida adaptativa o la transformada de tiempo - frecuencia adaptativa 1300B muestra características en el dominio del tiempo localizadas con una resolución más alta que la transformada de STFT 1500A. Las otras dos componentes 1504A y 1506A también tienen una resolución mucho más pobre que las componentes 1504B y 1506B mostradas en la representación 1500B, respectivamente, de tal forma que las dos componentes 1504A y 1506A tienen una cierta superposición. En contraposición, las componentes 1304B y 1306B no tienen superposición alguna como resultado de una resolución alta tanto en el dominio del tiempo como en el dominio de la frecuencia. Como se ha mostrado anteriormente, la transformada de frecuencia de incertidumbre reducida adaptativa puede tener una resolución alta tanto en el dominio de la frecuencia como en el dominio del tiempo. A la inversa, la transformada de STFT puede proporcionar o bien una resolución de frecuencia alta con una resolución de tiempo pobre o bien una resolución de tiempo alta con una resolución de frecuencia pobre.
Por lo tanto, el presente método se puede usar para una edición espectral precisa en cuanto a las muestras. Las magnitudes y fases de la transformada de tiempo - frecuencia se pueden ajustar para eliminar señales bajando hasta la duración de una muestra en el dominio del tiempo única desde dentro del dominio de tiempo - frecuencia. Este método puede ser útil para eliminar los chasquidos u otras señales muy localizadas en el tiempo. Como un ejemplo de la aplicación, una grabación de música puede tener un arañazo. El arañazo puede producir un sonido de chasquido. El sonido de chasquido puede ser similar a la punta 408 como se muestra en la figura 4D. Mediante el uso de una extensión de matriz de frecuencia a tiempo - frecuencia y un CFPC, el sonido de chasquido generado a partir del arañazo se puede eliminar fácilmente de las magnitudes de transformada antes de calcular la representación en el dominio del tiempo modificada f (t)'. Por ejemplo, suprimir la componente 808 como se muestra en la figura 8 eliminaría el contenido espectral 408 como se muestra en la figura 4D. No obstante, mediante la visualización de la señal en el dominio de tiempo - frecuencia (tal como se muestra en la figura 8 o la figura 9), un usuario puede seleccionar una parte no deseada en la visualización mediante el uso de un ratón para eliminar la parte no deseada. Mediante el procesamiento del sonido a partir de la grabación arañada usando el proceso divulgado, la grabación arañada se vuelve virtualmente libre de arañazos para una audiencia. El proceso transforma virtualmente la grabación arañada en una grabación libre de arañazos. Debido a que cada frecuencia en el dominio del tiempo tiene una línea espectral correspondiente única en el dominio de tiempo - frecuencia, es fácil manipular, modificar, suprimir o potenciar los contenidos espectrales en un dominio de tiempo - frecuencia para eliminar los ruidos o arañazos en la señal de entrada original.
Como se ha ilustrado anteriormente, son posibles una resolución de tiempo alta y una resolución de frecuencia alta al reducir localmente los efectos del principio de incertidumbre que existe para las ondas periódicas. La razón para esto es que el presente método aplica alisado o filtrado de paso bajo para cambiar las ondas parciales individuales de las sinusoides periódicas a paquetes de ondas no periódicas más complejas, desplazando de ese modo la concentración de energía del dominio de la frecuencia al dominio de tiempo - frecuencia. El alisado ayuda a reducir los efectos del principio de incertidumbre en la transformada de frecuencia, debido a que la compensación recíproca de localización original solo es de aplicación a las ondas sinusoidales periódicas, no a los paquetes de ondas no periódicas.
Las transformadas de incertidumbre reducida grandes pueden requerir una memoria y un tiempo de procesamiento considerables cuando se calculan explícitamente. Con la capacidad y velocidad aumentadas de los ordenadores actuales, la memoria y el tiempo de procesamiento no es tanto un problema cuando es necesario mejorar la resolución en el dominio del tiempo. Los cálculos matriciales pueden ser realizados por un ordenador personal u otro dispositivo informático, incluyendo extensiones de CPU de Única Instrucción - Múltiples Datos (SIMD) y Unidades de Procesamiento de Gráficos (GPU). Debido a que la fase de alisado puede operar sobre muestras en el dominio del tiempo sucesivas independientemente, los cálculos se pueden implementar eficientemente usando un procesamiento paralelo, por ejemplo, en una tarjeta de gráficos o en múltiples núcleos de procesador. El método de alisado se puede implementar fácil y eficientemente en un ordenador personal, o bien de escritorio o bien portátil, para postprocesar la transformada de frecuencia de cualquier señal de entrada. En el presente método, el CFPC describe un proceso de sincronización que tiene lugar entre diferentes regiones de frecuencia vecinas. Los procesos de CFPC se pueden simular en un ordenador cuando las señales incluyen una multitud de frecuencias.
La figura 15A es un diagrama de sistema simplificado para procesar una señal de entrada de acuerdo con algunas realizaciones de la presente divulgación. Un sistema informático 1600 ilustrativo para implementar los procesos de procesamiento y modificación de señal anteriores se representa en la figura 16A. El sistema informático 1600 de un emisor o un destinatario puede ser un ordenador personal (PC), una estación de trabajo conectada con un servidor u ordenador central, un ordenador portátil o ultraportátil, un PC de tipo tableta, un reproductor de medios de mano (por ejemplo, un reproductor de MP3), un dispositivo de teléfono inteligente, un dispositivo de videojuegos o una unidad de adaptación multimedios, con componentes de procesamiento y de memoria internos así como componentes de interfaz para la conexión con entrada externa, salida, almacenamiento, red y otros tipos de dispositivos periféricos. Los componentes internos del sistema informático en la figura 16A se muestran dentro de la línea de trazo discontinuo y los componentes externos se muestran fuera de la línea de trazo discontinuo. Los componentes que pueden ser internos o externos se muestran extendiéndose a ambos lados de la línea de trazo discontinuo. Como una alternativa a un PC, el sistema informático 1600, por ejemplo, para crear una instancia de las metodologías de procesamiento y modificación de señal descritas en el presente documento, se puede encontrar en la forma de cualquiera de un servidor, un ordenador de gran sistema, un ordenador distribuido, un dispositivo para Internet, u otros dispositivos informáticos, o combinaciones de los mismos.
En cualquier realización o componente del sistema descrito en el presente documento, el sistema informático 1600 incluye un procesador 1602 y una memoria de sistema 1606 conectados por un bus de sistema 1604 que también acopla operativamente diversos componentes de sistema. Puede haber uno o más procesadores 1602, por ejemplo, una unidad central de procesamiento (CPU) única, o una pluralidad de unidades de procesamiento, a las que se hace referencia habitualmente como entorno de procesamiento en paralelo (por ejemplo, un núcleo doble, núcleo cuádruple, u otro dispositivo de procesamiento de múltiples núcleos). El bus de sistema 1604 puede ser cualquiera de varios tipos de estructuras de bus, incluyendo un bus de memoria o controlador de memoria, un bus de periféricos, una estructura conmutada, conexión punto a punto y un bus local usando cualquiera de una diversidad de arquitecturas de bus. La memoria de sistema 1606 incluye la memoria de solo lectura (ROM) 1608 y la memoria de acceso aleatorio (RAM) 1610. Un sistema básico de entrada / salida (BIOS) 1612, que contiene las rutinas básicas que ayudan a transferir información entre elementos dentro del sistema informático 1600, tal como durante el arranque, se almacena en la ROM 1608. Una memoria caché 1614 se puede dejar a un lado en la RAM 1610 para proporcionar un almacén de memoria de alta velocidad para datos a los que se accede frecuentemente.
Una interfaz de unidad de disco duro 1616 se puede conectar con el bus de sistema 1604 para proporcionar un acceso de lectura y escritura a un dispositivo de almacenamiento de datos, por ejemplo, una unidad de disco duro 1618, para un almacenamiento no volátil de aplicaciones, archivos y datos. Obsérvese que la unidad de disco duro 1618 puede ser o bien un componente interno o bien un componente externo del sistema informático 1600 como es indicado por la unidad de disco duro 1618 que se extiende a ambos lados de la línea de trazo discontinuo en la figura 16. En algunas configuraciones, puede haber tanto una unidad de disco duro interna como una externa 1618. Un número de módulos de programa y otros datos se pueden almacenar en el disco duro 1618, incluyendo un sistema operativo 1620, uno o más programas de aplicación y archivos de datos.
En una implementación ilustrativa, la unidad de disco duro 1618 puede almacenar un programa de aplicación de edición de señal 1622 como uno de varios programas que pueden convertir el sistema informático 1600 en un número de máquinas de propósito especial. El programa de aplicación de edición de señal 1622 puede incluir un número de módulos de software que funcionan conjuntamente para realizar diversas funciones del programa de aplicación de edición de señal 1622. En una implementación ilustrativa, el programa de aplicación de edición de señal 1622 puede incluir un módulo de FFT/IDFT 1624 que da lugar a que la CPU 1602 transforme una señal del dominio del tiempo al dominio de la frecuencia (por ejemplo, usando una lógica de FFT que implementa las ecuaciones (1) y (2)) y en sentido inverso del dominio de la frecuencia al dominio del tiempo (por ejemplo, usando una lógica de IDFT que implementa la ecuación (8)).
El programa de aplicación de edición de señal 1622 también puede incluir un módulo de transformada de tiempo - frecuencia 1664 que configura la CPU 1602 para crear las representaciones de matriz de tiempo - frecuencia de los datos de frecuencia como ondas parciales individuales, por ejemplo, de acuerdo con la ecuación (3). El programa de aplicación de edición de señal 1622 puede incluir adicionalmente un módulo de filtro de alisado 1666 que configura la c Pu 1602 para proporcionar un acoplamiento de fase de frecuencia cruzada de las ondas en la matriz de tiempo - frecuencia emitida a partir de los procesos del módulo de transformada de tiempo - frecuencia 1664, por ejemplo, de acuerdo con las ecuaciones (4) -(7). El módulo de filtro de alisado 1666 crea un CFPC con la matriz de transformada de tiempo - frecuencia y emite la transformada de tiempo - frecuencia alisada, que se puede almacenar temporalmente en la memoria de sistema 1606 o para un acceso posterior y a largo plazo en un archivo de datos 1626 asociado con el programa de aplicación de edición de señal 1622. Unos archivos de datos 1626 adicionales asociados con el programa de aplicación de edición de señal 1622 pueden almacenar parámetros operativos para cada uno de los módulos. Por ejemplo, el módulo de filtro de alisado 1666 puede aplicar un filtro de promedio móvil exponencial, tal como se muestra en las ecuaciones (4) y (5). El módulo de filtro de alisado 1666 puede usar el enfoque de A adaptativo a la señal o un enfoque de A invariante con la señal para generar una transformada de tiempo - frecuencia alisada. Los valores para A y los parámetros relacionados se pueden almacenar en los archivos de datos 1626.
En una realización alternativa, el programa de aplicación de edición de señal 1622 se puede optimizar para ejecutarse en una tarjeta de unidad de procesamiento de gráficos (GPU) 1603 en lugar de una CPU convencional 1602. Una tarjeta de GPU 1603 es un componente de procesamiento de hardware informático especializado que está diseñado para computar millones de valores (habitualmente valores de color y brillo de píxel para su visualización en una pantalla informática) en paralelo a partir de un modelo informático de una imagen (por ejemplo, como una escena en 3D en un juego informático) usando un así denominado "Sombreador". Un Sombreador es un filtro que combina valores de entrada, tales como la inclinación de un plano en relación con una fuente de luz para todos los píxeles en una pantalla, y recibe llamadas de datos para millones de píxeles en una pantalla al mismo tiempo, permitiendo de ese modo un cómputo rápido de una imagen a partir de un modelo en 3D. El programa de aplicación de edición de señal 1622, incluyendo el módulo de transformada de tiempo - frecuencia 1664 y el módulo de filtro de alisado 1666, se puede modificar para computar los valores de alisado para las matrices usando un Sombreador sobre la tarjeta de GPU 1603, permitiendo que el programa se ejecute eficientemente a una velocidad muy alta, previendo de este modo una visualización en tiempo real de la representación de tiempo - frecuencia.
El programa de aplicación de edición de señal 1622 también puede incluir herramientas de edición de señal para identificar y alterar o eliminar la magnitud de señal o energía no deseada a determinadas frecuencias en contenedores de tiempo discretos de la transformada de tiempo - frecuencia alisada. Tales herramientas de edición de señal pueden incluir filtros de paso bajo automáticos o pueden prever la recepción de parámetros de entrada de usuario o incluso una interfaz de usuario para prever una edición directa de la señal en el dominio de tiempo - frecuencia a través de una interfaz gráfica de usuario de la que se crea una instancia en el sistema informático 1600. Una vez que se ha completado cualquier edición de señal, la señal editada puede ser procesada entonces por la CPU 1602 de acuerdo con las operaciones de IFFT en el módulo de FFT/IFFT 1624 para devolver una señal modificada en el dominio del tiempo.
El sistema informático 1600 puede incluir adicionalmente una unidad de disco magnético 1630 para leer de o escribir en un disco magnético extraíble 1632, cinta, u otros medios magnéticos. La unidad de disco magnético 1630 se puede conectar con el bus de sistema 1604 por medio de una interfaz de unidad de disco 1628, por ejemplo, una Interfaz de Sistema para Ordenadores Pequeños (SCSI), interfaz de SCSI con Acoplamiento Serie (SAS) o interfaz de Acoplamiento de AT Serie (SATA), para proporcionar un acceso de lectura y escritura a la unidad de disco magnético 1630 iniciado por otros componentes o aplicaciones dentro del sistema informático 1600. La unidad de disco magnético 1630 y los medios legibles por ordenador asociados se pueden usar para proporcionar un almacenamiento no volátil de instrucciones legibles por ordenador, estructuras de datos, módulos de programa y otros datos para el sistema informático 1600.
El sistema informático 1600 puede incluir adicionalmente una unidad de disco óptico 1634 para leer de o escribir en un disco óptico extraíble 1636 tal como un CD ROM, DVD u otros medios ópticos. La unidad de disco óptico 1634 se puede conectar con el bus de sistema 1604 por medio de la interfaz de unidad de disco 1628 para proporcionar un acceso de lectura y escritura a la unidad de disco óptico 1634 iniciado por otros componentes o aplicaciones dentro del sistema informático 1600. La unidad de disco óptico 1630 y los medios ópticos legibles por ordenador asociados se pueden usar para proporcionar un almacenamiento no volátil de instrucciones legibles por ordenador, estructuras de datos, módulos de programa y otros datos para el sistema informático 1600. El sistema informático 1600 puede incluir adicionalmente una unidad de disco duro externa 1638 conectada con la interfaz de unidad de disco externa 1628. La unidad de disco duro externa 1638 se puede usar para proporcionar un almacenamiento no volátil adicional de instrucciones legibles por ordenador, estructuras de datos, módulos de programa y otros datos para el sistema informático 1600.
Un dispositivo de visualización 1642, por ejemplo, un monitor, una televisión o un proyector, u otro tipo de dispositivo de presentación también se puede conectar con el bus de sistema 1604 por medio de una interfaz, tal como un adaptador de vídeo 1640 o tarjeta de vídeo. De forma similar, unos dispositivos de audio, por ejemplo, altavoces externos o un micrófono (no mostrado), se pueden conectar con el bus de sistema 1604 a través de una tarjeta de audio u otra interfaz de audio (no mostrada).
Además del monitor 1642, el sistema informático 1600 puede incluir otros dispositivos de entrada y salida periféricos, que se conectan a menudo con el procesador 1602 y la memoria 1606 a través de la interfaz de puerto serie 1644 que está acoplada con el bus de sistema 1606. Los dispositivos de entrada y salida se pueden conectar, también o como alternativa, con el bus de sistema 1604 por otras interfaces, por ejemplo, un bus serie universal (USB), una interfaz según la norma 1394 de IEEE ("Firewire"), un puerto paralelo o un puerto de juegos. Un usuario puede introducir órdenes e información en el sistema informático 1600 a través de diversos dispositivos de entrada que incluyen, por ejemplo, un teclado 1646 y un dispositivo apuntador 1648, por ejemplo, un ratón. Otros dispositivos de entrada (no mostrados) pueden incluir, por ejemplo, una palanca de mando, un controlador de juegos, una tableta, un dispositivo de pantalla táctil, una antena parabólica, un escáner, un fax, un micrófono, una cámara digital y una videocámara digital.
Los dispositivos de salida pueden incluir una impresora 1650 y uno o más altavoces 1670 para presentar el desempeño de audio del emisor. Otros dispositivos de salida (no mostrados) pueden incluir, por ejemplo, un trazador gráfico, una fotocopiadora, una impresora de fotografías, un fax y una prensa. En algunas implementaciones, varios de estos dispositivos de entrada y salida se pueden combinar en dispositivos únicos, por ejemplo, una impresora/escáner/fax/fotocopiadora. También se debería apreciar que el sistema informático 1600 puede, por medio de la interfaz de puerto serie 1644 (por ejemplo, USB) o una interfaz de puerto similar, acceder a otros tipos de medios legibles por ordenador y unidades asociadas para almacenar datos, por ejemplo, casetes magnéticos o unidades de memoria flash.
El sistema informático 1600 puede operar en un entorno en red usando conexiones lógicas a través de una interfaz de red 1652 acoplada con el bus de sistema 1604 para comunicarse con uno o más dispositivos remotos. Las conexiones lógicas representadas en la figura 16 incluyen una red de área local (LAN) 1654 y una red de área extensa (WAN) 1660. Tales entornos de interconexión de redes son corrientes en redes domésticas, redes de oficina, redes informáticas a nivel de empresa e intranets. Estas conexiones lógicas pueden ser logradas por un dispositivo de comunicaciones acoplado o en una sola pieza con el sistema informático 1600. Como se representa en la figura 16, la LAN 1654 puede usar un encaminador 1656 o concentrador, o bien cableado o bien inalámbrico, o bien interno o bien externo, para conectar con dispositivos remotos, por ejemplo, un ordenador remoto 1658, conectado de forma similar a través de la LAN 1654. El ordenador remoto 1658 puede ser otro ordenador personal, un servidor, un cliente, un dispositivo del mismo nivel, u otro nodo de red común, e incluye habitualmente muchas o la totalidad de los elementos descritos anteriormente en relación con el sistema informático 1600.
Para conectar con una WAN 1660, el sistema informático 1600 incluye habitualmente un módem 1662 para establecer comunicaciones a lo largo de la WAN 1660. Habitualmente, la WAN 1660 puede ser Internet. No obstante, en algunos casos la WAN 1660 puede ser una red privada grande diseminada entre múltiples ubicaciones, o una red privada virtual (VPN). El módem 1662 puede ser un módem de teléfono, un módem de alta velocidad (por ejemplo, un módem de línea de abonado digital (DSL)), un módem de cable, o un tipo similar de dispositivo de comunicaciones. El módem 1662, que puede ser interno o externo, se conecta con el bus de sistema 1618 por medio de la interfaz de red 1652. En realizaciones alternativas, el módem 1662 se puede conectar por medio de la interfaz de puerto serie 1644. Se debería apreciar que las conexiones de red mostradas son ilustrativas y se pueden usar otros medios y dispositivos de comunicaciones para establecer un enlace de comunicaciones de red entre el sistema informático y otros dispositivos o redes.
El sistema informático 1600 puede incluir múltiples procesadores o múltiples núcleos de procesador y un algoritmo para dar instrucciones a los procesadores de que realicen un procesamiento paralelo. Por ejemplo, la CPU informática 1602 única puede incluir múltiples núcleos de procesador. Como alternativa, se pueden usar múltiples ordenadores conectados. Cada ordenador puede incluir al menos un procesador. Mediante un procesamiento paralelo, la eficiencia se puede mejorar significativamente. Algunos algoritmos de alisado rápido se pueden encontrar disponibles en las CPU o GPU modernas. Por ejemplo, cuando las transformadas proporcionan una salida de valor real, se puede aplicar una transformada de Hilbert para convertir los valores en una señal analítica (de valor complejo) antes del procesamiento. También se pueden usar los algoritmos para una manipulación espectral basándose en un procesamiento de FFT o de transformada de frecuencia.
La tecnología descrita en el presente documento se puede implementar como módulos y/u operaciones lógicas en uno o más sistemas informáticos configurados para un procesamiento de propósito especial de las metodologías de procesamiento y edición de señal divulgadas en el presente documento. Las operaciones lógicas se pueden implementar como una secuencia de etapas implementadas por procesador dirigidas por programas de software que se ejecutan en uno o más sistemas informáticos o como módulos de máquina o de circuito interconectados que usan puertas lógicas o bien en un dispositivo autónomo o bien dentro de uno o más sistemas informáticos, o como una combinación tanto de un microprocesador configurado por software como de módulos de circuito. De forma similar, las descripciones de diversos módulos de componente se pueden proporcionar en términos de las operaciones ejecutadas o efectuadas por los módulos. La implementación resultante es una cuestión de elección, que depende de los requisitos de desempeño del sistema subyacente que implementa la tecnología descrita. Por consiguiente, se hace referencia a las operaciones lógicas que constituyen las realizaciones de la tecnología descrita en el presente documento de forma diversa como operaciones, etapas, objetos o módulos. Además, se debería entender que las operaciones lógicas se pueden realizar en cualquier orden, salvo que explícitamente se afirme lo contrario o que la redacción de lo que se afirma necesite inherentemente un orden específico.
En algunas implementaciones, se proporcionan artículos de fabricación como productos de programa informático que dan lugar a la creación de instancias de operaciones en un sistema informático para implementar la invención. Una implementación de un producto de programa informático proporciona un medio de almacenamiento de programa informático no transitorio legible por un sistema informático y la codificación de un algoritmo de procesamiento particular y único en el ordenador para crear un ordenador de propósito especial. Se debería entender adicionalmente que la tecnología descrita también se puede emplear en dispositivos de propósito especial independientemente de un ordenador personal.
Por ejemplo, el sistema de procesamiento de señal divulgado en el presente documento se puede implementar en un dispositivo de procesamiento de propósito especial 1670 como se muestra en la figura 16B. El dispositivo de procesamiento 1670 puede incluir un microcontrolador 1674 que combina un procesador 1676 y una memoria 1678. En una realización alternativa, microprocesadores y dispositivos de memoria separados se pueden acoplar operativamente entre sí. Como alternativa, si se requiere memoria adicional, un módulo de memoria separado se podría acoplar al microcontrolador 1674. La memoria 1678 se puede usar para almacenar una señal de entrada 1672 para su procesamiento y, en última instancia, una señal modificada 1690 para la salida. La memoria 1678 se puede usar adicionalmente para almacenar diversos parámetros para las etapas de procesamiento por los diversos módulos de circuito descritos posteriormente, así como datos y valores de salida a partir de los módulos de circuito. El microcontrolador 1674 gestiona el flujo de datos a y desde la memoria 1678 y coordina las etapas de procesamiento por los diversos módulos de circuito. En algunas implementaciones, el microcontrolador 1674 se puede configurar para realizar las operaciones de procesamiento de uno o más de los módulos de circuito.
Un número de módulos de circuito se pueden conectar con el microcontrolador 1674 dentro del dispositivo 1670. Estos módulos de circuito se pueden implementar, por ejemplo, usando un Circuito Integrado para Aplicaciones Específicas (ASIC) o una Agrupación de Puertas Programable en Campo (FPGA). Los módulos de circuito pueden incluir un módulo de transformada de tiempo - frecuencia 1680 que está configurado para transformar una señal del dominio del tiempo al dominio de la frecuencia (por ejemplo, un circuito de lógica de FFT que implementa las ecuaciones (1) y (2)) y en sentido inverso del dominio de la frecuencia al dominio del tiempo (por ejemplo, un circuito de lógica de IDFT que implementa la ecuación (8)). El microprocesador 1674 se puede configurar para dirigir la señal de entrada 1672 al módulo de transformada 1680, que aplica una FFT a la señal de entrada 1672. Un segundo módulo de circuito puede ser un módulo de extensión de matriz de tiempo - frecuencia 1682 en el que las puertas lógicas están configuradas para crear las representaciones de matriz de tiempo - frecuencia de los datos de frecuencia, por ejemplo, de acuerdo con la ecuación (3). Como alternativa, la memoria 1678 puede almacenar los algoritmos y datos asociados para dar instrucciones al procesador 1676 de que realice una transformada de frecuencia de la señal de entrada 1672, por ejemplo, como se muestra en las ecuaciones (1) y (2), y generar matrices de transformada de tiempo - frecuencia u ondas parciales individuales, por ejemplo, como se muestra en la ecuación (3), obviando la necesidad de transformar módulos de circuito separados.
Un tercer módulo de circuito puede ser un módulo de filtro de alisado 1684 en el que las puertas lógicas están configuradas para proporcionar un acoplamiento de fase de frecuencia cruzada, por ejemplo, de acuerdo con las ecuaciones (4)-(7). En algunas realizaciones, el módulo de filtro de alisado 1684 puede ser un coprocesador de gráficos informáticos. El módulo de filtro de alisado 1684 puede recibir la salida del módulo de matriz de transformada de tiempo - frecuencia 1682. El módulo de filtro de alisado 1684 crea un CFPC con la matriz de transformada de tiempo - frecuencia y emite la transformada de tiempo - frecuencia alisada 1686 a la memoria 1678. El módulo de filtro de alisado 1684 puede aplicar un filtro de promedio móvil exponencial, tal como se muestra en las ecuaciones (4) y (5). El módulo de filtro de alisado 1684 puede usar el enfoque de A adaptativo a la señal o un enfoque de A invariante con la señal para generar la transformada de tiempo - frecuencia alisada 1686.
Uno o más módulos de circuito adicionales, por ejemplo, un módulo de edición de señal 1684 también se pueden incluir en el dispositivo para identificar y alterar o eliminar la magnitud de señal o energía no deseada a determinadas frecuencias en contenedores de tiempo discretos. Un módulo de edición de señal 1684 de este tipo puede ser tan simple como un circuito de filtro de paso bajo o puede prever la recepción de parámetros de entrada de usuario o incluso una interfaz de usuario y herramientas para prever una edición directa de la señal en el dominio de tiempo - frecuencia. Una vez que se ha completado cualquier edición en el módulo de edición de señal 1684, la señal editada se puede transmitir entonces de vuelta al módulo de transformada 1680 para realizar una transformada inversa (por ejemplo, una Transformada de Fourier Discreta Inversa) y devolver una señal modificada 1690 en el dominio del tiempo. El procesador 1676 puede indicar que la señal modificada 1690 se almacene en la memoria 1678 o se emita para su uso o representación por otros dispositivos. Por lo tanto, el dispositivo de procesamiento 1670 puede recibir una señal de entrada 1672 en el dominio del tiempo y emitir una señal en el dominio del tiempo modificada 1690 después de procesar la señal de entrada 1672 mediante el uso de las metodologías descritas anteriormente.
Un proceso de edición de señal ilustrativo que puede usar la extensión de matriz de tiempo - frecuencia para eliminar de una señal el ruido u otras aberraciones de frecuencia no deseadas se puede entender con referencia a las figuras 16-19. Las figuras 16-18 representan esquemáticamente métodos de procesamiento de señal del estado de la técnica para fines de comparación con la figura 19, que representa esquemáticamente el proceso de extensión de matriz de tiempo - frecuencia divulgado en el presente documento. Los ejemplos de las figuras 16-19 se pueden entender en el contexto del procesamiento de señal de audio; no obstante, el presente método se puede aplicar a cualquier señal que se pueda representar como una serie de valores espaciotemporales medidos, tales como audio, archivos de imagen estática y vídeo o mediciones a partir de otras señales como transmisiones de radio, de televisión y de satélite; RADAR y SONAR; transmisiones de teléfono por línea terrestre e inalámbricas y de señales de datos; señales recibidas por radiotelescopio; señales de mapeo geofísico; y formación de imágenes por resonancia magnética y tomografía, entre otros. Por lo tanto, además del ejemplo de procesamiento de audio presentado en el presente documento, un procesamiento de señal que usa estas técnicas es posible en cualquier número de disciplinas y aplicaciones.
Una representación esquemática de un proceso de edición espectral 1700 tradicional se presenta en la figura 17. Una señal en el dominio del tiempo sinusoidal 1702 es el objeto del proceso de edición 1700. Una señal de entrada se puede convertir en una representación digital ("muestreada") mediante el uso de una conversión de analógico a digital (A/D). Como alternativa, una señal de entrada puede ser un archivo de datos informáticos que contiene una señal muestreada que se muestreó en un punto anterior en el tiempo. La señal de entrada capturada puede ser cualquier tipo de señal que representa una serie de mediciones de tiempo frente a amplitud o intensidad. Habitualmente, algunas porciones de la señal en el dominio del tiempo 1702 se "dividen en ventanas" o seleccionan para un análisis y edición adicional mediante una transformación al dominio de la frecuencia. No hay requisito de tamaño particular alguno para una ventana de muestreo. Por ejemplo, una función de división en ventanas 1704a se podría ajustar con parámetros para seleccionar una ventana grande 1706a para el análisis o una función de división en ventanas 1704b se podría ajustar con parámetros alternativos para seleccionar una ventana relativamente más pequeña 1706b para el análisis.
Cada ventana seleccionada de este modo se somete entonces a una operación de FFT 1708 (por ejemplo, una STFT) para traducir la señal en el dominio del tiempo a la representación en dominio de la frecuencia correspondiente. Dependiendo del tamaño de la ventana elegida para el análisis, la resolución de la representación en el dominio de la frecuencia se verá afectada de conformidad con el principio de incertidumbre, es decir, no se puede lograr al mismo tiempo tanto una resolución temporal alta como una resolución de frecuencia alta. En particular, cuanto mayor sea la ventana de muestra a partir del dominio del tiempo, mejor o más estrecha será la resolución de las frecuencias en el dominio de la frecuencia, pero al coste de la resolución en el dominio del tiempo. Esto es debido a que la resolución de la FFT es la frecuencia de muestra dividida por el número de muestras (es decir, la longitud de ventana).
La operación de FFT 1708 da una serie de valores que se corresponden con un espectro de frecuencias dentro del rango de la operación de FFT 1708, lo que se puede representar gráficamente como una "pila" 1710a/b (la serie) de "contenedores" 1712a/b (los valores de frecuencia discretos). Los contenedores 1712a/b con la energía de señal 1714a/b a frecuencias particulares se pueden resaltar u oscurecer para contrastar con contenedores vacíos que no tienen energía de señal alguna a la frecuencia particular asociada con el contenedor. Obsérvese que las frecuencias discretas identificadas por la operación de FFT 1708 representada en contenedores 1712a en la pila 1710a tienen unas bandas mucho más estrechas y, por lo tanto, una resolución más alta, cuando se usa la ventana de muestra grande 1706a, en comparación con las bandas más anchas de los contenedores 1712b en la pila 1710b cuando se usa la ventana de muestra grande 1706a, que tienen una resolución más baja, es decir, la banda de frecuencia en la que se registra la energía de señal es relativamente ancha y no se puede estrechar o refinar adicionalmente.
Los contenedores 1710a/b se pueden representar en una pantalla de visualización como las columnas 1718a/b de intensidad de señal a diversas frecuencias representadas frente al tiempo en las representaciones gráficas en el dominio de la frecuencia 1716a/b. La representación esquemática de la representación gráfica 1716a que se corresponde con la ventana de muestra grande 1706a se presenta junto con la representación gráfica 1716b que se corresponde con la ventana de muestra pequeña 1706b para su comparación. La energía de señal 1722a/b en una banda de muestras de frecuencia particular puede ser representada por diferentes números o colores de los píxeles en la pantalla de visualización en cada contenedor, o por cualquier número de otros esquemas de representación visual. Cada columna 1718a/b representa una trama de transformada a partir de una de las ventanas 1706a/b, lo que se corresponde con una estimada de frecuencia / magnitud promedio a lo largo de N muestras en el dominio del tiempo (es decir, la frecuencia de muestra). Unos valores más grandes para N proporcionan una resolución mejor en el dominio de la frecuencia (es decir, más columnas verticales 1618a a lo largo de una trama de tiempo dada). En contraposición, los valores más pequeños para N proporcionan una resolución mejor en el dominio del tiempo pero menos contenedores de frecuencia (menos columnas verticales 1718a a lo largo de una trama de tiempo dada).
Otra representación esquemática de un proceso de edición espectral convencional 1800 se muestra en la figura 18 para resaltar un procedimiento de análisis común para una señal 1802 con el ruido 1807. En un proceso de análisis y edición 1800 típico, la función de muestreo 1804 es la misma para cada longitud de muestra y las ventanas de muestra 1806a/b son, por lo tanto, de un tamaño constante. Las ventanas de muestra 1806a/b están configuradas adicionalmente para superponerse (véase el área superpuesta 1805), habitualmente un 50 % o más. La operación de FFT 1808 opera sobre cada ventana de muestra 1806a/b y da una serie de valores que se corresponden con un espectro de frecuencias dentro del rango de la operación de FFT 1808, lo que se puede representar gráficamente como una "pila" 1810a/b (la serie) de "contenedores" 1812a/b (los valores de frecuencia discretos). Obsérvese que las frecuencias discretas identificadas por la operación de FFT 1808 representada en contenedores 1812a en la pila 1810a tienen la misma resolución que los contenedores 1812b en la pila 1810b. Esto es debido a que las ventanas de muestra 1806a/b son del mismo tamaño y los parámetros de la operación de FFT 1808 son los mismos para cada muestra.
Los contenedores 1810a/b se pueden representar en una pantalla de visualización como las columnas 1818a/b de intensidad de señal a diversas frecuencias representadas frente al tiempo en una única representación gráfica en el dominio de la frecuencia 1816. Cada columna 1818a/b representa una trama de transformada a partir de una de las 1806a/b, lo que se corresponde con una estimada de frecuencia / magnitud promedio a lo largo de N muestras en el dominio del tiempo (es decir, la frecuencia de muestra). Obsérvese, no obstante, que las columnas 1818a/b adyacentes representan tramas de transformada adyacentes que se corresponden con las ventanas superpuestas 1806a/b y, por lo tanto, periodos de tiempo diferentes pero superpuestos, cada uno de una duración de N / TasaDeMuestras segundos. Como resultado de la superposición 1805 y el tamaño de cada ventana 1806a/b, cada muestra en el dominio del tiempo, incluyendo cualquier señal transitoria tal como el ruido 1807, tiene lugar en más de una ventana 1806a/b. Por lo tanto, cualquier señal transitoria o de ruido 1807 está diseminada a lo largo de múltiples instancias de tiempo en el dominio de la frecuencia, haciendo de ese modo difícil una edición precisa del ruido 1807. Una vez que se ha completado la edición, las modificaciones en el dominio de la frecuencia se pueden convertir entonces de vuelta a una representación en el dominio del tiempo por una transformada de frecuencia inversa.
La figura 19 representa una captura de pantalla de una aplicación de edición de audio 1900 típica. La aplicación 1900 presenta transformaciones en el dominio de la frecuencia de las señales de audio 1904 para el análisis y edición en una ventana y proporciona las herramientas de edición 1902 para una manipulación de las señales. El usuario manipula los píxeles en la pantalla usando las herramientas de edición 1902 para cambiar la energía de señal para cada muestra en el dominio del tiempo a unas frecuencias particulares. La imagen en la figura 19 muestra un área de manipulación 1906 representativa seleccionada a través de múltiples muestras y frecuencias para la aplicación de un tratamiento proporcionado por las herramientas de edición 1902. En este ejemplo, una región de soporte (ROS) es definida por una frontera de forma arbitraria en torno a las frecuencias y la región fuera de la ROS se puede suprimir o extraer o bien manual o bien automáticamente.
La resolución de edición más pequeña puede ser de un píxel. No obstante, cada píxel sigue representando al menos una porción de los resultados a partir del análisis de una ventana, es decir, más de una muestra en el dominio del tiempo. Por lo tanto, todas las operaciones de edición afectan a al menos N muestras en el dominio del tiempo, es decir, el número de muestras discretas en cada ventana de muestra separada y sobre la que se opera por la FFT 1808. Los sucesos limitados en el tiempo (por ejemplo, transitorios o el ruido 1807 representado en la figura 18) que estén más cerca entre sí que la región superpuesta 1805 serán imposibles de editar por separado y se tratarán por igual. Por ejemplo, una reducción de la intensidad de señal a una frecuencia particular a través del proceso de edición para eliminar el ruido 1807 por lo tanto da como resultado una atenuación de la señal a la frecuencia de edición a lo largo de un periodo de tiempo más largo que el periodo en el que tiene lugar el ruido.
La aplicación del proceso de matriz de tiempo - frecuencia divulgado en el presente documento en el contexto de una herramienta de edición 2000 se representa en la figura 20. En esta herramienta de edición 2000, la división en ventanas en el dominio del tiempo es completamente opcional, debido a que el tamaño de transformada de análisis es arbitrario y puede abarcar la totalidad de la región de interés, o fragmentos individuales de la señal 2002. Una vez que la FFT 2008 se ha aplicado a la porción de la señal 2002 y en la ventana 2006 y el algoritmo de alisado de matrices 2012 se aplica a la pila de contenedores de frecuencia 2010 creada por la FFT 2008 como se ha descrito anteriormente, los datos de transformada de tiempo - frecuencia resultantes se pueden visualizar visualmente como una representación de imagen 2016, en donde un eje vertical puede representar la frecuencia, y un eje horizontal puede representar el tiempo, o viceversa.
El color y el brillo de píxel se pueden usar para visualizar la magnitud de señal en cualquier coordenada de pantalla dada (por ejemplo, como un "espectrograma"). Este espectrograma es un método común de visualización de datos en el dominio de la frecuencia para una manipulación directa por un usuario a través de herramientas de selección manual, y mediante la aplicación de diversos procesos secundarios a los datos seleccionados entonces. Los procesos de edición de espectrograma convencionales no permiten la manipulación del contenido espectral de la señal representada a un nivel muestra a muestra, limitando las ediciones en la extensión de las tramas de transformada de STFT individuales. El presente método posibilita operaciones de edición en segmentos de datos arbitrariamente pequeños a lo largo tanto del eje de tiempo como del eje de frecuencia (es decir, una resolución de tiempo alta y una resolución de frecuencia alta), incluyendo la capacidad de editar segmentos de la duración de un valor espaciotemporal único en la señal de origen (es decir, es "preciso en cuanto a las muestras").
En la herramienta de edición 2000 ilustrativa, cada columna representa una división en el dominio del tiempo (es decir, una muestra), no la totalidad de una trama de análisis. La resolución vertical depende del tamaño de trama o la ventana 2006 elegida para la aplicación de la FFT 2008. De nuevo, no es necesario que se superpongan las ventanas de análisis 2006. Unos valores más grandes para N proporcionan una resolución mejor en el dominio de la frecuencia (es decir, más píxeles verticales). Columnas adyacentes de los píxeles 2020 representan particiones o incrementos en el dominio del tiempo adyacentes, cada uno de los cuales tiene una duración de 1/TasaDeMuestras segundos. Las bandas de píxeles horizontales 2022 se corresponden con los contenedores de frecuencia de energía de señal en cada incremento en el dominio del tiempo y tienen una resolución que se corresponde con el número N de muestras de muestra en el dominio del tiempo. Las señales transitorias o de ruido limitadas en el tiempo 2007a/b/c aparecen como objetos discretos 2024a/b/c (es decir, líneas verticales) en contenedores o instancias de tiempo específicas y se pueden manipular por separado entre sí independientemente del tamaño de ventana.
Con la herramienta de edición 2000 ilustrativa, el usuario puede manipular los píxeles usando las mismas herramientas de edición habitualmente halladas en aplicaciones de procesamiento de imagen (por ejemplo, como en la figura 18). Por lo tanto, los métodos de procesamiento de señal se pueden configurar como una sustitución directa para otros algoritmos de herramientas de edición que proporciona una resolución mejor. Un usuario puede seleccionar partes de la representación en espectrograma de la señal y modificarlas usando herramientas de selección como se usan en el procesamiento de imagen, o herramientas de selección ayudadas por máquina, o a través de métodos de selección paramétrica basándose en criterios de señal. Como ejemplos, la señal puede ser una señal de audio. En una realización, las componentes de señal pueden incluir reverberación, reflexiones y/o ecos. Estas señales se pueden identificar, separar y modificar. En otra realización, las componentes de señal pueden ser componentes de voz, de habla y/o no de habla. En una realización adicional, las componentes de señal pueden ser ruido y componentes que contienen información útil. En aún otra realización, las componentes de señal pueden ser de un tipo definible por el usuario que van a estar separadas de otras señales. En aún otra realización más, las componentes de señal pueden incluir, pero no limitarse a, señales de transmisión inalámbrica, archivos de imagen o archivos de vídeo entre otros. La resolución de edición más pequeña puede ser de un píxel.
Como alternativa, se pueden usar rutinas de selección / modificación paramétrica automática para sustituir el procedimiento manual por el usuario. Por ejemplo, en la técnica anterior, la búsqueda de un patrón de tiempo - frecuencia embebido en el ruido usando una secuencia de STFT puede requerir múltiples tramas de transformada con un grado alto de superposición entre tramas de transformada de STFT sucesivas, o un grado alto de libertad en los criterios de comparación. Mediante el uso del presente método en combinación con algoritmos de detección de patrones, el patrón se puede separar del ruido y un detector de patrones puede detectar de forma más fiable un patrón dado. La razón para esto es que en el presente método, la resolución de frecuencia depende del tamaño de transformada N, que puede ser un número arbitrariamente grande. La resolución de tiempo depende del parámetro de localización de tiempo - frecuencia local A y, por lo tanto, es localmente variable. Por lo tanto, se puede emplear un software de detección de patrones automática dentro del dominio de tiempo - frecuencia para editar automáticamente componentes de señal no deseadas. Las herramientas de edición automática ilustrativas incluyen UNMIX::DRUMS (Zynaptiq, Alemania), que detecta patrones que se corresponden con tambores en una mezcla de audio y automáticamente los atenúa o los refuerza dependiendo de parámetros preseleccionados, y UNVEIL (Zynaptiq, Alemania), que usa una detección de patrones para detectar y eliminar la reverberación de una señal.
Las modificaciones en el dominio de tiempo - frecuencia se pueden convertir entonces de vuelta a una representación en el dominio del tiempo por una transformada de frecuencia inversa (por ejemplo, como se muestra en la ecuación 8). Como alternativa, la modificación se puede almacenar en disco en datos (en el dominio del tiempo) o bien transformados o bien directos para su posterior recuperación y modificación adicional. La muestra en el dominio del tiempo modificada puede ser reproducida por una conversión de digital a analógico (D/A). Como alternativa, la muestra en el dominio del tiempo modificada se puede almacenar en un ordenador como un archivo de datos digital, que se puede convertir por medio de D/A en un instante posterior.
Los expertos en la materia apreciarán que el método también puede tener aplicaciones en numerosos otros campos, tales como electrónica, física, procesamiento de imagen y, en general, en todos los campos que hacen uso de f Ft o transformadas de frecuencia relacionadas para el análisis espectral.
Los expertos en la materia reconocerán que el presente método se puede usar como una sustitución directa para, o junto con, técnicas y algoritmos existentes basándose habitualmente en la transformada de Fourier con poco o nada de cambio en el algoritmo de procesamiento. Por ejemplo, el presente método se puede usar para convertir cada trama de análisis de STFT en N subtramas con un intervalo unidad (es decir, una transformada por muestra en el dominio del tiempo). Cada una de estas subtramas se puede tratar como una FFT de resolución plena, y se pueden aplicar algoritmos basados en FFT.
Los expertos en la materia apreciarán que las realizaciones actualmente divulgadas enseñan a modo de ejemplo y no de limitación. Por lo tanto, la materia contenida en la descripción anterior o mostrada en los dibujos adjuntos se debería interpretar como ilustrativa y no en un sentido limitante. Las siguientes reivindicaciones tienen por objeto cubrir todas las características genéricas y específicas descritas en el presente documento, así como todas las afirmaciones del alcance del presente método y sistema, que, como una cuestión lingüística, pudiera decirse que caigan entre las mismas.

Claims (22)

REIVINDICACIONES
1. Un método (600) implementado en un sistema informático para procesar una señal electromagnética digitalizada para identificar características de señal no deseadas que comprende
generar por medio de un microprocesador configurado de forma particular una representación de tiempo - frecuencia modificada de una señal de entrada al
recibir la señal de entrada (602) como una pluralidad de tramas de transformada en un dominio del tiempo (604) en el microprocesador, en donde cada trama de transformada incluye una pluralidad de muestras de señal; transformar cada trama de transformada de la señal de entrada a un dominio de la frecuencia usando una transformada de frecuencia (606); caracterizada adicionalmente la etapa de generación por
introducir una dimensión de tiempo en la transformada de frecuencia para generar ondas parciales periódicas de frecuencia constante y de magnitud constante para cada banda de frecuencia de la transformada de frecuencia de la señal de entrada para cada una de las tramas de transformada (608) para formar una representación de tiempo - frecuencia para cada trama de transformada;
aplicar un filtro de alisado a la representación de tiempo - frecuencia para introducir una sincronización entre las ondas parciales periódicas de bandas de frecuencia adyacentes y para generar una representación de tiempo - frecuencia alisada que incluye paquetes de ondas no periódicas a través de las bandas de frecuencia convertidas a partir de las ondas parciales periódicas por la sincronización (612), en donde las características de señal no deseadas se amplían en bandas de frecuencia correspondientes de la representación de tiempo - frecuencia alisada para cada muestra de señal en la que tuvieron lugar las características de señal no deseadas en la señal de entrada en el dominio del tiempo; y
formular valores de tiempo - frecuencia a partir de los paquetes de ondas no periódicas para cada banda de frecuencia en cada muestra de señal (616); y
emitir para su almacenamiento en un dispositivo de memoria acoplado con el microprocesador o visualizar en un dispositivo de visualización dentro del sistema informático, o ambos, los valores de tiempo - frecuencia o representaciones de los mismos, o ambos, que identifican las características de señal no deseadas en muestras de tiempo discretas (620).
2. El método de la reivindicación 1, en donde
en la etapa de conversión, la señal de entrada se representa sobre una cuadrícula de bandas de frecuencia (202) mediante mediciones de fase y magnitud para cada banda de frecuencia (608);
la etapa de introducción comprende adicionalmente formular matrices con un eje de frecuencia y un eje de tiempo que contienen ondas sinusoidales que se corresponden con partes real e imaginaria de la información de frecuencia, magnitud y fase a través de cada trama de transformada, en donde cada onda sinusoidal se extiende a lo largo de la totalidad de una duración en el dominio del tiempo de N muestras de la trama de transformada (610); y
la etapa de aplicación comprende adicionalmente aplicar el filtro de alisado a lo largo del eje de frecuencia de las matrices para alisar las matrices a lo largo del eje de frecuencia de tal forma que las energías de las ondas a partir de bandas de frecuencia adyacentes se filtran una en otra (612).
3. El método de la reivindicación 2, que comprende adicionalmente
modificar las magnitudes y fases de tiempo - frecuencia por medio del microprocesador;
transformar inversamente por medio del microprocesador las magnitudes y fases de tiempo - frecuencia modificadas a una representación en el dominio del tiempo modificada de la señal de entrada; y
emitir la representación en el dominio del tiempo modificada a partir del microprocesador.
4. El método de la reivindicación 3, en donde la operación de modificación comprende adicionalmente identificar una señal no deseada en las magnitudes y fases de tiempo - frecuencia modificadas; y
alterar una magnitud o fase, o ambas, de la señal no deseada.
5. El método de la reivindicación 4, que comprende adicionalmente usar un proceso de detección de patrones automática implementado por el microprocesador para realizar las etapas de identificación y alteración.
6. El método de la reivindicación 1, que comprende adicionalmente editar los valores de tiempo - frecuencia para modificar características de señal no deseadas en la representación de tiempo - frecuencia alisada (614).
7. El método de la reivindicación 1, que comprende adicionalmente
generar una señal en el dominio del tiempo modificada de los valores de tiempo - frecuencia editados por medio del microprocesador (618); y en donde
la etapa de visualización comprende adicionalmente visualizar la señal en el dominio del tiempo modificada como una representación en un dispositivo de visualización (620).
8. Un medio de almacenamiento legible por ordenador no transitorio que contiene instrucciones para crear una instancia de un ordenador de propósito especial para procesar una señal electromagnética digitalizada para eliminar características de señal no deseadas de la señal electromagnética, en donde las instrucciones implementan un proceso informático que comprende las etapas de
recibir la señal de entrada que comprende una pluralidad de tramas de transformada en un dominio del tiempo (602); transformar la señal de entrada a un dominio de la frecuencia usando una transformada de frecuencia (606); en donde las etapas del proceso informático están adicionalmente caracterizadas por
generar matrices de tiempo - frecuencia que se corresponden con tramas de transformada respectivas a partir de la transformada de frecuencia que contienen funciones de base de la transformada de frecuencia ajustada para magnitudes y fases de transformada respectivas, en donde las matrices de tiempo - frecuencia tienen una primera dimensión de tiempo en instancias de tiempo de muestra t y una segunda dimensión de frecuencia en contenedores de ancho de banda k para cada trama de transformada (610);
aplicar un algoritmo de procesamiento de acoplamiento de fase de frecuencia cruzada entre frecuencias adyacentes para introducir una sincronización entre las frecuencias adyacentes y para generar matrices de tiempo - frecuencia alisadas, en donde las características de señal no deseadas se amplían en contenedores de ancho de banda k correspondientes de las matrices de tiempo - frecuencia alisadas para cada muestra de tiempo t en la que tuvieron lugar las características de señal no deseadas en la señal de entrada en el dominio del tiempo (612); y emitir para su almacenamiento o para su visualización en un dispositivo de visualización, o ambos, valores de tiempo - frecuencia o representaciones de los mismos, o ambos, a partir de las matrices de tiempo - frecuencia alisadas que identifican las características de señal no deseadas para las muestras de tiempo t relevantes (620).
9. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 8, en donde las instrucciones implementan etapas de proceso adicionales que comprenden
formular magnitudes y fases variables en el tiempo a partir de las matrices de tiempo - frecuencia alisadas para cada tiempo de muestra t y cada contenedor de ancho de banda k en cada trama de transformada (608); y modificar las magnitudes y fases variables en el tiempo para editar las características de señal no deseadas para las muestras de tiempo t en contenedores de ancho de banda k relevantes (614).
10. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 9, en donde la etapa de modificar las magnitudes y fases variables en el tiempo en un dominio de tiempo - frecuencia da como resultado la manipulación del contenido espectral en el dominio del tiempo y el dominio de la frecuencia con respecto a muestras de tiempo t discretas.
11. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 9, en donde las instrucciones implementan una etapa de proceso adicional que comprende
formar matrices de tiempo - frecuencia modificadas a partir de las magnitudes y fases variables en el tiempo modificadas (614); generar una señal en el dominio del tiempo modificada de la señal de entrada a partir de las matrices de tiempo - frecuencia modificadas que reflejan ediciones en las características de señal no deseadas (618); y en donde
la etapa de emisión comprende adicionalmente emitir la señal en el dominio del tiempo modificada para su almacenamiento o para su visualización en un dispositivo de visualización (620).
12. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 11, en donde la etapa de generar una señal en el dominio del tiempo modificada comprende adicionalmente transformar inversamente las matrices de tiempo - frecuencia alisadas para generar una representación en el dominio del tiempo modificada de la señal de entrada.
13. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 8, en donde la generación de las matrices de tiempo - frecuencia alisadas comprende adicionalmente
seleccionar un parámetro de localización de tiempo - frecuencia local; y
generar las matrices de tiempo - frecuencia alisadas basándose en el parámetro de localización de tiempo - frecuencia seleccionado.
14. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 13, en donde
la etapa de generar una señal en el dominio del tiempo modificada comprende adicionalmente transformar inversamente las matrices de tiempo - frecuencia alisadas para generar una representación en el dominio del tiempo modificada de la señal de entrada; y la representación en el dominio del tiempo modificada de la señal de entrada tiene una resolución de tiempo que depende del parámetro de localización de tiempo - frecuencia local y una resolución de frecuencia que depende de un tamaño de la transformada de frecuencia.
15. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 13, en donde el parámetro de localización de tiempo - frecuencia local es igual a o mayor que 0 y menor que 1.
16. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 13, en donde la generación de las matrices de tiempo - frecuencia alisadas comprende adicionalmente
variar el parámetro de localización de tiempo - frecuencia local para calcular las matrices de tiempo - frecuencia alisadas; y seleccionar el parámetro de localización de tiempo - frecuencia local que genera una magnitud transformada máxima.
17. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 16, en donde la etapa de variar el parámetro de localización de tiempo - frecuencia local comprende adicionalmente variar el parámetro de localización de tiempo - frecuencia local en proporción a una curva de 1 / frecuencia para dar una resolución de frecuencia mejor para frecuencias bajas y una resolución de tiempo mejor para frecuencias altas.
18. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 16, en donde la etapa de variar el parámetro de localización de tiempo - frecuencia local comprende adicionalmente variar el parámetro de localización de tiempo - frecuencia local en proporción a un espectro de magnitud blanqueado |X/<|', de tal forma que una relación de pico a promedio local baja en magnitud da como resultado un parámetro de tiempo - frecuencia local relativamente alto para lograr una resolución de tiempo relativamente alta, y una relación de pico a promedio local alta en magnitud da como resultado un parámetro de tiempo - frecuencia local relativamente bajo para lograr una resolución de frecuencia relativamente alta.
19. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 16, en donde la etapa de variar el parámetro de localización de tiempo - frecuencia local comprende adicionalmente variar el parámetro de localización de tiempo - frecuencia local a un incremento constante.
20. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 8, en donde la etapa de aplicar el algoritmo de procesamiento de acoplamiento de fase de frecuencia cruzada comprende adicionalmente mezclar una porción de las ondas en cada banda de frecuencia con las ondas en bandas de frecuencia adyacentes.
21. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 8, en donde cada matriz de tiempo - frecuencia tiene un tamaño de N por (N / 2 1), en donde N representa un número de muestras de tiempo t en cada trama de transformada.
22. El medio de almacenamiento legible por ordenador no transitorio de la reivindicación 8, en donde la etapa de aplicar un acoplamiento de fase de frecuencia cruzada comprende adicionalmente aplicar un filtrado de paso bajo por uno o más de un filtro de cálculo de promedio móvil exponencial, un filtro de respuesta a impulsos finitos (FIR), un filtro de respuesta a impulsos infinitos, un filtro de orden de rango, un filtro de alisado o un filtro adaptativo.
ES16715447T 2015-03-17 2016-03-17 Métodos de extensión de transformadas de frecuencia para resolver características en el dominio espaciotemporal Active ES2755489T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562134314P 2015-03-17 2015-03-17
PCT/EP2016/000477 WO2016146265A1 (en) 2015-03-17 2016-03-17 Methods for extending frequency transforms to resolve features in the spatio-temporal domain

Publications (1)

Publication Number Publication Date
ES2755489T3 true ES2755489T3 (es) 2020-04-22

Family

ID=55701913

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16715447T Active ES2755489T3 (es) 2015-03-17 2016-03-17 Métodos de extensión de transformadas de frecuencia para resolver características en el dominio espaciotemporal

Country Status (8)

Country Link
US (1) US11079418B2 (es)
EP (1) EP3271736B1 (es)
JP (1) JP6655269B2 (es)
DK (1) DK3271736T3 (es)
ES (1) ES2755489T3 (es)
HK (1) HK1250177A1 (es)
PL (1) PL3271736T3 (es)
WO (1) WO2016146265A1 (es)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018055455A1 (en) * 2016-09-23 2018-03-29 Eventide Inc. Tonal/transient structural separation for audio effects
KR102632136B1 (ko) 2017-04-28 2024-01-31 디티에스, 인코포레이티드 오디오 코더 윈도우 사이즈 및 시간-주파수 변환
US10648692B2 (en) 2017-07-27 2020-05-12 Johnson Controls Technology Company Building management system with multi-dimensional analysis of building energy and equipment performance
CN108181486B (zh) * 2018-01-25 2019-12-03 中国科学院电子学研究所 加速度信号的处理方法及装置
US10856755B2 (en) * 2018-03-06 2020-12-08 Ricoh Company, Ltd. Intelligent parameterization of time-frequency analysis of encephalography signals
CN108814593B (zh) * 2018-06-20 2021-06-08 天津大学 一种基于复杂网络的脑电信号特征提取方法
US11579921B2 (en) * 2018-08-29 2023-02-14 Alibaba Group Holding Limited Method and system for performing parallel computations to generate multiple output feature maps
CN110659583B (zh) * 2019-04-26 2023-11-28 深圳市豪视智能科技有限公司 信号处理方法、装置及相关产品
JP7001200B2 (ja) * 2019-06-06 2022-01-19 三菱電機ビルテクノサービス株式会社 分析装置
CN111680549B (zh) * 2020-04-28 2023-12-05 肯维捷斯(武汉)科技有限公司 一种纸纹识别方法
CN111612130B (zh) * 2020-05-18 2022-12-23 吉林大学 一种频移键控通信信号调制方式识别方法
CN113688655B (zh) * 2020-05-19 2023-12-15 广州海格通信集团股份有限公司 干扰信号的识别方法、装置、计算机设备和存储介质
CN111723699B (zh) * 2020-06-08 2023-08-22 西安工业大学 基于gst和rprg的多分量lfm信号时频线修正方法
CN111856562B (zh) * 2020-07-30 2022-07-26 成都理工大学 一种广义高阶同步挤压地震信号时频分解与重构方法
CN112285406B (zh) * 2021-01-04 2021-06-15 深圳市鼎阳科技股份有限公司 一种高精度时域测量方法及装置、存储介质
CN113925517B (zh) * 2021-09-22 2022-08-26 北京脑陆科技有限公司 基于脑电信号的认知障碍识别方法、装置及介质
CN117009742A (zh) * 2023-06-20 2023-11-07 南方电网调峰调频发电有限公司储能科研院 一种带宽提取域机械信号的故障特征表征方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009029032A2 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution
FR3039685A1 (fr) * 2015-08-01 2017-02-03 Inst Nat Rech Inf Automat Traitement de donnees geometriques avec approximation isotopique dans un volume de tolerance
US10307611B2 (en) * 2016-11-17 2019-06-04 Cognito Therapeutics, Inc. Methods and systems for neural stimulation via visual, auditory and peripheral nerve stimulations

Also Published As

Publication number Publication date
JP2018525614A (ja) 2018-09-06
EP3271736A1 (en) 2018-01-24
PL3271736T3 (pl) 2020-04-30
US11079418B2 (en) 2021-08-03
DK3271736T3 (da) 2019-12-09
WO2016146265A1 (en) 2016-09-22
EP3271736B1 (en) 2019-09-04
JP6655269B2 (ja) 2020-03-04
HK1250177A1 (zh) 2018-11-30
US20180238943A1 (en) 2018-08-23

Similar Documents

Publication Publication Date Title
ES2755489T3 (es) Métodos de extensión de transformadas de frecuencia para resolver características en el dominio espaciotemporal
KR101453711B1 (ko) 반복적 영상 재구성에서 픽손 맵을 결정하는 방법
Kroes et al. Exposure render: An interactive photo-realistic volume rendering framework
US9563817B2 (en) Apparatus and method for reconstructing an image using high-energy-based data
JP4420531B2 (ja) レンダリングパイプラインにおいてボリュームデータを照射する照射装置及び照射方法
US7692661B2 (en) Method of creating and evaluating bandlimited noise for computer graphics
JP6688618B2 (ja) 医用画像処理装置及び医用画像診断装置
Roy et al. Sound speed estimation using wave-based ultrasound tomography: theory and GPU implementation
Díaz et al. Real-time ambient occlusion and halos with summed area tables
Nikitin et al. Fast hyperbolic Radon transform represented as convolutions in log-polar coordinates
US7672476B2 (en) Bandlimited noise for computer graphics
Sattari High-resolution seismic complex trace analysis by adaptive fast sparse S-transform
Vaidyanathan et al. Layered light field reconstruction for defocus blur
Ament et al. Low-pass filtered volumetric shadows
Ledergerber et al. Volume MLS ray casting
Kim GPU isosurface raycasting of FCC datasets
Arcadu et al. A forward regridding method with minimal oversampling for accurate and efficient iterative tomographic algorithms
Drouin et al. PRISM: An open source framework for the interactive design of GPU volume rendering shaders
Gavrilov et al. Novel approach to development of direct volume rendering algorithms based on visualization quality assessment
Bethel Exploration of optimization options for increasing performance of a GPU implementation of a three-dimensional bilateral filter
Bagher‐Ebadian et al. On the development of an outcome‐driven frequency filter for improving radiomics‐based modeling of human papillomavirus (HPV) in patients with oropharyngeal squamous cell carcinoma
Wu et al. Multiple axis‐aligned filters for rendering of combined distribution effects
Vuçini et al. Enhancing visualization with real-time frequency-based transfer functions
Seo et al. Solid texture synthesis for heterogeneous translucent materials
CA2083210A1 (en) System and method for projection volume rendering