MXPA04009408A - Reconstruccion del espectro de una senal de audio con espectro incompleto en base a la traslacion de frecuencia. - Google Patents

Reconstruccion del espectro de una senal de audio con espectro incompleto en base a la traslacion de frecuencia.

Info

Publication number
MXPA04009408A
MXPA04009408A MXPA04009408A MXPA04009408A MXPA04009408A MX PA04009408 A MXPA04009408 A MX PA04009408A MX PA04009408 A MXPA04009408 A MX PA04009408A MX PA04009408 A MXPA04009408 A MX PA04009408A MX PA04009408 A MXPA04009408 A MX PA04009408A
Authority
MX
Mexico
Prior art keywords
signal
representation
obtaining
regenerated
baseband signal
Prior art date
Application number
MXPA04009408A
Other languages
English (en)
Inventor
Mark Stuart Vinton
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of MXPA04009408A publication Critical patent/MXPA04009408A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Stereophonic System (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)
  • Ceramic Products (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

Una senal de audio es conducida mas efectivamente transmitiendo o registrando una banda base de la senal, con un envolvente espectral estimado y un parametro de mezclado de ruido derivado de una medida de la calidad de la senal con respecto al ruido. La senal es reconstruida trasladando componentes espectrales de la senal de banda base a frecuencias fuera de la banda base, ajustando la fase de los componentes regeneradores, para mantener la coherencia de fase, ajustar la forma espectral de acuerdo con el envolvente espectral estimado, y adicionando ruido de acuerdo con el parametro de mezclado de ruido. Preferentemente, la senal transmitida o registrada incluye tambien un envolvente espectral estimado que se usa para ajustar la forma temporal de la senal reconstruida. La figura mas representativa de la invencion es la numero 2.

Description

RECONSTRUCCIÓN DEL ESPECTRO DE UNA SEÑAL DE AUDIO CON ESPECTRO INCOMPLETO EN BASE A LA TRASLACIÓN DE FRECUENCIA CAMPO DE LA INVENCIÓN La presente invención se refiere, en general, a la transmisión y registro de señales de audio. Más particularmente la presente invención permite la reducción de información requerida para transmitir o almacenar una señal de audio determinada y mantener a la vez un nivel de calidad percibida, determinado, en la señal de salida.
ANTECEDENTES DE LA INVENCIÓN Muchos sistemas de comunicación afrontan el problema de que la demanda de transmisión de información y capacidad de almacenamiento a menudo exceden la capacidad disponible. Como un resultado existe un interés considerable entre los que se encuentran involucrados en los campos de difusión y registro, en reducir la cantidad de información requerida para transmitir o registrar una señal de audio para percepción humana, sin degradar su calidad subjetiva. Similarmente existe la necesidad de mejorar la calidad de la señal de salida para un ancho de banda o capacidad de almacenamiento, determinados. Dos consideraciones de principio impulsan el diseño de sistemas que sirven para la transmisión y almacenamiento de audio: la necesidad de reducir los requerimientos de información y la necesidad de asegurar un nivel especificado de calidad perceptual en la señal de salida. Estas dos consideraciones entran en conflicto porque la reducción de la cantidad de información transmitida puede reducir la calidad percibida de la señal de salida. Aunque restricciones objetivas, tales como la velocidad de transferencia de datos, son impuestas usualmente por el sistema de comunicaciones mismo, los requerimientos perceptuales subjetivos son dictados usualmente por la aplicación . Los métodos tradicionales para reducir los requerimientos de información involucran transmitir o registrar sólo una porción seleccionada de la señal de entrada, y el resto se descarta. Preferentemente únicamente se descarta la porción que sea considerada redundante o perceptualmente irrelevante. Si se requiere de una reducción adicional, preferentemente se descarta únicamente una porción de la señal que se considere que tenga mínima significancia perceptual . Las aplicaciones de voz que enfatizan la inteligibilidad por encima de la fidelidad, tal como la codificación de la voz, pueden transmitir o registrar únicamente una porción de una señal, a la que se hace referencia en la presente como "señal de banda base", que contenga únicamente las porciones perceptualmente más relevantes del espectro de frecuencias de la señal. Un receptor puede regenerar la porción omitida de la señal de voz, a partir de información contenida en esta señal de banda base. La señal regenerada generalmente no es perceptualmente idéntica a la original, pero para muchas aplicaciones es suficiente una reproducción aproximada. Por otra parte, las aplicaciones diseñadas para conseguir un alto grado de fidelidad, tales como aplicaciones para música de alta calidad, requieren generalmente de una señal de salida de mayor calidad. Para obtener una señal de salida de mayor calidad, generalmente es necesario transmitir una mayor cantidad de información o utilizar un método más sofisticado para generar la señal de salida. Una técnica usada con relación a la descodificación de señales de voz, es conocida como regeneración de alta frecuencia ( "HFR" ) · Una señal de banda base que contenga únicamente componentes de baja frecuencia de una señal, es transmitida o almacenada. Un receptor regenera los componentes de alta frecuencia omitidos, en base a los contenidos de la señal de banda base recibida y combina la señal de banda base con los componentes de alta frecuencia regenerados, para producir una señal de salida. Aunque los componentes de alta frecuencia regenerados son en general no idénticos a los componentes de alta frecuencia en la señal original, esta técnica puede producir una señal de salida que sea más satisfactoria que otras técnicas que no usen la HFR. Numerosas variaciones de esta técnica han sido desarrolladas en el área de la codificación y descodificación de la voz. Tres métodos comunes usados para la HFR son el plegamiento espectral, la traslación espectral, y la rectificación. Una descripción de estas técnicas puede ser encontrada en Makhoul and Berouti, "High-Frequency Regeneration in Speech Coding Systems", ICASSP 1979 IEEE International Conf. on Acoust. , Speech and Signal Proc . , April 2-4. 1979. Aunque son simples de implementar, estas técnicas de HFR usualmente no son apropiadas para sistemas de reproducción de alta calidad, tales como aquellos usados para música de alta calidad. El plegamiento espectral y la traslación espectral pueden producir tonos de fondo indeseables. La rectificación tiende a producir resultados que · son percibidos como estridentes. Los inventores han notado que en muchos casos en donde estas técnicas han producido resultados insatisfactorios , las técnicas fueron usadas en codificadores de voz con limitación de banda, en donde la HFR estuvo restringida a la traslación de componentes por debajo de 5 kHz . Los inventores han notado también otros dos problemas que pueden surgir del uso de las técnicas de HFR. El primer problema está relacionado con las características de tono y ruido de las señales, y el segundo problema está relacionado con la forma o envolvente temporal de las señales regeneradas. Muchas señales naturales contienen un componente de ruido cuya magnitud se incrementa como una función de la frecuencia. Las técnicas de HFR conocidas regeneran los componentes de alta frecuencia de una señal de banda base, pero' fallan en reproducir una mezcla apropiada de componentes del tipo tono y del tipo ruido, en la señal regenerada, a las frecuencias mayores. La señal regenerada contiene a menudo un "zumbido" de alta frecuencia, distinto, que puede ser atribuido a la substitución de los componentes de tipo tono en la banda base, por los componentes de alta frecuencia, de tipo más similar al ruido, originales. Además, las técnicas de HFR reconocidas fallan en regenerar los componentes espectrales, en una manera tal que el envolvente temporal de la señal regenerada conserva, o es al menos similar, al envolvente temporal de la señal original . Se ha desarrollado cierto número de técnicas de HFR, más sofisticadas, que ofrecen resultados mejorados; sin embargo, estas técnicas tienden a ser específicas para la voz, a basarse en características de la voz que no sean apropiadas para la música y otras formas de audio, o requieren de demasiados recursos de cómputo, que no pueden ser implementados económicamente .
DESCRIPCIÓN DE LA INVENCIÓN Un objeto de la presente invención es permitir el procesamiento de señales de audio para reducir la cantidad de información requerida para representar una' señal durante la transmisión o almacenamiento, y mantener a la vez la calidad percibida de la señal . Aunque la presente invención está particularmente enfocada a la reproducción de señales de música, también es aplicable a una amplia gama de señales de audio incluyendo la voz. De acuerdo con un aspecto de la presente invención, en un transmisor una señal de salida es generada obteniendo una representación en el dominio de la frecuencia, de una señal de banda base, que tiene algunos pero no todos los componentes espectrales de la señal de audio; obtener un envolvente espectral estimado, de una señal residual que tenga componentes espectrales de la señal del audio, que no se encuentren en la señal de banda base; derivar un parámetro de mezcla de ruido, a partir de una medición del contenido de ruido de la señal residual; y ensamblar datos que representen la representación en el dominio de la frecuencia, de la señal de banda base, el envolvente espectral estimado y el parámetro de mezclado de ruido, en la señal de salida. De acuerdo con otro aspecto de la presente invención, en un receptor una señal de audio es reconstruida recibiendo una señal que contenga datos que representen una señal de banda base, un envolvente espectral estimado y un parámetro de mezclado de ruido; obtener de los datos una representación en el dominio de la frecuencia, de la señal de banda base; obtener una señal regenerada que comprenda componentes espectrales regenerados, trasladando los componentes espectrales de la banda base en la frecuencia; ajustar la fase de los componentes espectrales regenerados, para mantener la coherencia de fase en la señal regenerada,-obtener una señal regenerada, ajustada, obteniendo una señal de ruido en respuesta al parámetro de mezclado de ruido, modificar la señal regenerada mediante el ajuste de las amplitudes de los componentes espectrales regenerados, de acuerdo con el envolvente espectral estimado y el parámetro de mezclado de ruido, y combinar la señal regenerada, modificada, con la señal de ruido, y obtener una representación en el dominio del tiempo, de la señal reconstruida, que corresponda a una combinación de los componentes espectrales en la señal regenerada, ajustada, con componentes espectrales en la representación en el dominio de la frecuencia, de la señal de banda base. Otros aspectos de la presente invención se describen posteriormente y se presentan en las reivindicaciones . Las diferentes características de la presente invención y sus implementaciones preferidas pueden ser comprendidas de mejor manera, haciendo referencia al siguiente análisis y a los dibujos adjuntos en los que los números de referencia similares se refieren a elementos similares, en las diferentes figuras. El contenido del siguiente análisis y los dibujos, se presentan únicamente como ejemplos, y no deberá considerarse que representen limitaciones para el alcance de la presente invención.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La figura 1 ilustra los componentes principales en un sistema de comunicaciones. La figura 2 es un diagrama de bloques de un transmisor . Las figuras 3A y 3B son ilustraciones gráficas hipotéticas de una señal de audio y de una señal de banda base correspondiente. La figura 4 es un diagrama de bloques de un receptor . Las figuras 5A-5D son ilustraciones gráficas hipotéticas de una señal de banda base y señales generadas por la traslación de la señal de banda base. Las figuras 6A-6G son ilustraciones gráficas hipotéticas de señales obtenidas mediante la representación de los componentes de alta frecuencia, usando tanto la traslación espectral como el mezclado de ruido. La figura 6H es una ilustración de la señal en la figura 6G después del ajuste de la ganancia. La figura 7 es una ilustración de la señal de banda base mostrada en la figura 6B combinada con la señal generada mostrada en la figura 6H. La figura 8A es una ilustración de la forma temporal de la señal . La figura 8B muestra la forma temporal de una señal de salida que es producida derivando una señal de banda base a partir de la señal de la figura 8A y regenerando la señal a través de un proceso de traslación espectral . La figura 8C muestra la forma temporal de la señal en la figura 8B, después de que se ha llevado a cabo el control del envolvente temporal. La figura 9 es un diagrama de bloques de un transmisor que proporciona información necesaria para el control del envolvente temporal, usando técnicas en el dominio del tiempo. La figura 10 es un diagrama de bloques de un receptor, que proporciona el control del envolvente temporal, usando técnicas en el dominio del tiempo. La figura 11 es un diagrama de bloques de un transmisor, que proporciona información necesaria para el control del envolvente temporal, usando técnicas en el dominio de la frecuencia. La figura 12 es un diagrama de bloques de un receptor, que proporciona el control del envolvente, usando técnicas en el dominio de la frecuencia.
MODOS PARA LLEVAR A CABO LA INVENCIÓN A. Análisis General La figura 1 ilustra los componentes principales en un ejemplo en un sistema de comunicaciones. Una fuente de información 112 genera una señal de audio a lo largo de la ruta 115 que representa esencialmente cualquier tipo de información de audio tal como voz o música. Un transmisor 136 recibe la señal de audio proveniente de la ruta 115 y procesa la información en una forma que sea apropiada para la transmisión a través del canal 140. El transmisor 136 puede preparar la señal para que coincida con las características físicas del canal 140. El canal 140 puede ser una ruta de transmisión tal como alambres eléctricos o fibras ópticas, o puede ser una ruta de comunicación inalámbrica a través del espacio. El canal 140 puede incluir también un dispositivo de almacenamiento que registre la señal en un medio de almacenamiento tal como una cinta o disco magnético, o un disco óptico para el uso posterior por parte de un receptor 142. El receptor 142 puede llevar a cabo una variedad de funciones de procesamiento de señales, tales como la desmodulación o descodificación de la señal recibida desde el canal 140. La salida del receptor 142 se pasa a lo largo de una ruta 145 hacia un transductor 147, el cual la convierte en una señal de salida 152 que es apropiada para el usuario. En un sistema de reproducción de audio convencional, por ejemplo, las bocinas sirven como transductores para convertir señales eléctricas en señales acústicas. Los sistemas de comunicación, que están restringidos a transmitir a través de un canal que tenga un ancho de banda limitado o a registrar en un medio que tenga una capacidad limitada, encuentran problemas cuando la demanda de información excede este .ancho de banda o capacidad, disponible. Como un resultado existe una continua necesidad en los campos de la difusión y registro, de reducir la cantidad de información requerida para transmitir o registrar una señal de audio para percepción humana, sin degradar su calidad subjetiva. Similarmente existe la necesidad de mejorar la calidad de la señal de salida para un ancho de banda de transmisión o capacidad de almacenamiento, determinados . Una técnica usada con relación a la codificación de voz, es conocida como regeneración de alta frecuencia ("HFR") . Únicamente una señal de banda base que contenga componentes de baja frecuencia, de una señal de voz, son transmitidos o almacenados. El receptor 142 regenera los componentes de alta frecuencia omitidos, en base a los contenidos de la señal de banda base recibida, y combina la señal de banda base con los componentes de alta frecuencia, regenerados, para producir una señal de salida. Sin embargo, en general, las técnicas de HFR conocidas producen componentes de alta frecuencia, regenerados, que son fácilmente distinguibles de los componentes de alta frecuencia en la señal original . La presente invención proporciona una técnica mejorada para la regeneración de componentes espectrales, que produce componentes espectrales regenerados, perceptualmente más similares a componentes espectrales correspondientes que se encuentren en la señal original, en comparación con los proporcionados por otras técnicas conocidas. Es importante notar que aunque a las técnicas descritas en la presente se hace referencia a veces como regeneración de alta frecuencia, la presente invención no está limitada a la regeneración de componentes de alta frecuencia, de una señal. Las técnicas descritas posteriormente pueden ser utilizadas también para regenerar componentes espectrales en cualquier parte del espectro.
B. Transmisor La figura 2 es un diagrama de bloques de un transmisor 136 de acuerdo con un aspecto de la presente invención. Una señal de audio de entrada es recibida desde la ruta 115 y es procesada mediante un banco de filtros de análisis 705 para obtener una representación en el dominio de la frecuencia, de la señal de entrada. Un analizador 710 de señales de banda base determina qué componentes espectrales de la señal de entrada van a ser descartados. Un filtro 715 remueve los componentes espectrales que van a ser descartados, para producir una señal de banda base que consista del resto de los componentes espectrales. Un estimador 720 de envolvente espectral, obtiene un estimado del envolvente espectral de la señal de entrada. Un analizador espectral 722 analiza el envolvente espectral, estimado, para determinar parámetros de mezclado de ruido, para la señal. Un formateador 725 de señales, combina la información estimada del envolvente espectral, los parámetros de mezclado de ruido, y la señal de banda base, en una señal de salida que tenga una forma apropiada para la transmisión o almacenamiento. 1. Banco de Filtros de Análisis El banco de filtros de análisis 705 puede ser implementado, esencialmente mediante cualquier transformación en el dominio del tiempo al dominio de la frecuencia. La transformación usada en una implementación preferida de la presente invención, se describe en Princen, Johnson and Bradley, "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation, "ICASSP 1987 Conf. Proc, May 1987, pp. 2161-64. Esta transformación es el equivalente en el dominio del tiempo, de un sistema de análisis-síntesis en una sola banda lateral, con muestreo crítico y apilamiento impar, con cancelación de identidad en el dominio del tiempo, y en la presente se hace referencia al mismo como "O-TDAC" . De acuerdo con la técnica O-TDAC, se muestrea una señal de audio, se cuantifica y se agrupa en una serie de bloques de muestras de señales en el dominio del tiempo, traslapados . Cada bloque de muestra es ponderado mediante una función de ventana de análisis. Esta es equivalente a una multiplicación de muestra por muestra, del bloque de muestra de señales. La técnica O-TDAC aplica una transformación Cosenoidal Discreta Modificada ("DCT") a los bloques de muestras de señales en el dominio del tiempo, ponderados, para producir conjuntos de coeficientes de transformación, a los que se hace referencia en la presente como "bloques de transformación" . Para conseguir el muestreo crítico, la técnica conserva únicamente la mitad de los coeficientes espectrales antes de la transmisión o almacenamiento. Desafortunadamente, la retención de únicamente la mitad de los coeficientes espectrales causa que una transformación inversa complementaria genere componentes de identidad en el dominio del tiempo. La técnica O-TDAC puede cancelar la identidad y recuperar con exactitud la señal de entrada. La longitud de los bloques puede variarse en respuesta a las características de la señal, usando técnicas que son conocidas en el arte; sin embargo debe tenerse cuidado con respecto a la coherencia de fases, por razones que son analizadas posteriormente. Detalles adicionales de la técnica O-TDAC pueden ser obtenidos haciendo referencia a la patente de los Estados Unidos de Norteamérica 5,394,473. Para recuperar los bloques de señales de entrada, originales, de los bloques de transformación, la técnica 0-TDAC utiliza una DCT modificada inversa. Los bloques de señales producidos mediante la transformación inversa, son ponderados mediante una función de ventana de síntesis, son traslapados y sumados para recrear la señal de entrada. Para cancelar la identidad en el dominio del tiempo y recuperar con exactitud la señal de entrada, las ventanas de análisis y síntesis deben ser diseñadas para que satisfagan criterios estrictos . En una implementación preferida de un sistema para transmitir o registrar una señal digital de entrada muestreada a una velocidad de 44.1 kilomuestras/segundo, los componentes espectrales obtenidos a partir del banco de filtros de análisis 705, son divididos en cuatro subbandas que tengan intervalos de frecuencias como las que se presentan en la tabla I.
Tabla I 2. Analizador de Señales de Banda Base El analizador de señales de banda base 710 selecciona qué componentes espectrales descartar y qué componentes espectrales conservar, para la señal de banda base. Esta selección puede variar dependiendo de las características de la señal de entrada o puede permanecer fija de acuerdo con las necesidades de una aplicación; sin embargo, los inventores han determinado empíricamente que la calidad percibida, de una señal de audio, se deteriora si una o más de las frecuencias fundamentales de la señal son descartadas. Por lo tanto es preferible conservar esas porciones del espectro, que contengan las frecuencias fundamentales de la señal. Debido a que las frecuencias fundamentales de la voz y de los instrumentos musicales más naturales, generalmente no son mayores que aproximadamente 5 kHz, una implementación preferida del transmisor 136 que sirve para aplicaciones de música, usa una frecuencia de corte fija a 5 kHz, o alrededor de ese valor, y descarta todos los componentes espectrales por arriba de esa frecuencia. En el caso de una frecuencia de corte fija, el analizador de señales de banda base no necesita hacer nada más que proporcionar la frecuencia de corte fija, al filtro 715, y al analizador espectral 722. En una implementación alternativa, el analizador de señales de banda base 710 es eliminado y el filtro 715 y el analizador espectral 722 operan de acuerdo con la frecuencia de corte fija. En la estructura de su banda mostrada anteriormente en la tabla I, por ejemplo, los componentes espectrales que se encuentren únicamente en la subbanda 0 son conservados para la señal de banda base. Esta elección es también apropiada porque el oído humano no puede distinguir fácilmente diferencias en el tono, por arriba de 5 kHz y por lo tanto no puede discernir fácilmente inexactitudes en componentes regenerados, por arriba de esta frecuencia. La elección de la frecuencia de corte afecta el ancho de banda de la señal de banda base, lo cual a su vez influencia un intercambio entre los requerimientos de capacidad de información, de la señal de salida generada por el transmisor 136, y la calidad percibida de la señal reconstruida por el receptor 142. La calidad percibida de la señal reconstruida por el receptor 142 es influenciada por tres factores que son analizados en los siguientes párrafos. El primer factor es la exactitud de la representación de la señal de banda base que sea transmitida o almacenada. Generalmente, si el ancho de banda de una señal de banda base se mantiene constante, la calidad percibida de una señal reconstruida se incrementará a medida que se incremente la exactitud de la representación de la señal de banda base. Las inexactitudes representan ruido que será audible en la señal reconstruida si las inexactitudes son lo suficientemente grandes. El ruido degradará tanto la calidad percibida de la señal de banda base como los componentes espectrales que sean regenerados a partir de la señal de banda base. En una implementación ejemplar, la representación de la señal de banda base es un conjunto de coeficientes de una transformación en el dominio de la frecuencia. La exactitud de esta representación está controlada por el número de bitios que sean usados para expresar cada coeficiente de transformación. Se pueden usar técnicas de codificación para conducir un nivel determinado de exactitud con menores bitios; sin embargo, existe un intercambio básico entre la exactitud de la señal de banda base y los requerimientos de capacidad de información, para cualquier técnica de codificación determinada. El segundo factor es el ancho de banda de la señal de banda base, que sea transmitida o almacenada.
Generalmente, si la exactitud de la representación de la señal de . banda base es mantenida constante, la calidad percibida de una señal reconstruida se incrementará a medida que se incremente el ancho de banda de la señal de banda base. El uso de señales de banda base con un mayor ancho de banda, permite que el receptor 142 confine los componentes espectrales regenerados, en mayores frecuencias en donde el sistema auditivo humano sea menos sensible a las diferencias en la forma temporal y espectral. En la implementación ejemplar mencionada anteriormente, el ancho de banda de la señal de banda base es controlado por el número de coeficiente de transformación en la representación. Se pueden usar técnicas de codificación para conducir un número determinado de coeficientes con menor número de bitios, sin embargo, existe una negociación entre el ancho de banda de la señal de banda base y los requerimientos de capacidad de información, para cualquier técnica de codificación determinada . El tercer factor es la capacidad de información que se requiere para transmitir o almacenar la representación de la señal de banda base. Si el requerimiento de capacidad de información se mantiene constante,' la exactitud de la señal de banda base variará inversamente con el ancho de banda de la señal de banda base. Las necesidades de una aplicación dictarán, en general, un requerimiento de capacidad de información particular para la señal de salida que sea generada por el transmisor 136. Esta capacidad debe ser asignada a varias porciones de la señal de salida, tal como una representación de la señal de banda base y un envolvente espectral estimado. La asignación debe equilibrar las necesidades de cierto número de intereses de conflicto que son bien conocidos en los sistemas de comunicación. Dentro de esta asignación, el ancho de banda de la señal de banda base deberá ser seleccionado para equilibrar una negociación con la exactitud de codificación para optimizar la calidad percibida, de la señal reconstruida. 3. Estimador del Envolvente Espectral El estimador del envolvente espectral 720 analiza la señal de audio para extraer información concerniente al envolvente espectral de la señal. Si la capacidad de la información disponible lo permite, una implementación del transmisor 136 obtiene preferentemente un estimado de un envolvente espectral de la señal, dividiendo el espectro de la señal en bandas de frecuencia con ancho de banda que se aproximan a las bandas críticas para el oído humano, y extrayendo información concerniente a la magnitud de la señal en cada banda. En la mayoría de las aplicaciones que tienen capacidad de información limitada, no obstante, es preferible dividir el espectro en un número más pequeño de subbandas tal como el arreglo mostrado arriba en la tabla I . Se pueden usar otras variaciones tal como la de calcular una densidad espectral de potencia, o extraer la amplitud promedio o máxima en cada banda. Técnicas más sofisticadas pueden proporcionar mayor calidad en la señal de salida, pero generalmente requieren de mayor número de recursos de cómputo. La elección del método usado para obtener un envolvente espectral estimado tiene generalmente implicaciones prácticas porque generalmente afecta la calidad percibida del sistema de comunicación; sin embargo, la selección del método no es crítica en principio. Esencialmente se puede usar cualquier técnica, según se desee . En una implementación que usa la estructura de subbandas mostrada en la tabla I, el estimador del envolvente espectral 720 obtiene un estimado del envolvente espectral únicamente para las subbandas 0, 1 y 2. La subbanda 3 es excluida para reducir la cantidad de información requerida para representar el envolvente espectral estimado. 4. Analizador Espectral El analizador espectral 722 analiza el envolvente espectral estimado, recibido del estimador del envolvente espectral 720 e información del analizador de la señal de banda base 710, que identifica los componentes espectrales que van a ser descartados, de una señal de banda base, y calcula uno o más parámetros de mezclado de ruido que van a ser usados por el receptor 142 para generar un componente de ruido para componentes espectrales trasladados. Una implementación preferida minimiza los requerimientos de velocidad de transferencia de datos, calculando y transmitiendo un solo parámetro de mezclado de ruido que vaya a ser aplicado por el receptor 142 a todos los componentes trasladados. Los parámetros de mezclado de ruido pueden ser calculados a través de cualquier número de diferentes métodos. Un método preferido deriva un solo parámetro de mezclado de ruido igual a una medida de planeidad que se calcula a partir de la relación de la media geométrica con respecto a la media aritmética, del espectro de potencia breve. La relación proporciona una indicación aproximada de la planeidad del espectro. Una mayor medida de planeidad espectral, que indica un espectro más plano, indica también que un nivel de mezclado de ruido mayor es apropiado. En una implementación alternativa del transmisor 136, los componentes espectrales son agrupados en múltiples subbandas tales como las que se presentan en la tabla I, y el transmisor 136 transmite un parámetro de mezclado de ruido para cada subbanda . Este define de manera más exacta la cantidad de .ruido que se va a mezclar con el contenido de frecuencia trasladada, pero requiere también de una mayor velocidad de transferencia de datos para transmitir los parámetros de mezclado de ruido, adicionales.
. Filtro de Señales de Banda Base El filtro 715 recibe información proveniente del analizador de señales de banda base 710, que identifica los componentes espectrales que son seleccionados para ser descartados de una señal de banda base, y elimina los componentes de frecuencia seleccionados, para obtener una representación en el dominio de la frecuencia, de la señal de banda base, para la transmisión o almacenamiento. Las figuras 3A y 3B son ilustraciones gráficas hipotéticas de una señal de audio y de una señal de banda base correspondiente. La figura 3A muestra el envolvente espectral de una representación en el dominio de la frecuencia 600 de una señal de audio hipotética. La figura 3B muestra el envolvente espectral de la señal de banda base 610 que permanece después de que la señal de audio es procesada para eliminar los componentes de altas frecuencias seleccionados. El filtro 715 puede ser implementado esencialmente de cualquier manera que remueva efectivamente los componentes de frecuencia que sean seleccionados para ser descartados. En una implementación el filtro 715 aplica una función de ventana en el dominio de la frecuencia, a la representación en el dominio de la frecuencia, de la señal de audio de entrada. La forma de la función de ventana se selecciona para proporcionar una negociación apropiada entre la selectividad de la frecuencia y la atenuación contra los efectos en el dominio del tiempo, en la señal de audio de salida, que es generada finalmente por el receptor 142. 6. Formateador de Señales El formateador de señales 725 genera una señal de salida a lo largo del canal de comunicación 140 combinando la información estimada del envolvente espectral, el uno o más parámetros de mezclado de ruido, y una representación de la señal de banda base hacia una señal de salida que tenga una forma apropiada para la transmisión o almacenamiento. Las señales individuales pueden ser combinadas esencialmente en cualquier manera. En muchas aplicaciones el formateador 725 multiplexa las señales individuales en una corriente de bitios en serie con patrones de sincronización apropiados, detección de errores y códigos de corrección, y otra información que sea pertinente para las operaciones ya sea de transmisión o de almacenamiento, o para aplicación en la que la información de audio sea utilizada. El formateador de señales 725 puede codificar también toda la señal de salida, o porciones de la misma, para reducir los requerimientos de la capacidad de información, para proporcionar seguridad, o para colocar la señal de salida en una forma que facilite su uso subsecuente.
C. Receptor La figura 4 es un diagrama de bloques del receptor 142 de conformidad con un aspecto de la presente invención. Un desformateador 805 recibe una señal proveniente del canal de comunicaciones 140 y obtiene de esta señal una señal de banda base, información estimada del envolvente espectral y uno o más parámetros de mezclado de ruido. Estos elementos de información son transmitidos a un procesador de señales 808 que comprende un regenerador espectral 810, un ajustador de fases 815, un filtro de mezclado 818 y un ajustador de ganancia 820. El regenerador del componente espectral 810 determina qué componentes espectrales faltan de la señal de banda base y los regenera trasladándolos todos, o al menos a algunos de los componentes espectrales, de la señal de banda base, hacia las ubicaciones de los componentes espectrales faltantes. Los componentes trasladados se pasan al ajustador de fase 815, el cual ajusta la fase de uno o más componentes espectrales en la señal combinada, para asegurar la coherencia de fases. El filtro de mezclado 818 suma uno o más componentes de ruido con los componentes trasladados, de acuerdo con uno o más parámetros de mezclado de ruido recibidos, con la señal de banda base. El ajustador de ganancia 820 ajusta la amplitud de componentes espectrales en la señal regenerada, de acuerdo con la información estimada del envolvente espectral, recibida con la señal de banda base. Los componentes espectrales, trasladados y ajustados, son combinados con la señal de banda base para producir una representación en el dominio de la frecuencia, de la señal de salida. Un banco de filtro de síntesis 825 procesa la señal para obtener una representación en el dominio del tiempo, de la señal de salida, que se pasa a lo largo de la ruta 145. 1. Desformateador El desformateador 805 procesa la señal recibida del canal de comunicación 140 en una manera que es complementaria al proceso de formateo proporcionado por el formateador de señales 725. En muchas aplicaciones el desformateador 805 recibe una corriente de bitios en serie, del canal 140, usa patrones de sincronización en la corriente de bitios para sincronizar su procesamiento, usa códigos de corrección y de detección para identificar y rectificar errores que fueron introducidos en la corriente de bitios durante la transmisión o almacenamiento, y opera como un desmultiplexor para extraer una representación de la señal de banda base, la información estimada del envolvente espectral, uno o más parámetros de mezclado de ruido, y cualquier otra información que pueda ser pertinente para la aplicación. El desformateador 805 puede descodificar también toda o porciones de la corriente de bitios en serie, para invertir los efectos de cualquier codificación proporcionada por el transmisor 136. Una representación en el dominio de la frecuencia, de la señal de banda base, se pasa al regenerador del componente espectral 810, y los parámetros de mezclado de ruido se pasan al filtro de mezclado 818 y la información del envolvente espectral se pasa al ajustador de ganancia 820. 2. Regenerador del Componente Espectral El regenerador del componente espectral 810 regenera los componentes espectrales faltantes mediante el -copiado o traslación de todos o al menos algunos de los componentes espectrales, de la señal de banda base, hacia las ubicaciones de los componentes faltantes de la señal. Los componentes espectrales pueden ser copiados en más de un intervalo de frecuencias, permitiendo con ello que una señal de salida sea generada con un ancho de' banda mayor que dos veces el ancho de banda de la señal de banda base. En una implementación del receptor 142, que usa únicamente las subbandas 0 y 1, mostradas anteriormente en la tabla I, la señal de banda base no contiene componentes espectrales por arriba de una frecuencia de corte de 5.5 kHz o aproximadamente de ese valor. Los componentes espectrales de señal de banda base son copiados o trasladados a una gama de frecuencias desde aproximadamente 5.5 kHz hasta aproximadamente 11.0 kHz. Si se desea un ancho de banda de 16.5 kHz, por ejemplo, los componentes espectrales de la señal de banda base pueden ser trasladados también a intervalos de frecuencias desde aproximadamente 11.0 kHz hasta aproximadamente 16.5 kHz. Generalmente, los componentes espectrales son trasladados en intervalos de frecuencias no traslapantes, de manera tal que no exista un espacio libre en el espectro que incluya la señal de banda base y todos los componentes espectrales copiados; sin embargo esta característica no es esencial. Los componentes espectrales pueden ser trasladados en intervalos de frecuencias traslapantes y/o en intervalos de frecuencia con espacios libres en el espectro, esencialmente en cualquier manera según se desee. La elección de qué componentes espectrales deberán ser copiados, puede ser variada para ajustarse a la aplicación particular. Por ejemplo, los componentes espectrales que sean copiados no necesitan empezar en el borde inferior de la banda base y no necesitan terminar en el borde superior de la banda base. La calidad percibida de la señal reconstruida por el receptor 142 puede a veces ser mejorada excluyendo frecuencias fundamentales de voz e instrumento y copiando únicamente las armónicas. Este aspecto se incorpora en una implementación excluyendo de la traslación a aquellos componentes espectrales de la banda base que se encuentren por debajo de aproximadamente 1 kHz. Haciendo referencia a la estructura de subbanda mostrada anteriormente en la tabla I como un ejemplo, únicamente se trasladan con los componentes espectrales desde aproximadamente 1 kHz hasta aproximadamente 5.5 kHz . Si el ancho de banda de los componentes espectrales que van a ser regenerados es más ancho que el ancho de banda de los componentes espectrales de banda base, que van a ser copiados, los componentes espectrales de banda base pueden ser copiados en una manera circular empezando con el componente de frecuencia más baja hasta el componente de frecuencia más alta y, si es necesario, envolviéndolo y continuando con el componente de frecuencia más baja. Por ejemplo, haciendo referencia a la estructura de subbanda mostrada en la tabla I, si únicamente componentes espectrales de banda base, desde aproximadamente 1 kHz hasta 5.5 kHz, van a ser copiados, y componentes espectrales van a ser regenerados para la subbandas 1 y 2 que abarcan frecuencias desde aproximadamente 5.5 kHz hasta 16.5 kHz, entonces los componentes espectrales de banda base desde aproximadamente 1 kHz hasta 5.5 kHz son copiados a las frecuencias respectivas desde aproximadamente 5.5 kHz hasta 10 kHz, los mismos componentes espectrales de banda base desde aproximadamente 1 kHZ hasta 5.5 kHz son copiados nuevamente a las frecuencias respectivas, desde aproximadamente 10 kHz hasta 14.5 kHz , y el componente espectral de banda base desde aproximadamente 1 kHz hasta 3 kHz es copiado a las frecuencias respectivas desde 14.5 kHz hasta 16.5 kHZ . Alternativamente este proceso de copiado puede llevarse a cabo para cada subbanda individual de componentes regenerados, copiando el componente de frec encia más baja de la banda base, en el borde inferior de la subbanda respectiva y continuando a través de los componentes espectrales de banda base, en una manera circular, según sea necesario, para completar la traslación para esa subbanda. Las figuras 5A a 5D son ilustraciones gráficas hipotéticas del envolvente espectral de una señal de banda base y del envolvente espectral de señales generadas por la traslación de componentes espectrales dentro de la señal de banda base . La figura 5A muestra una señal de banda base descodificada, hipotética 900. La figura 5B muestra componentes espectrales de la señal de banda base 905 trasladados a frecuencias mayores. La figura 5C muestra los componentes de la señal de banda base 910 trasladados múltiples veces a frecuencias mayores. La figura 5D muestra una señal resultante de la combinación de los componentes trasladados 915 y de la señal de banda base 920. 3. Ajustador de Fase La traslación de componentes espectrales puede crear discontinuidades en la fase de los componentes regenerados . La implementación de la transformación O-TDAC descrita anteriormente, por ejemplo, así como muchas otras implementaciones posibles, proporciona representaciones en el dominio de la frecuencia que se encuentran arregladas en bloques de coeficientes de transformación. Los componentes espectrales trasladados son también arreglados en bloques. Si los componentes espectrales regenerados por la traslación, tienen discontinuidades de fase entre bloques sucesivos, es probable que ocurran artefactos audibles en la señal de audio de salida. El ajustador de fase 815 ajusta la fase de cada componente espectral regenerado, para mantener una fase consistente o coherente. En una implementación del receptor 142, que emplea la transformación O-TDAC descrita anteriormente, cada uno de los componentes espectrales regenerados es multiplicado por el valor complejo ejA", en donde ?? representan el intervalo de frecuencias en que es trasladado el componente espectral respectivo, expresado como el número de coeficiente de transformación que corresponden a ese intervalo de frecuencias. Por ejemplo, si un componente espectral es trasladado a la frecuencia del componente adyacente, el intervalo de traslación ?? es igual a uno. Implementaciones alternativas pueden requerir de diferentes técnicas para el ajuste de fase, apropiadas para la implementación particular del banco de filtros de síntesis 825. El proceso de traslación puede ser adaptado para que haga coincidir con los componentes regenerados con las armónicas de los componentes espectrales significativos, en la señal de banda base. Dos formas en las que se pueda adaptar la traslación es cambiando ya sea los componentes espectrales específicos que sean copiados, o cambiando la cantidad de la traslación. Si se usa un proceso adaptativo, deberá tenerse un cuidado especial con respecto a la coherencia de fases si los componentes espectrales se encuentran arreglados en bloques. Si los componentes espectrales regenerados son copiados de diferentes componentes de base, de bloque a bloque, o si la cantidad de la traslación de la frecuencia es cambiada de bloque a bloque, es muy probable que los componentes regenerados no tengan coherencia de fase. Es posible adaptar la traslación de componentes espectrales pero debe tenerse cuidado en asegurar la audibilidad de artefactos causados porque la incoherencia de fase no es significativa. Un sistema que emplea técnicas de múltiples pasos o técnicas de anticipación, podrían identificar intervalos durante los cuales podría ser adaptada la traslación. Bloques que representen intervalos de una señal de audio en los que los componentes espectrales regenerados sean considerados inaudibles, son usualmente buenos candidatos para adaptar el proceso de traslación. 4. Filtro de Mezclado de Ruido El filtro de mezclado 818 genera un componente de ruido para los componentes espectrales trasladados, usando los parámetros de mezclado de ruido recibidos del desformateador 805. El filtro de mezclado 818 genera una señal de ruido, calcula una función de mezclado de ruido usando los parámetros de mezclado de ruido y utiliza la función de mezclado de ruido para combinar la señal de ruido con los componentes espectrales trasladados. Una señal de ruido puede ser generada a través de cualquiera de una variedad de formas. En una implementación preferida, una señal de ruido es producida generando una secuencia de números aleatorios que tienen una distribución con media de cero y varianza de uno. El filtro de mezclado 818 ajusta la señal de ruido multiplicando la señal de ruido por la función de mezclado de ruido. Si se usa un solo parámetro de mezclado de ruido, la función de mezclado de ruido generalmente se ajusta a la señal de ruido para tener mayor amplitud a mayores frecuencias. Esto se deduce de las suposiciones analizadas anteriormente de que las señales de la voz y de un instrumento musical natural tienden a contener más ruido a mayores frecuencias. En una implementación preferida, cuando componentes espectrales son trasladados a mayores frecuencias, una función de mezclado de ruido tiene una amplitud máxima a la frecuencia más · alta y decae suavemente hasta un valor mínimo a la frecuencia más baja a la cual se mezcla el ruido. Una implementacion usa una función de mezclado de ruido N( :) como se muestra en la siguiente expresión: N(/c) = máx ( k kmín +5_if0 kmáx~kmín en donde máx(x,y) = el mayor de x e y; B = un parámetro de mezclado de ruido en base a SF ; k = el índice de componentes espectrales regenerados ; Kmáx = la frecuencia más alta para la regeneración de componentes espectrales; y Kmín= la frecuencia más baja para la regeneración de componentes espectrales.
En esta implementacion, el valor de B varía de cero a uno, en donde uno indica un espectro plano que es típico de una señal de tipo ruido y cero indica una forma espectral que no es plana y es típica de una señal de tipo tono. El valor del cociente en la ecuación 1 varía de cero a uno a medida que k se incrementa de KmIn a Kmáx. Si B es igual a cero, el primer término en la función "máx" varía de uno negativo a cero; por lo tanto N(k) será igual a cero a través de todo el espectro regenerado y no se adicionará ruido a los componentes espectrales regenerados. Si B es igual a uno, el primer término en la función "máx" varía de cero a uno; por lo tanto, N(k) incrementa linealmente de cero, a la frecuencia regenerada más baja Kmín hasta un valor igual a uno, en la frecuencia regenerada máxima Kmáx. Si B tiene un valor entre cero y uno, N(k) es igual a cero de Kmln hasta alguna frecuencia entre Kmln y Km&x, y se incrementa linealmente para el resto del espectro regenerado. La amplitud de los componentes espectrales regenerados se ajusta multiplicando los componentes regenerados con la función de mezclado de ruido. La señal de ruido ajustada y los componentes espectrales regenerados, ajustados, son combinados. Esta implementación particular descrita anteriormente es solamente un ejemplo apropiado. Se pueden usar, según se desee, otras técnicas de mezclado de ruido. Las figuras 6A a 6G son ilustraciones gráficas hipotéticas de los envolventes espectrales de señales obtenidas mediante la regeneración de componentes de alta frecuencia, usando tanto la traslación espectral como el mezclado de ruido. La figura 6A muestra una señal de entrada hipotética 410 que va a ser transmitida. La figura 6B muestra la señal de banda base 420 producida descartando componentes de alta frecuencia. La figura 6C muestra los componentes de alta frecuencia regenerados 431, 432 y 433. La figura 6D representa una posible función de mezclado de ruido 440 que proporciona mayor peso a los componentes de ruido a mayores frecuencias. La figura 6E es una ilustración esquemática de una señal de ruido 445 que ha sido multiplicada por la función de mezclado de ruido 440. La figura 6F muestra una señal 450 generada mediante la multiplicación de los componentes de alta frecuencia .regenerados 431, 432 y 433 por la inversa de la función de mezclado de ruido 440. La figura 6G es una ilustración esquemática de una señal combinada 460 que resulta de adicionar la señal de ruido ajustada 445 a los componentes de alta frecuencia ajustados 450. La figura 6G sirve para ilustrar esquemáticamente que la porción de alta frecuencia 430 contiene una mezcla de los componentes de alta frecuencia trasladados 431, 432 y 433 y ruido.
. Ajustador de Ganancia El ajustador de ganancia 820 ajusta la amplitud de la señal regenerada, de acuerdo con la información estimada del envolvente espectral, recibida del desformateador 805. La figura 6H es una ilustración hipotética del envolvente espectral de la señal 460 mostrada en la figura 6G después del ajuste de ganancia. La porción 510 de la señal que contiene una mezcla de componentes espectrales trasladados y ruido, ha recibido un envolvente espectral que se aproxima al de la señal original 410 mostrada en la figura 6A. La reproducción del envolvente espectral en la escala precisa es generalmente innecesaria porque los componentes espectrales regenerados no reproducen exactamente los componentes espectrales de la señal original . Una serie armónica trasladada generalmente no será igual a una serie armónica; por lo tanto es generalmente imposible asegurar que la señal de salida regenerada es idéntica a la señal de entrada original en una escala fina. Aproximaciones burdas que coincidan con la energía espectral dentro de unas pocas bandas críticas o menos, han resultado funcionar bien. También se hará la observación de que el uso de un estimado burdo de la forma espectral en vez que una aproximación más fina, se prefiere generalmente porque el estimado burdo impone menores requerimientos de capacidades de información, en los canales de transmisión y en los medios de almacenamiento. En aplicaciones de audio que tienen más de un canal, no obstante, la formación de imágenes aurales pueden ser mejoradas mediante el uso de aproximaciones más finas de la forma espectral, de manera tal que se puedan realizar ajuste de ganancia más precisos a fin de asegurar un equilibrio apropiado entre canales. 6. Banco de Filtros de Síntesis Los componentes espectrales regenerados, con ganancia ajustada, proporcionados por el ajustador de ganancia 820 son combinados con la representación en el dominio de la frecuencia de la señal de banda base recibida del desfomateador 805 para formar una representación en el dominio de la frecuencia, de una señal reconstruida. Esto puede realizarse adicionando los componentes regenerados, a los componentes correspondientes, de la señal de banda base. La figura 7 muestra una señal reconstruida, hipotética, obtenida mediante la combinación de la señal de banda base mostrada en la figura 6B con los componentes regenerados mostrados en la figura 6H. El banco de síntesis 825 transforma la representación en el dominio de la frecuencia, en una representación en el dominio del tiempo, de la señal reconstruida. Este banco de filtros puede ser implementado esencialmente en cualquier manera pero deberá ser inverso con respecto al banco de filtros 705 usado en el transmisor 136. En la implementacion preferida analizada anteriormente, el receptor 142 usa la síntesis 0-TDAC que aplica una DCT modificada inversa.
D. Implemen aciones Alternativas de la Invención El ancho y ubicación de la señal de banda base pueden ser establecidos esencialmente en cualquier manera y pueden ser variados dinámicamente, por ejemplo, de acuerdo con las características de la señal de entrada. En una implementación alternativa, el transmisor 136 genera una señal de banda base descartando múltiples bandas de componentes espectrales, creando con ello espacio libre en el espectro de la señal de banda base. Durante la regeneración del componente espectral, porciones de la señal de banda base son trasladadas para regenerar los componentes espectrales faltantes. La dirección de la traslación puede ser variada también. En otra implementación, el transmisor 136 descarta los componentes espectrales a bajas frecuencias a fin de producir una señal de banda base localizada relativamente a frecuencias más altas. El receptor 142 traslada porciones de la señal de banda base de alta frecuencia hasta ubicaciones de menores frecuencias, para regenerar los componentes espectrales faltantes.
E. Control del Envolvente Temporal Las técnicas de regeneración analizadas anteriormente pueden regenerar una señal reconstruida que conserve substancialmente el envolvente espectral de la señal de audio de entrada; sin embargo, el envolvente temporal de la señal de entrada generalmente no es conservado. La figura 8A muestra la forma temporal de una señal de audio 860. La figura 8B muestra la forma temporal de una señal de salida reconstruida 870, producida mediante la derivación de una señal de banda base a partir de la señal 860 en la figura 8A y regenerando los componentes espectrales descartados, mediante un proceso de traslación de componentes espectrales. La forma temporal de la señal reconstruida 870 difiere significativamente de la forma temporal de la señal original 860. Los cambios en la forma temporal pueden tener un efecto significativo en la calidad percibida de una señal de audio regenerada. A continuación se analizan dos métodos para conservar el envolvente temporal . 1. Técnica en el Dominio del Tiempo En el primer método el transmisor 136 determina el envolvente temporal de la señal de audio de entrada en el dominio del tiempo y el receptor 142 restaura el mismo o substancialmente el mismo envolvente temporal para la señal reconstruida en el dominio del tiempo. a) Transmisor La figura 9 muestra un diagrama de bloques de una implementación del transmisor 136 en un sistema de comunicaciones que proporciona control del envolvente temporal, usando una técnica en el dominio del tiempo. El banco de filtros de análisis 205 recibe una señal de entrada desde la ruta 115 y divide la señal en múltiples señales de subbanda de frecuencia. La figura ilustra únicamente dos subbandas por claridad ilustrativa; sin embargo, el banco de filtros de análisis 205 puede dividir la señal de entrada en cualquier número entero de subbandas que sea mayor que uno. El banco de filtros de análisis 205 puede ser implementado esencialmente en cualquier manera, tal como uno o más Filtros de Espejos en Cuadratura (QMF) conectados en cascada o, preferentemente, mediante una técnica seudo-QMF que pueda dividir una señal de entrada en cualquier número entero de subbandas en una etapa de filtro. Información adicional acerca de la técnica seudo-QMF puede ser obtenida de Vaidyanathan, "Multirate Systems and Filter Banks", Prentice Hall, New Jersey, 1993, pp . 354-373. Una o más de las señales de subbanda se usan para formar una señal de banda base. Las señales de subbanda restantes contienen los componentes espectrales de la señal de entrada que son descartados. En muchas aplicaciones la señal de banda base se forma a partir de una señal de subbanda que representa los componentes espectrales de la frecuencia más baja, de la señal de entrada, pero no es necesario en principio. En una implementación preferida de un sistema para transmitir o registrar una señal digital de entrada, muestreada a una velocidad de 44.1 kilomuestras/segundo, el banco de filtros de análisis 205 divide la señal de entrada en cuatro subbandas que tienen intervalos de frecuencias como la que se mostraron anteriormente en la tabla I . La subbanda de frecuencia más baja se usa para formar la señal de banda base. Haciendo referencia a la implementación mostrada en la figura 9, el banco de filtros de análisis 205 deja pasar la señal de subbanda de menor frecuencia, como la señal de banda base hacia el estimador del envolvente temporal 213 y el modulador 214. El estimador del envolvente temporal 213 proporciona un envolvente temporal, estimado, de la señal de banda base, al modulador 214, y al. formateador de señales 225. Preferentemente, los componentes espectrales de la señal de banda base, que se encuentra por debajo de aproximadamente 500 Hz, son o excluidos del proceso que estima el envolvente temporal, o son atenuados a fin de que no tengan algún efecto significativo en la forma del envolvente temporal estimado. Esto puede conseguirse aplicando un filtro de paso alto, apropiado, a la señal que sea analizada por el estimador de envolvente temporal 213. El modulador 214 divide la amplitud de la señal de banda base entre el envolvente temporal estimado, y deja pasar al banco de filtro de análisis 215 una representación de la señal de banda base que es aplanada emporalmente. El banco de filtros de análisis 215 genera una representación en el dominio de la frecuencia, de la señal de banda base aplanada, que se deja pasar al codificador 220 para la codificación. El banco de filtros de análisis 215, así como el banco de filtros de análisis 212 analizado posteriormente, puede ser implementado esencialmente mediante cualquier transformación del dominio del tiempo al dominio de la frecuencia; sin embargo, una transformación como la transformación O-TDAC, que implemente un banco de filtros muestreado críticamente, es en general preferida. El codificador 220 es opcional; sin embargo su uso es preferido porque la codificación puede usarse generalmente para reducir los requerimientos de información de la señal de banda base aplanada. La señal de banda base aplanada, ya sea que se encuentre en forma codificada o no, se pasa al formateador de señales 225. El banco de filtros de análisis 205 pasa la señal de subbanda de mayor frecuencia, al estimador del envolvente temporal 210 y al modulador 211. El estimador del envolvente temporal 210 proporciona un envolvente temporal estimado, de la señal de subbanda de frecuencia más alta, al modulador 211 y al formateador de señales de salida 225. El modulador 211 divide la amplitud de la señal de subbanda de mayor frecuencia, entre el envolvente temporal estimado, y deja pasar al banco de filtros de análisis 212 una representación de la señal de subbanda de frecuencia más alta que está aplanada temporalmente. El banco de filtros de análisis 212 genera una representación en el dominio de la frecuencia, de la señal de subbanda de mayor frecuencia, aplanada. El estimador del envolvente espectral 720 y el analizador espectral 722 proporcionan un envolvente espectral estimado y uno o más parámetros de mezclado de ruido, respectivamente, para la señal de subbanda de mayor frecuencia, esencialmente en la misma manera que se describió anteriormente, y pasa esta información al formateador de señales 225. El formateador de señales 225 proporciona una señal de salida a lo largo del canal de comunicación 140 ensamblando una representación de la señal de banda base aplanada, los envolventes temporales estimados de la señal de banda base y la señal de subbanda de mayor frecuencia, el envolvente espectral estimado, y el uno o más parámetros de mezclado de ruido en la señal de salida. Las señales individuales y la información son ensambladas en una señal que tiene una forma que es apropiada para la transmisión o almacenamiento usando esencialmente cualquier técnica de formateo deseada, como se describió anteriormente para el formateador de señales 725. b) Estimador del Envolvente Temporal Los estimadores de envolventes temporales 210 y 213 pueden ser implementados en una amplia variedad de formas. En una implementación, cada uno de estos estimadores procesa una señal de subbanda que es dividida en bloques de muestras de señales de subbanda. Estos bloques de muestras de señales de subbanda son procesados también por cualesquiera de los bancos de filtros de análisis 212 o 215. En muchas implementaciones prácticas, los bloques arreglados para que contengan un número de muestras que sean una potencia de dos y mayor que 256 muestras. Ese tamaño de bloque se prefiere generalmente para mejorar la eficiencia y la resolución de la frecuencia de las transformaciones usadas para implementar los bancos de filtros de análisis 212 y 215. La longitud de los bloques puede ser adaptada también en respuesta a las características de la señal de entrada, tales como la présencia o ausencia de transitorios largos. Cada bloque es dividido adicionalmente en grupos de 256 muestras para la estimación del envolvente temporal. El tamaño de los grupos se selecciona para equilibrar un intercambio entre la exactitud del estimado y la cantidad de información requerida para conducir el estimado en la señal de salida. En una implementación el estimador del envolvente temporal calcula la potencia de las muestras en cada grupo de muestras de señales de subbanda. El conjunto de valores de potencia para el bloque de las muestras de señales de subbanda, es el envolvente temporal estimado para ese bloque.
En otra implementación, el estimador del envolvente temporal calcula el valor medio de las magnitudes de las muestras de señales de subbanda en cada grupo. El conjunto de medias para el bloque es el envolvente temporal estimado para ese bloque. El conjunto de valores en el envolvente estimado puede ser modificado en una variedad de formas. En un ejemplo, el envolvente para cada bloque es representado mediante un valor inicial para el primer grupo de muestras en el bloque y un conjunto de valores diferenciales que expresa los valores relativos para grupos subsecuentes. En otro ejemplo, se usan códigos ya sean diferenciales o absolutos, en una manera adaptativa, para reducir la cantidad de información requerida para conducir los valores. c) Receptor La figura 10 muestra un diagrama de bloques de una implementación del receptor 142 en un sistema de comunicación, que proporciona el control del envolvente temporal, usando una técnica en el dominio del tiempo. El desformateador 265 recibe una señal del canal de comunicación 140 y obtiene de esta señal una representación de una señal de banda base aplanada, envolventes temporales estimados de la señal de banda base y una señal de subbanda de mayor frecuencia, un envolvente espectral estimado y uno o más parámetros de mezclado de ruido. El descodificador 267 es opcional pero deberá ser usado para invertir los efectos de cualquier codificación realizada en el transmisor 135 para obtener una representación en el dominio de la frecuencia, de la señal de banda base aplanada. El banco de filtros de síntesis 280 recibe la representación en el dominio de la frecuencia, de la señal de banda base aplanada, y genera una representación en el dominio del tiempo, usando una técnica que sea el inverso de la usada mediante el banco de filtros de análisis 215 en el transmisor 136. El modulador 281 recibe el envolvente temporal estimado de la señal de banda base, del desformateador 265, y usa este envolvente estimado para modular la señal de banda base aplanada, recibida del banco de filtros de síntesis 280. Esta modulación proporciona una forma temporal que es substancialmente la misma que la forma temporal de la señal de banda base original, antes de que fuese aplanada por el modulador 214 en el transmisor 136. El procesador de señales 808 recibe la representación en el dominio de la frecuencia, de la señal de banda base aplanada, el envolvente espectral estimado y el uno o más parámetros de mezclado de ruido, del desformateador 265, y regenera los componentes espectrales de la misma manera que se analizó anteriormente para el procesador de señales 808 mostrado en la figura 4. Los componentes espectrales regenerados se pasan al banco de filtros de síntesis 283, lo cual genera una representación en el dominio del tiempo, usando una técnica que es la inversa de la usada por los bancos de filtros de análisis 212 y 215 en el transmisor 136. El modulador 284 recibe el envolvente temporal estimado, de la señal de subbanda de .mayor frecuencia, del desformateador 265, y usa este envolvente estimado para modular la señal de componentes espectrales regenerados, recibida del banco de filtros de síntesis 283. Esta modulación proporciona una forma temporal que es substancialmente la misma que la forma temporal de la señal de subbanda de mayor frecuencia, original, antes de que fuese aplanada por el modulador 211 en el transmisor 136. La señal de subbanda modulada y la señal de subbanda de mayor frecuencia, modulada, se combinan para formar una señal reconstruida, la cual se pasa al banco de filtros de síntesis 287. El banco de filtros de síntesis 287 usa técnica inversa a la usada por el banco de filtros de análisis 205 en el transmisor 136 para proporcionar a lo largo de la ruta 145 una señal de salida que sea perceptualmente indistinguible o casi indistinguible a la señal de entrada original proveniente de la ruta 115 por el transmisor 136. 2. Técnica en el dominio de la Frecuencia En el segundo método, el transmisor 136 determina el envolvente temporal de la señal de audio de entrada, en el dominio de la frecuencia, y el receptor 142 restaura el mismo o substancialmente el mismo envolvente temporal, a la señal reconstruida, en el dominio de la frecuencia. a) Transmisor La figura 11 muestra un diagrama de bloques de una implementación del transmisor 136 en un sistema de comunicación que proporciona control del envolvente temporal, usando una técnica en el dominio de la frecuencia. La implementación de este transmisor es muy similar a la implementación del transmisor mostrado en la figura 2. La diferencia principal es el estimador del envolvente temporal 707. Los otros componentes no se analizan aquí con detalle porque su funcionamiento es esencialmente el mismo que el que se describió anteriormente con relación a la figura 2. Haciendo referencia a la figura 11, el estimador del envolvente temporal 707 recibe del banco de filtros de análisis 705 una representación en el dominio de la frecuencia, de la señal de entrada, la cual se analiza para derivar un estimado del envolvente temporal de la señal de entrada. Preferentemente, los componentes espectrales que se encuentran por debajo de aproximadamente 500 Hz son excluidos de la representación en el dominio de frecuencia o son atenuados de manera tal que no tengan un efecto significativo en el proceso que estima el envolvente temporal . El estimador del envolvente temporal 707 obtiene una representación en el dominio de la frecuencia, de una versión temporalmente aplanada, de la señal de entrada, desconvolucionando una representación en el dominio de la frecuencia, del envolvente temporal estimado y la representación en el dominio de la frecuencia, de la señal de entrada. Esta desconvolución puede ser realizada convolucionando la representación al dominio de la frecuencia, de la señal de entrada, con un inverso de la representación en el dominio de la frecuencia, del envolvente temporal estimado. La representación en el dominio de la frecuencia, de una versión temporalmente aplanada de la señal de entrada, se pasa al filtro 715, al analizador de la señal de banda base 710, y al estimador del envolvente espectral 720. Una descripción de la representación en el dominio de la frecuencia, del envolvente temporal estimado, se pasa al formateador de señales 725 para ensamblarlas en la señal de salida que se hace pasar a "lo largo del canal de comunicación 140. b) Estimador del Envolvente Temporal El estimador del envolvente temporal 707 puede ser implementado en un número de formas. La base técnica para una implementación del estimador del envolvente temporal puede ser explicada en términos del sistema lineal mostrado en la ecuación 2 : y(t) = h(t) -x(t) (2) en donde y(t) = una señal que va a ser transmitida ; h (t) = El envolvente temporal de la señal que va a ser transmitida; el símbolo ( · ) denota multiplicación; y x(t) = una versión, temporalmente plana, de la señal y (t) .
La ecuación 2 puede ser reescrita como: Y[k] = H[k]*X[k] (3) en donde Y[k] = una representación en el dominio de la frecuencia, de la señal de entrada y(t); H [k] = una representación en el dominio de la frecuencia de h(t); el símbolo asterisco (*) denota convolución,- y X [k] = una representación en el dominio de la frecuencia de x(t). Haciendo referencia a la figura 11, la señal y(t) es la señal de audio que recibe el transmisor 136 desde la ruta 115. El banco de filtros de análisis 705 proporciona la representación en el dominio de la frecuencia Y[k] de la señal y(t). El estimador del envolvente temporal 707 obtiene un estimado de la representación en el dominio de la frecuencia H[k] del envolvente temporal de la señal (t) resolviendo un conjunto de ecuaciones derivadas de un modelo de promedio móvil autoregresivo (ARMA) de Y[k] y X[k] . Información adicional acerca del uso de los modelos ARMA puede ser obtenida a partir de Proakis and Manolakis, "Digital Signal Processing: Principies, Algorithms and Applications", MacMillan Publishing Co . , New York, 1988. Ver especialmente las páginas 818-821. En una implementación preferida del transmisor 136, el banco de filtros 705 aplica una transformación a bloques de muestras que representen la señal y(t) para proporcionar la representación en el dominio de la frecuencia Y[k] arreglada en bloques de coeficientes de transformación. Cada bloque de coeficiente de transformación expresa un espectro breve de la señal y(t). La representación en el dominio de la frecuencia X [k] se encuentra arreglada también en bloques. Cada bloque de coeficiente en la representación en el dominio de la frecuencia X [k] representa un bloque de muestras para la señal temporalmente plana x(t) que se asume estacionaria, en amplio sentido (WSS) . También se asume que los coeficientes en cada bloque de la representación X [k] se encuentran distribuidos independientemente (ID) . Dadas estas suposiciones, las señales pueden ser expresadas a través de un modelo ARMA como sigue : La ecuación 4 puede ser resuelta para ax y bq resolviendo para la autocorrelación de Y[k] ·. en donde E/ denota la función de valor esperado; L = Longitud de la porción autoregresiva del modelo ARMA; y Q = Longitud de la porción promedio móvil del modelo ARMA. La Ecuación 5 puede ser reescrita como: () en donde Ryy [n] denota la autocorrelacion de Y [n] ; y Rxy[k] denota la correlación cruzada de Y [k] y X[k] Si además se asume que el sistema lineal representado por H [k] es únicamente autoregresivo, entonces el segundo término del lado derecho de la ecuación 6 es igual a la varianza o2 x de X [k] . La ecuación 6 puede ser reescrita entonces como: - Ta,Rn [m-¡] para m > 0 i-A L Rn.[m)= - a,Rrr [m —/]+ s y para m = 0 (7) Rn [m] para m < ü La ecuación 7 puede ser resuelta invirtiendo el siguiente conjunto de ecuaciones lineales: -Rn[0] Rn[~\] ½[2] · • RyÁ-L] ' " l " ½[1] *nl<] [-'] ' • Rn{-L + l] a? 0 ½Í2] ?GG? · ¦ Rn[-L + 2] a2 0 R„[L] ½^-?] ?„[?--2] ¦ ¦ ?/t[] . 0 Proporcionando estos antecedentes, ahora es posible describir una implementación de un estimador de envolvente temporal que usa técnicas en el dominio de la frecuencia. En esta implementación, el estimador del envolvente temporal 707 recibe una representación en el dominio de la frecuencia Y[k] de una señal de entrada y(t) y calcula la secuencia de autocorrelación Rxx [m] por -L = m = L. Estos valores se usan para construir la matriz mostrada en la ecuación 8. La matriz se invierte después para resolver para los coeficientes a±. Debido a que la matriz en la ecuación 8 es de Toeplitz, puede ser invertida mediante el algoritmo de Levinson-Durbin . Para información, ver Proakis and Manolakis, pp. 458-462. El conjunto de ecuaciones obtenidas mediante la inversión de la matriz no puede ser resuelto directamente porque la varianza s2 x de X [k] no es conocida; sin embargo, el conjunto de ecuaciones puede ser resuelto para alguna varianza arbitraria tal como el valor uno. Una vez resuelto para este valor arbitrario, el conjunto de ecuaciones produce un conjunto de coeficientes no normalizados fa'Q...,a'J. Estos coeficientes no son normalizados porque las ecuaciones fueron resueltas para' una varianza arbitraria. Los coeficientes pueden ser normalizados dividiendo cada uno entre el valor del primer coeficiente no normalizado a'0, puede ser expresado como: a para Q < i = L. (9) La varianza puede ser obtenida a partir de la siguiente ecuación. 1 (10) "o El conjunto de coeficientes normalizados {l, alr...,aLJ representa los ceros del filtro de aplanamiento FF que puede ser convolucionado con una representación en el dominio de la frecuencia Y [k] de una señal de entrada y(t) para obtener una representación en el dominio de la frecuencia X [k] de una versión temporalmente aplanada x(t) de la señal de entrada. El conjunto de coeficientes normalizados representa también los polos de un filtro de reconstrucción FR que pueden ser convolucionados con la representación del dominio de la frecuencia X[k] de una señal temporalmente plana x(t) para obtener una representación en el dominio de la frecuencia de la señal plana que tiene una forma temporal, modificada, substancialmente igual al envolvente temporal de la señal de entrada y(t). El estimador del envolvente temporal 707 convoluciona el filtro de aplanamiento FF con la representación en el dominio de la frecuencia Y[k] recibida del banco de filtros 705 y deja pasar el resultado temporalmente aplanado al filtro 715, al analizador de señales de banda base 710, y al estimador del envolvente espectral 720. Una descripción de los coeficientes en el filtro de aplanamiento FF se pasa al formateador de señales 725 para el ensamble en la señal de salida que se pasa por la ruta 140. c) Receptor La figura 12 muestra un diagrama de bloques de una implementación del receptor 142 en un sistema de comunicación que proporciona control del envolvente temporal usando una técnica en el dominio de la frecuencia. La implementación de este receptor es muy similar a la implementación del receptor mostrado en la figura 4. La diferencia principal es el regenerador del envolvente temporal 807. Los otros componentes no se analizan aquí con detalle porque su funcionamiento es esencialmente el mismo que el que se describió anteriormente con relación a la figura 4. Haciendo referencia a la figura 12, el regenerador del envolvente temporal 807 recibe del desformateador 805 una descripción de un envolvente temporal estimado, el cual es convolucionado con una representación en el dominio de la frecuencia de una señal reconstruida. El resultado obtenido de la convolución se hace pasar al banco de filtros de síntesis 825, el cual proporciona por la ruta 145 una señal de salida que es perceptualmente indistinguible o casi indistinguible de la señal de entrada original recibida de la ruta 115 por el transmisor 136. El regenerador del envolvente temporal 807 puede ser implementado en cierto número de formas. En una implementación compatible con la implementación del estimador del envolvente, analizada anteriormente, el desformateador 805 proporciona un conjunto de coeficientes que representan los polos de un filtro de reconstrucción FR, el cual es convolucionado con la representación en el dominio de la frecuencia de la señal reconstruida. d) Implementaciones Alternativas Son posibles implementaciones alternativas. En una alternativa para el transmisor 136, los componentes espectrales de la representación en el dominio de la frecuencia, recibidos del banco de filtros 705, son agrupados en subbandas de frecuencia. El conjunto de subbandas mostrado en la tabla I es un ejemplo apropiado. Un filtro de aplanamiento FF es derivado para cada subbanda y convolucionado con la representación en el dominio de la frecuencia de cada subbanda para aplanarlo temporalmente. El formateador de señales 725 ensambla en la señal de salida una identidad del envolvente temporal estimado para cada subbanda . El receptor 142 recibe la identificación del envolvente para cada subbanda, obtiene un filtro de regeneración apropiado FR para cada subbanda, y lo convoluciona con una representación en el dominio de la frecuencia de la subbanda correspondiente en la señal reconstruida . En otra alternativa, múltiples conjuntos de coeficientes son almacenados en una tabla. Los coeficientes {l, a1...,aL} para el filtro de aplanamiento FF son calculados para una señal de entrada, y los coeficientes calculados son comparados con cada uno de los múltiples conjuntos de coeficientes almacenados en la tabla. El conjunto {C±}j en la tabla que es considerado el más cercano a os coeficientes calculados, se selecciona y usa para aplanar la señal de entrada. Una identificación del conjunto {Ci } j que es seleccionado de la tabla, se hace pasar al formateador de señales 725 para ser ensamblado a la señal de salida. El receptor 142 recibe la identificación del conjunto {CiJj , consulta una tabla de conjuntos de coeficientes almacenados para obtener el conjunto de coeficientes apropiado {Cijj i deriva un filtro de regeneración FR que corresponde a los coeficientes, y convoluciona el filtro con una representación en el dominio de la frecuencia, de la señal reconstruida. Esta alternativa puede ser aplicada también a subbandas como se analizó anteriormente.
Una forma en la que un conjunto de coeficientes en la tabla puede ser seleccionado, es definir un punto objetivo en un espacio L-dimensional que tenga coordenadas euclidianas iguales a los coeficientes calculados {a1...,a.L} para la señal de entrada o subbanda de la señal de entrada. A cada uno de los conjuntos almacenados en la tabla define también un punto respectivo en el espacio L-dimensional. El conjunto almacenado en la tabla cuyo punto asociado tiene la distancia Euclidiana más corta al punto objetivo, es considerado el más cercano a los coeficientes calculados. Si la tabla almacena 256 conjuntos de coeficientes, por ejemplo, podrían pasarse un número de ocho bitios al formateador de señales 725 para identificar el conjunto de coeficientes seleccionado. F. Implementaciones La presente invención puede ser implementada en una amplia variedad de formas. Se pueden usar tecnologías analógicas y digitales según se desee. Varios aspectos pueden ser implementados mediante componentes eléctricos discretos, circuitos integrados, arreglos lógicos programables , ASICs y otros tipos de componentes electrónicos, y, por ejemplo, mediante dispositivos que ejecuten programas de instrucciones. Los programas de instrucciones pueden ser portados esencialmente por cualesquiera medios legibles por dispositivos, tales como medios de almacenamiento magnéticos y ópticos, memoria únicamente de lectura y memoria programable .

Claims (33)

  1. REIVINDICACIONES 1. Un método para procesar una señal de audio, caracterizado porque comprende: obtener una representación en el dominio de la frecuencia, de una señal de banda base, que tiene algunos pero no todos los componentes espectrales de la señal de audio; obtener un envolvente espectral estimado, de una señal residual que tiene componentes espectrales de la señal de audio, que no se encuentran en la señal de banda base; derivar un parámetro de mezclado de ruido a partir de una medida del contenido de ruido de la señal residual; y, ensamblar datos que representen la representación en el dominio de la frecuencia, de la señal de banda base, el envolvente espectral estimado y el parámetro de mezclado de ruido, en una señal de salida apropiada para la transmisión o almacenamiento.
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque la representación en el dominio de la frecuencia, de la señal de banda base, se obtiene para representar segmentos de señales cuya longitud varía.
  3. 3. El método de conformidad con la reivindicación 2, caracterizado porque comprende aplicar una transformación de análisis de cancelación de la identidad en el dominio del tiempo, para obtener la representación en el dominio de la frecuencia, de la señal de banda base.
  4. 4. El método de conformidad con la reivindicación 1, caracterizado porque comprende: obtener una representación en el dominio de la frecuencia, de la señal de audio; y, obtener la representación en el dominio de la frecuencia, de la señal de banda base, a partir de una porción de la representación en el dominio de la frecuencia, de la señal de audio .
  5. 5. El método de conformidad con la reivindicación 1, caracterizado porque comprende: obtener una pluralidad de señales de subbanda que representen la señal de audio; obtener la representación en el dominio de la frecuencia de la señal de banda base, mediente la aplicación de un primer banco de filtros de análisis, a un primer grupo de una o más señales de subbanda, que incluya algunas pero no todas de la pluralidad de señales de subbanda; y, obtener el envolvente espectral estimado, de la señal residual, analizando una señal obtenida mediante la aplicación de un segundo banco de filtros de análisis, a un segundo grupo de una o más señales de subbanda que no estén incluidas en el primer grupo de señales de subbanda.
  6. 6. El método de conformidad con la reivindicación 5, caracterizado porque comprende: obtener una representación temporalmente aplanada, del segundo grupo de señales de subbanda, modificando el segundo grupo de señales de subbanda, de acuerdo con un inverso de un envolvente temporal estimado, del segundo grupo de señales de subbanda, en donde el envolvente espectral estimado, de la señal residual, y el parámetro de mezclado de ruido, son obtenidos en respuesta a la representación temporalmente aplanada del segundo grupo de señales de subbanda; y, ensamblar datos en la señal de salida que representen el envolvente temporal estimado, del segundo grupo de señales de subbanda.
  7. 7. El método de conformidad con la reivindicación 6, caracterizado porque comprende: obtener una representación temporalmente aplanada del primer grupo de señales de subbanda, modificando el primer grupo de señales de subbanda de acuerdo con un inverso de un envolvente temporal estimado, del primer grupo de señales de subbanda, en donde la representación en el dominio de la frecuencia, de la señal de banda base, se obtiene en respuesta a la representación temporalmente aplanada del primer grupo de señales de subbanda; y, ensamblar datos en la señal de salida, que representen el envolvente temporal estimado, del primer grupo de señales de subbanda.
  8. 8. Un método para procesar una señal de audio, caracterizado porque comprende: obtener una pluralidad de señales de subbanda que represente la señal de audio; obtener una representación en el dominio de la frecuencia, de una señal de banda base, mediante la aplicación de un primer banco de filtros de análisis, a un primer grupo de una o más señales de subbanda que incluya algunas pero no todas de la pluralidad de señales de subbanda; obtener una representación temporalmente aplanada, de un segundo grupo de una o más señales de subbanda, que no estén incluidas en el primer grupo de señales de subbanda, modificando el segundo grupo de señales de subbanda, de acuerdo con un inverso de un envolvente temporal estimado, del segundo grupo de señales de subbanda; obtener un envolvente espectral estimado, de la representación temporalmente aplanada del segundo grupo de señales de subbanda; derivar un parámetro de mezclado de ruido, a partir de una medida del contenido de ruido de la representación temporalmente aplanada, del segundo grupo de señales de subbanda; y, ensamblar datos que representen la representación en el dominio de la frecuencia, de la señal de banda base, el envolvente espectral estimado, y el parámetro de mezclado de ruido, en una señal de salida, apropiada para la transmisión o almacenamiento.
  9. 9. Un método para generar una señal de audio reconstruida, caracterizado porque comprende: recibir una señal que contenga datos que representen una señal de banda base derivada de la señal de audio, un envolvente espectral estimado, y un parámetro de mezclado de ruido derivado de una medida del contenido de ruido de la señal de audio; obtener de los datos, una representación en el dominio de la frecuencia, de la señal de banda base; obtener una señal regenerada que comprenda los componentes espectrales regenerados, trasladando componentes espectrales de la banda base en la frecuencia; ajusfar la fase de los componentes espectrales regenerados, para mantener la coherencia de fase en la señal regenerada; obtener una señal regenerada, ajustada, obteniendo una señal de ruido en respuesta al parámetro de mezclado de ruido, modificando la señal regenerada mediante el ajuste de amplitudes de los componentes espectrales regenerados, de acuerdo con el envolvente espectral estimado y el parámetro de mezclado de ruido, y combinando la señal regenerada modificada, con la señal de ruido; y, obtener una representación en el dominio del tiempo, de la señal reconstruida, que corresponda a una combinación de los componentes espectrales en la señal regenerada ajustada, con componentes espectrales en la representación en el dominio de la frecuencia de la señal de banda base .
  10. 10. El método de conformidad con la reivindicación 9, caracterizado porque la representación en el dominio del tiempo, de la señal reconstruida, se obtiene para representar segmentos de la señal reconstruida, cuya longitud varía.
  11. 11. El método de conformidad con la reivindicación 10, caracterizado porque comprende aplicar una transformación de síntesis de cancelación de identidad en el dominio del tiempo, para obtener la representación, en el dominio del tiempo, de la señal reconstruida.
  12. 12. El método de conformidad con la reivindicación 9, caracterizado porque comprende adaptar la traslación de los componentes espectrales, cambiando los componentes espectrales que sean trasladados o cambiando la cantidad de la frecuencia en la cual sean trasladados los componentes espectrales, en donde la representación en el dominio de la frecuencia, de la señal de banda base, es arreglada en bloques y la traslación de los componentes espectrales es adaptada cuando los componentes espectrales regenerados, que resultan de la traslación adaptada, son considerados como inaudibles.
  13. 13. El método de conformidad con la reivindicación 9, caracterizado porque obtiene la señal de ruido en una manera tal que sus componentes espectrales tienen magnitudes que varían substancialmente en forma inversa con la frecuencia.
  14. 14. El método de conformidad con la reivindicación 9, caracterizado porque comprende: obtener la señal reconstruida combinando los componentes espectrales de la señal regenerada, ajustada, y los componentes espectrales en la representación en el dominio de la frecuencia, de la señal de banda base; y, obtener la representación en el dominio del tiempo, de la señal reconstruida, aplicando un banco de filtros de síntesis, a la señal reconstruida.
  15. 15. El método de conformidad con la reivindicación 9, caracterizado porque comprende: obtener una representación en el dominio del tiempo, de la señal de banda base, aplicando un primer banco de filtros de síntesis a la representación en el dominio de la frecuencia, de la señal de banda base; obtener una representación en el dominio del tiempo, de la señal regenerada, ajustada, aplicando un segundo banco de filtros de síntesis, a la señal regenerada ajustada; y, obtener la representación en el dominio del tiempo, de la señal reconstruida, de manera tal que represente una combinación de la representación en el dominio del tiempo, de la señal de banda base, y la representación en el dominio del tiempo, de la señal regenerada ajustada.
  16. 16. El método de conformidad con la reivindicación 15, caracterizado porque comprende: modificar la representación en el dominio del tiempo, de la señal regenerada, ajustada, de acuerdo con un envolvente temporal estimado, obtenido a partir de los datos; y, obtener la señal reconstruida, combinando la representación en el dominio del tiempo, de la señal de banda base, y la representación en el dominio del tiempo, modificada, de la señal regenerada ajustada .
  17. 17. El método de conformidad con la reivindicación 16, caracterizado porque comprende: modificar la representación en el dominio del tiempo, de la señal de banda base, de acuerdo con otro envolvente temporal estimado, obtenido a partir de los datos; y, obtener la señal reconstruida, combinando la representación en el dominio del tiempo, modificada, de la señal de banda base, y la representación en el dominio del tiempo, modificada, de la señal regenerada ajustada.
  18. 18. Un método para generar una señal de audio reconstruida, caracterizado porque comprende: recibir una señal que contenga datos que representen una señal de banda base, derivada a partir de la señal de audio, un envolvente espectral estimado, un envolvente temporal estimado, y un parámetro de mezclado de ruido; obtener a partir de los datos, una representación en el dominio de la frecuencia, de la señal de banda base; obtener una señal regenerada que comprenda componentes espectrales regenerados, trasladando componentes espectrales de la banda base en la frecuencia; a ustar la fase de los componentes espectrales regenerados, para mantener la coherencia de fase en la señal regenerada; obtener una señal de ruido en respuesta al parámetro de mezclado de ruido; obtener una señal regenerada ajustada, ajustando amplitudes de los componentes espectrales regenerados, de acuerdo con el envolvente espectral estimado y combinándolos con la señal de ruido; obtener una representación en el dominio del tiempo, de la señal de banda base, aplicando un primer banco de filtros de síntesis a la representación en el dominio de la frecuencia, de la señal de banda base; obtener una representación en el dominio del tiempo, de la señal regenerada ajustada, aplicando un segundo banco de filtros de síntesis, a la señal regenerada ajustada, y aplicando una modulación de acuerdo con el envolvente temporal estimado; y, obtener una representación en el dominio del tiempo, de la señal reconstruida, de manera tal que represente una combinación de la representación en el dominio del tiempo, de la señal de banda base, y la representación en el dominio del tiempo, modificada, de la señal regenerada ajustada.
  19. 19. Un medio legible por un dispositivo y que porta uno o más programas de instrucciones para la ejecución por parte del dispositivo, a fin de ejecutar un método para procesar una señal de audio, el método está caracterizado porque comprende: obtener una representación en el dominio de la frecuencia, de una señal de banda base, que tiene algunos pero no todos los componentes espectrales de la señal de audio,· obtener un envolvente espectral estimado, de una señal residual que tiene componentes espectrales de la señal de audio, que no se encuentran · en la señal de banda base; derivar un parámetro de mezclado de ruido, a partir de una medida de contenido de ruido de la señal residual; y, ensamblar datos que representen la representación en el dominio de la frecuencia, de la señal de banda base, el envolvente espectral estimado y el parámetro de mezclado de ruido en una señal de salida apropiada para la transmisión o almacenamiento .
  20. 20. El medio de conformidad con la reivindicación 19, caracterizado porque el método comprende: obtener una representación en el dominio de la frecuencia, de la señal de audio; y, obtener la representación en el dominio de la frecuencia, de la señal de banda base, de una porción de la representación en el dominio de la frecuencia, de la señal de audio .
  21. 21. El medio de conformidad con la reivindicación 19, caracterizado porque el método comprende: obtener una pluralidad de señales de subbanda que representen la señal de audio; obtener la representación en el dominio de la frecuencia, de la señal de banda base, mediante la aplicación de un primer banco de filtros de análisis, a un primer grupo de una o más señales de subbanda que incluya algunas pero no todas de la pluralidad de señales de subbanda; y, obtener el envolvente espectral estimado, de la señal residual, analizando una señal obtenida mediante la aplicación de un segundo banco de filtros de análisis, a un segundo grupo de una o más señales de subbanda que no estén incluidas en el primer grupo de señales de subbanda.
  22. 22. El medio de conformidad con la reivindicación 21, caracterizado porque el método comprende: obtener una representación temporalmente aplanada, del segundo grupo de señales de subbanda, modificando el segundo grupo de señales de subbanda, de acuerdo con un inverso de un envolvente temporal estimado, del segundo grupo de señales de subbanda, en donde el envolvente espectral estimado, de la señal residual, y el parámetro del mezclado de ruido, se obtienen en respuesta a la representación temporalmente aplanada del segundo grupo de señales de subbanda: y, ensamblar datos en la señal de salida que representen el envolvente temporal estimado, del segundo grupo de señales de subbanda.
  23. 23. El medio de conformidad con la reivindicación 22, caracterizado porque el método comprende: obtener una presentación temporalmente aplanada, del primer grupo de señales de subbanda, modificando el primer grupo de señales de subbanda de acuerdo con un inverso de un envolvente temporal estimado, del primer grupo de señales de subbanda, en donde la representación en el dominio de la frecuencia, de la señal de banda base, se obtiene en respuesta a la representación temporalmente aplanada del primer grupo de señales de subbanda; y, ensamblar datos en la señal de salida que representen el envolvente temporal estimado del primer grupo de señales de subbanda.
  24. 24. Un medio legible mediante un dispositivo, y que porta uno o más programas de instrucciones para la ejecución por el dispositivo, para ejecutar un método para procesar una señal de audio, en donde el método comprende: obtener una pluralidad de señales de subbanda que represente la señal de audio; obtener una representación en el dominio de la frecuencia, de una señal de banda base, mediante la aplicación de un primer banco de filtros de análisis a un primer grupo de una o más señales de subbanda que incluya algunas pero no todas de la pluralidad de señales de subbanda; obtener una representación temporalmente aplanada de un segundo grupo de una o más señales de subbanda que no estén incluidas en el primer grupo de señales de subbanda, modificando el grupo de señales de subbanda de acuerdo con un inverso de un envolvente temporal estimado del segundo grupo de señales de subbanda, obtener un envolvente espectral estimado de la representación temporalmente aplanada del segundo grupo de señales de subbanda; derivar un parámetro de mezclado de ruido, a partir de una medida de contenido de ruido de la representación temporalmente aplanada del segundo grupo de señales de subbanda; y ensamblar datos que representen la representación en el dominio de la frecuencia, de la señal de banda base, el envolvente espectral estimado y el parámetro de mezclado de ruido, en una señal de salida apropiada para la transmisión o almacenamiento.
  25. 25. Un medio legible por un dispositivo y que porta uno o más programas de instrucciones para la ejecución por parte del dispositivo, a fin de ejecutar un método para generar una señal de audio reconstruida, caracterizado porque el método comprende: recibir una señal que contengan datos que representen una señal de banda base derivada de la señal de audio, un envolvente espectral estimado, y un parámetro de mezclado de ruido derivado de una medida del contenido de ruido de la señal de audio; obtener de los datos una representación del dominio de frecuencia, de la señal de banda base; obtener una señal regenerada que comprenda componentes espectrales regenerados, trasladando los componentes espectrales de la banda base en la frecuencia; ajustar la fase de los componentes espectrales regenerados para mantener la coherencia de fase dentro de la señal regenerada; obtener una señal regenerada, ajustada, obteniendo una señal de ruido en respuesta al parámetro de mezclado de ruido, modificando la señal regenerada mediante el ajuste de amplitudes de los componentes espectrales regenerados, de acuerdo con el envolvente espectral estimado y el parámetro de mezclado de ruido, y combinar la señal regenerada, modificada, con la señal de ruido; y, obtener una representación en el dominio del tiempo, de la señal reconstruida, que corresponda a una combinación de los componentes espectrales en la señal regenerada, ajustada, con componentes espectrales en la representación en el dominio de la frecuencia, de la señal de banda base.
  26. 26. El medio de conformidad con la reivindicación 25, caracterizado porque el método obtiene la señal de ruido de una manera tal que sus componentes espectrales tienen magnitudes que varían substancialmente en forma inversa con la frecuencia.
  27. 27. El medio de conformidad con la reivindicación 25, caracterizado porque el método comprende: obtener la señal reconstruida combinando los componentes espectrales de la señal regenerada ajustada y los componentes espectrales en la representación en el dominio de la frecuencia, de la señal de banda base; y, obtener la representación en el dominio del tiempo de la señal reconstruida, mediante la aplicación de un banco de filtros de síntesis a la señal reconstruida.
  28. 28. El medio de conformidad con la reivindicación 25, caracterizado porque el método comprende: obtener una representación en el dominio del tiempo, de la señal de banda base, aplicando un primer banco de filtros de síntesis a la representación en el dominio de frecuencia de la señal de banda base; obtener una representación en el dominio del tiempo, de la señal regenerada ajustada, aplicando un segundo banco de filtros de síntesis a la señal regenerada, ajustada; y, obtener la representación en el dominio del tiempo, de la señal reconstruida, de manera tal que represente una combinación de la representación en el dominio del tiempo, de la señal de banda base, y de la representación en el dominio del tiempo de la señal regenerada, ajustada.
  29. 29. El medio de conformidad con la reivindicación 28, caracterizado porque el método comprende: modificar la representación en el dominio del tiempo, de la señal regenerada ajustada, de acuerdo con un envolvente temporal estimado, obtenido de los datos; y, obtener la señal reconstruida combinando la representación en el dominio en el tiempo, de la señal de banda base, y la representación en el dominio del tiempo, modificada, de la señal regenerada, ajustada.
  30. 30. El medio de conformidad con la reivindicación 29, caracterizado porque el método comprende: modificar la representación en el dominio del tiempo, de la señal de banda base, de acuerdo con otro envolvente temporal, estimado, obtenido a partir de los datos; y, obtener la señal reconstruida, combinando la representación en el dominio del tiempo, modificada, de la señal de banda base, y la representación en el dominio del tiempo, modificada, de la señal regenerada ajustada.
  31. 31. Un medio legible por un dispositivo y que porta uno o más programas de instrucciones para la ejecución por parte del dispositivo, a fin de ejecutar un método para generar una señal de audio reconstruida, caracterizado porque el método comprende: recibir una señal que contenga datos que representen una señal de banda base derivada de la señal de audio, un envolvente espectral estimado, un envolvente temporal estimado, y un parámetro de mezclado de ruido; obtener de los datos una representación en el dominio de la frecuencia, de la señal de banda base; obtener una señal regenerada que comprenda componentes espectrales regenerados, trasladando los componentes espectrales de la banda base, en la frecuencia; ajustar la fase de los componentes espectrales regenerados, para mantener la coherencia de fase dentro de la señal regenerada; obtener una señal de ruido en respuesta al parámetro de mezclado de ruido; obtener una señal regenerada, ajustada, ajustando amplitudes de los componentes espectrales regenerados, de acuerdo con el envolvente espectral estimado y. combinándolos con la señal de ruido; obtener la representación en el dominio del tiempo, de la señal de banda base, aplicando un primer banco de filtros de síntesis, a la representación en el dominio de la frecuencia, de la señal de banda base; obtener una representación en el dominio del tiempo, de la señal regenerada ajustada, aplicando un segundo banco de filtros de síntesis, a la señal regenerada ajustada y aplicando una modulación de acuerdo con el envolvente temporal estimado; y, obtener una representación en el dominio del tiempo de la señal reconstruida, de manera tal que represente una combinación de la representación en el dominio del tiempo, de la señal de banda base, y la representación en el dominio del tiempo, modificada, de la señal regenerada ajustada.
  32. 32. Un medio que conduce una señal de salida generada mediante un método para procesar una señal de audio, el método está caracterizado porque comprende: obtener una representación en el dominio de la frecuencia, de una señal de banda base, que tenga algunos pero no todos los componentes espectrales de la señal de audio ; obtener un envolvente espectral estimado, de una señal residual que tenga componentes espectrales de la señal de audio, que no se encuentren en la señal de banda base; derivar un parámetro de mezclado de ruido a partir de una medida de contenido de ruido de la señal residual; y, ensamblar datos que representen la representación en el dominio de la frecuencia, de la señal de banda base, el envolvente espectral estimado y el parámetro de mezclado de ruido, en la señal de salida conducida por el medio.
  33. 33. El medio de conformidad con la reivindicación 32, caracterizado porque el método comprende: obtener una representación temporalmente aplanada de al menos una porción de la señal de audio que esté temporalmente aplanada de acuerdo con un inverso de un envolvente temporal estimado, en donde el envolvente espectral estimado y el parámetro de mezclado de ruido, se obtengan en respuesta a la representación temporalmente aplanada; y, ensamblar datos en la señal de salida, que representen el envolvente temporal estimado.
MXPA04009408A 2002-03-28 2003-03-21 Reconstruccion del espectro de una senal de audio con espectro incompleto en base a la traslacion de frecuencia. MXPA04009408A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/113,858 US20030187663A1 (en) 2002-03-28 2002-03-28 Broadband frequency translation for high frequency regeneration
PCT/US2003/008895 WO2003083834A1 (en) 2002-03-28 2003-03-21 Reconstruction of the spectrum of an audiosignal with incomplete spectrum based on frequency translation

Publications (1)

Publication Number Publication Date
MXPA04009408A true MXPA04009408A (es) 2005-01-25

Family

ID=28453693

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA04009408A MXPA04009408A (es) 2002-03-28 2003-03-21 Reconstruccion del espectro de una senal de audio con espectro incompleto en base a la traslacion de frecuencia.

Country Status (16)

Country Link
US (19) US20030187663A1 (es)
EP (2) EP1488414A1 (es)
JP (1) JP4345890B2 (es)
KR (1) KR101005731B1 (es)
CN (2) CN100338649C (es)
AT (1) ATE511180T1 (es)
AU (1) AU2003239126B2 (es)
CA (1) CA2475460C (es)
HK (2) HK1078673A1 (es)
MX (1) MXPA04009408A (es)
MY (1) MY140567A (es)
PL (1) PL208846B1 (es)
SG (8) SG10201710913TA (es)
SI (1) SI2194528T1 (es)
TW (1) TWI319180B (es)
WO (1) WO2003083834A1 (es)

Families Citing this family (163)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
EP1482482A1 (de) * 2003-05-27 2004-12-01 Siemens Aktiengesellschaft Frequenzerweiterung für Synthesizer
KR101058062B1 (ko) 2003-06-30 2011-08-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 잡음 부가에 의한 디코딩된 오디오의 품질 개선
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
US8417515B2 (en) * 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
US20070165892A1 (en) * 2004-06-28 2007-07-19 Koninklijke Philips Electronics, N.V. Wireless audio
JP2008510197A (ja) * 2004-08-17 2008-04-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルなオーディオ符号化
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI498882B (zh) 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
MY149811A (en) 2004-08-30 2013-10-14 Qualcomm Inc Method and apparatus for an adaptive de-jitter buffer
US8085678B2 (en) 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006060279A1 (en) 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
JP4554451B2 (ja) * 2005-06-29 2010-09-29 京セラ株式会社 通信装置、通信システム、変調方法、及びプログラム
DE102005032724B4 (de) 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
FR2891100B1 (fr) * 2005-09-22 2008-10-10 Georges Samake Codec audio utilisant la transformation de fourier rapide, le recouvrement partiel et une decomposition en deux plans basee sur l'energie.
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP5034228B2 (ja) * 2005-11-30 2012-09-26 株式会社Jvcケンウッド 補間装置、音再生装置、補間方法および補間プログラム
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
JP5457171B2 (ja) * 2006-03-20 2014-04-02 オランジュ オーディオデコーダ内で信号を後処理する方法
US20080076374A1 (en) * 2006-09-25 2008-03-27 Avraham Grenader System and method for filtering of angle modulated signals
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
CN101237317B (zh) * 2006-11-27 2010-09-29 华为技术有限公司 确定发送频谱的方法和装置
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
EP3712888B1 (en) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
DK3591650T3 (da) 2007-08-27 2021-02-15 Ericsson Telefon Ab L M Fremgangsmåde og indretning til udfyldning af spektrale huller
EP2212884B1 (en) * 2007-11-06 2013-01-02 Nokia Corporation An encoder
CN101896968A (zh) * 2007-11-06 2010-11-24 诺基亚公司 音频编码装置及其方法
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
US8005152B2 (en) 2008-05-21 2011-08-23 Samplify Systems, Inc. Compression of baseband signals in base transceiver systems
USRE47180E1 (en) * 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP5387076B2 (ja) * 2009-03-17 2014-01-15 ヤマハ株式会社 音処理装置およびプログラム
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
AU2012204068B2 (en) * 2009-04-03 2013-12-19 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI401923B (zh) * 2009-06-06 2013-07-11 Generalplus Technology Inc 適應性時脈重建方法與裝置以及進行音頻解碼方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP3723090B1 (en) * 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
PL3564954T3 (pl) 2010-01-19 2021-04-06 Dolby International Ab Ulepszona transpozycja harmonicznych oparta na bloku podpasma
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
EP2362375A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
RU2591012C2 (ru) 2010-03-09 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
CA2792452C (en) 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6103324B2 (ja) * 2010-04-13 2017-03-29 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103069484B (zh) * 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
US9443534B2 (en) 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
TW201138354A (en) * 2010-04-27 2011-11-01 Ind Tech Res Inst Soft demapping method and apparatus thereof and communication system thereof
CN102237954A (zh) * 2010-04-30 2011-11-09 财团法人工业技术研究院 软性解映射方法及其装置与其通讯系统
EP2581905B1 (en) * 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US9117459B2 (en) 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US8759661B2 (en) 2010-08-31 2014-06-24 Sonivox, L.P. System and method for audio synthesizer utilizing frequency aperture arrays
US8649388B2 (en) 2010-09-02 2014-02-11 Integrated Device Technology, Inc. Transmission of multiprotocol data in a distributed antenna system
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8989088B2 (en) * 2011-01-07 2015-03-24 Integrated Device Technology Inc. OFDM signal processing in a base transceiver system
US9059778B2 (en) * 2011-01-07 2015-06-16 Integrated Device Technology Inc. Frequency domain compression in a base transceiver system
WO2012095700A1 (en) * 2011-01-12 2012-07-19 Nokia Corporation An audio encoder/decoder apparatus
CA2827482C (en) * 2011-02-18 2018-01-02 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
US8653354B1 (en) * 2011-08-02 2014-02-18 Sonivoz, L.P. Audio synthesizing systems and methods
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN104221081B (zh) * 2011-11-02 2017-03-15 瑞典爱立信有限公司 带宽扩展音频信号的高频带扩展的生成
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
CN103368682B (zh) 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US9369149B1 (en) 2012-05-03 2016-06-14 Integrated Device Technology, Inc. Method and apparatus for efficient baseband unit processing in a communication system
US9313453B2 (en) * 2012-08-20 2016-04-12 Mitel Networks Corporation Localization algorithm for conferencing
US9640190B2 (en) * 2012-08-29 2017-05-02 Nippon Telegraph And Telephone Corporation Decoding method, decoding apparatus, program, and recording medium therefor
US9135920B2 (en) * 2012-11-26 2015-09-15 Harman International Industries, Incorporated System for perceived enhancement and restoration of compressed audio signals
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
WO2014159898A1 (en) * 2013-03-29 2014-10-02 Dolby Laboratories Licensing Corporation Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
SG11201510164RA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
CA2916150C (en) 2013-06-21 2019-06-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for tcx ltp
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
PL3028275T3 (pl) 2013-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób przetwarzania sygnału audio z użyciem kombinacji w zakresie nakładania
US9203933B1 (en) 2013-08-28 2015-12-01 Integrated Device Technology, Inc. Method and apparatus for efficient data compression in a communication system
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US9553954B1 (en) 2013-10-01 2017-01-24 Integrated Device Technology, Inc. Method and apparatus utilizing packet segment compression parameters for compression in a communication system
US9398489B1 (en) 2013-10-09 2016-07-19 Integrated Device Technology Method and apparatus for context based data compression in a communication system
US8989257B1 (en) 2013-10-09 2015-03-24 Integrated Device Technology Inc. Method and apparatus for providing near-zero jitter real-time compression in a communication system
US9485688B1 (en) 2013-10-09 2016-11-01 Integrated Device Technology, Inc. Method and apparatus for controlling error and identifying bursts in a data compression system
US9313300B2 (en) 2013-11-07 2016-04-12 Integrated Device Technology, Inc. Methods and apparatuses for a unified compression framework of baseband signals
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
KR101861787B1 (ko) * 2014-05-01 2018-05-28 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체
WO2015189533A1 (en) * 2014-06-10 2015-12-17 Meridian Audio Limited Digital encapsulation of audio signals
WO2016066217A1 (en) * 2014-10-31 2016-05-06 Telefonaktiebolaget L M Ericsson (Publ) Radio receiver, method of detecting an obtruding signal in the radio receiver, and computer program
CN107210029B (zh) * 2014-12-11 2020-07-17 优博肖德Ug公司 用于处理一连串信号以进行复调音符辨识的方法和装置
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
US11176958B2 (en) * 2017-04-28 2021-11-16 Hewlett-Packard Development Company, L.P. Loudness enhancement based on multiband range compression
KR102468799B1 (ko) 2017-08-11 2022-11-18 삼성전자 주식회사 전자장치, 그 제어방법 및 그 컴퓨터프로그램제품
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置
JP7123134B2 (ja) 2017-10-27 2022-08-22 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. デコーダにおけるノイズ減衰
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US10714098B2 (en) 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN112154502B (zh) 2018-04-05 2024-03-01 瑞典爱立信有限公司 支持生成舒适噪声
CN109036457B (zh) 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN115318605B (zh) * 2022-07-22 2023-09-08 东北大学 变频超声换能器自动匹配方法

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3995115A (en) * 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) * 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US4051331A (en) * 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4232194A (en) * 1979-03-16 1980-11-04 Ocean Technology, Inc. Voice encryption system
NL7908213A (nl) * 1979-11-09 1981-06-01 Philips Nv Spraaksynthese inrichting met tenminste twee vervormingsketens.
US4419544A (en) * 1982-04-26 1983-12-06 Adelman Roger A Signal processing apparatus
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4866777A (en) * 1984-11-09 1989-09-12 Alcatel Usa Corporation Apparatus for extracting features from a speech signal
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
EP0243562B1 (en) * 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
DE3785189T2 (de) * 1987-04-22 1993-10-07 Ibm Verfahren und Einrichtung zur Veränderung von Sprachgeschwindigkeit.
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5583962A (en) * 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5327457A (en) * 1991-09-13 1994-07-05 Motorola, Inc. Operation indicative background noise in a digital receiver
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0653846B1 (en) * 1993-05-31 2001-12-19 Sony Corporation Apparatus and method for coding or decoding signals, and recording medium
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
CN1045852C (zh) * 1993-10-08 1999-10-20 索尼公司 数字信号处理装置和数字信号处理方法
JPH07160299A (ja) * 1993-12-06 1995-06-23 Hitachi Denshi Ltd 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
US5619503A (en) * 1994-01-11 1997-04-08 Ericsson Inc. Cellular/satellite communications system with improved frequency re-use
US6169813B1 (en) * 1994-03-16 2001-01-02 Hearing Innovations Incorporated Frequency transpositional hearing aid with single sideband modulation
US6173062B1 (en) * 1994-03-16 2001-01-09 Hearing Innovations Incorporated Frequency transpositional hearing aid with digital and single sideband modulation
EP0775409A4 (en) * 1994-08-12 2000-03-22 Neosoft Ag NON-LINEAR DIGITAL TELECOMMUNICATION SYSTEM
US5587998A (en) * 1995-03-03 1996-12-24 At&T Method and apparatus for reducing residual far-end echo in voice communication networks
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
JPH09101799A (ja) * 1995-10-04 1997-04-15 Sony Corp 信号符号化方法及び装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3092653B2 (ja) * 1996-06-21 2000-09-25 日本電気株式会社 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US5744739A (en) * 1996-09-13 1998-04-28 Crystal Semiconductor Wavetable synthesizer and operating method using a variable sampling rate approximation
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JPH10341256A (ja) * 1997-06-10 1998-12-22 Logic Corp 音声から有音を抽出し、抽出有音から音声を再生する方法および装置
US6035048A (en) * 1997-06-18 2000-03-07 Lucent Technologies Inc. Method and apparatus for reducing noise in speech and audio signals
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5899969A (en) 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
US6159014A (en) * 1997-12-17 2000-12-12 Scientific Learning Corp. Method and apparatus for training of cognitive and memory systems in humans
US6019607A (en) * 1997-12-17 2000-02-01 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI systems
JP3473828B2 (ja) 1998-06-26 2003-12-08 株式会社東芝 オーディオ用光ディスク及び情報再生方法及び再生装置
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
EP1126620B1 (en) * 1999-05-14 2005-12-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
GB2351889B (en) * 1999-07-06 2003-12-17 Ericsson Telefon Ab L M Speech band expansion
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
AUPQ366799A0 (en) * 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
EP1158800A1 (en) 2000-05-18 2001-11-28 Deutsche Thomson-Brandt Gmbh Method and receiver for providing audio translation data on demand
EP1158799A1 (en) 2000-05-18 2001-11-28 Deutsche Thomson-Brandt Gmbh Method and receiver for providing subtitle data in several languages on demand
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
CN1381040A (zh) * 2000-05-26 2002-11-20 皇家菲利浦电子有限公司 发送以窄带编码信号的发射机和在接收端扩展信号频带的接收机
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7236929B2 (en) * 2001-05-09 2007-06-26 Plantronics, Inc. Echo suppression and speech detection techniques for telephony applications
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
WO2003044777A1 (en) * 2001-11-23 2003-05-30 Koninklijke Philips Electronics N.V. Audio signal bandwidth extension
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
WO2004084182A1 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication

Also Published As

Publication number Publication date
US20200143817A1 (en) 2020-05-07
US20170084281A1 (en) 2017-03-23
PL371410A1 (en) 2005-06-13
CN100338649C (zh) 2007-09-19
SG10201710913TA (en) 2018-02-27
US9324328B2 (en) 2016-04-26
PL208846B1 (pl) 2011-06-30
US9412389B1 (en) 2016-08-09
US20160379655A1 (en) 2016-12-29
KR20040101227A (ko) 2004-12-02
US8457956B2 (en) 2013-06-04
AU2003239126A1 (en) 2003-10-13
US20090192806A1 (en) 2009-07-30
US20030187663A1 (en) 2003-10-02
US20150243295A1 (en) 2015-08-27
US9343071B2 (en) 2016-05-17
US9653085B2 (en) 2017-05-16
US20160232904A1 (en) 2016-08-11
US8285543B2 (en) 2012-10-09
CN101093670B (zh) 2010-06-02
SG10201710915PA (en) 2018-02-27
US9466306B1 (en) 2016-10-11
US20180204581A1 (en) 2018-07-19
EP2194528B1 (en) 2011-05-25
US20120328121A1 (en) 2012-12-27
US10529347B2 (en) 2020-01-07
US9947328B2 (en) 2018-04-17
SG10201710917UA (en) 2018-02-27
WO2003083834A1 (en) 2003-10-09
TW200305855A (en) 2003-11-01
US9704496B2 (en) 2017-07-11
US8126709B2 (en) 2012-02-28
CA2475460A1 (en) 2003-10-09
HK1078673A1 (en) 2006-03-17
SG2013057666A (en) 2015-12-30
US20170206909A1 (en) 2017-07-20
US9412388B1 (en) 2016-08-09
US20160232905A1 (en) 2016-08-11
EP2194528A1 (en) 2010-06-09
US9177564B2 (en) 2015-11-03
US20180005639A1 (en) 2018-01-04
JP2005521907A (ja) 2005-07-21
KR101005731B1 (ko) 2011-01-06
SG173224A1 (en) 2011-08-29
US20190172472A1 (en) 2019-06-06
SG153658A1 (en) 2009-07-29
HK1114233A1 (en) 2008-10-24
SG10201710911VA (en) 2018-02-27
CN101093670A (zh) 2007-12-26
US20170148454A1 (en) 2017-05-25
US9412383B1 (en) 2016-08-09
AU2003239126B2 (en) 2009-06-04
US9548060B1 (en) 2017-01-17
ATE511180T1 (de) 2011-06-15
TWI319180B (en) 2010-01-01
US20160232911A1 (en) 2016-08-11
SG10201710912WA (en) 2018-02-27
US9767816B2 (en) 2017-09-19
CN1639770A (zh) 2005-07-13
SI2194528T1 (sl) 2012-03-30
JP4345890B2 (ja) 2009-10-14
US20160314796A1 (en) 2016-10-27
EP1488414A1 (en) 2004-12-22
US20150279379A1 (en) 2015-10-01
US10269362B2 (en) 2019-04-23
MY140567A (en) 2009-12-31
US20140161283A1 (en) 2014-06-12
US20120128177A1 (en) 2012-05-24
CA2475460C (en) 2012-02-28

Similar Documents

Publication Publication Date Title
US10529347B2 (en) Methods, apparatus and systems for determining reconstructed audio signal

Legal Events

Date Code Title Description
FG Grant or registration