ES2501790T3 - Reducción de incorrelación espuria en ruido de radio FM - Google Patents

Reducción de incorrelación espuria en ruido de radio FM Download PDF

Info

Publication number
ES2501790T3
ES2501790T3 ES11754629.1T ES11754629T ES2501790T3 ES 2501790 T3 ES2501790 T3 ES 2501790T3 ES 11754629 T ES11754629 T ES 11754629T ES 2501790 T3 ES2501790 T3 ES 2501790T3
Authority
ES
Spain
Prior art keywords
signal
parameter
noise
stereo
parametric stereo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11754629.1T
Other languages
English (en)
Inventor
Jonas Engdegard
Heiko Purnhagen
Leif Sehlstrom
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2501790T3 publication Critical patent/ES2501790T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • H04B1/1646Circuits adapted for the reception of stereophonic signals
    • H04B1/1661Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels
    • H04B1/1669Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal
    • H04B1/1676Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal of the sum or difference signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Noise Elimination (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Stereophonic System (AREA)

Abstract

Un sistema (2) configurado para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales, comprendiendo el sistema: una fase de estimación de ruido (15) configurada para determinar un factor de impacto característico para el ruido de una señal lateral obtenida a partir de la señal de audio de dos canales; y una fase de estimación de parámetros de estéreo paramétrico (3, 3') configurada para determinar el parámetro de estéreo paramétrico; en el que la determinación se basa en la señal de audio de dos canales y en el factor de impacto.

Description

DESCRIPCIÓN
Reducción de incorrelación espuria en ruido de radio FM
Referencia cruzada con solicitudes relacionadas 5
Esta solicitud reivindica la prioridad de la solicitud provisional de patente estadounidense n.º 61/376.567, presentada el 24 de agosto de 2010.
Campo técnico 10
El documento se refiere al procesamiento de señales de audio, en particular a un sistema y a un procedimiento correspondiente para mejorar una señal de audio de un receptor de radio estéreo FM. En este contexto, un aspecto se refiere a la estimación de ruido en una señal lateral recibida y a la compensación de tal ruido en parámetros de estéreo paramétrico. 15
Antecedentes de la invención
En un sistema de radio estéreo FM (modulación de frecuencia) analógico, el canal izquierdo (L) y el canal derecho (R) de la señal de audio se transmiten en una representación central-lateral (M/S), es decir, como un canal central 20 (M) y un canal lateral (S). El canal central M corresponde a una señal suma de L y R, por ejemplo M = (L+R)/2, y el canal lateral S corresponde a una señal diferencia de L y R, por ejemplo S = (L-R)/2. Para la transmisión, el canal lateral S se modula en una portadora suprimida de 38 kHz y se añade a la señal central de banda base M para formar una señal múltiple estéreo retrocompatible. Esta señal múltiple se usa después para modular la portadora HF (alta frecuencia) del transmisor FM, operando normalmente en el intervalo comprendido entre 87,5 y 108 MHz. 25
Cuando la calidad de la recepción se degrada (es decir, la relación de señal a ruido en el canal de radio se reduce), el canal S sufre normalmente más que el canal M. En muchas implementaciones del receptor FM, el canal S se silencia cuando las condiciones de recepción se vuelven muy ruidosas. Esto significa que el receptor pasa de estéreo a mono en caso de una mala señal de radio HF. 30
Aunque la señal central M tenga una calidad aceptable, la señal lateral S puede ser ruidosa y, por tanto, puede degradar en gran medida la calidad de audio global cuando se mezclan en los canales izquierdo y derecho de la señal de salida (que se obtienen, por ejemplo, de la siguiente manera: L = M+S y R = M-S). Cuando una señal lateral S solo tiene una calidad entre mala e intermedia, hay dos opciones: o bien el receptor elige aceptar el ruido asociado 35 a la señal lateral S y proporciona una señal estéreo real que comprende unas señales izquierda y derecha ruidosas, o bien el receptor descarta la señal lateral S y pasa a mono.
La codificación de estéreo paramétrico (PS) es una técnica asociada a la codificación de audio con una velocidad binaria muy baja. PS permite codificar una señal de audio estéreo de 2 canales como una señal de mezclado 40 descendente mono en combinación con información lateral PS adicional, es decir, los parámetros PS. La señal de mezclado descendente mono se obtiene como una combinación de ambos canales de la señal estéreo. Los parámetros PS permiten al descodificador PS reconstruir una señal estéreo a partir de la señal de mezclado descendente mono y la información lateral PS. Normalmente, los parámetros PS varían en el tiempo y en frecuencia, y el procesamiento PS en el descodificador PS se lleva a cabo normalmente en un dominio de banco de filtros 45 híbrido que incluye un banco QMF. El documento “Low Complexity Parametric Stereo Coding in MPEG-4", de Heiko Purnhagen, Proc. Digital Audio Effects Workshop (DAFx), páginas 163 a 168, Nápoles, Italia, octubre de 2004, describe un sistema de codificación PS a modo de ejemplo para MPEG-4. MPEG-4 Audio, por ejemplo, soporta el estéreo paramétrico. El estéreo paramétrico se describe en el apartado 8.6.4 y en los anexos 8.A y 8.C del documento de normalización de MPEG-4, ISO/IEC 14496-3:2005 (MPEG-4 Audio, tercera edición). El estéreo 50 paramétrico también se usa en la norma MPEG Surround (véase el documento ISO/IEC 23003-1:2007, MPEG Surround). Ejemplos adicionales de sistemas de codificación de estéreo paramétrico se describen en el documento "Binaural Cue Coding - Part I: Psychoacoustic Fundamentals and Design Principles" de Frank Baumgarte y Christof Faller, IEEE Transactions on Speech and Audio Processing, volumen 11, n.º 6, páginas 509 a 519, noviembre de 2003, y en el documento "Binaural Cue Coding - Part II: Schemes and Applications", de Christof Faller y Frank 55 Baumgarte, IEEE Transactions on Speech and Audio Processing, volumen 11, n.º 6, páginas 520 a 531, noviembre de 2003. En los dos últimos documentos se usa el término “binaural cue coding”, que es un ejemplo de codificación de estéreo paramétrico.
En el presente documento se describe un procedimiento y un sistema basados en la generación de señales estéreo 60 usando parámetros PS. Los parámetros PS se usan para generar una señal estéreo de bajo ruido incluso cuando se reciben señales laterales de mala calidad. En este contexto, se analiza el impacto del ruido de la señal lateral en los parámetros PS y se describe un procedimiento sobre cómo compensar tal impacto.
Sumario de la invención 65
Según un aspecto, se describe un sistema configurado para generar una señal estéreo de salida y/o configurado para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales. Dicho de otro modo, el sistema puede configurarse para determinar al menos un parámetro de estéreo paramétrico. La señal de audio de dos canales puede recibirse en un receptor de radio estéreo FM que es, por ejemplo, parte de un dispositivo de comunicación inalámbrico. La señal de audio de dos canales recibida puede presentarse como una 5 señal central y una señal lateral. Dicho de otro modo, la señal de audio de dos canales puede comprender una señal central y una señal lateral o puede comprender señales que pueden representarse como una señal central y una señal lateral. La señal central y la señal lateral pueden representar una señal de audio izquierda y una señal de audio derecha correspondientes. La señal central y la señal lateral pueden obtenerse a partir de la señal izquierda y de la señal derecha. De este modo, la señal de audio de dos canales puede comprender información a partir de la 10 cual puede obtenerse una señal central y una señal lateral. En una realización, la señal central M y la señal lateral S se refieren a la señal de audio izquierda L y a la señal de audio derecha R, como M = (L+R)/2 y S = (L-R)/2.
La señal estéreo de salida puede representar normalmente una señal izquierda y una señal derecha. Como alternativa, la señal estéreo de salida puede denominarse señal de salida de dos canales. Esta señal de salida de 15 dos canales puede transportar una señal de audio mono o una señal de audio estéreo. En particular, si la señal izquierda de la señal de salida de dos canales corresponde a la señal derecha de la señal de salida de dos canales, la señal de salida de dos canales transporta normalmente una señal de audio mono.
El sistema puede comprender una fase de estimación de ruido configurada para determinar un factor de impacto 20 característico para el ruido de la señal lateral. Como se ha explicado anteriormente, la señal lateral puede obtenerse a partir de la señal de audio de dos canales recibida. En particular, el factor de impacto puede ser característico para el espectro de potencia de la señal lateral, por ejemplo del espectro de potencia de una trama de señal o de una pluralidad de tramas de señal de la señal lateral. Incluso más en particular, el factor de impacto puede ser característico de la planicidad espectral de la señal lateral. En una realización, el factor de impacto se obtiene a 25 partir de una medida de planicidad espectral de la señal lateral, por ejemplo a partir de una medida de planicidad espectral de una o más tramas de señal de la señal lateral.
El sistema puede comprender una fase de estimación de parámetros de estéreo paramétrico configurada para determinar un parámetro de estéreo paramétrico o al menos un parámetro de estéreo paramétrico. La fase de 30 estimación de parámetros de estéreo paramétrico puede configurarse para determinar un parámetro de estéreo paramétrico en función de una trama de señal de la señal de audio de dos canales. Dicho de otro modo, un fragmento de la señal de audio de dos canales recibida puede usarse para determinar un parámetro de estéreo paramétrico, por ejemplo un parámetro que indica una diferencia de nivel de canal y/o un parámetro que indica una correlación cruzada entre canales. En términos más generales, la fase de estimación de parámetros de estéreo 35 paramétrico puede configurarse para determinar un parámetro de estéreo paramétrico que indica la cantidad de descorrelación que se aplica en la generación de la señal estéreo de salida. La fase de estimación de parámetros de estéreo paramétrico puede configurarse para determinar un nuevo parámetro de estéreo paramétrico para cada trama subsiguiente de la señal de audio de dos canales. Como alternativa o adicionalmente, la fase de estimación de parámetros de estéreo paramétrico puede configurarse para determinar el parámetro de estéreo paramétrico en 40 función de, es decir, teniendo en cuenta, el factor de impacto. En una realización, el parámetro de estéreo paramétrico comprende un parámetro de correlación cruzada entre canales que indica la correlación entre la señal de audio izquierda y la señal de audio derecha.
La fase de estimación de parámetros de estéreo paramétrico puede configurarse para modificar el parámetro de 45 ruido de estéreo paramétrico de modo que se reduzca la cantidad de descorrelación que se aplica en la generación de una señal estéreo, si el factor de impacto indica un alto grado de planicidad espectral de la señal lateral. La fase de estimación de parámetros de estéreo paramétrico puede determinar, en particular, el parámetro de estéreo paramétrico a partir de una función que depende del parámetro de ruido de estéreo paramétrico y del factor de impacto. 50
El sistema puede comprender una fase de mezclado ascendente configurada para generar la señal estéreo de salida en función de una señal de audio auxiliar y el parámetro de estéreo paramétrico. La señal de audio auxiliar puede obtenerse a partir de la señal de audio de dos canales. En particular, una trama de la señal de audio auxiliar puede obtenerse a partir de una trama correspondiente de la señal de audio de dos canales. En una realización, la señal de 55 audio auxiliar se determina como (L+R)/a, donde a es un número real, por ejemplo dos. Es decir, la señal de audio auxiliar puede corresponder a la señal central comprendida en la señal de audio de dos canales.
La fase de estimación de parámetros de estéreo paramétrico puede configurarse para determinar un parámetro de ruido de correlación cruzada entre canales usando muestras de una primera trama de señal de las señales de audio 60 izquierda y derecha. En particular, puede determinarse una correlación cruzada entre una primera trama de señal de las señales de audio izquierda y derecha. Esto puede realizarse usando, por ejemplo, las fórmulas descritas en este documento. El parámetro de correlación cruzada entre canales puede determinarse modificando el parámetro de ruido de correlación cruzada entre canales usando el factor de impacto. En particular, el parámetro de ruido de correlación cruzada entre canales puede incrementarse, si el factor de impacto indica un alto grado de planicidad 65 espectral de la señal lateral.
Dicho de otro modo, la fase de estimación de parámetros de estéreo paramétrico puede configurarse para determinar el parámetro de correlación cruzada entre canales a partir de una función que depende del parámetro de ruido de correlación cruzada entre canales y del factor de impacto. Esta función puede tener el valor “0” si el valor del factor de impacto es “0”. Esta función puede tener el valor “1” si el valor del factor de impacto es “1”. Entre los 5 valores “0” y “1”, la función puede ser continua con respecto a sus variables “parámetro de ruido de correlación cruzada entre canales” y “factor de impacto”. Las restricciones anteriores de la función son particularmente relevantes si el parámetro de correlación cruzada entre canales cubre el intervalo comprendido entre “-1” y “1”, donde el valor de correlación cruzada entre canales “-1” indica una correlación cruzada negativa entre el canal izquierdo y el canal derecho, “0” indica que no hay ninguna correlación cruzada entre el canal izquierdo y el canal 10 derecho, y donde el valor de correlación cruzada entre canales “1” indica una correlación cruzada total entre el canal izquierdo y el canal derecho. Además, el factor de impacto puede cubrir el intervalo comprendido entre “0” y “1”, donde el valor de factor de impacto “0” indica un bajo grado de planicidad y donde el valor de factor de impacto “1” indica un alto grado de planicidad.
15
En una realización, la fase de estimación de parámetros de estéreo paramétrico puede configurarse para determinar el parámetro de correlación cruzada entre canales ICC_nuevo a partir del parámetro de ruido de correlación cruzada entre canales ICC usando la función: ICC_nuevo = (factor de impacto) + (1 – factor de impacto)*ICC.
La fase de estimación de ruido puede configurarse para calcular un espectro de potencia de una segunda trama de 20 señal de la señal lateral. La primera y la segunda trama de señal pueden coincidir, es decir, la trama de señal usada para determinar el parámetro de ruido de correlación cruzada entre canales puede corresponder a la trama de señal usada para determinar el espectro de potencia de la señal lateral. Como se ha indicado anteriormente, el espectro de potencia puede usarse para determinar la planicidad espectral de la señal lateral y obtener de este modo una indicación sobre el nivel de ruido comprendido en la señal lateral. La fase de estimación de ruido puede configurarse 25 para compensar la pendiente del espectro de potencia, obteniéndose así un espectro de potencia compensado. La pendiente usada para compensar el espectro de potencia puede predeterminarse, por ejemplo, como la pendiente media del espectro de potencia de una pluralidad de señales laterales de prueba. Estas señales laterales de prueba pueden ser las señales laterales de señales mono, por ejemplo, señales de voz mono, obteniéndose así una pendiente típica/media del ruido de señal lateral comprendido en las señales mono, por ejemplo señales de voz 30 mono. Como alternativa o adicionalmente, la pendiente usada para compensar el espectro de potencia puede determinarse usando la segunda trama de señal de la señal lateral. Esto puede realizarse usando técnicas de regresión lineal.
La fase de estimación de ruido puede configurarse para determinar un valor de medida de planicidad espectral 35 (SFM) del espectro de potencia compensado. El valor SFM puede determinarse como la relación entre la media geométrica del espectro de potencia compensado y la media aritmética del espectro de potencia compensado. Debe observarse que, normalmente, una pluralidad de valores SFM se determina a partir de y para una pluralidad de tramas de señal subsiguientes de la señal lateral. Puesto que los valores SFM pueden determinarse a partir de y para tramas de señal actuales, pueden denominarse valores SFM instantáneos. La fase de estimación de ruido 40 puede configurarse para mapear el valor SFM (o la pluralidad de valores SFM) y determinar un primer factor de impacto en función del valor SFM mapeado. El valor SFM (o la pluralidad de valores SFM) puede mapearse en una escala o intervalo predeterminados con el fin de determinar el primer factor de impacto. Dicho de otro modo, el primer factor de impacto puede determinarse a partir del valor SFM. Por consiguiente, una pluralidad de primeros factores de impacto puede determinarse a partir de la pluralidad de valores SFM. 45
Como resultado del mapeo, el primer factor de impacto puede mapearse con un intervalo comprendido entre “0” y “1”. En particular, la fase de estimación de ruido puede configurarse para fijar el primer factor de impacto a “0” para un valor SFM por debajo de un primer umbral inferior; y/o para fijar el primer factor de impacto a “1” para un valor SFM por encima de un primer umbral superior; y/o para escalar un valor SFM desde el primer umbral inferior al 50 primer umbral superior en el intervalo comprendido entre “0” y “1”, y para mapear así el valor SFM, donde el primer valor de impacto corresponde al valor SFM mapeado. Puede realizarse un escalado lineal.
La fase de estimación de ruido puede configurarse para determinar un valor SFM alisado teniendo en cuenta una pluralidad de valores SFM correspondientes a una pluralidad de tramas de señal de la señal lateral. El valor SFM 55 alisado puede determinarse recursivamente, por ejemplo teniendo en cuenta el valor SFM de una trama actual y el valor SFM alisado de una trama (directamente) anterior. De este modo, una pluralidad de valores SFM alisados puede determinarse a partir de y para una pluralidad de tramas de señal. De manera similar al valor SFM, el valor SFM alisado puede mapearse. En particular, el valor SFM alisado puede mapearse en una escala o intervalo predeterminados. Un segundo factor de impacto puede determinarse usando el valor SFM alisado mapeado. Dicho 60 de otro modo, el segundo factor de impacto puede determinarse a partir del valor SFM alisado. Por consiguiente, una pluralidad de segundos factores de impacto puede determinarse a partir de la pluralidad de valores SFM alisados.
De manera similar a la determinación del primer factor de impacto, la fase de estimación de ruido puede configurarse 65 para mapear el segundo factor de impacto con un intervalo comprendido entre “0” y “1”. El mapeo puede
comprender las etapas de fijar el segundo factor de impacto a “0” para un valor SFM alisado por debajo de un segundo umbral inferior; y/o de fijar el segundo factor de impacto a “1” para un valor SFM alisado por encima de un segundo umbral superior; y/o de escalar un valor SFM alisado desde el primer umbral inferior al primer umbral superior en el intervalo comprendido entre “0” y “1”.
5
Como resultado, puede determinarse un primer y un segundo factor de impacto. Normalmente, el primer valor de impacto (o la pluralidad de primeros valores de impacto) basado en el valor SFM instantáneo puede usarse para detectar ráfagas de ruido cortas. El segundo valor de impacto (o la pluralidad de segundos valores de impacto) basado en el valor SFM alisado puede usarse para detectar ruido estático. Con el fin de adaptar el primer y el segundo valor de impacto a sus respectivos fines, el primer y el segundo umbral inferior y/o el primer y el segundo 10 umbral superior pueden fijarse de diferente manera. En una realización, el primer umbral superior es mayor que el segundo umbral superior con el fin de detectar mejor ráfagas de ruido cortas.
La fase de estimación de ruido puede configurarse para determinar el factor de impacto en función del primer y el segundo factor de impacto. En una realización, la fase de estimación de ruido está configurada para seleccionar el 15 mayor factor de impacto de entre el primer y el segundo factor de impacto. Como alternativa, un promedio ponderado del primer y el segundo factor de impacto puede usarse como el factor de impacto.
El sistema también puede comprender un codificador de audio que soporta estéreo paramétrico, en el que el codificador de audio puede comprender un codificador de estéreo paramétrico, donde la fase de estimación de 20 parámetros de estéreo paramétrico forma parte del codificador de estéreo paramétrico. Como alternativa o adicionalmente, el sistema puede configurarse para detectar que el receptor estéreo FM selecciona la salida mono de la señal de radio estéreo o el sistema puede configurarse para detectar una mala recepción de radio. Cuando el receptor estéreo FM conmuta a la salida mono o se produce una mala recepción de radio, la fase de mezclado ascendente estéreo puede usar uno o más parámetros de mezclado ascendente basados en uno o más parámetros 25 de estéreo paramétrico previamente estimados en la fase de estimación de parámetros de estéreo paramétrico, tales como parámetros de correlación cruzada entre canales.
Según un aspecto adicional, se describe un receptor de radio estéreo FM. El receptor de radio estéreo FM puede configurarse para recibir una señal de radio FM que comprende o que puede presentarse como una señal central y 30 una señal lateral. Además, el receptor de radio estéreo FM puede comprender un sistema que presenta una cualquiera o más de las características y funciones descritas en el presente documento.
Según otro aspecto, se describe un dispositivo de comunicaciones móviles, por ejemplo un teléfono celular o un teléfono inteligente. El dispositivo de comunicaciones móviles puede comprender un receptor estéreo FM 35 configurado para recibir una señal de radio FM que comprende o que puede presentarse como una señal central y una señal lateral. Además, el dispositivo de comunicación móvil puede comprender un sistema según una cualquiera o más de las características y funciones descritas en el presente documento.
Según un aspecto adicional, se describe un procedimiento para generar una señal estéreo de salida y/o para 40 determinar un (o al menos un) parámetro de estéreo paramétrico a partir de una señal de audio de dos canales. La señal de audio de dos canales puede presentarse como o puede comprender una señal central y una señal lateral, donde la señal central y la señal lateral pueden representar una señal de audio izquierda y una señal de audio derecha correspondientes. El procedimiento puede comprender la etapa de determinar un factor de impacto característico para el ruido, por ejemplo, característico de la planicidad espectral, de la señal lateral. El 45 procedimiento puede determinar el parámetro de estéreo paramétrico (o el al menos un parámetro de estéreo paramétrico), por ejemplo un parámetro de correlación cruzada entre canales que indica la correlación entre las señales de audio izquierda y derecha. La determinación del parámetro de estéreo paramétrico puede basarse en la señal de audio de dos canales y en el factor de impacto. El procedimiento puede comprender la etapa de generar la señal estéreo de salida en función de una señal de audio auxiliar y del parámetro de estéreo paramétrico, donde la 50 señal de audio auxiliar puede obtenerse a partir de la señal de audio de dos canales.
Según un aspecto adicional, se describe un programa de software. El programa de software puede estar adaptado para ejecutarse en un procesador y para realizar las etapas de procedimiento descritas en el presente documento cuando se llevan a cabo en un dispositivo informático. 55
Según otro aspecto, se describe un medio de almacenamiento. El medio de almacenamiento puede comprender un programa de software adaptado para ejecutarse en un procesador y para realizar las etapas de procedimiento descritas en el presente documento cuando se llevan a cabo en un dispositivo informático.
60
Según un aspecto adicional, se describe un producto de programa informático. El programa informático puede comprender instrucciones ejecutables para realizar las etapas de procedimiento descritas en el presente documento cuando se ejecutan en un ordenador.
Debe observarse que los procedimientos y sistemas, incluyendo sus realizaciones preferidas, descritos en la 65 presente solicitud de patente pueden usarse de manera autónoma o en combinación con otros procedimientos y
sistemas dados a conocer en este documento. Además, todos los aspectos de los procedimientos y sistemas descritos en la presente solicitud de patente pueden combinarse de manera arbitraria. En particular, las características de las reivindicaciones pueden combinarse entre sí de manera arbitraria.
Descripción de los dibujos 5
A continuación se describirá la invención mediante ejemplos ilustrativos con referencia a los dibujos adjuntos, en los que:
La figura 1 ilustra una realización esquemática para mejorar la salida estéreo de un receptor de radio estéreo FM; 10
la figura 2 ilustra una realización del aparato de procesamiento de audio según el concepto de estéreo paramétrico;
la figura 3 ilustra otra realización del aparato de procesamiento de audio basado en PS que presenta un codificador PS y un descodificador PS; 15
la figura 4 ilustra una versión ampliada del aparato de procesamiento de audio de la figura 3;
la figura 5 ilustra una realización del codificador PS y del descodificador PS de la figura 4;
20
la figura 6 ilustra otra realización del aparato de procesamiento de audio para la generación seudoestéreo en caso de salida únicamente mono del receptor FM;
la figura 7 ilustra la aparición de pequeñas pérdidas de información en la reproducción estéreo en la salida del receptor FM; 25
la figura 8 ilustra una fase de estimación de parámetros PS avanzada con compensación de errores;
la figura 9A ilustra una fase de compensación de ruido de ejemplo para compensar el parámetro ICC;
30
la figura 9B ilustra en mayor detalle una fase de compensación de ruido de ejemplo;
la figura 10 ilustra el espectro de potencia de una señal de audio de ejemplo;
la figura 11 muestra un proceso de ejemplo para determinar un factor de impacto que puede usarse para compensar 35 el parámetro ICC;
la figura 12 muestra la medida de planicidad espectral alisada y su factor de impacto correspondiente de una señal de audio de ejemplo que transita desde una sección de música estéreo a una sección de voz mono; y
40
la figura 13 ilustra una realización adicional del aparato de procesamiento de audio conforme a un codificador HE-AAC v2.
Descripción detallada
45
La figura 1 muestra una realización esquemática simplificada para mejorar la salida estéreo de un receptor de radio estéreo FM 1. Como se ha descrito en el apartado de los antecedentes, en la radio FM la señal estéreo se transmite por diseño como una señal central y una señal lateral. En el receptor FM 1, la señal lateral se usa para crear la diferencia estéreo entre el canal izquierdo L y el canal derecho R en la salida del receptor FM 1 (al menos cuando la recepción es suficientemente buena y la información de la señal lateral no está silenciada). Los canales izquierdo y 50 derecho L, R pueden ser señales digitales o señales analógicas. Para mejorar las señales de audio L, R del receptor FM, se usa un aparato 2 de procesamiento de audio que genera una señal de audio estéreo L’ y R’ en su salida. El aparato 2 de procesamiento de audio corresponde a un sistema que puede realizar la reducción de ruido de una señal de radio FM recibida usando estéreo paramétrico. El procesamiento de audio en el aparato 2 se realiza preferiblemente en el dominio digital; por tanto, en caso de una interfaz analógica entre el receptor FM 1 y el aparato 55 2 de procesamiento de audio, se usa un convertidor de analógico a digital antes del procesamiento de audio digital en el aparato 2. El receptor FM 1 y el aparato 2 de procesamiento de audio pueden estar integrados en el mismo chip semiconductor o pueden ser parte de dos chips semiconductores. El receptor FM 1 y el aparato 2 de procesamiento de audio pueden ser parte de un dispositivo de comunicación inalámbrico, tal como un teléfono celular, un asistente digital personal (PDA) o un teléfono inteligente. En este caso, el receptor FM 1 puede ser parte 60 del chip de banda base que presenta funcionalidad adicional de receptor de radio FM.
En lugar de usar una representación izquierda/derecha en la salida del receptor FM 1 y en la entrada del aparato 2, puede usarse una representación central/lateral en la interfaz entre el receptor FM 1 y el aparato 2 (véase M, S en la figura 1 para la representación central/lateral y L, R para la representación izquierda/derecha). Tal representación 65 central/lateral en la interfaz entre el receptor FM 1 y el aparato 2 puede dar como resultado un menor esfuerzo, ya
que el receptor FM 1 ya recibe una señal central/lateral y el aparato 2 de procesamiento de audio puede procesar directamente la señal central/lateral sin mezclado descendente. La representación central/lateral puede ser ventajosa si el receptor FM 1 está estrechamente integrado con el aparato 2 de procesamiento de audio, en particular si el receptor FM 1 y el aparato 2 de procesamiento de audio están integrados en el mismo chip semiconductor. 5
Opcionalmente, una señal de intensidad de señal 6 que indica la condición de recepción de radio puede usarse para adaptar el procesamiento de audio en el aparato 2 de procesamiento de audio. Esto se explicará posteriormente en esta memoria descriptiva.
10
La combinación del receptor de radio FM 1 y del aparato 2 de procesamiento de audio corresponde a un receptor de radio FM que presenta un sistema de reducción de ruido integrado.
La figura 2 muestra una realización del aparato 2 de procesamiento de audio que está basada en el concepto de estéreo paramétrico. El aparato 2 comprende una fase 3 de estimación de parámetros PS. La fase 3 de estimación 15 de parámetros está configurada para determinar parámetros PS 5 en función de la señal de audio de entrada a mejorar (que puede estar o bien en la representación izquierda/derecha o en la central/lateral). Los parámetros PS 5 pueden incluir, entre otros, un parámetro que indica diferencias de intensidad entre canales (IID o denominado también CLD – diferencias de nivel de canal) y/o un parámetro que indica una correlación cruzada entre canales (ICC). Preferiblemente, los parámetros PS 5 varían en el tiempo y en frecuencia. En caso de una representación M/S 20 en la entrada de la fase 3 de estimación de parámetros, la fase 3 de estimación de parámetros puede determinar sin embargo parámetros PS 5 relacionados con los canales UR.
Una señal de audio DM se obtiene a partir de la señal de entrada. En caso de que la señal de audio de entrada ya use una representación central/lateral, la señal de audio DM puede corresponder directamente a la señal central. En 25 caso de que la señal de audio de entrada tenga una representación izquierda/derecha, la señal de audio se genera mezclando de manera descendente la señal de audio. Preferiblemente, la señal resultante DM después del mezclado descendente corresponde a la señal central M y puede generarse mediante la siguiente ecuación:
DM = (L+R)/a, por ejemplo con a = 2, 30
es decir, la señal de mezclado descendente DM puede corresponder a la media de las señales L y R. Para diferentes valores de a, la media de las señales L y R se amplifica o se atenúa.
El aparato comprende además una fase de mezclado ascendente 4 denominada también módulo de mezclado 35 estéreo o mezclador ascendente estéreo. La fase de mezclado ascendente 4 está configurada para generar una señal estéreo L’, R’ en función de la señal de audio DM y de los parámetros PS 5. Preferiblemente, la fase de mezclado ascendente 4 no usa solamente la señal DM, sino que también usa una señal lateral o algún tipo de señal seudolateral (no mostrada). Esto se explicará posteriormente en la memoria descriptiva con respecto a realizaciones más extendidas en las figuras 4 y 5. 40
El aparato 2 se basa en la idea de que debido a su ruido, la señal lateral recibida puede ser muy ruidosa para reconstruir la señal estéreo combinando simplemente las señales central y lateral recibidas; sin embargo, en este caso, la señal lateral o la componente de la señal lateral en la señal UR puede seguir siendo lo bastante buena para un análisis de parámetros estéreo en la fase 3 de estimación de parámetros PS. Los parámetros PS 5 resultantes 45 pueden usarse después para generar una señal estéreo L’, R’ que presenta un nivel de ruido reducido en comparación con la señal de audio directamente en la salida del receptor FM 1.
Por tanto, una mala señal de radio FM puede “limpiarse” usando el concepto de estéreo paramétrico. La mayor parte de la distorsión y del ruido en una señal de radio FM está localizada en el canal lateral, que no puede usarse en el 50 mezclado descendente PS. Sin embargo, el canal lateral, incluso en el caso de una mala recepción, tiene normalmente una calidad suficiente para la extracción de parámetros PS.
En todos los dibujos siguientes, la señal de entrada en el aparato 2 de procesamiento de audio es una señal estéreo izquierda/derecha. Con pequeñas modificaciones en algunos módulos del aparato 2 de procesamiento de audio, el 55 aparato 2 de procesamiento de audio también puede procesar una señal de entrada en una representación central/lateral. Por lo tanto, los conceptos descritos en el presente documento pueden usarse en relación con una señal de entrada en una representación central/lateral.
La figura 3 muestra una realización del aparato 2 de procesamiento de audio basado en PS, que usa un codificador 60 PS 7 y un descodificador PS 8. La fase 3 de estimación de parámetros, en este ejemplo, forma parte del codificador PS 7, y la fase de mezclado ascendente 4 forma parte del descodificador PS 8. Los términos “codificador PS” y “descodificador PS” se usan como nombres para describir la función de los bloques de procesamiento de audio del aparato 2. Debe observarse que el procesamiento de audio se desarrolla completamente en el mismo dispositivo receptor FM. Estos procesos de codificación PS y de descodificación PS pueden estar estrechamente relacionados y 65 los términos “codificación PS” y “descodificación PS” solo se usan para describir la esencia de las funciones de
procesamiento de audio.
El codificador PS 7 genera, basándose en la señal de entrada de audio estéreo L, R, la señal de audio DM y los parámetros PS 5. Opcionalmente, el codificador PS 7 usa además una señal de intensidad de señal 6. La señal de audio DM es una mezcla descendente mono y corresponde preferiblemente a la señal central recibida. Cuando se 5 suman los canales L/R para formar la señal DM, la información del canal lateral recibido puede excluirse completamente en la señal DM. Por tanto, en este caso, solo la información central está presente en la mezcla descendente mono DM. Por tanto, cualquier ruido del canal lateral puede excluirse en la señal DM. Sin embargo, el canal lateral forma parte del análisis de parámetros estéreo en el codificador 7, ya que el codificador 7 toma normalmente como entrada L = M+S y R = M-S (por consiguiente, DM = (L+R)/2=M). 10
La señal mono DM y los parámetros PS 5 se usan posteriormente en el descodificador PS 8 para reconstruir la señal estéreo L’, R’.
La figura 4 muestra una versión ampliada del aparato 2 de procesamiento de audio de la figura 3. Aquí, además de 15 la señal de mezclado descendente mono DM y de los parámetros PS, la señal lateral recibida originalmente S0 se transfiere también al descodificador PS 8. Este enfoque es similar a las técnicas de “codificación residual” de la codificación PS y permite usar al menos partes (por ejemplo, determinadas bandas de frecuencia) de la señal lateral recibida S0 en caso de buenas, pero no perfectas, condiciones de recepción. La señal lateral recibida S0 se usa preferiblemente en caso de que la señal de mezclado descendente mono corresponda a la señal central. Sin 20 embargo, en caso de que la señal de mezclado descendente mono no corresponda a la señal central, puede usarse una señal residual más genérica en lugar de la señal lateral recibida S0. Tal señal residual indica el error asociado a la representación de canales originales mediante su mezclado descendente y los parámetros PS, y normalmente se usa en esquemas de codificación PS. A continuación, las observaciones referentes al uso de la señal lateral recibida S0 se aplican también a una señal residual. 25
La figura 5 muestra una realización del codificador PS 7 y del descodificador PS 8 de la figura 4. El módulo codificador PS 7 comprende un generador de mezcla descendente 9 y una fase 3 de estimación de parámetros PS. Por ejemplo, el generador de mezcla descendente 9 puede crear una mezcla descendente mono DM que corresponde preferiblemente a una señal central M (por ejemplo, DM = M = (L+R)/a) y también puede generar 30 opcionalmente una segunda señal que corresponde a la señal lateral recibida S0 = (L-R)/a.
La fase 3 de estimación de parámetros PS puede estimar como parámetros PS 5 la correlación y la diferencia de nivel entre las entradas L y R. Opcionalmente, la fase de estimación de parámetros recibe la intensidad de señal 6, que puede ser la potencia de señal en el receptor FM. Esta información puede usarse para decidir la fiabilidad de los 35 parámetros PS 5. En caso de una baja fiabilidad, por ejemplo en el caso de una baja intensidad de señal 6, los parámetros PS 5 pueden fijarse de modo que la señal de salida L’, R’ sea una señal de salida mono o una señal de salida seudoestéreo. En caso de una señal de salida mono, la señal de salida L’ es igual a la señal de salida R’. En caso de una señal de salida seudoestéreo, pueden usarse parámetros PS por defecto para generar una señal de salida estéreo por defecto o seudoestéreo L’, R’. 40
El módulo descodificador PS 8 comprende una matriz de mezclado estéreo 4a y un descorrelacionador 10. El descorrelacionador recibe la mezcla descendente mono DM y genera una señal descorrelacionada S’ que se usa como una señal seudolateral. El descorrelacionador 10 puede realizarse mediante un filtro de todo paso apropiado como el descrito en el apartado 4 del citado documento “Low Complexity Parametric Stereo Coding in MPEG-4". La 45 matriz de mezclado estéreo 4a es una matriz de mezclado ascendente 2x2 en esta realización.
En función de los parámetros estimados 5, la matriz de mezclado estéreo 4a mezcla la señal DM con la señal lateral recibida S0 o la señal descorrelacionada S’ para crear las señales de salida estéreo L’ y R’. La selección entre la señal S0 y la señal S’ puede depender de un indicador de recepción de radio que indica las condiciones de 50 recepción, tales como la intensidad de señal 6. Como alternativa o adicionalmente puede usarse un indicador de calidad que indica la calidad de la señal lateral recibida. Un ejemplo de tal indicador de calidad puede ser un ruido estimado (potencia) de la señal lateral recibida. En caso de una señal lateral que comprende un alto grado de ruido, la señal descorrelacionada S’ puede usarse para crear la señal de salida estéreo L’ y R’, mientras que en situaciones de bajo ruido puede usarse la señal lateral S0. Varias realizaciones para estimar el ruido de la señal lateral recibida 55 se describen posteriormente en esta memoria descriptiva.
La operación de mezclado ascendente se lleva a cabo preferiblemente según la siguiente ecuación matricial:
60
Aquí, los factores de ponderación , , ,  determinan la ponderación de las señales DM y S. La mezcla descendente mono DM corresponde preferiblemente a la señal central recibida. La señal S en la fórmula
corresponde o bien a la señal descorrelacionada S’ o a la señal lateral recibida S0. Los elementos matriciales de mezclado ascendente, es decir, los factores de ponderación , , ,  pueden obtenerse, por ejemplo, como se muestra en el citado documento “Low Complexity Parametric Stereo Coding in MPEG-4" (véase el apartado 2.2), como se muestra en el citado documento de normalización de MPEG-4, ISO/IEC 14496-3:2005 (véase el apartado 8.6.4.6.2) o como se muestra en el documento de la especificación de MPEG Surround, ISO/IEC 23003-1 (véase el 5 apartado 6.5.3.2). Estos apartados de los documentos (y también los apartados a los que se hace referencia en estos apartados) se incorporan como referencia en el presente documento a todos los efectos.
En determinadas condiciones de recepción, el receptor FM 1 solo proporciona una señal mono, estando silenciada la señal lateral transportada. Esto sucederá normalmente cuando las condiciones de recepción sean muy malas y la 10 señal lateral sea muy ruidosa. En caso de que el receptor estéreo FM 1 haya conmutado a una reproducción mono de la señal de radio estéreo, la fase de mezclado ascendente usa preferiblemente parámetros de mezclado ascendente para un mezclado ascendente ciego, tales como parámetros de mezclado ascendente prefijados, y genera una señal seudoestéreo, es decir, la fase de mezclado ascendente genera una señal estéreo usando los parámetros de mezclado ascendente para un mezclado ascendente ciego. 15
También existen realizaciones del receptor estéreo FM 1 que conmutan, en condiciones de recepción muy malas, a una reproducción mono. Si las condiciones de recepción son muy malas para la estimación de parámetros PS 5 fiables, la fase de mezclado ascendente usa preferiblemente parámetros de mezclado ascendente para un mezclado ascendente ciego y genera una señal seudoestéreo basada en los mismos. 20
La figura 6 muestra una realización para la generación seudoestéreo en caso de una salida únicamente mono del receptor FM 1. Aquí, un detector mono/estéreo 13 se usa para detectar si la señal de entrada al aparato 2 es mono, es decir, si las señales de los canales L y R son idénticas. En caso de una reproducción mono del receptor FM 1, el detector mono/estéreo 13 indica que hay que mezclar de manera ascendente a estéreo usando, por ejemplo, un 25 descodificador PS con parámetros de mezclado ascendente fijos. Dicho de otro modo: en este caso, la fase de mezclado ascendente 4 no usa parámetros PS de la fase 3 de estimación de parámetros PS (no mostrada en la figura 6), sino que usa parámetros de mezclado ascendente fijos (no mostrados en la figura 6).
Opcionalmente, un detector de voz 14 puede añadirse para indicar si la señal recibida es predominantemente voz o 30 música. Tal detector de voz 14 permite un mezclado ascendente ciego dependiente de la señal. Por ejemplo, un detector de voz 14 de este tipo puede permitir parámetros de mezclado ascendente dependientes de la señal. Preferiblemente, uno o más parámetros de mezclado ascendente pueden usarse para voz, y uno o más parámetros de mezclado ascendente diferentes pueden usarse para la música. Un detector de voz 14 de este tipo puede realizarse mediante un detector de actividad de voz (VAD). 35
Específicamente, la fase de mezclado ascendente 4 en la figura 6 comprende un descorrelacionador 10, una matriz de mezclado ascendente de 2x2 4a y medios para convertir la salida del detector mono/estéreo 13 y del detector de voz 14 a alguna forma de parámetros PS usados como entrada en el mezclado ascendente estéreo real.
40
La figura 7 ilustra un problema habitual cuando la señal de audio proporcionada por el receptor FM 1 alterna entre estéreo y mono debido a malas condiciones de recepción variables en el tiempo (por ejemplo, desvanecimiento de la señal). Para mantener una imagen de sonido estéreo durante la alternancia mono/estéreo, pueden usarse técnicas de cancelación de errores. Los intervalos de tiempo en los que se aplicará la cancelación se indican mediante la letra “C” en la figura 7. Un enfoque para la cancelación en la codificación PS es usar parámetros de mezclado 45 ascendente basados en los parámetros PS previamente estimados en caso de que no puedan calcularse nuevos parámetros PS debido a que la salida de audio del receptor FM 1 haya pasado a mono. Por ejemplo, la fase de mezclado ascendente 4 puede seguir usando los parámetros PS previamente estimados en caso de que no puedan calcularse nuevos parámetros PS debido a que la salida de audio del receptor FM 1 haya pasado a mono. Por tanto, cuando el receptor estéreo FM 1 conmuta a una salida de audio mono, la fase de mezclado ascendente estéreo 4 50 sigue usando los parámetros PS previamente estimados en la fase 3 de estimación de parámetros PS. Si los periodos de pérdida de información en la salida estéreo son lo suficientemente cortos como para que la imagen de sonido estéreo de la señal de radio FM siga siendo similar durante un periodo de pérdida de información, la pérdida de información no es audible o solamente muy poco audible en la salida de audio del aparato 2. Otro enfoque puede ser interpolar y/o extrapolar parámetros de mezclado ascendente a partir de parámetros previamente estimados. 55 Con respecto a la determinación de parámetros de mezclado ascendente basados en los parámetros PS previamente estimados, también puede usarse, conforme a las enseñazas del presente documento, otras técnicas conocidas, por ejemplo, de mecanismos de cancelación de errores que pueden usarse en descodificadores de audio para mitigar el efecto de los errores de transmisión (por ejemplo, datos corruptos o ausentes).
60
También puede aplicarse el mismo enfoque de usar parámetros de mezclado ascendente basados en los parámetros PS previamente estimados si el receptor FM 1 proporciona una señal estéreo ruidosa durante un corto periodo de tiempo, siendo la señal estéreo ruidosa demasiado mala para estimar parámetros PS fiables basados en la misma.
65
A continuación se describe, con referencia a la figura 8, una fase 3’ de estimación de parámetros PS avanzada que
proporciona compensación de errores. En caso de estimar parámetros PS basados en una señal estéreo que contiene una componente lateral ruidosa, habrá un error en el cálculo de los parámetros PS si se usan fórmulas convencionales para determinar los parámetros PS, tales como para determinar el parámetro CLD (diferencias de nivel de canal) y el parámetro ICC (correlación cruzada entre canales).
5
Los valores reales de señal de entrada estéreo ruidosa Icon_ruido y rcon_ruido, que son entradas en la fase de estimación de parámetros PS interna 3’ mostrada en la figura 8, pueden expresarse en función de los respectivos valores sin ruido Isin_ruido y rsin_ruido y de los valores de ruido n de los valores de señal lateral recibida:
10
Debe observarse que en este caso la señal lateral recibida se modela como s+n, donde “s” es la señal lateral original (no distorsionada) y “n” es el ruido (señal de distorsión) provocado por el canal de transmisión de radio. Además, en 15 este caso se supone que la señal m no está distorsionada por el ruido del canal de transmisión de radio.
Por tanto, las correspondientes potencias de entrada Lcon_ruido2, Rcon_ruido2 y la correlación cruzada Lcon_ruido Rcon_ruido pueden escribirse como:
20
25
Con la estimación de potencia de ruido de señal lateral N2, con N2 = E(n2), donde “E()” es el operador expectación.
Reordenando las ecuaciones anteriores, las correspondientes potencias compensadas y la correlación cruzada sin ruido pueden determinarse como: 30
35
Una extracción de parámetros PS de errores compensados basada en las potencias compensadas y en la correlación cruzada puede llevarse a cabo de la manera indica por las siguientes fórmulas:
40
Una extracción de parámetros de este tipo compensa el término N2 estimado en el cálculo de los parámetros PS. 45
El efecto del ruido en la señal lateral es el siguiente: si se supone que el ruido en la señal lateral es independiente de la señal central:
los valores ICC se aproximan a 0 en comparación con los valores ICC estimados en función de una señal estéreo 50
sin ruido, y
los valores CLD en decibelios se aproximan a 0 dB en comparación con los valores CLD estimados en función de una señal estéreo sin ruido.
5
Para compensar el error en los parámetros PS, el aparato 2 tiene preferiblemente una fase de estimación de ruido que está configurada para determinar un parámetro de ruido característico para la potencia del ruido de la señal lateral recibida que fue causado por la (mala) transmisión de radio. El parámetro de ruido puede considerarse entonces durante la estimación de los parámetros PS. Esto puede implementarse como se muestra en la figura 8.
10
Según la figura 8, la intensidad de señal FM 6 puede usarse para compensar al menos parcialmente el error. Información acerca de la intensidad de señal está normalmente disponible en los receptores de radio FM. La intensidad de señal 6 se introduce en la fase 3 de análisis de parámetros en el codificador PS 7. En una fase 15 de estimación de potencia de ruido de señal lateral, la intensidad de señal 6 puede convertirse en la estimación de potencia de ruido de señal lateral N2. Como alternativa a la intensidad de señal 6 o además de la intensidad de señal 15 6, la señal de audio L, R puede usarse para estimar la potencia de ruido de señal, como se describirá posteriormente.
En la figura 8, la fase 15 de estimación de potencia de ruido de señal lateral está configurada para obtener la estimación de potencia de ruido N2 en función de la intensidad de señal 6 y/o de las señales de entrada de audio (L y 20 R). La estimación de potencia de ruido N2 puede variar tanto en frecuencia como en el tiempo.
Pueden usarse diversos procedimientos para determinar la potencia de ruido de señal lateral N2, por ejemplo:
- Cuando se detectan mínimos de potencia de la señal central (por ejemplo, pausas en el habla), puede suponerse 25 que la potencia de la señal lateral es únicamente ruido (es decir, la potencia de la señal lateral corresponde a N2 en estas situaciones).
- La estimación N2 puede definirse en función de los datos 6 de intensidad de señal.
30
La función (o tabla de consulta) puede diseñarse mediante mediciones experimentales (físicas).
- La estimación N2 puede definirse en función de los datos 6 de intensidad de señal y/o de las señales de entrada de audio (L y R). La función puede diseñarse mediante reglas heurísticas.
35
- La estimación N2 puede basarse en el análisis de la coherencia del tipo de señal de las señales centrales y laterales. Puede suponerse, por ejemplo, que las señales centrales y laterales originales tienen una relación de tonalidad a ruido o factor de cresta similar u otras características de envolvente de potencia. Desviaciones de esas propiedades pueden usarse para indicar un alto nivel de N2.
40
A continuación se describirá una realización de una fase 15 de estimación de potencia de ruido de señal lateral y una fase de estimación de parámetros PS con compensación de errores 3’. Como se ha indicado anteriormente, la adición de ruido (independiente) en el canal lateral genera errores en la estimación de los parámetros PS. Las consecuencias son que:
45
a) La magnitud de los valores CLD se reducirá normalmente (hacia 0 dB). Por tanto, la señal estéreo regenerada tiende a aplanarse más hacia el centro.
b) Los valores ICC disminuyen (hacia 0, es decir, hacia la descorrelación). Por tanto, un mayor grado de descorrelación generada artificialmente se usa para regenerar la señal estéreo. 50
Aunque el impacto en el parámetro CLD es bastante seguro e inocuo, el efecto en el parámetro ICC se percibe normalmente como un artefacto no deseable. En el muy importante y habitual caso de una señal de voz mono que comprende ruido lateral adicional, la disminución del parámetro ICC, es decir, la correlación cruzada de las señales de audio izquierda y derecha, conlleva un mayor uso del descorrelacionador en la fase de mezclado ascendente, lo 55 que da lugar a una voz poco natural, envolvente y “reverberante”, que es percibida de una manera particularmente inquietante.
Por tanto, debe prestarse especial atención a la compensación de ruido del parámetro ICC. El concepto básico para generar un parámetro ICC de ruido compensado se ilustra en la figura 9A. Un parámetro ICC se introduce en la fase 60 de compensación de ruido, en la que el parámetro ICC introducido puede corresponder al parámetro ICC determinado a partir de las señales de audio izquierda y derecha ruidosas, como se ha descrito anteriormente. Además, la señal lateral entra en la fase de compensación. La señal lateral se usa para estimar la cantidad de ruido de señal lateral. Usando la estimación de ruido, el parámetro ICC se procesa posteriormente para compensar el ruido y para proporcionar un nuevo parámetro ICC nuevo_ICC que puede usarse posteriormente para volver a 65 generar la señal estéreo.
La figura 9B ilustra en mayor detalle un sistema de ejemplo para generar un parámetro ICC de ruido compensado. Un parámetro ICC se determina en la fase 3 de estimación de parámetros PS, como se describe en el presente documento. La fase 3 de estimación de parámetros PS puede configurarse para determinar también otros parámetros PS, tales como un parámetro CLD. Si la señal de audio de dos canales se representa como una señal 5 de audio izquierda y una señal de audio derecha, el sistema puede comprender una fase 22 de determinación de señal lateral configurada para determinar la señal lateral a partir de las señales de audio izquierda y de derecha. La señal lateral entra en una fase 23 de determinación de factor de impacto que usa los procedimientos descritos en el presente documento para determinar un factor de impacto en función de la señal lateral. En particular, el factor de impacto puede determinarse en función del grado de ruido en la señal lateral, por ejemplo en función de la planicidad 10 espectral de la señal lateral. El factor de impacto y el parámetro ICC determinado en la fase 3 de estimación de parámetros PS se introducen en una fase 24 de modificación de parámetros PS que está configurada para determinar un parámetro ICC de ruido compensado según un procedimiento descrito en el presente documento.
La estimación de ruido de señal lateral puede basarse en una medida de planicidad espectral (SFM). En la figura 10 15 se ilustra el espectro de potencia de las señales central y lateral de una señal de voz ruidosa. Puede observarse que el espectro de potencia de la señal central 20 es relativamente empinado con altos niveles de energía en el intervalo de frecuencia inferior. Por otro lado, la señal lateral 21, que en el caso ilustrado de una señal de voz mono comprende principalmente ruido, tiene un grado de energía global bajo y un espectro de potencia relativamente plano. 20
Puesto que el espectro de potencia del ruido de señal lateral 21 es bastante plano y tiene una pendiente característica, la SFM junto con la compensación de pendiente puede usarse para estimar el nivel de ruido y para ajustar posteriormente los valores ICC. Pueden usarse diferentes tipos de valores SFM. Es decir, los valores SFM pueden calcularse de varias maneras. En particular, puede usarse el valor SFM instantáneo, así como una versión 25 alisada de la SFM. El valor SFM instantáneo corresponde normalmente a la SFM de una trama de señal de la señal lateral, mientras que la versión alisada del valor SFM instantáneo también depende de la SFM de tramas de señal anteriores de la señal lateral.
En la figura 11 se ilustra el flujo de señales del proceso de compensación ICC 30. En particular, se ilustra un 30 procedimiento 30 para determinar un factor de impacto a partir de la señal lateral. El factor de impacto puede usarse para compensar el parámetro ICC. En la etapa 31 se determina el espectro de potencia de la señal lateral. Normalmente, esto se realiza usando un determinado número de muestras (por ejemplo, las muestras de una trama de señal) de la señal lateral. El periodo de determinación del espectro de potencia puede alinearse con el periodo para determinar parámetros PS. De este modo, un espectro de potencia de la señal lateral puede determinarse para 35 el periodo de validez de los parámetros PS correspondientes, en concreto el parámetro ICC.
En una etapa 32 posterior puede compensarse la pendiente característica del espectro de potencia 21 del ruido de señal lateral. La pendiente característica puede determinarse de manera experimental (en una fase de diseño/ajuste), por ejemplo determinando el espectro de potencia promedio de las señales laterales de un conjunto 40 de señales mono. Como alternativa o adicionalmente, la pendiente característica puede determinarse de manera adaptativa a partir de la señal lateral actual, por ejemplo usando regresión lineal en el espectro de potencia 21 de la señal lateral actual. La compensación de la pendiente característica puede llevarse a cabo mediante un filtro inverso de pendiente de ruido. Como resultado, debería obtenerse un espectro de potencia de pendiente compensada y posiblemente plano que no presenta la pendiente característica del espectro de potencia de una señal lateral de una 45 señal de audio de voz mono.
Usando el espectro de potencia (de pendiente compensada), en la etapa 33 se determina un valor SFM. La SFM puede calcularse de la siguiente manera:
50
donde denota la potencia de la señal lateral en la banda de banco de filtros híbrido k. El banco de filtros híbrido usado en el sistema PS de ejemplo consiste en 64 bandas QMF, donde las 3 bandas más bajas están divididas adicionalmente en 4+2+2 bandas (por tanto, N = 64 – 3 + 4 + 2 + 2 = 69). La SFM puede describirse como 55 la relación entre la media geométrica del espectro de potencia y la media aritmética del espectro de potencia.
Como alternativa, la SFM puede calcularse en un subconjunto del espectro, incluyendo solamente las bandas de banco de filtros híbrido comprendidas entre Kinicio y Kfin. De esa manera, por ejemplo, una o algunas de las primeras bandas pueden excluirse con el fin de eliminar un desfase DC no deseado, por ejemplo de baja frecuencia. Cuando 60
se ajustan en consecuencia los bordes de banda, la SFM proporciona:
Con el fin de limitar la complejidad computacional, la fórmula de la SFM puede sustituirse alternativamente por 5 aproximaciones numéricas de la misma basadas en, por ejemplo, una expansión de Taylor, una tabla de consulta o técnicas similares conocidas comúnmente por los expertos en el campo de las implementaciones software.
Además, existen otros procedimientos conocidos de la técnica anterior que miden la planicidad espectral, tales como, por ejemplo, la desviación estándar o la diferencia entre el mínimo y el máximo de los contenedores de 10 potencia de frecuencia, etc. De este modo, el término “SFM” denota cualquiera de estas medidas.
Usando el valor SFM para el periodo de tiempo particular o trama de la señal lateral puede determinarse un factor de impacto. Para este fin, la SFM se mapea, por ejemplo, en una escala de 0 a 1, en el bloque de mapeo 36. El mapeo y la determinación de un factor de impacto SFM pueden llevarse a cabo de la siguiente manera: 15
donde los dos valores de umbral umbral_bajo y umbral_alto se seleccionan según el intervalo medio de los valores SFM, que oscilan normalmente entre 0,2 y 0,8. El objetivo principal de la fase de normalización 36 es garantizar que el 20 factor de impacto SFM abarque regularmente toda la región entre “0” y “1”. De este modo, la normalización garantiza que un espectro no plano “normal” (SFM < umbral_bajo) no se detecte como ruido y que la medida se sature para valores altos (SFM > umbral_alto). Dicho de otro modo, la normalización proporciona un factor de impacto que distingue más claramente entre situaciones de alto ruido (SFM > umbral_alto) y situaciones de bajo ruido (SFM < umbral_bajo). 25
En un cálculo paralelo puede determinarse un segundo factor de impacto SFM en función de una versión alisada del valor SFM. La versión alisada del valor SFM actual se determina en la etapa 34. La operación de alisado puede realizarse por ejemplo, de manera recursiva, donde el valor SFM alisado actual se determina a partir de la media entre el valor SFM alisado anterior y el valor SFM instantáneo actual. Para obtener la media, la SFM alisada anterior 30 puede ponderarse mediante el coeficiente a (por ejemplo, a = 0,95) y el valor SFM instantáneo actual puede ponderarse mediante (1-). De este modo, el valor SFM alisado puede determinarse de manera recursiva a partir del valor SFM instantáneo actual usando la fórmula: SFMalisar(n) = (1-)*SFM(n) + *SFMalisar(n-1). El coeficiente  puede obtenerse, por ejemplo, a partir de la constante de tiempo T=0,62 según =exp(-1/(T*FrecuenciaMuestreo/FrecuenciaActualización)), donde en este ejemplo la frecuencia de muestreo es de 32 kHz 35 y la frecuencia de actualización es de cada 1024 muestras.
Finalmente, el valor SFM alisado actual puede mapearse en la etapa 35 de manera similar a lo descrito en el contexto de la etapa 36. Sin embargo, los valores de umbral umbral_bajo y umbral_alto que se usan para mapear el valor SFM alisado para determinar un segundo factor de impacto SFM son normalmente diferentes a los usados para los 40 valores SFM no alisados. En un ejemplo, los valores de umbral oscilan entre 0,5 y 0,7 para los valores SFM alisados.
Los valores SFM alisados detectan normalmente ruido estático estable, mientras que los valores SFM no alisados usan umbrales superiores para detectar ráfagas de ruido cortas. De este modo, una combinación de ambos puede 45 usarse para detectar ruido estático estable, así como ráfagas de ruido cortas. Para este fin, uno de los dos factores de impacto SFM se selecciona para compensar el parámetro ICC. Esto se lleva a cabo en la etapa 37. En el ejemplo ilustrado se selecciona el valor máximo de los dos factores de impacto SFM, implementando de ese modo un enfoque conservador con la mayor reducción posible de descorrelación. Como alternativa, una suma ponderada de ambos factores de impacto SFM (los factores alisados y los factores no alisados) puede usarse como el factor de 50 impacto SFM resultante.
El factor de impacto SFM resultante se aplica después a los valores ICC de la siguiente manera:
ICC_nuevo = (Factor_Impacto_SFM) + (1 – Factor_Impacto_SFM) * ICC
5
Como se ha descrito anteriormente, el factor de impacto SFM se mapea en un intervalo comprendido entre “0” y “1”, donde “0” corresponde a un valor SFM bajo que indica un espectro de potencia de la señal lateral en el que la potencia espectral se concentra en un número relativamente pequeño de bandas de frecuencia. Es decir, un factor de impacto SFM de “0” indica un bajo nivel de ruido, de modo que debería conservarse el parámetro ICC estimado. Por otro lado, un factor de impacto SFM de “1” corresponde a un valor SFM alto que indica que el espectro tiene una 10 cantidad similar de potencia en todas las bandas espectrales. Por consiguiente, un factor de impacto SFM de “1” indica un alto nivel de ruido, de modo que el parámetro ICC debería compensarse en gran medida. De hecho, si la señal lateral solo comprende ruido, el parámetro ICC debería fijarse a “1”, es decir, el parámetro ICC debería fijarse para indicar que no hay descorrelación, es decir, una correlación cruzada total. Esto se lleva a cabo mediante la fórmula anterior para determinar un parámetro ICC de ruido compensado “ICC_nuevo” a partir del parámetro ICC 15 estimado originalmente “ICC” y del factor de impacto SFM.
Pueden usarse otras funciones de transformación para determinar un parámetro ICC de ruido compensado a partir del parámetro ICC estimado originalmente y a partir del factor de impacto SFM. En términos generales, puede decirse que ICC_nuevo = f(Factor_impacto_SFM, ICC), donde f() es una función que vale “0” para un 20 Factor_impacto_SFM = 0 y que vale “1” para un Factor_impacto_SFM = 1. Entre estos valores, la función f() es una función predefinida que permite un mapeo de posibles valores de ICC y de Factor_impacto_SFM con un valor correspondiente de ICC_nuevo.
Los gráficos de la figura 12 ilustran claramente la funcionalidad mencionada anteriormente del factor de impacto 25 SFM. En el gráfico superior se ilustra una señal lateral de una señal de audio de ejemplo. La primera mitad de la señal de audio contiene el final de un fragmento de música clásica (ópera) en estéreo. La segunda mitad contiene voz mono con únicamente ruido en la señal lateral. El gráfico inferior muestra la secuencia correspondiente de valores SFM alisados 41 y la secuencia correspondiente de factores de impacto SFM 42 (denominados “SFM alisada mapeada” en la figura 12). Los valores SFM alisados 41 indican si la señal lateral contiene ruido o no. 30 Después del mapeo en la etapa 35, es decir, en este caso después de mapear la región de valores SFM [0,5; 0,7] con la región de factor de impacto SFM [0, 1], el valor de impacto SFM 42 toma valores entre 0 y 1 y muestra una transición clara entre la situación de “bajo ruido” y la situación de “alto ruido”. Para valores SFM 41 inferiores a 0,5 el valor de impacto SFM 42 es “0”, mientras que para valores SFM 41 mayores que 0,7 el valor de impacto SFM 42 es “1”. De este modo, el valor de impacto SFM 42 garantiza que los parámetros ICC no varíen durante la primera parte 35 de la señal de audio (música estéreo). Por otro lado, el valor de impacto SFM 42 obliga a interrumpir la descorrelación en la segunda parte de la señal de audio (voz mono).
El concepto de compensar el ruido de la señal lateral comprendido en parámetros de estéreo paramétrico se ha descrito en el contexto del parámetro de correlación cruzada entre canales ICC. Debe observarse que existen otras 40 parametrizaciones de estéreo paramétrico (PS) alternativas, es decir, otros conjuntos de parámetros PS diferentes a CLD e ICC. El concepto de compensación de ruido descrito en el presente documento también puede aplicarse a tales parametrizaciones PS alternativas. En particular, la compensación de ruido puede aplicarse al parámetro PS, lo que influye en la cantidad de descorrelación aplicada durante la fase de mezclado ascendente con el fin de generar una señal estéreo de salida. 45
Un ejemplo de una parametrización PS alternativa puede ilustrarse mediante el siguiente proceso de mezclado ascendente:
S = a*DM + g*descorr(DM), L’ = DM+S, R’ = DM-S, 50
donde DM es la señal de mezclado descendente, “a” y “g” son los dos nuevos parámetros PS y descorr() es el descorrelacionador, normalmente un filtro de todo paso, usado en la etapa de mezclado ascendente.
Aunque normalmente es posible calcular los parámetros “a” y “g” a partir de “CLD” e “ICC”, también es posible 55 aplicar una modificación de parámetro controlada por SFM, es decir, una compensación de ruido como la descrita en el presente documento, para reducir directamente una descorrelación no deseada al parámetro PS alternativo “g” que determina la cantidad de descorrelación añadida en el proceso de mezclado ascendente. En este caso, el procesamiento en la fase 23 de determinación de factor de impacto de la figura 9B y en la fase de modificación de parámetro PS 24 de la figura 9B tendrá que adaptarse en consecuencia, mientras que el principio general de 60 funcionamiento de la compensación de ruido sigue siendo el mismo. En particular, puede usarse una función de mapeo diferente para obtener el Factor_impacto_SFM a partir de la SFM, y la modificación de parámetro puede basarse en la función:
g_nuevo = (1 – Factor_impacto_SFM) * g, 65
es decir, un Factor_impacto_SFM = 1 fijará g_nuevo a 0. Esto, similar a ICC = 1, significa que no se añade ninguna descorrelación durante la fase de mezclado ascendente. Para un Factor_impacto_SFM = 0, g no cambiará.
De este modo, debe observarse que el concepto de compensación de ruido descrito en el presente documento puede aplicarse a varias formas de parametrizaciones PS. En particular, los conceptos pueden usarse para ajustar 5 el parámetro PS o los parámetros PS que afectan a la cantidad de descorrelación que se aplica para generar una señal estéreo de salida.
Los conceptos descritos en el presente documento pueden implementarse en relación con cualquier codificador que use técnicas PS, por ejemplo un codificador HE-AAC v2 (codificación de audio avanzada de alta eficacia, versión 2) 10 definido en la norma ISO/IEC 14496-3 (MPEG-4 Audio), un codificador basado en MPEG Surround o un codificador basado en MPEG USAC (codificador de audio y voz unificado), así como codificadores no cubiertos por las normas MPEG.
A continuación se adopta, a modo de ejemplo, un codificador HE-AAC v2; sin embargo, los conceptos pueden 15 usarse en relación con cualquier codificador de audio que use técnicas PS.
HE-AAC es un esquema de compresión de audio con pérdidas. HE-AAC v1 (HE-AAC, versión 1) usa replicación de banda espectral (SBR) para aumentar la eficacia de compresión. HE-AAC v2 incluye además estéreo paramétrico para mejorar la eficacia de compresión de las señales estéreo a velocidades binarias muy bajas. Un codificador HE-20 AAC v2 incluye intrínsecamente un codificador PS para permitir el funcionamiento a velocidades binarias muy bajas. El codificador PS de un codificador HE-AAC v2 de este tipo puede usarse como el codificador PS 7 del aparato 2 de procesamiento de audio. En particular, la fase de estimación de parámetros PS de un codificador PS de un codificador HE-AAC v2 puede usarse como la fase 3 de estimación de parámetros PS del aparato 2 de procesamiento de audio. Además, la fase de mezclado descendente de un codificador PS de un codificador HE-AAC 25 v2 puede usarse como la fase 9 de mezclado descendente del aparato 2.
Por tanto, el concepto descrito en esta memoria descriptiva puede combinarse eficazmente con un codificador HE-AAC v2 para obtener un receptor de radio estéreo FM mejorado. Un receptor de radio estéreo FM mejorado de este tipo puede tener una característica de grabación HE-AAC v2, ya que el codificador HE-AAC v2 proporciona un flujo 30 de bits HE-AAC v2 que puede almacenarse con fines de grabación. Esto se muestra en la figura 13. En esta realización, el aparato 2 comprende un codificador HE-AAC v2 16 y el descodificador PS 8. El codificador HE-AAC v2 proporciona el codificador PS 7 usado para generar la mezcla descendente mono DM y los parámetros PS 5, como se ha descrito en relación con los dibujos anteriores.
35
Opcionalmente, el codificador PS 7 puede modificarse para la reducción de ruido de ruido FM y soportar un esquema de mezclado descendente fijo, tal como un esquema de mezclado descendente según DM = (L + R)/a.
La mezcla descendente mono DM y los parámetros PS 8 pueden introducirse en el descodificador PS 8 para generar la señal estéreo L’, R’, como se ha descrito anteriormente. La mezcla descendente mono DM se introduce 40 en un codificador HE-AAC v1 para la codificación perceptual de la mezcla descendente mono DM. La señal de audio codificada perceptual resultante y la información PS se multiplexan en un flujo de bits 18 HE-AAC v2. Con fines de grabación, el flujo de bits 18 HE-AAC v2 puede almacenarse en una memoria, tal como una memoria flash o un disco duro.
45
El codificador HE-AAC v1 17 comprende un codificador SBR y un codificador AAC (no mostrados). El codificador SBR realiza normalmente un procesamiento de señal en el dominio QMF (banco de filtros de espejo en cuadratura) y, por tanto, necesita muestras QMF. Por el contrario, el codificador AAC necesita normalmente muestras en el dominio de tiempo (normalmente muestreadas de manera descendente en un factor de 2).
50
El codificador PS 7 del codificador HE-AAC v2 16 ya proporciona normalmente la señal de mezclado descendente DM en el dominio QMF.
Puesto que el codificador PS 7 puede enviar la señal de dominio QMF DM al codificador HE-AAC v1, la transformada de análisis QMF en el codificador HE-AAC v1 para el análisis SBR puede resultar obsoleta. Por tanto, 55 el análisis QMF que normalmente forma parte del codificador HE-AAC v1 puede evitarse proporcionando la señal de mezclado descendente DM como muestras QMF. Esto reduce el esfuerzo computacional y permite reducir la complejidad.
Las muestras de dominio de tiempo para el codificador AAC pueden obtenerse en la entrada del aparato 2, por 60 ejemplo realizando la sencilla operación DM = (L+R) / 2 en el dominio de tiempo y muestreando de manera descendente la señal de dominio de tiempo DM. Este enfoque es probablemente el enfoque más económico. Como alternativa, el aparato 2 puede llevar a cabo una síntesis QMF a media velocidad de las muestras DM de dominio QMF.
65
En el presente documento se ha descrito un procedimiento y un sistema para reducir el ruido de receptores de radio
FM. Se determinan parámetros PS a partir de una señal central y una señal lateral recibidas para generar una señal de audio de ruido reducido usando la señal central y los parámetros PS. Para reducir el impacto de ruido en los parámetros PS estimados, se ha descrito un procedimiento de estimación y compensación de ruido.
Los procedimientos y sistemas descritos en el presente documento pueden implementarse como software, firmware 5 y/o hardware. Determinados componentes pueden implementarse, por ejemplo, como software que se ejecuta en un procesador de señales digitales o en un microprocesador. Otros componentes pueden implementarse, por ejemplo, como hardware y/o como circuitos integrados de aplicación específica. Las señales encontradas en los procedimientos y sistemas descritos pueden almacenarse en medios tales como memorias de acceso aleatorio o medios de almacenamiento ópticos. Pueden transferirse a través de redes, tales como redes de radio, redes por 10 satélite, redes inalámbricas o redes cableadas, por ejemplo Internet. Dispositivos típicos que usan los procedimientos y sistemas descritos en el presente documento son dispositivos electrónicos portátiles u otros equipos de usuario que se usan para almacenar y/o reproducir señales de audio.
15

Claims (15)

  1. REIVINDICACIONES
    1.- Un sistema (2) configurado para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales, comprendiendo el sistema:
    5
    una fase de estimación de ruido (15) configurada para determinar un factor de impacto característico para el ruido de una señal lateral obtenida a partir de la señal de audio de dos canales; y
    una fase de estimación de parámetros de estéreo paramétrico (3, 3’) configurada para determinar el parámetro de estéreo paramétrico; en el que la determinación se basa en la señal de audio de dos canales y en el factor de 10 impacto.
  2. 2.- El sistema (2) según la reivindicación 1, en el que la señal de audio de dos canales puede presentarse como una señal central y la señal lateral, que representan una señal de audio izquierda y una señal de audio derecha correspondientes. 15
  3. 3.- El sistema (2) según cualquiera de las reivindicaciones 1 y 2, que comprende además:
    una fase de mezclado ascendente (4) configurada para generar una señal estéreo de salida en función de una señal de audio auxiliar y del parámetro de estéreo paramétrico; en el que la señal de audio auxiliar se obtiene a partir de la 20 señal de audio de dos canales.
  4. 4.- El sistema (2) según cualquiera de las reivindicaciones 1 a 3, en el que
    el factor de impacto es característico de la planicidad espectral de la señal lateral. 25
  5. 5.- El sistema (2) según la reivindicación 4, en el que la fase de estimación de parámetros de estéreo paramétrico (3, 3’) está configurada para
    determinar un parámetro de ruido de estéreo paramétrico usando muestras de una primera trama de señal de la 30 señal de audio de dos canales; y
    determinar el parámetro de estéreo paramétrico modificando el parámetro de ruido de estéreo paramétrico usando el factor de impacto.
    35
  6. 6.- El sistema (2) según la reivindicación 5, en el que la fase de estimación de parámetros de estéreo paramétrico (3, 3’) está configurada para
    modificar el parámetro de ruido de estéreo paramétrico de modo que la cantidad de descorrelación que se aplica en la generación de una señal estéreo se reduce, si el factor de impacto indica un alto grado de planicidad espectral de 40 la señal lateral.
  7. 7.- El sistema (2) según cualquiera de las reivindicaciones 5 y 6, en el que la fase de estimación de parámetros de estéreo paramétrico (3, 3’) está configurada para determinar el parámetro de estéreo paramétrico a partir de una función que depende del parámetro de ruido de estéreo paramétrico y del factor de impacto. 45
  8. 8.- El sistema (2) según la reivindicación 7, en el que el parámetro de estéreo paramétrico es un parámetro de correlación cruzada entre canales que indica la correlación entre la señal de audio de dos canales.
  9. 9.- El sistema (2) según la reivindicación 8, en el que 50
    el parámetro de correlación cruzada entre canales cubre un intervalo comprendido entre “-1” y “1”;
    el valor de correlación cruzada entre canales “0” indica que no hay correlación cruzada entre el canal izquierdo y el canal derecho; 55
    el valor de correlación cruzada entre canales “1” indica una correlación cruzada total entre el canal izquierdo y el canal derecho;
    el valor de correlación cruzada entre canales “-1” indica una correlación cruzada total negativa entre el canal 60 izquierdo y el canal derecho;
    el factor de impacto cubre un intervalo comprendido entre “0” y “1”;
    el valor de factor de impacto “0” indica un bajo grado de planicidad; 65
    el valor de factor de impacto “1” indica un alto grado de planicidad;
    la función tiene el valor de la correlación cruzada entre canales de ruido si el valor de factor de impacto es “0”; y
    la función tiene el valor “1” si el valor del factor de impacto es “1”. 5
  10. 10.- El sistema (2) según la reivindicación 9, en el que la fase de estimación de parámetros de estéreo paramétrico (3, 3’) está configurada para determinar el parámetro de correlación cruzada entre canales ICC_nuevo a partir del parámetro de ruido de correlación cruzada entre canales ICC usando la función:
    10
    ICC_nuevo = (Factor_Impacto) + (1 – Factor_Impacto) * ICC
  11. 11.- El sistema (2) según cualquier reivindicación anterior, en el que la fase de estimación de ruido (15) está configurada para:
    15
    calcular un espectro de potencia de una segunda trama de señal de la señal lateral;
    compensar una pendiente del espectro de potencia, obteniéndose así un espectro de potencia compensado; y
    determinar un valor de medida de planicidad espectral, denominado como SFM, del espectro de potencia 20 compensado.
  12. 12.- El sistema según cualquier reivindicación anterior, en el que la fase de estimación de parámetros de estéreo paramétrico está configurada además para determinar un parámetro que indica una diferencia de nivel de canal.
    25
  13. 13.- Un procedimiento para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales, comprendiendo el procedimiento:
    determinar un factor de impacto característico para el ruido de una señal lateral obtenida a partir de la señal de audio de dos canales; y 30
    determinar el parámetro de estéreo paramétrico; en el que la determinación se basa en la señal de audio de dos canales y en el factor de impacto.
  14. 14.- Un programa de software adaptado para ejecutarse en un procesador y para realizar las etapas de 35 procedimiento de la reivindicación 13 cuando se lleva a cabo en un dispositivo informático.
  15. 15.- Un medio de almacenamiento que comprende un programa de software adaptado para ejecutarse en un procesador y para realizar las etapas de procedimiento de la reivindicación 13 cuando se lleva a cabo en un dispositivo informático. 40
ES11754629.1T 2010-08-24 2011-08-16 Reducción de incorrelación espuria en ruido de radio FM Active ES2501790T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37656710P 2010-08-24 2010-08-24
US376567P 2010-08-24
PCT/EP2011/064077 WO2012025429A1 (en) 2010-08-24 2011-08-16 Reduction of spurious uncorrelation in fm radio noise

Publications (1)

Publication Number Publication Date
ES2501790T3 true ES2501790T3 (es) 2014-10-02

Family

ID=44584154

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11754629.1T Active ES2501790T3 (es) 2010-08-24 2011-08-16 Reducción de incorrelación espuria en ruido de radio FM

Country Status (8)

Country Link
US (1) US9094754B2 (es)
EP (1) EP2609684B1 (es)
JP (1) JP5617039B2 (es)
CN (1) CN103069721B (es)
ES (1) ES2501790T3 (es)
HK (1) HK1186312A1 (es)
TW (1) TWI516138B (es)
WO (1) WO2012025429A1 (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
WO2013017435A1 (en) 2011-08-04 2013-02-07 Dolby International Ab Improved fm stereo radio receiver by using parametric stereo
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
KR101585852B1 (ko) 2011-09-29 2016-01-15 돌비 인터네셔널 에이비 Fm 스테레오 라디오 신호들에서 고품질의 검출
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
CN109346101B (zh) * 2013-01-29 2024-05-24 弗劳恩霍夫应用研究促进协会 产生频率增强音频信号的译码器和产生编码信号的编码器
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
ES2700246T3 (es) 2013-08-28 2019-02-14 Dolby Laboratories Licensing Corp Mejora paramétrica de la voz
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
KR101805327B1 (ko) * 2013-10-21 2017-12-05 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조
CN105225671B (zh) 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及系统
US11245375B2 (en) 2017-01-04 2022-02-08 That Corporation System for configuration and status reporting of audio processing in TV sets
WO2018129143A1 (en) * 2017-01-04 2018-07-12 That Corporation Configurable multi-band compressor architecture with advanced surround processing
CN115622634B (zh) * 2022-08-22 2023-08-04 荣耀终端有限公司 辐射杂散rse测试的控制方法、测试系统及存储介质

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4833715A (en) * 1987-03-06 1989-05-23 Alps Electric Co., Ltd. FM stereo receiver
US5027402A (en) * 1989-12-22 1991-06-25 Allegro Microsystems, Inc. Blend-on-noise stereo decoder
JPH0846585A (ja) 1994-07-27 1996-02-16 Fujitsu Ten Ltd ステレオ受信装置
US6067363A (en) * 1996-06-03 2000-05-23 Ericsson Inc. Audio A/D convertor using frequency modulation
JP2000332710A (ja) * 1999-05-24 2000-11-30 Sanyo Electric Co Ltd ステレオ放送用受信装置
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US8605911B2 (en) * 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
KR20050116828A (ko) 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7835916B2 (en) * 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
DE602005017358D1 (de) * 2004-01-28 2009-12-10 Koninkl Philips Electronics Nv Verfahren und vorrichtung zur zeitskalierung eines signals
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
BRPI0606387B1 (pt) * 2005-01-11 2019-11-26 Koninl Philips Electronics Nv Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
WO2006091139A1 (en) 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
KR100933548B1 (ko) 2005-04-15 2009-12-23 돌비 스웨덴 에이비 비상관 신호의 시간적 엔벨로프 정형화
EP1905008A2 (en) 2005-07-06 2008-04-02 Koninklijke Philips Electronics N.V. Parametric multi-channel decoding
ATE476732T1 (de) * 2006-01-09 2010-08-15 Nokia Corp Steuerung der dekodierung binauraler audiosignale
CN101411063B (zh) 2006-03-28 2011-11-23 艾利森电话股份有限公司 滤波器自适应频率分辨率
JP4999846B2 (ja) 2006-08-04 2012-08-15 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
US8588440B2 (en) 2006-09-14 2013-11-19 Koninklijke Philips N.V. Sweet spot manipulation for a multi-channel signal
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
CN101320562A (zh) 2007-06-07 2008-12-10 中皇国际股份有限公司 一种音乐压缩与解压缩方法的改良及其实现电路
JP2009010841A (ja) 2007-06-29 2009-01-15 Kenwood Corp ステレオ復調装置及びステレオ復調方法
CN101572088A (zh) 2008-04-30 2009-11-04 北京工业大学 立体声编解码方法、编解码器及编解码系统
CN102272830B (zh) * 2009-01-13 2013-04-03 松下电器产业株式会社 音响信号解码装置及平衡调整方法
ES2415155T3 (es) * 2009-03-17 2013-07-24 Dolby International Ab Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
EP2609592B1 (en) 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
KR101585852B1 (ko) * 2011-09-29 2016-01-15 돌비 인터네셔널 에이비 Fm 스테레오 라디오 신호들에서 고품질의 검출
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction

Also Published As

Publication number Publication date
EP2609684B1 (en) 2014-07-30
TWI516138B (zh) 2016-01-01
US20130142339A1 (en) 2013-06-06
CN103069721B (zh) 2016-03-23
WO2012025429A1 (en) 2012-03-01
CN103069721A (zh) 2013-04-24
HK1186312A1 (en) 2014-03-07
JP2013541030A (ja) 2013-11-07
TW201220863A (en) 2012-05-16
EP2609684A1 (en) 2013-07-03
JP5617039B2 (ja) 2014-10-29
US9094754B2 (en) 2015-07-28

Similar Documents

Publication Publication Date Title
ES2501790T3 (es) Reducción de incorrelación espuria en ruido de radio FM
ES2655972T3 (es) Mejora de una señal de audio de un receptor de radio estéreo FM mediante el uso de estéreo paramétrico
ES2526320T3 (es) Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
ES2548216T3 (es) Reducción de ruido de radio FM estéreo basado en predicción
US9672839B1 (en) Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
ES2770146T3 (es) Conformación temporal y espacial de señales de audio multicanal
KR101585852B1 (ko) Fm 스테레오 라디오 신호들에서 고품질의 검출
ES2232842T3 (es) Codificador predictivo de sub-banda multicanal con atribucion fisico-acustica adaptativa de bitios.
ES2307188T3 (es) Sintetizador multicanal y procedimiento para generar una señal de salida multicanal.
US20090299756A1 (en) Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
ES2555136T3 (es) Codificador paramétrico para codificar una señal de audio multicanal
JP2018072846A (ja) ハーモニックオーディオ信号の帯域幅拡張