ES2526320T3 - Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM - Google Patents

Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM Download PDF

Info

Publication number
ES2526320T3
ES2526320T3 ES11754630.9T ES11754630T ES2526320T3 ES 2526320 T3 ES2526320 T3 ES 2526320T3 ES 11754630 T ES11754630 T ES 11754630T ES 2526320 T3 ES2526320 T3 ES 2526320T3
Authority
ES
Spain
Prior art keywords
signal
frame
stereo
audio signal
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11754630.9T
Other languages
English (en)
Inventor
Leif Sehlstrom
Heiko Purnhagen
Jonas Engdegard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2526320T3 publication Critical patent/ES2526320T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; ELECTRIC HEARING AIDS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • H04B1/1646Circuits adapted for the reception of stereophonic signals
    • H04B1/1661Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels
    • H04B1/1669Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal
    • H04B1/1676Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal of the sum or difference signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • H04H40/36Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving
    • H04H40/45Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving
    • H04H40/81Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving for stereo-monaural switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Stereophonic System (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

Un sistema configurado para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales; comprendiendo el sistema: * una etapa de estimación de parámetros de estéreo paramétrico configurada para determinar un parámetro de estéreo paramétrico primero en base a una trama de señal primera de la señal de audio de dos canales recibida; y * una etapa de detección de ocultamiento configurada para: - determinar una energía de una señal lateral dentro de la trama de señal primera; en la que la señal lateral se puede obtener de la señal de audio de dos canales y en la que la energía está por encima de un umbral alto; - determinar un período de transición de un número de tramas de señal siguientes sucesivas durante el cual la energía de la señal lateral cae desde un valor por encima del umbral alto a un valor por debajo de un umbral bajo; - determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada si el número de tramas de señal sucesivas del período de transición está por debajo de un umbral de trama; y - determinar el parámetro de estéreo paramétrico para tramas que suceden a la trama de señal primera en base al parámetro de estéreo paramétrico primero, si se determina que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada.

Description

15
25
35
45
55
65
E11754630
16-12-2014
DESCRIPCIÓN
Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
Referencia cruzada a solicitudes relacionadas
Esta solicitud reivindica prioridad sobre la solicitud de patente provisional de Estados Unidos Nº 61/376569, presentada el 24 de agosto de 2010.
Campo técnico
El presente documento se refiere al procesamiento de señales de audio, en particular a un aparato y un correspondiente método para mejorar una señal de audio de un receptor de radio estéreo de FM. En particular, el presente documento se refiere a un método y un sistema para ocultar de manera fiable la recepción mono intermitente de los receptores de radio estéreo de FM.
Antecedentes de la invención
En un sistema de radio estéreo de FM (frecuencia modulada) analógico, el canal izquierdo (L) y el canal derecho (R) de la señal de audio se transmiten en una representación medio lateral (M/S), es decir, como canal medio (M) y canal lateral (S). El canal medio M corresponde a una señal de suma de L y R, por ejemplo, M = (L+R)/2, y el canal lateral S corresponde a una señal de diferencia de L y R, por ejemplo, S = (L-R)/2. Para la transmisión, el canal lateral S se modula sobre una portadora suprimida de 38 kHz y se añade a la señal media M de banda base para formar una señal múltiplex estéreo compatible con versiones anteriores. Esta señal multiplex se usa entonces para modular la portadora HF (High Frequency) del transmisor de FM, que funciona típicamente en el intervalo entre 87,5 y 108 MHz.
Cuando disminuye la calidad de recepción (es decir, la relación señal a ruido sobre el canal de radio disminuye), el canal S típicamente sufre más que el canal M. En muchas implementaciones de receptor de FM, el canal S se silencia cuando las condiciones de recepción se vuelven demasiado ruidosas. Esto significa que el receptor vuelve de estéreo a mono en caso de una señal de radio HF pobre.
Incluso en caso de que la señal media M sea de calidad aceptable, la señal lateral S puede ser ruidosa y así puede degradar seriamente la calidad de audio total cuando se mezcle en los canales izquierdo y derecho de la señal de salida (que se derivan por ejemplo de acuerdo con L=M+S y R=M-S). Cuando una señal lateral S solo tiene calidad de mala a intermedia, hay dos opciones: el receptor elige aceptar el ruido asociado con la señal lateral S y emite la señal de estéreo real que comprende una señal ruidosa izquierda y derecha, o el receptor abandona la señal lateral S y vuelve a mono.
La codificación de estéreo paramétrico (PS) es una técnica del campo de la codificación de audio de muy baja tasa de bits. El PS permite codificar una señal de audio estéreo de 2 canales como una señal de submezcla mono en combinación con información lateral adicional de PS, es decir, los parámetros de PS. La señal de submezcla mono se obtiene como una combinación de ambos canales de la señal estéreo. Los parámetros de PS permiten que el decodificador de PS reconstruya una señal estéreo de la señal de submezcla mono y la información lateral de PS. Típicamente, los parámetros de PS son variantes de tiempo y frecuencia, y el procesamiento de PS en el decodificador de PS se lleva a cabo típicamente en un dominio de filtros híbrido que incorpora un banco de QMF. El documento Low Complexity Parametric Stereo Coding in MPEG-4, Heiko Purnhagen, Proc. Efectos de audio digital Taller (DAFX), pp. 163-168, Nápoles, TI, octubre de 2004 y el documento WO 2010/012927 A1 describen un sistema de codificación de PS ejemplar para MPEG-4. El estéreo paramétrico es soportado por ejemplo por audio MPEG-4. El estéreo paramétrico se trata en la sección 8.6.4 y anexos 8.A y 8.C del documento MPEG-4 de estandarización ISO / IEC 14496-3: 2005 (MPEG-4 Audio, 3ª edición). El estéreo paramétrico también se usa en la norma MPEG Surround (véase el documento ISO/IEC 23003-1:2007, MPEG Surround).
Se tratan ejemplos adicionales de sistemas de codificación de estéreo paramétrico en el documento Binaural Cue Codificación -Part I: Psychoacoustic Fundamentals and Design Principles, Frank Baumgarte y Christof Faller, IEEE Transactions on Speech and Audio Processing, vol 11, n° 6, páginas 509 a 519, noviembre de 2003, y en el documento Binaural Cue Codificación -Part II: Schemes and Applications, Christof Faller y Frank Baumgarte, IEEE Transactions on Speech and Audio Processing, vol 11, n° 6, páginas 520 a 531, noviembre de 2003. En los dos últimos documentos el término "codificación de indicación binaural" se usa, que es un ejemplo de codificación de estéreo paramétrico.
En el presente documento, se describe un método y sistema que se basa en la generación de parámetros de PS. Los parámetros de PS se usan para generar una señal de estéreo de ruido bajo incluso cuando se recibe una señal lateral de mala calidad. Además, se describe un método de ocultamiento de errores que se puede usar para ocultar las caídas intermedias a mono, manteniendo los parámetros de PS estimados previamente. Un problema en este contexto es que las situaciones de caída de mono necesitan ser detectadas de manera eficiente y fiable. En vista de
15
25
35
45
55
65
E11754630
16-12-2014
esto, el presente documento describe un mecanismo para detectar y ocultar situaciones de caída de mono.
Sumario de la invención
La invención resuelve el problema mencionado anteriormente mediante un sistema y un método como se reivindica.
De acuerdo con un aspecto, se describe un sistema configurado para generar una señal estéreo de salida y/o configurado para determinar un parámetro de estéreo paramétrico desde una señal de audio de dos canales. La señal de audio de dos canales puede ser recibida en un receptor de radio estéreo de FM, que es por ejemplo, parte de un dispositivo de comunicación inalámbrico. La señal de audio de dos canales recibida puede ser presentable como una señal media y una señal lateral. En otras palabras, la señal de audio de dos canales puede comprender una señal media y una señal lateral o puede comprender señales que son representables como una señal media y una señal lateral. La señal media y la señal lateral se pueden derivar de una señal izquierda y una señal derecha. En otras palabras, la señal media y/o la señal lateral pueden ser obtenibles desde la señal de audio de dos canales. Como tal, la señal de audio de dos canales puede comprender información desde la cual una señal media y una señal lateral se pueden derivar. En una realización, la señal media M y la señal lateral S se refieren a la señal de audio izquierda L y la señal de audio derecha R, como M=(L+R)/2 y S=(L-R)/2. La señal estéreo de salida es típicamente representable de una señal izquierda y una señal derecha. Alternativamente, la señal estéreo de salida puede ser referida como una señal de salida de dos canales. Esta señal de salida de dos canales puede llevar una señal de audio mono o una señal de audio estéreo. En particular, si la señal izquierda de la señal de salida de dos canales corresponde a la señal derecha de la señal de salida de dos canales, la señal de salida de dos canales lleva típicamente una señal de audio mono.
El sistema puede comprender una etapa de estimación de parámetros de estéreo paramétrico configurada para determinar un parámetro de estéreo paramétrico primero (o al menos un parámetro de estéreo paramétrico primero) en base a una trama primera de la señal de audio de dos canales recibida. En otras palabras, un extracto de la señal de audio de dos canales recibida puede ser usado para determinar un parámetro de estéreo paramétrico primero, por ejemplo, un parámetro que indica una diferencia de nivel de canal y/o un parámetro que indica una correlación cruzada entre canales. El extracto puede ser referido como una trama de señal. La etapa de estimación de parámetros de estéreo paramétrico puede estar configurada para determinar un nuevo parámetro de estéreo paramétrico (o al menos un nuevo parámetro de estéreo paramétrico) para cada trama sucesiva de la señal de audio de dos canales recibida.
El sistema puede comprender una etapa de detección de ocultamiento configurada para determinar una energía de la señal lateral dentro de la trama de señal primera. La energía de la señal lateral dentro de una trama de señal puede ser determinada en base al valor cuadrático medio de las muestras de la señal lateral dentro de la trama de señal. La etapa de detección de ocultamiento puede ser configurada para determinar que la energía de la señal lateral dentro de la trama de señal primera está por encima de un umbral alto.
La etapa de detección de ocultamiento puede ser configurada para determinar un número de tramas de señal sucesivas siguientes durante las cuales la energía de la señal lateral (Es) cae desde un valor por encima del umbral alto a un valor por debajo de un umbral bajo. El número de tramas de señal sucesivas siguientes puede ser referido como el periodo de transición de una señal lateral de energía alta (Es>umbral alto) a una señal lateral de energía baja (Es<umbral bajo). En otras palabras, la etapa de detección de ocultamiento puede ser configurada para determinar que la energía de la señal lateral de un cierto número de tramas de señal que suceden directamente a la trama de señal primera es menor que el umbral alto y, finalmente, cae por debajo de un umbral bajo. En particular, la etapa de detección de ocultamiento puede ser configurada para determinar el número exacto de tramas de señal durante las cuales la energía cae de una energía por encima del umbral alto a una energía por debajo del umbral bajo. Incluso más particularmente, la etapa de detección de ocultamiento puede ser configurada para determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal estéreo deteriorada o una señal mono forzada si el número de tramas de señal sucesivas, es decir, si el período de transición, está por debajo de un umbral de trama. En una realización, el umbral de trama puede ser una o más tramas de señal, por ejemplo, cualquiera de las tramas de señal 1, 2, 3 ó 4.
La etapa de detección de ocultamiento puede ser configurada para determinar el parámetro de estéreo paramétrico en base al parámetro de estéreo paramétrico primero, en particular, si se ha detectado una señal mono forzada. El parámetro de estéreo paramétrico puede ser usado para el procesamiento de tramas de señal de audio de dos canales. En particular, el parámetro de estéreo paramétrico puede ser usado para el procesamiento de tramas de la señal de audio de dos canales que sucede a la trama de señal primera de la señal de audio de dos canales.
El sistema puede comprender una etapa de mezcla ascendente configurada para generar una trama de la señal estéreo de salida que sigue a la trama de señal primera en base a una señal de audio auxiliar y en base al parámetro de estéreo paramétrico primero. En otras palabras, si se determina que la señal de audio de dos canales recibida que sigue a la trama de señal primera es una señal mono forzada, por ejemplo, una señal estéreo donde la señal lateral es muy pequeña, por ejemplo, tiene poca energía, entonces las tramas sucesivas de la señal estéreo de salida se determinan a partir del parámetro de estéreo paramétrico primero, es decir, desde un parámetro de
15
25
35
45
55
65
E11754630
16-12-2014
estéreo paramétrico primero que se ha determinado en base a una trama de la señal de audio de dos canales recibida que no se deterioró. Por otra parte, la señal de audio auxiliar puede obtenerse a partir de la señal de audio de dos canales recibida que sigue a la trama de señal primera, es decir, la señal de audio auxiliar puede ser determinada a partir de las tramas de la señal de audio de dos canales recibida que corresponden a las tramas de la señal estéreo de salida. En una realización, la señal de audio auxiliar se determina como (L+R)/a, en la que a es un número real, por ejemplo, dos. Es decir, la señal de audio auxiliar puede corresponder a la señal media comprendida dentro de la señal de audio de dos canales recibida.
La etapa de detección de ocultamiento puede ser configurada además para determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono auténtica si el número de tramas de señal sucesivas está en o por encima del umbral de trama. Como tal, la etapa de detección de ocultamiento puede ser configurada para detectar una transición de una señal estéreo a una señal mono auténtica (por ejemplo, una señal de voz) determinando el número de tramas de señal que le lleva a la energía de la señal lateral caer desde por encima del umbral alto a por debajo del umbral bajo.
La etapa de detección de ocultamiento puede ser configurada como una máquina de estado. En particular, la etapa de detección de ocultamiento puede comprender una pluralidad de estados que especifican una pluralidad de modos del sistema en general. Un modo del sistema típicamente determina cómo se procesa una trama actual de la señal de audio de dos canales recibida. En particular, el procesamiento de la etapa de mezcla ascendente puede depender del estado actual del sistema. La etapa de detección de ocultamiento puede comprender también una pluralidad de bordes que especifican las condiciones de transición entre la pluralidad de estados. Como tal, un borde entre dos estados puede especificar una condición que ha de cumplirse para que el sistema pase de un estado actual a un estado sucesivo. La condición puede comprender una o más condiciones, por ejemplo, condiciones con respecto a la energía de la trama sucesiva de la señal lateral, una restricción de tiempo, un número de restricción de trama, etc. Al especificar las condiciones de transición entre los estados, un borde puede determinar cómo se procesa una trama inmediatamente sucesiva en la trama actual de la señal de audio de dos canales.
La pluralidad de estados puede comprender un estado estéreo, es decir, un estado durante el cual el sistema procesa la señal de audio de dos canales como una señal estéreo no deteriorada. Si el sistema está en el estado estéreo la etapa de estimación de parámetros de estéreo paramétrico puede ser configurada para determinar un parámetro actual de estéreo paramétrico, en base a la trama actual de la señal de audio de dos canales recibida. La etapa de mezcla ascendente puede ser configurada para generar una trama actual de la señal estéreo de salida en base a la señal de audio auxiliar y el parámetro actual de estéreo paramétrico. La señal de audio auxiliar puede obtenerse a partir de la trama actual de la señal de audio de dos canales recibida. En particular, la señal de audio auxiliar puede obtenerse a partir de la trama actual de la señal media comprendida dentro de la señal de audio de dos canales recibida. Debería señalarse que, alternativamente o adicionalmente, el sistema puede pasar por alto la etapa de mezcla ascendente y determinar la señal estéreo de salida directamente de la señal de audio de dos canales. En particular, una trama de la señal estéreo de salida podría ser determinada directamente, por ejemplo, copiada, a partir de una trama de la señal de audio de dos canales recibida.
La pluralidad de estados puede comprender un estado mono auténtico, es decir, un estado durante el cual el sistema procesa la señal de audio de dos canales recibida como una señal mono auténtica, como por ejemplo, una señal de voz. Si el sistema está en el estado mono auténtico, la etapa de estimación de parámetros de estéreo paramétrico puede ser configurada para determinar un parámetro actual de estéreo paramétrico, en base a la trama actual de la señal de audio de dos canales recibida. La etapa de mezcla ascendente puede ser configurada para generar una trama actual de la señal estéreo de salida en base a la señal de audio auxiliar y el parámetro actual de estéreo paramétrico. La señal de audio auxiliar puede obtenerse de la trama actual de la señal de audio de dos canales recibida. Debería señalarse que, en una manera similar al estado estéreo, el sistema puede funcionar en un modo de derivación durante el funcionamiento mono auténtico.
La pluralidad de estados puede comprender un estado de ocultamiento, es decir, un estado durante el cual el sistema oculta la señal mono forzada. Si el sistema está en el estado de ocultamiento la etapa de mezcla ascendente puede ser configurada para generar una trama actual de la señal estéreo de salida en base a la señal auxiliar de audio y un parámetro de estéreo paramétrico almacenado. Como tal, la etapa de mezcla ascendente puede ser configurada para determinar la señal estéreo de salida en base a un parámetro de estéreo paramétrico determinado previamente, y ocultar así la señal mono comprendida dentro de una trama de señal lateral actualmente recibida. De una manera similar a los otros estados, la señal de audio auxiliar puede obtenerse a partir de la trama actual de la señal de audio de dos canales recibida. Por otra parte, el parámetro de estéreo paramétrico almacenado puede haber sido determinado por la etapa de estimación de parámetros de estéreo paramétrico mientras el sistema estaba en un estado estéreo previo. En una realización, el parámetro de estéreo paramétrico almacenado se ha determinado a partir de una pluralidad de parámetros de estéreo paramétrico, preferentemente mediante el suavizado o un promedio. Teniendo en cuenta los parámetros de estéreo paramétrico que han sido determinados para diferentes tramas de señal antes de alcanzar el estado de ocultamiento, se puede asegurar que el sistema no usa parámetros de estéreo paramétrico incómodos durante el estado de ocultamiento. Por otra parte, el parámetro de estéreo paramétrico almacenado puede depender del tiempo. En particular, el parámetro de estéreo paramétrico almacenado puede decaer a mono como una función del tiempo. En otras palabras, el parámetro de estéreo
15
25
35
45
55
65
E11754630
16-12-2014
paramétrico almacenado puede transitar a un parámetro de estéreo paramétrico que se adapta para generar una señal de audio mono. El intervalo de tiempo para tal transición puede ser variable.
La pluralidad de bordes puede comprender uno o más de los siguientes bordes: una transición desde el estado estéreo al estado mono auténtico, si la energía de la trama sucesiva está por debajo del umbral alto y por encima del umbral bajo; una transición desde el estado estéreo al estado de ocultamiento, si la energía de la trama sucesiva es inferior al umbral bajo; una transición desde el estado de ocultamiento al estado mono auténtico, si la energía de la trama sucesiva está por debajo del umbral alto y por encima del umbral bajo; una transición desde el estado de ocultamiento al estado estéreo, si la energía de la trama sucesiva está por encima del umbral alto; y/o una transición desde el estado mono auténtico al estado estéreo, si la energía de la trama sucesiva está por encima del umbral alto. En una realización, la transición desde el estado mono auténtico al estado de ocultamiento depende además del número de tramas anteriores a la trama actual para la que el sistema está en el estado mono auténtico. Alternativamente, o adicionalmente, la transición desde el estado mono auténtico al estado de ocultamiento solo puede ocurrir si el número de tramas que precede a la trama actual para la cual el sistema está en el estado mono auténtico está por debajo del umbral de trama.
La etapa de detección de ocultamiento puede ser configurada además para determinar una planicidad espectral de la trama sucesiva de la señal lateral. La planicidad espectral puede determinarse en base al espectro de potencia de una trama de la señal lateral. El espectro de potencia puede comprender una pluralidad de valores de energía asociados con una pluralidad respectiva de bandas de frecuencia. La planicidad espectral se puede determinar como la relación entre la media geométrica de la pluralidad de valores de energía y la media aritmética de la pluralidad de valores de energía. Como tal, una planicidad espectral cercana a cero indica un espectro de potencia concentrado, en el que una planicidad espectral hacia uno indica un espectro de potencia plana, es decir, el espectro de potencia de una señal ruidosa. La etapa de detección de ocultamiento puede ser configurada para considerar la planicidad espectral en una condición de transición de al menos uno de la pluralidad de bordes. Es decir, una condición de transición de un borde de la etapa de ocultamiento puede tener en cuenta que la trama sucesiva de la señal lateral comprende o no comprende un alto grado de ruido, en particular, la transición desde el estado mono auténtico al estado estéreo puede depender de la planicidad espectral de la trama sucesiva. Aún más particularmente, la transición desde el estado mono auténtico al estado estéreo solo puede producirse si la planicidad espectral es inferior a un umbral de planicidad. Como tal, se puede evitar una falsa transición desde el estado mono auténtico al estado estéreo causada por una estallido de ruido en la señal lateral. Esto también evita una transición desde el estado mono auténtico al estado de ocultamiento (a través del estado estéreo) que conduciría a un ocultamiento no deseado de una señal mono auténtica.
El sistema puede comprender una etapa de estimación de ruido. La etapa de estimación de ruido puede ser configurada para determinar una característica de parámetro de ruido para la potencia de ruido de la señal lateral recibida. Además, la etapa de estimación de parámetros de estéreo paramétrico puede ser configurada para determinar el parámetro de estéreo paramétrico, es decir, los parámetros de estéreo paramétrico primero o actual, en base a la señal de audio de dos canales recibida y el parámetro de ruido.
El sistema puede comprender además un codificador de audio que soporte estéreo paramétrico. El codificador de audio puede comprender un codificador de estéreo paramétrico, con la etapa de estimación de parámetros de estéreo paramétrico siendo parte del codificador de estéreo paramétrico.
De acuerdo con un aspecto adicional, se describe un receptor de radio estéreo de FM. El receptor de radio estéreo de FM puede ser configurado para recibir una señal de radio de FM que comprende o presentable como una señal media y una señal lateral. Además, el receptor de radio estéreo de FM puede comprender un sistema que tiene una
o más de las características y funciones descritas en el presente documento.
De acuerdo con otro aspecto, se describe un dispositivo de comunicación móvil, por ejemplo, un teléfono móvil o un teléfono inteligente. El dispositivo de comunicación móvil puede comprender un receptor estéreo FM configurado para recibir una señal de radio de FM que comprende o presentable como una señal media y una señal lateral. Además, el dispositivo de comunicación móvil puede comprender un sistema de acuerdo con una cualquiera o más de las características y funciones descritas en el presente documento.
De acuerdo con un aspecto adicional, se describe un método para generar una señal de salida estéreo (o una señal de salida de dos canales) y/o para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales recibida. La señal de audio de dos canales recibida puede comprender o estar presentable como una señal media y una señal lateral. El método puede comprender la etapa de determinar un parámetro de estéreo paramétrico primero en base a una trama primera de la señal de audio de dos canales recibida. El método puede proceder a determinar una energía de la señal lateral dentro de la trama de señal primera y a determinar que la energía de la señal lateral dentro de la trama de señal primera está por encima de un umbral alto. Además, el método puede comprender la etapa de determinar un número de tramas de señal sucesivas siguientes, por ejemplo, tramas de señal que siguen directamente a la trama de señal primera, durante la cual la energía de la señal lateral cae desde un valor por encima del umbral alto a un valor por debajo de un umbral bajo. En particular, el método puede determinar el número de tramas durante las cuales la energía de la señal lateral cae desde un valor por
15
25
35
45
55
65
E11754630
16-12-2014
encima del umbral alto a un valor por debajo del umbral bajo. Subsiguientemente, el método puede proceder a determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal estéreo deteriorada o una señal mono forzada si el número de tramas de señal sucesivas está por debajo de un umbral de trama. Si este es el caso, es decir, si se determina que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada, el método puede comprender la etapa de determinar el parámetro de estéreo paramétrico en base al parámetro de estéreo paramétrico primero. Alternativamente o adicionalmente, el método puede comprender la etapa de generar una trama de la señal estéreo de salida que sigue a la trama de señal primera en base a una señal de audio auxiliar y en base al parámetro de estéreo paramétrico primero; en el que la señal de audio auxiliar se obtiene a partir de la señal de audio de dos canales recibida que sigue a la trama de señal primera.
De acuerdo con un aspecto adicional, se describe un programa de equipo lógico. El programa de equipo lógico se puede adaptar para su ejecución en un procesador y para realizar los pasos del método descritos en el presente documento cuando se llevan a cabo en un dispositivo de ordenador.
De acuerdo con otro aspecto, se describe un medio de almacenamiento. El medio de almacenamiento puede comprender un programa de equipo lógico adaptado para su ejecución en un procesador y para llevar a cabo los pasos del método descritas en el presente documento cuando se llevan a cabo en un dispositivo de ordenador.
De acuerdo con un aspecto adicional, se describe un producto de programa de ordenador. El programa de ordenador puede comprender instrucciones ejecutables para realizar los pasos del método descritos en el presente documento cuando se ejecuta en un ordenador.
Descripción de los dibujos
La invención se explica a continuación a modo de ejemplos ilustrativos en referencia a los dibujos que se acompañan, en los que:
la figura 1 ilustra una realización esquemática para mejorar la salida estéreo de un receptor de radio estéreo FM;
la figura 2 ilustra una realización del aparato de procesamiento de audio basado en el concepto de estéreo paramétrico;
la figura 3 ilustra otra realización del aparato de procesamiento de audio basado en PS que tiene un codificador de PS y un decodificador de PS;
la figura 4 ilustra una versión ampliada del aparato de procesamiento de audio de la figura 3;
la figura 5 ilustra una realización del codificador de PS y el decodificador de PS de la figura 4;
la figura 6 ilustra otra realización del aparato de procesamiento de audio para la generación de pseudoestéreo en el caso de salida solo mono del receptor de FM;
la figura 7 ilustra la ocurrencia de caídas cortas en la reproducción estéreo en la salida del receptor de FM;
la figura 8 ilustra una máquina de estado de ejemplo que se usa para realizar la detección de caída mono y el ocultamiento de errores mono;
la figura 9 ilustra un ocultamiento de errores de ejemplo de una señal con caídas mono;
la figura 10 ilustra el espectro de potencia para una señal de audio de ejemplo;
la figura 11 ilustra una etapa de estimación de parámetros de PS de ejemplo usando el ocultamiento de errores;
la figura 12 ilustra una etapa de detección de "mono" de ejemplo o etapa de detección de ocultamiento;
la figura 13 ilustra una etapa de estimación de parámetros de PS avanzada con compensación de errores; y
la figura 14 ilustra una realización adicional del aparato de procesamiento de audio en base a un codificador HE-AAC v2.
Descripción detallada
La figura 1 muestra una realización esquemática simplificada para mejorar la salida estéreo de un receptor 1 de radio estéreo de FM. Como se trató en la sección de antecedentes, en la radio de FM la señal estéreo se transmite por el diseño como una señal media y señal lateral. En el receptor 1 de FM, se usa la señal lateral para crear la
15
25
35
45
55
65
E11754630
16-12-2014
diferencia de estéreo entre el canal izquierdo L y el canal derecho R a la salida del receptor 1 de FM (al menos cuando la recepción es bastante buena y la información de la señal lateral no es silenciada). Los canales izquierdo y derecho L, R puede ser señales digitales o analógicas. Para mejorar las señales de audio L, R del receptor de FM, se usa un aparato 2 de procesamiento de audio que genera una señal de audio estéreo L' y R' en su salida. El aparato 2 de procesamiento de audio corresponde a un sistema que está habilitado para realizar la reducción de ruido de una señal de radio de FM recibida usando estéreo paramétrico. El procesamiento de audio en el aparato 2 se realiza preferentemente en el dominio digital; así, en caso de una interfaz analógica entre el receptor 1 de FM y el aparato 2 de procesamiento de audio, se usa un convertidor de analógico a digital antes del procesamiento de audio digital en el aparato 2. El receptor de 1 FM y el aparato 2 de procesamiento de audio pueden estar integrados en el mismo chip semiconductor, o pueden ser parte de dos chips semiconductores. El receptor 1 de FM y el aparato 2 de procesamiento de audio pueden ser parte de un dispositivo de comunicación inalámbrico tal como un teléfono móvil, un asistente digital personal (PDA) o un teléfono inteligente, en este caso, el receptor 1 de FM puede ser parte del chip de banda de base que tiene una funcionalidad de receptor de radio de FM adicional.
En lugar de usar una representación izquierda/derecha en la salida del receptor 1 de FM y la entrada del aparato 2, una representación media / lateral puede ser usada en la interfaz entre el receptor 1 de FM y el aparato 2 (véase M, S en la figura 1 para la representación media/lateral y L, R para la representación izquierda/derecha). Tal representación media/lateral en la interfaz entre el receptor 1 de FM y el aparato 2 puede resultar en menos esfuerzo puesto que el receptor 1 de FM ya recibe una señal media/lateral y el aparato 2 de procesamiento de audio podrá tratar directamente la señal media/lateral sin submezclar. La representación media/lateral puede ser ventajosa si el receptor 1 de FM está estrechamente integrado con el aparato 2 de procesamiento de audio, en particular, si el receptor 1 de FM y el aparato 2 de procesamiento de audio están integrados en el mismo chip semiconductor.
Opcionalmente, una señal 6 de fuerza de señal que indica la condición de recepción de la radio se puede usar para adaptar el procesamiento de audio en el aparato 2 de procesamiento de audio. Esto se explicará más adelante en esta especificación.
La combinación del receptor 1 de radio de FM y el aparato 2 de procesamiento de audio corresponde a un receptor de radio de FM que tiene un sistema de reducción de ruido integrado.
La figura 2 muestra una realización del aparato 2 de procesamiento de audio que se basa en el concepto de estéreo paramétrico. El aparato 2 comprende una etapa 3 de estimación de parámetros de PS. La etapa 3 de estimación de parámetros está configurada para determinar los parámetros 5 de PS en base a la señal de audio de entrada a ser mejorada (que puede ser tanto en representación izquierda/ derecha como media/lateral). Los parámetros 5 de PS pueden incluir, entre otros, un parámetro que indica las diferencias de intensidad entre canales (IID o también llamado EPC -diferencias de nivel de canal) y/o un parámetro que indica una correlación cruzada entre canales (ICC). Preferentemente, los parámetros 5 de PS son la variante de tiempo y frecuencia. En caso de una representación de M/S en la entrada de la etapa 3 de estimación de parámetros, la etapa 3 de estimación de parámetros puede no obstante determinar los parámetros 5 de PS que se refieren a los canales UR.
Una señal de audio DM se obtiene de la señal de entrada. En caso de que la señal de audio de entrada ya use una representación media/lateral, la señal DM de audio puede corresponder directamente a la señal media. En caso de que la señal de audio de entrada tenga una representación izquierda/derecha, la señal de audio se genera por submezclar la señal de audio. Preferentemente, la señal DM resultante después de la submezcla corresponde a la señal media M y puede ser generada por la siguiente ecuación:
DM = (L+R) / a, por ejemplo con a = 2,
es decir, la señal DM de submezla puede corresponder a la media de las señales L y R. Para diferentes valores de a, la media de las señales L y R se amplifica o atenúa.
El aparato comprende además una etapa 4 de mezcla ascendente también llamada módulo de mezcla estéreo o estéreo mezclar ascendente. La etapa 4 de mezcla ascendente está configurada para generar una señal estéreo L', R' en base a la señal DM de audio y los parámetros 5 de PS. Preferentemente, la etapa 4 de mezcla ascendente no solo usa la señal DM sino también usa una señal lateral o algún tipo de señal pseudolateral (no mostrada). Esto se explicará más adelante en la especificación en conexión con más realizaciones extendidas en las figuras 4 y 5.
El aparato 2 se basa en la idea de que debido a su ruido la señal lateral recibida puede ser demasiado ruidosa para la reconstrucción de la señal estéreo simplemente combinando las señales medias y laterales recibidas; sin embargo, en este caso la señal lateral o componente de la señal lateral en la señal de UR pueden ser todavía lo bastante buena para el análisis de parámetros estéreo en la etapa 3 de estimación de parámetros de PS. Los parámetros 5 de PS resultantes pueden ser entonces usados para la generación de una señal estéreo L', R' que tiene un nivel reducido de ruido en comparación con la señal de audio directamente en la salida del receptor 1 de FM.
Así, una señal de radio de FM mala puede ser "limpiada" mediante el uso del concepto de estéreo paramétrico. La
15
25
35
45
55
65
E11754630
16-12-2014
mayor parte de la distorsión y el ruido en una señal de radio de FM se encuentra en el canal lateral que puede no ser usado en la submezcla de PS. Sin embargo, el canal lateral es, incluso en caso de mala recepción, a menudo de calidad suficiente para la extracción de parámetros de PS.
En todos los dibujos siguientes, la señal de entrada al aparato 2 de procesamiento de audio es una señal estéreo izquierda/derecha. Con pequeñas modificaciones en algunos módulos dentro del aparato 2 de procesamiento de audio, el aparato 2 de procesamiento de audio también puede procesar una señal de entrada en la representación media/lateral. Por lo tanto, los conceptos tratados en el presente documento pueden ser usados en conexión con una señal de entrada en la representación media/lateral.
La figura 3 muestra una realización del aparato 2 de procesamiento de audio basado en PS, que hace uso de un codificador 7 de PS y un decodificador 8 de PS. La etapa 3 de estimación de parámetros, en este ejemplo, es parte del codificador 7 de PS y la etapa 4 de mezcla ascendente es parte del decodificador 8 de PS. Los términos "codificador de PS" y "decodificador de PS" se usan como nombres para describir la función de los bloques de procesamiento de audio dentro del aparato 2. Se debe apreciar que el procesamiento de audio está sucediendo todo en el mismo dispositivo receptor de FM. Estos procesos de codificación de PS y de decodificación de PS pueden ser fuertemente acoplados y los términos "codificación de PS " y "descodificación de PS " solo se usan para describir la herencia de las funciones de procesamiento de audio.
El codificador 7 de PS genera –en base a la entrada de audio estéreo de la señal L, R– la señal DM de audio y los parámetros 5 de PS. Opcionalmente, el codificador 7 de PS usa, además, una señal 6 de fuerza de señal. La señal DM de audio es una submezcla mono y corresponde preferentemente a la señal media recibida. Cuando se suman los canales L/R para formar la señal DM, la información del canal lateral recibida puede excluirse por completo en la señal DM. Así, en este caso solo la información media está contenida en la submezcla mono DM. Por consiguiente, ningún ruido del canal lateral puede ser excluido de la señal DM. Sin embargo, el canal lateral es parte del análisis de parámetros estéreo en el codificador 7 como el codificador 7 toma típicamente L=M+S y R=M-S como entrada (por consiguiente, DM = (L + R) / 2 = M).
La señal mono DM y los parámetros 5 de PS se usan subsiguientemente en el decodificador 8 de PS para reconstruir la señal estéreo L', R'.
La figura 4 muestra una versión ampliada del aparato 2 de procesamiento de audio de la figura 3. En este caso, además de la señal DM de submezcla mono y los parámetros de PS también la señal lateral recibida originalmente So se transmite al decodificador 8 de PS. Este enfoque es similar a las técnicas de codificación "residual" de la codificación de PS, y permite a hacer uso de al menos partes (por ejemplo, ciertas bandas de frecuencia) como mínimo de la señal lateral recibida So en caso de buenas condiciones de recepción, pero no perfectas. La señal recibida lateral So se usa preferentemente en caso de que la señal de submezcla mono corresponda a la señal media. Sin embargo, en caso de que la señal de submezcla mono no corresponde a la señal media, una señal residual más genérica puede usarse en lugar de la señal lateral recibida So. Tal señal residual indica el error asociado con los canales originales de representación mediante su submezcla y sus parámetros de PS y se usa a menudo en esquemas de codificación de PS. A continuación, los comentarios al uso de la señal recibida lateral So también se aplican a una señal residual.
La figura 5 muestra una realización del codificador 7 de PS y el decodificador 8 de PS de la figura 4. El módulo codificador 7 de PS comprende un generador 9 de submezcla y una etapa 3 de estimación de parámetros de PS. Por ejemplo, el generador 9 de submezcla puede crear una submezcla mono DM que corresponde preferentemente a una señal media M (por ejemplo, DM=M=(L+R)/a) y puede opcionalmente también generar una segunda señal que corresponde a la señal recibida lateral So=(L-R)/a.
La etapa 3 de estimación de parámetros de PS puede estimar como parámetros 5 de PS la correlación y la diferencia de nivel entre las entradas L y R. Opcionalmente, la etapa de la estimación de parámetros recibe la fuerza 6 de señal. Esta información se puede usar para decidir acerca de la fiabilidad de los parámetros 5 de PS. En caso de una baja fiabilidad, por ejemplo, en caso de una fuerza 6 de señal baja, los parámetros 5 de PS pueden ser establecidos de tal manera que la señal de salida L', R' sea una señal de salida mono o una señal de salida de pseudoestéreo. En caso de una señal de salida mono, la señal L’ de salida es igual a la señal R' de salida. En caso de una señal de salida de pseudoestéreo, los parámetros de PS por defecto pueden ser usados para generar una señal L', R' de salida pseudoestéreo o estándar.
El módulo decodificador 8 de PS comprende una matriz 4a de mezcla estéreo y un decorrelador 10. El decorrelador recibe la submezcla mono DM y genera una señal S' decorrelacionada que se usa como una señal pseudolateral. El decorrelador 10 puede ser realizado por un filtro de todo paso apropiado como se trató en la sección 4 del documento citado Low Complexity Parametric Stereo Coding in MPEG-4. La matriz 4a de mezcla estéreo es una matriz de mezcla ascendente 2x2 en esta realización.
Dependiendo de los parámetros estimados 5, la matriz 4a de mezcla de estéreo mezcla la señal DM con la señal lateral recibida So o la señal S’ decorrelacionada para crear las señales L' y R’ de salida estéreo. La selección entre
10
15
20
25
30
35
40
45
50
55
60
E11754630
16-12-2014
la señal So y la señal S' puede depender de un indicador de recepción de radio indicativo de las condiciones de recepción, tal como la fuerza 6 de señal. Uno puede en lugar de o adicionalmente usar un indicador de calidad indicativo de la calidad de la señal lateral recibida. Un ejemplo de tal indicador de calidad puede ser un ruido estimado (potencia) de la señal lateral recibida. En caso de una señal lateral que comprende un alto grado de ruido, la señal decorrelacionada S’ puede ser usada para crear la señal L' y R' de salida estéreo, mientras que en situaciones de bajo ruido, la señal lateral S0 puede ser usada. Varias realizaciones para estimar el ruido de la señal lateral recibida se discuten más adelante en esta especificación.
La operación de mezcla ascendente se lleva a cabo preferentemente de acuerdo con la siguiente ecuación matricial:
imagen1
Aquí, los factores de ponderación α, β, γ, δ determinan la ponderación de las señales de DM y S. La submezcla mono DM corresponde preferentemente a la señal media recibida. La señal S en la fórmula corresponde ya sea a la señal decorrelacionada S' o con la señal lateral recibida So. Los elementos de matriz de mezcla ascendente, es decir, los factores de ponderación α, β, γ, δ, se pueden derivar, por ejemplo, como se muestra en el citado artículo “Low Complexity Parametric Stereo Coding in MPEG-4” (véase la sección 2.2), como se muestra en el citado documento ISO/IEC 14496-3: 2005 (véase la sección 8.6.4.6.2) de estandarización de MPEG-4, o como se muestra en el documento ISO/IEC 23003-1 (véase la sección 6.5.3.2) de especificación MPEG Surround.
En ciertas condiciones de recepción, el receptor 1 de FM solo proporciona una señal mono, siendo silenciada la señal lateral transportada. Esto típicamente pasará cuando las condiciones de recepción son muy malas y la señal lateral es muy ruidosa. En caso de que el receptor estéreo 1 de FM haya cambiado a mono la reproducción de la señal de radio estéreo, la etapa de mezcla ascendente usa preferentemente parámetros de mezcla ascendente para mezcla ascendente ciega, como parámetros de mezcla ascendente preestablecidos, y genera una señal de pseudoestéreo, es decir, la etapa de mezcla ascendente genera una señal estéreo usando los parámetros de mezcla ascendente para mezcla ascendente ciega.
También hay realizaciones del receptor estéreo 1 de FM que cambian, en condiciones de recepción pobres, la reproducción mono. Si las condiciones de recepción son demasiado pobres para la estimación de parámetros 5 de PS fiables, la etapa de mezcla ascendente usa preferentemente parámetros de mezcla ascendente para mezcla ascendente ciega y genera una señal pseudoestéreo en base a ello.
La figura 6 muestra una realización para la generación pseudoestéreo en el caso de salida mono solo del receptor 1 de FM. Aquí, un detector de mono/estéreo 13 se usa para detectar si la señal de entrada al aparato 2 es mono, es decir, si las señales de los canales L y R son las mismas. En el caso de la reproducción mono del receptor 1 de FM, el detector mono/estéreo 13 indica mezcla ascendente en estéreo usando por ejemplo un decodificador de PS con parámetros de mezcla ascendente fijos. En otras palabras: en este caso, la etapa 4 de mezcla ascendente no usa parámetros de PS desde la etapa 3 de estimación de parámetros de PS (no mostrados en la figura 6), pero usa los parámetros de mezcla ascendente fijos (no mostrados en la figura 6).
Opcionalmente, un detector 14 de voz puede ser añadido para indicar si la señal recibida es predominantemente voz
o música. Tal detector 14 de voz permite para la mezcla ascendente ciega dependiente de señal. Por ejemplo, tal detector 14 de voz puede permitir parámetros de mezcla ascendente dependientes de señales. Preferentemente, uno o más parámetros mezcla ascendente se pueden usar para voz y diferentes uno o más parámetros de mezcla ascendente se pueden usar para música. Tal detector 14 de voz puede ser realizado por un detector de actividad de voz (VAD).
Estrictamente hablando, la etapa 4 de mezcla ascendente en la figura 6 comprende un correlador 10, una matriz 4a de mezcla ascendente de 2x2, y medios para convertir la salida del detector 13 de mono/estéreo y el detector 14 de voz en alguna forma de parámetros de PS usados como entrada para la verdadera mezcla ascendente estéreo.
La figura 7 ilustra un problema común cuando la señal de audio proporcionada por el receptor 1 de FM cambia entre estéreo y mono debido a las condiciones de mala recepción de variante de tiempo (por ejemplo, "debilitándose"). Para mantener una imagen de sonido estéreo durante la conmutación mono/estéreo, se pueden usar técnicas de ocultamiento de errores. Los intervalos de tiempo en los que se aplicará el ocultamiento se indican mediante "C" en la figura. 7. Una aproximación al ocultamiento en la codificación de PS es usar los parámetros de mezcla ascendente que se basan en los parámetros de PS estimados previamente en caso de que los nuevos parámetros de PS no se puedan calcular debido a que la salida de audio del receptor 1 de FM cayó a mono. Por ejemplo, la etapa 4 de mezcla ascendente puede seguir usando los parámetros de PS estimados previamente en caso de que los nuevos parámetros de PS no se puedan calcular debido a que la salida de audio del receptor 1 de FM cayó a mono. Así, cuando el receptor estéreo 1 de FM cambia a la salida de audio mono, la etapa 4 de mezcla ascendente de estéreo continúa usando los parámetros de PS estimados previamente desde la etapa 3 de estimación de
15
25
35
45
55
65
E11754630
16-12-2014
parámetros de PS. Si los períodos de caída en la salida estéreo son lo bastante cortos de manera que la imagen de música estéreo de la señal de radio de FM permanezca similar durante un período de caída, la caída no es audible o solo apenas audible en la salida de audio del aparato 2. Otro enfoque puede ser para interpolar y/o extrapolar los parámetros de mezcla ascendente de parámetros estimados previamente. Con respecto a la determinación de los parámetros de mezcla ascendente en base a los parámetros de PS previamente estimados, se puede, a la luz de las enseñanzas en el presente documento, usar también otras técnicas conocidas por ejemplo, de mecanismos de ocultamiento de errores que se pueden usar en los decodificadores de audio para mitigar el efecto de los errores de transmisión (por ejemplo, datos corruptos o desaparecidos).
El mismo enfoque de usar parámetros de mezcla ascendente en base a los parámetros de PS estimados anteriormente también se puede aplicar si el receptor 1 de FM proporciona una señal estéreo ruidosa durante un corto período de tiempo, siendo la señal estéreo ruidosa demasiado mala para estimar parámetros de PS fiables en base a ella.
Como se ha descrito anteriormente, es deseable mantener una imagen estéreo durante las interrupciones estéreo representadas en la figura 7, con el fin de evitar discontinuidades percibidas repentinas de la anchura de estéreo. Esto se puede lograr mediante las técnicas de ocultamiento antes mencionados. Sin embargo, puede ser un problema para detectar estas caídas mono de una manera fiable. Una posible detector mono/estéreo podría estar basado en la detección de secciones mono de la señal que cumple la condición señal izquierda = señal derecha (o señal izquierda -señal derecha = 0). Tal detector mono/estéreo, sin embargo, llevaría a un comportamiento inestable para el proceso de ocultamiento, debido al hecho de que las energías de señal izquierda y derecha, así como la energía de la señal lateral, pueden fluctuar mucho incluso en condiciones de recepción sanas.
Con el fin de evitar tal comportamiento inestable del ocultamiento, la detección de mono/estéreo y el mecanismo de ocultamiento podrían implementarse como una máquina de estado. Una máquina de estado de ejemplo se ilustra en la figura 8. La máquina de estado de la figura 8 hace uso de dos niveles de referencia de la energía absoluta de la señal lateral S, es decir, Es. La señal lateral S usada para calcular Es puede haber sido filtrada de paso alto con una frecuencia de corte de 250 Hz típicamente. Estos niveles de referencia son un nivel de referencia superior ref__high y un nivel de referencia inferior ref_low. Sobre el nivel de referencia superior (ref_high) la señal es considerada como estéreo y por debajo de los niveles de referencia inferiores (ref_low) se considera como mono.
La energía de la señal lateral Es se calcula como un parámetro de control de la máquina de estado. Es puede calcularse a través de un intervalo de tiempo que podría por ejemplo corresponder al período de tiempo de validez de los parámetros de PS. En otras palabras, la frecuencia de la determinación de la energía de la señal lateral puede estar alineada a la frecuencia de la determinación de los parámetros de PS. En este documento, el período de tiempo para determinar la energía Es de señal lateral (y posiblemente los parámetros de PS) es referido como una trama de señal. La máquina de estado de la figura 8 comprende cinco condiciones, que se verifican cada vez que la energía Es de una nueva trama se calcula:
-La condición A indica que la energía Es de la señal lateral excede el nivel de referencia superior ref_high. El nivel de referencia superior puede ser referido como el umbral superior.
-La condición B indica que la energía Es de la señal lateral es menor o igual que el nivel de referencia superior y mayor o igual que el nivel de referencia inferior ref_low. El nivel de referencia inferior puede ser referido como el umbral inferior.
-La condición B1 corresponde a la condición B, pero añade una condición de tiempo adicional. La condición de tiempo establece que la condición B se cumple menos de un número de umbral de tramas o menos de un tiempo de umbral. Este umbral puede ser referido como el umbral de trama.
-La condición B2 corresponde a la condición B, con la condición de tiempo adicional que estipula que la condición B se cumple más o igual que el número de umbral de tramas o más o igual que el tiempo de umbral.
-La condición C indica que la energía Es de señal lateral es inferior que el nivel de referencia inferior ref_low.
Además, la máquina de estado de ejemplo de la figura 8 hace uso de cinco estados. Los diferentes estados se alcanzan sujetos a las condiciones mencionadas anteriormente y sujetos al diagrama de estado ilustrado en la figura. 8. Las siguientes acciones se realizan típicamente en los diferentes estados:
-En el estado 1 se realiza el funcionamiento estéreo normal, por ejemplo en base a los parámetros de PS que se determinan a partir de la señal actual de audio.
-En el estado 2 se realiza el funcionamiento estéreo normal en base a los parámetros de PS determinados en la señal actual de audio. Este estado es solo transitorio, en vista del hecho de que, o bien la condición B se cumple durante un número de tramas más o igual que el umbral de trama o por un tiempo mayor o igual al umbral de tiempo (es decir, la condición B2) o antes de este lapso de número de tramas o lapso de tiempo, la condición A se cumple.
10
15
20
25
30
35
40
45
50
55
60
65
E11754630
16-12-2014
-En el estado 3 se realiza el funcionamiento estéreo en base a los parámetros de PS determinados en la señal actual de audio. Se puede ver que el estado 3 puede lograrse en una trayectoria que va de un estado 1 vía el estado 2 al estado 3. En vista del hecho de que la condición B2 requiere un número mínimo de tramas o una cantidad mínima de tiempo para la transición, la trayectoria "estado 1, estado 2, estado 3" representa una transición lenta, es decir, suave, de un funcionamiento estéreo normal (por ejemplo, música) a un funcionamiento normal mono (por ejemplo, voz).
-En el estado 4 se empieza el ocultamiento de errores usando parámetros de PS previamente determinados, por ejemplo, los parámetros de PS más recientes que se determinaron en el estado 1. Se puede ver que el estado 4 puede ser logrado desde el estado 1 directamente, si se cumple la condición C, es decir, si la energía Es de señal lateral cae repentinamente desde arriba ref_high a abajo ref_low. Alternativamente, el estado 4 puede ser logrado desde el estado 1 a través de estado 2, sin embargo, solo si se cumple la condición B por solo un escaso número de tramas o solo un corto período de tiempo. Como tal, las trayectorias "estado 1, estado 4" y "estado 1, estado 2, estado 4" representan una transición rápida, es decir, repentina, de un funcionamiento estéreo normal (por ejemplo, música) a un funcionamiento mono forzado. El funcionamiento mono forzado se debe típicamente a que el receptor de FM corte repentinamente la señal lateral si el nivel de ruido en la señal lateral excede un nivel predeterminado.
-En el estado 5 se continúa el ocultamiento de errores por ejemplo en base a los parámetros de PS que se han establecido en el estado 4. En la realización ilustrada, el estado 5 solo puede ser logrado desde el estado 4 si se cumple la condición C, es decir, el estado 5 representa el estado de ocultamiento de errores estable, donde se usan los parámetros de PS determinados previamente con el fin de generar una señal de audio estéreo de una señal media. Los parámetros de PS pueden decaer a mono con una constante de tiempo de unos pocos segundos. Las constantes de tiempo de parámetros IID e ICC pueden ser diferentes.
Como ya se ha indicado, el diagrama de estado ilustrado asegura que el ocultamiento se activa solo si la señal de audio recibida por el receptor de FM va de estéreo a mono dentro de unos pocos intervalos de tiempo, es decir, si la transición de estéreo a mono es repentina. Por otra parte, activar el ocultamiento se evita en los casos en que hay ruido en la señal lateral con energía Es bajo el nivel estéreo (ref_high), pero sobre el nivel mono (ref_low), es decir, en los casos en que todavía hay suficiente información dentro de la señal lateral para generar parámetros de PS apropiados. Al mismo tiempo, incluso cuando la señal cambia de estéreo a mono, por ejemplo, cuando la señal transita de música a voz, no se activará la detección de ocultamiento, asegurando así que la señal mono original no se convierte en una señal estéreo artificial debido a la aplicación errónea del ocultamiento. Una auténtica transición de estéreo a mono se puede detectar en base a una transición suave de la energía Es de señal lateral desde por encima de ref_high a por debajo de ref_low.
Los parámetros estéreo (PS) (por ejemplo, IID e ICC) de uno de los intervalos de tiempo previos se usan cuando se activa el ocultamiento. Usando opcionalmente los valores filtrados de paso bajo de los parámetros de PS en lugar de una instantánea de los parámetros de PS, la elección de los parámetros se puede hacer menos sensible al riesgo de congelación de una imagen estéreo incómoda. En otras palabras, puede ser beneficioso usar los parámetros de PS filtrados de paso bajo o promediados a partir de un cierto número de tramas o de un determinado lapso de tiempo antes de la activación del ocultamiento, con el fin de evitar el uso de un conjunto inapropiado de parámetros de PS. Los valores de los parámetros pueden decaer a mono.
Como se puede ver en la figura 8 el ocultamiento se termina cuando la señal lateral excede el nivel de mono (ref_low). Por consiguiente, los parámetros de estéreo recién evaluados se usan de nuevo. Esto es debido al hecho de que se considera que la señal lateral comprende información suficiente para determinar los parámetros de PS si la energía Es de señal lateral está por encima del umbral ref_low.
La figura 9 muestra una señal de audio de ejemplo, cómo se activa el ocultamiento cuando la energía de la señal lateral cae por debajo del nivel de referencia inferior (ref_low). La figura 9 ilustra la energía Emid de señal media (número de referencia 30), así como la energía Es de señal lateral (número de referencia 31) de una señal de audio recibida. Además, la figura 9 muestra el umbral superior ref_high (número de referencia 32) y el umbral inferior ref_low (número de referencia 33). La activación del ocultamiento se ilustra en el gráfico superior 34, en el que el valor más bajo indica que se realiza el funcionamiento normal usando parámetros de PS determinados actualmente y en el que el valor superior indica que el ocultamiento se realiza usando parámetros de PS determinado previamente.
En una realización, se usa una medición de planicidad espectral (SFM) para la detección de ruido de señal lateral, con el fin de mejorar la prevención de la falsa detección de caída mono. Como se indicó anteriormente, es beneficioso para distinguir de forma fiable entre las caídas mono causadas por una señal lateral deteriorada y las transiciones auténticas entre estéreo y mono. Un enfoque para llevar a cabo tal distinción es el uso de un diagrama de estado como se describe anteriormente. La planicidad espectral del espectro de la señal lateral puede ser una medida más para distinguir entre una señal lateral de ruido deteriorada y una señal mono auténtica. Una medición de planicidad espectral puede ser dada por
5
10
15
20
25
30
35
40
45
50
55
E11754630
16-12-2014
imagen2
donde imagen3denota la potencia de la señal lateral en la banda k de banco de filtros híbrido. El banco de filtros híbrido usado en el sistema de PS de ejemplo consta de 64 bandas QMF, donde las 3 bandas más bajas se dividen a su vez en 4+2+2 bandas (por consiguiente, N=64-3+4+2+2=69). La SFM se puede describir como la relación entre la media geométrica del espectro de potencia y la media aritmética del espectro de potencia.
Alternativamente, la SFM se puede calcular en un subconjunto del espectro, solo incluyendo las bandas de banco de filtros híbrido que van desde Kstart a Kstop. De esa manera por ejemplo, una o pocas de las primeras bandas pueden ser excluidas con el fin de eliminar un DC no deseado, por ejemplo, desviación de baja frecuencia. Cuando se ajusten los bordes de banda en consecuencia el SFM da:
imagen4
Por razones de limitación de la complejidad computacional, la fórmula de SFM puede alternativamente ser reemplazada por aproximaciones numéricas de la misma basándose por ejemplo en una expansión Taylor, una tabla de consulta, o técnicas similares comúnmente conocidas por los expertos en el campo de las implementaciones de equipo lógico.
Además, hay otros métodos obvios de la técnica anterior de medir la planicidad espectral, tales como por ejemplo, la desviación estándar o la diferencia entre el mínimo y máximo de los contenedores de potencia de frecuencia, etc. Se permite aquí que el término "SFM" denote cualquiera de estas mediciones.
Una planicidad espectral alta indica que el espectro tiene una cantidad similar de potencia en todas las bandas espectrales. Por otra parte, una planicidad espectral baja indica que la potencia espectral está concentrada en un número relativamente pequeño de bandas. En consecuencia, un valor de SFM alto indica una señal lateral ruidosa, donde un valor de SFM bajo indica una señal lateral que puede comprender información.
En la figura 10, se representa el espectro de potencia de la señal media y lateral de una señal de voz ruidosa. Se puede ver que el espectro de potencia de la señal media 20 es relativamente empinado con altos niveles de energía en el rango de frecuencia inferior. Por otra parte, la señal lateral 21, que en el caso ilustrado de una señal de voz mono comprende principalmente ruido, tiene un bajo grado general de energía y un espectro de potencia relativamente plano.
Puesto que el espectro de potencia del ruido 21 de señal lateral tiene una pendiente característica, la SFM puede ser determinada en base a un espectro de potencia de pendiente compensada, es decir, un valor de SFM puede determinarse a partir de un espectro de potencia de pendiente compensada usando la fórmula anterior. La pendiente usada para compensar el espectro de potencia se puede predeterminar, por ejemplo, como la pendiente media del espectro de potencia de una pluralidad de señales laterales de prueba. Estas señales laterales de prueba pueden ser las señales laterales de señales mono, por ejemplo señales de voz mono, produciendo mediante ello una pendiente típica/media para el ruido de señal lateral comprendido en las señales mono, por ejemplo, las señales de voz mono. Alternativamente, o adicionalmente, la pendiente usada para compensar el espectro de potencia se puede determinar usando tramas actuales de la señal lateral, proporcionando así una compensación de pendiente de adaptación. Esto podría hacerse usando técnicas de regresión lineal.
Usando la medida anterior, se puede determinar un valor de SFM para cada trama de señal, produciendo mediante ello una señal de SFM para una secuencia de tramas de señal. Esta señal de SFM puede ser suavizada (filtrada de paso bajo) a lo largo del eje de la trama/tiempo. Los valores de SFM o la señal de SFM (suavizada) se pueden usar como una medida de ruido. En particular, los valores de MSB se pueden usar para identificar estallidos de ruido ocasionales en una señal mono auténtica. A modo de ejemplo, la señal de audio puede ser una señal de voz mono y la máquina de estado de la figura 8 puede estar en el estado 3. Un estallido de ruido ocasional en la señal lateral, es decir, un incremento ocasional de energía Es, puede activar las condiciones A, iniciando así una transición del estado 3 al estado 1, a pesar de que la señal de audio es aún una señal de voz mono. Un final repentino del estallido de ruido entonces podría activar una transición al estado 4 (tanto directamente como por medio del estado 2), iniciando así el ocultamiento no deseado para una señal de voz mono. Con el fin de evitar una situación tan
E11754630
16-12-2014
indeseable, los valores de SFM o la señal de SFM (suavizada) se pueden usar como una condición adicional. A modo de ejemplo, la condición A podría adicionalmente ser dependiente de la señal de SFM (suavizada), diferenciando de esta manera entre la energía de la señal lateral que se debe a una señal estéreo y la energía de la señal lateral que se debe a estallidos de ruido. En una realización, si la señal de SFM (suavizada) excede un cierto
5 umbral, la detección de ocultamiento puede ser inactivada. En general, ha de señalarse que el uso de la SFM hace posible evitar detecciones de ocultamiento falsas que de otro modo podrían ocurrir para señales de voz mono típicas con estallidos de ruido ocasionales en la señal lateral.
En la figura 11 se ilustra una etapa de estimación de parámetros de PS de ejemplo que comprende el ocultamiento.
10 Esta etapa de estimación de parámetros de PS puede ser denominada como una etapa de estimación de parámetros de PS modificada. Una señal de audio de dos canales que comprende una señal izquierda y una derecha entra en la etapa 3 de estimación de parámetros de PS que determina un conjunto de parámetros de PS en base a una o más tramas actuales de la señal de audio de dos canales. Las señales de audio izquierda y derecha también entran en una etapa de detección "mono" o la etapa 22 de detección de ocultamiento que está configurada
15 para determinar si el ocultamiento ha de ser realizado. Para este propósito, la etapa 22 de detección "mono" puede usar cualquiera de los métodos descritos en el presente documento. La etapa de estimación de parámetros de PS modificada también comprende una etapa 23 de memoria que está configurada para almacenar parámetros de PS previamente determinados. En particular, la etapa de la memoria 23 puede ser configurada para determinar y almacenar un conjunto de parámetros de PS que se va a usar durante el ocultamiento. Además, la etapa 23 de
20 memoria puede ser configurada para aplicar un decaimiento para el conjunto de parámetros de PS almacenados. El decaimiento puede conducir a una transición suave desde el conjunto de parámetros de PS almacenados a un conjunto de parámetros de PS adaptados para convertirse en una señal mono. La velocidad del decaimiento o de transición puede ser configurable. Adicionalmente, la etapa de estimación de parámetros de PS modificados puede comprender una etapa 24 de selección de parámetros de PS configurada para seleccionar los parámetros de PS
25 desde la salida de la etapa 3 de estimación de parámetros de PS durante el funcionamiento auténtico mono o estéreo y desde la salida de la etapa 23 de memoria durante el funcionamiento de ocultamiento.
La figura 12 ilustra una etapa de detección "mono" de ejemplo o etapa 22 de detección de ocultamiento. Una señal lateral se genera a partir de las señales de audio izquierda y derecha usando una etapa 25 de determinación de 30 señal lateral. Subsiguientemente, la energía Es de la señal lateral se determina en la etapa 26 de determinación de energía. Además, un valor de SFM de la señal lateral se puede determinar en la etapa 27 de determinación de SFM. Dentro de las etapas 28, 29 de verificación de umbral respectivas se determina si la energía Es y/o el valor de SFM de la señal lateral cumplen ciertas condiciones. Estas condiciones se introducen en la máquina 40 de estado con el fin de activar una transición entre los estados de la máquina de estado. Los estados y las transiciones (bordes) de la
35 máquina de estado se pueden configurar como se describe en el presente documento. Como una salida de la etapa 22 de detección "mono", la activación de ocultamiento puede ser activada.
A continuación, se trata una etapa 3 de estimación de parámetros de PS avanzada que proporciona compensación de errores en referencia a la figura 13. En caso de la estimación de parámetros de PS en base a una señal estéreo
40 que contiene un componente lateral ruidoso, habrá un error en el cálculo de los parámetros de PS si se usan las fórmulas convencionales para determinar los parámetros de PS, tal como para determinar el parámetro CLD (Channel Level Differences) y el parámetro de ICC (Inter-channel Cross-Correlation).
Los verdaderos valores Iw/noise y Rw/noise de señal de entrada estéreo ruidosa, que se introducen en la etapa 3' de
45 estimación de parámetros de PS interior mostrada en la figura 13, se pueden expresar en dependencia de los valores Iw/o noise y Rw/o noise respectivos sin ruido y valores n de ruido de los valores de señal lateral recibidos:
imagen5
imagen6
Debería señalarse que aquí la señal lateral recibida se modela como s+n, donde "s" es la señal lateral (sin distorsión) original, y "n" es el ruido (señal de distorsión) causado por el canal de transmisión de radio. Además, se supone aquí que la señal m no está distorsionada por el ruido de canal de transmisión de radio.
Así, las potencias Lw/noise 2 y Rw/noise 2 de entrada correspondientes y la correlación cruzada Lw/noise y Rw/noise se pueden escribir como:
imagen7
imagen8
E11754630
16-12-2014
con la estimación de potencia de ruido de señal lateral N2, con N2=E(n2), donde “E ()" es el operador de expectación.
Al reordenar las ecuaciones anteriores, las potencias compensadas correspondientes y la correlación cruzada sin ruido se puede determinar que:
imagen9
Una extracción de parámetros de PS de error compensado en base a las potencias compensadas y la correlación 15 cruzada puede llevarse a cabo según lo dado por las fórmulas siguientes:
imagen10
20 Tal extracción de parámetros compensa el término N2 estimado en el cálculo de los parámetros de PS.
El efecto del ruido en la señal lateral es el siguiente: cuando se supone que el ruido en la señal lateral es independiente de la señal media:
25 -los valores ICC se acercan a 0 en comparación con los valores ICC estimados en base a una señal estéreo no ruidosa, y
-los valores CLD en decibelios se acercan a 0 dB en comparación con los valores CLD estimados en base a una 30 señal estéreo no ruidosa.
Para la compensación del error en los parámetros de PS, el aparato 2 tiene preferentemente una etapa de estimación de ruido que está configurada para determinar una característica de parámetro de ruido para la potencia del ruido de la señal lateral recibida que fue causada por la transmisión (mala) de radio. El parámetro de ruido puede
35 entonces ser considerado cuando se estiman los parámetros de PS. Esto puede ser implementado como se muestra en la figura 13.
De acuerdo con la figura 13, la fuerza 6 de señal FM se puede usar para compensar al menos parcialmente el error. La información sobre la fuerza de la señal está a menudo disponible en los receptores de radio de FM. La fuerza 6 40 de señal se introduce en la etapa 3 de análisis de parámetros en el codificador 7 de PS. En una etapa 15 de estimación de potencia de ruido de señal lateral, la fuerza 6 de señal puede ser convertida a la estimación N2 de potencia de ruido de señal lateral. Como una alternativa a la fuerza 6 de señal o adicionalmente a la fuerza 6 de señal, la señal de audio L, R se puede usar para estimar la potencia de ruido de señal como se tratará más adelante.
45 En la figura 13, la etapa 15 de estimación de potencia de ruido de señal lateral está configurada para derivar la estimación N2 de potencia de ruido en base a la fuerza 6 de señal y/o las señales de entrada de audio (L y R). La estimación N2 de potencia de ruido puede ser tanto la variante de frecuencia como la variante de tiempo.
Se pueden usar una variedad de métodos para determinar la potencia N2 de ruido de señal lateral, por ejemplo:
50 -Cuando se detecta la mínima potencia de la señal media (por ejemplo, pausas en la voz), se puede suponer que la potencia de la señal lateral es solo ruido (es decir, la potencia de señal lateral corresponde a N2 en estas situaciones).
55 -La estimación N2 puede ser definida por una función de los datos 6 de fuerza de señal. La función (o tabla de consulta) puede ser diseñada por mediciones (físicas) experimentales.
-La estimación N2 puede ser definida por una función de los datos 6 de fuerza de señal y/o las señales de entrada de audio (L y R). La función puede ser diseñada por reglas heurísticas. 60
15
25
35
45
55
65
E11754630
16-12-2014
-La estimación N2 puede basarse en estudiar la coherencia de tipo de las señales media y lateral. Se puede suponer, por ejemplo, que las señales media y lateral originales tienen una proporción tonalidad-ruido o un factor de cresta u otras características de envolvente de potencia similares. Las desviaciones de esas propiedades se pueden usar para indicar un alto nivel de N2.
Los conceptos tratados aquí se pueden implementar en relación con cualquier codificador usando técnicas de PS, por ejemplo un codificador HE-AAC v2 (High-Efficiency Advanced Audio Coding version 2) como se define en la norma ISO/IEC 14496-3 (MPEG-4 Audio), un codificador basado en MPEG Surround o un codificador basado en MPEG USAC (Unified Speech and Audio Coder), así como los codificadores que no están cubiertos por normas MPEG.
A continuación, a modo de ejemplo, se supone un codificador HE-AAC v2; no obstante, los conceptos pueden ser usados en conexión con cualquier codificador de audio que use técnicas de PS.
HE-AAC es un esquema de compresión de audio con pérdida. HE-AAC v1 (HE-AAC versión 1) hace uso de replicación de banda espectral (SBR) para incrementar la eficiencia de compresión. HE-AAC v2 incluye además estéreo paramétrico para mejorar la eficiencia de la compresión de señales estéreo a velocidades de bits muy bajas. Un codificador HE-AAC v2 incluye inherentemente un codificador de PS para permitir el funcionamiento en tasa de bits muy baja. El codificador de PS de tal codificador HE-AAC v2 se puede usar como el codificador 7 de PS del aparato 2 de procesamiento de audio. En particular, la etapa de estimación de parámetros de PS dentro de un codificador de PS de un codificador HE-AAC v2 se puede usar como la etapa 3 de estimación de parámetros de PS del aparato 2 de procesamiento de audio. También la etapa de submezcla dentro de un codificador de PS de un codificador HE-AAC v2 se puede usar como la etapa 9 de submezcla del aparato 2.
Por consiguiente, el concepto tratado en esta especificación se puede combinar de manera eficiente con un codificador HE-AAC v2 para realizar un receptor de radio estéreo de FM mejorado. Tal receptor de radio estéreo de FM mejorado puede tener una función de grabación de HE-AAC v2 puesto que el codificador HE-AAC v2 emite una corriente de bits HE-AAC v2, que puede almacenarse para fines de grabación. Esto se muestra en la figura 14. En esta realización, el aparato 2 comprende un codificador HE-AAC v2 16 y el decodificador 8 de PS. El codificador HE-AAC v2 proporciona el codificador 7 de PS usado para generar la submezcla mono DM y los parámetros 5 de PS como se trata en relación con los dibujos anteriores.
Opcionalmente, el codificador 7 de PS puede ser modificado para el propósito de reducción de ruido de radio de FM para apoyar un esquema fijo de submezcla, tal como un esquema de submezcla de acuerdo con DM=(L+R)/a.
La submezcla mono DM y los parámetros 5 de PS pueden ser suministrados al decodificador 8 de PS para generar la señal estéreo L', R' como se trató anteriormente. La submezcla mono DM se suministra a un codificador HE-AAC v1 para la codificación perceptiva de la submezcla mono DM. La señal codificada resultante perceptual de audio y la información de PS se multiplexan en una corriente de bits HE-AAC v2 18. Para propósitos de grabación, la corriente de bits HE-AAC v2 18 puede ser almacenado en una memoria tal como una memoria flash o un disco duro.
El codificador HE-AAC v1 17 comprende un codificador SBR y un codificador AAC (no mostrado). El codificador SBR típicamente realiza el procesamiento de señal en el dominio QMF (filtro espejo en cuadratura) y por lo tanto necesita muestras de QMF. En contraste, el codificador AAC necesita típicamente muestras en el dominio de tiempo (típicamente submuestreadas por un factor de 2).
El codificador 7 de PS dentro del codificador HE-AAC v2 16 típicamente proporciona la señal DM de submezcla ya en el dominio de QMF.
Puesto que el codificador 7 de PS ya puede enviar la señal DM de dominio QMF al codificador HE-AAC v1, la transformación de análisis de QMF en el codificador HE-AAC v1 para el análisis de SBR se puede hacer obsoleto. Así, el análisis de QMF que normalmente es parte del codificador HE-AAC v1 puede evitarse proporcionando la señal DM de submezcla como muestras de QMF. Esto reduce el esfuerzo de computación y permite el ahorro de complejidad.
Las muestras en el dominio de tiempo para el codificador AAC se pueden derivar de la entrada del aparato 2, por ejemplo mediante la realización de la operación simple DM=(L+R)/2 en el dominio de tiempo y por disminución de la resolución de la señal de dominio de tiempo de DM. Este enfoque es probablemente el enfoque más barato. Alternativamente, el aparato 2 puede realizar una síntesis QMF de velocidad mitad de las muestras de dominio de DM de QMF.
En el presente documento, se ha descrito un método y un sistema para reducir el ruido de los receptores de radio de FM. Los parámetros de PS se determinan a partir de la señal media y lateral recibida para generar una reducción de ruido de la señal de audio usando la señal media y los parámetros de PS. Se ha descrito una técnica de ocultamiento para proporcionar señales estéreo, incluso para las señales laterales que comprenden un alto grado de ruido. En este contexto, se ha descrito un método, sobre la manera de detectar con fiabilidad las situaciones de
E11754630
16-12-2014
recepción mono auténticas vs. las situaciones de señales laterales de ruido.
Los métodos y sistemas descritos en el presente documento pueden implementarse como equipo lógico,
microprograma y/o equipo físico. Ciertos componentes pueden, por ejemplo, ser implementados como equipo lógico
5 que se ejecuta en un procesador de señal digital o microprocesador. Otros componentes pueden por ejemplo ser
implementados como equipo físico y/o como circuitos integrados específicos de la aplicación. Las señales
encontradas en los métodos y sistemas descritos pueden ser almacenadas en los medios de comunicación tales
como memoria de acceso aleatorio o medio de almacenamiento óptico. Pueden transferirse a través de redes, como
las redes de radio, las redes de satélites, redes inalámbricas o redes de telefonía fija, por ejemplo, internet. Los 10 dispositivos típicos que hacen uso de los métodos y sistemas descritos en el presente documento son dispositivos
electrónicos portátiles u otros equipos de consumo que se usan para almacenar y/o proveer señales de audio.

Claims (13)

  1. E11754630
    16-12-2014
    REIVINDICACIONES
    1.-Un sistema configurado para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales; comprendiendo el sistema: 5
    una etapa de estimación de parámetros de estéreo paramétrico configurada para determinar un parámetro de estéreo paramétrico primero en base a una trama de señal primera de la señal de audio de dos canales recibida; y
    una etapa de detección de ocultamiento configurada para:
    10 -determinar una energía de una señal lateral dentro de la trama de señal primera; en la que la señal lateral se puede obtener de la señal de audio de dos canales y en la que la energía está por encima de un umbral alto;
    -determinar un período de transición de un número de tramas de señal siguientes sucesivas durante el cual la 15 energía de la señal lateral cae desde un valor por encima del umbral alto a un valor por debajo de un umbral bajo;
    -determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada si el número de tramas de señal sucesivas del período de transición está por debajo de un umbral de trama; y
    20 -determinar el parámetro de estéreo paramétrico para tramas que suceden a la trama de señal primera en base al parámetro de estéreo paramétrico primero, si se determina que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada.
  2. 2.-El sistema de la reivindicación 1, en el que la señal de audio de dos canales recibida es presentable como una 25 señal media y la señal lateral.
  3. 3.-El sistema de cualquiera de las reivindicaciones 1 a 2, comprendiendo además el sistema:
    • una etapa de mezcla ascendente configurada para generar una trama de una señal estéreo de salida que sigue a
    30 la trama de señal primera en base a una señal de audio auxiliar y en base al parámetro de estéreo paramétrico primero; en el que la señal de audio auxiliar se obtiene a partir de la señal de audio de dos canales recibida que sigue a la trama de señal primera.
  4. 4.-El sistema de cualquiera de las reivindicaciones 1 a 3, en el que la etapa de detección de ocultamiento está 35 configurada además para:
    -determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono auténtica si el número de tramas de señal sucesivas del período de transición está en o por encima del umbral de trama.
    40 5.-El sistema de cualquier reivindicación previa, en el que la etapa de detección de ocultamiento comprende:
    -una pluralidad de estados que especifican una pluralidad de modos del sistema; en el que un modo del sistema determina cómo se procesa una trama actual de la señal de audio de dos canales; y
    45 -una pluralidad de bordes que especifican las condiciones de transición entre la pluralidad de estados, determinando mediante ello cómo se procesa una trama que sucede inmediatamente a la trama actual de la señal de audio de dos canales.
    50 6.-El sistema de la reivindicación 5, en el que la pluralidad de estados comprende un estado estéreo; en el que en el estado estéreo:
    -la etapa de estimación de parámetros de estéreo paramétrico está configurada para determinar un parámetro actual de estéreo paramétrico en base a la trama actual de la señal de audio de dos canales recibida; y
    55 -la etapa de mezcla ascendente está configurada para generar una trama actual de la señal estéreo de salida en base a la señal de audio auxiliar y el parámetro actual de estéreo paramétrico; en el que la señal de audio auxiliar se obtiene de la trama actual de la señal de audio de dos canales recibida.
    60 7.-El sistema de la reivindicación 6, en el que la pluralidad de estados comprende un estado mono auténtico; en el que en el estado mono auténtico:
    -la etapa de estimación de parámetros de estéreo paramétrico está configurada para determinar un parámetro actual de estéreo paramétrico en base a la trama actual de la señal de audio de dos canales recibida; y 65 -la etapa de mezcla ascendente está configurada para generar una trama actual de la señal estéreo de salida en
    17 5
    15
    25
    35
    45
    55
    65
    E11754630
    16-12-2014
    base a la señal de audio auxiliar y el parámetro actual de estéreo paramétrico; en el que la señal de audio auxiliar se obtiene a partir de la trama actual de la señal de audio de dos canales recibida.
  5. 8.-El sistema de la reivindicación 7, en el que la pluralidad de estados comprende un estado de ocultamiento; en el que en el estado ocultamiento:
    -la etapa de mezcla ascendente está configurada para generar una trama actual de la señal estéreo de salida en base a la señal auxiliar de audio y un parámetro de estéreo paramétrico almacenado; en el que la señal de audio auxiliar se obtiene de la trama actual de la señal de audio de dos canales recibida; y en el que el parámetro de estéreo paramétrico almacenado se ha determinado por la etapa de estimación de parámetros de estéreo paramétrico mientras el sistema estaba en un estado estéreo previo.
  6. 9.-El sistema de la reivindicación 8, en el que el parámetro de estéreo paramétrico almacenado se ha determinado a partir de una pluralidad de parámetros de estéreo paramétrico.
  7. 10.-El sistema de cualquiera de las reivindicaciones 8 a 9, en el que la pluralidad de bordes comprende:
    -una transición desde el estado de estéreo hasta el estado mono auténtico, si la energía de la trama sucesiva está por debajo del umbral alto y por encima del umbral bajo;
    -una transición desde el estado estéreo hasta el ocultamiento de estado, si la energía de la trama subsiguiente es inferior al umbral bajo;
    -una transición desde el estado de ocultamiento hasta el estado mono auténtico, si la energía de la trama sucesiva está por debajo del umbral alto y por encima del umbral bajo;
    -una transición desde el estado de ocultamiento hasta el estado estéreo, si la energía de la trama sucesiva está por encima del umbral alto; y/o
    -una transición desde el estado mono auténtico hasta el estado estéreo, si la energía de la trama sucesiva está por encima del umbral alto.
  8. 11.-El sistema de la reivindicación 10, en el que la transición desde el estado mono auténtico hasta el estado de ocultamiento depende del número de tramas que preceden a la trama actual para las cuales el sistema está en el estado mono auténtico.
  9. 12.-El sistema de la reivindicación 11, en el que la transición desde el estado mono auténtico hasta el estado de ocultamiento solo ocurre si el número de tramas que precede a la trama actual para las cuales el sistema está en el estado mono auténtico está por debajo del umbral de trama.
  10. 13.-Un receptor de radio estéreo de FM configurado para recibir una señal de radio de FM que comprende una señal media y una señal lateral y que comprende un sistema de acuerdo con cualquiera de las reivindicaciones 1 a
  11. 12.
  12. 14.-Un método para determinar un parámetro de estéreo paramétrico a partir de una señal de audio de dos canales; comprendiendo el método:
    -determinar un parámetro de estéreo paramétrico primero en base a una trama de la señal primera de audio de dos canales recibida;
    -determinar una energía de una señal lateral dentro de la trama de señal primera; en el que la señal lateral es obtenible de la señal de audio de dos canales y en el que la energía está por encima de un umbral alto;
    -determinar un número de tramas de señal sucesivas siguientes durante las cuales la energía de la señal lateral cae desde un valor por encima del umbral alto a un valor por debajo de un umbral bajo;
    -determinar que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada si el número de tramas de señal sucesivas está por debajo de un umbral de trama; y
    -determinar el parámetro de estéreo paramétrico para tramas que suceden a la trama de señal primera en base al parámetro de estéreo paramétrico primero, si se determina que la señal de audio de dos canales que sigue a la trama de señal primera es una señal mono forzada.
  13. 15.-Un medio de almacenamiento que comprende un programa de equipo lógico adaptado para la ejecución en un procesador y para realizar los pasos de método de la reivindicación 14 cuando se lleva a cabo en un dispositivo de computación.
    18
ES11754630.9T 2010-08-24 2011-08-16 Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM Active ES2526320T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37656910P 2010-08-24 2010-08-24
US376569P 2010-08-24
PCT/EP2011/064084 WO2012025431A2 (en) 2010-08-24 2011-08-16 Concealment of intermittent mono reception of fm stereo radio receivers

Publications (1)

Publication Number Publication Date
ES2526320T3 true ES2526320T3 (es) 2015-01-09

Family

ID=44584155

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11754630.9T Active ES2526320T3 (es) 2010-08-24 2011-08-16 Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM

Country Status (7)

Country Link
US (1) US9237400B2 (es)
EP (1) EP2609592B1 (es)
JP (1) JP5581449B2 (es)
CN (1) CN103098131B (es)
AR (1) AR082522A1 (es)
ES (1) ES2526320T3 (es)
WO (1) WO2012025431A2 (es)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2526320T3 (es) * 2010-08-24 2015-01-09 Dolby International Ab Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
WO2013017435A1 (en) 2011-08-04 2013-02-07 Dolby International Ab Improved fm stereo radio receiver by using parametric stereo
WO2013045693A2 (en) 2011-09-29 2013-04-04 Dolby International Ab High quality detection in fm stereo radio signals
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
WO2013179100A1 (en) * 2012-06-01 2013-12-05 Nokia Coporation Stereo audio output, associated apparatus and methods
CN104282309A (zh) 2013-07-05 2015-01-14 杜比实验室特许公司 丢包掩蔽装置和方法以及音频处理系统
EP3503095A1 (en) * 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
EP3561809B1 (en) 2013-09-12 2023-11-22 Dolby International AB Method for decoding and decoder.
EP3127109B1 (en) * 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
CN108140393B (zh) 2016-09-28 2023-10-20 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
US10224045B2 (en) * 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
KR102629385B1 (ko) * 2018-01-25 2024-01-25 삼성전자주식회사 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN113194464B (zh) * 2021-04-26 2022-05-17 北京理工大学 一种基于频谱检测的物联网物理层隐蔽通信方法及装置

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5068896A (en) 1989-09-11 1991-11-26 Bose Corporation Audible noise reducing
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
JPH08331698A (ja) * 1995-05-30 1996-12-13 Sanyo Electric Co Ltd モノラル/ステレオ判別装置
US6466912B1 (en) 1997-09-25 2002-10-15 At&T Corp. Perceptual coding of audio signals employing envelope uncertainty
DE69840020D1 (de) 1998-04-29 2008-10-30 Sony Deutschland Gmbh Verfahren und Vorrichtung zum demultiplexieren eines frequenzdemodulierten Stereomultiplexsignals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003107591A1 (en) 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
BR0305555A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7406302B1 (en) 2003-12-15 2008-07-29 Marvell International, Inc. Digital FM stereo receiver architecture
US7835916B2 (en) 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
WO2005073958A1 (en) * 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Method and apparatus for time scaling of a signal
JP5166030B2 (ja) * 2004-09-06 2013-03-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号のエンハンスメント
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
KR101137359B1 (ko) * 2006-09-14 2012-04-25 엘지전자 주식회사 다이알로그 증폭 기술
RU2454825C2 (ru) * 2006-09-14 2012-06-27 Конинклейке Филипс Электроникс Н.В. Манипулирование зоной наилучшего восприятия для многоканального сигнала
KR101370354B1 (ko) * 2007-02-06 2014-03-06 코닌클리케 필립스 엔.브이. 낮은 복잡도 파라메트릭 스테레오 디코더
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
ATE514163T1 (de) 2007-09-12 2011-07-15 Dolby Lab Licensing Corp Spracherweiterung
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
US8374883B2 (en) * 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
DE602008005250D1 (de) * 2008-01-04 2011-04-14 Dolby Sweden Ab Audiokodierer und -dekodierer
US8023918B2 (en) 2008-02-13 2011-09-20 Silicon Laboratories, Inc. Methods and systems for stereo noise mitigation
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
EP2319037B1 (fr) * 2008-07-30 2012-05-09 France Telecom Reconstruction de données audio multicanal
US8793749B2 (en) * 2008-08-25 2014-07-29 Broadcom Corporation Source frame adaptation and matching optimally to suit a recipient video device
BR122019023877B1 (pt) * 2009-03-17 2021-08-17 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011123859A1 (en) * 2010-04-02 2011-10-06 Skyfire Labs, Inc. Assisted hybrid mobile browser
ES2526320T3 (es) * 2010-08-24 2015-01-09 Dolby International Ab Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
WO2013045693A2 (en) * 2011-09-29 2013-04-04 Dolby International Ab High quality detection in fm stereo radio signals
US9905236B2 (en) * 2012-03-23 2018-02-27 Dolby Laboratories Licensing Corporation Enabling sampling rate diversity in a voice communication system
CN119495308A (zh) * 2012-05-18 2025-02-21 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
EP2862168B1 (en) * 2012-06-14 2017-08-09 Dolby International AB Smooth configuration switching for multichannel audio

Also Published As

Publication number Publication date
CN103098131A (zh) 2013-05-08
JP2013541870A (ja) 2013-11-14
US20130142340A1 (en) 2013-06-06
AR082522A1 (es) 2012-12-12
EP2609592B1 (en) 2014-11-05
WO2012025431A2 (en) 2012-03-01
HK1186280A1 (en) 2014-03-07
EP2609592A2 (en) 2013-07-03
WO2012025431A3 (en) 2012-04-19
US9237400B2 (en) 2016-01-12
CN103098131B (zh) 2015-03-11
JP5581449B2 (ja) 2014-08-27

Similar Documents

Publication Publication Date Title
ES2526320T3 (es) Ocultamiento de la recepción mono intermitente de receptores de radio estéreo de FM
TWI516138B (zh) 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
US9877132B2 (en) Audio signal of an FM stereo radio receiver by using parametric stereo
KR101585852B1 (ko) Fm 스테레오 라디오 신호들에서 고품질의 검출
KR101893016B1 (ko) 역상관된 신호의 기여도의 잔여 신호 기반 조정을 이용하는 다중 채널 오디오 디코더, 다중 채널 오디오 인코더, 방법 및 컴퓨터 프로그램
HK1186280B (en) Concealment of intermittent mono reception of fm stereo radio receivers
HK1186312B (en) Reduction of spurious uncorrelation in fm radio noise
HK1220067B (en) Improvement of an audio signal of an fm stereo radio receiver by using parametric stereo