JP5617039B2 - Fm無線ノイズの擬似無相関の低減 - Google Patents

Fm無線ノイズの擬似無相関の低減 Download PDF

Info

Publication number
JP5617039B2
JP5617039B2 JP2013525251A JP2013525251A JP5617039B2 JP 5617039 B2 JP5617039 B2 JP 5617039B2 JP 2013525251 A JP2013525251 A JP 2013525251A JP 2013525251 A JP2013525251 A JP 2013525251A JP 5617039 B2 JP5617039 B2 JP 5617039B2
Authority
JP
Japan
Prior art keywords
signal
impact factor
sfm
parametric stereo
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013525251A
Other languages
English (en)
Other versions
JP2013541030A (ja
Inventor
エングデガルド,ヨナス
プルンハーゲン,ヘイコ
セルストロム,レイフ
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2013541030A publication Critical patent/JP2013541030A/ja
Application granted granted Critical
Publication of JP5617039B2 publication Critical patent/JP5617039B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • H04B1/1646Circuits adapted for the reception of stereophonic signals
    • H04B1/1661Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels
    • H04B1/1669Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal
    • H04B1/1676Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal of the sum or difference signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Noise Elimination (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Stereophonic System (AREA)

Description

本出願は2010年8月24日に出願された米国特許仮出願第61/376,567への優先権を主張し、参照することにより全体として本出願に組み込まれる。
本出願は音声(オーディオ)信号処理に関連し、詳しくはFMステレオ無線受信機の音声信号を改善するシステム及び対応する方法に関連する。この文脈では、一側面は受信側信号におけるノイズの推定、及び、パラメトリック・ステレオ・パラメータにおけるそうしたノイズの補償に関連する。
アナログFM(周波数変調)ステレオ無線システムでは、音声信号の左チャンネル(L)と右チャンネル(R)とは中央・サイド(M/S)表現で伝達され、即ち、中央・チャンネル(M)とサイド・チャンネル(S)として伝達される。中央・チャンネルMはLとRとの信号の和、例えば、M=(L+R)/2に対応し、そして、サイド・チャンネルSはLとRの信号の差分、例えば、S=(L−R)/2に対応する。送信のため、サイド・チャンネルSは38kHzの抑圧搬送波に変調され、ベースバンド・中央信号Mに加えられ、下位互換のステレオ多重信号を形成する。そして、この多重信号はFM送信機のHF(高周波)搬送波を変調するのに使用され、典型的には87.5乃至108MHzの範囲で動作する。
受信品質が低下すると(即ち、無線チャンネルに対するSN比が低下する)、典型的にはSチャンネルはMチャンネルよりも被害が大きい。多くのFM受信機の実施では、受信条件が極めてノイズが多くなるとSチャンネルはミュートされる。これは、不良なHF無線信号の場合には受信機がステレオからモノラルへ後退することを意味する。
中央信号Mが許容できる品質の場合でも、サイド信号Sはノイズが多いことがあり、それ故、出力信号の左右のチャンネル(例えば、L=M+SとR=M−Sに従って導出される)に混合されると全般の音声品質を大幅に低下することがある。サイド信号Sが不良乃至中間品質であるとき、2つの選択肢が存在する:受信機がサイド信号Sに関連するノイズを受信することを選択して、ノイズの多い左右信号を有する実際のステレオ信号を出力するか、又は、受信機がサイド信号Sをドロップして、モノラルに後退するか、である。
パラメトリック・ステレオ(PS)符号化はとても低いビットレート音声符号化の分野の技術である。PSは2チャンネルのステレオ音声信号を、追加的なPSサイド情報、即ち、PSパラメータと組み合わせて、モノラルのダウンミックス信号として符号化することを可能にする。そのモノラルのダウンミックス信号はステレオ信号の両チャンネルの組合せとして得られる。PSパラメータはPSデコーダが、モノラルのダウンミックス信号とPSサイド情報とから、ステレオ信号を再構成することを可能にする。典型的には、PSパラメータは時間と周波数の変数であり、PSデコーダにおけるPS処理は典型的にはQMFバンクを含むハイブリッド・フィルターバンク領域において実行される。文献”Low Complexity Parametric Stereo Coding in MPEG−4”,Heiko Purnhagen,Proc.Digital Audio Effects Workshop (DAFx),pp163−168,Naples,IT,Oct.2004は、MPEG4の例示的なPS符号化システムを説明している。そのパラメトリック・ステレオの議論は本明細書に参照して組み込まれる。パラメトリック・ステレオは例えばMPEG−4Audioによってサポートされる。パラメトリック・ステレオはMPEG−4標準規格文書ISO/IEC14496−3:2005(MPEG−4Audio,3rd edition)の8.6.4節とアネックス8.Aと8.Cで議論されている。その標準規格文書のこれらの部分は本願明細書において参照して組み込まれる。パラメトリック・ステレオはMPEG Surround規格においても使用される(文献ISO/IEC 23003−1:2007、MPEG Surroundを参照)。この文献も本願明細書において参照して組み込まれる。パラメトリック・ステレオ符号化システムの更なる例は,文献“Binaural Cue Coding−PartI:Psychoacoustic Fundamentals and Design Principles”,Frank Baumgarte and Christof Faller,IEEE Transactions on Speech and Audio Processing,vol11,no6,pages 509−519,November 2003,及び、文献“Binaural Cue Coding−PartII:Schemes and Applications”,Christof Faller and Frank Baumgarte, IEEE Transactions on Speech and Audio Processing,vol11,no6,pages520−531,November 2003において議論されている。2つの文献の後者には、用語“binaural cue coding”が使用され、それはパラメトリック・ステレオ符号化の一例である。
本願明細書では、PSパラメータを使用したステレオ信号の生成に基づく方法及びシステムが説明される。PSパラメータは不良品質のサイド信号が受信されるときにも低ノイズ信号を生成するのに使用される。この文脈では、PSパラメータのサイド信号におけるノイズの影響が分析され、そして、方法が説明され、そうした影響がどのように補償され得るかが説明される。
本願発明の課題は、PSパラメータを使用したステレオ信号の生成に基づく方法及びシステムを提供することである。
一側面によれば、出力ステレオ信号を生成し、及び/又は、2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するよう構成されるシステムが説明される。すなわち、本システムは少なくとも1つのパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。その2チャンネル音声信号はFMステレオ無線受信機で受信されてもよく、その受信機は例えばワイヤレス通信装置の部分である。その受信された2チャンネル音声信号は中央信号とサイド信号として呈示されてもよい。すなわち、その2チャンネル音声信号は中央信号とサイド信号とを含むか、又は、中央信号とサイド信号として呈示できる信号を含んでもよい。その中央信号とサイド信号とは、対応する左音声信号と右音声信号とを表してもよい。その中央信号とサイド信号とはその左信号と右信号とから導いてもよい。そうして、その2チャンネル音声信号は情報を含み、その情報から中央信号とサイド信号とを導くことができる。一実施形態では、中央信号Mとサイド信号Sとは、M=(L+R)/2及びS=(L−R)/2として、左音声信号Lと右音声信号Rとに関連する。
出力ステレオ信号は典型的には左信号と右信号とを表せる。代替的に、その出力ステレオ信号は2チャンネル出力信号として言及されてもよい。この2チャンネル出力信号はモノラルの音声信号又はステレオの音声信号を搬送してもよい。詳しくは、2チャンネル出力信号の左信号が2チャンネル出力信号の右信号に対応する場合、その2チャンネル出力信号は通常はモノラル音声信号を搬送する。
本システムは、サイド信号のノイズの特性を表わすインパクト・ファクタを決定するよう構成されたノイズ推定ステージを含む。上記で概説したように、サイド信号は受信した2チャンネル音声信号から得られてもよい。詳しくは、そのインパクト・ファクタはサイド信号のパワースペクトルに対して特徴的であってもよく、例えばサイド信号の単数又は複数の信号フレームのパワースペクトルである。より詳しくは、そのインパクト・ファクタはサイド信号のスペクトル平坦性の特徴であってもよい。一実施形態では、そのインパクト・ファクタはサイド信号のスペクトル平坦性指標から導かれ、例えばサイド信号の1つ又は複数の信号フレームのスペクトル平坦性指標から導かれる。
本システムは、或るパラメトリック・ステレオ・パラメータ又は少なくとも1つのパラメトリック・ステレオ・パラメータを決定するように構成されるパラメトリック・ステレオ・パラメータ推定ステージを含んでもよい。そのパラメトリック・ステレオ・パラメータ推定ステージは、2チャンネル音声信号の信号フレームに基づいて、パラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。換言すれば、受信された2チャンネル音声信号の抜粋は、パラメトリック・ステレオ・パラメータ、例えば、チャンネル・レベル・ディフェレンスを表すパラメータ、及び/又は、インターチャンネル相互相関を表すパラメータを決定するのに使用されてもよい。より一般的には、パラメトリック・ステレオ・パラメータ推定ステージは、出力ステレオ信号の生成のために適用される非相関の量を示すパラメトリック・ステレオ・パラメータを決定するように構成されてもよい。そのパラメトリック・ステレオ・パラメータ推定ステージは、2チャンネル・オーディオ信号の各連続するフレームに対して、新しいパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。代替的に、又は、追加的に、そのパラメトリック・ステレオ・パラメータ推定ステージは、即ち、インパクト・ファクタに基づいて、即ち、考慮に入れることにより、パラメトリック・ステレオ・パラメータを決定するように構成されてもよい。一実施形態では、パラメトリック・ステレオ・パラメータは、左と右の音声信号の間の相関を表すインターチャンネル相互相関パラメータを含む。
そのパラメトリック・ステレオ・パラメータ推定ステージは、ノイズの多いパラメトリック・ステレオ・パラメータを修正するよう構成されてもよく、そうして、そのインパクト・ファクタがサイド信号のスペクトル平坦性の高い程度を示す場合は、ステレオ信号の生成のために適用される非相関の量が低減する。詳しくは、そのパラメトリック・ステレオ・パラメータ推定ステージは、ノイズの多いパラメトリック・ステレオ・パラメータとインパクト・ファクタとに応じて、或る関数からパラメトリック・ステレオ・パラメータを決定してもよい。
本システムは、補助音声信号とパラメトリック・ステレオ・パラメータとに基づいて、出力ステレオ信号を生成するよう構成されるアップミックス・ステージを含んでもよい。その補助音声信号は2チャンネル音声信号から得られてもよい。詳しくは、補助音声信号のフレームは2チャンネル音声信号の対応するフレームから得られてもよい。一実施形態では、その補助音声信号は(L+R)/aとして決定され、aは実数、例えば2である。即ち、その補助オーディオ信号は2チャンネル音声信号の内部に含まれる中央信号に対応してもよい。
そのパラメトリック・ステレオ・パラメータ推定ステージは、左右の音声信号の第一信号フレームのサンプルを用いて、ノイズの多いインターチャンネル相互相関パラメータを決定するよう構成されてもよい。詳しくは、左右の音声信号の第一信号フレームの相互相関が決定されてもよい。これは、例えば本明細書で概説する式を用いることにより実施できる。そのインターチャンネル相互相関パラメータは、インパクト・ファクタを用いて、ノイズの多いインターチャンネル相互相関パラメータを修正することにより決定されてもよい。詳しくは、インパクト・ファクタがサイド信号のスペクトル平坦性の高い程度を表す場合、ノイズの多いインターチャンネル相互相関パラメータは増加してもよい。
換言すれば、パラメトリック・ステレオ・パラメータ推定ステージは、ノイズの多いインターチャンネル相互相関パラメータとインパクト・ファクタに応じて、或る関数からインターチャンネル相互相関パラメータを決定するよう構成されてもよい。この関数は、インパクト・ファクタが“0”の場合、値“0”を有してもよい。この関数は、インパクト・ファクタが“1”の場合、値“1”を有してもよい。値“0”と“1”の間で、その関数は“ノイズの多いインターチャンネル相互相関パラメータ”と“インパクト・ファクタ”の値に関して連続的であってもよい。その関数についての上記の制約は、そのインターチャンネル相互相関パラメータが“−1”から“1”までの範囲をカバーする場合、特に関連があり、そのインターチャンネル相互相関値“−1”は左右のチャンネルの間で否定的な相互相関を表し、“0”は左右のチャンネルの間で相互相関がないことを表し、インターチャンネル相互相関値“1”は左右のチャンネルの間で完全な相互相関を表す。さらに、そのインパクト・ファクタは、“0”から“1”までの範囲をカバーしてもよく、そのインパクト・ファクタ値“0”は平坦性の低い程度を表し、インパクト・ファクタ値“1”は平坦性の高い程度を表す。
一実施形態では、パラメトリック・ステレオ・パラメータ推定ステージは、関数:ICC_new=(impact factor)+(1−impact factor)ICCを用いて、ノイズの多いインターチャンネル相互相関パラメータICCから、インターチャンネル相互相関パラメータICC_newを決定するよう構成されてもよい。
そのノイズ推定ステージはサイド信号の第二信号フレームのパワースペクトルを計算するよう構成されてもよい。第一と第二の信号フレームは一致してもよく、即ち、ノイズの多いインターチャンネル相互相関パラメータを決定するのに使用される信号フレームは、サイド信号のパワースペクトルを決定するのに使用される信号フレームに対応してもよい。上で示したように、パワースペクトルはサイド信号のスペクトル平坦性を決定するのに使用されてもよく、それによって、サイド信号の中に含まれるノイズレベルについての目安を取得する。そのノイズ推定ステージはパワースペクトルのスロープを補償するよう構成されてもよく、それによって、補償されたパワースペクトルをもたらす。そのパワースペクトルを補償するのに使用されるスロープは、例えば、複数のテストサイド信号のパワースペクトルの平均スロープとして予め定義されてもよい。これらのテストサイド信号は、モノラル信号、例えばモノラル・スピーチ信号のサイド信号でもよく、それによって、モノラル・スピーチ信号のようなモノラル信号に含まれるサイド信号ノイズに対して典型的な平均スロープをもたらす。代替的に、又は、追加的に、パワースペクトルを補償するのに使用されるスロープは、サイド信号の第二信号フレームを用いて決定されてもよい。これは線形回帰技術を用いて実施することができるだろう。
そのノイズ推定ステージは補償パワースペクトルのスペクトル平坦性指標(SFM)値を決定するよう構成されてもよい。そのSFM値は、補償パワースペクトルの幾何平均と補償パワースペクトルの算術平均との比率として定義されてもよい。典型的には、サイド信号の複数の連続する信号フレームから、及び、それに対して複数のSFM値が決定されることに留意すべきである。SFM値は現在の信号フレームから、及び、それに対して決定されてもよいので、そのSFM値は瞬間的なSFM値として言及されてもよい。そのノイズ推定ステージはSFM値(又は、複数のSFM値)をマップし、そのマップされたSFM値に基づいて第一のインパクト・ファクタを決定するよう構成されてもよい。そのSFM値(又は、複数のSFM値)は、第一のインパクト・ファクタを決定するため、所定のスケール又は範囲の上にマップされてもよい。換言すれば、第一のインパクト・ファクタはSFM値から決定されてもよい。その結果、複数の第一のインパクト・ファクタは複数のSFM値から決定されてもよい。
マッピングの結果、第一のインパクト・ファクタは“0”から“1”までの範囲にマップされてもよい。詳しくは、そのノイズ推定ステージは、第一の低い閾値よりも下のSFM値に対して第一のインパクト・ファクタを“0”に設定し;及び/又は、第一の高い閾値よりも上のSFM値に対して第一のインパクト・ファクタを“1”に設定し;及び/又は、第一の低い閾値から第二の高い閾値までのSFM値を“0”から“1”までの範囲にスケールし、それによって、SFM値をマップするよう構成されてもよく、その第一のインパクト値はそのマップされたSFM値に対応する。線形のスケーリングが実行されてもよい。
そのノイズ推定ステージは、サイド信号の複数の信号フレームに対応する複数のSFM値を考慮することにより、平滑化されたSFM値を決定するよう構成されてもよい。その平滑化SFM値は再帰的に決定されてもよく、例えば、現在のフレームのSFM値や(直接)先行するフレームの平滑化SFM値を考慮することにより決定されてもよい。こうして、複数の平滑化SFM値が複数の信号フレームから、そして、それに対して決定されてもよい。SFM値と同様にして、平滑化SFM値がマップされてもよい。詳しくは、平滑化SFM値は所定のスケール又は範囲の上にマップされてもよい。第二のインパクト・ファクタがそのマップされた平滑化SFM値を用いて決定されてもよい。換言すれば、その第二のインパクト・ファクタは平滑化SFM値から決定されてもよい。結果的に、複数の第二のインパクト・ファクタは複数の平滑化SFM値から決定されてもよい。
その第一のインパクト・ファクタの決定と同様にして、ノイズ推定ステージは第二のインパクト・ファクタを“0”から“1”までの範囲にマップするよう構成されてもよい。そのマッピングステップは、第二の低い閾値より低い平滑化SFM値に対しては第二のインパクト・ファクタを“0”に設定するステップと;及び/又は、第二の高い閾値より高い平滑化SFM値に対しては第二のインパクト・ファクタを“1”に設定するステップと;及び/又は、第二の低い閾値から第二の高い閾値までの平滑化SFM値を“0”から“1”までの範囲にスケーリングするステップとを含んでもよい。
その結果、第一と第二のインパクト・ファクタが決定さてれもよい。典型的には、瞬間的なSFM値に基づく第一のインパクト値(又は複数の第一のインパクト値)は短いノイズ・バーストを検出するのに用いられてもよい。平滑化SFM値に基づく第二のインパクト値(又は複数の第二のインパクト値)はスタティックなノイズを検出するのに用いられてもよい。第一と第二のインパクト値を夫々の目的に適応するため、第一と第二の低い方の閾値、及び/又は、第一と第二の高い方の閾値は異なって設定されてもよい。一実施形態では、短いノイズ・バーストを良好に検出するため、第一の高い閾値は第二の高い閾値よりも高い。
ノイズ推定ステージは第一と第二のインパクト・ファクタに基づいてインパクト・ファクタを決定するよう構成されてもよい。一実施形態では、そのノイズ推定ステージはインパクト・ファクタとして第一と第二のインパクト・ファクタのうちの大きい方を選択するよう構成されてもよい。代替的に、第一と第二のインパクト・ファクタの重み付け平均がインパクト・ファクタとして使用されてもよい。
本システムは、パラメトリック・ステレオをサポートするオーディオ・エンコーダを含んでもよく、そのオーディオ・エンコーダはパラメトリック・ステレオ・エンコーダを含んでもよく、そのパラメトリック・ステレオ・パラメータ推定ステージがそのパラメータ・ステレオ・エンコーダの一部である。代替的に、又は、追加的に、本システムはFMステレオ受信機がステレオ無線信号のモノラル出力を選択することを検出するよう構成されてもよく、又は、本システムは劣悪な無線の受信を検出するよう構成されてもよい。そのFMステレオ受信機がモノラル出力へ切換えられるとき、又は、劣悪な無線の受信が発生するとき、ステレオのアップミックス・ステージは1つ以上のパラメータを使用してもよく、その1つ以上のパラメータは、パラメトリック・ステレオ・パラメータ推定ステージ、例えば、インターチャンネル・相互相関パラメータから以前に推定された1つ以上のパラメトリック・ステレオ・パラメータに基づく。
更なる側面によれば、FMステレオ無線受信機が説明される。そのFMステレオ無線受信機は、中央信号及びサイド信号を含む、または、それらを表す信号として、FM無線信号を受信するよう構成されてもよい。さらに、そのFMステレオ無線受信機は、本明細書で概説される如何なる1つ以上の特徴及び機能をも有するシステムを含んでもよい。
他の側面によれば、モバイル通信装置、例えば携帯電話やスマートフォンが説明される。そのモバイル通信装置は、中央信号及びサイド信号を含む、又は、それらを表す信号としてFM無線信号を受信するよう構成される。さらに、モバイル通信装置は本明細書で概説される如何なる1つ以上の特徴及び機能にも従ったシステムを含んでもよい。
更なる側面によれば、出力信号を生成する、及び/又は、2チャンネル音声信号から(少なくとも1つの)パラメトリック・ステレオ・パラメータを決定する方法が説明される。その2チャンネル音声信号は中央信号及びサイド信号として表されてもよく、又は、それらを含んでもよく、その中央信号及びサイド信号は対応する左右の音声信号を代表してもよい。本方法は、サイド信号のノイズのインパクト・ファクタ特徴、例えばスペクトル平坦性の特徴を決定するステップを含んでもよい。本方法は、パラメトリック・ステレオ・パラメータ(又は、少なくとも1つのパラメトリック・ステレオ・パラメータ)、例えば、左と右の音声信号の間の相関を示すインターチャンネル相互相関パラメータを決定してもよい。パラメトリック・ステレオ・パラメータの決定ステップは、2チャンネル音声信号とインパクト・ファクタとに基づいてもよい。本方法は補助音声信号とパラメトリック・ステレオ・パラメータとに基づいて出力ステレオ信号を生成するステップを含んでもよく、その補助音声信号は2チャンネル音声信号から得られてもよい。
更なる側面によれば、ソフトウェア・プログラムが説明される。そのソフトウェア・プログラムはプロセッサ上で実行され、コンピュータ装置上で実行されると本明細書で概説する方法ステップ群を実行するよう適応されてもよい。
他の側面によれば、保存媒体が説明される。その保存媒体はソフトウェア・プログラムを含んでもよく、そのソフトウェア・プログラムは、プロセッサ上で実行するよう適応され、コンピュータ装置上で実行されると本明細書で概説する方法ステップ群を実行する。
更なる側面によれば、コンピュータ・プログラム製品が説明される。そのコンピュータ・プログラムは実行可能な命令を含んでもよく、コンピュータ装置上で実行されると本明細書で概説する方法ステップ群を実行する。
本特許出願で概説する好ましい実施形態群を含む本方法及び装置は、スタンドアロンで、又は、本明細書で開示される他の方法及びシステムと組み合わせて使用されてもよい。さらに、本特許出願で概説される方法及びシステムの全ての側面は任意的に組み合わせてもよいことに留意すべきである。特に、請求項の特徴は任意的に他の特徴と組み合わせてもよい。
本発明は添付の図面を参照して例示的な例を用いて以下で説明される。
図1はFMステレオ無線受信機のステレオ出力を改善する概略的な実施形態を例示する。 図2はパラメトリック・ステレオのコンセプトに基づいた音声処理装置の一実施形態を例示する。 図3はPSエンコーダとPSデコーダとを有するPSベースの音声処理装置に係る他の実施形態を例示する。 図4は図3の音声処理装置の拡張版を例示する。 図5は図4のPSエンコーダとPSデコーダの一実施形態を例示する。 図6はFM受信機のモノラルだけの出力の場合の疑似ステレオ生成用の音声処理装置の他の実施形態を例示する。 図7はFM受信機の出力端でのステレオ再生における短いドロップアウトの発生を例示する。 図8はエラー補償を備えた高度なPSパラメータ推定ステージを例示する。 図9AはICCパラメータを補償するためのノイズ補償の例を示す。 図9Bはノイズ補償の例をより詳細に示す。 図10は音声信号の例に対するパワースペクトルを示す。 図11はインパクト・ファクタを決定するプロセスの例を示し、その影響ファクタはICCパラメータを補償するのに使用されてもよい。 図12は、ステレオ音楽セクションからモノラルスピーチセクションへ推移する音声信号の例に対する、平滑化されたスペクトル平坦性指標とその対応するインパクト・ファクタとを示す。 図13はHE−AAC v2エンコーダに基づく音声処理装置の別の実施形態を示す。
図1はFMステレオ無線受信機1のステレオ出力を改善する単純化された概略的な実施形態を示す。背景技術の章で説明したように、FM無線ではステレオ信号は意図的に中央信号とサイド信号として送信される。FM受信機1では、サイド信号はFM受信機1の出力端で左チャンネルLと右チャンネルRの間のステレオ差分を生成するよう使用される(少なくとも受信が充分に良好でかつそのサイド信号情報がミュートされていない場合)。左と右のチャンネルL,Rはデジタル又はアナログ信号でもよい。FM受信機の音声信号L,Rを改善するため、音声信号装置2が使用されてその出力端でステレオ音声信号L´とR´とを生成する。その音声処理装置2は、パラメトリック・ステレオを用いて、受信されたFM無線信号のノイズ低減を実行することを可能にするシステムに対応する。その装置2内の音声処理は好ましくはデジタル領域で実行され;従って、FM受信機1と音声処理装置2との間のアナログ・インターフェースの場合は、アナログ・デジタルのコンバータが装置2内のデジタル音声処理の前に使用される。FM受信機1と音声処理装置2とは同じ半導体チップ上に統合されてもよいし、又は、2つの半導体チップの部分であってもよい。FM受信機1と音声処理装置2とは、携帯電話やPDAやスマートフォンのようなワイヤレス通信装置の部分であってもよい。この場合、FM受信機1は追加的なFM無線受信機能を有するベースバンド・チップの部分でもよい。
FM受信機1の出力端および装置2の入力端で左/右表示を使用する代わりに、中央/サイド表示がFM受信機1と装置2との間のインターフェースに使用されてもよい(図1の中央/サイド表示に対するM,S、及び左/右表示に対するL,Rを参照)。FM受信機1と装置2との間のインターフェースでのそうした中央/サイド表示は、FM受信機1が既に中央/サイド信号を受信して音声処理装置2がその中央/サイド信号をダウンミックスせずに直接処理してもよいので、より少ない労力をもたらしてもよい。中央/サイド表示は、FM受信機1が音声処理装置2にしっかりと統合している場合、詳しくは、FM受信機1と音声処理装置2とが同じ半導体チップ上に統合されている場合に、有利であってもよい。
任意的には、無線受信状態を表す信号強度信号6が使用されてもよく、音声処理装置2内の音声処理を適応する。これは本明細書で後に説明されるだろう。
FM無線受信機1と音声処理装置2との組合せは統合ノイズ低減システムを有するFM無線受信機に対応する。
図2はパラメトリック・ステレオのコンセプトに基づく音声処理装置2の一実施形態を示す。装置2はPSパラメータ推定ステージ3を含む。パラメータ推定ステージ3は改善されるべき入力音声信号(左/右又は中央/サイドの表示であってもよい)に基づいてPSパラメータ5を決定するよう構成される。PSパラメータ5は特にインターチャンネル強度差(IID、又は、CLD−チャンネル・レベル・ディフェレンスとも呼ばれる)を表すパラメータ、及び/又は、インターチャンネル相互相関(ICC)を表すパラメータを含んでもよい。好ましくは、PSパラメータ5は時間及び周波数変数である。パラメータ推定ステージ3の入力でのM/S表示の場合、そのパラメータ推定ステージ3はそれにもかかわらずL/Rチャンネルに関連するPSパラメータ5を決定してもよい。
音声信号DMが入力信号から得られる。その入力音声信号が中央/サイド表示を既に使用している場合、音声信号DMは中央信号に直接的に対応してもよい。入力信号が左/右表示を有する場合、その音声信号は音声信号をダウンミックすることにより生成される。好ましくは、ダウンミックス後の結果の信号DMは中央信号Mに対応し、以下の式により生成されてもよい:
Figure 0005617039
即ち、ダウンミックス信号DMはLとRの信号の平均に対応してもよい。aの様々な値に対して、LとRの信号の平均は単純化されるか、又は、減衰する。
本装置はステレオ・ミクシング・モジュール又はステレオ・アップミクサーとも言われるアップミックス・ステージ4を更に含む。アップミックス・ステージ4は音声信号DMとPSパラメータ5に基づいてステレオ信号L´、R´を生成するよう構成される。好ましくは、アップミックス・ステージ4はDM信号だけでなく、サイド信号又は幾つかの種類の疑似サイド信号(不図示)も使用する。これは、図4と5のより広範な実施形態に関連して本明細書で後に説明されるだろう。
本装置2は、受信した中央とサイドの信号を単純に組み合わせることにより、ノイズのためにステレオ信号を再構成するのに受信サイド信号が極めてノイズが多いことがあるというアイディアに基づく;それにもかかわらず、この場合は、L/R信号におけるサイド信号又はサイド信号の成分が、PSパラメータ推定ステージ3におけるステレオ・パラメータ分析には充分にまだ良好であることがある。そして、結果のPSパラメータ5は、ステレオ信号L´、R´を生成するのに使用されることができ、そのステレオ信号L´、R´は、FM受信機1の出力での直接の音声信号に比べて、低減したノイズレベルを有する。
従って、パラメトリック・コンセプトを用いることで劣悪なFM無線信号が“クリーン・アップ”されることができる。FM無線信号の歪みやノイズの主要部分は、PSダウンミックスで使用されないことがあるサイドチャンネルに存在する。それにもかかわらず、そのサイドチャンネルは、劣悪な受信の場合でさえ、しばしばPSパラメータ抽出に対して充分な品質である。
以下の全ての図面において、音声処理装置2への入力信号は左/右ステレオ信号である。音声処理装置2の中で幾つかのモジュールへの僅かな変更により、音声処理装置2は中央/サイド表示の入力信号も処理することができる。それ故、本明細書で議論したコンセプトは中央/サイド表示の入力信号に関連して使用することができる。
図3はPSベースの音声処理装置2の一実施形態を示し、PSエンコーダ7とPSデコータ8とを使用する。この例では、そのパラメータ推定ステージ3はPSエンコーダ7の部分であり、アップミックス・ステージ4はPSデコーダ8の部分である。“PSエンコーダ”及び“PSデコーダ”の用語は、装置2の中の音声処理ブロックの機能を説明するための名称として用いられる。音声処理は同じFM受信装置で全て動作することに留意すべきである。これらのPSエンコーディング及びPSデコーディング処理はしっかりと連結されても良く、用語“PSエンコーディング”及び“PSデコーティング”は音声処理機能のヘリテージを説明するのに用いられるだけである。
PSエンコーダ7は、ステレオ音声入力信号L,Rに基づいて、音声信号DM及びPSパラメータ5を生成する。任意的に、PSエンコーダ7は信号強度信号6を更に使用してもよい。その音声信号DMはモノラル・ダウンミックスであり、好ましくは受信中央信号に対応する。DM信号を形成するためにL/Rチャンネルを合計すると、受信サイドチャンネルの情報はそのDM信号内で完全に除去されてもよい。従って、この場合、中央情報だけがモノラル・ダウンミックスDMの中に含まれる。それ故、サイドチャンネルからの如何なるノイズもDM信号内で除去されてもよい。しかしながら、サイドチャンネルは、エンコーダ7が典型的にはL=M+S及びR=M−Sを入力としてとるので(従って、DM=(L+R)/2=M)、エンコーダ7のステレオ・パラメータ分析の部分である。
モノラル信号DM及びPSパラメータ5は、続いて、PSデコータ8で使用され、ステレオ信号L´、R´を再構成する。
図4は図3の音声処理装置2の拡張版を示す。ここでは、モノラル・ダウンミックス信号DMとPSパラメータとに加えて、元々受信したサイド信号SもPSデコータ8に伝えられる。このアプローチはPSコーディングの“残余コーディング”技術に類似し、良好であるが完全ではない受信状態の場合、受信サイド信号Sの少なくとも部分(例えば或る周波数バンド)を使用することが可能になる。その受信サイド信号Sは、そのモノラル・ダウンミックス信号が中央信号に対応しない場合に、好ましくは使用される。しかしながら、そのモノラル・ダウンミックス信号がサイド信号に対応しない場合、より一般的な残余信号が受信サイド信号Sに代わって使用されることができる。そうした残余信号は、ダウンミックスとPSパラメータによって、元々のチャンネルの表示に関連するエラーを示し、そして、PSエンコーディング・スキームの中でしばしば使用される。以下では、受信サイド信号Sの使用についての言及は残余信号にも適応される。
図5は図4のPSエンコーダ7とPSデコーダ8の一実施形態を示す。そのPSエンコーダ・モジュール7は、ダウンミックス生成器9とPSパラメータ推定ステージ3を含む。例えば、そのダウンミックス生成器9はモノラル・ダウンミックスDMを生成してもよく、そのモノラル・ダウンミックスDMは中央信号M(例えば、DM=M=(L+R)/a)に好ましくは対応し、任意的に、受信サイド信号S=(L−R)/aに対応する第2信号を生成してもよい。
PSパラメータ推定ステージ3は、PSパラメータ5として、L及びR入力の間のレベル差と相関とを推定してもよい。任意的に、そのパラメータ推定ステージは信号強度6を受信し、その信号強度はFM受信機の信号パワーであってもよい。この情報はPSパラメータ5の信頼性に関して決定するために使用されることができる。低い信頼性の場合、例えば、低い信号強度6の場合、PSパラメータ5は、出力信号L´、R´がモノラル出力信号又は疑似ステレオ出力信号であるように設定されてもよい。モノラル出力信号の場合、出力信号L´は出力信号R´と等しい。疑似ステレオ信号の場合、デフォールトのPSパラメータは疑似又はデフォールトのステレオ出力信号L´、R´を生成するのに使用されてもよい。
PSデコーダモジュール8はステレオ・ミクシング・マトリクス4aと非相関器(デコレレータ)10とを含む。その非相関器はモノラル・ダウンミックスDMを受信し、疑似サイド信号として使用される非相関信号S´を生成する。その非相関器10は引用文献“Low Complexity Parametic Stereo Coding in MPEG−4”の第4章で述べられているように、適切な全通過フィルタによって実現されてもよい。そのステレオ・ミクシング・マトリクス4aはこの実施形態の2x2のアップミックス行列である。
推定パラメータ5に応じて、ステレオ・ミクシング・マトリクス4aはステレオ出力信号L´とR´とを生成するため、DM信号を受信サイド信号S又は非相関信号S´と混合する。信号Sと信号S´の間の選択は受信状態を表す無線受信インジケータに応じてもよく、例えば信号強度6である。これに代わって、又は、これに加えて、受信サイド信号の品質を表す品質インジケータを使用してもよい。そうした品質インジケータの或る例は、受信サイド信号の推定ノイズ(パワー)であってもよい。高度ノイズを含むサイド信号の場合、非相関信号S´がステレオ出力信号L´及びR´を生成するよう使用されてもよく、一方、低ノイズの状況では、サイド信号Sが使用されてもよい。受信サイド信号のノイズを推定する各種の実施形態は本明細書で後に説明される。
アップミックス操作は好ましくは以下の行列方程式に従って実行される:
Figure 0005617039
ここで、重み付けファクタα、β、γ、δは信号DMとSの重みを決定する。モノラル・ダウンミックス信号DMは好ましくは受信中央信号に対応する。その式の信号Sは非相関信号S´か、又は、受信サイド信号Sに対応する。アップミックス・マトリクス要素群、即ち、重み付けファクタα、β、γ、δは、例えば、引用論文“Low Complexity Parametic Stereo Coding in MPEG−4”(2.2章参照)、引用されるMPEG−4標準規格文書ISO/IEC 14496−3:2005(8.6.4.6.2章参照)、又は、MPEGサラウンド仕様文書ISO/IEC23003−1(6.5.3.2章参照)に示されるように導出されてもよい。その文献のそうした章は(及び、これらの章で言及される章も)本明細書で参照して組み込まれる。
或る受信状態では、FM受信機1はモノラル信号を、伝達サイド信号をミュートにして、供給するのみである。これは、受信状態がたいへん劣悪でサイド信号がノイズが多いときに、典型的に発生するだろう。FMステレオ受信機1がステレオ無線信号のモノラル再生にスイッチした場合、アップミックス・ステージは好ましくは、プリセットのアップミックス・パラメータのようなブラインド・アップミックスのアップミックス・パラメータを使用して疑似ステレオ信号を生成し、即ち、そのアップミックス・ステージは、ブラインド・アップミックスのアップミックス・パラメータを用いて、ステレオ信号を生成する。
極めて劣悪な受信状態ではモノラル再生にスイッチするFMステレオ受信機1の実施形態もある。その受信状態が信頼できるPSパラメータ5の推定には極めて劣悪である場合、アップミックス・ステージは好ましくはブラインド・アップミックスのアップミックス・パラメータを使用し、そして、それに基づいて疑似ステレオ信号を生成する。
図6はFM受信機1のモノラルだけの出力の場合に、疑似ステレオを生成する一実施形態を示す。ここでは、モノラル/ステレオの検出器13が使用され、装置2への入力信号がモノラルであるか、即ち、L及びRのチャンネルの信号が同じであるかどうかを検出する。FM受信機1のモノラル再生の場合、モノラル/ステレオの検出器13は、例えば固定アップミックス・パラメータを備えたPSデコーダを用いて、ステレオへのアップミックスを指し示す。換言すれば、この場合、アップミックス・ステージ4はPSパラメータ推定ステージ3からのPSパラメータ(図6には図示されない)を使用しないが、固定アップミックス・パラメータ(図6には図示されない)を使用する。
任意的にスピーチ検出器14が加えられてもよく、その受信信号が主にスピーチ又は音楽であることを表示する。そうしたスピーチ検出器14は信号従属のブラインド・アップミックスを可能にさせる。例えば、そうしたスピーチ検出器14は信号従属のアップミックス・パラメータを可能にしてもよい。好ましくは、1つ以上のアップミックス・パラメータがスピーチ用に使用されてもよく、そして、異なる1つ以上のアップミックス・パラメータが音楽用に使用されてもよい。そうしたスピーチ検出器14はボイス活動検出器(VAD)によって実現されてもよい。
厳密には、図6のアップミックス・ステージ4は非相関器10、2x2アップミックス・マトリックス4a、及び、モノラル/ステレオ検出器13とスピーチ検出器14との出力を実際のステレオ・アップミックスへの入力として使用されるPSパラメータの或る形態へ変換する手段を含む。
図7は、FM受信機1によって供給される音声信号が、時間変化する劣悪な受信状態のため(例えば“フェーディング”)、ステレオとモノラルの間でトグルするとき、一般的な問題を図示する。モノラル/ステレオのトグルの間、ステレオ・サウンド・イメージを維持するため、誤り隠蔽技術が使用されてもよい。隠蔽が適応されるべき場所の時間インターバルは図7では“C”によって表示される。PSコーディングの隠蔽へのアプローチは、新しいPSパラメータはFM受信機1の音声出力がモノラルにドロップダウンしたため計算できないときは、以前に推定されたPSパラメータに基づくアップミックス・パラメータを使用することである。例えば、新しいPSパラメータがFM受信機1の音声出力がモノラルにドロップダウンしたため計算できない場合は、アップミックス・ステージ4は以前に推定されたPSパラメータを使用し続けてもよい。従って、FMステレオ受信機1がモノラルの音声出力にスイッチしたとき、ステレオのアップミックス・ステージ4はPSパラメータ推定ステージ3からの以前に推定されたPSパラメータを使用し続ける。ステレオ出力の中のドロップアウト期間が充分に短くFM無線信号のステレオ・サウンド・イメージがドロップアウト期間に類似している場合、そのドロップアウトは装置2の音声出力において聴くことができないか、又は、ほんの少しだけ聞くことができる。他のアプローチは、以前に推定されたパラメータからアップミックス・パラメータを内挿するか、及び/又は、外挿することである。以前に推定されたPSパラメータに基づくアップミックス・パラメータの決定については、本明細書の教示を考慮して、他の公知の技術を使用してもよく、例えば誤り隠蔽技術により知られた技術であって、音声デコーダにおいて使用されることができ、伝送エラーの影響を軽減する(例えば破損データ又は消失データ)。
以前に推定されたPSパラメータに基づきアップミックス・パラメータを使用する同様のアプローチは、FM受信機1がノイズの多いステレオ信号を短期間の間に供給する場合、適応されることができ、そのノイズの多いステレオ信号は極めて劣悪であり、それに基づいて信頼できるPSパラメータを推定できない。
以下では、誤り補償を供給する高度なPSパラメータ推定ステージ3´が図8に関連して説明される。ノイズの多い成分を含むステレオ信号に基づいてPSパラメータを推定する場合、CLDパラメータ(Channel Level Differences)やICCパラメータ(Inter−channel Cross−Correlation)のようなPSパラメータを決定する従来の方式が使用されると、PSパラメータの計算にエラーが起こるだろう。
実際のノイズの多いステレオ入力信号値lw/noiseとrw/noiseは、図8に示される内部PSパラメータ予測ステージ3´への入力であり、ノイズのない各値lw/o noiseとrw/o noiseと受信サイド信号値のノイズ値nとに依存して表される:
Figure 0005617039
ここで、受信サイド信号はs+nとしてモデル化され、“s”はオリジナル(歪みのない)サイド信号で、“n”は無線送信チャンネルにより生じるノイズ(歪み信号)である。さらに、ここでは、信号mが無線送信チャンネルからのノイズによって歪んでいないことが想定される。
従って、対応する入力パワーLw/noise ,Rw/noise 及び相互相関Lw/noisew/noiseは以下のように記される:
Figure 0005617039
サイド信号ノイズパワー推定Nを有し、N=E(n)であって、“E()”は推定オペレータである。
上記の式を再整理することにより、対応する補償パワーとノイズのない相互相関が決定される:
Figure 0005617039
補償パワーと相互相関に基づきエラー補償されたPSパラメータは、以下の式で実行されてもよい:
Figure 0005617039
そうしたパラメータ抽出はPSパラメータの計算において、推定されたN項を補償する。
サイド信号のノイズの影響は以下の通りである:サイド信号のノイズが中央信号から独立であると想定するとき:
− ICC値は、ノイズの少ないステレオ信号に基づいて推定されたICC値と比較して、0に近づき、及び、
− CLDデシベル値は、ノイズの少ないステレオ信号に基づいて推定されたCLD値と比較して、0dBに近づく。
PSパラメータのエラーを補償するため、装置2は好ましくはノイズ推定ステージを有し、そのノイズ推定ステージは、(劣悪な)無線送信により生じた受信サイド信号のノイズのパワーの特性を表わすノイズパラメータを決定するよう構成される。従って、そのノイズパラメータはPSパラメータを予測するときに考慮されてもよい。これは図8に示されるように実施されてもよい。
図8によれば、FM信号強度6はエラーを少なくとも部分的に補償するために使用されてもよい。信号強度に関する情報はしばしばFM無線受信機において利用可能である。その信号強度6はPSエンコーダ7におけるパラメータ分析ステージ3へ入力される。サイド信号ノイズパワー推定ステージ15では、信号強度6がサイド信号ノイズパワー推定Nに変換されてもよい。信号強度6への代替として、又は、信号強度6に付加して、音声信号L,Rは以下で引き続き説明するように、信号ノイズパワーを推定するように使用されてもよい。
図8では、サイド信号ノイズパワー推定ステージ15は、信号強度6、及び/又は、音声入力信号(LとR)に基づいて、ノイズパワー推定Nを導き出すよう構成される。ノイズパワー推定Nは周波数可変と時間可変の両方であり得る。
サイド信号ノイズパワーNを決定するために各種の方法が使用され得る。例えば:
− 中央信号(例えばスピーチのポーズ)のパワー最小値を検出すると、サイド信号のパワーはノイズだけであると想定できる(即ち、サイド信号のパワーはこれらの状態におけるNに対応する)。
− そのNは信号強度データ6の関数により定義することができる。その関数(又はルックアップテーブル)は実験的な(物理的な)測定によって設計することもできる。
− そのN推定は、中央とサイドの信号の信号タイプの一致(コヒーレンス)の研究に基づくことができる。そのオリジナルの中央とサイドの信号は例えば類似の音調対ノイズ比、又は、波高因子(クレスト・ファクタ)、又は、他のパワーの包絡線特性を有することが想定され得る。こうした特性の偏差は高レベルのNを表すように使用され得る。
以下では、サイド信号ノイズパワー推定ステージ15と、エラー補償3´を備えたPSパラメータ推定ステージの一実施形態が開示される。既に示したように、サイドチャンネルにおける(独立の)ノイズの追加はPSパラメータの推定でのエラーを導く。その結果は:
a)CLD値の大きさは典型的には減少するだろう(0dBに向かって)。従って、再生成されたステレオ信号は中央に向けてパン(panned)される傾向を有する。
b)ICC値は減少する(0に向かって、即ち非相関に向かって)。従って、より高度な人工的に生成された非相関が、ステレオ信号の再生成に使用される。
CLDパラメータへの影響はむしろ安全で無害であるが、ICCパラメータへの影響は典型的には不所望なアーティファクトとして認識される。追加的なサイドノイズを含むモノラルのスピーチ信号のとても重要で一般的な場合には、ICCパラメータ、即ち、左と右の音声信号の相互相関の減少は、アップミックス・ステージにおける非相関の増加した使用を生み、不自然で、広い、“リバーブ”音につながり、それは特に騒がしく認識される。
そうして、特別な強調がICCパラメータのノイズ補償に置かれるべきである。ノイズ補償ICCパラメータを生成する基本的な概念が図9Aに例示される。或るICCパラメータがノイズ補償ステージに入り、その入力ICCパラメータは、上記のようにノイズの多い左と右の音声信号から導かれたICCパラメータに対応してもよい。さらに、サイド信号が補償ステージに入る。そのサイド信号はサイド信号ノイズの量を推定するよう使用される。ノイズ推定を使用して、ICCパラメータは後処理されてノイズを補償し、そして、ステレオ信号を再構成するように引き続き使用されてもよい新しいICCパラメータnew_ICCを供給する。
図9Bはノイズ補償されたICCパラメータを生成するシステムの例をより詳細に例示する。或るICCパラメータが本明細書で概説したようにPSパラメータ推定ステージ3において決定される。PSパラメータ推定ステージ3はCLDパラメータのような他のPSパラメータも決定するように構成されてもよい。2チャンネルの音声信号が左と右の信号として表示される場合、そのシステムはサイド信号決定ステージ22を含んでもよく、そのサイド信号決定ステージは左右の音声信号からサイド信号を決定するよう構成される。そのサイド信号はインパクト・ファクタ・決定ステージ23に入り、そのインパクト・ファクタ・決定ステージは本明細書で概説される方法を使用し、そうしてサイド信号に基づいてインパクト・ファクタを決定する。特に、そのインパクト・ファクタとPSパラメータ推定ステージ3で決定されたICCパラメータはPSパラメータ修正ステージ24に入力され、そのPSパラメータ修正ステージは本明細書で概説した方法に従ってノイズ補償されたICCパラメータを決定するよう構成される。
そのサイド信号ノイズ推定はスペクトル・フラットネス・メジャー(SFM)に基づいてもよい。図10では、ノイズの多いスピーチ信号の中央とサイドの信号のパワースペクトルが描かれる。中央信号20のパワースペクトルが、低周波数領域では高レベルのエネルギーを有して比較的急勾配であることが見て取れる。他方、モノラルのスピーチ信号の例示の場合では主にノイズを含むサイド信号21は、全般的に低レベルのエネルギーと比較的平坦なパワースペクトルを有する。
サイド信号ノイズ21のパワースペクトルはやや平坦で特徴的なスロープを有するので、SFMはスロープ補償と一緒に使用されてもよく、ノイズレベルを推定し、ICC値を実質的に調整する。異なるタイプのSFM値が使用されてもよい。即ち、SFM値は様々な方法で計算されてもよい。とりわけ、即時的なSFM値がSFMの平滑化バージョンと同様に使用されてもよい。その即時的なSFM値はサイド信号の信号フレームのSFMと典型的には対応し、一方、その即時的なSFM値の平滑化バージョンはサイド信号の以前の信号フレームのSFMに依存する。
図11には、ICC補償処理の信号フロー30が描かれる。特に、サイド信号からインパクト・ファクタを決定する方法30が例示される。そのインパクト・ファクタはICCパラメータを補償するように使用されてもよい。ステップ31では、サイド信号のパワースペクトルが決定される。典型的には、これはサイド信号の或る数の具体例(例えば、信号フレームの具体例)を用いて行われる。パワースペクトルの決定期間はPSパラメータを決定する期間に一致してもよい。このようにして、サイド信号のパワースペクトルが、対応するPSパラメータ、特にICCパラメータの有効期間のために決定されてもよい。
次のステップ32では、サイド信号ノイズのパワースペクトル21の特徴的なスロープが補償されてもよい。その特徴的なスロープは実験的に決定されてもよく(設計/調整段階で)、例えば、モノラルの信号のサイド信号の平均パワースペクトルを決定することによる。代替的に、又は、追加的に、その特徴的なスロープは現在のサイド信号から適応的に決定されてもよく、例えば、現在のサイド信号のパワースペクトル21についての線形回帰を用いて決定されてもよい。その特徴的なスロープの補償は逆ノイズ・スロープ・フィルタにより実行されてもよい。その結果、スロープ補償された、場合によっては平坦な、パワースペクトルが得られるべきで、それは、モノラルのスピーチ音声信号のサイド信号のパワースペクトルの特徴的なスロープを示さない。
(スロープ補償された)パワースペクトルを用いて、SFM値がステップ33で決定される。そのSFMは以下の式に従って計算されてもよい。
Figure 0005617039
ここで、
Figure 0005617039
はハイブリッド・フィルタバンク周波数kにおけるサイド信号のパワーを表す。例示のPSシステムで使用されるハイブリッド・フィルタバンクは64のQMF周波数を有し、3つの最小周波数が更に4+2+2の周波数に分割される(即ち、N=64−3+4+2+2=69)。そのSFMは、パワースペクトルの幾何平均とパワースペクトルの相加平均との間の比として説明されてもよい。
代替的に、そのSFMはKstartからKstopまでの範囲のハイブリッド・フィルタバンク周波数だけを含む、スペクトルの部分集合に基づいて計算されてもよい。そうして、例えば1つ又は数個の第1周波数が、不所望のDC、例えば低周波のオフセットを取り除くため除外されてもよい。従って周波数の境界を調節すると、SFMはもたらす:
Figure 0005617039
計算上の複雑さを制限するため、そのSFMの式は代替的に、テイラー展開やルックアップテーブル、又は、ソフトウェア実行の分野で専門家に公知の類似の技術に基づいて、その数値近似で置換されてもよい。
さらに、スペクトル・フラットネスを測定する他の明白な先行技術の方法が存在し、例えば、標準偏差又は周波数パワービンの最小値と最大値の差などである。これによって、用語“SFM”は如何なるこれらの測度(指標)をも意味する。
サイド信号の特定の時間間隔やフレームに対してSFM値を使用して、インパクト・ファクタを決定することができる。このため、マッピング・ブロック36で、SFMは例えば0から1のスケールにマップされる。SFMインパクト・ファクタのマッピングと決定は以下に従って実行されてもよい。
Figure 0005617039
ここで、2つの閾値αlow_threshとαhigh_threshは、典型的には0.2から0.8までの範囲のSFM値の平均値に従って選ばれる。正規化ステージ36の主要な目的は、SFMインパクト・ファクタが“0”と“1”との間の全範囲に規則的に架かることを確保することである。こうして、正規化は“ノーマルな”な平坦でないスペクトル(SFM<αlow_thresh)がノイズとして検出されず、そして、その測度が高い値(SFM>αhigh_thresh)に対して飽和することを確保する。換言すれば、正規化は、高ノイズ状態(SFM>αhigh_thresh)と低ノイズ状態(SFM<αlow_thresh)との間でより明確に区別するインパクト・ファクタを供給する。
パラレル・ブランチでは、第2のSFMインパクト・ファクタがSFM値の平滑化バージョンに基づいて決定されてもよい。その現在のSFM値の平滑化バージョンはステップ34で決定される。その平滑化操作は例えば再帰的に実行されてもよく、その現在の平滑化SFM値は以前の平滑化SFM値と現在の瞬間的なSFM値との平均から決定される。その平均を決定するため、以前の平滑化SFM値は係数α(たとえばα=0.95)によって重み付けされてもよい。こうして、その平滑化SFM値は、式:SFMsmooth(n)=(1−α)SFM(n)+αSFMsmooth(n−1)を用いて、現在の瞬間的なSFM値から再帰的に決定することができる。その係数αは、α=exp(−1/(tsamplingRate/updateRate))に従って、例えば時定数t=0.62から導出することができ、この例では、そのサンプリングレートは32kHzでアップデートレートは1024サンプル毎である。
最終的に、ステップ35でその平滑化SFM値はステップ36のコンテキストで概説したのと同様にマップされてもよい。しかしながら、閾値αlow_threshとαhigh_threshとは、第2のSFMインパクト・ファクタを決定するために平滑化SFM値をマップするのに用いられ、典型的には、非平滑化SFM値のために用いられる閾値とは異なる。一例では、その閾値は平滑化SFM値に対して0.5と0.7の間の範囲である。
その平滑化SFM値は典型的には安定したスタティック・ノイズを検出し、一方、その非平滑化SFM値は短いノイズ・バーストを検出するためより高い閾値を用いる。こうして、両方の組合せが、短いノイズ・バーストと同様に安定したスタティック・ノイズを検出するように用いられることができる。この目的のため、2つのSFMインパクト・ファクタのうちの1つがICCパラメータを補償するために選択される。これはステップ37で実行される。例示の例では、2つのSFMインパクト・ファクタの最大値が選択され、それによって、非相関の最も高い可能な低減を用いた保守的なアプローチを実施する。代替的に、両方のSFMインパクト・ファクタ(平滑化ファクタと非平滑化ファクタ)の加重和が結果のSFMインパクト・ファクタとして使用されてもよい。そして、その結果のSFMインパクト・ファクタは次のICC値に適用される:
Figure 0005617039
上記で概説したように、そのSFM値は“0”と“1”の範囲にマップされ、ここで“0”はサイド信号のパワースペクトルを表す低SFM値に対応し、そのスペクトルパワーは比較的小さい周波数帯域に集中する。即ち、“0”のSFMインパクト・パワーは低ノイズ・レベルを表し、そうして推定されるICCパラメータは保持されるべきである。他方、“1”のSFMインパクト・ファクタは高SFM値に対応し、そのスペクトルは全周波数帯域で同様の大きさのパワーを有するスペクトルを表す。その結果、“1”のSFMインパクト・ファクタは高レベルのノイズを表し、そうしてICCパラメータは強く補償されるべきである。実際のところ、サイド信号だけがノイズを有する場合、ICCパラメータは強制的に“1”になり、即ち、そのICCパラメータは強制的に非相関を何ら示さず、即ち、完全な相互相関を示す。これは上記の式により実行され、元々推定されたICCパラメータ“ICC”とSFMインパクト・ファクタとからノイズ補償されたICCパラメータ“ICC_new”を決定する。
他の変換が、元々推定されたICCパラメータとSFMインパクト・ファクタとからノイズ補償されたICCパラメータを決定するように用いることができる。一般的には、ICC_new=f(SFM_impact_factor,ICC)で表され、ここで、f()は関数であり、その関数はSFM_impact_factor=0に対しては“0”であり、SFM_impact_factor=1に対しては“1”である。これらの値の間で、その関数f()は所定の関数であって、ICCとSFM_impact_factorの可能な値をICC_newの対応する値にマップすることを可能にする関数である。
図12のプロットはSFMインパクト・ファクタの上述した機能を明瞭に例示する。上のプロットでは、音声信号の例のサイド信号が描かれる。その音声信号の第一の半分はステレオのクラッシク音楽曲(オペラ)の終わりを含む。第二の半分はサイド信号のノイズだけを有するモノラル・スピーチを含む。下のプロットは平滑化SFM値41の対応するシーケンスと、SFMインパクト・ファクタ42の対応するシーケンスとを示す(図12では“SFM smooth mapped”として言及される)。その平滑化SFM値41はサイド信号がノイズを含むか否かを表す。ステップ35のマッピングの後、即ち、このケースではSFM値の範囲[0.5,0.7]をSFMインパクト・ファクタの範囲[0,1]にマッピングした後、SFMインパクト値42は0と1の間の値をとり、“低ノイズ”状態と“高ノイズ”状態との間で明りょうな移行(トランジション)を示す。
0.5よりも低いSFM値41に対しては、SFMインパクト値42は“0”であり、一方で、0.7よりも大きいSFM値41に対しては、SFMインパクト値42は“1”である。こうして、SFMインパクト値42はICCパラメータが音声信号(ステレオ音楽)の第一の部分の間は影響されないことを確保する。他方、SFMインパクト値42は音声信号(モノラル・スピーチ)の第二の部分で、非相関を強制的にシャットダウンする。
パラメトリックなステレオ・パラメータの範囲内に含まれるサイド信号のノイズを補償するコンセプトは、インターチャンネルの相互相関パラメータICCのコンテキストにおいて概説された。他の代替的なパラメトリックなステレオ(PS)パラメータ表示が存在することに留意すべきであり、即ち、CLDやICC以外のPSパラメータの他のセットである。本明細書で概説したノイズ補償のコンセプトは、そうした代替的なPSパラメータ表示に適用されてもよい。詳しくは、そのノイズ補償は、出力ステレオ信号を生成するために、アップミックス・ステージの間に適用される非相関の量に影響を与えるPSパラメータに適用されてもよい。
代替的なPSパラメータ表示の一例が次のアップミックス処理によって例示される:
S=aDM+gdecorr(DM), L’=DM+S, R’=DM−S
ここで、DMはダウンミックス信号であり、“a”と“g”は2つの新しいPSパラメータであり、decorr()は非相関器で典型的には全域通過フィルタであってアップミックス・ステージで用いられる。
“CLD”と“ICC”からパラメータ“a”と“g”を計算することは普通は可能であるが、SFMコントロールのパラメータ修正を適用することも可能であり、即ち、本明細書で概説したようなノイズ補償であり、そうして、アップミックス処理で加えられる非相関の量を決定する代替的なPSパラメータ“g”への不所望な非相関を直接的に低減する。このケースでは、図9Bのインパクト・ファクタ決定ステージ23、及び、図9BのPSパラメータ修正ステージ24における処理は、そのように適応される必要があるかもしれないが、ノイズ補償の操作の一般的な原理は同じである。詳しくは、SFMからSFM_impact_factorを導く各種のマッピング関数を使用してもよく、そのパラメータ修正は次の関数に基づいてもよい:
g_new=(1−SFM_impact_factor)g,
即ち、SFM_impact_factor=1であれば、g_new=0を導き、アップミックス・ステージの間には如何なる非相関も加えられないことを意味する。SFM_impact_factor=0であれば変化がない。
こうして、本明細書で概説したノイズ補償のコンセプトが各種のPSパラメータ表示に適用されてもよいことに留意すべきである。詳しくは、そのコンセプトは、出力ステレオ信号を生成するために適用される非相関の量に影響する単数又は複数のPSパラメータを調節するのに使用されてもよい。
本明細書で述べたコンセプトはPS技術を用いた如何なるエンコーダにも関連して実施することができ、例えば、標準規格ISO/IEC14496−3(MPEG4オーディオ)において定義されるようなHE-AACv2(High−Efficiency Advanced Audio Coding version2)エンコーダ、MPEG3サラウンドに基づくエンコーダ、又は、MPEG USAC(United Speech and Audio coder)に基づくエンコーダであり、MPEG標準規格によってカバーされないエンコーダも含む。
以下では、例として、HE-AACv2エンコーダを想定する;しかし、本コンセプトはPS技術を用いた如何なるオーディオ・エンコーダに関しても使用してもよい。
HE-AACは不可逆のオーディオ圧縮方法である。HE-AACv1(HE-AACバージョン1)はスペクトル帯域複製(SBR)を利用し、そうして圧縮効率を向上する。HE−AACv2は更にパラメトリック・ステレオを含み、そうしてとても低いビットレートのステレオ信号の圧縮効率を向上する。HE−AACv2エンコーダは、本質的にPSエンコーダを含み、そうしてとても低いビットレートでの操作を可能にする。そうしたHE-AACv2エンコーダのPSエンコーダはオーディオ処理装置2のPSエンコーダ7として使用することができる。詳しくは、HE-AACv2エンコーダのPSエンコーダの内部のPSパラメータ推定ステージがオーディオ処理装置2のPSパラメータ推定ステージ3として使用することができる。また、HE-AACv2エンコーダのPSエンコーダの内部のダウンミックス・ステージが、装置2のダウンミックス・ステージ9として使用することもできる。
従って、本明細書で述べたコンセプトはHE−AACv2エンコーダと効率的に組み合わせることができ、そうして改善されたFMステレオ無線受信機が実現できる。そうした改善されたFMステレオ無線受信機は、HE-AACv2エンコーダがレコーディング目的で保存されるHE-AACv2ビットストリームを出力するので、HE-AACv2のレコーディング・フィーチャを有してもよい。これは図13に示される。この実施形態では、装置2はHE-AACv2エンコーダ16とPSデコーダ8とを含む。HE-AACv2エンコーダは、前の図面に関連して説明したように、モノラル・ダウンミックスDMとPSパラメータ5とを生成するために使用されるPSエンコーダ7を供給する。
任意的に、PSエンコーダ7はFM無線ノイズ低減の目的で固定のダウンミックス方法をサポートするよう修正されてもよく、例えば、DM=(L+R)/aに従ったダウンミックス方法である。
モノラル・ダウンミックスDMとPSパラメータ5はPSデコーダ8に供給されてもよく、そうして、上述のようにステレオ信号L’、R’を生成する。モノラル・ダウンミックスDMはモノラル・ダウンミックスDMの知覚的エンコーディングのためのHE-AACv1エンコーダに供給される。その結果の知覚的エンコードされた音声信号とPS信号とは、HE-AACv2ビットストリーム18に多重化される。レコーディング目的のため、HE-AACv2ビットストリーム18は、フラッシュメモリやハードディスクのようなメモリの中に保存され得る。
HE-AACv1エンコーダ17はSBRエンコーダとAACエンコーダとを含む(不図示)。SBRエンコーダは典型的にはQMF(quadrature mirror filterbank)領域での信号処理を実行し、そして、QMFサンプルを必要とする。対照的に、AACエンコーダは典型的には時間領域サンプル(ファクタ2で典型的にはダウンサンプリングされる)を必要とする。
HE-AACv2エンコーダ16の内部のPSエンコーダ7は典型的には、QMF領域に既にあるダウンミックス信号DMを供給する。
PSエンコーダ7はQMF領域信号DMをHE-AACv1エンコーダを既に送信していてもよいので、SBR分析のためのHE-AACv1エンコーダにおけるQMF分析変形が廃止される。従って、通常はHE-AACv1エンコーダの一部であるQMF分析は、QMFサンプルとしてダウンミックス信号DMを供給することにより、回避することができる。これは計算コストを低減し、複雑さを省力化できる。
AACエンコーダに対する時間領域サンプルは、装置2の入力から導いてもよく、例えば、時間領域でサンプリング操作DM=(L+R)/2を実行することにより、及び、時間領域信号DMをダウンサンプリングすることにより導かれる。このアプローチは恐らくは最も安価なアプローチである。代替的には、装置2はQMF領域DMサンプルのハーフレートQMF合成を実行してもよい。
本明細書では、FM無線受信機のノイズを低減する方法及びシステムが説明された。PSパラメータは受信した中央及びサイド信号から決定され、そうして、その中央信号とそのPSパラメータとを用いて、ノイズ低減されたオーディオ信号を生成することができる。推定されたPSパラメータに与えるノイズの影響を低減するため、ノイズ推定と補償の方法が説明された。
本明細書で述べた方法及びシステムは、ソフトウェア、ファームウェア、及び/又は、ハードウェアとして実施されてもよい。或る部品群は例えばデジタル信号プロセッサ又はマイクロプロセッサ上でランするソフトウェアとして実施されてもよい。他の部品群は例えばハードウェア、及び/又は、特定用途向き集積回路として実施されてもよい。説明した方法及びシステムで現れる信号はランダムアクセスメモリや光学保存媒体といったメディアに保存されてもよい。そうした信号は無線ネットワーク、衛星ネットワーク、ワイヤレスネットワーク、又はワイヤラインネットワークのようなネットワーク、例えばインターネットを介して転送されてもよい。本明細書で述べた方法及びシステムを利用した典型的な装置は、ポータブル・エレクトロニック・デバイス、又は、他のコンシューマ装置であり、オーディオ信号を保存、及び/又は、レンダリングするものである。
いくつかの態様を記載しておく。
〔態様1〕
2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するよう構成されるシステムであって、該システムは:
−前記2チャンネル音声信号から得られるサイド信号のノイズの特性を表わすインパクト・ファクタを決定するよう構成されるノイズ推定ステージと、
−前記2チャンネル音声信号および前記インパクト・ファクタに基づいて、前記パラメトリック・ステレオ・パラメータを決定するよう構成されるパラメトリック・ステレオ・パラメータ推定ステージと、
含む、システム。
〔態様2〕
前記2チャンネル音声信号は中央信号及びサイド信号として表現することができ、対応する左及び右の音声信号を表す、態様1記載のシステム。
〔態様3〕
補助音声信号と前記パラメトリック・ステレオ・パラメータとに基づいて、出力音声信号を生成するよう構成されるアップミックス・ステージを更に含み、前記補助音声信号は前記2チャンネル音声信号から得られる、態様1乃至は2記載のシステム。
〔態様4〕
前記パラメトリック・ステレオ・パラメータは、前記2チャンネル音声信号に基づくステレオ信号の生成のために適用される非相関の量に影響を与える、態様1記載のシステム。
〔態様5〕
前記インパクト・ファクタは前記サイド信号のスペクトル平坦性の特性を表わす、態様1乃至4のいずれか1つに記載のシステム。
〔態様6〕
前記パラメトリック・ステレオ・パラメータ推定ステージは
−前記2チャンネル音声信号の第一信号フレームのサンプルを用いて、ノイズのあるパラメトリック・ステレオ・パラメータを決定し、
−前記インパクト・ファクタを用いて、前記ノイズのあるパラメトリック・ステレオ・パラメータを修正することにより前記パラメトリック・ステレオ・パラメータを決定するよう構成される、
態様5記載のシステム。
〔態様7〕
前記パラメトリック・ステレオ・パラメータ推定ステージは
−前記インパクト・ファクタが前記サイド信号のスペクトル平坦性の高い程度を示す場合、前記ノイズのあるパラメトリック・ステレオ・パラメータを修正し、そうしてステレオ信号の生成のために適用される非相関の量を低減するよう構成される、
態様6記載のシステム。
〔態様8〕
前記パラメトリック・ステレオ・パラメータ推定ステージは、前記ノイズのあるパラメトリック・ステレオ・パラメータ及び前記インパクト・ファクタに応じた関数から、前記パラメトリック・ステレオ・パラメータを決定するよう構成される、態様6又は7に記載のシステム。
〔態様9〕
前記パラメトリック・ステレオ・パラメータは前記2チャンネル音声信号の間の相関を示すインターチャンネル相互相関パラメータである、態様1乃至8のいずれか1つに記載のシステム。
〔態様10〕
−前記インターチャンネル相互相関パラメータは“−1”から“1”までの範囲をカバーし、
−前記インターチャンネル相互相関値“0”は左と右のチャンネルの間に相互相関が無いことを示し、
−前記インターチャンネル相互相関値“1”は左と右のチャンネルの間に完全な相互相関があることを示し、
−前記インターチャンネル相互相関値“−1”は左と右のチャンネルの間に負の完全な相互相関があることを示し、
−前記インパクト・ファクタは“0”から“1”までの範囲をカバーし、
−前記インパクト・ファクタ値“0”は平坦性の低い程度を示し、
−前記インパクト・ファクタ値“1”は平坦性の高い程度を示し、
−前記関数は、前記インパクト・ファクタ値が“0”の場合、前記ノイズのあるインターチャンネル相互相関の値を有し、及び、
−前記関数は、前記インパクト・ファクタ値が“1”の場合、値“1”を有する、
態様9記載のシステム。
〔態様11〕
前記パラメトリック・ステレオ・パラメータ推定ステージは、関数:
ICC_new=(impact factor)+(1−impact factor) ICCを用いて、前記ノイズのあるインターチャンネル相互相関パラメータICCから、インターチャンネル相互相関パラメータICC_newを決定するよう構成される、態様10記載のシステム。
〔態様12〕
前記ノイズ推定ステージは、
−前記サイド信号の第二信号フレームのパワースペクトルを計算し、
−前記パワースペクトルのスロープを補償し、それによって補償パワースペクトルを生じ、そして、
−前記補償パワースペクトルの値であって、SFMとして言及されるスペクトル平坦性指標を決定するよう構成される、
態様1乃至11のいずれか1つに記載のシステム。
〔態様13〕
前記第一と第二の信号フレームは一致する、態様6を引用する態様12記載のシステム。
〔態様14〕
前記SFM値は前記補償パワースペクトルの幾何平均と前記補償パワースペクトルの算術平均との比率として決定される、態様12又は13記載のシステム。
〔態様15〕
前記ノイズ推定ステージは
−前記SFM値をマップし、
−前記マップされたSFM値に基づいて第一のインパクト・ファクタを決定する、
態様12乃至14のいずれか1つに記載のシステム。
〔態様16〕
前記ノイズ推定ステージは前記第一インパクト・ファクタを“0”から“1”までの範囲にマップするよう構成される、態様15記載のシステム。
〔態様17〕
前記ノイズ推定ステージは
−第一の低い閾値を下回るSFM値に対して、第一のインパクト・ファクタを“0”に設定し、
−第一の高い閾値を上回るSFM値に対して、第一のインパクト・ファクタを“1”に設定し、
前記第一の低い閾値から前記第一の高い閾値までのSFM値を“0”から“1”までの範囲にスケーリングする、
態様16記載のシステム。
〔態様18〕
前記ノイズ推定ステージは、
−前記サイド信号の複数の信号フレームに対応する複数のSFM値を考慮することにより、平滑化SFM値を決定し、
−前記平滑化SFM値をマップし、
−前記マップされた平滑化SFM値に基づいて第二のインパクト・ファクタを決定するよう構成される、態様12乃至17のいずれか1つに記載のシステム。
〔態様19〕
前記ノイズ推定ステージは前記第二のインパクト・ファクタを“0”から“1”までの範囲にマップするよう構成される、態様18記載のシステム。
〔態様20〕
前記ノイズ推定ステージは、
−第二の低い閾値を下回る平滑化SFM値に対しては、前記第二のインパクト・ファクタを“0”に設定し、
−第二の高い閾値を上回る平滑化SFM値に対しては、前記第二のインパクト・ファクタを“1”に設定し、
−前記第二の低い閾値から前記第二の高い閾値までの平滑化SFM値を“0”から“1”までの範囲にスケーリングするよう構成される、
態様19記載のシステム。
〔態様21〕
前記第一と第二の低い閾値、及び/又は、前記第一と第二の高い閾値は異なるように設定することができる、態様20記載のシステム。
〔態様22〕
前記ノイズ推定ステージは前記第一と第二のインパクト・ファクタに基づいてインパクト・ファクタを決定するよう構成される、態様18乃至20のいずれか1つに記載のシステム。
〔態様23〕
前記ノイズ推定ステージは前記インパクト・ファクタとして前記第一と第二のインパクト・ファクタのうち大きい方を選択するよう構成される、態様22記載のシステム。
〔態様24〕
前記パラメトリック・ステレオ・パラメータ推定ステージは、チャンネル・レベル・ディフェレンスを示すパラメータを決定するよう更に構成される、態様1乃至23のいずれか1つに記載のシステム。
〔態様25〕
−前記中央信号Mと前記サイド信号Sは左音声信号Lと右音声信号Rと関連し、M=(L+R)/2及びS=(L−R)/2として表され、
−前記補助音声信号は(L+R)/aとして決定され、aは実数、好ましくはa=2である、
態様3乃至24のいずれか1つに記載のシステム。
〔態様26〕
パラメトリック・ステレオをサポートするオーディオ・エンコーダを更に含み、前記オーディオ・エンコーダはパラメトリック・ステレオ・エンコーダを含み、前記パラメトリック・ステレオ・パラメータ推定ステージは前記パラメトリック・ステレオ・エンコーダの部分である、態様1乃至25のいずれか1つに記載のシステム。
〔態様27〕
−前記システムは、前記FMステレオ受信機が前記ステレオ無線信号のモノラル出力を選択することを検出するよう構成され、又は、前記システムは、劣悪な無線受信を検出するよう構成され、
−前記FMステレオ受信機がモノラル出力にスイッチされるか、又は、劣悪な無線受信が発生するときは、ステレオ・アップミックス・ステージは1つ以上のアップミックス・パラメータを使用し、当該アップミックス・パラメータは前記パラメトリック・ステレオ・パラメータ推定ステージから以前に推定されたパラメトリック・ステレオ・パラメータに基づく、
態様3乃至26のいずれか1つに記載のシステム。
〔態様28〕
中央信号とサイド信号とを含むFM無線信号を受信するよう構成され、態様1乃至27のいずれか1つに記載のシステムを含む、FMステレオ無線受信機。
〔態様29〕
モバイル通信装置であって:
−中央信号とサイド信号とを含むFM無線信号を受信するよう構成されるFMステレオ受信機と、
−態様1乃至27のいずれか1つに記載のシステムと、を含む、
装置。
〔態様30〕
2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定する方法であって、該方法は:
−前記2チャンネル音声信号から得られるサイド信号のノイズの特性を表わすインパクト・ファクタを決定するステップと、
−前記パラメトリック・ステレオ・パラメータを決定するステップであって、前記決定するステップは前記2チャンネル音声信号と前記インパクト・ファクタとに基づく、ステップと、を含む、
方法。
〔態様31〕
プロセッサ上で実行されるよう適応され、コンピュータ・デバイス上で実行されると、態様30に係る方法ステップ群を実行する、ソフトウェア・プログラム。
〔態様32〕
プロセッサ上での実行に適応され、コンピュータ・デバイス上で実行されると、態様30に係る方法ステップ群を実行する、ソフトウェア・プログラムを含む記憶媒体。
〔態様33〕
コンピュータ上で実行されると、態様30の方法を実行する実行可能な命令を含む、コンピュータ・プログラム。

Claims (33)

  1. 2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するよう構成されるシステムであって、該システムは:
    −前記2チャンネル音声信号から得られるサイド信号のノイズの特性を表わすインパクト・ファクタを決定するよう構成されるノイズ推定ステージと、
    −前記2チャンネル音声信号および前記インパクト・ファクタに基づいて、前記パラメトリック・ステレオ・パラメータを決定するよう構成されるパラメトリック・ステレオ・パラメータ推定ステージと、
    含む、システム。
  2. 前記2チャンネル音声信号は中央信号及びサイド信号として表現することができ、対応する左及び右の音声信号を表す、請求項1記載のシステム。
  3. 補助音声信号と前記パラメトリック・ステレオ・パラメータとに基づいて、出力音声信号を生成するよう構成されるアップミックス・ステージを更に含み、前記補助音声信号は前記2チャンネル音声信号から得られる、請求項1乃至は2記載のシステム。
  4. 前記パラメトリック・ステレオ・パラメータは、前記2チャンネル音声信号に基づくステレオ信号の生成のために適用される非相関の量に影響を与える、請求項1記載のシステム。
  5. 前記インパクト・ファクタは前記サイド信号のスペクトル平坦性の特性を表わす、請求項1乃至4のいずれか1つに記載のシステム。
  6. 前記パラメトリック・ステレオ・パラメータ推定ステージは
    −前記2チャンネル音声信号の第一信号フレームのサンプルを用いて、第一のパラメトリック・ステレオ・パラメータを決定し、
    −前記インパクト・ファクタを用いて、前記第一のパラメトリック・ステレオ・パラメータを修正することにより前記パラメトリック・ステレオ・パラメータを決定するよう構成される、
    請求項5記載のシステム。
  7. 前記パラメトリック・ステレオ・パラメータ推定ステージは
    −前記インパクト・ファクタが前記サイド信号のスペクトル平坦性の高い程度を示す場合、前記第一のパラメトリック・ステレオ・パラメータを修正し、そうしてステレオ信号の生成のために適用される非相関の量を低減するよう構成され、前記スペクトル平坦性の高い程度とは、スペクトル平坦性の指標が所定の閾値より高いことに対応する、
    請求項6記載のシステム。
  8. 前記パラメトリック・ステレオ・パラメータ推定ステージは、前記第一のパラメトリック・ステレオ・パラメータ及び前記インパクト・ファクタに応じた関数から、前記パラメトリック・ステレオ・パラメータを決定するよう構成される、請求項6又は7に記載のシステム。
  9. 前記パラメトリック・ステレオ・パラメータは前記2チャンネル音声信号の間の相関を示すインターチャンネル相互相関パラメータである、請求項1乃至8のいずれか1つに記載のシステム。
  10. −前記インターチャンネル相互相関パラメータは“−1”から“1”までの範囲をカバーし、
    −前記インターチャンネル相互相関値“0”は左と右のチャンネルの間に相互相関が無いことを示し、
    −前記インターチャンネル相互相関値“1”は左と右のチャンネルの間に完全な相互相関があることを示し、
    −前記インターチャンネル相互相関値“−1”は左と右のチャンネルの間に負の完全な相互相関があることを示し、
    −前記インパクト・ファクタは“0”から“1”までの範囲をカバーし、
    −前記インパクト・ファクタ“0”は平坦性の低い程度を示し、
    −前記インパクト・ファクタ“1”は平坦性の高い程度を示し、
    −前記関数は、前記インパクト・ファクタが“0”の場合、前記2チャンネル音声信号の第一信号フレームのサンプルを用いて決定されたインターチャンネル相互相関の値を有し、及び、
    −前記関数は、前記インパクト・ファクタが“1”の場合、値“1”を有する、
    請求項9が請求項8を引用する場合の請求項9記載のシステム。
  11. 前記パラメトリック・ステレオ・パラメータ推定ステージは、関数:
    ICC_new=(impact factor)+(1−impact factor)ICCを用いて、前記第一のインターチャンネル相互相関パラメータICCから、インターチャンネル相互相関パラメータICC_newを決定するよう構成される、請求項10記載のシステム。
  12. 前記ノイズ推定ステージは、
    −前記サイド信号の第二信号フレームのパワースペクトルを計算し、
    −前記パワースペクトルのスロープを補償し、それによって補償パワースペクトルを生じ、そして、
    −前記補償パワースペクトルの値であって、SFMとして言及されるスペクトル平坦性指標を決定するよう構成される、
    請求項1乃至11のいずれか1つに記載のシステム。
  13. 前記第一と第二の信号フレームは一致する、請求項6を引用する請求項12記載のシステム。
  14. 前記SFM値は前記補償パワースペクトルの幾何平均と前記補償パワースペクトルの算術平均との比率として決定される、請求項12又は13記載のシステム。
  15. 前記ノイズ推定ステージは
    −前記SFM値をマップし、
    −前記マップされたSFM値に基づいて第一のインパクト・ファクタを決定する、
    請求項12乃至14のいずれか1つに記載のシステム。
  16. 前記ノイズ推定ステージは前記第一インパクト・ファクタを“0”から“1”までの範囲にマップするよう構成される、請求項15記載のシステム。
  17. 前記ノイズ推定ステージは
    −第一の低い閾値を下回るSFM値に対して、第一のインパクト・ファクタを“0”に設定し、
    −第一の高い閾値を上回るSFM値に対して、第一のインパクト・ファクタを“1”に設定し、
    前記第一の低い閾値から前記第一の高い閾値までのSFM値を“0”から“1”までの範囲にスケーリングする、
    請求項16記載のシステム。
  18. 前記ノイズ推定ステージは、
    −前記サイド信号の複数の信号フレームに対応する複数のSFM値を考慮することにより、平滑化SFM値を決定し、
    −前記平滑化SFM値をマップし、
    −前記マップされた平滑化SFM値に基づいて第二のインパクト・ファクタを決定するよう構成される、請求項12乃至17のいずれか1つに記載のシステム。
  19. 前記ノイズ推定ステージは前記第二のインパクト・ファクタを“0”から“1”までの範囲にマップするよう構成される、請求項18記載のシステム。
  20. 前記ノイズ推定ステージは、
    −第二の低い閾値を下回る平滑化SFM値に対しては、前記第二のインパクト・ファクタを“0”に設定し、
    −第二の高い閾値を上回る平滑化SFM値に対しては、前記第二のインパクト・ファクタを“1”に設定し、
    −前記第二の低い閾値から前記第二の高い閾値までの平滑化SFM値を“0”から“1”までの範囲にスケーリングするよう構成される、
    請求項19記載のシステム。
  21. 前記第一と第二の低い閾値、及び/又は、前記第一と第二の高い閾値は異なるように設定することができる、請求項20記載のシステム。
  22. 前記ノイズ推定ステージは前記第一と第二のインパクト・ファクタに基づいてインパクト・ファクタを決定するよう構成される、請求項18乃至20のいずれか1つに記載のシステム。
  23. 前記ノイズ推定ステージは前記インパクト・ファクタとして前記第一と第二のインパクト・ファクタのうち大きい方を選択するよう構成される、請求項22記載のシステム。
  24. 前記パラメトリック・ステレオ・パラメータ推定ステージは、チャンネル・レベル・ディフェレンスを示すパラメータを決定するよう更に構成される、請求項1乃至23のいずれか1つに記載のシステム。
  25. −前記中央信号Mと前記サイド信号Sは左音声信号Lと右音声信号Rと関連し、M=(L+R)/2及びS=(L−R)/2として表され、
    −前記補助音声信号は(L+R)/aとして決定され、aは実数である、
    請求項3乃至24のいずれか1つに記載のシステム。
  26. パラメトリック・ステレオをサポートするオーディオ・エンコーダを更に含み、前記オーディオ・エンコーダはパラメトリック・ステレオ・エンコーダを含み、前記パラメトリック・ステレオ・パラメータ推定ステージは前記パラメトリック・ステレオ・エンコーダの部分である、請求項1乃至25のいずれか1つに記載のシステム。
  27. −前記システムは、劣悪な無線受信を検出するよう構成され、
    −劣悪な無線受信が発生するときは、前記アップミックス・ステージは1つ以上のアップミックス・パラメータを使用し、当該アップミックス・パラメータは前記パラメトリック・ステレオ・パラメータ推定ステージから以前に推定されたパラメトリック・ステレオ・パラメータに基づく、
    請求項3に記載のシステム。
  28. 中央信号とサイド信号とを含むFM無線信号を受信するよう構成され、請求項1乃至27のいずれか1つに記載のシステムを含む、FMステレオ無線受信機。
  29. モバイル通信装置であって:
    −中央信号とサイド信号とを含むFM無線信号を受信するよう構成されるFMステレオ受信機と、
    −請求項1乃至27のいずれか1つに記載のシステムと、を含む、
    装置。
  30. 2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定する方法であって、該方法は:
    −前記2チャンネル音声信号から得られるサイド信号のノイズの特性を表わすインパクト・ファクタを決定するステップと、
    −前記パラメトリック・ステレオ・パラメータを決定するステップであって、前記決定するステップは前記2チャンネル音声信号と前記インパクト・ファクタとに基づく、ステップと、を含む、
    方法。
  31. プロセッサ上で実行されるよう適応され、コンピュータ・デバイス上で実行されると、請求項30に係る方法ステップ群を実行する、ソフトウェア・プログラム。
  32. プロセッサ上での実行に適応され、コンピュータ・デバイス上で実行されると、請求項30に係る方法ステップ群を実行する、ソフトウェア・プログラムを含む記憶媒体。
  33. コンピュータ上で実行されると、請求項30の方法を実行する実行可能な命令を含む、コンピュータ・プログラム。
JP2013525251A 2010-08-24 2011-08-16 Fm無線ノイズの擬似無相関の低減 Expired - Fee Related JP5617039B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37656710P 2010-08-24 2010-08-24
US61/376,567 2010-08-24
PCT/EP2011/064077 WO2012025429A1 (en) 2010-08-24 2011-08-16 Reduction of spurious uncorrelation in fm radio noise

Publications (2)

Publication Number Publication Date
JP2013541030A JP2013541030A (ja) 2013-11-07
JP5617039B2 true JP5617039B2 (ja) 2014-10-29

Family

ID=44584154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013525251A Expired - Fee Related JP5617039B2 (ja) 2010-08-24 2011-08-16 Fm無線ノイズの擬似無相関の低減

Country Status (8)

Country Link
US (1) US9094754B2 (ja)
EP (1) EP2609684B1 (ja)
JP (1) JP5617039B2 (ja)
CN (1) CN103069721B (ja)
ES (1) ES2501790T3 (ja)
HK (1) HK1186312A1 (ja)
TW (1) TWI516138B (ja)
WO (1) WO2012025429A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2007000391A (es) * 2004-07-14 2007-06-25 Koninkl Philips Electronics Nv Conversion de canal de audio.
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
US9237400B2 (en) * 2010-08-24 2016-01-12 Dolby International Ab Concealment of intermittent mono reception of FM stereo radio receivers
EP2740222B1 (en) 2011-08-04 2015-04-22 Dolby International AB Improved fm stereo radio receiver by using parametric stereo
CN103918030B (zh) 2011-09-29 2016-08-17 杜比国际公司 Fm立体声无线电信号中的高质量检测
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
CA2899134C (en) * 2013-01-29 2019-07-30 Frederik Nagel Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
TWI671734B (zh) * 2013-09-12 2019-09-11 瑞典商杜比國際公司 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統
JP6201047B2 (ja) * 2013-10-21 2017-09-20 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成のための脱相関器構造
CN105225671B (zh) 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及系统
KR102363056B1 (ko) * 2017-01-04 2022-02-14 댓 코포레이션 서라운드 처리가 진보된 구성가능한 다중-대역 압축기 아키텍처
US11245375B2 (en) 2017-01-04 2022-02-08 That Corporation System for configuration and status reporting of audio processing in TV sets
CN115622634B (zh) * 2022-08-22 2023-08-04 荣耀终端有限公司 辐射杂散rse测试的控制方法、测试系统及存储介质

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4833715A (en) * 1987-03-06 1989-05-23 Alps Electric Co., Ltd. FM stereo receiver
US5027402A (en) * 1989-12-22 1991-06-25 Allegro Microsystems, Inc. Blend-on-noise stereo decoder
JPH0846585A (ja) * 1994-07-27 1996-02-16 Fujitsu Ten Ltd ステレオ受信装置
US6067363A (en) * 1996-06-03 2000-05-23 Ericsson Inc. Audio A/D convertor using frequency modulation
JP2000332710A (ja) * 1999-05-24 2000-11-30 Sanyo Electric Co Ltd ステレオ放送用受信装置
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US8605911B2 (en) * 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
EP1609335A2 (en) 2003-03-24 2005-12-28 Koninklijke Philips Electronics N.V. Coding of main and side signal representing a multichannel signal
US7835916B2 (en) * 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
ATE447226T1 (de) * 2004-01-28 2009-11-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zur zeitskalierung eines signals
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
BRPI0606387B1 (pt) * 2005-01-11 2019-11-26 Koninl Philips Electronics Nv Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
WO2006091139A1 (en) 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
EP1829424B1 (en) 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
RU2433489C2 (ru) 2005-07-06 2011-11-10 Конинклейке Филипс Электроникс Н.В. Параметрическое многоканальное декодирование
US8081762B2 (en) * 2006-01-09 2011-12-20 Nokia Corporation Controlling the decoding of binaural audio signals
EP1999847B1 (en) 2006-03-28 2012-11-14 Telefonaktiebolaget LM Ericsson (publ) Filter adaptive frequency resolution
JP4999846B2 (ja) 2006-08-04 2012-08-15 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP5513887B2 (ja) * 2006-09-14 2014-06-04 コーニンクレッカ フィリップス エヌ ヴェ 多チャネル信号のためのスイートスポット操作
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
CN101320562A (zh) * 2007-06-07 2008-12-10 中皇国际股份有限公司 一种音乐压缩与解压缩方法的改良及其实现电路
JP2009010841A (ja) * 2007-06-29 2009-01-15 Kenwood Corp ステレオ復調装置及びステレオ復調方法
CN101572088A (zh) 2008-04-30 2009-11-04 北京工业大学 立体声编解码方法、编解码器及编解码系统
WO2010082471A1 (ja) * 2009-01-13 2010-07-22 パナソニック株式会社 音響信号復号装置及びバランス調整方法
CA2949616C (en) * 2009-03-17 2019-11-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
US9237400B2 (en) * 2010-08-24 2016-01-12 Dolby International Ab Concealment of intermittent mono reception of FM stereo radio receivers
CN103918030B (zh) * 2011-09-29 2016-08-17 杜比国际公司 Fm立体声无线电信号中的高质量检测
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction

Also Published As

Publication number Publication date
EP2609684A1 (en) 2013-07-03
EP2609684B1 (en) 2014-07-30
US9094754B2 (en) 2015-07-28
TWI516138B (zh) 2016-01-01
CN103069721A (zh) 2013-04-24
JP2013541030A (ja) 2013-11-07
US20130142339A1 (en) 2013-06-06
CN103069721B (zh) 2016-03-23
WO2012025429A1 (en) 2012-03-01
TW201220863A (en) 2012-05-16
HK1186312A1 (en) 2014-03-07
ES2501790T3 (es) 2014-10-02

Similar Documents

Publication Publication Date Title
JP5617039B2 (ja) Fm無線ノイズの擬似無相関の低減
KR101585852B1 (ko) Fm 스테레오 라디오 신호들에서 고품질의 검출
JP5581449B2 (ja) Fmステレオ無線受信機の断続的モノラル受信の隠蔽
JP5635662B2 (ja) Fmステレオ無線レシーバのオーディオ信号のパラメトリックステレオを用いた改善
KR101616700B1 (ko) 예측-기반 fm 스테레오 라디오 노이즈 감소
TWM527596U (zh) 用於預測式fm立體聲無線電雜訊降低的設備

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140416

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140912

R150 Certificate of patent or registration of utility model

Ref document number: 5617039

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees