JP2013541870A - Fmステレオ無線受信機の断続的モノラル受信の隠蔽 - Google Patents

Fmステレオ無線受信機の断続的モノラル受信の隠蔽 Download PDF

Info

Publication number
JP2013541870A
JP2013541870A JP2013525252A JP2013525252A JP2013541870A JP 2013541870 A JP2013541870 A JP 2013541870A JP 2013525252 A JP2013525252 A JP 2013525252A JP 2013525252 A JP2013525252 A JP 2013525252A JP 2013541870 A JP2013541870 A JP 2013541870A
Authority
JP
Japan
Prior art keywords
signal
stereo
state
audio signal
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013525252A
Other languages
English (en)
Other versions
JP5581449B2 (ja
Inventor
セルストロム,レイフ
プルンハーゲン,ヘイコ
エングデガルド,ヨナス
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2013541870A publication Critical patent/JP2013541870A/ja
Application granted granted Critical
Publication of JP5581449B2 publication Critical patent/JP5581449B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits
    • H04B1/1646Circuits adapted for the reception of stereophonic signals
    • H04B1/1661Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels
    • H04B1/1669Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal
    • H04B1/1676Reduction of noise by manipulation of the baseband composite stereophonic signal or the decoded left and right channels of the demodulated composite stereo signal of the sum or difference signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • H04H40/36Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving
    • H04H40/45Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving
    • H04H40/81Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving for FM stereophonic broadcast systems receiving for stereo-monaural switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Stereophonic System (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

本発明は音声信号処理に関する。詳しくは、FMステレオ無線受信機の断続的なモノラルの受信を確実に隠蔽する方法とシステムに関する。本システムは、パラメトリック・ステレオ・パラメータ推定ステージを含み、受信された2チャンネル音声信号の第1フレームに基づいて、第1パラメトリック・ステレオ・パラメータを決定する。本システムは、隠蔽検出ステージを更に含み、第1信号フレーム内のサイド信号のエネルギーを決定し;次の連続する信号フレームの数を決定し、その間にサイド信号のエネルギーが高閾値の上の値から低閾値の下の値へ低下し;連続する信号フレームの数がフレーム閾値より下である場合、第1信号フレームに続く2チャンネル音声信号が強制的モノラル信号であることを決定し;そして、第1パラメトリック・ステレオ・パラメータに基づいてパラメトリック・ステレオ・パラメータを決定する。

Description

本出願は2010年8月24日に出願された米国特許仮出願第61/376,569への優先権を主張し、参照することにより全体として本出願に組み込まれる。
本出願は音声(オーディオ)信号処理に関連し、詳しくはFMステレオ無線受信機の音声信号を改善するシステム及び対応する方法に関連する。詳しくは、本明細書はFMステレオ無線受信機の断続的なモノラル受信を確実に隠すための方法と装置に関連する。
アナログFM(周波数変調)ステレオ無線システムでは、音声信号の左チャンネル(L)と右チャンネル(R)とは中央・サイド(M/S)表現で伝達され、即ち、中央・チャンネル(M)とサイド・チャンネル(S)として伝達される。中央・チャンネルMはLとRとの信号の和、例えば、M=(L+R)/2に対応し、そして、サイド・チャンネルSはLとRの信号の差分、例えば、S=(L−R)/2に対応する。送信のため、サイド・チャンネルSは38kHzの抑圧搬送波に変調され、ベースバンド・中央信号Mに加えられ、下位互換のステレオ多重信号を形成する。そして、この多重信号はFM送信機のHF(高周波)搬送波を変調するのに使用され、典型的には87.5乃至108MHzの範囲で動作する。
受信品質が低下すると(即ち、無線チャンネルに対するSN比が低下する)、典型的にはSチャンネルはMチャンネルよりも被害が大きい。多くのFM受信機の実施では、受信条件が極めてノイズが多くなるとSチャンネルはミュートされる。これは、不良なHF無線信号の場合には受信機がステレオからモノラルへ後退することを意味する。
中央信号Mが許容できる品質の場合でも、サイド信号Sはノイズが多いことがあり、それ故、出力信号の左右のチャンネル(例えば、L=M+SとR=M−Sに従って導出される)に混合されると全般の音声品質を大幅に低下することがある。サイド信号Sが不良乃至中間品質であるとき、2つの選択肢が存在する:受信機がサイド信号Sに関連するノイズを受信することを選択して、ノイズの多い左右信号を有する実際のステレオ信号を出力するか、又は、受信機がサイド信号Sをドロップして、モノラルに後退するか、である。
パラメトリック・ステレオ(PS)符号化はとても低いビットレート音声符号化の分野の技術である。PSは2チャンネルのステレオ音声信号を、追加的なPSサイド情報、即ち、PSパラメータと組み合わせて、モノラルのダウンミックス信号として符号化することを可能にする。そのモノラルのダウンミックス信号はステレオ信号の両チャンネルの組合せとして得られる。PSパラメータはPSデコーダが、モノラルのダウンミックス信号とPSサイド情報とから、ステレオ信号を再構成することを可能にする。典型的には、PSパラメータは時間と周波数の変数であり、PSデコーダにおけるPS処理は典型的にはQMFバンクを含むハイブリッド・フィルターバンク領域において実行される。文献”Low Complexity Parametric Stereo Coding in MPEG−4”,Heiko Purnhagen,Proc.Digital Audio Effects Workshop (DAFx),pp163−168,Naples,IT,Oct.2004は、MPEG4の例示的なPS符号化システムを説明している。そのパラメトリック・ステレオの議論は本明細書に参照して組み込まれる。パラメトリック・ステレオは例えばMPEG−4Audioによってサポートされる。パラメトリック・ステレオはMPEG−4標準規格文書ISO/IEC14496−3:2005(MPEG−4Audio,3rd edition)の8.6.4節とアネックス8.Aと8.Cで議論されている。その標準規格文書のこれらの部分は本願明細書において参照して組み込まれる。パラメトリック・ステレオはMPEG Surround規格においても使用される(文献ISO/IEC 23003−1:2007、MPEG Surroundを参照)。この文献も本願明細書において参照して組み込まれる。パラメトリック・ステレオ符号化システムの更なる例は,文献“Binaural Cue Coding−PartI:Psychoacoustic Fundamentals and Design Principles”,Frank Baumgarte and Christof Faller,IEEE Transactions on Speech and Audio Processing,vol11,no6,pages 509−519,November 2003,及び、文献“Binaural Cue Coding−PartII:Schemes and Applications”,Christof Faller and Frank Baumgarte, IEEE Transactions on Speech and Audio Processing,vol11,no6,pages520−531,November 2003において議論されている。2つの文献の後者には、用語“binaural cue coding”が使用され、それはパラメトリック・ステレオ符号化の一例である。
本願明細書では、PSパラメータを使用したステレオ信号の生成に基づく方法及びシステムが説明される。PSパラメータは不良品質のサイド信号が受信されるときにも低ノイズ信号を生成するのに使用される。さらに、エラー隠蔽方法が説明され、その方法は、前に推定されたPSパラメータを保持することにより、モノラルへの中間的なフォールバックを隠蔽するよう用いられてもよい。
本願発明の課題は、PSパラメータを使用したステレオ信号の生成に基づく方法及びシステムを提供することである。
一側面によれば、出力ステレオ信号を生成し、及び/又は、2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するよう構成されるシステムが説明される。その2チャンネル音声信号はFMステレオ無線受信機で受信されてもよく、その受信機は例えばワイヤレス通信装置の部分である。その受信された2チャンネル音声信号は中央信号とサイド信号として呈示されてもよい。すなわち、その2チャンネル音声信号は中央信号とサイド信号とを含むか、又は、中央信号とサイド信号として呈示できる信号を含んでもよい。その中央信号とサイド信号とはその左信号と右信号とから導いてもよい。更に換言すれば、その中央信号及び/又はそのサイド信号は、2チャンネル音声信号から得ることができてもよい。そうして、その2チャンネル音声信号は情報を含み、その情報から中央信号とサイド信号とを導くことができる。一実施形態では、中央信号Mとサイド信号Sとは、M=(L+R)/2及びS=(L−R)/2として、左音声信号Lと右音声信号Rとに関連する。出力ステレオ信号は典型的には左信号と右信号とを表せる。代替的に、その出力ステレオ信号は2チャンネル出力信号として言及されてもよい。この2チャンネル出力信号はモノラルの音声信号又はステレオの音声信号を搬送してもよい。詳しくは、2チャンネル出力信号の左信号が2チャンネル出力信号の右信号に対応する場合、その2チャンネル出力信号は通常はモノラル音声信号を搬送する。
本システムは、受信した2チャンネル音声信号の第一のフレームに基づいて、第一のパラメトリック・ステレオ・パラメータ(又は、少なくとも1つの第一のパラメトリック・ステレオ・パラメータ)を決定するよう構成されるパラメトリック・ステレオ・パラメータ推定ステージを含んでもよい。換言すれば、受信した2チャンネル・音声信号の抜粋は、第一のパラメトリック・ステレオ・パラメータ、例えばチャンネル・レベル・ディフェレンスを示すパラメータ、及び/又は、インターチャンネル相互相関を示すパラメータを決定するよう使用されてもよい。その抜粋は、信号フレームとして言及されてもよい。そのパラメトリック・ステレオ・パラメータ推定ステージは、新しいパラメトリック・ステレオ・パラメータ(又は、少なくとも1つの新しいパラメトリック・ステレオ・パラメータ)を前記受信した2チャンネル音声信号の夫々の連続するフレームに対して決定するよう構成されてもよい。
本システムは、隠蔽検出ステージを含んでもよく、そのステージは第一の信号フレーム内のサイド信号のエネルギーを決定するよう構成される。信号フレーム内のサイド信号のエネルギーは、その信号フレーム内のサイド信号のサンプルのrms値に基づいて決定されてもよい。その隠蔽検出ステージは、第一の信号フレーム内のサイド信号のエネルギーが高い閾値を上回ることを決定するよう構成されてもよい。
その隠蔽検出ステージは多数の次の連続する信号フレームを決定するよう構成されてもよく、その間、サイド信号(Es)のエネルギーは高い閾値を上回る値から、低い閾値を下回る値へ低下する。次の連続する信号フレームの数は、高エネルギーサイド信号(Es>高い閾値)から低エネルギーサイド信号(Es<低い閾値)までの移行期間として言及されてもよい。換言すれば、隠蔽検出ステージは、第一の信号フレームに直接続く或る数の信号フレームのサイド信号のエネルギーが高い閾値よりも低く、最終的には低い閾値を下回って低下することを決定するよう構成される。詳しくは、その隠蔽検出ステージは正確な数の信号フレームを決定するよう構成され、その間、エネルギーは高い閾値を上回るエネルギーから低い閾値を下回るエネルギーへ低下する。更に詳しくは、その隠蔽検出ステージは、連続する信号フレームの数、即ち、移行期間がフレーム閾値を下回る場合、第一の信号フレームに続く2チャンネル音声信号が劣化したステレオ信号であるか、又は、不自然なモノラル信号であることを決定するよう構成されてもよい。一実施形態では、そのフレーム閾値は1つ以上の信号フレーム、例えば1,2,3又は4つの信号フレームの何れかであってもよい。
その隠蔽検出ステージは、第一のパラメトリック・ステレオ・パラメータに基づいて、具体的には不自然なモノラル信号が検出された場合、パラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。そのパラメトリック・ステレオ・パラメータは2チャンネル音声信号の処理のために使用されてもよい。詳しくは、そのパラメトリック・ステレオ・パラメータは、2チャンネル音声信号の第一の信号フレームに続く2チャンネル音声信号のフレームを処理するために使用されてもよい。
本システムは、補助音声信号に基づいて、及び、第一のパラメトリック・ステレオ・パラメータに基づいて、第一の信号フレームに続く出力ステレオ信号のフレームを生成するよう構成される。換言すれば、第一の信号フレームに続いて受信した2チャンネル音声信号が不自然なモノラル信号であると決定される場合、例えば、サイド信号がとても小さいステレオ信号や、僅かなエネルギーしか有しない場合、出力ステレオ信号の連続フレームは第一のパラメトリック・ステレオ・パラメータから決定され、即ち、劣化していない受信2チャンネル音声信号のフレームに基づいて決定された第一のパラメトリック・ステレオ・パラメータから決定される。他方、補助音声信号は、第一の信号フレームに続く受信2チャンネル音声信号から得られ、例えば、補助音声信号は出力ステレオ信号のフレームに対応する受信2チャンネル音声信号のフレームから決定されてもよい。一実施形態では、補助音声信号は(L+R)/aとして決定され、aは実数であり、例えば2である。即ち、補助音声信号は受信2チャンネル音声信号内に含まれる中央信号に対応してもよい。
その隠蔽検出ステージは、連続する信号フレームの数がフレーム閾値以上である場合、第一の信号フレームに続く2チャンネル音声信号が真の(オーセンティックな)モノラル信号であることを決定するよう更に構成されてもよい。そうして、その隠蔽検出ステージは、信号フレームの数を決定することにより、ステレオ信号から真のモノラル信号(例えばスピーチ信号)への移行を検出するよう構成されてもよく、サイド信号のエネルギーをとって、高い閾値の上から低い閾値の下へ落ちる。
その隠蔽検出ステージは状態機械として構成されてもよい。詳しくは、その隠蔽検出ステージは、全体のシステムの複数のモードを特定する複数の状態を含んでもよい。そのシステムのモードは、典型的には、受信2チャンネル音声信号の現在のフレームがどのように処理されるのかを決定する。詳しくは、アップミックス・ステージの処理は、本システムの現在の状態に依存してもよい。その隠蔽検出ステージは、複数の境界(エッジ)も含んでもよく、その境界は複数の状態間の移行状態を特定する。このようにして、2つの状態間の境界は、現在の状態から次の状態へ渡るように本システムに対して満たされるべき条件を特定してもよい。その条件は1つ以上の条件を含んでもよく、例えば、サイド信号の連続フレームのエネルギーに関する条件、時間の制約、フレーム数の制約等々である。状態間の移行条件を特定することによって、或る境界は、2チャンネル音声信号の現在のフレームの直後のフレームがどのように処理されるかを決定してもよい。
複数の状態はステレオ状態を含んでもよく、即ち、或る状態の間、本システムは2チャンネル音声信号を非劣化ステレオ信号として処理する。本システムがステレオ状態である場合、パラメトリック・ステレオ・パラメータ推定ステージは、受信2チャンネル音声信号の現在のフレームに基づいて現在のパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。アップミックス・ステージは補助音声信号と現在のパラメトリック・ステレオ・パラメータとに基づいて出力ステレオ信号の現在のフレームを生成するよう構成されてもよい。補助音声信号は受信2チャンネル音声信号の現在のフレームから得られてもよい。詳しくは、補助音声信号は受信2チャンネル音声信号の内部に含まれる中央信号の現在のフレームから得られてもよい。代替的に、又は、追加的に、本システムは、アップミックス・ステージをバイパスし、2チャンネル音声信号から出力ステレオ信号を直接に決定してもよいことに留意すべきである。詳しくは、出力ステレオ信号のフレームが受信2チャンネル音声信号のフレームから直接決定されてもよく、例えばコピーされてもよい。
複数の状態には真のモノラル状態を含んでもよく、即ち、或る状態の間、本システムは受信2チャンネル音声信号を真のモノラル信号として、例えばスピーチ信号のように処理する。本システムが真のモノラル状態にある場合、パラメトリック・ステレオ・パラメータ推定ステージは受信2チャンネル音声信号の現在のフレームに基づいて現在のパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。アップミックス・ステージは、補助音声信号と現在のパラメトリック・ステレオ・パラメータとに基づいて出力ステレオ信号の現在のフレームを生成するよう構成されてもよい。音声補助信号は、受信2チャンネル音声信号の現在のフレームから得られてもよい。ステレオ状態と同様の方法で、本システムは真のモノラル動作の間バイパスモードで動作してもよい。
複数の状態には隠蔽状態を含んでもよく、即ち、或る状態の間、本システムは不自然な(強制的な)モノラル信号を隠す。本システムが隠蔽状態にある場合、アップミックス・ステージは補助音声信号と保存されたパラメトリック・ステレオ・パラメータとに基づいて、出力ステレオ信号の現在のフレームを生成するよう構成されてもよい。このようにして、アップミックス・ステージは以前に決定されたパラメトリック・ステレオ・パラメータに基づいて出力ステレオ信号を決定し、それによって、現在受信されたサイド信号フレームの内部に含まれるモノラル信号を隠すように構成されてもよい。他の状態と同様の方法で、補助音声信号は受信2チャンネル音声信号の現在のフレームから得られてもよい。他方、保存されたパラメトリック・ステレオ・パラメータは、本システムが前回のステレオ状態にある間に、パラメトリック・ステレオ・パラメータ推定ステージによって決定されていてもよい。一実施形態では、保存されたパラメトリック・ステレオ・パラメータは複数のパラメトリック・ステレオ・パラメータから、好ましくは平滑化又は平均化により導かれる。隠蔽状態に到達する前に異なる信号フレームに対して決定されたパラメトリック・ステレオ・パラメータを考慮することにより、本システムは隠蔽状態の間に不適切なパラメトリック・ステレオ・パラメータを使用しないことが確保されてもよい。さらに、保存されたパラメトリック・ステレオ・パラメータは時間依存でもよい。詳しくは、保存されたパラメトリック・ステレオ・パラメータは時間関数でモノラルに減衰してもよい。換言すれば、保存されたパラメトリック・ステレオ・パラメータはモノラル音声信号を生成するよう適応されるパラメトリック・ステレオ・パラメータへ移行してもよい。そうした移行のための時間インターバルは可変でもよい。
複数の境界には1つ以上の次の境界を含んでもよい:次のフレームのエネルギーが高い閾値を下回り、且つ、低い閾値を上回る場合には、ステレオ状態から真のモノラル状態への移行;次のフレームのエネルギーが低い閾値を下回る場合には、ステレオ状態から隠蔽状態への移行;次のフレームのエネルギーが高い閾値を下回り、且つ、低い閾値を上回る場合には、隠蔽状態から真のモノラル状態への移行;次のフレームのエネルギーが高い閾値を上回る場合には、隠蔽状態からステレオ状態への移行;及び/又は、次のフレームのエネルギーが高い閾値を上回る場合には、真のモノラル状態からステレオ状態への移行。一実施形態では、真のモノラル状態から隠蔽状態への移行は、更に、本システムが真のモノラル状態にある現在のフレームに先行するフレームの数に依存する。代替的に、又は、追加的に、真のモノラル状態から隠蔽状態への移行は、本システムが真のモノラル状態にある現在のフレームに先行するフレームの数がフレーム閾値を下回る場合にだけ生じてもよい。
隠蔽検出状態は、サイド信号の次のフレームのスペクトル平坦性を決定するよう構成されてもよい。スペクトル平坦性は、サイド信号のフレームのパワースペクトルに基づいて決定されてもよい。パワースペクトルは、複数の周波数帯域の夫々に関連する複数のエネルギー値を含んでもよい。スペクトル平坦性は、複数のエネルギー値の幾何平均と複数のエネルギー値の算術平均と間の比率として決定されてもよい。このようにして、0に近いスペクトル平坦性は集中したパワースペクトルを示し、1に近いスペクトル平坦性は平坦なパワースペクトル、即ち、ノイズの多い信号のパワースペクトルを示す。隠蔽検出ステージは、複数の境界のうち少なくとも1つの移行条件のスペクトル平坦性を考慮するよう構成されてもよい。即ち、隠蔽ステージの境界の移行条件は、サイド信号の次のフレームがノイズの高い程度を有するか否かを考慮してもよい。詳しくは、真のモノラル状態からステレオ状態への移行は次のフレームのスペクトル平坦性に依存してもよい。より詳しくは、真のモノラル状態からステレオ状態への移行は、スペクトル平坦性が平坦性閾値を下回る場合にだけ生じてもよい。このようにして、ノイズバーストによって発生する真のモノラル状態からステレオ状態への間違った移行を回避することができる。これは、真のモノラル信号の不所望の隠蔽に繋がることのある真のモノラル状態から隠蔽状態(ステレオ状態を介して)への移行をも回避する。
本システムはノイズ推定ステージを含んでもよい。ノイズ推定ステージは、受信サイド信号のノイズパワーに対するノイズパラメータ特性を決定するよう構成されてもよい。さらに、パラメトリック・ステレオ・パラメータ推定ステージは、受信2チャンネル音声信号とノイズパラメータとに基づいて、パラメトリック・ステレオ・パラメータ、即ち、第一の、又は現在のパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。
本システムはパラメトリック・ステレオをサポートする音声エンコーダを更に含んでもよい。音声エンコーダはパラメトリック・ステレオ・エンコーダを含んでもよく、パラメトリック・ステレオ・パラメータ推定ステージはパラメトリック・ステレオ・エンコーダの部分である。
別の側面によれば、FMステレオ無線受信機が説明される。FMステレオ無線受信機は、中央信号とサイド信号を含むか、又は、それらを表すFM無線信号を受信するよう構成されてもよい。さらに、FMステレオ無線受信機は本明細書で概説する如何なる1つ以上の特徴や機能を有するシステムを含んでもよい。
別の側面によれば、モバイル通信デバイス、例えば携帯電話やスマートフォンが説明される。モバイル通信デバイスはFMステレオ受信機を含み、中央信号とサイド信号とを含むか、又は、それらを表すFM無線信号を受信するよう構成される。さらに、モバイル通信デバイスは本明細書で概説する如何なる1つ以上の特徴や機能に従ったシステムを含んでもよい。
別の側面によれば、出力ステレオ信号(又は、2チャンネル出力信号)の生成方法、及び/又は、受信した2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定する方法が説明される。受信した2チャンネル音声信号は中央信号とサイド信号とを含んでもよく、又は、表されてもよい。本方法は、受信した2チャンネル音声信号の第一のフレームに基づいて第一のパラメトリック・ステレオ・パラメータを決定するステップを含んでもよい。本方法は、続いて、第一の信号フレーム内のサイド信号のエネルギーを決定し、そして、第一の信号フレーム内のサイド信号のエネルギーが高い閾値を上回ることを決定する。さらに、本方法は、多数の次の連続信号フレームを決定するステップを含み、例えば、第一の信号フレームに直接続く信号フレームであり、その間、サイド信号のエネルギーは高い閾値を上回る値から低い閾値を下回る値へ低下する。詳しくは、本方法はフレームの数を決定してもよく、その間、サイド信号のエネルギーは高い閾値を上回る値から低い閾値を下回る値へ低下する。従って、本方法は、連続する信号フレームの数がフレーム閾値を下回る場合に、第一の信号フレームに続く2チャンネル音声信号が劣化ステレオ信号であるか、又は、不自然なモノラル信号であると決定するステップに続く。この場合には、即ち、第一の信号フレームに続く2チャンネル音声信号が不自然なモノラル信号である場合は、本方法は、第一のパラメトリック・ステレオ・パラメータに基づいてパラメトリック・ステレオ・パラメータを決定するステップを含んでもよい。代替的に、又は、追加的に、本方法は、補助音声信号に基づいて、及び、第一のパラメトリック・ステレオ・パラメータに基づいて第一の信号フレームに続く出力ステレオ信号のフレームを生成するステップを含んでもよく、その補助音声信号は第一の信号フレームに続いて受信された2チャンネル音声信号から得られる。
別の側面によれば、ソフトウェア・プログラムが説明される。ソフトウェア・プログラムはプロセッサ上での実行のために適応されてもよく、コンピュータ・デバイス上で実行されるとき、本明細書で概説する方法ステップ群を実行する。
別の側面によれば、記憶媒体が説明される。記憶媒体はプロセッサ上での実行のために適応されるソフトウェア・プログラムを含んでもよく、コンピュータ・デバイス上で実行されるとき、本明細書で概説する方法ステップ群を実行する。
別の側面によれば、コンピュータ・プログラム製品が説明される。コンピュータ・プログラムは、実行可能な命令を含んでもよく、コンピュータ・デバイス上で実行されるとき、本明細書で概説する方法ステップ群を実行する。
本特許出願において概説する好ましい実施形態群を含む方法及びシステムは、スタンドアロンで使用されても、又は、本明細書で開示する他の方法及びシステムと組み合わせても使用されてもよい。さらに、本特許出願で概説される方法及びシステムの全ての側面は任意に組み合わされてもよい。特に、請求項の特徴は任意的に相互に組み合わされてもよい。
本発明は添付の図面を参照して例示的な例を用いて以下で説明される。
図1はFMステレオ無線受信機のステレオ出力を改善する概略的な実施形態を例示する。 図2はパラメトリック・ステレオのコンセプトに基づいた音声処理装置の一実施形態を例示する。 図3はPSエンコーダとPSデコーダとを有するPSベースの音声処理装置に係る他の実施形態を例示する。 図4は図3の音声処理装置の拡張版を例示する。 図5は図4のPSエンコーダとPSデコーダの一実施形態を例示する。 図6はFM受信機のモノラルだけの出力の場合の疑似ステレオ生成用の音声処理装置の他の実施形態を例示する。 図7はFM受信機の出力端でのステレオ再生における短いドロップアウトの発生を例示する。 図8は例示的な状態機械であり、モノラル・ドロップアウトとモノラル・エラー隠蔽を実行するために用いられる。 図9はモノラル・ドロップアウトを有する信号のエラー隠蔽を例示する。 図10は音声信号の例に対するパワースペクトルを示す。 図11はエラー隠蔽を用いたPSパラメータ推定ステージの例を示す。 図12は、“モノラル”検出ステージ、又は、隠蔽検出ステージの例を示す。 図13は、エラー補償による高度なPSパラメータ推定の例を示す。 図14はHE−AAC v2エンコーダに基づく音声処理装置の別の実施形態を示す。
図1はFMステレオ無線受信機1のステレオ出力を改善する単純化された概略的な実施形態を示す。背景技術の章で説明したように、FM無線ではステレオ信号は意図的に中央信号とサイド信号として送信される。FM受信機1では、サイド信号はFM受信機1の出力端で左チャンネルLと右チャンネルRの間のステレオ差分を生成するよう使用される(少なくとも受信が充分に良好でかつそのサイド信号情報がミュートされていない場合)。左と右のチャンネルL,Rはデジタル又はアナログ信号でもよい。FM受信機の音声信号L,Rを改善するため、音声信号装置2が使用されてその出力端でステレオ音声信号L´とR´とを生成する。その音声処理装置2は、パラメトリック・ステレオを用いて、受信されたFM無線信号のノイズ低減を実行することを可能にするシステムに対応する。その装置2内の音声処理は好ましくはデジタル領域で実行され;従って、FM受信機1と音声処理装置2との間のアナログ・インターフェースの場合は、アナログ・デジタルのコンバータが装置2内のデジタル音声処理の前に使用される。FM受信機1と音声処理装置2とは同じ半導体チップ上に統合されてもよいし、又は、2つの半導体チップの部分であってもよい。FM受信機1と音声処理装置2とは、携帯電話やPDAやスマートフォンのようなワイヤレス通信装置の部分であってもよい。この場合、FM受信機1は追加的なFM無線受信機能を有するベースバンド・チップの部分でもよい。
FM受信機1の出力端および装置2の入力端で左/右表示を使用する代わりに、中央/サイド表示がFM受信機1と装置2との間のインターフェースに使用されてもよい(図1の中央/サイド表示に対するM,S、及び左/右表示に対するL,Rを参照)。FM受信機1と装置2との間のインターフェースでのそうした中央/サイド表示は、FM受信機1が既に中央/サイド信号を受信して音声処理装置2がその中央/サイド信号をダウンミックスせずに直接処理してもよいので、より少ない労力をもたらしてもよい。中央/サイド表示は、FM受信機1が音声処理装置2にしっかりと統合している場合、詳しくは、FM受信機1と音声処理装置2とが同じ半導体チップ上に統合されている場合に、有利であってもよい。
任意的には、無線受信状態を表す信号強度信号6が使用されてもよく、音声処理装置2内の音声処理を適応する。これは本明細書で後に説明されるだろう。
FM無線受信機1と音声処理装置2との組合せは統合ノイズ低減システムを有するFM無線受信機に対応する。
図2はパラメトリック・ステレオのコンセプトに基づく音声処理装置2の一実施形態を示す。装置2はPSパラメータ推定ステージ3を含む。パラメータ推定ステージ3は改善されるべき入力音声信号(左/右又は中央/サイドの表示であってもよい)に基づいてPSパラメータ5を決定するよう構成される。PSパラメータ5は特にインターチャンネル強度差(IID、又は、CLD−チャンネル・レベル・ディフェレンスとも呼ばれる)を表すパラメータ、及び/又は、インターチャンネル・コレクション(ICC)を表すパラメータを含んでもよい。好ましくは、PSパラメータ5は時間及び周波数変数である。パラメータ推定ステージ3の入力でのM/S表示の場合、そのパラメータ推定ステージ3はそれにもかかわらずL/Rチャンネルに関連するPSパラメータ5を決定してもよい。
音声信号DMが入力信号から得られる。その入力音声信号が中央/サイド表示を既に使用している場合、音声信号DMは中央信号に直接的に対応してもよい。入力信号が左/右表示を有する場合、その音声信号は音声信号をダウンミックすることにより生成される。好ましくは、ダウンミックス後の結果の信号DMは中央信号Mに対応し、以下の式により生成されてもよい:
Figure 2013541870
即ち、ダウンミックス信号DMはLとRの信号の平均に対応してもよい。aの様々な値に対して、LとRの信号の平均は単純化されるか、又は、減衰する。
本装置はステレオ・ミクシング・モジュール又はステレオ・アップミクサーとも言われるアップミックス・ステージ4を更に含む。アップミックス・ステージ4は音声信号DMとPSパラメータ5に基づいてステレオ信号L´、R´を生成するよう構成される。好ましくは、アップミックス・ステージ4はDM信号だけでなく、サイド信号又は幾つかの種類の疑似サイド信号(不図示)も使用する。これは、図4と5のより広範な実施形態に関連して本明細書で後に説明されるだろう。
本装置2は、受信した中央とサイドの信号を単純に組み合わせることにより、ノイズのためにステレオ信号を再構成するのに受信サイド信号が極めてノイズが多いことがあるというアイディアに基づく;それにもかかわらず、この場合は、L/R信号におけるサイド信号又はサイド信号の成分が、PSパラメータ推定ステージ3におけるステレオ・パラメータ分析には充分にまだ良好であることがある。そして、結果のPSパラメータ5は、ステレオ信号L´、R´を生成するのに使用されることができ、そのステレオ信号L´、R´は、FM受信機1の出力での直接の音声信号に比べて、低減したノイズレベルを有する。
従って、パラメトリック・コンセプトを用いることで劣悪なFM無線信号が“クリーン・アップ”されることができる。FM無線信号の歪みやノイズの主要部分は、PSダウンミックスで使用されないことがあるサイドチャンネルに存在する。それにもかかわらず、そのサイドチャンネルは、劣悪な受信の場合でさえ、しばしばPSパラメータ抽出に対して充分な品質である。
以下の全ての図面において、音声処理装置2への入力信号は左/右ステレオ信号である。音声処理装置2の中で幾つかのモジュールへの僅かな変更により、音声処理装置2は中央/サイド表示の入力信号も処理することができる。それ故、本明細書で議論したコンセプトは中央/サイド表示の入力信号に関連して使用することができる。
図3はPSベースの音声処理装置2の一実施形態を示し、PSエンコーダ7とPSデコータ8とを使用する。この例では、そのパラメータ推定ステージ3はPSエンコーダ7の部分であり、アップミックス・ステージ4はPSデコーダ8の部分である。“PSエンコーダ”及び“PSデコーダ”の用語は、装置2の中の音声処理ブロックの機能を説明するための名称として用いられる。音声処理は同じFM受信装置で全て動作することに留意すべきである。これらのPSエンコーディング及びPSデコーディング処理はしっかりと連結されても良く、用語“PSエンコーディング”及び“PSデコーティング”は音声処理機能のヘリテージを説明するのに用いられるだけである。
PSエンコーダ7は、ステレオ音声入力信号L,Rに基づいて、音声信号DM及びPSパラメータ5を生成する。任意的に、PSエンコーダ7は信号強度信号6を更に使用してもよい。その音声信号DMはモノラル・ダウンミックスであり、好ましくは受信中央信号に対応する。DM信号を形成するためにL/Rチャンネルを合計すると、受信サイドチャンネルの情報はそのDM信号内で完全に除去されてもよい。従って、この場合、中央情報だけがモノラル・ダウンミックスDMの中に含まれる。それ故、サイドチャンネルからの如何なるノイズもDM信号内で除去されてもよい。しかしながら、サイドチャンネルは、エンコーダ7が典型的にはL=M+S及びR=M−Sを入力としてとるので(従って、DM=(L+R)/2=M)、エンコーダ7のステレオ・パラメータ分析の部分である。
モノラル信号DM及びPSパラメータ5は、続いて、PSデコータ8で使用され、ステレオ信号L´、R´を再構成する。
図4は図3の音声処理装置2の拡張版を示す。ここでは、モノラル・ダウンミックス信号DMとPSパラメータとに加えて、元々受信したサイド信号SもPSデコータ8に伝えられる。このアプローチはPSコーディングの“残余コーディング”技術に類似し、良好であるが完全ではない受信状態の場合、受信サイド信号Sの少なくとも部分(例えば或る周波数バンド)を使用することが可能になる。その受信サイド信号Sは、そのモノラル・ダウンミックス信号が中央信号に対応しない場合に、好ましくは使用される。しかしながら、そのモノラル・ダウンミックス信号がサイド信号に対応しない場合、より一般的な残余信号が受信サイド信号Sに代わって使用されることができる。そうした残余信号は、ダウンミックスとPSパラメータによって、元々のチャンネルの表示に関連するエラーを示し、そして、PSエンコーディング・スキームの中でしばしば使用される。以下では、受信サイド信号Sの使用についての言及は残余信号にも適応される。
図5は図4のPSエンコーダ7とPSデコーダ8の一実施形態を示す。そのPSエンコーダ・モジュール7は、ダウンミックス生成器9とPSパラメータ推定ステージ3を含む。例えば、そのダウンミックス生成器9はモノラル・ダウンミックスDMを生成してもよく、そのモノラル・ダウンミックスDMは中央信号M(例えば、DM=M=(L+R)/a)に好ましくは対応し、任意的に、受信サイド信号S=(L−R)/aに対応する第2信号を生成してもよい。
PSパラメータ推定ステージ3は、PSパラメータ5として、L及びR入力の間のレベル差と相関とを推定してもよい。任意的に、そのパラメータ推定ステージは信号強度6を受信する。この情報はPSパラメータ5の信頼性に関して決定するために使用されることができる。低い信頼性の場合、例えば、低い信号強度6の場合、PSパラメータ5は、出力信号L´、R´がモノラル出力信号又は疑似ステレオ出力信号であるように設定されてもよい。モノラル出力信号の場合、出力信号L´は出力信号R´と等しい。疑似ステレオ信号の場合、デフォールトのPSパラメータは疑似又はデフォールトのステレオ出力信号L´、R´を生成するのに使用されてもよい。
PSデコーダモジュール8はステレオ・ミクシング・マトリクス4aと非相関器(decorrelator)10とを含む。その非相関器はモノラル・ダウンミックスDMを受信し、疑似サイド信号として使用される非相関信号S´を生成する。その非相関器10は引用文献“Low Complexity Parametic Stereo Coding in MPEG−4”の第4章で述べられているように、適切な全通過フィルタによって実現されてもよい。そのステレオ・ミクシング・マトリクス4aはこの実施形態の2x2のアップミックス行列である。
推定パラメータ5に応じて、ステレオ・ミクシング・マトリクス4aはステレオ出力信号L´とR´とを生成するため、DM信号を受信サイド信号S又は非相関信号S´と混合する。信号Sと信号S´の間の選択は受信状態を表す無線受信インジケータに応じてもよく、例えば信号強度6である。これに代わって、又は、これに加えて、受信サイド信号の品質を表す品質インジケータを使用してもよい。そうした品質インジケータの或る例は、受信サイド信号の推定ノイズ(パワー)であってもよい。高度ノイズを含むサイド信号の場合、非相関信号S´がステレオ出力信号L´及びR´を生成するよう使用されてもよく、一方、低ノイズの状況では、サイド信号Sが使用されてもよい。受信サイド信号のノイズを推定する各種の実施形態は本明細書で後に説明される。
アップミックス操作は好ましくは以下の行列方程式に従って実行される:
Figure 2013541870
ここで、重み付けファクタα、β、γ、δは信号DMとSの重みを決定する。モノラル・ダウンミックス信号DMは好ましくは受信中央信号に対応する。その式の信号Sは非相関信号S´か、又は、受信サイド信号Sに対応する。アップミックス・マトリクス要素群、即ち、重み付けファクタα、β、γ、δは、例えば、引用論文“Low Complexity Parametic Stereo Coding in MPEG−4”(2.2章参照)、引用されるMPEG−4標準規格文書ISO/IEC 14496−3:2005(8.6.4.6.2章参照)、又は、MPEGサラウンド仕様文書ISO/IEC23003−1(6.5.3.2章参照)に示されるように導出されてもよい。その文献のそうした章は(及び、これらの章で言及される章も)本明細書で参照して組み込まれる。
或る受信状態では、FM受信機1はモノラル信号を、伝達サイド信号をミュートにして、供給するのみである。これは、受信状態がたいへん劣悪でサイド信号がノイズが多いときに、典型的に発生するだろう。FMステレオ受信機1がステレオ無線信号のモノラル再生にスイッチした場合、アップミックス・ステージは好ましくは、プリセットのアップミックス・パラメータのようなブラインド・アップミックスのアップミックス・パラメータを使用して疑似ステレオ信号を生成し、即ち、そのアップミックス・ステージは、ブラインド・アップミックスのアップミックス・パラメータを用いて、ステレオ信号を生成する。
極めて劣悪な受信状態ではモノラル再生にスイッチするFMステレオ受信機1の実施形態もある。その受信状態が信頼できるPSパラメータ5の推定には極めて劣悪である場合、アップミックス・ステージは好ましくはブラインド・アップミックスのアップミックス・パラメータを使用し、そして、それに基づいて疑似ステレオ信号を生成する。
図6はFM受信機1のモノラルだけの出力の場合に、疑似ステレオを生成する一実施形態を示す。ここでは、モノラル/ステレオの検出器13が使用され、装置2への入力信号がモノラルであるか、即ち、L及びRのチャンネルの信号が同じであるかどうかを検出する。FM受信機1のモノラル再生の場合、モノラル/ステレオの検出器13は、例えば固定アップミックス・パラメータを備えたPSデコーダを用いて、ステレオへのアップミックスを指し示す。換言すれば、この場合、アップミックス・ステージ4はPSパラメータ推定ステージ3からのPSパラメータ(図6には図示されない)を使用しないが、固定アップミックス・パラメータ(図6には図示されない)を使用する。
任意的にスピーチ検出器14が加えられてもよく、その受信信号が主にスピーチ又は音楽であることを表示する。そうしたスピーチ検出器14は信号従属のブラインド・アップミックスを可能にさせる。例えば、そうしたスピーチ検出器14は信号従属のアップミックス・パラメータを可能にしてもよい。好ましくは、1つ以上のアップミックス・パラメータがスピーチ用に使用されてもよく、そして、異なる1つ以上のアップミックス・パラメータが音楽用に使用されてもよい。そうしたスピーチ検出器14はボイス活動検出器(VAD)によって実現されてもよい。
厳密には、図6のアップミックス・ステージ4は非相関器10、2x2アップミックス・マトリックス4a、及び、モノラル/ステレオ検出器13とスピーチ検出器14との出力を実際のステレオ・アップミックスへの入力として使用されるPSパラメータの或る形態へ変換する手段を含む。
図7は、FM受信機1によって供給される音声信号が、時間変化する劣悪な受信状態のため(例えば“フェーディング”)、ステレオとモノラルの間でトグルするとき、一般的な問題を図示する。モノラル/ステレオのトグルの間、ステレオ・サウンド・イメージを維持するため、エラー隠蔽技術が使用されてもよい。隠蔽が適応されるべき場所の時間インターバルは図7では“C”によって表示される。PSコーディングの隠蔽へのアプローチは、新しいPSパラメータはFM受信機1の音声出力がモノラルにドロップダウンしたため計算できないときは、以前に推定されたPSパラメータに基づくアップミックス・パラメータを使用することである。例えば、新しいPSパラメータがFM受信機1の音声出力がモノラルにドロップダウンしたため計算できない場合は、アップミックス・ステージ4は以前に推定されたPSパラメータを使用し続けてもよい。従って、FMステレオ受信機1がモノラルの音声出力にスイッチしたとき、ステレオのアップミックス・ステージ4はPSパラメータ推定ステージ3からの以前に推定されたPSパラメータを使用し続ける。ステレオ出力の中のドロップアウト期間が充分に短くFM無線信号のステレオ・サウンド・イメージがドロップアウト期間に類似している場合、そのドロップアウトは装置2の音声出力において聴くことができないか、又は、ほんの少しだけ聞くことができる。他のアプローチは、以前に推定されたパラメータからアップミックス・パラメータを内挿するか、及び/又は、外挿することである。以前に推定されたPSパラメータに基づくアップミックス・パラメータの決定については、本明細書の教示を考慮して、他の公知の技術を使用してもよく、例えばエラー隠蔽技術により知られた技術であって、音声デコーダにおいて使用されることができ、伝送エラーの影響を軽減する(例えば破損データ又は消失データ)。
以前に推定されたPSパラメータに基づきアップミックス・パラメータを使用する同様のアプローチは、FM受信機1がノイズの多いステレオ信号を短期間の間に供給する場合、適応されることができ、そのノイズの多いステレオ信号は極めて劣悪であり、それに基づいて信頼できるPSパラメータを推定できない。
上で概説したように、図7に描かれたステレオ中断の間、ステレオ幅の突然の感知された不連続を回避するため、ステレオ・イメージを維持することは望ましい。これは、上で述べた隠蔽技術によって達成することができる。しかしながら、信頼できる方法でこれらのドロップアウトを検出することは問題かもしれない。可能なモノラル/ステレオ検出器が、信号のモノラル・セクションの検出に基づくことができ、それは左信号=右信号の条件を満たす(又は、左信号―右信号=0)。しかし、そうしたモノラル/ステレオは隠蔽プロセスには不安定な動作につながることがあり、それは、左信号と右信号のエネルギーが、サイド信号のエネルギーと同様に、正常な受信状態でも大きく変動することがあるという事実による。
そうした隠蔽の不安定な動作を回避するため、モノラル/ステレオ検出と隠蔽メカニズムとは状態機械として実現できる。状態機械の例が図8に示される。図8の状態機械は、サイド信号Sの絶対エネルギー、即ちEs、の2つの基準レベルを使用する。Esを計算するのに使用されるサイド信号Sは、典型的には250Hzのカットオフ周波数を用いてハイパス・フィルタされていてもよい。これらの基準レベルは、上位基準レベルref_highと下位基準レベルref_lowである。その上位基準レベル(ref_high)の上では、信号はステレオであるとみなされ、その下位基準レベル(ref_low)の下では、信号はモノラルであるとみなされる。
サイド信号のエネルギーEsは状態機械の制御パラメータとして計算される。Esはタイム・ウインドウに渡って計算されてもよく、それは例えばPSパラメータの有効性の時間に対応してもよい。換言すれば、サイド信号のエネルギー決定頻度は、PSパラメータを決定する頻度と整合してもよい。本明細書では、サイド信号のエネルギーEs(及び、場合によりPSパラメータ)を決定する期間は信号フレームとして言及される。図8の状態機械は5つ条件を含み、それらは新しいフレームのエネルギーEsが計算される度に検証される:
−条件Aは、サイド信号エネルギーEsが上位基準レベルref_highを超えていることを示す。その上位基準レベルは高い閾値として言及されてもよい。
−条件Bは、サイド信号エネルギーEsが上位基準レベルref_high以下であって、且つ、下位基準レベルref_low以上であることを示す。その下位基準レベルは低い閾値として言及されてもよい。
−条件B1は条件Bに対応するが、追加的な時間条件を付加する。その時間条件は、条件Bがフレーム数の閾値より低いか、又は、時間閾値よりも低いことを規定する。この閾値は、フレーム閾値として参照されてもよい。
−条件B2は条件Bに対応し、追加的な時間条件を有し、条件Bがフレーム数の閾値以上であるか、又は、時間閾値以上であることを規定する。
−条件Cはサイド信号エネルギーEsが下位基準レベルref_lowよりも低いことを示す。
さらに、図8の状態機械の例は5つの状態を使用する。異なる状態が、上記の条件に従って、及び、図8に図示される状態図に従って到達する。次のアクションが典型的には異なる状態で実行される:
−状態1では、通常のステレオ操作が実行され、例えば、現在の音声信号から決定されるPSパラメータに基づいて実行される。
−状態2では、通常のステレオ操作が現在の音声信号について決定されたPSパラメータに基づいて実行される。この状態は単に過渡的なものであり、条件Bがフレーム閾値以上の多数のフレームに対して、又は、時間閾値以上の時間に対して(即ち、条件B2)、又は、フレーム数の経過の前に、又は、時間の経過の前に満たされるか、又は、条件Aが満たされるという事実を考慮している。
−状態3では、現在の音声信号について決定されたPSパラメータに基づいてステレオ操作が実行される。状態3は、状態1から状態2を介して状態3に至る経路に到達することが見て取れる。条件B2は移行のために最小限のフレーム数、又は最小限の時間を必要とするという事実を考慮して、経路“状態1、状態2、状態3”は、通常のステレオ操作(例えば音楽)から通常のモノラル操作(例えばスピーチ)までのスローな、即ちスムースな移行を表している。
−状態4では、以前に決定されたPSパラメータ、例えば状態1で決定された最も最近のPSパラメータを用いて、エラー隠蔽が開始される。条件Cが満たされる場合、即ち、サイド信号エネルギーEsがref_highの上からref_lowの下へ急に低下する場合、状態4は状態1から直接に到達することができることが見て取れる。しかし、代替的に、条件Bがわずか2,3のフレーム数、又は、ほんの短い時間に対して満たされる場合だけ、状態4は状態2を介して状態1から到達することができる。このようにして、経路“状態1、状態4”と“状態1、状態2、状態4”は、通常のステレオ動作(例えば音楽)から強制的なモノラル動作への速い、即ち突然の移行を表す。その強制的なモノラル動作は、典型的にはFM受信機のせいであり、サイド信号のノイズレベルが所定のレベルを超過する場合に、サイド信号を突然にカットオフする。
−状態5では、エラー隠蔽が継続し、例えば状態4で構築されたPSパラメータに基づく。例示の実施形態では、状態5は、条件Cが満たされる場合、即ち、状態5が安定したエラー隠蔽状態を表す場合、状態4から到達することができるだけであり、その場合には、以前に決定されたPSパラメータが中央信号からステレオ信号を生成するために使用される。PSパラメータは数秒の時間定数によりモノラルへ減少してもよい。IIDとICCパラメータの時間定数は異なっていてもよい。
既に述べたように、例示の状態図は、FM受信機により受信される音声信号が数個の時間ウインドウの中でステレオからモノラルへいく場合のみ、即ち、ステレオからモノラルへの移行が突然の場合に、隠蔽がトリガーされることを確実にする。他方、ステレオレベル(ref_high)より低いがモノラルレベル(ref_low)よりも高いエネルギーEsを有するサイド信号にノイズが存在する場合、即ち、サイド信号の中に適切なPSパラメータを生成するのに十分な情報がまだ存在する場合、隠蔽のトリガーが回避される。同時に、ステレオからモノラルへ信号が変化するときでも、例えば音楽からスピーチへ信号が移行するときは、隠蔽検出はトリガーされないだろう、それによって、エラーの多い隠蔽アプリケーションのせいで、元々のモノラル信号が人工的なステレオ信号の中に与えられないことが確保される。ステレオからモノラルへの真の移行は、ref_highの上からref_lowの下へのサイド信号エネルギーEsのスムースな移行に基づいて、検出することができる。
前回のウインドウの1つからのステレオ(PS)パラメータ(例えばIIDとICC)は、隠蔽がトリガーされるときに使用される。PSパラメータのスナップショットの代わりに、任意的にPSパラメータのローパス・フィルタされた値を使用することにより、パラメータの選択は、ぎこちないステレオ・イメージのフリージングのリスクに対してより敏感でないようになされる。換言すれば、PSパラメータの不適切なセットの使用を回避するため、或る数のフレーム、又は、隠蔽のトリガーの前の或る時間の経過から、ローパス・フィルタされた又は平均化されたPSパラメータを使用することは有利であることがある。そのパラメータ値はモノラルへ減少してもよい。
図8で見られるように、サイド信号がモノラルレベル(ref_low)を超過するとき、隠蔽が終了する。従って、新たに評価されるステレオ・パラメータが再び使用される。これは、サイド信号のエネルギーEsが閾値ref_lowよりも大きい場合は、サイド信号がPSパラメータを決定するのに十分な情報を含んでいると考えられるという事実のためである。
図9は音声信号の一例を示し、サイド信号のエネルギーが下位基準レベル(ref_low)よりも低くなるとき、どのようにして隠蔽が行われるかを示す。図9は、受信した音声信号のサイド信号エネルギーEs(参照番号31)と同様に、中央信号エネルギーEmid(参照番号30)を示す。さらに、図9は上位閾値ref_high(参照番号32)と下位閾値ref_low(参照番号33)を示す。隠蔽のトリガーは上のグラフ34に示され、低い値は、現在決定されたPSパラメータを用いて通常の操作が実行されることを示し、高い値は以前に決定されたPSパラメータを用いて隠蔽が実行されることを示す。
一実施形態では、誤ったモノラル・ドロップアウト検出の回避を更に改善するため、スペクトル平坦性指標(SFM)がサイド信号ノイズ検出に使用される。上述したように、劣化したサイド信号により生ずるモノラル・ドロップアウトと、ステレオからモノラルまでの間の真の移行とを確実に区別することは有利である。そうした区別を実行するアプローチの1つが、上述した状態図の使用である。サイド信号のスペクトルのスペクトル平坦性が、劣化したノイズサイド信号と、真のモノラル信号とを区別するための更なる指標であってもよい。スペクトル平坦性指標は、以下で与えられてもよい。
Figure 2013541870
ここで、
Figure 2013541870
はハイブリッド・フィルタバンク帯域kにおけるサイド信号のパワーを表す。PSシステムの例で用いられるハイブリッド・フィルタバンクは64のQMF帯域からなり、3つの最小の帯域は更に4+2+2の帯域に分割される(従って、N=64−3+4+2+2=69)。SFMはパワースペクトルの幾何平均とパワースペクトルの算術平均との比率として述べられてもよい。
代替的に、SFMはスペクトルのサブセットに基づいて計算されてもよく、Kstartstopまでの範囲のハイブリッド・フィルタバンク帯域だけを含む。そうして、例えば1つ又は2,3の第一の帯域が、不所望のDC、例えば低周波数のオフセットを除去するために排除することができる。こうして帯域境界を調整すると、SFMは与える:
Figure 2013541870
計算上の複雑さを制限するため、そのSFMの式は、例えばテイラー展開、ルックアップテーブル、又は、ソフトウェア実施の分野で当業者に一般的に知られた類似の技術に基づいて、代替的にその数値近似により代替されてもよい。
さらに、スペクトル平坦性を測定する、明らかな先行技術の方法が他にも存在し、例えば周波数パワービンの標準偏差や最小値と最大値の差などである。これによって、用語“SFM”はこれらの指標のうちの何れも表す。
高いスペクトル平坦性は、スペクトルが全てのスペクトル帯域において同様の量のパワーを有することを示す。他方、低いスペクトル平坦性は、スペクトルパワーが比較的小さい数の帯域に集中していることを示す。従って、高いSFM値はノイズの多いサイド信号を示し、そこでは低いSFM値は情報を含むことのあるサイド信号を示す。
図10では、ノイズの多いスピーチ信号の中央とサイドの信号のパワースペクトルが描かれる。中央信号20のパワースペクトルが、低周波数領域では高レベルのエネルギーを有して比較的急勾配であることが見て取れる。他方、モノラルのスピーチ信号の例示の場合では主にノイズを含むサイド信号21は、全般的に低レベルのエネルギーと比較的平坦なパワースペクトルを有する。
サイド信号ノイズ21のパワースペクトルはやや平坦で特徴的なスロープを有するので、SFMはスロープ補償されたパワースペクトルに基づいて決定されてもよい。即ち、SFM値は、上記の式を用いて、スロープ補償されたパワースペクトルから決定されてもよい。パワースペクトルを補償するのに用いられるスロープは、予め決定されてもよく、例えば、複数のテスト・サイド信号のパワースペクトルの平均スロープとしてである。これらのテスト・サイド信号は、モノラル・スピーチ信号のようなモノラル信号のサイド信号であってもよく、それによって、モノラル信号、例えばモノラル・スピーチ信号に含まれるサイド信号ノイズに対して、典型的な/平均のスロープを与える。代替的に、又は、追加的に、パワースペクトルを補償するために使用されるスロープはサイド信号の現在のフレームを用いて決定されてもよく、それによって、適応的なスロープ補償を提供する。これは線形回帰技術を用いて行われてもよい。
上述の指標を用いて、各信号フレームに対してSFM値が決定されてもよく、それによって、信号フレームのシーケンスに対してSFM信号を与える。このSFM信号は、フレーム/時間軸にそって平滑化されてもよい(ローパス・フィルタされる)。そのSFM値又は(平滑化)SFM信号は、ノイズ指標として使用されてもよい。詳しくは、SFM値は真のモノラル信号における偶発的なノイズ・バーストを特定するのに用いられてもよい。例として、音声信号はモノラル・スピーチ信号であってもよく、図8の状態機械は状態3であってもよい。サイド信号における偶発的なノイズ・バースト、即ちエネルギーEsの偶発的な増加が条件Aをトリガーしてもよく、それによって、音声信号がまだモノラル・スピーチ信号であっても、状態3から状態1への移行をトリガーする。そして、ノイズ・バーストの突然の終端が、状態4への移行(直接的に、又は、状態2を介して)をトリガーし、それによって、モノラル・スピーチ信号に対する不所望の隠蔽を開始する。そうした不所望の状況を回避するため、SFM値又は(平滑化)SFM信号が追加の条件として用いられてもよい。例として、条件Aは(平滑化)SFM信号に依存するよう追加的に作られてもよく、それによって、ステレオ信号に起因するサイド信号エネルギーと、ノイズ・バーストに起因するサイド信号エネルギーとを区別する。一実施形態では、(平滑化)SFM信号が或る閾値を超過する場合、隠蔽検出が停止されてもよい。全体的に見て、SFMの使用は誤った隠蔽検出を回避することができ、さもなければ、それはサイド信号の中に偶発的なノイズ・バーストにより典型的なモノラル・スピーチ信号に対して発生するかもしれない
図11には、隠蔽を含む例示のPSパラメータ推定ステージが示される。このPSパラメータ推定ステージは、修正されたPSパラメータ推定ステージとして言及されてもよい。左と右の信号を含む2チャンネル音声信号がPSパラメータ推定ステージ3に入り、2チャンネル音声信号の1つ以上の現在のフレームに基づいて、PSパラメータのセットを決定する。また、左と右の音声信号は“モノラル”検出ステージ、又は、隠蔽検出ステージ22に入り、それは隠蔽が実行されるべきかどうかを決定するよう構成される。このため、“モノラル”検出ステージ22は本明細書で概説される方法の何れを使用してもよい。また、修正されたPSパラメータ推定ステージは、メモリステージ23を含み、それは以前に決定されたPSパラメータを保存するよう構成される。詳しくは、メモリステージ23は、隠蔽の間に使用されるべきPSパラメータのセットを決定し保存するよう構成される。さらに、メモリステージ23は、保存されたPSパラメータのセットに減衰を適用するよう構成されてもよい。その減衰は、保存されたPSパラメータのセットから、モノラル信号を与えるために適応されるPSパラメータのセットへのスムースな移行につながることがある。減衰又は移行のスピードは設定可能であってもよい。加えて、修正されたPSパラメータ推定ステージはPSパラメータ選択ステージ24を含んでもよく、それは、ステレオ又は真のモノラル操作の間は、PSパラメータ推定ステージ3の出力から、そして、隠蔽操作の間は、メモリステージ23の出力から、PSパラメータを選択するよう構成される。
図12は一例として“モノラル”検出ステージ、又は、隠蔽検出ステージ22を示す。サイド信号が、サイド信号決定ステージ25を用いて、左と右の音声信号から生成される。引き続き、サイド信号のエネルギーEsがエネルギー決定ステージ26において決定される。さらに、サイド信号のSFM値がSFM決定ステージ27において決定されてもよい。夫々の閾値検証ステージ28,29の内部で、エネルギーEs及び/又はサイド信号のSFM値が或る条件を満たすかどうかが判定される。これらの条件は、状態機械40の状態間での移行をトリガーするため、状態機械40に供給される。状態機械の状態と移行(境界)は、本明細書で概説されるように構成されてもよい。“モノラル”検出ステージ22の出力として、隠蔽の実行がトリガーされてもよい。
以下では、エラー補償を供給する高度なPSパラメータ推定ステージ3´が図13を参照して説明される。ノイズの多いサイド成分を含むステレオ信号に基づいて、PSパラメータを推定する場合、CLD(Channel Level Differences)パラメータやICC(Inter−channel Cross−Correlation)パラメータを決定するような、PSパラメータを決定する従来の式が使用されると、PSパラメータの計算におけるエラーが存在するだろう。
実際のノイズの多いステレオ入力信号値lw/noiseとrw/noiseは、図13に示される内部のPSパラメータ推定ステージ3´に入力され、ノイズの無い夫々の値lw/o noisew/o noiseと受信サイド信号値のノイズ値nとに従属して表現することができる:
Figure 2013541870
ここでは、受信信号はs+nとしてモデル化され、“s”はオリジナルの(歪みの無い)サイド信号であり、そして、“n”は無線送信チャンネルによって生じる(歪み信号)ノイズであることに留意すべきである。さらに、ここでは、信号mは、無線送信チャンネルからのノイズによって歪んでいないことが想定される。
従って、対応する入力パワーLw/noise ,Rw/noise と相互相関Lw/noisew/noiseは以下のように記述することができる:
Figure 2013541870
サイド信号ノイズパワー推定N、N=E(n)を有し、“E()”は期待演算子である。
上記の式を再構成することにより、対応するノイズの無い補償パワーと相互相関が決定される:
Figure 2013541870
補償されたパワーと相互相関に基づいてエラー補償されたPSパラメータ抽出が、以下の式で与えられるように実行されてもよい:
Figure 2013541870
そうしたパラメータ抽出はPSパラメータの計算において推定Nの項を補償する。
サイド信号におけるノイズの影響は以下の通りである:サイド信号におけるノイズが中央信号から独立であると仮定すると:
−ICC値は、ノイズの無いステレオ信号に基づいて予測されるICC値に比べて、0に近くなり、そして、
−CLDデシベル値は、ノイズの無いステレオ信号に基づいて予測されるCLD値に比べて、0dBに近くなる。
PSパラメータにおけるエラーの補償のため、本装置2は好ましくはノイズ推定ステージを有し、そのステージは、(劣悪な)無線送信により生ずる受信サイド信号のノイズのパワーに対してノイズパラメータ特性を決定するよう構成される。従って、PSパラメータを推測するとき、ノイズパラメータが考慮されてもよい。これは図13で示されるように実現されてもよい。
図13に従って、FM信号強度6が少なくとも部分的にエラーを補償するように使用されてもよい。信号強度に関する情報がFM無線受信機でしばしば利用可能である。信号強度6は、PSエンコーダ7のパラメータ分析ステージ3に入力される。サイド信号ノイズパワー推定ステージ15では、信号強度6はサイド信号ノイズパワー推定Nに変換されてもよい。信号強度6の代替として、又は、信号強度6に加えて、音声信号L,Rは信号ノイズパワーを推定するために使用されてもよく、後で説明されるだろう。
図13では、サイド信号ノイズパワー推定ステージ15が、信号強度6及び/又は音声入力信号(LとR)に基づいて、ノイズパワー推定Nを導出するよう構成されてもよい。ノイズパワー推定Nは周波数変数と時間変数の双方であり得る。
様々な方法がサイド信号ノイズパワーNを決定するために使用されてもよく、例えば:
−中央信号の最小パワーを検出するとき(例えばスピーチの一時停止)、サイド信号のパワーはノイズだけであることが想定される(即ち、サイド信号のパワーはこの状況でNに相当する)。
−そのN推定は信号強度データ6の関数によって定義することができる。その関数(又はルックアップテーブル)は実験的な(物理的な)測定によって設計することができる。
−そのN推定は信号強度データ6及び/又は音声入力信号(LとR)の関数として定義することができる。その関数は発見的規則によって設計することができる。
−そのN推定は中央信号とサイド信号との信号タイプ・コヒーレンスを研究することに基づいて行うことができる。そのオリジナルの中央信号とサイド信号は、例えば、同様の音調対ノイズ比、又は、クレスト・ファクタ、又は、他のパワー包絡線特性を有すると想定される。こうした特徴の偏差は、高いレベルのNを示すように使用される。
本明細書で説明されるコンセプトは、PS技術を用いた如何なるエンコーダと連携して実施することができ、例えば、標準規格ISO/IEC 14496-3(High-Efficiency Advanced Audio Coding version 2)で定義されるHE-AAC v2(MPEG-4 Audio)エンコーダ、MPEGサラウンドに基づくエンコーダ、又は、MPEG USAC(United Speech and Audio coder)に基づくエンコーダ、さらにMPEG標準規格でカバーされていないエンコーダである。
以下では、例として、HE-AAC v2エンコーダが想定され;しかし、本コンセプトはPS技術を用いた如何なる音声エンコーダと連携して使用されてもよい。
HE-AACは不可逆のオーディオ圧縮方法である。HE-AACv1(HE-AACバージョン1)はスペクトル帯域複製(SBR)を利用し、そうして圧縮効率を向上する。HE−AACv2は更にパラメトリック・ステレオを含み、そうしてとても低いビットレートのステレオ信号の圧縮効率を向上する。HE−AACv2エンコーダは、本質的にPSエンコーダを含み、そうしてとても低いビットレートでの操作を可能にする。そうしたHE-AACv2エンコーダのPSエンコーダはオーディオ処理装置2のPSエンコーダ7として使用することができる。詳しくは、HE-AACv2エンコーダのPSエンコーダの内部のPSパラメータ推定ステージがオーディオ処理装置2のPSパラメータ推定ステージ3として使用することができる。また、HE-AACv2エンコーダのPSエンコーダの内部のダウンミックス・ステージが、装置2のダウンミックス・ステージ9として使用することもできる。
従って、本明細書で述べたコンセプトはHE−AACv2エンコーダと効率的に組み合わせることができ、そうして改善されたFMステレオ無線受信機が実現できる。そうした改善されたFMステレオ無線受信機は、HE-AACv2エンコーダがレコーディング目的で保存されるHE-AACv2ビットストリームを出力するので、HE-AACv2のレコーディング・フィーチャを有してもよい。これは図14に示される。この実施形態では、装置2はHE-AACv2エンコーダ16とPSデコーダ8とを含む。HE-AACv2エンコーダは、前の図面に関連して説明したように、モノラル・ダウンミックスDMとPSパラメータ5とを生成するために使用されるPSエンコーダ7を供給する。
任意的に、PSエンコーダ7はFM無線ノイズ低減の目的で固定のダウンミックス方法をサポートするよう修正されてもよく、例えば、DM=(L+R)/aに従ったダウンミックス方法である。
モノラル・ダウンミックスDMとPSパラメータ5はPSデコーダ8に供給されてもよく、そうして、上述のようにステレオ信号L’、R’を生成する。モノラル・ダウンミックスDMはモノラル・ダウンミックスDMの知覚的エンコーディングのためのHE-AACv1エンコーダに供給される。その結果の知覚的エンコードされたオーディオ信号とPS信号とは、HE-AACv2ビットストリーム18に多重化される。レコーディング目的のため、HE-AACv2ビットストリーム18は、フラッシュメモリやハードディスクのようなメモリの中に保存され得る。
HE-AACv1エンコーダ17はSBRエンコーダとAACエンコーダとを含む(不図示)。SBRエンコーダは典型的にはQMF(quadrature mirror filterbank)領域での信号処理を実行し、そして、QMFサンプルを必要とする。対照的に、AACエンコーダは典型的には時間領域サンプル(ファクタ2で典型的にはダウンサンプリングされる)を必要とする。
HE-AACv2エンコーダ16の内部のPSエンコーダ7は典型的には、QMF領域に既にあるダウンミックス信号DMを供給する。
PSエンコーダ7はQMF領域信号DMをHE-AACv1エンコーダを既に送信していてもよいので、SBR分析のためのHE-AACv1エンコーダにおけるQMF分析変形が廃止される。従って、通常はHE-AACv1エンコーダの一部であるQMF分析は、QMFサンプルとしてダウンミックス信号DMを供給することにより、回避することができる。これは計算コストを低減し、複雑さを省力化できる。
AACエンコーダに対する時間領域サンプルは、装置2の入力から導いてもよく、例えば、時間領域でサンプリング操作DM=(L+R)/2を実行することにより、及び、時間領域信号DMをダウンサンプリングすることにより導かれる。このアプローチは恐らくは最も安価なアプローチである。代替的には、装置2はQMF領域DMサンプルのハーフレートQMF合成を実行してもよい。
本明細書では、FM無線受信機のノイズを低減する方法及びシステムが説明された。PSパラメータは受信した中央及びサイド信号から決定され、そうして、その中央信号とそのPSパラメータとを用いて、ノイズ低減されたオーディオ信号を生成することができる。隠蔽技術が概説され、高い程度のノイズを含むサイド信号に対してもステレオ信号を供給する。このコンテキストでは、真のモノラル受信状況、対、ノイズサイド信号状況を確実に検出する方法が概説された。推定されたPSパラメータに与えるノイズの影響を低減するため、ノイズ推定と補償の方法が説明された。
本明細書で述べた方法及びシステムは、ソフトウェア、ファームウェア、及び/又は、ハードウェアとして実施されてもよい。或るコンポーネント群は例えばデジタル信号プロセッサ又はマイクロプロセッサ上でランするソフトウェアとして実施されてもよい。他のコンポーネント群は例えばハードウェア、及び/又は、特定用途向き集積回路として実施されてもよい。説明した方法及びシステムで現れる信号はランダムアクセスメモリや光学保存媒体といったメディアに保存されてもよい。そうした信号は無線ネットワーク、衛星ネットワーク、ワイヤレスネットワーク、又はワイヤラインネットワークのようなネットワーク、例えばインターネットを介して転送されてもよい。本明細書で述べた方法及びシステムを利用した典型的な装置は、ポータブル・エレクトロニック・デバイス、又は、他のコンシューマ装置であり、オーディオ信号を保存、及び/又は、レンダリングするものである。

Claims (27)

  1. 2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するシステムであって:
    −受信した2チャンネル音声信号の第1信号フレームに基づいて、第1パラメトリック・ステレオ・パラメータを決定するよう構成されるパラメトリック・ステレオ・パラメータ推定ステージと、
    −隠蔽検出ステージと、を含み、当該隠蔽検出ステージは、
    −前記第1信号フレーム内のサイド信号のエネルギーを決定し;前記サイド信号は前記2チャンネル音声信号から取得可能であり、前記エネルギーは高い閾値を上回り;
    −多数の後続の信号フレームの移行期間を決定し、その間に前記サイド信号は前記高い閾値の上から低い閾値の下へ落下し;
    −前記移行期間の連続信号フレームの数がフレーム閾値より低い場合、第1信号フレームに続く2チャンネル音声信号が強制的なモノラル信号であることを決定し、そして、
    −前記第1パラメトリック・ステレオ・パラメータに基づいて、前記パラメトリック・ステレオ・パラメータを決定する、
    システム。
  2. 前記受信した2チャンネル音声信号は中央信号及びサイド信号として表示できる、請求項1記載のシステム。
  3. 前記システムは:
    −アップミックス・ステージを更に含み、当該アップミックス・ステージは、補助音声信号と前記第1パラメトリック・ステレオ・パラメータとに基づいて、第1信号フレームに続く出力ステレオ信号のフレームを生成するよう構成され;前記補助音声信号は、前記第1信号フレームに続く前記受信した2チャンネル音声信号から得られる、
    請求項1又は2に記載のシステム。
  4. 前記隠蔽検出ステージは更に、
    −前記移行期間の連続する信号フレームの数が前記フレーム閾値と同じ、又は、大きい場合に、前記第1信号フレームに続く前記2チャンネル音声信号が真のモノラル信号であると決定するよう構成される、
    請求項1乃至3の何れか1つに記載のシステム。
  5. 前記隠蔽検出ステージは:
    −複数のシステムモードを特定する複数の状態であって;前記システムのモードが前記2チャンネル音声信号の現在のフレームがどのように処理されるかを決定し;及び、
    −前記複数の状態の間の移行条件を特定する複数の境界であって、それにより前記2チャンネル音声信号の現在のフレームへの直後のフレームがどのように処理されるかを決定する、
    請求項1乃至4の何れか1つに記載のシステム。
  6. 前記複数の状態はステレオ状態を含み;当該ステレオ状態では
    −前記パラメトリック・ステレオ・パラメータ推定ステージは、前記受信した2チャンネル音声信号の現在のフレームに基づいて、現在のパラメトリック・ステレオ・パラメータを決定するよう構成され;及び、
    −前記アップミックス・ステージは、前記補助音声信号と前記現在のパラメトリック・ステレオ・パラメータとに基づいて、前記出力ステレオ・パラメータの現在のフレームを生成するよう構成され;前記補助音声信号は前記受信した2チャンネル音声信号の前記現在のフレームから得られる、
    請求項5記載のシステム。
  7. 前記複数の状態は真のモノラル状態を含み;当該真のモノラル状態には
    −前記パラメトリック・ステレオ・パラメータ推定ステージは、前記受信した2チャンネル音声信号の現在のフレームに基づいて、現在のパラメトリック・ステレオ・パラメータを決定するよう構成され、及び、
    −前記アップミックス・ステージは、前記補助音声信号と前記現在のパラメトリック・ステレオ・パラメータとに基づいて、前記出力ステレオ信号の現在のフレームを生成するよう構成され;前記補助音声信号は前記受信した2チャンネル音声信号の前記現在のフレームから得られる、
    請求項6記載のシステム。
  8. 前記複数の状態は隠蔽状態を含み;当該隠蔽状態には
    −前記アップミックス・ステージを含み、当該アップミックス・ステージは、前記補助音声信号と保存されたパラメトリック・ステレオ・パラメータとに基づいて、前記出力ステレオ信号の現在のフレームを生成するよう構成され;前記補助音声信号は前記受信した2チャンネル音声信号の前記現在のフレームから得られ;さらに、前記保存されたパラメトリック・ステレオ・パラメータは、前記システムが前のステレオ状態にある間、前記パラメトリック・ステレオ・パラメータ推定ステージによって決定されている、
    請求項7記載のシステム。
  9. 前記保存されたパラメトリック・ステレオ・パラメータは複数のパラメトリック・ステレオ・パラメータから決定され、好ましくはローパス・フィルタ又は平均化により決定される、請求項8記載のシステム。
  10. 前記保存されたパラメトリック・ステレオ・パラメータは時間依存であり、時間の関数としてモノラルへ減衰する、請求項8乃至10の何れか1つに記載のシステム。
  11. 前記複数の境界は
    −前記連続するフレームのエネルギーが前記高い閾値より低く、且つ、前記低い閾値より高い場合、前記ステレオ状態から前記真のモノラル状態への移行と;
    −前記連続するフレームのエネルギーが前記低い閾値よりも低い場合、前記ステレオ状態から前記隠蔽状態への移行と;
    −前記連続するフレームのエネルギーが前記高い閾値より低く、且つ、前記低い閾値より高い場合、前記隠蔽状態から前記真のモノラル状態への移行と;
    −前記連続するフレームのエネルギーが前記高い閾値よりも高い場合、前記隠蔽状態から前記ステレオ状態への移行;及び/又は、
    −前記連続するフレームのエネルギーが前記高い閾値よりも高い場合、前記真のモノラル状態から前記ステレオ状態への移行、を含む、
    請求項8乃至10の何れか1つに記載のシステム。
  12. 前記真のモノラル状態から前記隠蔽状態への移行は、前記システムが前記真のモノラル状態にある現在のフレームに先行するフレームの数に依存する、請求項11記載のシステム。
  13. 前記真のモノラル状態から前記隠蔽状態への移行は、前記システムが前記真のモノラル状態にある現在のフレームに先行するフレームの数が前記フレーム閾値よりも低い場合にだけ生じる、請求項12記載のシステム。
  14. 前記フレーム閾値は1、2、3、又は4フレームである、請求項1乃至13のいずれか1つに記載のシステム。
  15. 前記隠蔽検出ステージは、さらに、
    −前記サイド信号の連続するフレームのスペクトル平坦性を決定し;そして、
    −前記複数の境界の少なくとも1つの移行状態での前記スペクトル平坦性を考慮する、
    請求項11乃至14の何れか1つに記載のシステム。
  16. 前記真のモノラル状態から前記ステレオ状態への移行は、前記連続するフレームの前記スペクトル平坦性に依存する、請求項15記載のシステム。
  17. 前記真のモノラル状態から前記ステレオ状態への移行は、前記スペクトル平坦性が平坦性閾値を下回るときのみ発生する、請求項16記載のシステム。
  18. −前記中央信号Mと前記サイド信号Sは左音声信号Lと右音声信号Rとに関係し、M=(L+R)/2かつS=(L−R)/2であり;
    −前記補助音声信号は(L+R)/aであり、aは実数である、
    請求項3乃至17の何れか1つに記載のシステム。
  19. 前記パラメトリック・ステレオ・パラメータは、チャンネル・レベル・ディフェレンスを示すパラメータ、及び/又は、インターチャンネル・クロスリファレンスを示すパラメータを含む、請求項1乃至18の何れか1つに記載のシステム。
  20. −前記システムは、受信したサイド信号のノイズパワーに対するノイズ・パラメータ特性を決定するよう構成されるノイズ推定ステージを更に含み;
    −前記パラメトリック・ステレオ・パラメータ推定ステージは、前記受信した2チャンネル音声信号とノイズ・パラメータに基づいて、前記パラメトリック・ステレオ・パラメータを決定するよう構成される、
    請求項1乃至19の何れか1つに記載のシステム。
  21. パラメトリック・ステレオをサポートする音声エンコーダを更に含み、前記音声エンコーダはパラメトリック・ステレオ・エンコーダを含み、前記パラメトリック・ステレオ・パラメータ推定ステージは前記パラメトリック・ステレオ・エンコーダの一部である、請求項1乃至20の何れか1つに記載のシステム。
  22. 中央信号とサイド信号とを含むFM無線信号を受信するよう構成され、請求項1乃至21の何れか1つに記載のシステムを含む、FMステレオ無線受信機。
  23. −中央信号とサイド信号とを含むFM無線信号を受信するよう構成される、FMステレオ受信機と;
    −請求項1乃至21の何れか1つに記載のシステムと、
    を含む、モバイル通信デバイス。
  24. 2チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定する方法であって;当該方法は:
    −受信した2チャンネル音声信号の第1フレームに基づいて、第1パラメトリック・ステレオ・パラメータを決定するステップと、
    −前記第1信号フレーム内のサイド信号のエネルギーを決定するステップであって;前記サイド信号は前記2チャンネル音声信号から得られ、前記エネルギーは高い閾値よりも大きい、ステップと;
    −次の連続する信号フレームの数を決定するステップであって、その間に前記サイド信号のエネルギーは高い閾値より高い値から低い閾値より低い値へ落下する、ステップと;
    −前記連続する信号フレームの数がフレーム閾値より小さい場合、前記第1信号フレームに続く2チャンネル音声信号は強制的なモノラル信号であることを決定するステップと;
    −前記第1パラメトリック・ステレオ・パラメータに基づいて、前記パラメトリック・ステレオ・パラメータを決定するステップと、
    を含む、方法。
  25. プロセッサ上で実行されるよう適応されたソフトフェア・プログラムであって、コンピュータ・デバイス上で実行されると、請求項24記載の方法を実行する、ソフトウェア・プログラム。
  26. プロセッサ上で実行されるよう適応されたソフトウェア・プログラムを含む記憶媒体であって、コンピュータ・デバイス上で実行されると、請求項24記載の方法を実行するソフトウェア・プログラムを含む、記憶媒体。
  27. コンピュータ上で実行されると、請求項24記載の方法を実行する実行可能な命令を含む、コンピュータ・プログラム製品。
JP2013525252A 2010-08-24 2011-08-16 Fmステレオ無線受信機の断続的モノラル受信の隠蔽 Active JP5581449B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US37656910P 2010-08-24 2010-08-24
US61/376,569 2010-08-24
PCT/EP2011/064084 WO2012025431A2 (en) 2010-08-24 2011-08-16 Concealment of intermittent mono reception of fm stereo radio receivers

Publications (2)

Publication Number Publication Date
JP2013541870A true JP2013541870A (ja) 2013-11-14
JP5581449B2 JP5581449B2 (ja) 2014-08-27

Family

ID=44584155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013525252A Active JP5581449B2 (ja) 2010-08-24 2011-08-16 Fmステレオ無線受信機の断続的モノラル受信の隠蔽

Country Status (8)

Country Link
US (1) US9237400B2 (ja)
EP (1) EP2609592B1 (ja)
JP (1) JP5581449B2 (ja)
CN (1) CN103098131B (ja)
AR (1) AR082522A1 (ja)
ES (1) ES2526320T3 (ja)
HK (1) HK1186280A1 (ja)
WO (1) WO2012025431A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019533189A (ja) * 2016-09-28 2019-11-14 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネルオーディオ信号処理方法、装置、およびシステム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
CN103718466B (zh) 2011-08-04 2016-08-17 杜比国际公司 通过使用参量立体声改善fm立体声无线电接收器
IN2014CN01270A (ja) 2011-09-29 2015-06-19 Dolby Int Ab
UA107771C2 (en) 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
WO2013179100A1 (en) * 2012-06-01 2013-12-05 Nokia Coporation Stereo audio output, associated apparatus and methods
CN104282309A (zh) 2013-07-05 2015-01-14 杜比实验室特许公司 丢包掩蔽装置和方法以及音频处理系统
RU2639952C2 (ru) * 2013-08-28 2017-12-25 Долби Лабораторис Лайсэнзин Корпорейшн Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
CN117037811A (zh) 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
US9756448B2 (en) * 2014-04-01 2017-09-05 Dolby International Ab Efficient coding of audio scenes comprising audio objects
US10224045B2 (en) 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
KR102629385B1 (ko) * 2018-01-25 2024-01-25 삼성전자주식회사 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN113194464B (zh) * 2021-04-26 2022-05-17 北京理工大学 一种基于频谱检测的物联网物理层隐蔽通信方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08331698A (ja) * 1995-05-30 1996-12-13 Sanyo Electric Co Ltd モノラル/ステレオ判別装置
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5068896A (en) * 1989-09-11 1991-11-26 Bose Corporation Audible noise reducing
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US6466912B1 (en) 1997-09-25 2002-10-15 At&T Corp. Perceptual coding of audio signals employing envelope uncertainty
DE69840020D1 (de) * 1998-04-29 2008-10-30 Sony Deutschland Gmbh Verfahren und Vorrichtung zum demultiplexieren eines frequenzdemodulierten Stereomultiplexsignals
AU2002309146A1 (en) 2002-06-14 2003-12-31 Nokia Corporation Enhanced error concealment for spatial audio
CN1669358A (zh) 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7406302B1 (en) 2003-12-15 2008-07-29 Marvell International, Inc. Digital FM stereo receiver architecture
US7835916B2 (en) 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
US7734473B2 (en) * 2004-01-28 2010-06-08 Koninklijke Philips Electronics N.V. Method and apparatus for time scaling of a signal
EP1792520A1 (en) * 2004-09-06 2007-06-06 Koninklijke Philips Electronics N.V. Audio signal enhancement
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
CN101518103B (zh) 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
DE602007010330D1 (de) * 2006-09-14 2010-12-16 Lg Electronics Inc Dialogerweiterungsverfahren
WO2008096313A1 (en) * 2007-02-06 2008-08-14 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
US8891778B2 (en) 2007-09-12 2014-11-18 Dolby Laboratories Licensing Corporation Speech enhancement
KR101450940B1 (ko) * 2007-09-19 2014-10-15 텔레폰악티에볼라겟엘엠에릭슨(펍) 멀티채널 오디오의 조인트 인핸스먼트
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8023918B2 (en) 2008-02-13 2011-09-20 Silicon Laboratories, Inc. Methods and systems for stereo noise mitigation
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8867752B2 (en) * 2008-07-30 2014-10-21 Orange Reconstruction of multi-channel audio data
US8793749B2 (en) * 2008-08-25 2014-07-29 Broadcom Corporation Source frame adaptation and matching optimally to suit a recipient video device
CA2754671C (en) * 2009-03-17 2017-01-10 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011123859A1 (en) * 2010-04-02 2011-10-06 Skyfire Labs, Inc. Assisted hybrid mobile browser
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
IN2014CN01270A (ja) * 2011-09-29 2015-06-19 Dolby Int Ab
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
WO2013142650A1 (en) * 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
CN104303229B (zh) * 2012-05-18 2017-09-12 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
CN104380376B (zh) * 2012-06-14 2017-03-15 杜比国际公司 解码系统、重构方法和设备、编码系统、方法和设备及音频发布系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08331698A (ja) * 1995-05-30 1996-12-13 Sanyo Electric Co Ltd モノラル/ステレオ判別装置
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019533189A (ja) * 2016-09-28 2019-11-14 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネルオーディオ信号処理方法、装置、およびシステム
US10984807B2 (en) 2016-09-28 2021-04-20 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system
US11922954B2 (en) 2016-09-28 2024-03-05 Huawei Technologies Co., Ltd. Multichannel audio signal processing method, apparatus, and system

Also Published As

Publication number Publication date
JP5581449B2 (ja) 2014-08-27
EP2609592B1 (en) 2014-11-05
ES2526320T3 (es) 2015-01-09
HK1186280A1 (en) 2014-03-07
CN103098131B (zh) 2015-03-11
US9237400B2 (en) 2016-01-12
WO2012025431A2 (en) 2012-03-01
CN103098131A (zh) 2013-05-08
US20130142340A1 (en) 2013-06-06
EP2609592A2 (en) 2013-07-03
WO2012025431A3 (en) 2012-04-19
AR082522A1 (es) 2012-12-12

Similar Documents

Publication Publication Date Title
JP5581449B2 (ja) Fmステレオ無線受信機の断続的モノラル受信の隠蔽
JP5617039B2 (ja) Fm無線ノイズの擬似無相関の低減
RU2584009C2 (ru) Обнаружение высокого качества в стереофонических радиосигналах с частотной модуляцией
US9877132B2 (en) Audio signal of an FM stereo radio receiver by using parametric stereo
US9191045B2 (en) Prediction-based FM stereo radio noise reduction
TW201532035A (zh) 預測式fm立體聲無線電雜訊降低
TWM527596U (zh) 用於預測式fm立體聲無線電雜訊降低的設備

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140714

R150 Certificate of patent or registration of utility model

Ref document number: 5581449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250