JP2013541870A

JP2013541870A - Ｆｍステレオ無線受信機の断続的モノラル受信の隠蔽

Info

Publication number: JP2013541870A
Application number: JP2013525252A
Authority: JP
Inventors: セルストロム，レイフ; プルンハーゲン，ヘイコ; エングデガルド，ヨナス
Original assignee: ドルビー・インターナショナル・アーベー
Priority date: 2010-08-24
Filing date: 2011-08-16
Publication date: 2013-11-14
Anticipated expiration: 2031-08-16
Also published as: JP5581449B2; EP2609592B1; ES2526320T3; HK1186280A1; CN103098131B; US9237400B2; WO2012025431A2; CN103098131A; US20130142340A1; EP2609592A2; WO2012025431A3; AR082522A1

Abstract

本発明は音声信号処理に関する。詳しくは、FMステレオ無線受信機の断続的なモノラルの受信を確実に隠蔽する方法とシステムに関する。本システムは、パラメトリック・ステレオ・パラメータ推定ステージを含み、受信された２チャンネル音声信号の第１フレームに基づいて、第１パラメトリック・ステレオ・パラメータを決定する。本システムは、隠蔽検出ステージを更に含み、第１信号フレーム内のサイド信号のエネルギーを決定し；次の連続する信号フレームの数を決定し、その間にサイド信号のエネルギーが高閾値の上の値から低閾値の下の値へ低下し；連続する信号フレームの数がフレーム閾値より下である場合、第１信号フレームに続く２チャンネル音声信号が強制的モノラル信号であることを決定し；そして、第１パラメトリック・ステレオ・パラメータに基づいてパラメトリック・ステレオ・パラメータを決定する。

Description

本出願は２０１０年８月２４日に出願された米国特許仮出願第６１／３７６，５６９への優先権を主張し、参照することにより全体として本出願に組み込まれる。

本出願は音声（オーディオ）信号処理に関連し、詳しくはＦＭステレオ無線受信機の音声信号を改善するシステム及び対応する方法に関連する。詳しくは、本明細書はFMステレオ無線受信機の断続的なモノラル受信を確実に隠すための方法と装置に関連する。

アナログＦＭ（周波数変調）ステレオ無線システムでは、音声信号の左チャンネル（Ｌ）と右チャンネル（Ｒ）とは中央・サイド（Ｍ／Ｓ）表現で伝達され、即ち、中央・チャンネル（Ｍ）とサイド・チャンネル（Ｓ）として伝達される。中央・チャンネルＭはＬとＲとの信号の和、例えば、Ｍ＝（Ｌ＋Ｒ）／２に対応し、そして、サイド・チャンネルＳはＬとＲの信号の差分、例えば、Ｓ＝（Ｌ−Ｒ）／２に対応する。送信のため、サイド・チャンネルＳは３８ｋＨｚの抑圧搬送波に変調され、ベースバンド・中央信号Ｍに加えられ、下位互換のステレオ多重信号を形成する。そして、この多重信号はＦＭ送信機のＨＦ（高周波）搬送波を変調するのに使用され、典型的には８７．５乃至１０８ＭＨｚの範囲で動作する。

受信品質が低下すると（即ち、無線チャンネルに対するＳＮ比が低下する）、典型的にはＳチャンネルはＭチャンネルよりも被害が大きい。多くのＦＭ受信機の実施では、受信条件が極めてノイズが多くなるとＳチャンネルはミュートされる。これは、不良なＨＦ無線信号の場合には受信機がステレオからモノラルへ後退することを意味する。

中央信号Ｍが許容できる品質の場合でも、サイド信号Ｓはノイズが多いことがあり、それ故、出力信号の左右のチャンネル（例えば、Ｌ＝Ｍ＋ＳとＲ＝Ｍ−Ｓに従って導出される）に混合されると全般の音声品質を大幅に低下することがある。サイド信号Ｓが不良乃至中間品質であるとき、２つの選択肢が存在する：受信機がサイド信号Ｓに関連するノイズを受信することを選択して、ノイズの多い左右信号を有する実際のステレオ信号を出力するか、又は、受信機がサイド信号Ｓをドロップして、モノラルに後退するか、である。

パラメトリック・ステレオ（ＰＳ）符号化はとても低いビットレート音声符号化の分野の技術である。ＰＳは２チャンネルのステレオ音声信号を、追加的なＰＳサイド情報、即ち、ＰＳパラメータと組み合わせて、モノラルのダウンミックス信号として符号化することを可能にする。そのモノラルのダウンミックス信号はステレオ信号の両チャンネルの組合せとして得られる。ＰＳパラメータはＰＳデコーダが、モノラルのダウンミックス信号とＰＳサイド情報とから、ステレオ信号を再構成することを可能にする。典型的には、ＰＳパラメータは時間と周波数の変数であり、ＰＳデコーダにおけるＰＳ処理は典型的にはＱＭＦバンクを含むハイブリッド・フィルターバンク領域において実行される。文献”ＬｏｗＣｏｍｐｌｅｘｉｔｙＰａｒａｍｅｔｒｉｃＳｔｅｒｅｏＣｏｄｉｎｇｉｎＭＰＥＧ−４”，ＨｅｉｋｏＰｕｒｎｈａｇｅｎ，Ｐｒｏｃ．ＤｉｇｉｔａｌＡｕｄｉｏＥｆｆｅｃｔｓＷｏｒｋｓｈｏｐ（ＤＡＦｘ），ｐｐ１６３−１６８，Ｎａｐｌｅｓ，ＩＴ，Ｏｃｔ．２００４は、ＭＰＥＧ４の例示的なＰＳ符号化システムを説明している。そのパラメトリック・ステレオの議論は本明細書に参照して組み込まれる。パラメトリック・ステレオは例えばＭＰＥＧ−４Ａｕｄｉｏによってサポートされる。パラメトリック・ステレオはＭＰＥＧ−４標準規格文書ＩＳＯ／ＩＥＣ１４４９６−３：２００５（ＭＰＥＧ−４Ａｕｄｉｏ，３ｒｄｅｄｉｔｉｏｎ）の８．６．４節とアネックス８．Ａと８．Ｃで議論されている。その標準規格文書のこれらの部分は本願明細書において参照して組み込まれる。パラメトリック・ステレオはＭＰＥＧＳｕｒｒｏｕｎｄ規格においても使用される（文献ＩＳＯ／ＩＥＣ２３００３−１：２００７、ＭＰＥＧＳｕｒｒｏｕｎｄを参照）。この文献も本願明細書において参照して組み込まれる。パラメトリック・ステレオ符号化システムの更なる例は，文献“ＢｉｎａｕｒａｌＣｕｅＣｏｄｉｎｇ−ＰａｒｔＩ：ＰｓｙｃｈｏａｃｏｕｓｔｉｃＦｕｎｄａｍｅｎｔａｌｓａｎｄＤｅｓｉｇｎＰｒｉｎｃｉｐｌｅｓ”，ＦｒａｎｋＢａｕｍｇａｒｔｅａｎｄＣｈｒｉｓｔｏｆＦａｌｌｅｒ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｐｅｅｃｈａｎｄＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ，ｖｏｌ１１，ｎｏ６，ｐａｇｅｓ５０９−５１９，Ｎｏｖｅｍｂｅｒ２００３，及び、文献“ＢｉｎａｕｒａｌＣｕｅＣｏｄｉｎｇ−ＰａｒｔＩＩ：ＳｃｈｅｍｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ”，ＣｈｒｉｓｔｏｆＦａｌｌｅｒａｎｄＦｒａｎｋＢａｕｍｇａｒｔｅ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｐｅｅｃｈａｎｄＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ，ｖｏｌ１１，ｎｏ６，ｐａｇｅｓ５２０−５３１，Ｎｏｖｅｍｂｅｒ２００３において議論されている。２つの文献の後者には、用語“ｂｉｎａｕｒａｌｃｕｅｃｏｄｉｎｇ”が使用され、それはパラメトリック・ステレオ符号化の一例である。

本願明細書では、ＰＳパラメータを使用したステレオ信号の生成に基づく方法及びシステムが説明される。ＰＳパラメータは不良品質のサイド信号が受信されるときにも低ノイズ信号を生成するのに使用される。さらに、エラー隠蔽方法が説明され、その方法は、前に推定されたPSパラメータを保持することにより、モノラルへの中間的なフォールバックを隠蔽するよう用いられてもよい。

本願発明の課題は、ＰＳパラメータを使用したステレオ信号の生成に基づく方法及びシステムを提供することである。

一側面によれば、出力ステレオ信号を生成し、及び／又は、２チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するよう構成されるシステムが説明される。その２チャンネル音声信号はＦＭステレオ無線受信機で受信されてもよく、その受信機は例えばワイヤレス通信装置の部分である。その受信された２チャンネル音声信号は中央信号とサイド信号として呈示されてもよい。すなわち、その２チャンネル音声信号は中央信号とサイド信号とを含むか、又は、中央信号とサイド信号として呈示できる信号を含んでもよい。その中央信号とサイド信号とはその左信号と右信号とから導いてもよい。更に換言すれば、その中央信号及び／又はそのサイド信号は、２チャンネル音声信号から得ることができてもよい。そうして、その２チャンネル音声信号は情報を含み、その情報から中央信号とサイド信号とを導くことができる。一実施形態では、中央信号Ｍとサイド信号Ｓとは、Ｍ＝（Ｌ＋Ｒ）／２及びＳ＝（Ｌ−Ｒ）／２として、左音声信号Ｌと右音声信号Ｒとに関連する。出力ステレオ信号は典型的には左信号と右信号とを表せる。代替的に、その出力ステレオ信号は２チャンネル出力信号として言及されてもよい。この２チャンネル出力信号はモノラルの音声信号又はステレオの音声信号を搬送してもよい。詳しくは、２チャンネル出力信号の左信号が２チャンネル出力信号の右信号に対応する場合、その２チャンネル出力信号は通常はモノラル音声信号を搬送する。

本システムは、受信した２チャンネル音声信号の第一のフレームに基づいて、第一のパラメトリック・ステレオ・パラメータ（又は、少なくとも１つの第一のパラメトリック・ステレオ・パラメータ）を決定するよう構成されるパラメトリック・ステレオ・パラメータ推定ステージを含んでもよい。換言すれば、受信した２チャンネル・音声信号の抜粋は、第一のパラメトリック・ステレオ・パラメータ、例えばチャンネル・レベル・ディフェレンスを示すパラメータ、及び／又は、インターチャンネル相互相関を示すパラメータを決定するよう使用されてもよい。その抜粋は、信号フレームとして言及されてもよい。そのパラメトリック・ステレオ・パラメータ推定ステージは、新しいパラメトリック・ステレオ・パラメータ（又は、少なくとも１つの新しいパラメトリック・ステレオ・パラメータ）を前記受信した２チャンネル音声信号の夫々の連続するフレームに対して決定するよう構成されてもよい。

本システムは、隠蔽検出ステージを含んでもよく、そのステージは第一の信号フレーム内のサイド信号のエネルギーを決定するよう構成される。信号フレーム内のサイド信号のエネルギーは、その信号フレーム内のサイド信号のサンプルのｒｍｓ値に基づいて決定されてもよい。その隠蔽検出ステージは、第一の信号フレーム内のサイド信号のエネルギーが高い閾値を上回ることを決定するよう構成されてもよい。

その隠蔽検出ステージは多数の次の連続する信号フレームを決定するよう構成されてもよく、その間、サイド信号（Es）のエネルギーは高い閾値を上回る値から、低い閾値を下回る値へ低下する。次の連続する信号フレームの数は、高エネルギーサイド信号（Es＞高い閾値）から低エネルギーサイド信号（Es＜低い閾値）までの移行期間として言及されてもよい。換言すれば、隠蔽検出ステージは、第一の信号フレームに直接続く或る数の信号フレームのサイド信号のエネルギーが高い閾値よりも低く、最終的には低い閾値を下回って低下することを決定するよう構成される。詳しくは、その隠蔽検出ステージは正確な数の信号フレームを決定するよう構成され、その間、エネルギーは高い閾値を上回るエネルギーから低い閾値を下回るエネルギーへ低下する。更に詳しくは、その隠蔽検出ステージは、連続する信号フレームの数、即ち、移行期間がフレーム閾値を下回る場合、第一の信号フレームに続く２チャンネル音声信号が劣化したステレオ信号であるか、又は、不自然なモノラル信号であることを決定するよう構成されてもよい。一実施形態では、そのフレーム閾値は１つ以上の信号フレーム、例えば１，２，３又は４つの信号フレームの何れかであってもよい。

その隠蔽検出ステージは、第一のパラメトリック・ステレオ・パラメータに基づいて、具体的には不自然なモノラル信号が検出された場合、パラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。そのパラメトリック・ステレオ・パラメータは２チャンネル音声信号の処理のために使用されてもよい。詳しくは、そのパラメトリック・ステレオ・パラメータは、２チャンネル音声信号の第一の信号フレームに続く２チャンネル音声信号のフレームを処理するために使用されてもよい。

本システムは、補助音声信号に基づいて、及び、第一のパラメトリック・ステレオ・パラメータに基づいて、第一の信号フレームに続く出力ステレオ信号のフレームを生成するよう構成される。換言すれば、第一の信号フレームに続いて受信した２チャンネル音声信号が不自然なモノラル信号であると決定される場合、例えば、サイド信号がとても小さいステレオ信号や、僅かなエネルギーしか有しない場合、出力ステレオ信号の連続フレームは第一のパラメトリック・ステレオ・パラメータから決定され、即ち、劣化していない受信２チャンネル音声信号のフレームに基づいて決定された第一のパラメトリック・ステレオ・パラメータから決定される。他方、補助音声信号は、第一の信号フレームに続く受信２チャンネル音声信号から得られ、例えば、補助音声信号は出力ステレオ信号のフレームに対応する受信２チャンネル音声信号のフレームから決定されてもよい。一実施形態では、補助音声信号は（Ｌ＋Ｒ）／ａとして決定され、ａは実数であり、例えば２である。即ち、補助音声信号は受信２チャンネル音声信号内に含まれる中央信号に対応してもよい。

その隠蔽検出ステージは、連続する信号フレームの数がフレーム閾値以上である場合、第一の信号フレームに続く２チャンネル音声信号が真の（オーセンティックな）モノラル信号であることを決定するよう更に構成されてもよい。そうして、その隠蔽検出ステージは、信号フレームの数を決定することにより、ステレオ信号から真のモノラル信号（例えばスピーチ信号）への移行を検出するよう構成されてもよく、サイド信号のエネルギーをとって、高い閾値の上から低い閾値の下へ落ちる。

その隠蔽検出ステージは状態機械として構成されてもよい。詳しくは、その隠蔽検出ステージは、全体のシステムの複数のモードを特定する複数の状態を含んでもよい。そのシステムのモードは、典型的には、受信２チャンネル音声信号の現在のフレームがどのように処理されるのかを決定する。詳しくは、アップミックス・ステージの処理は、本システムの現在の状態に依存してもよい。その隠蔽検出ステージは、複数の境界（エッジ）も含んでもよく、その境界は複数の状態間の移行状態を特定する。このようにして、２つの状態間の境界は、現在の状態から次の状態へ渡るように本システムに対して満たされるべき条件を特定してもよい。その条件は１つ以上の条件を含んでもよく、例えば、サイド信号の連続フレームのエネルギーに関する条件、時間の制約、フレーム数の制約等々である。状態間の移行条件を特定することによって、或る境界は、２チャンネル音声信号の現在のフレームの直後のフレームがどのように処理されるかを決定してもよい。

複数の状態はステレオ状態を含んでもよく、即ち、或る状態の間、本システムは２チャンネル音声信号を非劣化ステレオ信号として処理する。本システムがステレオ状態である場合、パラメトリック・ステレオ・パラメータ推定ステージは、受信２チャンネル音声信号の現在のフレームに基づいて現在のパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。アップミックス・ステージは補助音声信号と現在のパラメトリック・ステレオ・パラメータとに基づいて出力ステレオ信号の現在のフレームを生成するよう構成されてもよい。補助音声信号は受信２チャンネル音声信号の現在のフレームから得られてもよい。詳しくは、補助音声信号は受信２チャンネル音声信号の内部に含まれる中央信号の現在のフレームから得られてもよい。代替的に、又は、追加的に、本システムは、アップミックス・ステージをバイパスし、２チャンネル音声信号から出力ステレオ信号を直接に決定してもよいことに留意すべきである。詳しくは、出力ステレオ信号のフレームが受信２チャンネル音声信号のフレームから直接決定されてもよく、例えばコピーされてもよい。

複数の状態には真のモノラル状態を含んでもよく、即ち、或る状態の間、本システムは受信２チャンネル音声信号を真のモノラル信号として、例えばスピーチ信号のように処理する。本システムが真のモノラル状態にある場合、パラメトリック・ステレオ・パラメータ推定ステージは受信２チャンネル音声信号の現在のフレームに基づいて現在のパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。アップミックス・ステージは、補助音声信号と現在のパラメトリック・ステレオ・パラメータとに基づいて出力ステレオ信号の現在のフレームを生成するよう構成されてもよい。音声補助信号は、受信２チャンネル音声信号の現在のフレームから得られてもよい。ステレオ状態と同様の方法で、本システムは真のモノラル動作の間バイパスモードで動作してもよい。

複数の状態には隠蔽状態を含んでもよく、即ち、或る状態の間、本システムは不自然な（強制的な）モノラル信号を隠す。本システムが隠蔽状態にある場合、アップミックス・ステージは補助音声信号と保存されたパラメトリック・ステレオ・パラメータとに基づいて、出力ステレオ信号の現在のフレームを生成するよう構成されてもよい。このようにして、アップミックス・ステージは以前に決定されたパラメトリック・ステレオ・パラメータに基づいて出力ステレオ信号を決定し、それによって、現在受信されたサイド信号フレームの内部に含まれるモノラル信号を隠すように構成されてもよい。他の状態と同様の方法で、補助音声信号は受信２チャンネル音声信号の現在のフレームから得られてもよい。他方、保存されたパラメトリック・ステレオ・パラメータは、本システムが前回のステレオ状態にある間に、パラメトリック・ステレオ・パラメータ推定ステージによって決定されていてもよい。一実施形態では、保存されたパラメトリック・ステレオ・パラメータは複数のパラメトリック・ステレオ・パラメータから、好ましくは平滑化又は平均化により導かれる。隠蔽状態に到達する前に異なる信号フレームに対して決定されたパラメトリック・ステレオ・パラメータを考慮することにより、本システムは隠蔽状態の間に不適切なパラメトリック・ステレオ・パラメータを使用しないことが確保されてもよい。さらに、保存されたパラメトリック・ステレオ・パラメータは時間依存でもよい。詳しくは、保存されたパラメトリック・ステレオ・パラメータは時間関数でモノラルに減衰してもよい。換言すれば、保存されたパラメトリック・ステレオ・パラメータはモノラル音声信号を生成するよう適応されるパラメトリック・ステレオ・パラメータへ移行してもよい。そうした移行のための時間インターバルは可変でもよい。

複数の境界には１つ以上の次の境界を含んでもよい：次のフレームのエネルギーが高い閾値を下回り、且つ、低い閾値を上回る場合には、ステレオ状態から真のモノラル状態への移行；次のフレームのエネルギーが低い閾値を下回る場合には、ステレオ状態から隠蔽状態への移行；次のフレームのエネルギーが高い閾値を下回り、且つ、低い閾値を上回る場合には、隠蔽状態から真のモノラル状態への移行；次のフレームのエネルギーが高い閾値を上回る場合には、隠蔽状態からステレオ状態への移行；及び／又は、次のフレームのエネルギーが高い閾値を上回る場合には、真のモノラル状態からステレオ状態への移行。一実施形態では、真のモノラル状態から隠蔽状態への移行は、更に、本システムが真のモノラル状態にある現在のフレームに先行するフレームの数に依存する。代替的に、又は、追加的に、真のモノラル状態から隠蔽状態への移行は、本システムが真のモノラル状態にある現在のフレームに先行するフレームの数がフレーム閾値を下回る場合にだけ生じてもよい。

隠蔽検出状態は、サイド信号の次のフレームのスペクトル平坦性を決定するよう構成されてもよい。スペクトル平坦性は、サイド信号のフレームのパワースペクトルに基づいて決定されてもよい。パワースペクトルは、複数の周波数帯域の夫々に関連する複数のエネルギー値を含んでもよい。スペクトル平坦性は、複数のエネルギー値の幾何平均と複数のエネルギー値の算術平均と間の比率として決定されてもよい。このようにして、０に近いスペクトル平坦性は集中したパワースペクトルを示し、１に近いスペクトル平坦性は平坦なパワースペクトル、即ち、ノイズの多い信号のパワースペクトルを示す。隠蔽検出ステージは、複数の境界のうち少なくとも１つの移行条件のスペクトル平坦性を考慮するよう構成されてもよい。即ち、隠蔽ステージの境界の移行条件は、サイド信号の次のフレームがノイズの高い程度を有するか否かを考慮してもよい。詳しくは、真のモノラル状態からステレオ状態への移行は次のフレームのスペクトル平坦性に依存してもよい。より詳しくは、真のモノラル状態からステレオ状態への移行は、スペクトル平坦性が平坦性閾値を下回る場合にだけ生じてもよい。このようにして、ノイズバーストによって発生する真のモノラル状態からステレオ状態への間違った移行を回避することができる。これは、真のモノラル信号の不所望の隠蔽に繋がることのある真のモノラル状態から隠蔽状態（ステレオ状態を介して）への移行をも回避する。

本システムはノイズ推定ステージを含んでもよい。ノイズ推定ステージは、受信サイド信号のノイズパワーに対するノイズパラメータ特性を決定するよう構成されてもよい。さらに、パラメトリック・ステレオ・パラメータ推定ステージは、受信２チャンネル音声信号とノイズパラメータとに基づいて、パラメトリック・ステレオ・パラメータ、即ち、第一の、又は現在のパラメトリック・ステレオ・パラメータを決定するよう構成されてもよい。

本システムはパラメトリック・ステレオをサポートする音声エンコーダを更に含んでもよい。音声エンコーダはパラメトリック・ステレオ・エンコーダを含んでもよく、パラメトリック・ステレオ・パラメータ推定ステージはパラメトリック・ステレオ・エンコーダの部分である。

別の側面によれば、FMステレオ無線受信機が説明される。FMステレオ無線受信機は、中央信号とサイド信号を含むか、又は、それらを表すFM無線信号を受信するよう構成されてもよい。さらに、FMステレオ無線受信機は本明細書で概説する如何なる１つ以上の特徴や機能を有するシステムを含んでもよい。

別の側面によれば、モバイル通信デバイス、例えば携帯電話やスマートフォンが説明される。モバイル通信デバイスはFMステレオ受信機を含み、中央信号とサイド信号とを含むか、又は、それらを表すFM無線信号を受信するよう構成される。さらに、モバイル通信デバイスは本明細書で概説する如何なる１つ以上の特徴や機能に従ったシステムを含んでもよい。

別の側面によれば、出力ステレオ信号（又は、２チャンネル出力信号）の生成方法、及び／又は、受信した２チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定する方法が説明される。受信した２チャンネル音声信号は中央信号とサイド信号とを含んでもよく、又は、表されてもよい。本方法は、受信した２チャンネル音声信号の第一のフレームに基づいて第一のパラメトリック・ステレオ・パラメータを決定するステップを含んでもよい。本方法は、続いて、第一の信号フレーム内のサイド信号のエネルギーを決定し、そして、第一の信号フレーム内のサイド信号のエネルギーが高い閾値を上回ることを決定する。さらに、本方法は、多数の次の連続信号フレームを決定するステップを含み、例えば、第一の信号フレームに直接続く信号フレームであり、その間、サイド信号のエネルギーは高い閾値を上回る値から低い閾値を下回る値へ低下する。詳しくは、本方法はフレームの数を決定してもよく、その間、サイド信号のエネルギーは高い閾値を上回る値から低い閾値を下回る値へ低下する。従って、本方法は、連続する信号フレームの数がフレーム閾値を下回る場合に、第一の信号フレームに続く２チャンネル音声信号が劣化ステレオ信号であるか、又は、不自然なモノラル信号であると決定するステップに続く。この場合には、即ち、第一の信号フレームに続く２チャンネル音声信号が不自然なモノラル信号である場合は、本方法は、第一のパラメトリック・ステレオ・パラメータに基づいてパラメトリック・ステレオ・パラメータを決定するステップを含んでもよい。代替的に、又は、追加的に、本方法は、補助音声信号に基づいて、及び、第一のパラメトリック・ステレオ・パラメータに基づいて第一の信号フレームに続く出力ステレオ信号のフレームを生成するステップを含んでもよく、その補助音声信号は第一の信号フレームに続いて受信された２チャンネル音声信号から得られる。

別の側面によれば、ソフトウェア・プログラムが説明される。ソフトウェア・プログラムはプロセッサ上での実行のために適応されてもよく、コンピュータ・デバイス上で実行されるとき、本明細書で概説する方法ステップ群を実行する。

別の側面によれば、記憶媒体が説明される。記憶媒体はプロセッサ上での実行のために適応されるソフトウェア・プログラムを含んでもよく、コンピュータ・デバイス上で実行されるとき、本明細書で概説する方法ステップ群を実行する。

別の側面によれば、コンピュータ・プログラム製品が説明される。コンピュータ・プログラムは、実行可能な命令を含んでもよく、コンピュータ・デバイス上で実行されるとき、本明細書で概説する方法ステップ群を実行する。

本特許出願において概説する好ましい実施形態群を含む方法及びシステムは、スタンドアロンで使用されても、又は、本明細書で開示する他の方法及びシステムと組み合わせても使用されてもよい。さらに、本特許出願で概説される方法及びシステムの全ての側面は任意に組み合わされてもよい。特に、請求項の特徴は任意的に相互に組み合わされてもよい。

本発明は添付の図面を参照して例示的な例を用いて以下で説明される。
図１はＦＭステレオ無線受信機のステレオ出力を改善する概略的な実施形態を例示する。図２はパラメトリック・ステレオのコンセプトに基づいた音声処理装置の一実施形態を例示する。図３はＰＳエンコーダとＰＳデコーダとを有するＰＳベースの音声処理装置に係る他の実施形態を例示する。図４は図３の音声処理装置の拡張版を例示する。図５は図４のＰＳエンコーダとＰＳデコーダの一実施形態を例示する。図６はＦＭ受信機のモノラルだけの出力の場合の疑似ステレオ生成用の音声処理装置の他の実施形態を例示する。図７はＦＭ受信機の出力端でのステレオ再生における短いドロップアウトの発生を例示する。図８は例示的な状態機械であり、モノラル・ドロップアウトとモノラル・エラー隠蔽を実行するために用いられる。図９はモノラル・ドロップアウトを有する信号のエラー隠蔽を例示する。図１０は音声信号の例に対するパワースペクトルを示す。図１１はエラー隠蔽を用いたPSパラメータ推定ステージの例を示す。図１２は、“モノラル”検出ステージ、又は、隠蔽検出ステージの例を示す。図１３は、エラー補償による高度なPSパラメータ推定の例を示す。図１４はＨＥ−ＡＡＣｖ２エンコーダに基づく音声処理装置の別の実施形態を示す。

図１はＦＭステレオ無線受信機１のステレオ出力を改善する単純化された概略的な実施形態を示す。背景技術の章で説明したように、ＦＭ無線ではステレオ信号は意図的に中央信号とサイド信号として送信される。ＦＭ受信機１では、サイド信号はＦＭ受信機１の出力端で左チャンネルＬと右チャンネルＲの間のステレオ差分を生成するよう使用される（少なくとも受信が充分に良好でかつそのサイド信号情報がミュートされていない場合）。左と右のチャンネルＬ，Ｒはデジタル又はアナログ信号でもよい。ＦＭ受信機の音声信号Ｌ，Ｒを改善するため、音声信号装置２が使用されてその出力端でステレオ音声信号Ｌ´とＲ´とを生成する。その音声処理装置２は、パラメトリック・ステレオを用いて、受信されたＦＭ無線信号のノイズ低減を実行することを可能にするシステムに対応する。その装置２内の音声処理は好ましくはデジタル領域で実行され；従って、ＦＭ受信機１と音声処理装置２との間のアナログ・インターフェースの場合は、アナログ・デジタルのコンバータが装置２内のデジタル音声処理の前に使用される。ＦＭ受信機１と音声処理装置２とは同じ半導体チップ上に統合されてもよいし、又は、２つの半導体チップの部分であってもよい。ＦＭ受信機１と音声処理装置２とは、携帯電話やＰＤＡやスマートフォンのようなワイヤレス通信装置の部分であってもよい。この場合、ＦＭ受信機１は追加的なＦＭ無線受信機能を有するベースバンド・チップの部分でもよい。

ＦＭ受信機１の出力端および装置２の入力端で左／右表示を使用する代わりに、中央／サイド表示がＦＭ受信機１と装置２との間のインターフェースに使用されてもよい（図１の中央／サイド表示に対するＭ，Ｓ、及び左／右表示に対するＬ，Ｒを参照）。ＦＭ受信機１と装置２との間のインターフェースでのそうした中央／サイド表示は、ＦＭ受信機１が既に中央／サイド信号を受信して音声処理装置２がその中央／サイド信号をダウンミックスせずに直接処理してもよいので、より少ない労力をもたらしてもよい。中央／サイド表示は、ＦＭ受信機１が音声処理装置２にしっかりと統合している場合、詳しくは、ＦＭ受信機１と音声処理装置２とが同じ半導体チップ上に統合されている場合に、有利であってもよい。

任意的には、無線受信状態を表す信号強度信号６が使用されてもよく、音声処理装置２内の音声処理を適応する。これは本明細書で後に説明されるだろう。

ＦＭ無線受信機１と音声処理装置２との組合せは統合ノイズ低減システムを有するＦＭ無線受信機に対応する。

図２はパラメトリック・ステレオのコンセプトに基づく音声処理装置２の一実施形態を示す。装置２はＰＳパラメータ推定ステージ３を含む。パラメータ推定ステージ３は改善されるべき入力音声信号（左／右又は中央／サイドの表示であってもよい）に基づいてＰＳパラメータ５を決定するよう構成される。ＰＳパラメータ５は特にインターチャンネル強度差（ＩＩＤ、又は、ＣＬＤ−チャンネル・レベル・ディフェレンスとも呼ばれる）を表すパラメータ、及び／又は、インターチャンネル・コレクション（ＩＣＣ）を表すパラメータを含んでもよい。好ましくは、ＰＳパラメータ５は時間及び周波数変数である。パラメータ推定ステージ３の入力でのＭ／Ｓ表示の場合、そのパラメータ推定ステージ３はそれにもかかわらずＬ／Ｒチャンネルに関連するＰＳパラメータ５を決定してもよい。

音声信号ＤＭが入力信号から得られる。その入力音声信号が中央／サイド表示を既に使用している場合、音声信号ＤＭは中央信号に直接的に対応してもよい。入力信号が左／右表示を有する場合、その音声信号は音声信号をダウンミックすることにより生成される。好ましくは、ダウンミックス後の結果の信号ＤＭは中央信号Ｍに対応し、以下の式により生成されてもよい：

即ち、ダウンミックス信号ＤＭはＬとＲの信号の平均に対応してもよい。ａの様々な値に対して、ＬとＲの信号の平均は単純化されるか、又は、減衰する。

本装置はステレオ・ミクシング・モジュール又はステレオ・アップミクサーとも言われるアップミックス・ステージ４を更に含む。アップミックス・ステージ４は音声信号ＤＭとＰＳパラメータ５に基づいてステレオ信号Ｌ´、Ｒ´を生成するよう構成される。好ましくは、アップミックス・ステージ４はＤＭ信号だけでなく、サイド信号又は幾つかの種類の疑似サイド信号（不図示）も使用する。これは、図４と５のより広範な実施形態に関連して本明細書で後に説明されるだろう。

本装置２は、受信した中央とサイドの信号を単純に組み合わせることにより、ノイズのためにステレオ信号を再構成するのに受信サイド信号が極めてノイズが多いことがあるというアイディアに基づく；それにもかかわらず、この場合は、Ｌ／Ｒ信号におけるサイド信号又はサイド信号の成分が、ＰＳパラメータ推定ステージ３におけるステレオ・パラメータ分析には充分にまだ良好であることがある。そして、結果のＰＳパラメータ５は、ステレオ信号Ｌ´、Ｒ´を生成するのに使用されることができ、そのステレオ信号Ｌ´、Ｒ´は、ＦＭ受信機１の出力での直接の音声信号に比べて、低減したノイズレベルを有する。

従って、パラメトリック・コンセプトを用いることで劣悪なＦＭ無線信号が“クリーン・アップ”されることができる。ＦＭ無線信号の歪みやノイズの主要部分は、ＰＳダウンミックスで使用されないことがあるサイドチャンネルに存在する。それにもかかわらず、そのサイドチャンネルは、劣悪な受信の場合でさえ、しばしばＰＳパラメータ抽出に対して充分な品質である。

以下の全ての図面において、音声処理装置２への入力信号は左／右ステレオ信号である。音声処理装置２の中で幾つかのモジュールへの僅かな変更により、音声処理装置２は中央／サイド表示の入力信号も処理することができる。それ故、本明細書で議論したコンセプトは中央／サイド表示の入力信号に関連して使用することができる。

図３はＰＳベースの音声処理装置２の一実施形態を示し、ＰＳエンコーダ７とＰＳデコータ８とを使用する。この例では、そのパラメータ推定ステージ３はＰＳエンコーダ７の部分であり、アップミックス・ステージ４はＰＳデコーダ８の部分である。“ＰＳエンコーダ”及び“ＰＳデコーダ”の用語は、装置２の中の音声処理ブロックの機能を説明するための名称として用いられる。音声処理は同じＦＭ受信装置で全て動作することに留意すべきである。これらのＰＳエンコーディング及びＰＳデコーディング処理はしっかりと連結されても良く、用語“ＰＳエンコーディング”及び“ＰＳデコーティング”は音声処理機能のヘリテージを説明するのに用いられるだけである。

ＰＳエンコーダ７は、ステレオ音声入力信号Ｌ，Ｒに基づいて、音声信号ＤＭ及びＰＳパラメータ５を生成する。任意的に、ＰＳエンコーダ７は信号強度信号６を更に使用してもよい。その音声信号ＤＭはモノラル・ダウンミックスであり、好ましくは受信中央信号に対応する。ＤＭ信号を形成するためにＬ／Ｒチャンネルを合計すると、受信サイドチャンネルの情報はそのＤＭ信号内で完全に除去されてもよい。従って、この場合、中央情報だけがモノラル・ダウンミックスＤＭの中に含まれる。それ故、サイドチャンネルからの如何なるノイズもＤＭ信号内で除去されてもよい。しかしながら、サイドチャンネルは、エンコーダ７が典型的にはＬ＝Ｍ＋Ｓ及びＲ＝Ｍ−Ｓを入力としてとるので（従って、ＤＭ＝（Ｌ＋Ｒ）／２＝Ｍ）、エンコーダ７のステレオ・パラメータ分析の部分である。

モノラル信号ＤＭ及びＰＳパラメータ５は、続いて、ＰＳデコータ８で使用され、ステレオ信号Ｌ´、Ｒ´を再構成する。

図４は図３の音声処理装置２の拡張版を示す。ここでは、モノラル・ダウンミックス信号ＤＭとＰＳパラメータとに加えて、元々受信したサイド信号Ｓ_０もＰＳデコータ８に伝えられる。このアプローチはＰＳコーディングの“残余コーディング”技術に類似し、良好であるが完全ではない受信状態の場合、受信サイド信号Ｓ_０の少なくとも部分（例えば或る周波数バンド）を使用することが可能になる。その受信サイド信号Ｓ_０は、そのモノラル・ダウンミックス信号が中央信号に対応しない場合に、好ましくは使用される。しかしながら、そのモノラル・ダウンミックス信号がサイド信号に対応しない場合、より一般的な残余信号が受信サイド信号Ｓ_０に代わって使用されることができる。そうした残余信号は、ダウンミックスとＰＳパラメータによって、元々のチャンネルの表示に関連するエラーを示し、そして、ＰＳエンコーディング・スキームの中でしばしば使用される。以下では、受信サイド信号Ｓ_０の使用についての言及は残余信号にも適応される。

図５は図４のＰＳエンコーダ７とＰＳデコーダ８の一実施形態を示す。そのＰＳエンコーダ・モジュール７は、ダウンミックス生成器９とＰＳパラメータ推定ステージ３を含む。例えば、そのダウンミックス生成器９はモノラル・ダウンミックスＤＭを生成してもよく、そのモノラル・ダウンミックスＤＭは中央信号Ｍ（例えば、ＤＭ＝Ｍ＝（Ｌ＋Ｒ）／ａ）に好ましくは対応し、任意的に、受信サイド信号Ｓ_０＝（Ｌ−Ｒ）／ａに対応する第２信号を生成してもよい。

ＰＳパラメータ推定ステージ３は、ＰＳパラメータ５として、Ｌ及びＲ入力の間のレベル差と相関とを推定してもよい。任意的に、そのパラメータ推定ステージは信号強度６を受信する。この情報はＰＳパラメータ５の信頼性に関して決定するために使用されることができる。低い信頼性の場合、例えば、低い信号強度６の場合、ＰＳパラメータ５は、出力信号Ｌ´、Ｒ´がモノラル出力信号又は疑似ステレオ出力信号であるように設定されてもよい。モノラル出力信号の場合、出力信号Ｌ´は出力信号Ｒ´と等しい。疑似ステレオ信号の場合、デフォールトのＰＳパラメータは疑似又はデフォールトのステレオ出力信号Ｌ´、Ｒ´を生成するのに使用されてもよい。

ＰＳデコーダモジュール８はステレオ・ミクシング・マトリクス４ａと非相関器（ｄｅｃｏｒｒｅｌａｔｏｒ）１０とを含む。その非相関器はモノラル・ダウンミックスＤＭを受信し、疑似サイド信号として使用される非相関信号Ｓ´を生成する。その非相関器１０は引用文献“ＬｏｗＣｏｍｐｌｅｘｉｔｙＰａｒａｍｅｔｉｃＳｔｅｒｅｏＣｏｄｉｎｇｉｎＭＰＥＧ−４”の第４章で述べられているように、適切な全通過フィルタによって実現されてもよい。そのステレオ・ミクシング・マトリクス４ａはこの実施形態の２ｘ２のアップミックス行列である。

推定パラメータ５に応じて、ステレオ・ミクシング・マトリクス４ａはステレオ出力信号Ｌ´とＲ´とを生成するため、ＤＭ信号を受信サイド信号Ｓ_０又は非相関信号Ｓ´と混合する。信号Ｓ_０と信号Ｓ´の間の選択は受信状態を表す無線受信インジケータに応じてもよく、例えば信号強度６である。これに代わって、又は、これに加えて、受信サイド信号の品質を表す品質インジケータを使用してもよい。そうした品質インジケータの或る例は、受信サイド信号の推定ノイズ（パワー）であってもよい。高度ノイズを含むサイド信号の場合、非相関信号Ｓ´がステレオ出力信号Ｌ´及びＲ´を生成するよう使用されてもよく、一方、低ノイズの状況では、サイド信号Ｓ_０が使用されてもよい。受信サイド信号のノイズを推定する各種の実施形態は本明細書で後に説明される。

アップミックス操作は好ましくは以下の行列方程式に従って実行される：

ここで、重み付けファクタα、β、γ、δは信号ＤＭとＳの重みを決定する。モノラル・ダウンミックス信号ＤＭは好ましくは受信中央信号に対応する。その式の信号Ｓは非相関信号Ｓ´か、又は、受信サイド信号Ｓ_０に対応する。アップミックス・マトリクス要素群、即ち、重み付けファクタα、β、γ、δは、例えば、引用論文“ＬｏｗＣｏｍｐｌｅｘｉｔｙＰａｒａｍｅｔｉｃＳｔｅｒｅｏＣｏｄｉｎｇｉｎＭＰＥＧ−４”（２．２章参照）、引用されるＭＰＥＧ−４標準規格文書ＩＳＯ／ＩＥＣ１４４９６−３：２００５（８．６．４．６．２章参照）、又は、ＭＰＥＧサラウンド仕様文書ＩＳＯ／ＩＥＣ２３００３−１（６．５．３．２章参照）に示されるように導出されてもよい。その文献のそうした章は（及び、これらの章で言及される章も）本明細書で参照して組み込まれる。

或る受信状態では、ＦＭ受信機１はモノラル信号を、伝達サイド信号をミュートにして、供給するのみである。これは、受信状態がたいへん劣悪でサイド信号がノイズが多いときに、典型的に発生するだろう。ＦＭステレオ受信機１がステレオ無線信号のモノラル再生にスイッチした場合、アップミックス・ステージは好ましくは、プリセットのアップミックス・パラメータのようなブラインド・アップミックスのアップミックス・パラメータを使用して疑似ステレオ信号を生成し、即ち、そのアップミックス・ステージは、ブラインド・アップミックスのアップミックス・パラメータを用いて、ステレオ信号を生成する。

極めて劣悪な受信状態ではモノラル再生にスイッチするＦＭステレオ受信機１の実施形態もある。その受信状態が信頼できるＰＳパラメータ５の推定には極めて劣悪である場合、アップミックス・ステージは好ましくはブラインド・アップミックスのアップミックス・パラメータを使用し、そして、それに基づいて疑似ステレオ信号を生成する。

図６はＦＭ受信機１のモノラルだけの出力の場合に、疑似ステレオを生成する一実施形態を示す。ここでは、モノラル／ステレオの検出器１３が使用され、装置２への入力信号がモノラルであるか、即ち、Ｌ及びＲのチャンネルの信号が同じであるかどうかを検出する。ＦＭ受信機１のモノラル再生の場合、モノラル／ステレオの検出器１３は、例えば固定アップミックス・パラメータを備えたＰＳデコーダを用いて、ステレオへのアップミックスを指し示す。換言すれば、この場合、アップミックス・ステージ４はＰＳパラメータ推定ステージ３からのＰＳパラメータ（図６には図示されない）を使用しないが、固定アップミックス・パラメータ（図６には図示されない）を使用する。

任意的にスピーチ検出器１４が加えられてもよく、その受信信号が主にスピーチ又は音楽であることを表示する。そうしたスピーチ検出器１４は信号従属のブラインド・アップミックスを可能にさせる。例えば、そうしたスピーチ検出器１４は信号従属のアップミックス・パラメータを可能にしてもよい。好ましくは、１つ以上のアップミックス・パラメータがスピーチ用に使用されてもよく、そして、異なる１つ以上のアップミックス・パラメータが音楽用に使用されてもよい。そうしたスピーチ検出器１４はボイス活動検出器（ＶＡＤ）によって実現されてもよい。

厳密には、図６のアップミックス・ステージ４は非相関器１０、２ｘ２アップミックス・マトリックス４ａ、及び、モノラル／ステレオ検出器１３とスピーチ検出器１４との出力を実際のステレオ・アップミックスへの入力として使用されるＰＳパラメータの或る形態へ変換する手段を含む。

図７は、ＦＭ受信機１によって供給される音声信号が、時間変化する劣悪な受信状態のため（例えば“フェーディング”）、ステレオとモノラルの間でトグルするとき、一般的な問題を図示する。モノラル／ステレオのトグルの間、ステレオ・サウンド・イメージを維持するため、エラー隠蔽技術が使用されてもよい。隠蔽が適応されるべき場所の時間インターバルは図７では“Ｃ”によって表示される。ＰＳコーディングの隠蔽へのアプローチは、新しいＰＳパラメータはＦＭ受信機１の音声出力がモノラルにドロップダウンしたため計算できないときは、以前に推定されたＰＳパラメータに基づくアップミックス・パラメータを使用することである。例えば、新しいＰＳパラメータがＦＭ受信機１の音声出力がモノラルにドロップダウンしたため計算できない場合は、アップミックス・ステージ４は以前に推定されたＰＳパラメータを使用し続けてもよい。従って、ＦＭステレオ受信機１がモノラルの音声出力にスイッチしたとき、ステレオのアップミックス・ステージ４はＰＳパラメータ推定ステージ３からの以前に推定されたＰＳパラメータを使用し続ける。ステレオ出力の中のドロップアウト期間が充分に短くＦＭ無線信号のステレオ・サウンド・イメージがドロップアウト期間に類似している場合、そのドロップアウトは装置２の音声出力において聴くことができないか、又は、ほんの少しだけ聞くことができる。他のアプローチは、以前に推定されたパラメータからアップミックス・パラメータを内挿するか、及び／又は、外挿することである。以前に推定されたＰＳパラメータに基づくアップミックス・パラメータの決定については、本明細書の教示を考慮して、他の公知の技術を使用してもよく、例えばエラー隠蔽技術により知られた技術であって、音声デコーダにおいて使用されることができ、伝送エラーの影響を軽減する（例えば破損データ又は消失データ）。

以前に推定されたＰＳパラメータに基づきアップミックス・パラメータを使用する同様のアプローチは、ＦＭ受信機１がノイズの多いステレオ信号を短期間の間に供給する場合、適応されることができ、そのノイズの多いステレオ信号は極めて劣悪であり、それに基づいて信頼できるＰＳパラメータを推定できない。

上で概説したように、図７に描かれたステレオ中断の間、ステレオ幅の突然の感知された不連続を回避するため、ステレオ・イメージを維持することは望ましい。これは、上で述べた隠蔽技術によって達成することができる。しかしながら、信頼できる方法でこれらのドロップアウトを検出することは問題かもしれない。可能なモノラル／ステレオ検出器が、信号のモノラル・セクションの検出に基づくことができ、それは左信号＝右信号の条件を満たす（又は、左信号―右信号＝０）。しかし、そうしたモノラル／ステレオは隠蔽プロセスには不安定な動作につながることがあり、それは、左信号と右信号のエネルギーが、サイド信号のエネルギーと同様に、正常な受信状態でも大きく変動することがあるという事実による。

そうした隠蔽の不安定な動作を回避するため、モノラル／ステレオ検出と隠蔽メカニズムとは状態機械として実現できる。状態機械の例が図８に示される。図８の状態機械は、サイド信号Sの絶対エネルギー、即ちEs、の２つの基準レベルを使用する。Esを計算するのに使用されるサイド信号Sは、典型的には２５０Hzのカットオフ周波数を用いてハイパス・フィルタされていてもよい。これらの基準レベルは、上位基準レベルｒｅｆ＿ｈｉｇｈと下位基準レベルｒｅｆ＿ｌｏｗである。その上位基準レベル（ｒｅｆ＿ｈｉｇｈ）の上では、信号はステレオであるとみなされ、その下位基準レベル（ｒｅｆ＿ｌｏｗ）の下では、信号はモノラルであるとみなされる。

サイド信号のエネルギーEsは状態機械の制御パラメータとして計算される。Esはタイム・ウインドウに渡って計算されてもよく、それは例えばPSパラメータの有効性の時間に対応してもよい。換言すれば、サイド信号のエネルギー決定頻度は、PSパラメータを決定する頻度と整合してもよい。本明細書では、サイド信号のエネルギーEs（及び、場合によりPSパラメータ）を決定する期間は信号フレームとして言及される。図８の状態機械は５つ条件を含み、それらは新しいフレームのエネルギーEsが計算される度に検証される：
−条件Aは、サイド信号エネルギーEsが上位基準レベルｒｅｆ＿ｈｉｇｈを超えていることを示す。その上位基準レベルは高い閾値として言及されてもよい。

−条件Bは、サイド信号エネルギーEsが上位基準レベルｒｅｆ＿ｈｉｇｈ以下であって、且つ、下位基準レベルｒｅｆ＿ｌｏｗ以上であることを示す。その下位基準レベルは低い閾値として言及されてもよい。

−条件B１は条件Bに対応するが、追加的な時間条件を付加する。その時間条件は、条件Bがフレーム数の閾値より低いか、又は、時間閾値よりも低いことを規定する。この閾値は、フレーム閾値として参照されてもよい。

−条件B２は条件Bに対応し、追加的な時間条件を有し、条件Bがフレーム数の閾値以上であるか、又は、時間閾値以上であることを規定する。

−条件Cはサイド信号エネルギーEｓが下位基準レベルｒｅｆ＿ｌｏｗよりも低いことを示す。

さらに、図８の状態機械の例は５つの状態を使用する。異なる状態が、上記の条件に従って、及び、図８に図示される状態図に従って到達する。次のアクションが典型的には異なる状態で実行される：
−状態１では、通常のステレオ操作が実行され、例えば、現在の音声信号から決定されるPSパラメータに基づいて実行される。

−状態２では、通常のステレオ操作が現在の音声信号について決定されたPSパラメータに基づいて実行される。この状態は単に過渡的なものであり、条件Bがフレーム閾値以上の多数のフレームに対して、又は、時間閾値以上の時間に対して（即ち、条件B2）、又は、フレーム数の経過の前に、又は、時間の経過の前に満たされるか、又は、条件Ａが満たされるという事実を考慮している。

−状態３では、現在の音声信号について決定されたPSパラメータに基づいてステレオ操作が実行される。状態３は、状態１から状態２を介して状態３に至る経路に到達することが見て取れる。条件B２は移行のために最小限のフレーム数、又は最小限の時間を必要とするという事実を考慮して、経路“状態１、状態２、状態３”は、通常のステレオ操作（例えば音楽）から通常のモノラル操作（例えばスピーチ）までのスローな、即ちスムースな移行を表している。

−状態４では、以前に決定されたPSパラメータ、例えば状態１で決定された最も最近のPSパラメータを用いて、エラー隠蔽が開始される。条件Cが満たされる場合、即ち、サイド信号エネルギーEsがｒｅｆ＿ｈｉｇｈの上からｒｅｆ＿ｌｏｗの下へ急に低下する場合、状態４は状態１から直接に到達することができることが見て取れる。しかし、代替的に、条件Bがわずか２，３のフレーム数、又は、ほんの短い時間に対して満たされる場合だけ、状態４は状態２を介して状態１から到達することができる。このようにして、経路“状態１、状態４”と“状態１、状態２、状態４”は、通常のステレオ動作（例えば音楽）から強制的なモノラル動作への速い、即ち突然の移行を表す。その強制的なモノラル動作は、典型的にはFM受信機のせいであり、サイド信号のノイズレベルが所定のレベルを超過する場合に、サイド信号を突然にカットオフする。

−状態５では、エラー隠蔽が継続し、例えば状態４で構築されたPSパラメータに基づく。例示の実施形態では、状態５は、条件Cが満たされる場合、即ち、状態５が安定したエラー隠蔽状態を表す場合、状態４から到達することができるだけであり、その場合には、以前に決定されたPSパラメータが中央信号からステレオ信号を生成するために使用される。PSパラメータは数秒の時間定数によりモノラルへ減少してもよい。IIDとICCパラメータの時間定数は異なっていてもよい。

既に述べたように、例示の状態図は、FM受信機により受信される音声信号が数個の時間ウインドウの中でステレオからモノラルへいく場合のみ、即ち、ステレオからモノラルへの移行が突然の場合に、隠蔽がトリガーされることを確実にする。他方、ステレオレベル（ｒｅｆ＿ｈｉｇｈ）より低いがモノラルレベル（ｒｅｆ＿ｌｏｗ）よりも高いエネルギーEsを有するサイド信号にノイズが存在する場合、即ち、サイド信号の中に適切なPSパラメータを生成するのに十分な情報がまだ存在する場合、隠蔽のトリガーが回避される。同時に、ステレオからモノラルへ信号が変化するときでも、例えば音楽からスピーチへ信号が移行するときは、隠蔽検出はトリガーされないだろう、それによって、エラーの多い隠蔽アプリケーションのせいで、元々のモノラル信号が人工的なステレオ信号の中に与えられないことが確保される。ステレオからモノラルへの真の移行は、ｒｅｆ＿ｈｉｇｈの上からｒｅｆ＿ｌｏｗの下へのサイド信号エネルギーEsのスムースな移行に基づいて、検出することができる。

前回のウインドウの１つからのステレオ（PS）パラメータ（例えばIIDとICC）は、隠蔽がトリガーされるときに使用される。PSパラメータのスナップショットの代わりに、任意的にPSパラメータのローパス・フィルタされた値を使用することにより、パラメータの選択は、ぎこちないステレオ・イメージのフリージングのリスクに対してより敏感でないようになされる。換言すれば、PSパラメータの不適切なセットの使用を回避するため、或る数のフレーム、又は、隠蔽のトリガーの前の或る時間の経過から、ローパス・フィルタされた又は平均化されたPSパラメータを使用することは有利であることがある。そのパラメータ値はモノラルへ減少してもよい。

図８で見られるように、サイド信号がモノラルレベル（ｒｅｆ＿ｌｏｗ）を超過するとき、隠蔽が終了する。従って、新たに評価されるステレオ・パラメータが再び使用される。これは、サイド信号のエネルギーEsが閾値ｒｅｆ＿ｌｏｗよりも大きい場合は、サイド信号がPSパラメータを決定するのに十分な情報を含んでいると考えられるという事実のためである。

図９は音声信号の一例を示し、サイド信号のエネルギーが下位基準レベル（ｒｅｆ＿ｌｏｗ）よりも低くなるとき、どのようにして隠蔽が行われるかを示す。図９は、受信した音声信号のサイド信号エネルギーEs（参照番号３１）と同様に、中央信号エネルギーEmid（参照番号３０）を示す。さらに、図９は上位閾値ｒｅｆ＿ｈｉｇｈ（参照番号３２）と下位閾値ｒｅｆ＿ｌｏｗ（参照番号３３）を示す。隠蔽のトリガーは上のグラフ３４に示され、低い値は、現在決定されたPSパラメータを用いて通常の操作が実行されることを示し、高い値は以前に決定されたPSパラメータを用いて隠蔽が実行されることを示す。

一実施形態では、誤ったモノラル・ドロップアウト検出の回避を更に改善するため、スペクトル平坦性指標（SFM）がサイド信号ノイズ検出に使用される。上述したように、劣化したサイド信号により生ずるモノラル・ドロップアウトと、ステレオからモノラルまでの間の真の移行とを確実に区別することは有利である。そうした区別を実行するアプローチの１つが、上述した状態図の使用である。サイド信号のスペクトルのスペクトル平坦性が、劣化したノイズサイド信号と、真のモノラル信号とを区別するための更なる指標であってもよい。スペクトル平坦性指標は、以下で与えられてもよい。

ここで、

はハイブリッド・フィルタバンク帯域ｋにおけるサイド信号のパワーを表す。PSシステムの例で用いられるハイブリッド・フィルタバンクは６４のQMF帯域からなり、３つの最小の帯域は更に４＋２＋２の帯域に分割される（従って、N=６４−３＋４＋２＋２＝６９）。SFMはパワースペクトルの幾何平均とパワースペクトルの算術平均との比率として述べられてもよい。

代替的に、SFMはスペクトルのサブセットに基づいて計算されてもよく、Ｋ_{ｓｔａｒｔ}Ｋ_ｓｔｏｐまでの範囲のハイブリッド・フィルタバンク帯域だけを含む。そうして、例えば１つ又は２，３の第一の帯域が、不所望のDC、例えば低周波数のオフセットを除去するために排除することができる。こうして帯域境界を調整すると、SFMは与える：

計算上の複雑さを制限するため、そのSFMの式は、例えばテイラー展開、ルックアップテーブル、又は、ソフトウェア実施の分野で当業者に一般的に知られた類似の技術に基づいて、代替的にその数値近似により代替されてもよい。

さらに、スペクトル平坦性を測定する、明らかな先行技術の方法が他にも存在し、例えば周波数パワービンの標準偏差や最小値と最大値の差などである。これによって、用語“SFM”はこれらの指標のうちの何れも表す。

高いスペクトル平坦性は、スペクトルが全てのスペクトル帯域において同様の量のパワーを有することを示す。他方、低いスペクトル平坦性は、スペクトルパワーが比較的小さい数の帯域に集中していることを示す。従って、高いSFM値はノイズの多いサイド信号を示し、そこでは低いSFM値は情報を含むことのあるサイド信号を示す。

図１０では、ノイズの多いスピーチ信号の中央とサイドの信号のパワースペクトルが描かれる。中央信号２０のパワースペクトルが、低周波数領域では高レベルのエネルギーを有して比較的急勾配であることが見て取れる。他方、モノラルのスピーチ信号の例示の場合では主にノイズを含むサイド信号２１は、全般的に低レベルのエネルギーと比較的平坦なパワースペクトルを有する。

サイド信号ノイズ２１のパワースペクトルはやや平坦で特徴的なスロープを有するので、SFMはスロープ補償されたパワースペクトルに基づいて決定されてもよい。即ち、SFM値は、上記の式を用いて、スロープ補償されたパワースペクトルから決定されてもよい。パワースペクトルを補償するのに用いられるスロープは、予め決定されてもよく、例えば、複数のテスト・サイド信号のパワースペクトルの平均スロープとしてである。これらのテスト・サイド信号は、モノラル・スピーチ信号のようなモノラル信号のサイド信号であってもよく、それによって、モノラル信号、例えばモノラル・スピーチ信号に含まれるサイド信号ノイズに対して、典型的な／平均のスロープを与える。代替的に、又は、追加的に、パワースペクトルを補償するために使用されるスロープはサイド信号の現在のフレームを用いて決定されてもよく、それによって、適応的なスロープ補償を提供する。これは線形回帰技術を用いて行われてもよい。

上述の指標を用いて、各信号フレームに対してSFM値が決定されてもよく、それによって、信号フレームのシーケンスに対してSFM信号を与える。このSFM信号は、フレーム／時間軸にそって平滑化されてもよい（ローパス・フィルタされる）。そのSFM値又は（平滑化）SFM信号は、ノイズ指標として使用されてもよい。詳しくは、SFM値は真のモノラル信号における偶発的なノイズ・バーストを特定するのに用いられてもよい。例として、音声信号はモノラル・スピーチ信号であってもよく、図８の状態機械は状態３であってもよい。サイド信号における偶発的なノイズ・バースト、即ちエネルギーEsの偶発的な増加が条件Aをトリガーしてもよく、それによって、音声信号がまだモノラル・スピーチ信号であっても、状態３から状態１への移行をトリガーする。そして、ノイズ・バーストの突然の終端が、状態４への移行（直接的に、又は、状態２を介して）をトリガーし、それによって、モノラル・スピーチ信号に対する不所望の隠蔽を開始する。そうした不所望の状況を回避するため、SFM値又は（平滑化）SFM信号が追加の条件として用いられてもよい。例として、条件Aは（平滑化）SFM信号に依存するよう追加的に作られてもよく、それによって、ステレオ信号に起因するサイド信号エネルギーと、ノイズ・バーストに起因するサイド信号エネルギーとを区別する。一実施形態では、（平滑化）SFM信号が或る閾値を超過する場合、隠蔽検出が停止されてもよい。全体的に見て、SFMの使用は誤った隠蔽検出を回避することができ、さもなければ、それはサイド信号の中に偶発的なノイズ・バーストにより典型的なモノラル・スピーチ信号に対して発生するかもしれない
図１１には、隠蔽を含む例示のPSパラメータ推定ステージが示される。このPSパラメータ推定ステージは、修正されたPSパラメータ推定ステージとして言及されてもよい。左と右の信号を含む２チャンネル音声信号がPSパラメータ推定ステージ３に入り、２チャンネル音声信号の１つ以上の現在のフレームに基づいて、PSパラメータのセットを決定する。また、左と右の音声信号は“モノラル”検出ステージ、又は、隠蔽検出ステージ２２に入り、それは隠蔽が実行されるべきかどうかを決定するよう構成される。このため、“モノラル”検出ステージ２２は本明細書で概説される方法の何れを使用してもよい。また、修正されたPSパラメータ推定ステージは、メモリステージ２３を含み、それは以前に決定されたPSパラメータを保存するよう構成される。詳しくは、メモリステージ２３は、隠蔽の間に使用されるべきPSパラメータのセットを決定し保存するよう構成される。さらに、メモリステージ２３は、保存されたPSパラメータのセットに減衰を適用するよう構成されてもよい。その減衰は、保存されたPSパラメータのセットから、モノラル信号を与えるために適応されるPSパラメータのセットへのスムースな移行につながることがある。減衰又は移行のスピードは設定可能であってもよい。加えて、修正されたPSパラメータ推定ステージはPSパラメータ選択ステージ２４を含んでもよく、それは、ステレオ又は真のモノラル操作の間は、PSパラメータ推定ステージ３の出力から、そして、隠蔽操作の間は、メモリステージ２３の出力から、PSパラメータを選択するよう構成される。

図１２は一例として“モノラル”検出ステージ、又は、隠蔽検出ステージ２２を示す。サイド信号が、サイド信号決定ステージ２５を用いて、左と右の音声信号から生成される。引き続き、サイド信号のエネルギーEsがエネルギー決定ステージ２６において決定される。さらに、サイド信号のSFM値がSFM決定ステージ２７において決定されてもよい。夫々の閾値検証ステージ２８，２９の内部で、エネルギーEs及び／又はサイド信号のSFM値が或る条件を満たすかどうかが判定される。これらの条件は、状態機械４０の状態間での移行をトリガーするため、状態機械４０に供給される。状態機械の状態と移行（境界）は、本明細書で概説されるように構成されてもよい。“モノラル”検出ステージ２２の出力として、隠蔽の実行がトリガーされてもよい。

以下では、エラー補償を供給する高度なPSパラメータ推定ステージ３´が図１３を参照して説明される。ノイズの多いサイド成分を含むステレオ信号に基づいて、PSパラメータを推定する場合、CLD（ＣｈａｎｎｅｌＬｅｖｅｌＤｉｆｆｅｒｅｎｃｅｓ）パラメータやICC（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＣｒｏｓｓ−Ｃｏｒｒｅｌａｔｉｏｎ）パラメータを決定するような、PSパラメータを決定する従来の式が使用されると、PSパラメータの計算におけるエラーが存在するだろう。

実際のノイズの多いステレオ入力信号値ｌ_{ｗ／ｎｏｉｓｅ}とｒ_{ｗ／ｎｏｉｓｅ}は、図１３に示される内部のPSパラメータ推定ステージ３´に入力され、ノイズの無い夫々の値ｌ_{ｗ／ｏｎｏｉｓｅ} ｒ_{ｗ／ｏｎｏｉｓｅ}と受信サイド信号値のノイズ値ｎとに従属して表現することができる：

ここでは、受信信号はｓ＋ｎとしてモデル化され、“ｓ”はオリジナルの（歪みの無い）サイド信号であり、そして、“ｎ”は無線送信チャンネルによって生じる（歪み信号）ノイズであることに留意すべきである。さらに、ここでは、信号ｍは、無線送信チャンネルからのノイズによって歪んでいないことが想定される。

従って、対応する入力パワーＬ_{ｗ／ｎｏｉｓｅ} ^２，Ｒ_{ｗ／ｎｏｉｓｅ} ^２と相互相関Ｌ_{ｗ／ｎｏｉｓｅ}Ｒ_{ｗ／ｎｏｉｓｅ}は以下のように記述することができる：

サイド信号ノイズパワー推定Ｎ^２、Ｎ^２＝Ｅ（ｎ^２）を有し、“Ｅ（）”は期待演算子である。

上記の式を再構成することにより、対応するノイズの無い補償パワーと相互相関が決定される：

補償されたパワーと相互相関に基づいてエラー補償されたPSパラメータ抽出が、以下の式で与えられるように実行されてもよい：

そうしたパラメータ抽出はPSパラメータの計算において推定Ｎ^２の項を補償する。

サイド信号におけるノイズの影響は以下の通りである：サイド信号におけるノイズが中央信号から独立であると仮定すると：
−ICC値は、ノイズの無いステレオ信号に基づいて予測されるICC値に比べて、０に近くなり、そして、
−CLDデシベル値は、ノイズの無いステレオ信号に基づいて予測されるCLD値に比べて、０ｄBに近くなる。

PSパラメータにおけるエラーの補償のため、本装置２は好ましくはノイズ推定ステージを有し、そのステージは、（劣悪な）無線送信により生ずる受信サイド信号のノイズのパワーに対してノイズパラメータ特性を決定するよう構成される。従って、PSパラメータを推測するとき、ノイズパラメータが考慮されてもよい。これは図１３で示されるように実現されてもよい。

図１３に従って、FM信号強度６が少なくとも部分的にエラーを補償するように使用されてもよい。信号強度に関する情報がFM無線受信機でしばしば利用可能である。信号強度６は、PSエンコーダ７のパラメータ分析ステージ３に入力される。サイド信号ノイズパワー推定ステージ１５では、信号強度６はサイド信号ノイズパワー推定Ｎ^２に変換されてもよい。信号強度６の代替として、又は、信号強度６に加えて、音声信号L,Rは信号ノイズパワーを推定するために使用されてもよく、後で説明されるだろう。

図１３では、サイド信号ノイズパワー推定ステージ１５が、信号強度６及び／又は音声入力信号（LとR）に基づいて、ノイズパワー推定Ｎ^２を導出するよう構成されてもよい。ノイズパワー推定Ｎ^２は周波数変数と時間変数の双方であり得る。

様々な方法がサイド信号ノイズパワーＮ^２を決定するために使用されてもよく、例えば：
−中央信号の最小パワーを検出するとき（例えばスピーチの一時停止）、サイド信号のパワーはノイズだけであることが想定される（即ち、サイド信号のパワーはこの状況でＮ^２に相当する）。

−そのＮ^２推定は信号強度データ６の関数によって定義することができる。その関数（又はルックアップテーブル）は実験的な（物理的な）測定によって設計することができる。

−そのＮ^２推定は信号強度データ６及び／又は音声入力信号（LとR）の関数として定義することができる。その関数は発見的規則によって設計することができる。

−そのＮ^２推定は中央信号とサイド信号との信号タイプ・コヒーレンスを研究することに基づいて行うことができる。そのオリジナルの中央信号とサイド信号は、例えば、同様の音調対ノイズ比、又は、クレスト・ファクタ、又は、他のパワー包絡線特性を有すると想定される。こうした特徴の偏差は、高いレベルのＮ^２を示すように使用される。

本明細書で説明されるコンセプトは、PS技術を用いた如何なるエンコーダと連携して実施することができ、例えば、標準規格ISO/IEC 14496-3(High-Efficiency Advanced Audio Coding version 2)で定義されるHE-AAC v2（MPEG-4 Audio）エンコーダ、MPEGサラウンドに基づくエンコーダ、又は、MPEG USAC(United Speech and Audio coder)に基づくエンコーダ、さらにMPEG標準規格でカバーされていないエンコーダである。

以下では、例として、HE-AAC v2エンコーダが想定され；しかし、本コンセプトはPS技術を用いた如何なる音声エンコーダと連携して使用されてもよい。

HE-AACは不可逆のオーディオ圧縮方法である。HE-AACｖ１（HE-AACバージョン１）はスペクトル帯域複製（SBR）を利用し、そうして圧縮効率を向上する。HE−AACｖ２は更にパラメトリック・ステレオを含み、そうしてとても低いビットレートのステレオ信号の圧縮効率を向上する。HE−AACｖ２エンコーダは、本質的にPSエンコーダを含み、そうしてとても低いビットレートでの操作を可能にする。そうしたHE-AACｖ２エンコーダのPSエンコーダはオーディオ処理装置２のPSエンコーダ７として使用することができる。詳しくは、HE-AACｖ２エンコーダのPSエンコーダの内部のPSパラメータ推定ステージがオーディオ処理装置２のPSパラメータ推定ステージ３として使用することができる。また、HE-AACｖ２エンコーダのPSエンコーダの内部のダウンミックス・ステージが、装置２のダウンミックス・ステージ９として使用することもできる。

従って、本明細書で述べたコンセプトはHE−AACｖ２エンコーダと効率的に組み合わせることができ、そうして改善されたFMステレオ無線受信機が実現できる。そうした改善されたFMステレオ無線受信機は、HE-AACｖ２エンコーダがレコーディング目的で保存されるHE-AACｖ２ビットストリームを出力するので、HE-AACｖ２のレコーディング・フィーチャを有してもよい。これは図１４に示される。この実施形態では、装置２はHE-AACｖ２エンコーダ１６とPSデコーダ８とを含む。HE-AACｖ２エンコーダは、前の図面に関連して説明したように、モノラル・ダウンミックスDMとPSパラメータ５とを生成するために使用されるPSエンコーダ７を供給する。

任意的に、PSエンコーダ７はFM無線ノイズ低減の目的で固定のダウンミックス方法をサポートするよう修正されてもよく、例えば、ＤＭ＝（Ｌ＋Ｒ）／ａに従ったダウンミックス方法である。

モノラル・ダウンミックスDMとPSパラメータ５はPSデコーダ８に供給されてもよく、そうして、上述のようにステレオ信号Ｌ’、Ｒ’を生成する。モノラル・ダウンミックスDMはモノラル・ダウンミックスDMの知覚的エンコーディングのためのHE-AACｖ１エンコーダに供給される。その結果の知覚的エンコードされたオーディオ信号とPS信号とは、HE-AACｖ２ビットストリーム１８に多重化される。レコーディング目的のため、HE-AACｖ２ビットストリーム１８は、フラッシュメモリやハードディスクのようなメモリの中に保存され得る。

HE-AACｖ１エンコーダ１７はSBRエンコーダとAACエンコーダとを含む（不図示）。SBRエンコーダは典型的にはQMF(ｑｕａｄｒａｔｕｒｅｍｉｒｒｏｒｆｉｌｔｅｒｂａｎｋ)領域での信号処理を実行し、そして、QMFサンプルを必要とする。対照的に、AACエンコーダは典型的には時間領域サンプル（ファクタ２で典型的にはダウンサンプリングされる）を必要とする。

HE-AACｖ２エンコーダ１６の内部のPSエンコーダ７は典型的には、QMF領域に既にあるダウンミックス信号DMを供給する。

PSエンコーダ７はQMF領域信号DMをHE-AACｖ１エンコーダを既に送信していてもよいので、SBR分析のためのHE-AACｖ１エンコーダにおけるQMF分析変形が廃止される。従って、通常はHE-AACv１エンコーダの一部であるQMF分析は、QMFサンプルとしてダウンミックス信号DMを供給することにより、回避することができる。これは計算コストを低減し、複雑さを省力化できる。

AACエンコーダに対する時間領域サンプルは、装置２の入力から導いてもよく、例えば、時間領域でサンプリング操作ＤＭ＝（Ｌ＋Ｒ）／２を実行することにより、及び、時間領域信号DMをダウンサンプリングすることにより導かれる。このアプローチは恐らくは最も安価なアプローチである。代替的には、装置２はQMF領域DMサンプルのハーフレートQMF合成を実行してもよい。

本明細書では、FM無線受信機のノイズを低減する方法及びシステムが説明された。PSパラメータは受信した中央及びサイド信号から決定され、そうして、その中央信号とそのPSパラメータとを用いて、ノイズ低減されたオーディオ信号を生成することができる。隠蔽技術が概説され、高い程度のノイズを含むサイド信号に対してもステレオ信号を供給する。このコンテキストでは、真のモノラル受信状況、対、ノイズサイド信号状況を確実に検出する方法が概説された。推定されたPSパラメータに与えるノイズの影響を低減するため、ノイズ推定と補償の方法が説明された。

本明細書で述べた方法及びシステムは、ソフトウェア、ファームウェア、及び／又は、ハードウェアとして実施されてもよい。或るコンポーネント群は例えばデジタル信号プロセッサ又はマイクロプロセッサ上でランするソフトウェアとして実施されてもよい。他のコンポーネント群は例えばハードウェア、及び／又は、特定用途向き集積回路として実施されてもよい。説明した方法及びシステムで現れる信号はランダムアクセスメモリや光学保存媒体といったメディアに保存されてもよい。そうした信号は無線ネットワーク、衛星ネットワーク、ワイヤレスネットワーク、又はワイヤラインネットワークのようなネットワーク、例えばインターネットを介して転送されてもよい。本明細書で述べた方法及びシステムを利用した典型的な装置は、ポータブル・エレクトロニック・デバイス、又は、他のコンシューマ装置であり、オーディオ信号を保存、及び／又は、レンダリングするものである。

Claims

２チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定するシステムであって：
−受信した２チャンネル音声信号の第１信号フレームに基づいて、第１パラメトリック・ステレオ・パラメータを決定するよう構成されるパラメトリック・ステレオ・パラメータ推定ステージと、
−隠蔽検出ステージと、を含み、当該隠蔽検出ステージは、
−前記第１信号フレーム内のサイド信号のエネルギーを決定し；前記サイド信号は前記２チャンネル音声信号から取得可能であり、前記エネルギーは高い閾値を上回り；
−多数の後続の信号フレームの移行期間を決定し、その間に前記サイド信号は前記高い閾値の上から低い閾値の下へ落下し；
−前記移行期間の連続信号フレームの数がフレーム閾値より低い場合、第１信号フレームに続く２チャンネル音声信号が強制的なモノラル信号であることを決定し、そして、
−前記第１パラメトリック・ステレオ・パラメータに基づいて、前記パラメトリック・ステレオ・パラメータを決定する、
システム。
前記受信した２チャンネル音声信号は中央信号及びサイド信号として表示できる、請求項１記載のシステム。
前記システムは：
−アップミックス・ステージを更に含み、当該アップミックス・ステージは、補助音声信号と前記第１パラメトリック・ステレオ・パラメータとに基づいて、第１信号フレームに続く出力ステレオ信号のフレームを生成するよう構成され；前記補助音声信号は、前記第１信号フレームに続く前記受信した２チャンネル音声信号から得られる、
請求項１又は２に記載のシステム。
前記隠蔽検出ステージは更に、
−前記移行期間の連続する信号フレームの数が前記フレーム閾値と同じ、又は、大きい場合に、前記第１信号フレームに続く前記２チャンネル音声信号が真のモノラル信号であると決定するよう構成される、
請求項１乃至３の何れか１つに記載のシステム。
前記隠蔽検出ステージは：
−複数のシステムモードを特定する複数の状態であって；前記システムのモードが前記２チャンネル音声信号の現在のフレームがどのように処理されるかを決定し；及び、
−前記複数の状態の間の移行条件を特定する複数の境界であって、それにより前記２チャンネル音声信号の現在のフレームへの直後のフレームがどのように処理されるかを決定する、
請求項１乃至４の何れか１つに記載のシステム。
前記複数の状態はステレオ状態を含み；当該ステレオ状態では
−前記パラメトリック・ステレオ・パラメータ推定ステージは、前記受信した２チャンネル音声信号の現在のフレームに基づいて、現在のパラメトリック・ステレオ・パラメータを決定するよう構成され；及び、
−前記アップミックス・ステージは、前記補助音声信号と前記現在のパラメトリック・ステレオ・パラメータとに基づいて、前記出力ステレオ・パラメータの現在のフレームを生成するよう構成され；前記補助音声信号は前記受信した２チャンネル音声信号の前記現在のフレームから得られる、
請求項５記載のシステム。
前記複数の状態は真のモノラル状態を含み；当該真のモノラル状態には
−前記パラメトリック・ステレオ・パラメータ推定ステージは、前記受信した２チャンネル音声信号の現在のフレームに基づいて、現在のパラメトリック・ステレオ・パラメータを決定するよう構成され、及び、
−前記アップミックス・ステージは、前記補助音声信号と前記現在のパラメトリック・ステレオ・パラメータとに基づいて、前記出力ステレオ信号の現在のフレームを生成するよう構成され；前記補助音声信号は前記受信した２チャンネル音声信号の前記現在のフレームから得られる、
請求項６記載のシステム。
前記複数の状態は隠蔽状態を含み；当該隠蔽状態には
−前記アップミックス・ステージを含み、当該アップミックス・ステージは、前記補助音声信号と保存されたパラメトリック・ステレオ・パラメータとに基づいて、前記出力ステレオ信号の現在のフレームを生成するよう構成され；前記補助音声信号は前記受信した２チャンネル音声信号の前記現在のフレームから得られ；さらに、前記保存されたパラメトリック・ステレオ・パラメータは、前記システムが前のステレオ状態にある間、前記パラメトリック・ステレオ・パラメータ推定ステージによって決定されている、
請求項７記載のシステム。
前記保存されたパラメトリック・ステレオ・パラメータは複数のパラメトリック・ステレオ・パラメータから決定され、好ましくはローパス・フィルタ又は平均化により決定される、請求項８記載のシステム。
前記保存されたパラメトリック・ステレオ・パラメータは時間依存であり、時間の関数としてモノラルへ減衰する、請求項８乃至１０の何れか１つに記載のシステム。
前記複数の境界は
−前記連続するフレームのエネルギーが前記高い閾値より低く、且つ、前記低い閾値より高い場合、前記ステレオ状態から前記真のモノラル状態への移行と；
−前記連続するフレームのエネルギーが前記低い閾値よりも低い場合、前記ステレオ状態から前記隠蔽状態への移行と；
−前記連続するフレームのエネルギーが前記高い閾値より低く、且つ、前記低い閾値より高い場合、前記隠蔽状態から前記真のモノラル状態への移行と；
−前記連続するフレームのエネルギーが前記高い閾値よりも高い場合、前記隠蔽状態から前記ステレオ状態への移行；及び／又は、
−前記連続するフレームのエネルギーが前記高い閾値よりも高い場合、前記真のモノラル状態から前記ステレオ状態への移行、を含む、
請求項８乃至１０の何れか１つに記載のシステム。
前記真のモノラル状態から前記隠蔽状態への移行は、前記システムが前記真のモノラル状態にある現在のフレームに先行するフレームの数に依存する、請求項１１記載のシステム。
前記真のモノラル状態から前記隠蔽状態への移行は、前記システムが前記真のモノラル状態にある現在のフレームに先行するフレームの数が前記フレーム閾値よりも低い場合にだけ生じる、請求項１２記載のシステム。
前記フレーム閾値は１、２、３、又は４フレームである、請求項１乃至１３のいずれか１つに記載のシステム。
前記隠蔽検出ステージは、さらに、
−前記サイド信号の連続するフレームのスペクトル平坦性を決定し；そして、
−前記複数の境界の少なくとも１つの移行状態での前記スペクトル平坦性を考慮する、
請求項１１乃至１４の何れか１つに記載のシステム。
前記真のモノラル状態から前記ステレオ状態への移行は、前記連続するフレームの前記スペクトル平坦性に依存する、請求項１５記載のシステム。
前記真のモノラル状態から前記ステレオ状態への移行は、前記スペクトル平坦性が平坦性閾値を下回るときのみ発生する、請求項１６記載のシステム。
−前記中央信号Ｍと前記サイド信号Ｓは左音声信号Ｌと右音声信号Ｒとに関係し、Ｍ＝（Ｌ＋Ｒ）／２かつＳ＝（Ｌ−Ｒ）／２であり；
−前記補助音声信号は（Ｌ＋Ｒ）／ａであり、ａは実数である、
請求項３乃至１７の何れか１つに記載のシステム。
前記パラメトリック・ステレオ・パラメータは、チャンネル・レベル・ディフェレンスを示すパラメータ、及び／又は、インターチャンネル・クロスリファレンスを示すパラメータを含む、請求項１乃至１８の何れか１つに記載のシステム。
−前記システムは、受信したサイド信号のノイズパワーに対するノイズ・パラメータ特性を決定するよう構成されるノイズ推定ステージを更に含み；
−前記パラメトリック・ステレオ・パラメータ推定ステージは、前記受信した２チャンネル音声信号とノイズ・パラメータに基づいて、前記パラメトリック・ステレオ・パラメータを決定するよう構成される、
請求項１乃至１９の何れか１つに記載のシステム。
パラメトリック・ステレオをサポートする音声エンコーダを更に含み、前記音声エンコーダはパラメトリック・ステレオ・エンコーダを含み、前記パラメトリック・ステレオ・パラメータ推定ステージは前記パラメトリック・ステレオ・エンコーダの一部である、請求項１乃至２０の何れか１つに記載のシステム。
中央信号とサイド信号とを含むＦＭ無線信号を受信するよう構成され、請求項１乃至２１の何れか１つに記載のシステムを含む、ＦＭステレオ無線受信機。
−中央信号とサイド信号とを含むＦＭ無線信号を受信するよう構成される、ＦＭステレオ受信機と；
−請求項１乃至２１の何れか１つに記載のシステムと、
を含む、モバイル通信デバイス。
２チャンネル音声信号からパラメトリック・ステレオ・パラメータを決定する方法であって；当該方法は：
−受信した２チャンネル音声信号の第１フレームに基づいて、第１パラメトリック・ステレオ・パラメータを決定するステップと、
−前記第１信号フレーム内のサイド信号のエネルギーを決定するステップであって；前記サイド信号は前記２チャンネル音声信号から得られ、前記エネルギーは高い閾値よりも大きい、ステップと；
−次の連続する信号フレームの数を決定するステップであって、その間に前記サイド信号のエネルギーは高い閾値より高い値から低い閾値より低い値へ落下する、ステップと；
−前記連続する信号フレームの数がフレーム閾値より小さい場合、前記第１信号フレームに続く２チャンネル音声信号は強制的なモノラル信号であることを決定するステップと；
−前記第１パラメトリック・ステレオ・パラメータに基づいて、前記パラメトリック・ステレオ・パラメータを決定するステップと、
を含む、方法。
プロセッサ上で実行されるよう適応されたソフトフェア・プログラムであって、コンピュータ・デバイス上で実行されると、請求項２４記載の方法を実行する、ソフトウェア・プログラム。
プロセッサ上で実行されるよう適応されたソフトウェア・プログラムを含む記憶媒体であって、コンピュータ・デバイス上で実行されると、請求項２４記載の方法を実行するソフトウェア・プログラムを含む、記憶媒体。
コンピュータ上で実行されると、請求項２４記載の方法を実行する実行可能な命令を含む、コンピュータ・プログラム製品。