JP6526049B2

JP6526049B2 - 源信号分離における改良された測定、エンティティ及びパラメータ推定、及び経路伝播効果測定及び軽減のための方法及びシステム

Info

Publication number: JP6526049B2
Application number: JP2016561687A
Authority: JP
Inventors: ケヴィンエムショート; ブライアンティーホーン; スコットスタクリー; パスカルブリュネ
Original assignee: エックスモスインコーポレイテッド
Priority date: 2014-04-09
Filing date: 2015-04-08
Publication date: 2019-06-05
Anticipated expiration: 2035-04-08
Also published as: JP2017516131A; EP3129795A4; EP3129795A1; WO2015157458A1

Description

（関連出願の相互参照）
本出願は、これによりその全体が引用によって組み込まれる２０１４年４月９日出願の米国仮特許出願第６１／９７７，３５７号に対する優先権を主張するものである。

本発明は、信号処理のための方法及びシステムに関し、より具体的には、信号を異なる成分に分離するための方法及びシステムに関する。

信号分離（ＳＳ）は、発生源から生じた何れかのデジタル信号を個々の構成要素に分離することであり、これによってこれらの要素を部分的に又は全体的に分解、分離、抽出、拡張、又は分離して再構成することができる。ＳＳは、聴覚データ及び／又は視覚データ又は画像を含む、あらゆる形態のデータに対して実行することができる。ＳＳは、主成分分析、特異値分解、空間パターン分析、独立成分分析（ＩＣＡ）、コンピュータ聴覚情景分析（ＣＡＳＡ）又は何れかの他のこのような技術を含む、複数の発生源依存方式を使用して実行することができる。

従来のＳＳは通常、リアルタイム又は準リアルタイムの性能を達成するために膨大な処理量を必要とし、よって、所与の信号内の信号源を効率的に識別及び分離できないことが多い。従って、リアルタイム又は準リアルタイムの信号分離を提供するようなシステムを作動させるためのシステム及びアルゴリズムに対する必要性が存在する。

本明細書で開示される様々な実施形態によるＳＳのための方法及びシステムは、信号源不可知である。オリジナル信号の性質は、一般的に、生成方法又は装置に関して無関係である。ＳＳシステム及び方法を適用することができる信号源は、限定ではないが、音声、オーディオ、ビデオ、写真、イメージング（医療を含む）、通信、光学／光、無線、ＲＡＤＡＲ、ソナー、センサ及び震源を含む。本明細書で説明する方法及びシステムは、信号分離のための信号源不可知システム及び方法のセットを含むことができる。これらは、信号の構成部分を数学的に記述するための高分解能信号処理の方法、「コヒーレント」（すなわち同じ信号源から発生する）である信号の一部分を識別するための追跡及び区分方法、及び任意選択的にはオリジナル信号フォーマットで選択された部分を再結合し、及び／又はこれらの部分を発話認識システムのような他のアプリケーションに直接これらを送信するための方法を含む。

別の例示的かつ非制限的実施形態によると、信号を処理する方法は、各々が多量の周囲雑音又は干渉信号を含む複数の信号ストリームを受信する段階、及び各々が複数の信号ストリームの１つに対応する入力サンプルウィンドウの第１及び第２のセットを作成する段階であって、入力サンプルの第２セットの開始が入力サンプルの第１セットの開始よりも時間遅延する上記作成する段階、分析ウィンドウを第１及び第２サンプルウィンドウに乗算する段階、第１及び第２入力サンプルウィンドウを周波数ドメインに変換して得られるデータを記憶する段階、周波数ドメインデータに複素スペクトル位相展開（ＣＳＰＥ）を実行して基本変換分解能よりも高い分解能でデータセットの成分周波数を推定する段階、ＣＳＰＥで推定された成分周波数を使用する段階、内在信号成分の振幅、位相、振幅変調、及び周波数変調のうちの少なくとも１つに適合する高分解能ウィンドウを選択するために、記憶された高分解能ウィンドウのセットをサンプリングする段階、追跡アルゴリズムを使用して、内在する信号内の単一発振器源から発する発振器ピークの少なくとも１つのトラックレットを識別する段階、単一源から発するトラックレットをグループ化する段階、雑音又は干渉信号に関連付けられる可能性が高いトラックレットを拒否する段階、トラックレットの少なくとも１つのグループを選択する段階、トラックレットの選択されたグループから信号を再構成する段階、及び出力として信号を提供する段階を含む。

例示的かつ非制限的実施形態により、信号を処理する方法は、複数の信号レコーダによって記録された信号を取り出す段階、少なくとも１つの超分解能技術を信号に適用して、複数の発振器ピークに対する複数の周波数成分を含む信号の発振器ピーク表現を生成する段階、信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性を計算して、信号レコーダ間の複数の発振器ピークの空間展開の尺度を生成する段階、複数の発振器ピークの周波数成分と少なくとも１つのＸＣＳＰＥ属性とに対応する既知の予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースを識別する段階、及び識別されたＰＸＣトレースを利用して信号の起点に対応する空間属性を決定する段階を含む。

例示的かつ非制限的実施形態により、信号を処理する方法は、複数の信号レコーダによって記録された信号を取り出す段階、少なくとも１つの超分解能技術を信号に適用して、複数の発振器ピークに対する複数の周波数成分を含む信号の発振器ピーク表現を生成する段階、信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性を計算して、信号レコーダ間の複数の発振器ピークの空間展開の尺度と複数の発振器ピークのフライトの測定時間とを生成する段階、複数の発振器ピークの周波数成分と少なくとも１つのＸＣＳＰＥ属性とに対応する既知の予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースを識別する段階、複数の発振器ピークの各々に対するプロット位置のＰＸＣトレースから外れる偏差を測定する段階、及び偏差とオリジナル信号内の残響の量とに少なくとも一部基づいて経路伝播効果（ＰＰＥ）を決定する段階を含む。

必ずしも縮尺通りではない図において、複数の図を通して同じ参照符号は実質的に同じ構成要素を記述することができる。異なる添字を有する同じ参照符号は、実質的に同様の構成要素の異なる事例を表すことができる。図面は一般的に限定ではなく例証に過ぎず、本明細書で検討される特定の実施形態を例示している。

例示的かつ非限定的実施形態による信号抽出処理を示す図である。例示的かつ非限定的実施形態による信号抽出処理のステップを示す図である。例示的かつ非限定的実施形態による単一チャネル事前プロセッサを使用して源信号を事前処理する方法を示す図である。例示的かつ非限定的実施形態による単一チャネル事前プロセッサを使用して源信号を事前処理して信号内の周波数変調を検出する方法を示す図である。例示的かつ非限定的実施形態による単一チャネル超分解能アルゴリズムを示す図である。例示的かつ非限定的実施形態による信号成分のセットの抽出を可能にするような高精度周波数及びＡＭ及びＦＭ変調推定値を生成する方法を示す図である。例示的かつ非限定的実施形態による統一ドメイン超分解能のための方法の一例を示す図である。例示的かつ非限定的実施形態による振幅及び周波数変調検出を備えた統一ドメイン超分解能のための方法の一例を示す図である。例示的かつ非限定的実施形態によるＦＦＴスペクトルのグラフ表示の図である。例示的かつ非限定的実施形態によるＡＭ／ＦＭ検出のための高分解能窓を作成する方法の一例を示す図である。例示的かつ非限定的実施形態による周波数変調検出のための方法の一例を示す図である。例示的かつ非限定的実施形態による変調検出決定木を示す図である。例示的かつ非限定的実施形態による信号成分追跡器によって実行される方法の一例を示す図である。例示的かつ非限定的実施形態による周波数及び位相予測を使用することができる信号成分追跡器によって実行される方法の一例を示す図である。例示的かつ非限定的実施形態によるタブレット又は携帯電話制御のためのコンピュータで生成されるインタフェースを示す図である。例示的かつ非限定的実施形態によるトラックエディタを示す図である。例示的かつ非限定的実施形態によるトラックエディタのサブ選択を示す図である。例示的かつ非限定的実施形態によるトラックエディタデータ視覚化器を示す図である。例示的かつ非限定的実施形態による拡張源信号分離（ＳＳＳ）方法を示す図である。例示的かつ非限定的実施形態による例示的予測ＸＣＳＰＥ曲線（ＰＸＣ）を示す図である。例示的かつ非限定的実施形態による測定ＸＣＳＰＥの距離計算の例を示す図である。例示的三角関係を示す図である。当業技術で公知の移動音源のＰＨＡＴ分析を示す図である。例示的かつ非限定的実施形態による発生源までのサンプル集約ＸＣＳＰＥ距離を示す図である。例示的かつ非限定的実施形態による発生源までのサンプル集約ＸＣＳＰＥ距離を示す図である。例示的かつ非限定的実施形態による発生源までのサンプル集約ＸＣＳＰＥ距離を示す図である。例示的かつ非限定的実施形態による移動発生源の集約ＸＣＳＰＥＴＤＯＡ推定を示す図である。例示的かつ非限定的実施形態によるＡＸＴＥ音源におけるエンティティの検出を示す図である。例示的かつ非限定的実施形態による自動車の内側の２つのスピーカに対する集約ＸＣＳＰＥ測定を示す図である。例示的かつ非限定的実施形態による自動車の内側の２つのスピーカに対する集約ＸＣＳＰＥ測定を示す図である。例示的かつ非限定的実施形態による発生源パラメータ推定のための測定パワーパターンを示す図である。例示的かつ非限定的実施形態による発生源パラメータ推定のための測定信号パターンを示す図である。例示的かつ非限定的実施形態による発生源パラメータ推定のための測定ＸＣＳＰＥパターンを示す図である。例示的かつ非限定的実施形態によるＸＣＳＰＥ及びシグマ測定を使用した発振器ピークの選択を示す図である。例示的かつ非限定的実施形態によるＴＤＯＡ測定を使用した発振器ピークの選択を示す図である。例示的かつ非限定的実施形態によるエンティティパラメータを使用した発振器ピークの選択を示す図である。例示的かつ非限定的実施形態による追跡器出力を使用したエンティティパラメータの推定を示す図である。例示的かつ非限定的実施形態によるＴＤＯＡ推定を使用したエンティティパラメータの推定を示す図である。例示的かつ非限定的実施形態による源信号分離を強化するためにＸＣＳＰＥ、シグマ、及びＴＤＯＡ推定を使用するシステムを示す図である。例示的かつ非限定的実施形態による発振器ピーク表現を使用した経路伝播効果測定を示す図である。例示的かつ非限定的実施形態による音声のためのＸＣＳＰＥ測定を示す図である。例示的かつ非限定的実施形態による音声のためのＸＣＳＰＥ測定を示す図である。例示的かつ非限定的実施形態による音声のためのＸＣＳＰＥ測定を示す図である。例示的かつ非限定的実施形態による音声のためのＸＣＳＰＥ測定の詳細を示す図である。例示的かつ非限定的実施形態による音声のためのシグマ測定を示す図である。例示的かつ非限定的実施形態による信号のためのシグマ及びＸＣＳＰＥを共に示した図である。例示的かつ非限定的実施形態による中間シグマ及びＸＣＳＰＥ変動のＦＥＴを示す図である。例示的かつ非限定的実施形態による音声のための測定ＸＣＳＰＥを示す図である。例示的かつ非限定的実施形態による音声のための測定ＸＣＳＰＥの詳細を示す図である。例示的かつ非限定的実施形態による音声のための測定シグマを示す図である。例示的かつ非限定的実施形態によるＳＳＳシステムにおける経路伝播効果測定及び軽減を示す図である。例示的かつ非限定的実施形態による信号における経路伝播効果の軽減を示す図である。例示的かつ非限定的実施形態による発振器ピークにおける経路伝播効果の軽減を示す図である。例示的かつ非限定的実施形態による個々のサウンド発生源に対する経路伝播効果を除去するためにＰＰＥ推定及びエンティティ検出を使用するシステムを示す図である。例示的かつ非限定的実施形態による音楽及び背景雑音が存在する場合のスピーカを示す図である。例示的かつ非限定的実施形態による音楽及び背景雑音から抽出されたスピーカを示す図である。例示的かつ非限定的実施形態によるコンピュータ生成インタフェースを示す図である。例示的かつ非限定的実施形態によるトラックエディタを示す図である。例示的かつ非限定的実施形態によるトラックエディタポスト分析及び追跡を示す図である。例示的かつ非限定的実施形態によるトラックエディタデータ視覚化器を示す図である。例示的かつ非限定的実施形態による方法を示す図である。例示的かつ非限定的実施形態による方法を示す図である。

図１は、源信号分離のための方法１００の例示的かつ非限定的実施形態を示す。一例において、代表的な入力信号は、源信号（ＳＳ）ＳＳが源不可知であるようなシステムへの入力としてオーディオ信号／音声を含むＳＳとすることができ、あらゆるタイプの源信号に対して使用することができる。他の代表的な入力信号は、限定ではないが、周囲の音声、オーディオ、ビデオ、発話、画像、通信、地球物理、ＳＯＮＡＲ、ＲＡＤＡＲ、熱、光学／光、医療、及び音楽信号を含むことができる。方法１００は、組み合わせて又は部分的に使用して、ＳＳを分析し、ＳＳをその構成要素に分離して、次いで全体として又は部分的にＳＳ信号を再構成することができる１又は２以上のステップを含むことができる。

図１に示されるように、方法１００は、ステップ１０２において、信号を処理して信号分離を行うために信号を選択するよう構成することができる。一例において、分析のために連続的サンプル（時間的なサンプルの窓を表すことができる「窓」又は「サンプル窓」と本明細書では呼ばれる）を選択することができる。典型的には、小さな時間遅延を間に有して複数の窓を選択することができる。更にステップ１０４において、方法１００は、図１に示される窓Ｂ１のような分析窓によってＳＳを（すなわち、連続サンプルの形式で）乗算するよう構成することができる。分析窓はまた、本明細書ではテーパーと呼ぶことができる。

ステップ１０８において、ＨＲＷＣ１のような高分解能窓（ＨＲＷ）を作成することができる。更に、信号準備に使用される分析窓の複製を高分解能周波数ドメインに変換して発振器ピーク分析のために格納することができる。任意選択的には、振幅及び周波数変調効果が加えられたＨＲＷのセットを格納することができる。ステップ１１０において、周波数ドメインへの変換及び複素スペクトル位相展開（ＣＳＰＥ）高分解能周波数推定を実行することができる。一例において、時間ドメイン窓は、高速フーリエ変換（ＦＦＴ）、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）又は他の関連する変換などの変換を介して周波数ドメインに変換される。このような変換によって作成される周波数推定の精度は、従来では、入力サンプルの数によって制限される可能性がある。ＣＳＰＥ変換は、これらの制限を克服して、高精度な周波数推定値のセットを提供する。特に、ＣＳＰＥ計算は、２つの時間分離サンプル窓の変換の間に測定された位相回転を使用して、実際の内在周波数を検出する。

ステップ１１２において、方法１００は、シングレット変換処理を介して発振器ピークパラメータを識別するよう構成することができる。具体的には、高分解能窓（ＨＲＷ）は、ＣＳＰＥ計算によって提供される高精度周波数推定値を使用して内在信号成分の振幅、位相、振幅変調及び周波数変調を推定するために最も正確な適合を有するＨＲＷを選択するようにサンプルされる。これにより、幾つかの実施形態では、近くの発振器の推定値がより正確になるように、この成分の影響を除去することができる。シングレット変換処理を逆にして、オリジナル周波数ドメイン信号の一部又は全部を再生することができる。ステップ１１４において、方法１００は、追跡及びグループ化を実行するよう構成することができる。一例において、追跡を実行して、楽器又は人の声によって生成される単一の高調波のように、追跡アルゴリズムを使用して単一の発振器から発生し得る発振器ピークを識別することができる。単一源から発生していると判定された発振器ピークのセットは、トラックレットと呼ばれる。一例において、グループ化を実行し、単一源から発生するトラックレットを識別することができる。例えば、このようなグループ化は、単一の楽器又は人の声の複数の高調波を含む可能性がある。単一源から発生していると判定されたトラックレットのセットは、コヒーレントグループ化と呼ばれる。

ステップ１１８において、シングレット変換処理後の何れかの段階で発振器ピークを出力することができる。更に、追跡及びグループ化段階で収集された情報を使用して、要求される発振器ピークのセットを選択することができる。一例において、シングレット変換処理を使用して、一部又は全部の発振器ピークをオリジナル信号フォーマットの一部又は全部に正確に変換することができる。別の実施例において、一部又は全部の発振器ピークは、発話認識システムへの入力として使用することができる特徴ベクトルのような別のフォーマットに変換することができ、又は数学関数を介して直接、異なる出力フォーマットに変換することができる。上記のステップを使用して、あらゆる種類の信号を分析、分離及び再構成することができる。このシステムの出力は、オリジナル信号と同じ形式とすることができ、又は次の分析のためのオリジナル信号の数学的表現形式にすることができる。

本明細書において詳細な説明で使用される「周波数−位相予測」は、発振器ピークから構成されるトラックレットの周波数及び位相展開を予測する方法である。本明細書で使用される「特徴ベクトル」は、信号から測定されたデータセットである。更に、発話認識システムへの入力として、共通の特徴ベクトルが使用される。本明細書で使用される「窓付き変換」は、スペクトルピークを様々に形成するために、「テーパー」又は窓関数（例えば、ハニング、ハミング、ボックスカー、トライアングル、バートレット、ブラックマン、チェビシェフ、ガウスなど）によってオリジナルサンプル窓を事前乗算することを指す。本明細書で使用される「短い」とは、一般に、所与の状況に適切なサンプルの有限数を示し、短時間フーリエ変換（ＳＴＦＴ）のようなサンプルレートに応じて数千又は数百のサンプルを含むことができる。例えば、オーディオＣＤは、１秒当たりに４４１００サンプルを含み、よって、２０４８サンプルの短い窓は僅か１秒の約１／２０である。本明細書で使用される「トラックレット」は、追跡器が同じ発振器からのものと判定された異なるフレームからの発振器ピークのセットを示す。本明細書で使用される「マハラノビスの距離」は、不確実性尺度を考慮に入れた２つの多次元ポイント間の距離を測定するための当該技術分野で公知のアルゴリズムを示す。このアルゴリズムは、一般的に、追跡アプリケーションにおいて、トラックレット及び測定を結合しなければならない又は同じ源又は同じトラックレットに割り当てなくてはならない可能性を決定するのに使用される。本明細書で使用される「トラックレット関連付け」は、どの新しい測定を既存のトラックレットに結合しなくてはならないかを決定するための方法を示す。本明細書で使用される「グリーディ関連付け」は、トラックレット関連付けを実行するための当該技術分野で公知のアルゴリズムを示す。本明細書で使用される「区分化」は、トラックレットを別個のグループに分けるための方法を示す。一般的にこれらのグループは、人の会話のような別個の音声エミッタに対応することになる。本明細書で使用される「ユニオンファインド（ｕｎｉｏｎｆｉｎｄ）」は、区分化のための当該技術分野で公知のアルゴリズムである。本明細書で使用される「コヒーレントグループ」は、人の会話のような同じ信号発生器からのものであると判定されたトラックレットのセットを示す。本明細書で使用される「メル周波数複素係数」は、発話認識システムへの入力として一般的に使用される公知の種類の特徴要素である。

１又は２以上の実施形態によれば、本明細書で開示されるＳＳのための方法及びシステムは、複数の信号要素への源信号の分離を促進することができる。本明細書で記載される方法及びシステムを全体的に又は一部分使用して、源信号における個々の要素を分離及び増強することができる。システム及び方法は、一般にあらゆる信号源に適用して、信号分離を達成することができる。

１又は２以上の実施形態によれば、ＳＳのための方法及びシステムは、信号分離及び増強を実行するために部分的に又は組み合わせて使用することができる一連のアルゴリズムの実行を助けることができる。一連のアルゴリズムは、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアの組み合わせで実施することができる。

１又は２以上の実施形態によれば、ＳＳのための方法及びシステムは、シングルチャネル又はマルチチャネルとすることができる事前プロセッサ、及びシングルチャネル又はマルチチャネルとすることができる超分解能モジュールに構成することができる。１又は２以上の実施形態によれば、ＳＳのための方法は、短時間安定正弦波発振のための方法、短時間線形周波数変調方法、時間変化振幅変調方法、振幅及び周波数変調結合方法、及びシングレット表現法を含む、複素スペクトル位相展開に基づくことができる方法体系を含むことができる。本明細書で使用されるＦＭ−ＣＳＰＥは、周波数変調信号に適用されるＣＳＰＥ方法体系の中の特定の方法を示す。同様に、ＡＭ−ＣＳＰＥは、振幅変調信号に適用されるＣＳＰＥ方法体系の中の特定の方法を示す。

本明細書で記載されるＳＳのための方法及びシステムは、以下の利点の１又はそれ以上を提供することができる。例えば、本方法及びシステムは、源信号から干渉要素を別個に抽出するのを助けることができ、望ましくない要素を源信号から除去することができる。一例において、ＳＳのための本方法及びシステムを使用して、目標要素に悪影響を与えることなく源信号の目標要素を抽出又は分離することができる。別の実施例において、測定処理の畳み込み効果（「スミアリング」又は「不確実性原理」としても知られる）に関わらず、同じ周波数範囲内の重なり合った信号要素を独立して抽出し増強することができる。本明細書で記載されるＳＳのための方法及びシステムは、現在の処理技術に対して本明細書で開示されるＳＳのための方法及びシステムの処理技術の精度が向上したことに起因して、源信号の詳細分析の提供を可能にすることができる。

１又は２以上の実施形態によれば、ＳＳのための方法及びシステムは、信号成分追跡器を含むよう構成することができ、該信号成分追跡器は、時間的に及び／又は高調波によって、及び／又は他の類似性特徴によって信号成分をグループ化してコヒーレント源を識別する方法を実行するよう構成することができる。１又は２以上の実施形態によれば、ＳＳのための方法及びシステムは、コヒーレント構造集約器及びコヒーレント構造選択器／分離器を含むよう構成することができ、これによって、コヒーレント構造選択器／分離器は、抽出、分離、増強、及び／又は再合成のためのコヒーレント構造を識別する方法を実施するよう構成することができる。１又は２以上の実施形態によれば、本方法及びシステムは、複数の信号チャネルを単一の数学的構造に結合するため、及び統一ドメインで作用するよう設計されたあるバージョンのＣＳＰＥ法を利用するために、統一ドメイン変換及び統一ドメイン複素スペクトル位相展開（ＣＳＰＥ）を含むよう構成することができる。ＳＳのための方法及びシステムは、発振器ピークのセットからの周波数ドメイン信号の生成を助けることができる再合成モジュールを含むよう構成することができる。再合成モジュールは、シングルチャネル又はマルチチャネルモジュールを使用して実施することができる。

１又は２以上の実施形態によれば、ＳＳシステムは、マルチチャネル事前プロセッサ、マルチチャネル超分解能モジュール、追跡器／集約器／選択器／分離器、及びマルチチャネル再合成モジュールを含むよう構成することができる。１又は２以上の実施形態によれば、ＳＳのための方法は、複素スペクトル位相展開（ＣＳＰＥ）、シングレット表現法、統一ドメイン変換、統一ドメイン複素スペクトル位相展開、信号成分追跡、コヒーレント構造集約、コヒーレント構造分離、時間ドメインにおけるコヒーレント構造再構成、周囲信号再混合又は再構成及び他の動作のような動作のうちの１又はそれ以上を含むよう構成することができる。

ＣＳＰＥ動作は、高速フーリエ変換（ＦＦＴ）又は離散フーリエ変換（ＤＦＴ）の精度限界を克服する方法を示すことができる。ＣＳＰＥ動作は、幾つかの実施形態においては２１．５Ｈｚからおよそ０．１ＨｚのＦＦＴベースのスペクトル処理の精度を改善することができる。幾つかの実施形態では、精度は０．１Ｈｚよりもより良好にすることができる。１又は２以上の実施形態によれば、ＣＳＰＥ動作は、短時間安定正弦波発振方法、短時間線形周波数変調方法、時間変化振幅変調方法、及び振幅及び周波数変調結合方法を含むよう構成することができる。

シングレット表現法は、短時間安定又は準安定発振器を周波数ドメイン信号に投影することができ又は周波数ドメイン信号から抽出することができる方法を示す。一例において、発振器は、限定ではないが、正弦波発振、何れかの持続時間の短時間安定発振、準安定発振、又はこのような発振器の有限和によって所望の精度の程度に作成できる信号を含む、何れかの発振源を示すことができる。シングレット変換又はシングレット表現は、他の信号要素による干渉の程度を示すことができる発振器のスミアリング特性に関する情報と共に、発振器の振幅、位相及び（超分解能）周波数に関する情報を含むことができる。更に、シングレット表現は、オリジナルＦＦＴ又はＤＦＴの所与の周波数ビンにおける干渉のデシベル数の関数としてスミアリング及び干渉特性に関する情報を含むことができる。幾つかの実施形態では、シングレット表現は、（超分解能）周波数変調、振幅変調及び周波数−振幅変調結合特性に関する情報を含むことができる。

統一ドメイン変換は、複数の信号チャネルを単一の数学的構造に結合する方法を指すことができ、統一ドメイン複素スペクトル位相展開は、統一ドメインにおいて作用するよう設計されたあるバージョンのＣＳＰＥ方法を指すことができる。信号成分追跡は、コヒーレント源を識別するために時間において及び／又は高調波により、及び／又は他の類似性特性により信号成分をグループ化する方法を示すことができる。コヒーレント構造分離は、抽出、分離、増強、及び／又は再合成のためのコヒーレント構造を識別する方法を示すことができ、コヒーレント構造再構成は、選択された発振器ピークから構成される周波数ドメイン又は時間ドメイン信号を作成するための方法を示すことができる。周囲信号再混合又は再構成は、オリジナル信号（又はオリジナル信号の増幅又は減衰バージョン）を時間ドメインにおけるコヒーレント構造再構成によって作成された信号に加えて特定の望ましい特性を有する信号を生成する方法を示すことができる。一例において、出力は、時間ドメインにおけるコヒーレント構造再構成、周囲信号再混合又は再構成、特徴ベクトル作成及び数学的表現から他の出力フォーマットへの自動翻訳を含むことができる。

図２は、源信号２０２を複数の要素に分離するよう構成することができるＳＳシステム２００の実施形態を示す。１又は２以上の実施形態によれば、ＳＳシステム２００は、シングルチャネル事前プロセッサ２０４、シングルチャネル超分解能モジュール２０８、マルチチャネル事前プロセッサ２１０、マルチチャネル超分解能モジュール２１２、追跡器／集約器／選択器／分離器２１４、シングルチャネル再合成モジュール２２０、及びマルチチャネル再合成モジュール２２２などの１又は２以上の構成要素を含むよう構成することができる。これらの構成要素は、ハードウェア、ソフトウェア、又はフィールドプログラマブルゲートアレイ（ＦＰＧＡ）のようなプログラマブルハードウェアで実装することができる。

シングルチャネル事前プロセッサ２０４は、シングルチャネル超分解能モジュールによって処理することができるシングルチャネル時間ドメイン信号の事前処理（例えば準備）を助けることができる。シングルチャネル超分解能モジュール２０８は、シングルチャネル事前プロセッサによって準備された信号における発振器ピークのセットの検出を助けることができる。マルチチャネル事前プロセッサ２１０は、マルチチャネル超分解能モジュール２１２によって処理することができるマルチチャネル時間ドメイン信号の事前処理（例えば準備）を助けることができる。マルチチャネル超分解能モジュール２１２は、マルチチャネル事前プロセッサによって準備された信号における発振器ピークのセットの検出を助けることができる。１又は２以上の実施形態では、システムの単一の構成要素として動作するようにシングルチャネル又はマルチチャネル事前プロセッサを結合することができる。

追跡器／集約器／選択器／分離器（「ＴＡＳＳ」）２１４は、発振器ピークのサブセットをグループ化、分離、及び／又は選択するよう構成することができる。シングルチャネル再合成モジュール２２０は、発振器ピークのセットから周波数ドメイン信号を生成するよう構成することができる。マルチチャネル再合成モジュール２２２は、何れかの数のチャネルを含む、発振器ピークのセットからマルチチャネル周波数ドメイン信号を生成するよう構成することができる。１又は２以上の実施形態では、再合成は、シングルチャネルモジュール又はマルチチャネルモジュールによって生成されると説明できるが、これらは、システムの単一の構成要素として動作するように結合されてもよい。

１又は２以上の実施形態によれば、システム２００は、限定ではないが、オーディオ、ビデオ、写真、医用イメージング、セルラー、通信、レーダー、ソナー、及び地震信号処理システムを含む、特定用途用にカスタマイズされた、ハードウェア、ソフトウェア又はこれらの組み合わせで実装される様々な形式のアルゴリズムを利用又は含むよう構成することができる。図２に示すように、信号２０２を受信することができる。信号２０２は、周囲音のようなライブ映像、又は雑音環境の記録のような事前記録データに関連付けられたデータを含むことができる。受信した信号２０２は、シングルチャネル信号又はマルチチャネル信号としてグループ化することができる。信号２０２がモノオーディオ信号のようなシングルチャネルのデータを有する場合には、信号２０２に関連付けられるデータは、シングルチャネル事前プロセッサ２０４によって周波数ドメインに変換することができる。更に、シングルチャネル超分解能モジュール２０８を使用して、周波数ドメイン信号において１又は２以上の発振器ピークを識別することができる。

反対に、信号がステレオオーディオ信号のようなマルチチャネルのデータを有する場合には、マルチチャネルプロセッサ２１０を使用して信号２０２を周波数ドメインに変換することができる。更に、周波数ドメイン信号を統一ドメイン超分解能モジュール２１２に伝送することができ、ここで周波数データの統一ドメイン変換を実行して、統一ドメイン周波数データの（超分解能）発振器ピークを識別することができる。

１又は２以上の実施形態によれば、ＴＡＳＳモジュール２１４を利用して、ピークをグループ化することによって離散的な信号源を識別し、発振器ピークを集約して要求される離散源を分離することができる。ＴＡＳＳモジュール２１４は、集約された発振器ピークから１又は２以上のコヒーレントグループを選択するよう構成することができる。従って、ピークの１又は２以上のコヒーレントグループを分離して、１又は２以上のフォーマットの出力として１又は２以上のチャネルに配信することができる。

１又は２以上の実施形態によれば、図２に示す構成要素を使用して出力信号を再合成することができる。限定ではなく一例として、源信号２０２が、元はシングルチャネル信号である場合には、シングルチャネル再合成モジュール２２０を使用して発振器ピークを再合成信号２１８に変換することができる。再合成信号２１８はまた、本明細書においてシングルチャネル再合成モジュール２２０を使用して生成されたシングルチャネル信号と呼ぶことができる。同様に、源信号２０２が、元はマルチチャネル信号である場合には、マルチチャネル再合成モジュール２２２を使用して再合成信号２１８を生成するように発振器ピークを変換することができる。再合成信号２１８はまた、マルチチャネル再合成モジュール２２２を使用して生成された場合に本明細書でマルチチャネル信号と呼ぶことができる。例示のように、信号情報は、分析パラメータの小型形式で出力することができ；及び／又は信号は、分析パラメータからの数学的変換又は分析パラメータの再解釈によって達成できるような別のフォーマットに直接出力することができる。他の実施形態では、信号情報は、特徴ベクトルとして出力することができ、該特徴ベクトルは、発話認識器又はスピーカ識別システムのような別のアプリケーションに直接渡すことができる。

１又は２以上の実施形態によれば、シングルチャネル事前プロセッサ２０４は、シングルチャネル超分解能モジュール２０８を使用したシングルチャネルＣＳＰＥ超分解能技術による処理のためのシングルチャネル時間ドメイン信号データの準備を助けるよう構成することができる。シングルチャネル事前プロセッサ２０４への入力は、ライブ映像又は記録ファイルとすることができるシングルチャネル時間ドメイン信号である。一例において、マルチチャネルデータストリームは、マルチチャネルデータストリームの少なくとも１より多いチャネルを処理するよう構成することができるマルチチャネル事前プロセッサ２１０によって処理される。

従来の信号分析システムは、一般に、ＤＦＴ又はＦＦＴ又は離散コサイン変換（ＤＣＴ）又は関連の変換を使用して、信号分析及び増強のために時間ドメイン信号データを周波数ドメインに変換する。本明細書で開示されるＳＳのための方法及びシステムで利用される技術は、基本構成要素として２つ（又はそれ以上）のＦＦＴを使用した信号２０２の事前処理を助けるように構成することができ、ここで第２（又はそれ以上の）のＦＦＴへの時間ドメイン入力は、第１のＦＦＴへの入力に対して遅延した時間であるサンプルのセットである。

図３は、シングルチャネル事前プロセッサ２０４を使用して信号２０２を事前処理するための方法３００の例示的な実施形態を示す。例示されるように、ステップ３０２において、時間ドメイン信号ストリームをシングルチャネル事前プロセッサ２０４によって受信することができる。ステップ３０４において、信号２０２のような入力信号のｎ連続サンプルでサンプル窓を満たすことができる。ステップ３０８において、サンプル窓Ａ及びサンプル窓Ｂのような２つのサンプル窓を作成することができる。一例において、サンプル窓Ａのサイズ及びサンプル窓Ａのサンプルの数は、パラメータファイルにおいてユーザが指定することができる次のサンプル窓及び前のサンプル窓と重ねることができ、又はソフトウェア又はハードウェア実装の一部として設定することができる。一例において、サンプル窓Ｂは、本明細書ではサンプル窓Ａ及びＢが時間的にオフセットすることができかつサンプル窓Ｂがサンプル窓Ａより遅延することができるような時間遅延サンプル窓と呼ぶことができる。

ステップ３１０において、分析窓（本明細書ではテーパーと呼ばれる）は、サンプル窓Ａ及びサンプル窓Ｂに適用し、テーパーサンプル窓Ａ及びテーパーサンプル窓Ｂをそれぞれ作成するようにすることができる。一例において、分析窓は、アダマール積を使用して適用することができ、これによって２つのベクトルが項別にペアワイズで乗算される。アダマール／シャー積は、ベクトル、行列、又は一般的にアレイで定義することができる数学的演算である。２つのこのようなオブジェクトが同じ形状（及びひいては同じ位置における同じ数の要素）を有することができる場合には、アダマール／シャー積は、ベクトル、行列、又はアレイそれぞれにおける対応するエントリの要素別の積として定義される。この演算は、例えば、マトラブプログラミング言語では“．^*”によって示される演算子であるよう定義され、以下の関連では、以下の式における“．^*”又は演算子“

”として表される。一例として、２つのベクトルが、

及び

として定義される場合、アダマール／シャー積は、ベクトル

となる。別の実施例では、分析窓は、ハニング窓、ハミング窓、ウェルチ窓、ブラックマン窓、バートレット窓、矩形／ボックスカー窓、又は他の標準的な窓関数、又は固有の設計の他の類似の分析窓のような標準的窓関数であるように選択することができる。ステップ３１２において、テーパーサンプル窓Ａ及びＢは、ＤＦＴ又はＦＦＴ又は離散コサイン変換（ＤＣＴ）又は関連の変換を使用して周波数ドメインに変換することができる。結果として、ＦＤＡＴ（Ａ）及びＦＤＡＴ（Ｂ）は、複素形式になるように変換時に生成することができる。

図４は、周波数変調検出が要求されるときに、シングルチャネル事前プロセッサ２０４を使用して信号２０２を事前処理するための方法４００の例示的な実施形態を示す。例示のように、ステップ４０２において、シングルチャネル事前プロセッサ２０４によって時間ドメイン信号ストリームを受信することができる。ステップ４０４において、サンプル窓を信号２０２のような入力信号の連続サンプルで満たすことができる。ステップ４０８において、サンプル窓Ａ、サンプル窓Ｂ、サンプル窓（Ｂ＿アップ）及びサンプル窓（Ｂ＿ダウン）のような４つのサンプル窓を作成することができる。一例において、サンプル窓（Ｂ＿アップ）及びサンプル窓（Ｂ＿ダウン）は、（Ｂ）窓と同じサンプルを含むことができるが、異なるように処理することもできる。一例において、サンプル窓Ａのサイズ及びサンプル窓Ａにおけるサンプルの数は、パラメータファイルにおいてユーザが指定できる次のサンプル窓及び前のサンプル窓に重ねることができ、或いは、ソフトウェア又はハードウェア実装の一部として設定することができる。一例において、本明細書ではサンプル窓Ｂは、サンプル窓Ａ及びＢが時間的にオフセットできかつサンプル窓Ｂがサンプル窓Ａよりも遅延することができるような時間遅延サンプル窓と呼ぶことができる。

ステップ４１０において、分析窓（本明細書ではテーパーと呼ばれる）をサンプル窓Ａ及びサンプル窓Ｂに適用し、テーパーサンプル窓Ａ及びテーパーサンプル窓Ｂをそれぞれ作成するようにすることができる。ステップ４１２において、変調プルバック演算子をサンプル窓（Ｂ＿アップ）及びサンプル窓（Ｂ＿ダウン）に適用し、信号２０２における周波数変調検出を達成することができるテーパー窓を作成するようにすることができる。一例において、信号２０２における周波数変調検出は、サンプル変調プルバック演算子とサンプル窓（Ｂ＿アップ）及びサンプル窓（Ｂ＿ダウン）のような他のサンプルとの間のアダマール積を介して達成することができる。例えば、サンプル窓（Ｂ＿アップ）は、正の周波数変調の検出のため変調プルバック演算子と共に使用することができ、サンプル窓（Ｂ＿ダウン）は、負の周波数変調の検出のため変調プルバック演算子と共に使用することができる。ステップ４１４において、ＤＦＴ又はＦＦＴを使用して４つのテーパーサンプル窓全てを周波数ドメインに変換することができる。この結果、ＦＤＡＴ（Ａ）、ＦＤＡＴ（Ｂ）、ＦＤＡＴ（Ｂ＿アップ）及びＦＤＡＴ（Ｂ＿ダウン）が複素スペクトルの形式で作成される。

前述の方法（例えば、方法３００及び４００）は更に、ＦＤＡＴ（Ａ）からＦＤＡＴ（Ｂ）への複素スペクトルの展開を分析する段階と、複素スペクトルの各ピーク近くの複素スペクトルのローカル位相展開を決定する段階と、を含むことができる。結果として得られる位相変化を用いて、ＦＥＴ又はＤＦＴよりも細かい超分解能スケールで、観察された複素スペクトル位相展開を生成した内在周波数を決定することができる。内在周波数の計算は、ＣＳＰＥ方法を介して利用可能な超分解能の一例である。更に、方法４００は、ＦＤＡＴ（Ａ）からＦＤＡＴ（Ｂ＿ダウン）へ、及びＦＤＡＴ（Ａ）からＦＤＡＴ（Ｂ＿アップ）への複素スペクトルの展開を分析して、信号２０２における周波数変調の存在を検出するようなダウン変調及びアップ変調の特性を検出する段階を含むことができる。

本方法は更に、検出された内在周波数の各々に対して複素スペクトルにおける近くのポイントの複素スペクトル位相展開挙動を試験する段階を含むことができる。この試験は、複素スペクトルにおける近くのポイントの挙動が複素スペクトルのピークの近くで観察される挙動に一致するかどうかを判定するのを助けることができる。このような手法は、適正に動作したピークを保持し、矛盾するピークを排除するように適用することができる。同様に、各個別の変調する内在周波数に対して、本方法は、複素スペクトルにおける近くのポイントの複素スペクトル位相展開挙動を試験して、これらがピークの近くの観察される変調挙動と一致する方式で展開するかどうかを決定する段階を含むことができる。

本方法は更に、各一致したピークに対して測定されたＦＦＴ又はＤＦＴ複素スペクトルを生成した内在信号成分の振幅及び位相を決定するためにデコンボリューション分析を行う段階を含むことができる。更に、測定されたＦＦＴ又はＤＦＴ複素スペクトルを生成した内在信号成分の各一致した変調ピークに対する基準周波数、振幅、位相、及び変調速度を決定することができる。基準周波数は、一般に、時間ドメインサンプルのフレームの始め又は中間に設定される。

シングルチャネル事前プロセッサ２０４によって実行される前述の方法は、シングルチャネルＣＳＰＥ超分解能法によって処理することができる少なくとも２つの周波数ドメインデータセットを作成する。説明するように、第２のセットに入力された時間ドメインは、少数のサンプルによる第１のセットに入力された時間ドメインよりも遅延し、これは僅かな時間遅延に対応する。各入力は、分析窓と乗算して、次いで、ＤＦＴ又はＦＦＴによって周波数ドメインに変換される。事前プロセッサの周波数ドメイン出力は、以下ではＦＤＡＴ（Ａ）及びＦＤＡＴ（Ｂ）と呼ばれる。更に、周波数変調検出が要求される場合には、ＦＤＡＴ（Ｂ＿アップ）及びＦＤＡＴ（Ｂ＿ダウン）のような２つの付加的な周波数ドメインデータセットを作成することができる。ＦＤＡＴ（Ｂ＿アップ）及びＦＤＡＴ（Ｂ＿ダウン）は、周波数ドメインへの変換前に変調プルバック演算子が適用されるサンプル窓（Ｂ）に包含された時間遅延サンプルの周波数ドメイン表現である。ＦＤＡＴ（Ｂ＿アップ）は、正の周波数変調プルバック演算子が適用され、ＦＤＡＴ（Ｂ＿ダウン）は、負の周波数変調プルバック演算子が適用されている。

従って、例示的かつ非限定的実施形態による入力、方法及び上述の出力を介して、事前プロセッサは、信号ストリームを受信して周波数ドメインのデータセットを作成し、次に、時間ドメインの入力サンプルの第１のセット及び時間ドメインの入力サンプルの少なくとも第２のセットを作成する。入力サンプル時間の第２のセットの開始は、入力サンプルの第１のセットの開始よりも遅れ、従って、２つの窓を作成して、そのうちの１つの開始は、他方に対して時間的に遅延する。次いで、入力サンプルの第１及び第２のセットは、周波数ドメインに変換され、複素周波数スペクトルを含む周波数ドメインデータが、入力サンプルの第１のセット及び第２のセットの各々に対して出力される。幾つかの実施形態では、入力サンプルの第１及び第２のセットが、ＤＦＴ及びＦＦＴ又は他の変換の少なくとも１つを使用して周波数スペクトルに変換される。更に他の実施形態では、周波数変調を検出するための任意選択的な変換を時間遅延窓に適用することができる。幾つかの実施形態では、テーパー又は窓関数を時間ドメインの窓に適用することができる。

幾つかの実施形態では、適用される変換は、複素ドメインデータを出力することができない。例えば、離散コサイン変換（ＤＣＴ）の適用は、複素ドメインにはない実部データの出力を生じる傾向がある。

明らかなように、記載される事前処理方法は、（ｉ）ＣＳＰＥを実行するのを可能にする窓間の時間ラグの概念を導入し、（ｉｉ）周波数変調検出を実行するために一般的に適用される様々なタイプの変換を利用することができる。「時間ラグ」とは、重なり合う方式で第１の窓の開始及び終了よりも後で第２の窓が開始及び終了することを意味する。この時間ラグは、情報を格納する人間の脳の能力を擬似している。

１又は２以上の実施形態によれば、シングルチャネル超分解能モジュール２０８は、高周波数精度を取得してシングレット表現法を可能にして使用し、信号２０２のようなオリジナル信号の成分を抽出するよう構成することができる。シングルチャネル超分解能モジュール２０８は、信号２０２からの成分の抽出を助けるために以下の入力を使用するよう構成することができる。シングルチャネル超分解能モジュール２０８は、シングルチャネル事前プロセッサ２０４によって生成された周波数ドメインデータの少なくとも２つのセット（ＦＤＡＴ（Ａ）及びＦＤＡＴ（Ｂ））、テーパー関数をサンプル窓Ａ及びサンプル窓Ｂに加えている間に使用することができる１又は２以上のパラメータ、ＤＦＴ又はＦＦＴ変換よりも遙かに細かい分解能の窓関数の変換の超分解能分析、及び同様のものなどの入力情報を必要とすることができる。この情報は、窓関数の機能的形式が推測的に公知であるので事前にコンピュータ計算することができ、一般的に何れかの所望の精度にまで分析することができる。更に、シングルチャネル超分解能モジュール２０８は、信号２０２における周波数変調の検出のためにシングルチャネル事前プロセッサ２０４によって生成される周波数ドメインデータの２つの付加的なセットＦＤＡＴ（Ｂ＿アップ）及びＦＤＡＴ（Ｂ＿ダウン）を要求することができる。任意選択的に、シングルチャネル超分解能モジュール２０８は、振幅変調及び周波数／振幅結合変調の検出及び特徴付けのための付加的な超分解能分析窓を使用することができる。

図５は、信号成分のセットの抽出を可能にするために高精度周波数推定値を生成する方法５００を示す。シングルチャネル超分解能モジュール２０８は、周波数ドメインデータの２つのセット（ＦＤＡＴ（Ａ）及びＦＤＡＴ（Ｂ））及び分析窓を含むことができる入力５０２を利用するよう構成することができる。ステップ５０４において、シングルチャネル超分解能モジュール２０８は、複素スペクトル位相展開を計算して、次の信号抽出のための高分解能周波数を生成するように構成することができる。ステップ５０８において、複素スペクトル（ＦＤＡＴ（Ａ）又はＦＤＡＴ（Ｂ））における発振器ピークが識別されて、発振器ピークのリスト５１０を生成するようにする。発振器ピークは、周波数ドメインへの発振器の投影として定義することができ、処理過程におけるある段階の極大値として識別することができる。

一例において、ステップ５１２において、発振器ピークを選択するために、識別された極大値の各々に対して複素スペクトル（ＦＤＡＴ（Ａ）又はＦＤＡＴ（Ｂ））における近くのポイントのＣＳＰＥ挙動を試験することができる。この試験は、複素スペクトルにおける近くのポイントの挙動が複素スペクトルにおけるピークの近くの観察される挙動と一致するかどうかを判定するのを助けることができる。このような手法は、適正に動作したピークを保持し、矛盾するピークを排除するように適用することができる。同様に、各個別の変調する内在周波数に対して、複素スペクトルにおける近くのポイントのＣＳＰＥ挙動を試験して、ピークの近くの観察される変調挙動と一致する方式で展開するかどうかを決定することができる。一例において、ピーク排除基準を適用して、発振器のメインローブによって生成された目標最大値を発振器の望ましくない雑音又はサイドローブのような他の現象によって生成された非目標最大値から区別することができる。更に、多種多様な選択基準による目標最大値の抽出を優先させることができる。多種多様な選択基準は、限定ではないが、大きさ選択、周波数選択、心理音響的知覚モデルに基づく選択、或いは高調波又は適切な高調波関係を示す周波数成分の識別に基づく選択を含むことができる。

ステップ５１４において、出力を生成するために１又は２以上のシングレット表現法を使用することができる。１又は２以上のシングレット表現法は、ステップ５２０において、発振器ピーク５１８の振幅、位相、及び任意選択的に振幅及び周波数変調を決定する段階を含むことができる。更に、１又は２以上のシングレット表現法は、更新された発振器ピークの生成５２２及びステップ５２４のスペクトルデータの更新を含むことができる。本方法は、ＦＤＡＴ（Ａ）及びＦＤＡＴ（Ｂ）から発振器ピークの寄与分を除去する段階を含むことができ、これは、ＡＭ変調及びＦＭ変調発振器ピークを含む何れかのタイプの発振器ピークに対して行うことができる。寄与分の除去は、ＦＤＡＴ（Ａ）又はＦＤＡＴ（Ｂ）における最大値の領域を超えて拡張し、存在する他の信号成分に対する発振器のスミア干渉効果を取り出すことができる。このようなタイプの除去処理は、前の処理ステップの超分解能分析によって可能とすることができる非ローカル計算である。更に、シングレット表現法は、ナイキスト周波数を介し及びＤＣ（ゼロモード）周波数を介した信号成分のエイリアシングの一貫した処理を含むことができる。

ステップ５２８において、処理が完了したかどうかに関して判定される。すなわち、処理の完了の判定は、適切な数の目標最大値が識別されたかどうか、信号成分が追跡及び／又はコヒーレントグループへの集約及び／又は分離及び選択及び／又は再合成の準備ができているかどうかを含むことができる。シングルチャネル超分解能モジュール２０８は、処理が完了していないと判定された場合に、スペクトルデータ５３０を使用して処理ステップを繰り返すよう構成することができる。方法５００は、処理が完了したと判定された場合にはステップ５３２に進み、５３２において発振器ピーク５３４が出力され、例えばユーザに表示される。

図６は、信号成分のセットの抽出を可能にするために、高精度周波数並びにＡＭ及びＦＭ変調推定値を生成する方法６００を示す。方法６００は、方法５００によって要求されるようなデータセットと比較したときに、周波数ドメインデータの２つの付加的なセットＦＤＡＴ（Ｂ＿アップ）及びＦＤＡＴ（Ｂ＿ダウン）を必要とすることができる。周波数ドメインデータの付加的なセットは、オリジナル信号２０２内のＡＭ及び／又は周波数変調の検出を可能にすることができる。ステップ６０２において、方法６００は、ＦＤＡＴ（Ａ）、ＦＤＡＴ（Ｂ）、ＦＤＡＴ（Ｂ＿アップ）及びＦＤＡＴ（Ｂ＿ダウン）のような複素スペクトルデータに対してＣＰＳＥを実行することができる。ステップ６０４において、発振器ピークリストを作成することができ、６０８において、方法５００の５０８及び５１２においてそれぞれ開示された技術を使用して発振器ピークが選択される。ステップ６１０において、方法６００は、信号２０２から成分を抽出するために１又は２以上のシングレット表現技術を含むよう構成することができる。これらの技術は更に、高度シングレット適合処理に関して本明細書で開示される。方法６００は、ステップ６１２に進むことができ、ここで処理の完了に関する判定が行われる。完了すると、ステップ６１４において、方法６００は発振器ピークを出力することができる。

従って、入力を取り出して本明細書で記載される方法を実行する特定の例示的かつ非限定的実施形態によれば、プロセッサは、所与の又は「基本的な」変換分解能を各々が有する周波数ドメインデータの第１のセット及び第２のセットを受信し、本明細書で更に記載するように周波数ドメインデータに対して複素スペクトル位相展開（ＣＳＰＥ）を実行して、基本変換分解能よりも通常は高い極めて高精度の分解能で成分周波数を推定する。本明細書で使用される「変換分解能」は、変換方法のインヒーレントな分解能の限界を示し、例えば、ＤＦＴ又はＦＦＴが１秒当たりＱサンプルでサンプルされたデータから取られたＮポイントサンプル窓で計算される場合、ＤＦＴ又はＦＦＴは、半分が正（又は正スピニング）の周波数ビンに対応し半分が負（又は負スピニング）の周波数ビンに対応する（当業者には公知の標準的な規則によって定義される）Ｎ周波数ビンを提示することになり、この方法で検出できる最も適正にサンプルされた信号はＱ／２の周波数であり、これはＮ／２正周波数ビンに分割され、１ビン当たりＱ／Ｎヘルツのインヒーレントな「変換分解能」を結果として生じる。他の変換技術の何れかに対して類似の計算を行い、対応する「変換分解能」を決定することができる。幾つかの実施形態では、周波数ドメインデータにおいて１又は２以上の発振器ピークを識別する段階と、識別された発振器ピークの少なくとも１つの近くの少なくとも１つのポイントのＣＳＰＥ挙動を試験して適正に動作した及び／又は短期安定発振ピークを判定する段階と、識別された発振器ピークの抽出を実行する段階と、を含むピーク選択を更に実行することができる。更に他の実施形態では、各識別された発振器ピークの振幅及び位相を判定し、シングレット変換／シングレット表現を実行して高分解能空間から低分解能空間にマップすることができる。更に他の実施形態では、シングレット表現を更に実行し、周波数ドメインデータから各識別された発振器ピークの寄与分を除去することができる。

上記及び本明細書で使用される「所与の」、「オリジナル」又は「基本的な」変換分解能は、ＦＦＴのような変換の分解能であり、周波数ドメインデータの入力データセットを提供するのに使用され、すなわち、変換のインヒーレントな分解能が、ＣＳＰＥの基本構成要素として使用される。ＣＳＰＥ変換自体の付加的な詳細を以下に示す。

ＣＳＰＥは、標準的ＤＦＴ又はＦＦＴのような従来の変換によって生成されるよりも高精度の周波数の推定値を計算する。従来のＦＦＴ及びＤＦＴ方法は、周波数推定値が周波数ビンの中心に位置付けられると仮定するが、１又は２以上の実施形態によるＣＳＰＥは、時間の経過に伴って信号の複素位相の回転を測定して、周波数ビン内のその位置の高分解能推定値を生成する。本開示全体を通じたＣＳＰＥへの言及は、周波数ビン内の極めて高い分解能での複素位相の回転のような信号の特性を推定するためにこの機能を含むことを理解されたい。１又は２以上の実施形態によれば、本明細書で開示されるＣＳＰＥ方法は、超分解能周波数信号分析を提供することができる。一般的に、Ｎ個のサンプルが、信号、例えば、．ｗａｖフォーマットの音楽ファイルからのデジタルサンプル信号、又は何れかのセンサデバイスに付属することができるアナログ−デジタルコンバータの出力、或いは黒−白又はＲＧＢフォーマットの画像のスキャンライン、及びその他から取得される。信号のＮ個のサンプル（例えば、サンプル１，．．．，Ｎ）に対して、離散フーリエ変換（ＤＦＴ）又は高速フーリエ変換（ＦＦＴ）のようなフーリエ変換が実行される。同様にＮ個のサンプルは、信号の時間遅延スナップショット（例えば、時間遅延τに対するサンプルτ＋１，．．．，τ＋Ｎ）から取得され、これらの時間遅延サンプルにフーリエ変換が適用される。次いで、オリジナルサンプルと時間遅延サンプルとの間の複素フーリエ変換の位相展開が分析される。特に、変換の共役積が取得され（乗算は、乗算が第１変換ベクトルの要素及び第２変換ベクトルの複素共役に対して項別に行われる場合にシャー又はアダマール積である）、次いでこの共役積の角度が取得される。この積及び角度情報を使用して、多数の有利な応用を実現することができる。例えば、角度を変換と比較して、信号の正確な内在周波数を決定できるように周期の分数乗算を求めることができる。位相展開を用いて、オリジナル変換によって可能なものよりも高い分解能で正確な信号周波数を決定すると、補正された信号パワー値を計算することが可能になる。更に、フーリエ変換の周波数ビンにおけるパワーは、とりわけ周波数を補正するために再割り当てすることができる。この場合、近くの周波数ビンにスミアされた信号パワーは、正確な源信号周波数に再割り当てされる。

ＣＳＰＥアルゴリズムは、信号２０２の周波数スペクトルにおける発振成分の検出を可能にし、一般的に、変換において存在できる周波数に改良された分解能を提供することができる。上述したように、計算はＤＦＴ又はＦＦＴによって行うことができる。しかしながら、連続変換及びハードウェアベースの変換を含む、他の変換を使用してもよい。

以下の実施例において示されるように、信号ｓ（ｔ）が与えられると、同じ信号のデジタルサンプルバージョン

が定義される。信号のＮ個のサンプルが取られた場合、信号のＤＦＴは、ＤＦＴ行列を最初に定義することによって計算することができる。

に対して、行列は次式のように記述できる。

行列の各列は、Ｎポイントサンプル窓にわたって整数周期を発振している複素正弦関数である。１又は２以上の実施形態によれば、指数の符号を変えることができ、ＣＳＰＥの定義では、複素共役を第１項又は第２項の何れかに置くことができる。

Ｎ個のサンプルの所与のブロックに対して、次式を定義する。

及び一般的には、

信号のＤＦＴは以下のようにコンピュータ計算することができる。

上述したように、ＣＳＰＥは、Ｎポイントの初期サンプルとＮポイントの時間遅延サンプルとの間の信号成分の位相展開を分析することができる。時間遅延をΔ及び

及び

の複素共役の積によって指定することができることで、ＣＳＰＥは、積の角度として（シャー積又はアダマール積としても公知のマトラブの“．^*”演算子に等しい、ビン単位ベースで取られた）定義することができる。

ここで

演算子は、積がシャー又はアダマール積のように要素別ベースで取られることを示しており、

演算子は、積から生じた複素エントリの角度が取られることを示す。

正弦関数データにおけるこの例示的な処理を例示するために、周期ｐ＝ｑ＋δを有する複素正弦関数形式の信号を取り、ここでｑは整数、δは１より小さい大きさの分数偏差、すなわち

である。複素正弦関数のサンプルは、次式のように記述することができる。

１つのサンプルのシフトを取った場合には、ＣＳＰＥにおいてΔ＝１であり、

これを書き換えて以下を得ることができる。

変換の共役積（この場合も要素毎ベースで取られる）を求め、以下の結果が得られる。

ＣＳＰＥはこの積の角度を取り、次式を見つけることによって得られる。

これを標準的ＤＦＴ計算の情報と比較した場合、周波数ビンは、２π／Ｎの整数倍数であり、よってＣＳＰＥ計算は、２π／Ｎの整数倍数で現れる信号の代わりに、信号は実際にはｑ＋δによって与えられる分数倍数であると判定される情報を提供する。この結果は、考慮中の周波数ドメインとは関係なく、ＣＳＰＥは、どのような周波数ドメインのビンが考慮されようとも内在周波数の正確な決定を可能にすることができる。同じ信号のＤＦＴを探す際に、信号は、周波数ビンｑ−１、ｑ、又はｑ＋１の最大パワーを有することになり、

である場合、信号パワーは、ビンの範囲外の周波数ビンにまでリークすることになる。他方、ＣＳＰＥは、ＤＦＴの周波数ビンにおけるパワーを信号パワーを生成した正確な内在周波数に再割り当てすることができる。１又は２以上の実施形態によれば、Ω行列の定義である右の列は、「負周波数」の複素正弦関数として解釈されることが多く、以下のことによる。

同様に、最後から２列目は次式に等しい。

本明細書の説明において使用される用語「負周波数成分」は、このようにして再解釈することができる列への信号の投影を示すことができる（当該技術分野で使用される標準的規則に従う）。

１又は２以上の実施形態によれば、本明細書の方法４００及び５００で使用される発振器ピーク選択処理は、発振器のメインローブ効果である周波数ドメインスペクトルにおける最大値の識別、及び周波数ドメインデータから発振器ピークを抽出する最適順序の決定を助けることができる。一例において、発振器ピーク選択処理は、ＦＤＡＴ（Ａ）に格納された複素周波数データを振幅に変換することを含むことができる。ＦＤＡＴ（Ａ）の要素の振幅は、その要素の複素値の絶対値である。ＦＤＡＴ（Ａ）の要素の振幅は、本明細書ではスペクトル振幅（Ａ）と呼ぶことができる。

発振器ピーク選択処理は、スペクトル振幅（Ａ）における極大値を識別する段階を含むことができる。一例において、位置ｎにおける要素は、位置ｎにおける振幅が位置ｎ−１における要素の振幅及び位置ｎ＋１における要素の振幅よりも大きい場合に極大値である。更に、発振器ピークとして本明細書で呼ばれる発振器のメインローブ効果を識別するために極大値を試験することができる。例えば、極大値の振幅を最小閾値に対して試験することができる。別の実施例において、極大値の位置に対応するＣＳＰＥ周波数の近接性が当該位置に対応するＦＦＴ周波数ビンの中心に対して決定される。ＣＳＰＥ周波数が十分近似していない場合、これは、極大値が発振器のサイドローブ効果であること、又は雑音誘導ピークであることを表すことができる。しかしながら、極大値の振幅が特定の閾値よりも大きい場合、極大値は、早期の試験であるかに関係なく、有意なピークであるとみなすことができ、発振器のグループから構成することができる。

発振器ピーク選択処理は、ＦＤＡＴ（Ａ）及びＦＤＡＴ（Ｂ）から発振器ピークを抽出する順序を決定する段階を含むことができる。より高い優先順位ピークは、所与の応用に適切な選択基準を使用して選択され、すなわち、例えば、特定のタイプのより高い順序のピークは通常、所与の状況において雑音ではなく要求される信号のより顕著な特徴である。ピークは、他の技術の中でも、大きさ選択、心理音響的知覚モデル（発話認識又は発話フィルタリングのための信号抽出の場合など）、トラック持続時間、トラックオンセット時間、高調波関連付け、適切な高調波関連付け又は所与の応用に適切な何れかの他の基準によって選択することができる。

１又は２以上の実施形態によれば、ＣＳＰＥ高分解能分析は、音色様信号成分を適切に定義された周波数を有する構造化（例えばライン）スペクトルに変換するよう構成することができ、雑音様の信号帯域は、一般的には構造形態を示さない。従って、信号は、音色様及び雑音様成分に実質的に分離することができる。発振器ピークを選択するために、実施形態において、一連のステップを利用することができる。例えば、第１に、ＣＳＰＥ分析は、検出された各個別の内在周波数に対する複素スペクトルにおける近くのポイントの複素スペクトル位相展開挙動を試験して、これらが、複素スペクトルにおけるピークの近くの観察される挙動と一致するように展開するかどうかを判定することができる。更なる基準を適用して、適切に動作するピークを保持し、適切に動作しない（例えば矛盾した）ピークを排除することができる。

一例において、ＣＳＰＥ分析は、各一致した適切に動作するピークに対するデコンボリューション分析を行い、測定されたＦＦＴ又はＤＦＴ複素スペクトルを生成した内在信号成分の振幅及び位相を決定するように構成することができる。高分解能周波数分析から取得されたデータを使用して、重要性の順序で信号成分に優先順位を付けることができ、例えば、雑音環境における発話信号の認識の場合の優先順位は、知覚的重要性又は明瞭度への影響に基づくことができる。心理音響的知覚モデル（ＰＰＭ）を統一ドメインにおいて提供することができ、これによってデータの各チャネルに対する独立したコンピュータ計算を別個に計算する必要がなくなり、統一ドメインＰＰＭは、マルチチャネルデータの特定の成分に優先順位を与えるのに使用できる情報を提供することができる。一例において、統一ドメインＰＰＭを使用して、指定された方向又は方向の範囲から来る信号を重要視することができる。従って、信号のスペクトル、空間及び時間的態様の効果を１つのアルゴリズムに組み入れる統一心理音響的知覚モデル（ＵＰＰＭ）が提供される。このアルゴリズムは、ハードウェアで具現化するか、又はソフトウェア内に実装することができる。

１又は２以上の実施形態によれば、ＵＰＰＭコンピュータ計算は、３つのステップに分けることができる。第１のステップは、音色様の信号成分と雑音様の信号成分を区別することができる高分解能信号分析を含むことができる。第２のステップは、周波数、音圧力レベル、及び空間位置に基づく信号成分のコヒーレンシーグループの計算を含むことができ、各コヒーレンシーグループは、強調することができる「明瞭度の単位」を提供する。更に、コヒーレンシーグループの干渉及び分離を計算及び投影し、統一ドメインにおけるコヒーレンシー表面を作成することができる。一例において、コヒーレンシー表面を利用して、空間場全体にわたり定義される表面を作成することができる。更に、ステレオオーディオ信号、左及び右チャネルの統一ドメインからの変換によって、コヒーレンシー曲線を得ることができる。従って、従来のシングルチャネル処理技術を信号に対して依然として実行することができる。何れの時点においても、マルチチャネル信号を統一ドメインに変換して戻すことができ、又は統一ドメインの信号を信号処理の目的のためにマルチチャネル信号（又はシングルチャネル信号）に変換することができる。

１又は２以上の実施形態によれば、信号表現方法は、周波数ドメインデータから発振器のパラメータを識別することができる動作セットを含むことができ、又は発振器のパラメータを使用して周波数ドメインデータを生成することができる。１又は２以上の実施形態によるシングレット変換処理における様々なステップは、周波数ドメインにおける発振器の投影の正規化形状を計算する段階を含むことができる。更にステップは、計算されたスペクトルを周波数データのセットに当てはめて低周波数発振器の振幅及び位相を計算することによって、発振器の大きさ及び位相を計算する段階を含むことができ、ＤＣを介してエイリアシングすることによって起こる干渉効果を考慮に入れる。更に、ステップは、周波数ドメインデータに発振器の周波数ドメイン表現を加算するか、又は周波数ドメインデータから発振器の周波数ドメイン表現を減算する段階を含むことができ、ナイキスト及びＤＣを介したエイリアシングを考慮に入れる。１又は２以上の実施形態によれば、複素分析方法を利用して、単一のＦＦＴ窓内の発振器ピークの周波数及び振幅変調を更に特徴付けることができる。これらの複素アルゴリズムは、本明細書で更に詳細に検討される。

１又は２以上の実施形態によれば、周波数ドメインにおける発振器の投影の正規化形状は、シングルチャネル事前プロセッサ２０４で使用された分析窓の高分解能周波数ドメインバージョンを含む入力、及びＣＳＰＥによって作成された発振器ピークの高精度周波数推定値を使用して計算することができる。シングルチャネル事前プロセッサ２０４で使用される分析窓の高分解能周波数ドメインバージョンはまた、本明細書でＦＷＩＮとも呼ばれる場合がある。ＦＷＩＮは、テーパーをサンプル窓Ａ及びサンプル窓Ｂに適用するためにシングルチャネル事前プロセッサ２０４にて使用される分析窓の高分解能バージョンの周波数ドメイン表現である。ＦＷＩＮは、オリジナル分析よりも１６又は３２倍長くすることができる。この倍数は、「アップサンプル」レートと呼ばれる。他の実施形態では、分析窓の高分解能バージョンは、数学的関数表現によって正確に認知することができる。

発振器の周波数がＦＦＴビンの中心にあると判定された場合、発振器の投影形状は、ＦＷＩＮのダウンサンプルバージョンに一致し、最初にその中心でＦＷＩＮからポインタを選択して、次いでアップサンプルレートの間隔でポイントを選択することによって作成することができる。周波数がＦＦＴビンの中心にない場合、発振器の形状は、このポイントから周波数が僅かにオフセットされたＦＷＩＮのサブセットに対応することができる。１又は２以上の実施形態によれば、周波数ドメインへの発振器の投影の形状は、この位置に対応するＦＦＴビンの中心とＣＳＰＥ周波数との間の周波数の距離を計算する段階を含むことができる方法を使用して作成することができる。本方法は更に、ＦＷＩＮの中心に上記で計算されたオフセットを加えた周波数にてＦＷＩＮから第１サンプルを選択する段階を含むことができる。本方法は、アップサンプルレートに基づく事前に決められた間隔でＦＷＩＮからサンプルを選ぶ計算ステップを含むことができる。例えば、計算されたオフセットがＦＷＩＮにおける５ビンに相当する場合、アップサンプルレートは１６であり、ＦＷＩＮの中心ビンは３２７６９に対応し、次いで選択されたＦＷＩＮビンは、［．．．，３７４１，３２７５７，３２７７３，３２７８９，３２８０５．．．］とすることができる。一例において、選択できるビンの数は、システムのユーザ定義パラメータに依存することができる。このステップの出力は、ＦＷＩＮから選択された複素サンプルのセットであり、これらの複素サンプルは、本明細書では発振器ピーク標準化スペクトルと呼ぶことができる。これらのサンプルは、不正確な振幅及び位相を有する可能性がある。

１又は２以上の実施形態によれば、ＦＷＩＮから選択された複素サンプルの正確な振幅及び位相は、発振器のピーク形状の決定に応じて計算することができる。一例において、振幅及び位相計算は、一般的にはＦＤＡＴ（Ａ）に格納された周波数ドメインデータのセットに発振器の形状を適合させることによって達成することができ、この位相はまた、本明細書では適合振幅位相と呼ぶことができ、発振器ピーク標準化スペクトル、ＣＳＰＥによって計算された発振器ピークの高精度周波数、及び周波数ドメインデータのセット、一般的にはＦＤＡＴ（Ａ）を必要とすることができる。更に本方法は、スペクトルデータに適合する大きさ及び位相回転を求めて、サンプル正規化スペクトルを新しい大きさ及び位相で乗算する段階を含むことができる。

信号成分の周波数の推定に基づいて、信号の測定されたスペクトルへの当該信号成分の寄与の正確な近似を決定することができる。１又は２以上の実施形態によれば、これは、周波数ビンの中間にセンタリングされていない信号に適用されたときに離散フーリエ変換の特性から得られる。この処理は、コンボリューション（畳み込み）及び窓の特性から得られる。他の実施形態では、分析窓の高分解能バージョンが数学的関数表現として正確に既知とすることができる場合、畳み込み特性は連続方式で計算することができる。

１又は２以上の実施形態によれば、信号が分析されるときに、サンプルの有限数を選択することができ、変換をコンピュータ計算することができる。限定ではなく一例として、ＤＦＴを信号に適用することができる。しかしながら、類似の特性を有し当該技術分野に精通した研究者に公知の他の変換を信号に適用することができる。データの窓の変換は、一般的に窓ステップが先行し、この場合、窓関数Ｗ（ｔ）は、データＳ（ｔ）で乗算される。Ｗ（ｔ）は分析窓と呼ばれるものとする（後で、データの窓を同じ又は異なる合成窓を使用してリアセンブリすることができる）。データは時間ドメインの窓で乗算されるので、畳み込み定理は、Ｗ（ｔ）^*Ｓ（ｔ）の積の周波数ドメイン表現が、変換の畳み込み

及び

を示すことを表しており、ここで、これらはそれぞれにＷ（ｔ）及びＳ（ｔ）の変換であることを示している。周波数ｆ₀で大きさＭ₀の信号成分が存在することを高分解能スペクトル分析が明らかにした場合、畳み込み定理は、本質的に形式

の項を所与とすると、分析窓に似た形状のｆ₀にセンタリングされた寄与の存在を意味している。離散フーリエ変換によって計算されたスペクトルのような離散スペクトルでは、スペクトルのサンプルバージョンをもたらすポイントの有限格子が存在する。従って、上述のｆ₀にセンタリングされた寄与は、スペクトルにおける非ゼロの最低周波数の整数倍である有限格子ポイントでサンプルされる。同等に、１秒当たりＲサンプルのサンプルレートで適切にサンプルされたデータのＮポイントに対して離散フーリエ変換が計算される場合、取り込まれる最高周波数は、Ｒ／２Ｈｚのナイキスト周波数であり、Ｎ／２独立周波数ビンが存在することになる。これは、（Ｒ／２Ｈｚ）／（Ｎ／２ビン）＝Ｒ／ＮＨｚ／ビンの最低サンプル周波数を提供する。更に、離散フーリエ変換における他の全ての周波数は、Ｒ／Ｎの整数倍数である。

分析窓付き変換

の認識を使用して、大きさの優良な推定値Ｍ₀を計算することができる。この値を計算するために、ｆ₀（ｆ_grid）に最も近い周波数格子ポイントが識別され、差分Δｆ＝ｆ₀-ｆ_gridが計算され、当該格子ポイントでの信号の変換の大きさの値Ｍ_gridが計算される。次に以下の関係式から真の大きさを計算することができる。

一例において、

が、分析窓の変換の最大の大きさを意味するように取り出され、一般的に１に正規化される。また、分析窓の変換は一般的に対称であり、よって、Δｆの符号は一般的には問題ではない。これらの関係は、基本的な畳み込み関係の操作によって当業者によって例外的な窓関数に適応させることができる。固定分解能を

の認識と仮定すると、

は、２倍、４倍、８倍、１６倍、３２倍、又は６４倍、又はＤＦＴにおける周波数格子の分解能より細かいＮ倍である微細スケール格子でサンプリングすることができる。この場合、差分値Δｆが、微細スケール格子に対応することができる周波数ビンの最も近い分数まで計算される。例えば、微細スケール格子が変換のオリジナル周波数格子よりも１６倍細かい場合、Δｆは、オリジナル周波数格子の１／１６まで計算される。望ましい細粒度分解能は、特定の応用に依存し、当業者によって選択することができる。

１又は２以上の実施形態によれば、真の信号の位相は、真の信号の周波数及び大きさの推定に基づいて調整することができ、離散的な周波数スペクトルによって提示される位相と信号を整合できるようにすることができる。よって、φ_gridが大きさＭ_gridと関連付けられる位相角度を表し、φ_winが

の位相角度を表す場合、分析窓は、φ_rot＝φ_grid-φ_winに等しい量だけ回転しなくてはならない。これが行われると、信号成分に関する情報の全ては、ｆ₀、Ｍ₀、及びφ_rotの値によって取り込まれる。結果として、信号成分の再構成は、分析窓

の表現、周波数ｆ₀への表現のシフト、角度φ_rotの分析窓の回転、及び大きさＭ₀による分析窓の乗算を必要とする（分析窓は１に等しい最大大きさを有すると仮定し、そうでなければ窓をスケーリングする倍数だけ大きさＭ₀に乗算する）。適合振幅及び位相の出力は、発振器ピークの真の振幅及び位相、及び発振器ピークのスケールスペクトルを含む。

１又は２以上の実施形態によれば、発振器のピーク形状の判定に応じて、低周波数発振器に対して正確な振幅及び位相を計算することができる。低周波数発振器のこのような事例では、ＤＣを介したエイリアシングの効果は、当該発振器の複素共役投影に干渉する可能性がある。この干渉に起因して、従来の技術を使用して発振器の真の振幅及び位相を測定することは難しい。１又は２以上の実施形態に従って本明細書に提示される方法は、低周波数発振器の真の振幅及び位相を計算する問題を解決する新しい手法を表している。一例において、本方法は、低周波数発振器ピークの正規化されたスペクトル、ＣＳＰＥによって計算された低周波数発振器ピークの高精度周波数、及び周波数ドメインデータのセット、一般的には低周波数発振器の真の振幅及び位相を決定するためのＦＤＡＴ（Ａ）を含むことができる入力を使用する段階を含むことができる。特定の実施形態において、本方法は、反復ステップを含むことができ、ここでＣＳＰＥ周波数値は、発振器のスペクトルに対する改善された一致を達成するある範囲の値によって変化する。

信号処理アプリケーションにおいて、データのサンプル速度が遅い場合には、高周波数でのエイリアシング問題が現れることがある。極めて低い周波数において干渉もまた存在し、本明細書ではＤＣ問題による干渉と呼ばれる。この問題は、信号を分析するために有限サンプル窓が使用される場合に生じる。サンプリングに使用される窓関数は、密接に包含されるが、何れかの実現可能な有限時間窓関数の存在において問題が発生することがある。問題を明確に提示するために、周波数ｆ₀の信号が存在し、ＤＣ又は０Ｈｚ周波数状態に近いと仮定する。このような信号が有限時間窓Ｗ（ｔ）にわたってサンプルされる場合、上述のように、信号の周波数スペクトルは、

として示される窓関数のフーリエ変換によって、周波数ｆ₀のデルタ関数の周波数ドメインにおける畳み込みに等しい。離散的式では、結果が離散変換における周波数の格子、例えば、高速フーリエ変換（ＦＦＴ）の周波数格子に投影される。窓関数の変換が無限に狭くはないので、スペクトルは、ｆ₀を含む周波数ビン以外の周波数ビンへのパワースピリングを有する。実際には、窓関数の変換は、全周波数を通じて拡張され、よって、信号パワーの一部がスペクトル全体を通して分散され、パワーのスピルオーバから近くの周波数ビンの劣化を引き起こす。窓関数に応じて、

がゼロに低下する速度が変化するが、実際に使用される大部分の窓、例えばハニング窓、ハミング窓、ボックスカー窓、パルゼン窓及び当業者に公知の多くの他の窓に対して、ｆ₀を包含するビンを超える有意なスピルオーバが存在する。このスピルオーバ又はスミアリング効果は、信号のスペクトル全体を通して重要であり、２つの信号成分の周波数が近い場合、スピルオーバからの干渉が有意になる可能性がある。しかしながら、何れの低周波数信号もＤＣの片側で鏡像として複素共役ペアを有するので、ＤＣビンの近くで問題がより重大になる。これらの複素共役信号は、「負周波数」成分とみなされる場合が多いが、低周波数信号に対して、ペアリングが強力な干渉効果を保証する。しかしながら、周波数の優良な推定が達成できる場合には、ペアリングの複素共役性質は、真の内在する信号を明らかにして干渉を補正するよう干渉問題の解決を可能にする。本明細書で記載される方法は、畳み込み方法の問題に対処する。本方法は、ｆ₀でのスペクトル、及び

として示される「正周波数」成分からの寄与の反映としてのｆ₀での測定されたスペクトル値、並びに鏡像又は「負周波数」成分からの寄与

を考慮する段階を含むことができる。

寄与が、−ｆ₀での負周波数から生じるので、＋ｆ₀での寄与は、分析窓の共役

から取られる。

がｆ＝０でセンタリングされるように定義されると仮定すると、負周波数成分からの寄与は、

の中心から距離２ｆ₀に来る。結果的に、周波数ｆ₀の高分解能周波数が得られた場合、正及び負周波数から＋ｆ₀で測定されたスペクトル値への寄与分を決定することができる。本方法は、＋ｆ₀及び−ｆ₀位置の両方で０になるよう位相を設定する段階を含むことができる。この位置で設定されると、

及び

に対する値は完全に既知であり、よって差分

が得られる。更に、位相が０であるときには、＋ｆ₀及び−ｆ₀位置の信号成分は実部であり、よって負周波数からの複素共役スペクトルは、正周波数におけるスペクトルと同じ相対的位相位置にある。しかしながら、位相が０とは異なってくると、相対的位相値は、反対の方向に回転しなくてはならず、よって、＋ｆ₀での位相がφに設定された場合には、−ｆ₀における位相は、−φに設定して複素共役ペアリングを維持しなくてはならない。これは、ゼロ位相方向において、寄与

及び

は、

の相対的位相差を有するが、＋ｆ₀での位相方向がφに設定された場合、−ｆ₀での位相方向は逆回転して、−φに設定され、寄与

は同じ量だけ逆回転しなくてはならないことを意味する。従って、何れかの位相方向において、所与の周波数での総寄与は、

及び

が回転して整列するときに楕円の主軸が生じるので、これは、回転角度が

であり、回転及び逆回転バージョン総和が

になったとき生じる。結果として、回転及び逆回転が位相角度の平均である角度にて項を整列状態にしたときに主角度が生じる。主軸はπ／２ラジアンの更なる回転の後に発生するので、主軸の位置も同様に決定することができる。従って、短軸に対する回転及び逆回転バージョンの総和は、

となる。

本方法は更に、角度方向を直接的な方式で決定できるように、楕円のパラメータ化を容易にする段階を含むことができる。最初に、ｘ軸に主軸を有し、大きさＭの楕円を考えて、Ｓを短軸の大きさとする。楕円は、τ→（Ｍｃｏｓτ、Ｓｓｉｎτ）によって、及び楕円上の何れかのポイントを選択できるτに対する値を指定することによってパラメータ化することができる。τにより楕円上のポイントが得られた場合、曲座標におけるポイントの角度位置ρ（これはＤＣ問題を介した干渉に対する位相角度に相当するので）は、関係式

から見出すことができる。このパラメータ化の形式がＤＣ問題を介した干渉に適用されると、

及び

の回転及び逆回転和によって形成された楕円は、主軸及び短軸がｘ及びｙ軸と整列するように回転され、次いで、測定されたスペクトルを調べて、結果として得られたスペクトル成分によって示される実際の角度を決定する。測定されたスペクトルから得られた角度は、Ωで表記される。主軸が

にあるので、角度Ωでの結果をもたらすのに更なる回転が必要とされ、従って、Ω―Δに対応するτを決定する必要があり、一例において、以下の関係式を使用して得られる。

結果として次式が提供される。

本方法は更に、上記の関係式が周波数の認識及びスペクトルにおける＋ｆ₀位置及び−ｆ₀位置での複素共役関係のみから決定されることを認知する段階を含むことができる。分析は全て、窓関数の変換の相対的な大きさから決定された。相対的大きさは、信号が振幅値で乗算されたときでも同じ比率で残ることになる。従って、真の測定されたスペクトルの再生は、スペクトルから真の振幅値を選択することを必要とし、次いで、回転及び逆回転寄与の総和が測定されたスペクトル値によって示される振幅に等しくなるように再スケーリングすることができる。最終的結果は、＋ｆ₀での信号の真の振幅の高精度な測定であり、スペクトルが＋ｆ₀に位置付けられた窓関数

及びその鏡像の、−ｆ₀に置かれた複素共役ペア

によって再構成されたときに、ＤＣビンを介した干渉を含む結果として得られる総和は、真の測定された信号スペクトルの高精度再構成となる。

上記の分析は、スペクトルにおける＋ｆ₀位置及び−ｆ₀位置での干渉に焦点を当てており、影響される周波数の何れかにおいても類似の分析を行い、等価の結果を得ることができる。＋ｆ₀位置及び−ｆ₀位置での分析は例証に過ぎず、信号がそこに集中するという理由からであり、実際に通常、最も高い信号対雑音比及び最良の精度結果をもたらす。低周波数発振器に対する適合振幅及び位相の出力は、低周波数発振器ピークの真の振幅及び位相、及び低周波数発振器ピークのスケールスペクトルである。

１又は２以上の実施例において、＋ｆ₀の推定値が十分に正確ではない可能性があると判定される場合がある。これらの場合、ある範囲の周波数にわたって＋ｆ₀の値を変えて、要求精度に達するまで処理を継続して繰り返すことができ、このことは、本明細書で次の段落において更に詳細に検討する。

１又は２以上の実施形態によれば、低周波方法を使用して適合される一部又は全ての発振器ピークは、試験されて誤差が補正される。低周波発振器ピーク誤差を試験して補正する方法は、適合したスペクトルから発振器ピークを減算し、残余スペクトルを計算する段階を含むことができる。当該発振器ピークの中心に近い残余スペクトルが、閾値を上回る場合には、本方法は、オリジナルスペクトルの何れかの側である周期でＣＳＰＥ周波数を補正し、低周波数振幅及び位相計算を繰り返す段階を含むことができる。従って、本方法は、最少残余誤差を有する発振器ピークを使用することを含むことができる。この段落で説明した方法は、周波数、及び振幅変調検出の処理で使用することができる。

１又は２以上の実施形態によれば、ＤＣ又はナイキストにわたる発振器エイリアシングによる干渉は、ピークの誤った識別又はピークの再合成を防ぐため、周波数データから発振器ピークを除くか又は周波数データに発振器ピークを加える際に考慮しなければならない。一例において、このことは、一次加算又は減算に加えて、ＤＣ又はナイキストを通じてラップする部分の複素共役を加算又は減算する方法を実施することにより達成することができる。一例において、本方法は、ＣＳＰＥによって計算された発振器ピークの高分解能周波数、発振器ピークのスケールスペクトル、及び発振器ピーク加算及び減算を実行するための周波数ドメインデータのセットを含むことができる入力を使用する段階を含むことができる。本方法は、発振器ピークがＤＣ周波数又はナイキスト周波数の何れかによって二分されるような状況になった場合に、周波数ドメインデータにおける発振器ピークの位置を識別して、発振器ピークを主領域と末尾領域とに分割する段階を含むことができる。末尾領域は、ＤＣと、−ナイキスト（負ナイキスト）（ここで、複素ＦＦＴにおける周波数の半分が正指定される（又は正スピニングの）周波数であり、周波数の半分が負指定される（又は負スピニングの）周波数であるという規定を採用する）との間の負周波数にある部分である。

一例において、本方法は、ピークの誤識別又はピークの再合成を防ぐために加算動作が実行される場合に、主領域を入力周波数ドメインデータに加算し、末尾領域の複素共役を入力周波数ドメインデータに加算する段階を含むことができる。或いは、本方法は、ピークの誤識別又はピークの再合成を防ぐために、入力周波数ドメインデータから主領域を減算し、入力周波数ドメインデータから末尾領域の複素共役を減算する段階を含むことができる。本方法は、このステップへの入力として受信された周波数ドメインデータの補正されたセットを出力することができる。

１又は２以上の実施形態によれば、シングルチャネル超分解能方法の出力は、個々の発振器成分を記述するパラメータセットを含むことができる。各セットは、シングルチャネル再合成方法において当該発振器を正確に再構成するのに使用される情報を含むことができる。好ましい実施形態では、情報は、発振器成分に対応する周波数、振幅、及び位相に関係した情報を含むことができる。

一例において、マルチチャネル事前プロセッサ２１０は、１又は２以上の実施形態に従って、マルチチャネルＣＳＰＥ超分解能技術によって処理することができるマルチチャネル時間ドメイン信号データを準備するように構成することができる。一例において、入力として、マルチチャネル時間ドメイン信号をマルチチャネル事前プロセッサ２１０に送ることができる。入力は、ライブ映像又は記録ファイルとすることができる。別の実施例において、シングルチャネルデータストリームは、シングルチャネル事前プロセッサによって処理することができる。

マルチチャネル事前プロセッサ２１０は、２０４においてシングルチャネル事前プロセッサに対して前述されたのと同じ方法に従うように構成することができるが、本方法は、データの複数のチャネルに対して繰り返すことができる。一例において、マルチチャネル事前プロセッサ２１０は、１又は２以上の実施形態に従って入力信号の各チャネルに対する方法を実行することができる。本方法は、当該チャネルに対する入力信号のｎ連続サンプルでサンプル窓を満たす段階を含むことができる。一例において、連続サンプル窓は、サンプル窓が次のサンプル窓及び前のサンプル窓と重なるサンプル窓のサイズ及びサンプルの数をパラメータファイルにおいてユーザが指定できるよう、互いに重なり合うように構成することができる。重なり合うサンプル窓のサイズ及び数は、ソフトウェア又はハードウェア実装の一部として設定することができる。例示の目的で、サンプル窓は、以下ではサンプル窓（Ａ）と呼ばれるように定義することができる。

本方法は更に、第２の時間遅延サンプル窓を作成する段階を含むことができる。例示の目的で、第２のサンプル窓は、以下ではサンプル窓（Ｂ）と呼ぶことができる。サンプル窓Ａ及びサンプル窓Ｂは、サンプル窓Ｂがサンプル窓Ａよりも遅延するように時間的にオフセットさせることができる。サンプル窓（Ｂ）はサンプル窓（Ａ）よりも遅延する。本方法は更に、周波数変調検出が要求された場合に、２つよりも多い時間遅延サンプル窓を作成する段階を含むことができる。付加的なサンプル窓は、サンプル窓Ｂと同じサンプルを包含できるが、付加的な窓は異なるように処理することができる。例示の目的で、付加的な窓は、以下では（Ｂ＿アップ）及び（Ｂ＿ダウン）と呼ぶことができる。周波数変調の検出は、「変調プルバック演算子」を（Ｂ＿アップ）及び（Ｂ＿ダウン）サンプル窓に適用する段階を含むことができる。これは、アダマール積により達成することができる。例えば、（Ｂ＿アップ）サンプル窓に対して、正周波数変調のための変調プルバック演算子を使用することができる。更に、（Ｂ＿ダウン）サンプル窓に対して、負周波数変調のための変調プルバック演算子を使用することができる。本方法は更に、分析窓、又はテーパーをサンプル窓Ａ及びサンプル窓Ｂの両方に別個に適用する段階を含むことができる。これは、前述のようにアダマール積を介して達成することができる。一例において、周波数変調検出は、分析窓を（Ｂ＿アップ）及び（Ｂ＿ダウン）サンプル窓に適用する段階を含むことができる。本方法は更に、ＤＦＴ又はＦＦＴを使用してテーパーサンプル窓Ａ及びテーパーサンプル窓Ｂの両方を周波数ドメインに変換する段階を含むことができる。例示の目的で、周波数ドメイン出力は、以下では、ＦＤＡＴ＿チャネル＿Ｘ（Ａ）及びＦＤＡＴ＿チャネル＿Ｘ（Ｂ）と呼ぶことができ、ここでＸはチャネルの識別子である。更に、周波数変調検出が要求される場合、（Ｂ＿アップ）及び（Ｂ＿ダウン）サンプル窓に対して前述したのと同じ処理を使用して、ＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿アップ）及びＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿ダウン）窓を作成することができる。

一例において、マルチチャネル事前プロセッサ２１０の出力は、１フレーム当たりデータの２つのセットを含むことができ、各データセットは、高速フーリエ変換（ＦＦＴ）技術又は何れかの他の関連の周波数変換技術を介して周波数ドメインに変換することができる。各チャネルに対して、第２のセットは、僅かな時間遅延に対応する少数のサンプルだけ第１のセットよりも遅延させることができる。本明細書の例示の目的で、これらのデータセットは、ＦＤＡＴ＿チャネル＿０（Ａ）、ＦＤＡＴ＿チャネル＿０（Ｂ）．．．ＦＤＡＴ＿チャネル＿Ｎ（Ａ）、及びＦＤＡＴ＿チャネル＿Ｎ（Ｂ）と呼ぶことができる。一例において、周波数変調検出が要求される場合、２つの付加的な周波数ドメインデータセットを各チャネルに対して作成することができる。これらは、例示的に、以下ではＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿アップ）及びＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿ダウン）と呼ぶことができる。ＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿アップ）及びＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿ダウン）は、サンプル窓Ｂに包含することができかつ周波数ドメインへの変換の前に変調プルバック演算子を加えることができる、時間遅延サンプルの周波数ドメイン表現とすることができる。ＦＤＡＴ＿チャネル＿Ｘ（Ｂ＿アップ）には、正周波数変調プルバック演算子を適用させることができ、ＦＤＡＴ＿チャネル＿Ｘ＿（Ｂ＿ダウン）には、負周波数変調プルバック演算子を適用させることができる。

例示的かつ非限定的実施形態によれば、事前プロセッサは、複数の信号ストリームを受信して周波数ドメインでデータのセットを作成することができる。周波数ドメインデータは、複数のサンプル窓又は「データセット」を含むことができる。説明の目的で、「サンプル窓」は、オリジナル時系列データから取ることができるｎサンプルの窓を示すことができる。次いで、複数の周波数ドメインデータセットの各々を使用して、第２データセット時間の開始が第１データセットの開始よりも遅延することができる、第１データセット及び第２データセットを作成することができ、複数のサンプルデータセットの各々を周波数ドメインに変換して、第１及び第２データセットの各々に対する複素周波数スペクトルとして出力することができる。幾つかの実施例において、各対応する第１データセット／窓及び第２データセット／窓は、ＦＦＴ、ＤＣＴ、又は何れかの他のこのような変換のような従来の変換を使用することによって周波数スペクトルに変換することができる。

一例において、マルチチャネル超分解能モジュールを定義することができる。マルチチャネル超分解能モジュールは、高周波数精度を取得して、シングレット変換の使用を可能にし、オリジナル信号の成分を抽出するよう構成することができる。一例において、マルチチャネル超分解能モジュールの入力は、マルチチャネル事前プロセッサ２１０からの各チャネルに対する周波数ドメインデータの２つのセットを含むことができる。データセットは、以下ではＦＤＡＴ＿チャネル＿０（Ａ）及びＦＤＡＴ＿チャネル＿０（Ｂ）．．．ＦＤＡＴ＿チャネル＿Ｎ（Ａ）、及びＦＤＡＴ＿チャネル＿Ｎ（Ｂ）と呼ぶことができ、ここでチャネルは、チャネル＿０からチャネル＿Ｎとして指定され、周波数データは、非時間遅延データに対して（Ａ）及び時間遅延データに対して（Ｂ）として指定される。

入力は更に、テーパーをサンプル窓Ａ及びサンプル窓Ｂに適用する際に使用される分析窓を記述するパラメータを含むことができる。一例において、周波数変調が要求される場合、入力は更に、シングルチャネル事前プロセッサによって生成される、周波数ドメインデータの２つの付加的なセット、データＦＤＡＴ（Ｂ＿アップ）及びデータＦＤＡＴ（Ｂ＿ダウン）を含むことができる。一例において、入力は更に、周波数、及び振幅変調の検出及び特徴付けのための任意選択的な付加的超分解能分析窓を含むことができる。

図７は、統一ドメイン超分解能のための方法７００を示す。本方法は、例証として、定常音色、雑音様の要素、過渡事象、及び変調周波数のような離散的オブジェクトに分解することによって、統一ドメインにおける信号分解を実行する段階を示す。１又は２以上の実施形態による方法７００は、シングルチャネル超分解能方法の拡張とすることができる。

本方法は、７０２において、複数の入力チャネルから取得された複素スペクトル位相展開周波数に対して統一ドメイン変換及び統一ドメイン複素スペクトル位相展開（ＣＳＰＥ）を実行する段階を含むことができる。入力チャネルは、前述されたチャネルＦＤＡＴ＿チャネル＿０（Ａ）、ＦＤＡＴ＿チャネル＿０（Ｂ）．．．ＦＤＡＴ＿チャネル＿Ｎ（Ａ）、及びＦＤＡＴ＿チャネル＿Ｎ（Ｂ）のような、マルチチャネル超分解能モジュールへのチャネル入力を含むことができる。方法７００は更に、シングレット変換方法を使用して、ＤＡＴ＿チャネル＿０（Ａ）、ＦＤＡＴ＿チャネル＿０（Ｂ）．．．ＦＤＡＴ＿チャネル＿Ｎ（Ａ）、ＦＤＡＴ＿チャネル＿Ｎ（Ｂ）から発振器ピークの寄与分を除去する段階を含むことができる。これは、７０４において、変換されたチャネルデータから発振器ピークのリストを作成することによって行うことができる。更に、７０８において、発振器ピークのリストからピーク選択処理を使用して発振器ピークを選択することができる。ピーク選択処理は、発振器ピークを識別する段階を含むことができる。ピーク選択処理は更に、ピーク排除基準を適用して、発振器のメインローブによって生成された目標最大値を、望ましくない雑音又は発振器のサイドローブのような他の現象によって生成された非目標最大値と区別する段階を含むことができる。次いで、目標最大値は、分離の大きさ及び周波数、心理音響的モデルのアプリケーション、又はピーク選択を優先させるのに使用できる追跡器状態情報を含む、複数の因子に基づいて優先順位付けすることができる。方法７００は更に、７１０において、シングレット変換方法を使用して各チャネルにおける発振器ピークの振幅及び位相を識別する段階を含むことができる。発振器ピークの情報は、処理から出力するために保存することができる。方法７００は更に、７１０において、処理を完了できるかどうかの判定を行う段階を含むことができる。処理が完了した場合、７１２において、以前に保存された発振器ピーク情報を方法７００の実行の出力として提供することができる。或いは、７１２において発振器ピークの識別処理が完了していないと判定された場合、方法７００を繰り返すことができる。

一例において、方法７００は更に、追跡及び／又はフィルタリング及び／又は再合成のために信号成分を準備する段階を含むことができる。代替の実施形態では、統一ドメイン超分解能のための方法は、振幅及び周波数変調検出と共に使用することができる。図８は、方法７００に含まれるステップとは別に、８０２において付加的な振幅及び周波数変調検出を組み入れた方法８００を示す。８０２において、振幅及び／又は周波数変調検出が要求された場合、高度適合処理を伴う技術が使用される。

１又は２以上の実施形態によるスペクトルデータの統一ドメイン表現は、以下の説明で述べる技術を使用して計算することができる。

統一ドメインは、データのシングルチャネルとしてマルチチャネル信号の表現とすることができる。マルチチャネル信号を統一ドメインに変換するロスレス変換が存在することができる。この結果、統一ドメインにおける信号は、個々のチャネルを別々に処理するのではなく、全体として処理することができる。一例において、信号が統一ドメインに変換される場合でも、信号位置に関係付けられる大きさ、周波数及び空間成分に関する信号の情報の全てを保存することができる。信号の変換は、統一ドメインの信号をサラウンド音声信号、又はＲＧＢ信号のステレオ信号のようなマルチチャネル信号に戻すことができるような可逆的技術とすることができる。一例において、統一ドメイン変換は、単一の大きさの成分を特殊ユニタリ群ＳＵ（Ｎ）（ここでＮは、オリジナルデータ信号におけるチャネルの数を表す）からの行列で乗算される表現に変換できるような特徴を含むことができる。

一例において、マルチチャネル信号ストリームを統一ドメインのシングルチャネル信号ストリームに変換できる場合に、統一ドメイン（ＵＤ）に変換する処理を開始することができる。この変換は、変換（ｔｒａｎｓｆｏｒｍａｔｉｏｎ）を利用して実行することができる。変換は、情報を単一の「信号」に入れながら、各チャネルの信号成分の大きさ、周波数、内部位相、及び空間位置に関する情報を保持する段階を含むことができる。更に変換は、データサンプルの単一の１次元ストリームではなく、行列のストリームを使用する段階を含むことができる。ＵＤ変換は、ＵＤ表現がＮチャネルに対する複素特殊ユニタリ群の要素（ＳＵ（Ｎ））で乗算された単一の大きさ成分を含む可逆的技術とすることができる。幾つかの実施例において、ＵＤ行列は、ユニタリ群Ｕ（ｎ）から取ることができる。ＳＵ（Ｎ）群は、多くの方法で表現することができる。マルチチャネル信号を変換する目的で、複素行列の構造を利用することができる。一例において、ステレオ入力はＵＤで表現することができる。ステレオは、Ｎ＝２であるように２つのチャネルを含むので、従って、統一ドメインにおける表現は、２ｘ２複素行列で乗算された単一の大きさ成分として提供することができる。より詳細には、マルチチャネルオーディオストリームの変換は、次式のように表すことができる。

ここで、大きさは周波数の関数とすることができ、Ｎは入力チャネルの数を表すことができ、Ｕは統一ドメインを表す。

従来の２チャネルオーディオストリーム（左／右のような）では、次式のような表現となる。

この表現は、２つのチャネルのオーディオストリームとＵＤの行列のストリームとしての表現との間の１対１マッピングを含むことができ、変換は可逆性とすることができる。１つのドメインで行われる何れかの操作も、他のドメインにおける等価の対応するものを有することができる。当業者であれば、有利であると証明される統一ドメインにおける信号に対して、幾つかの処理技術を実行できることは理解できる。例えば、信号に適用される処理は、処理が統一ドメインにおいて一度実行すればよいので迅速に実行することができ、そうでなければ処理は、各サブチャネルに対して別々に実行する必要がある。更に、統一ドメイン操作は、同時にチャネルの全てに対して動作するという利点を有し、従って、付加的な同期処理を実行する必要もなく、チャネルの同期状態が保持される。

例示的な非限定的実施例によれば、プロセッサは、変換分解能を有する周波数ドメインデータの第１のセット及び第２のセットを各々が含む、複数のチャネルを受信するよう構成することができる。複数のチャネルは、統一ドメイン表現に結合することができ、複素スペクトル位相展開（ＣＳＰＥ）は、統一ドメイン表現に対して実行し、基本変換分解能よりも高い分解能又は精度で成分周波数を推定することができる。このような実施例において、ＣＳＰＥが複数のチャネルを統一ドメインの表現に変化させるときに上述の数学的処理を均一に適用することができる。例えば、右及び左チャネルの代わりに、ＣＳＰＥは、入力されたチャネルの全てを含む単一行列形式表現にすることができる。

他の実施例において、統一ドメイン表現において１又は２以上の発振器ピークを識別する段階及び少なくとも１つの識別された発振器ピークの近くの少なくとも１つのポイントのＣＳＰＥ動作を試験して適正に動作したピークを保持する段階を含む、ピーク選択を実行する段階を更に行うことができる。次にこれらの識別されたピークは、優先順位付け方式で抽出することができる。他の実施例において、各識別された発振器ピークの振幅及び位相を識別するためにシングレット表現を実行することができる。更に別の実施例において、統一ドメイン表現から各識別された発振器ピークの寄与分を除去するためにシングレット表現を実行することができる。

一例において、統一ドメインＣＰＳＥ方法を定義することができる。一例において、方法は、高分解能周波数分析の実行を含むことができる、統一ドメインにおける信号に対する処理ステップを実行する段階を含むことができる。高分解能周波数分析は、前述の１次元ＣＳＰＥ変換の拡張とすることができる。１次元の場合と同様に、統一ドメインにおける信号の成分の位相展開は、Ｎポイントの初期サンプルとＮポイントの時間遅延サンプルとの間で分析することができる。この比較から、信号成分が実際に現れる空間位置を表す分数倍数を取得することができる。この結果、信号に対する正確な内在周波数及び推定される空間位置を決定することができる。サンプル信号内に存在する内在周波数を補正するために、高分解能周波数分析を取得するのに利用される変換の周波数ビンに信号パワーを再割り当てするよう情報を利用することができる。

１又は２以上の実施例によれば、統一ドメインの信号を操作するのに利用することができる１つの処理は、高分解能周波数分析とすることができ、当該処理は、複素スペクトル位相展開（ＣＳＰＥ）方法の行列ベースのバージョンとして実施することができる。この結果、特定の実施例において、変換は、例えば、約４６ｍｓ窓で分析されるＣＤサンプルレートで安定した信号に対して０．０１Ｈｚの大きさの信号精度を与えることができる。特定の他の実施例において、０．０１Ｈｚ、０．０１Ｈｚ又はより細かい精度の信号精度を結果として生じることができる。ＣＳＰＥ高分解能分析は、音色様の信号成分を適正に定義された周波数を有する線スペクトルに変換することができ、他方、雑音様の信号帯域は構造を持たない。従って、信号は、音色様及び雑音様成分に実質的に分離することができる。サンプルデータのフレームに過渡信号成分又は振幅又は周波数変調信号成分があるかどうかを検出又は試験して、周波数の高調波グループを集約するような、更なる処理を利用することができる。当業者であれば、信号（例えば、全オーディオ信号）全体に又は信号の一部分に対して処理を実行できることは理解できる。従って、窓ステップは処理の何れのポイントにも提供することができる。例えば、データのフレームは、マルチチャネルデータストリームから直接、又は統一ドメインのデータから取り出すことができる。

一例において、ＵＤ変換は、２つのチャネルを有するステレオ音楽のための音楽、又は複数のチャネルを有するサラウンドサウンド音楽に存在することができるような、複数のチャネルで同時にデータを分析する方法を提供することができる。類似の実施例において、赤、青及び緑チャネルを有するＲＧＢフォーマットなどのデータの複数のチャネルから構成されることになる画像及びビデオデータを考慮することができる。従って、マルチチャネル信号は、特殊ユニタリ群ＳＵ（ｎ）から取り出される行列のベクトルにで乗算される周波数ドメインの１次元の大きさベクトルの形式で表すことができる。従って、統一ドメインの信号へのマルチチャネル信号の特定の変換は、以下のよう行うことができる。

１つの例示的な実施例において、入力データは、左及び右に指定されたデータの２つのチャネルを含むステレオ音楽とすることができ、得られる結果は、次元２の特殊ユニタリ群ＳＵ（２）からの行列のベクトルで乗算された大きさベクトルとすることができる。ステレオ音から結果として得られる大きさベクトルへの上述の変換を達成するための変換処理は、複数のステップを含むことができる。第１ステップは、音楽データの窓を選択し、これを離散フーリエ変換（ＤＦＴ）などの変換を使用して周波数ドメインに変換する段階を含むことができる。ステップの実行の結果として、離散的周波数ビンの信号の表現を取得することができる。一例において、データの窓においてＮ個のサンプルを選択することができる。この結果、Ｎ個の周波数ビンを取得することができる。或いは、周波数ビンの数を変えることができる、当業者に公知の変換の変形形態が存在することができる。

周波数ドメイン変換は、（一般的に）複素周波数情報の２チャネルを生じることができる。従って、各周波数ビンは、２要素を有する複素ベクトルとしてみなすことができる。次にこれらの要素を、グループＳＵ（２）から取り出された複素行列で乗算し、単一の大きさの成分を結果として得ることができる。この大きさ成分は、ステレオ音楽の表現として行列と共に格納することができる。

一例において、変換処理は、次式のように数学的に表すことができる。

周波数ドメインに変換するために、以下の数学的演算を実行することができる。

グループ要素は複数の方法で表すことができる。例えば、２チャネルのデータに対するＳＵ（２）行列に対して、以下に提示された形式で表すことができる。

一例において、周波数ドメインベクトルの成分を有する角度は、以下のように識別することができる。

のｊ^th複素成分を、

として指定し、

のｊ^thの複素成分を、

として指定する。次に複素周波数成分は、

及び

を設定することによって、ｊ^thの周波数ビンに対するＳＵ（２）行列の要素（ＫＳ注記：これは、挿入されたギャップ又は分離又はキャリッジリターンを有さないＳＵ（２）として現れなければならない）で識別することができ、位相変数は、同じφ₁及びφ₂値にすることができる。ＳＵ（２）行列がｊ^th周波数ビンに対する周波数成分の２ベクトルで乗算された場合、得られる結果は、以下のような単一の大きさベクトルとすることができる。

ＳＵ（２）行列は、ユニタリであるのが好ましく、また、逆行列を持つことができ、その結果、情報の全てを大きさベクトル及びＵ行列に包含することができる。従って、オリジナルに存在した情報の全てを包含することができる２つのチャネルデータに対する新しい表現を提供することができる。

１又は２以上の実施例において、データが統一ドメイン表現で表されると、以前に表された２つの独立した音楽チャネル、すなわち右及び左周波数は、ＳＵ（２）からの複素行列で乗算された単一の大きさベクトルとして統一ドメインで表現することができる。変換は容易に反転することができ、好都合な方法で前後に変えることができる。

上述の１又は２以上の実施例において、マルチチャネル信号の処理に使用できる大部分の信号処理動作は、統一ドメインでコンピュータ計算することができる。よって、１つのアプリケーションでは、フロントエンド処理が複素スペクトル位相展開（ＣＳＰＥ）の計算を使用することができる。統一ＣＳＰＥは、データの窓を統一ドメインに変換することによって計算することができる。当該窓に対する表現は、Λ₁と呼ぶことができる。更に、統一ドメインへのデータの時間シフト窓は、Λ₂として表すことができる。次に、統一ＣＳＰＥは、

の計算を必要とすることができ、ここで演算子

は、周波数ビンの全てにわたって行列の構成要素毎の積（シャー積又はアダマール積としても公知）をとるように構成され、^*は、複素共役が取られたことを示す。統一ドメインにおけるＣＳＰＥの再マッピングされた周波数を取得するために、統一ＣＳＰＥにおける複素エントリの引数を計算することができる。

一例において、統一ドメインでコンピュータ計算することができるように、従来の信号処理関数を有利に再定式化することができる。一例において、統一ドメインと周波数ドメイン又は時間ドメインにおけるデータの通常の表現との間の数学的等価性が存在することができる。統一ＣＳＰＥにおける周波数の再マッピングと結合されたときに、信号成分を空間位置及び内部位相関係を有するものと考えることができる。これは、入力データが右及び左チャネルを有するステレオオーディオである場合に、フィールドスパニングにわっってリスナーへのアプローチ角度を作動させるためにステレオオーディオの空間効果を関連付けることによって行うことができる。この点に関して、σの所与の値で生じることができる信号成分は、統一ドメイン表現の大きさ値から得られた大きさ成分によって与えられる大きさを有する、ステレオフィールドにおける角度σで発生するとみなすことができる。更に、２チャネルの内部位相角は、当該信号成分に割り当てられた、φ１及びφ２値に保持することができる。

一例において、左及び右チャネルの音楽を周波数ｆ₀及びｆ₁を有する２つの成分から構成することができる。成分を統一ドメインに変換して統一ＣＳＰＥによって処理できる場合、これらの信号は、

のように、その大きさ、空間位置、及び内部位相に関連付けることができ、第２信号に対して、関連付けは、

次に、コヒーレンシー表面の決定は、空間成分を有するように適応させることができる。例えば、ｆ₀のような信号成分が、マスキング関数Ｇ（ｆ₀；ｆ）によって与えられる近くの周波数に対して１次元マスキング効果を有することになる場合、このマスキング効果は統一ドメインに拡張することができ、コヒーレンシー表面関数は、信号成分間の角度分離に関係付けられる空間成分をピックアップすることになり、このことの１つの実施形態をコヒーレンシー関数

として表することができ、ここで正弦関数は空間成分を表す。同様に、コヒーレンシー関数は、あらゆる信号成分に対して導き出すことができ、データの空間場全体にわたって定義されるグローバルコヒーレンシー表面は、例えば、空間場における所与のポイントでのコヒーレンシー関数の総和、又は空間場における所与のポイントでのコヒーレンシー関数の最大値、又は空間場におけるあるポイントでのコヒーレンシー関数の平均値、又は空間場におけるあるポイントでのコヒーレンシー関数についての幾つかの他の選択規則の何れかを用いることによって見出すことができる。更に、正弦関数以外の他の空間関数、並びに空間方向に迅速に低下する関数又は空間方向に緩慢に低下する関数を利用することができる。

一例において、統一ドメインへの変換の処理、高分解能統一ＣＳＰＥ情報の計算、及び統一ドメインにおけるコヒーレンシー表面の計算は、マルチチャネル信号を構成する成分の全てを一緒に考慮して、これらを一貫した方法で処理する可能性をもたらすことができる。代替の実施例において、信号処理アルゴリズムの適用性の他の改良形態及び実施例を実施することができる。例えば、ＣＳＰＥ超分解能アルゴリズムは、単に単一の信号成分に適用するよりもより一般的に適用することができる。従って、ＣＳＰＥアルゴリズムを用いて、信号周波数の間に幾らかの分離が存在する場合に多くの信号成分を分解することができる。マルチ信号が存在する場合、周波数の超分解能は、個々の信号成分によって占有される可能性があるスペクトル周波数ビンの近くで最も正確とすることができ、信号中心から離れたスペクトル領域は、一般に、最も近い優勢信号周波数に再マップすることができる。例えば、３つの正弦波から構成される信号では、信号は、周波数ビンの中心には存在しない。この実施例において、アルゴリズムは、良好な精度を有する真の内在周波数を成功裏に再計算するよう構成することができる。図９は、この処理のグラフ表現である（９１０を参照）。オリジナルＦＦＴスペクトルが線９１１として示され、再マップスペクトルが線９１２として示されており、再マップスペクトルは事実上直線スペクトルである。この実施例において、正確な周波数（周波数ビン数）は、２８．７９６５３１７、５１．３７６４２３９、及び６５．５６４９８３１２であり、推定周波数は、２８．７９６０９５５、５１．３７７１７９４、及び６５．５６４４４２０である。これらのスペクトルが４４１００サンプル／秒のＣＤサンプリングレートでサンプルされた音楽から計算された場合、各周波数ビンの基本変換分解能は、約２１．５３Ｈｚ／ビンとなり、測定される信号は、誤差なく約±０．００１ビンであり、±０．０２１５３Ｈｚに等しい。しかしながら、現実世界の音楽データは、クリーンで安定しているとは限らない。従って、コンピュータ計算された高分解能スペクトルの精度は、近くの干渉信号の存在、周波数の変調、及び広帯域スペクトルを有する雑音様の信号などによって影響を受ける可能性がある。このような実施例において、高分解能分析は、サンプル窓全体にわたって比較的安定とすることができる何れかの信号成分に対して０．１Ｈｚ程度の信号精度をもたらすことができる。ノラジョーンズによるトラックから取られたデータの窓に関する実施例が与えられると、再マップスペクトルが信号９２０で現れ、ここでオリジナル信号は線９２２であり、再マップ信号は線９２１である。アルゴリズムの代替の変形形態の一例において、類似の分解能を直線的に変調する信号成分に提供することができ、変調速度と共に、窓における初期信号周波数の高分解能推定値を戻す。これは、測定される量による変調を相殺する複素ベクトル（プルバック演算子）による乗算を含むようＣＳＰＥを変更することによって、影響を受ける可能性がある。これは、補足説明において論じられる周波数変調の段落で更に検討することができる。

実関数を複素関数とその複素共役関数との総和として表すことができる場合、複素信号に加えて実信号に対してもＣＳＰＥ技術を利用することができる。例えば、周期ｐ＝ｑ＋δを有する実正弦波に対して、ｐが整数であり、δが１よりも小さい大きさの分数偏差であり、すなわち

であり、振幅「ａ」及び任意の位相では、実正弦波のサンプルは、以下のように複素正弦波の線形結合として記述することができる（ここでｊ＝√−１）：

及び１つのサンプルシフトは次式のようになる。

が定義される場合、ベクトルは次式のように記述することができる。

この実施例において、これらのベクトルのうちの各ベクトルのＤＦＴは次式とすることができる。

ＣＳＰＥは、シフト及びアンシフト変換の複素積

を使用してコンピュータ計算することができ、ここで積演算子

は、ベクトルにおける要素別に取られた複素積として定義することができる。

積を展開して次式を得ることができる。

上記の式を簡約して、次式を生成することができる。

一例において、上記の簡約式は、「前方スピニング」又は「正周波数」複素正弦波及び「後方スピニング」又は「負周波数」複素正弦波に対するＣＳＰＥの総和と相互作用項とみなすことができる。総和における第１項と最後の項は、前述されたＣＳＰＥ計算と同じとすることができるが、単一複素正弦波の代わりに、２つの複素正弦波の線形結合が存在することができる。更に、これらの２つの項からのＣＳＰＥへの寄与は、ｑ＋δ及び−（ｑ＋δ）それぞれにて位置付けられた高度に集中したピークを表すことができる。相互作用項は、適切に処理されない場合にはアルゴリズムの精度を低下させる可能性がある幾つかの特性を有することができる。以下に示すように、相互作用項によって導入されるバイアスは、データを窓関数化することによって最小にすることができる。更に、相互作用項Γは、次式のように簡約することができる。

Ｆ（Ｄⁿ）は、例えば、周波数位置ｑ＋δにて集中したピークとすることができ、Ｆ（Ｄ^-n）は、周波数位置−（ｑ＋δ）にて集中したピークとすることができ、積は、要素別に基づいて取ることができる（よって、幾つかの場合に対して

）。

上述の例示的な状況で提供されるデータは、限定ではないが、ハニング窓、ハミング窓、又は矩形窓、又は何れかの他の標準的窓関数を含む分析窓を使用して分析することができる。更に、測定されるスペクトルは、真の（すなわち、デルタのような）正弦波スペクトルを分析窓によって畳み込みことにより見出すことができる。例えば、矩形窓（ボックスカー窓など）が使用される場合、近くのスペクトルビンへの漏れが有意となる可能性があり、有意な相互作用項を生成するのに十分な強度のものとすることができる。相互作用項は、干渉する大きさの２次項（すなわち、

ブラケットにおける項）を発生させることができる。有意な相互作用項の可能性を低減するために、当該技術分野で公知の別の分析窓を利用して、漏れがｑ＋δ及び−（ｑ＋δ）の近傍に制限できるようにし、よって、

の場合は最も一般的な状況である。更に、ＣＳＰＥが計算された後、角度情報を抽出することによって周波数を再割り当てすることができる。正の周波数（ｋ＞０のような場合）では、次式を求めることができる。

負の周波数に対して（ｋ＜０）、反対の値

を求めることができる。その結果、実信号の場合（

のときの事例とすることができるような）、正周波数におけるパワーの全てをｑ＋δに再マップすることができ、負周波数におけるパワーの全てを−（ｑ＋δ）に再マップすることができる。このような結果は、周波数ビンとは実質的に無関係とすることができ、周波数の極めて正確な推定を可能にすることができる。

一例において、分析窓によって窓付きにされている実正弦波に対してＣＳＰＥを実行することができる。次いで、ＣＳＰＥは、例えば、基本変換を窓付き変換であると定義することによって、窓掛けの効果を含むよう一般化することができる。例示の目的で、ＤＦＴをコンピュータ計算する前に、データを窓付きにすることができる。更に、例示的に検討する目的で、任意の分析窓Ａ（ｔ）及びそのサンプルバージョンＡ_nを定義することができる。変換を前述したように実行することができる。更に、分析窓は、次式で示される関数で事前乗算することができる。

ここで添字Ｗは、窓付き変換を利用できることを示す。

従って、窓掛けの存在下で、次式を得ることができる。

変換は、漏れを近くの周波数ビンに最小化にし、更に干渉項をほとんどの場合で無視できる程度に低減するのを可能にすることができる。

幾つかの例示的かつ非限定的実施形態によれば、信号処理のための統一ドメインモデル／超分解能モデルにおいて、非直交ＡＭ／ＦＭ要素間の相互作用を周波数変化信号において決定することができる。このような決定は「追跡器による認識」で行うことができ、その結果、相互作用追跡器は、ＡＭ及びＦＭ成分間で一貫した決定を行うように発展しているときにトラックレットの履歴を探すように構成することができる。

一例において、高度適合処理を介して変調検出を実行するための方法を定義することができる。本方法の説明の目的で、従来のフーリエベースの分析方法に関して仮定することができる。この仮定では、従来のフーリエベースの分析が、あらゆる発振器ピークが一定の周波数及び振幅を有する単一の分析窓の時間中に安定した正弦波によって生成できるようにして作用することを記述することができる。しかしながら、多くのアプリケーションに対して、単一の分析窓内の周波数及び／又は振幅の変化を検出することが必要となる場合がある。このような検出は、以下で検討される技術の１又はそれ以上を組み合わせて或いは単独で考慮することによって行うことができる。

一例において、高分解能窓（ＨＲＷ）作成を使用した振幅変調（ＡＭ）／周波数変調（ＦＭ）検出技術を定義することができる。本発明の技術は、分析窓の高分解能周波数ドメインバージョンを時間ドメインサンプルに適用して、分析される発振器ピークを特徴付ける段階を含むシングレット変換処理を含むことができる。説明の目的で、分析窓の高分解能周波数ドメインバージョンは、（ＨＲＷ）と呼ぶことができる。

一例において、シングレット変換処理を使用して、サンプル窓内の振幅及び／又は周波数が一定ではない可能性がある発振器ピークを特徴付けることができる。これを行うために、対応する振幅及び／又は周波数変調を有するＨＲＷを分析のために使用することができる。振幅変調用に設計されたこのようなＨＲＷは、以下では説明の目的で（ＡＭＨＲＷ）と呼ぶことができる。例えば、サンプル窓の間に振幅が増加した正弦波の結果とすることができる発振器ピークを分析するために、ＨＲＷと比較することができ、この場合、ＨＲＷを作成するために使用される分析窓は、周波数ドメインへの変換の前に増加する同じ振幅で乗算することができる。同様の実施例において、周波数が変調されている発振器ピークを分析するために、周波数ドメインへの変換の前に対応する周波数変調速度に対する変調作成演算子と分析窓を乗算したＨＲＷを使用することができる。このようなＨＲＷは、以下では説明の目的で（ＦＭＨＲＷ）と呼ぶことができる。

上述の検出技術を組み合わせて、振幅及び周波数変調の両方を有する正弦波の効果を分析することができる。このようなＨＲＷは、以下では説明の目的で（ＡＭ／ＦＭＨＲＷ）と呼ぶことができる。

図１０は、高分解能ＡＭ／ＦＭ窓を作成するための方法の一例を示す。方法１０００は、窓関数１００２によって示されるように、オリジナル分析窓の複製によって高分解能窓作成の処理を開始する段階を含む。方法１０００は更に、１００８において、振幅変調の分析用の窓１０１２を作成するために、アダマール積などを使用して要求される振幅変調１００４で分析窓１００２を乗算する段階を含むことができる。方法１０００は更に、１０１４において、周波数変調の分析用の窓１０１８を作成するために、適切な変調量を有する周波数変調作成演算子１０１０で窓１０１２を乗算する段階を含むことができる。周波数変調作成演算子（ＦＭＣＯ）は、周波数が安定している正弦波を周波数で変調される正弦波に変換するよう構成することができる。方法１０００は更に、１０２０において、窓１０１８を要求長さにパッドする段階を含むことができる。好ましい実施例において、要求長さは、サンプル窓のオリジナルの長さの１６又は３２倍とすることができる。更に、１０２０において、ＦＦＴ又はＤＦＴを実行し、分析を周波数ドメインに変換することができる。変換は、図１０の実施例に示すように、高分解能窓（Ａ）１０２２をもたらすことができる。

方法１０００はまた、時間シフトＡＭ窓１０２４及び／又は時間シフトＦＭ窓１０３０を使用することにより、ステップ１００８から１０２０を繰り返すことによって実行することができ、該時間シフトＡＭ窓１０２４及び／又は時間シフトＦＭ窓１０３０は、事前プロセッサでサンプル時間遅延高分解能窓（Ｂ）１０３４を準備する場合に使用される時間遅延に対して適切なシフト係数だけＡＭ窓１００４及びＦＭ窓１０１０をシフトすることによって得ることができる。

振幅変調（ＡＭ）検出のための方法の一例において、振幅変調は、シングレット変換方法を使用して様々なＡＭＨＲＷを比較することによって検出することができ、該ＡＭＨＲＷの各々は、時間ドメインに適用された異なるＡＭエンベロープを有することができる。ＡＭＨＲＷは、同様の振幅変調を有する正弦波から作成された発振器ピークに最も近い周波数ドメインの形状のものとすることができる。従って、オリジナル信号の振幅変調は、最少残余誤差を有するＡＭＨＲＷを選択することによって検出することができる。

図１１は、周波数変調検出のための方法１１００の実施例を示す。方法１１００は、１１３４において、事前プロセッサにおけるオリジナル時間ドメインオーディオサンプル１１０２を使用して、２つの付加的な（Ｂ）窓、周波数ドメインサンプル窓（Ｂ＿アップ）１１１０、及び周波数ドメインサンプル窓（Ｂ＿ダウン）１１１２を作成する段階を含む。付加的な窓は、１１３４ｃにおいて、正変調用の周波数変調プルバック演算子（ＦＭＰＯ）を１つの（Ｂ）窓に適用することにより作成することができ、この窓を（Ｂ＿アップ）窓１１１０と呼ぶ。これは、アダマール積を介して達成することができる。同様に、方法１０３０は、周波数変調作成演算子の作成を可能にする。同様に、方法１１００は、１１３４ｄにおいて、負変調用の周波数変調プルバック演算子（ＦＭＰＯ）を他の（Ｂ）窓に適用する段階を含むことができ、これを（Ｂ＿ダウン）窓１１１２と呼ぶ。これもまた、アダマール積を介して達成することができる。方法１１００は更に、１１３８（ａ−ｃ）において、シングルチャネル超分解能モジュールの説明で記述したように３つの複素スペクトル位相展開（ＣＳＰＥ）を実行する段階、すなわち、１１３８ａにおいて（Ａ）窓及び（Ｂ）窓の非変調ＣＳＰＥと、１１３８ｂにおいて（Ａ）窓及び（Ｂ＿アップ）窓のアップ変調ＣＳＰＥと、１１３８ｃにおいて（Ａ）窓及び（Ｂ＿ダウン）窓のダウン変調ＣＳＰＥとを実行する段階を含むことができる。特定の非限定的な実施例によれば、入力を受けて以下に説明する方法を実行する際に、プロセッサは、所与の又は「基本的な」変換分解能を各々が有する周波数ドメインデータの第１のセット及び第２のセットを受信するよう構成することができ、また、極めて高精度の分解能で成分周波数を推定するために周波数ドメインデータに対して本明細書で更に説明する複素スペクトル位相展開（ＣＳＰＥ）を実行するよう構成することができ、これによって典型的には基本変換分解能よりも高精度となる。本明細書で使用される「変換分解能」は、変換方法のインヒーレントな分解能限界を指すことができ、例えば、ＤＦＴ又はＦＦＴが１秒当たりＱサンプルでサンプルされたデータから取られるＮポイントサンプル窓で計算される場合、ＤＦＴ又はＦＦＴは、半分が正（又は正スピニング）の周波数ビンに対応し、半分が負（又は負スピニング）の周波数ビンに対応する、Ｎ周波数ビンを示すことができる（当該技術分野で公知の標準的な規則によって定義することができる）。この方法で検出することができる最高の適正サンプル信号は、Ｎ／２正周波数ビンに分割することができるＱ／２の周波数を含むことができ、１ビン当たりＱ／Ｎヘルツのインヒーレントな「変換分解能」を生じる。類似の計算を他の変換技術の何れに対しても行い、対応する「変換分解能」を決定することができる。幾つかの実施例において、周波数ドメインデータにおける１又は２以上の発振器ピークを識別する段階、識別された発振器ピークの少なくとも１つの近くの少なくとも１つのポイントのＣＳＰＥ挙動を試験して、適正に動作した及び／又は短期安定の発振器ピークを決定する段階、及び識別された発振器ピークの抽出を実行する段階を含むピーク選択を更に実行することができる。他の実施例において、更に、各識別された発振器ピークの振幅及び位相を決定することができ、シングレット変換／シングレット表現を実行して高分解能空間から低分解能空間にマップすることができる。他の実施例において、シングレット表現を実行し、周波数ドメインデータから各識別された発振器ピークの寄与分を除去することができる。

上記及び本明細書で使用される「所与の」、「オリジナル」又は「基本的」変換分解能とは、ＦＦＴのような変換の分解能であり、周波数ドメインデータの入力データセット、すなわち、ＣＳＰＥの基本構成要素として使用される変換のインヒーレントな分解能を提供するのに使用することができる。ＣＳＰＥ変換に関する付加的な詳細内容は、以下の説明で記述する。

一例において、１１３８ａ−１１３８ｃにおいてＣＳＰＥを実行する段階は、３つのＣＳＰＥ窓、すなわち、ＣＳＰＥ窓１１１４、ＣＳＰＥ＿アップ変調窓１１１８、及びＣＳＰＥ＿ダウン変調窓１１２０の生成を生じることができる。発振器ピークが選択されると、ＣＳＰＥ、ＣＳＰＥ＿アップ及びＣＳＰＥ＿ダウンにおけるピークの周りのエリアの「平坦度」を分析することができる。正周波数変調を有する信号は、ＣＳＰＥ＿アップにおけるピークの周りに平坦なエリアを有することができ、負周波数変調を有する信号は、ＣＳＰＥ＿ダウンにおけるピークの周りに平坦なエリアを有することができ、周波数変調の比較的低い量を有する信号は、ＣＳＰＥにおけるピークの周りに平坦なエリアを有することができる。説明の目的で、「平坦度」は、発振器ピークの近くの周波数ビンが近くの一定値にマッピングされるように、推定周波数のプロット（又はその等価の尺度、すなわち、Ａ及びＢ窓に対する変換の複素空間における有効回転）を意味することができる。方法１１００は更に、１１４０（ａ−ｃ）において、ＣＳＰＥ窓１１１４、ＣＳＰＥ＿アップ窓１１１８及びＣＳＰＥ＿ダウン窓１１２０からピークの左及び右の値を減算して、周波数変調のＣＳＰＥ１１２２における幅、ＣＳＰＥ＿アップ１１２４における幅及びＣＳＰＥ＿ダウン１１２８における幅をそれぞれ識別する段階を含むことができる。周波数変調が検出された場合、１１４０において計算された値、すなわち値１１２０−１１２４を１１４２において使用して、周波数変調の正確な量を補間することができる。結果として、１１３０において、示された変調速度を取得することができる。１１４４において、示された変調速度１１３０をＦＭＨＲＷと共に更に使用して、発振器ピークを分析及び取り除き、畳み込み分析１１４８のために更に使用することができる高分解能周波数ドメインサンプル１１３２を取得することができる。

一例において、ＦＭ検出のための方法を詳細に説明する。複素スペクトル位相展開方法は、以前に導入された短期安定正弦波よりも複雑な信号に適用することができるように拡張することができる。この実施例において、ＣＳＰＥに関する変形形態を導入し、ある範囲の周波数にわたってスイープする可能性がある信号に適用することができ、スイープ周波数を定義することができる主要な内在パラメータを良好な精度で求めることができる。

連続に線形スエプトサイン（掃引正弦波）信号を定義するための例示的な手法は、次式の通りとすることができる。

ここで、ｆ₀はルート周波数とすることができ、δ／２は周波数変調速度とすることができ、φ₀は信号の初期位相とすることができる。信号を離散的にサンプリングすることができる場合は、スエプトサイン信号の好都合な式は、次式とすることができる。

ここで［０：Ｎ−１］は、０，１，２、．．．、Ｎ−１で表記されたサンプルのベクトルを意味するものとして定義することができ、

として短縮することができる。演算子

は、以下ではアダマール／シャー積と定義することができる。本開示の精神及び範囲から逸脱することなく、丸括弧の中の最初の２つの項は

として結合することができるが、これはまた、結合しない形式で記述することが好都合な場合がある。上記の表記法は、正弦波の複素指数形式（当業者には「分析信号」と呼ばれることもある）を示すことができるが、複素指数の実部又は虚部を取ることによってサイン又はコサイン形式に変換することができる。一例において、ベクトル

は、スエプトサイン信号からＮポイントの（複素化）サンプルを表すことができ、ベクトルに含まれる最後のサンプルを示すために添字を付加することができ、その結果、一例において、表記

を使用して、このサンプルのベクトルがサンプルＮ−１で終わることを表すことができる（ただし、Ｎ個の総サンプルがベクトルに含まれることを意味する）。結果として、この表記を使用して、Ｎサンプルの次の可能なグループを以下のように表すことができる。

基本的な説明で検討したＣＳＰＥ方法の精神及び範囲に沿って、Ｎ個のサンプルの１グループからＮ個のサンプルの後のグループへの信号の展開を分析することができる。一例において、これは、

が１サンプル展開演算子であると定義されるよう信号を進めることができる展開演算子を定義することにより達成することができる（これを複数回適用することで、信号を１よりも多いサンプルだけ進めることができる）。

これにより

は長さＮのベクトルを表すことができ、ここで、各エントリは値

とすることができる。次に、結合及びリファクタリングによって、

であることが認められる。これは、指数におけるベクトル項の以下の再構成によって分かる。

ここで最後のステップは、一般項から続くことができる。
ｎ＋（ｎ−１）＋（ｎ−１）²＝２ｎ−１＋（ｎ²−２ｎ＋１）＝ｎ²

従って、次式が認められる。

一例において、ＣＳＰＥ方法の基本前提が、信号の時間的前進（又は、幾つかのアプリケーションでは、空間的前進）のスナップショットを信号のオリジナルのスナップショットと比較して、信号の数学的再構成に使用できる内在パラメータを明らかにすることができる項を分離することであるので、展開演算子を指定する能力は重要とすることができる。前述したように、「周波数」ｆ₀は、サンプルのグループにおける最初の瞬間で保持することができ、変調をＮ個のサンプルの窓の中心にある瞬時「周波数」に対して考慮できるように問題を再定式化することは更に好都合とすることができる。ｆ₀を信号の時間期間とみなすことでより正確になることができ、また、式

の正弦波信号がＮ個のサンプルにおいて厳密にｆ₀周期を通過できるので、引用符は「周波数」の周りに置かれているが、ｆ₀を周波数と呼ぶのは一般的であり、当業者であれば、使用する関連に基づいて正確な意味を判断することができる。この実施例において、変調は、初期周波数ｆ₀から離れてスイープすることができ、このことは、Ｎ個のサンプルのグループにおける初期瞬間周波数をｆ₀と設定した場合に観測することができる。変調をＮ個のサンプルのグループの中心で生じることができる瞬間周波数に関する変調とみなすことができるように、変調問題を再定式化することができる。この中心定式化は好都合であり、よって以下で更に検討する。

一例において、変調信号の作成は、安定正弦波から開始することができ、Ｎ個のサンプルにわたるＱ周期は、次式のように取ることができる。

更に、（中心）周波数変調作成演算子（ＦＭＣＯ）を次式のように定義することができる。

ＦＭＣＯをサンプル正弦波

に適用できる場合、得られる結果は、変調信号

とすることができる（ここでは信号展開を調べるのに使用されるＮ＋１ポイントで定義される）。

ここでｙは、Ｎポイントサンプル窓におけるＱ周期に対応する瞬間中心周波数を有する線形変調信号とすることができる。

上述の例示的な実施形態では、線形周波数変調は、δ＝１／Ｎである場合に、信号が全ての連続した非重なり合いＮポイントサンプル窓の１周期の増加を示すことができるように作成することができる。従って、周波数が連続して線形的に増加できることを理解することができるが、定義された式構造は、第１のＮサンプルにおけるＱ全発振を有する信号に導くことができ（その結果、全発振を全２π間隔にわたる通路であると定義することができ）、次のＮサンプルにおいて、信号は、Ｑ＋１全発振を示すことができ、その次のＮサンプルにおいて、信号は、Ｑ＋２全発振を提示することができ、以下同様である。

一例において、変調パラメータδ＝２／Ｎである場合、上記の式は、Ｎ個のサンプルのあらゆる後続の窓（重なり合わない）において２周期の増加を与えることができる。代替の実施例において、窓が５０％重なり合う場合、これは、次の５０％重なり合う窓の各々に１周期の増加を与えることができ、よって、信号がサンプル１からＮにわたってＱ全発振を示す場合には、サンプルＮ／２＋１からＮ／２＋Ｎの５０％重なり合う窓に対して、信号はＱ＋１全発振を示すことができ、次の５０％重なり合うサンプルの窓Ｎ＋１から２Ｎでは、信号はＱ＋２全発振を示すことができる。

同様の実施例において、δ＝Ｐ／Ｎである変調パラメータを取ることができる場合、信号は、Ｎ個のサンプルの全ての次の窓（重なり合わない）におけるＰ周期の増加を示すことができる。この実施例において、信号周波数の式は、周波数と周期との間の通常変換を介してＱ（周期）の値に関係付けることができる。信号は、分析窓の中心での瞬間周波数が窓のＱ周期を作成できる周波数に等しくなるように定義することができる。変調は、当該中心周波数の周りとすることができる。短期安定正弦波のためのＣＳＰＥに類似の方法を開発してこの方法を変調周波数に拡張するために、周波数変調プルバック演算子（ＦＭＰＯ）を開発し、このＦＭＰＯと時間前進信号のアダマール／シャー積からの結果として得られる信号の周波数変換が、第１信号の変換からの位相回転でしかないように時間前進（又は場合によっては空間シフト）データに基づいて作動するようにする必要がある。

一例において、ＦＭＰＯを以下に示すように定義することができる。

この実施例において、虚数単位ｉの符号は、アッププルバック演算又はダウンプルバック演算の何れが要求されるかに応じて正又は負を選択することができる。信号を変調するためのＣＳＰＥ技術は、次式のようになる。

この結果の導出は、以下の式から生じることができ、ここで、

における指数を考慮することができ、係数

は導出のために無視することができる。

ここで、上記の第１行から第２行への変換は、以下の一般項を考慮することによって見出すことができる。

上記の実施例において、要素を全てまとめることで、

の結果を得ることができ、変調ＣＳＰＥに対する上記の結果が続く。結果として、変調ＣＳＰＥの角度を計算することができ、更に、Ｎ／（２π）で乗算することによって正規化することができる場合、得られる結果は正にＱ＋δ／２となり、この結果は、単一の変調信号が存在する場合に何れの周波数ビンにおいても見出すことができる。実際には、他の干渉信号が存在する可能性があるが、得られる結果は、変調信号に関連付けられるスペクトルピークの周りの領域において依然として成り立つことができる。結果として、この計算は周波数ドメインにおける局所演算をもたらすことができ、これはよりロバストにすることができると結論付けることができる。当業者がＱ及びδを分離する場合、上述の範囲内で説明される変調信号作成技術を使用して変調信号を正確に再生することができる。

δの正しい値を決定する例示的な方法において、変調速度のセットに対する変調ＣＳＰＥの計算及び結果として得られる計算から、δの正しい値への外挿及び補間を実行することができる。外挿は、変調速度の幾つかの値に対するＣＳＰＥ及び変調ＣＳＰＥを計算した後に再マッピングされたスペクトルピークの幅を測定することによって行うことができる。次いで、変調速度の正しい値を使用して、ゼロに近い幅のスペクトルピークを生成することができ、スペクトルピークの幅は、変調速度に伴ってほぼ直線的に変化することができるので、補間又は外挿を使用してゼロに近い幅ピークを生成できる変調速度の値を推定することができる。これは、存在することができ異なる変調速度を有することができる幾つかの異なる信号成分に対する独立した変調パラメータ（すなわち、δ値）の計算を可能にするという利点を有することができる。第２の手法は、反復方式を使用して最適変調速度に収束させるものとすることができる。何れかの場合にも、要求される結果は、あらゆる周波数ビンのパワーを取り、Ｑ＋δ／２の局所的に測定された値にてこれを再プロットすることから生じるデルタ関数のようなスペクトルが存在することによって検出することができる。このことは、δの正しい値が使用されるときにスペクトルをデルタ関数に低減するのを助けることができる。幾つかの異なる変調信号が存在することができる場合、スペクトルピークｐ_kに関連付けられる信号が変調速度δ_kを有することができる場合、及びその結果、変調ＣＳＰＥがδ_kで置き換えられたδによって計算することができる場合には、ピークｐ_kの周りで局所的に結果として得られるスペクトルは、デルタ関数と同じとすることができる。従って、外挿／補間の何れかを介して、又は反復を介して、直線的に変調する信号に対する中心周波数値（Ｑに対応する）又は変調速度を分離することが可能となる。

一例において、結合ＡＭ／ＦＭ検出の方法を定義することができる。これまで検討した振幅及び周波数変調検出のための方法を使用すると、周波数変調又は振幅変調の両方ではなく何れかを検出することができる。様々な決定木、混合ＡＭ／ＦＭ検出あり及びなし、及び追跡器支援変調検出を含む、これらの技術をコヒーレントフレームワークに統合する幾つかの方法が存在することができる。例示的な決定木を以下の説明において検討することができる。

例示的な信号処理方法において、周波数変調及び振幅変調は、区別可能ではないか、又は混合されているとすることができる。本方法は、変調を複素平面にマップする段階を含むことができるので、これによって半径方向の変化を振幅変調とみなすことができ、角度変化を周波数変調とみなすことができ、共分散行列を追跡方法に出力することができる。次に、追跡器が経時的に計算された情報を使用して、変調のどの部分が振幅変調としてより良好に又は効果的に特徴付けられるか、及びどの部分が周波数変調としてより良好に又は効果的に特徴付けられるかを決定することができる。

図１２は、ＡＭ／ＦＭ検出を結合するのに使用できる決定木１２００を使用した方法の一例を示す。決定木法１２００は、１２０４において、ＣＰＳＥツイストを使用してＣＰＳＥ周波数スペクトル１２０２に対する変調源を識別する段階を含むことができる。方法１２００は更に、識別ステップ１２０４から取得された変調推定１２０８を使用して図１２に示された３つの例示的な処理の１つを実行する段階を含むことができる。第１の実施例において、変調推定１２０８は、ＡＭ１２１０によって占有されている信号を提供することができる。第２の実施例において、変調推定１２０８は、混合ＡＭ／ＦＭ１２１２を有する信号を提供することができ、第３の実施例において、変調推定１２０８は、ＦＭ１２１４によって占有されている信号を提供することができる。決定木法１２００は、１２１８及び１２２０において、ＡＭ１２１０によって占有されている信号及び混合ＡＭ／ＦＭ１２１２を有する信号のそれぞれに窓種試験を実行する段階を含むことができる。方法１２００はまた、一例において、１２２２においてＦＭ１２１４によって占有されている信号に対してＦＭ速度を補間する段階を含むことができる。次に方法１２００は、１２２４及び／又は１２２８において、窓種試験１２１８−１２２０を実行した後で取得された窓から利用可能な窓を選択する段階を含むことができる。一例において、本方法は、１２２２で実行された補間の後に１２３０において正しいＦＭ窓を選択する段階を含むことができる。

方法１２００は更に、１２３２−１２３４において、窓サブセットを取得する段階、及び／又は１２３８において、１２２４−１２３０で実行されたステップに基づいて最も近いＦＭ窓を取得する段階を含むことができる。本方法は更に、１２４０において、すなわち１２４０ａ及び１２４０ｂにおいて、窓サブセット１２３２−１２３４に対する窓パラメータを補間して、１２４２において推定窓パラメータ１２４２ａ及び推定窓パラメータ１２４２ｂのような推定窓パラメータを取得する段階を含むことができる。方法１２００は更に、１２４４において推定窓パラメータ１２４２に対して畳み込み分析を実行する段階を含むことができる。更に方法１２００は、１２４８において、畳み込み分析１２４４の結果及び／又は最も近いＦＭ窓１２３８に対する残余誤差１２４８を識別する段階を含むことができる。誤差に基づいて、方法１２００は、１２５０において、最良の適合窓、変調、振幅及び位相を選択する段階を含み、選択の結果を推定信号パラメータ１２５２として提供することができる。最も単純な形式で、方法１２００は、非変調正弦波に対する適合誤差を計算するステップ、様々なＡＭＨＲＷに対する適合誤差を計算するステップ、最も近い利用可能なＦＭＨＲＷに対する適合誤差を計算するステップ、及び最少残余誤差をもたらすことができるＨＲＷ及び適合パラメータを選択するステップを含むものとして繰り返すことができる。

上記のステップは、従来のＦＦＴベースの分析よりも効率的に変調効果を検出できるが、ＡＭ及びＦＭ両方の検出を同時に可能にするより高度な決定木を使用することができる。一例において、高度な決定木は、上述した１又は２以上のＦＭ検出方法の何れかを使用して明白な周波数変調を計算する段階を含むことができる。周波数変調は、以下の本明細書では「表示変調速度」と呼ぶことができる。高度な決定木は更に、表示変調速度が範囲外又はゼロに近いかどうかを判定する段階を含むことができる。表示変調速度が範囲外又はゼロに近い場合、変調は振幅効果によって占有されている可能性がある。従って、前述された複数のＡＭ検出方法の何れかを使用する変調速度の分析のために振幅変調窓を使用することができる。

高度な決定木の実施例において、表示変調速度が特定の範囲内である場合、信号は、振幅及び周波数変調の両方の影響を受ける可能性がある。従って、高度な決定木は、ＡＭ／ＦＭＨＲＷのセットを選択する段階を含むことができる。一例において、振幅変調は、ＣＳＰＥ平坦度の計算結果をスキューする可能性がある。例えば、１つの窓当たりに２周期の正周波数変調を有する正弦波は、２．０の表示変調速度を生成することができるが、同じ正弦波が振幅で増加する場合、２．１８の表示変調速度を生成する場合がある。これらの効果は、事前判定することができ、較正テーブルの作成が必要となる場合がある。

１又は２以上の実施例によれば、振幅変調及び周波数変調を区別可能でないか又は混合されている状況が存在することができる。これらの場合、前のサンプル窓における当該発振器の挙動の認識を使用して、真の変調を識別することができる。例えば、発振器ピークが周波数の低下をしているデータのトラックレットに属する場合、周波数は降下し続ける可能性がある。幾つかの実施例において、ピーク検出処理は、このような推測を行えるように追跡器の状態を知覚できるようにする。他の実施例において、ピーク検出処理は、追跡器によって確定させることができる曖昧情報を出力することができる。更に、幾つかの実施例において、ピーク検出器は、追跡情報を使用して、最も可能性のあるＡＭ／ＦＭの組み合わせから始めてＡＭ／ＦＭ検出決定木の幾つかのステップを利用することができる。

１又は２以上の実施例によれば、前述されたマルチチャネル超分解能方法は、個々の発振器成分を記述するパラメータのセット及び各チャネルに対するそれらの関係を出力として有することができる。パラメータのセットでは、各パラメータは、統一ドメイン再合成方法などの使用によって、発振器を正確に再構成するのに必要とされる情報を包含することができる。好ましい実施例において、この情報は、一般的に、周波数、振幅、統一ドメインシグマ、振幅変調、周波数変調、及び各チャネルにおける発振器の位相、並びに適用することができる何れかの適切な振幅又は周波数変調パラメータを包含することができる。統一ドメインシグマは、各チャネルから導き出される信号の一部を表す。

例示的かつ非限定的実施形態によれば、ＡＭ及びＦＭ変調は、短持続時間窓において検出され、ＡＭ及びＦＭ特性に対する超分解能を達成することができる。他の実施形態では、本明細書で説明した１又は２以上の周波数変調プルバック演算子をサンプルデータの少なくとも１つのセットに適用することができる。

例示的かつ非限定的実施形態によれば、サンプル窓における周波数変調を検出することができる。複数の周波数変調プルバック演算子（ＦＭＰＯ）は、補間、線形補間、外挿及び反復の１又はそれ以上を受けた結果を有するサンプルデータの少なくとも１つのセットに適用されて、実際の変調速度の改良された推定値を提供することができる。幾つかの実施例において、複数のＦＭＰＯが、「アップ」、「ダウン」及び「ニュートラル」演算のうちの少なくとも２つを含むことができる。

上述のＣＳＰＥの補正において、特定の例示的な実施形態によれば、「ハミング窓」又は他の標準的窓関数又は「テーパー」のようなサンプル窓を使用することができるが、ＦＭ入力信号を処理する場合、以下では非公式に「ツイストベクトル」と呼ぶことができる別のベクトル（ＦＭＰＯ−周波数変調プルバック演算子）を挿入することができる。典型的には、ＦＭ信号は、時間遅延バージョンを受信したときに周波数の移動をすることができる。更に、ＡＭ信号は、堅固な回転子のように時間が展開する傾向があるが、標準的なＣＳＰＥで使用される分析窓の効果の場合とは異なり、ＡＭ変調の場合、ＡＭ窓はデータの一部とすることができる。従って、ＡＭ窓の「剛性回転子」の回転を検出したときには、時間遅延バージョンのＡＭ窓におけるシフトを可能にしなくてはならない。周波数変調の場合では、ＦＭＰＯの適用は、周波数及び角度回転をそこから検出できる剛性回転子のように展開できるものにＦＭ周波数を切り換えることができる。次いで、ＦＭ変調及び周波数変調表現のための基準「ルート」又は「アンカー」ポイントを導き出すことができる。

他の例示的かつ非限定的実施形態によれば、ＡＭ及びＦＭ変調を短期窓で検出して、ＡＭ及びＦＭ時間窓に対する超分解能を達成することができる。次に、複素スペクトル位相展開（ＣＳＰＥ）を周波数ドメインデータに対して実行し、基本変換分解能よりも高いとすることができる分解能及び／又は精度で成分周波数を推定することができる。

一例において、ＡＭ信号の振幅効果を、遅延サンプル窓に対してサンプルの第１スナップショット又は窓で異なるものにすることができる。振幅効果がどのように変化するかを考慮に入れることで、ＣＳＰＥからの内在する信号の導出を可能にすることができる。逆に、上述のように、ＦＭ信号に対して、ＦＭＰＯを使用して内在ＦＭ挙動を導き出すことができる。ＡＭ信号に対して、振幅効果の展開を考慮することができる。

一例において、振幅変調窓を作成する段階は、安定信号を取り出す段階、振幅効果を適用する段階、及び得られた結果を高分解能ＦＦＴにかける段階を含むことができる。限定ではないが、振幅エンベロープが上方向に傾斜するＡＭ効果、振幅エンベロープが下方向に傾斜するＡＭ効果、振幅エンベロープがデータサンプルの任意のポイントにて開始又は停止するＡＭ効果、振幅エンベロープが、上向き又は下向きの傾斜又は１つのＡＭエンベロープ状態から別のＡＭエンベロープ状態へのレベルオフ又は円滑遷移を含むことができる効果の組み合わせを有することができる場合のＡＭ効果、及びこれらの状態の何れかの組み合わせを含む、様々な振幅変調効果を引き続き考慮することによって、適用される効果の何れが周波数スペクトルの所与の成分に最良に適合できるかを判定することができる一連の高分解能発振器ピークを導き出すことができる。

幾つかの実施例において、複数の振幅効果を事前にコンピュータ計算し、分析窓で乗算することができる。次に、これらの振幅効果は、高分解能ＦＦＴ又は他の変換を介して周波数ドメインに変換することができ、また、信号内に検出されたスペクトルピークと比較して、スペクトルピークの観察される構造に関連付けることができる振幅変調効果を決定することができる。これらのＡＭ効果の実施例は、限定ではないが、振幅エンベロープが上方向に傾斜するＡＭ効果、振幅エンベロープが下方向に傾斜するＡＭ効果、振幅エンベロープがデータサンプルの任意のポイントにて開始又は停止するＡＭ効果、振幅エンベロープが、上向き又は下向きの傾斜又は１つのＡＭエンベロープ状態から別のエンベロープ状態へのレベルオフ又は円滑遷移を含む効果の組み合わせを有するＡＭ効果、及びこれらの状態の何れかの組み合わせを含むことができる。

例示的で非限定的な別の実施形態によれば、実施可能な既知の振幅効果のライブラリ内で一般に知られている振幅効果のような複数の振幅効果を、高分解能変換／ＦＦＴを適用させることができる基準信号に適用することができる。信号の複素スペクトル位相展開表現内で、どの振幅効果のセットが内在する信号／安定発振器に適用されたときに内在する信号の実際の発振器ピークに最良の適合をもたらすかを判定するために、一部の振幅効果によって補正された内在する信号の発振器ピークを分析することができる。発話か人工音かどうかのような信号に関連して知られる情報を使用して、どの振幅効果が内在する信号の経時的な振幅変化を最も良好に表すことができるかを決定する際の助けを提供することができる。

例示的かつ非限定的実施形態によれば、過渡信号要素（オンセット及び停止）は、超分解能信号処理法においてＡＭ信号として扱うことができる。オンセット及び停止に加えて、限定ではないが、上昇、下降、又は一般的エンベロープを含む他の過渡信号要素をそのように処理することができる。数学的には、雑音の短時間持続がサンプル窓時間よりも短い場合、短時間にわたって発生する鋭い雑音は、一部のスケール上で過渡事象とみなすことができる。十分に短い事象は、極めて鋭いエンベロープを有する傾向があり、エンベロープ自体がＡＭ効果に似ている可能性がある。結果として、本方法は、幾つかの実施例において、ＡＭ信号効果として顕在化する過渡信号要素を処理するよう構成することができる。

１又は２以上の実施例によれば、以下では信号成分追跡器２１４と呼ばれる図２に示された信号成分追跡器／集約器／選択器／分離器２１４を説明する。１又は２以上の実施例による信号成分追跡器２１４の機能は、次の再合成のために発振器ピークをグループ化及び抽出こと、又は出力フォーマットの１つに出力することとすることができる。

図１３は、信号成分追跡器によって実行される方法１３００の一例を示す。信号成分追跡器は、シングルチャネル超分解能モジュール又は統一ドメイン超分解能モジュールの何れかによって構成された信号発振器ピークのセットを受信するよう構成できる入力モジュールを含むことができる。信号発振器ピークは、追跡方法による所与の構造及び編成とすることができる。発振器ピークは、発振器ピークのセットに編成することができ、セットの各メンバは、同じ発振器によって発生したものと判定することができる（「トラックレット」）。方法１３００は、１３０４において、入力モジュール１３０２によって提供された入力を使用して、周波数、大きさ、統一ドメインシグマ、及び他の属性を含むことができる関連付け基準を用いて「トラックレット」を関連付け、同じ発振器からのピークを識別する段階を含むことができる。方法１３００は更に、１３０８において、「トラックレット」をその高調波関係を使用して関連付けて、同じ発生源によって作成されたトラックレットのセットを識別し、これらのトラックレットを１又は２以上の「コヒーレントグループ」にグループ化する段階を含むことができる。トラックレットのグループ化は、当該技術分野で公知の複数の追跡アルゴリズムの何れかを使用して実行することができる。更に、方法１３００は、１３１０において、コヒーレントグループを選択する段階、及び１３１２において、コヒーレントグループを分離して再合成のためフィルタリングされた発振器ピーク行列１３１４を提供する段階を含むことができる。

一例において、当該技術分野で公知の追跡アルゴリズムは、マルチ仮説追跡（ＭＨＴ）方法を含むことができる。本方法は、正確な関連付けを確認することができるデータが受信されるまで、複数の実施可能なデータ関連付けを保存する段階を含むことができる。幾つかの他の実施例において、追跡アルゴリズムは、他の公知のアルゴリズムを使用して、トラックレットをＧｒｅｅｄｙ、Ｍｕｎｋｒｅｓ、又はＪＶＣのような発振器ピークに関連付けることができる。アルゴリズムでは、カルマンフィルタを適用して、限定ではないが、周波数、及び振幅を含む複数次元でトラックレットの動きを予測することができる。更に、ユニオンファインドのような同じ発生源から発生するトラックレットを識別する問題に対して、公知のグループ化アルゴリズムを適用することができる。例えば、信号源の高調波パターンを使用して個々の信号源を識別することによって機能するトラックフィンガープリントアルゴリズムを使用することができる。

従って、例示的かつ非限定的実施形態によれば、信号処理方法は、超分解能分析及び、発振器の時間展開の表現を形成するトラックレットの周波数グループへの信号のグループ、及びグループ化アルゴリズムを介してデータをトラックレットのコヒーレントグループに集約して信号内の周波数のコヒーレントグループを識別する段階を含むことができる。トラックレットへのグループ化は、カルマンフィルタ、グリーディ関連付けのような追跡アルゴリズム又は当業者に公知の他の何れかのこのようなアルゴリズムを使用して実行され、信号源が時間を介して展開するときに往来することができる短期安定発振器を識別することができる。データは更に、限定ではないが、ユニオンファインドのような公知のトラックグループ化アルゴリズムの組み合わせを使用してトラックレットのコヒーレントグループに分割することができる。

幾つかの実施例において、分析を使用して信号要素をトラックレットに集約することができる。

幾つかの実施例において、区分化を使用して信号要素をコヒーレントグループに集約することができる。

幾つかの実施例において、トラックレットに包含される発振器ピークの周波数及び振幅の測定された展開を使用して、ＡＭ及びＦＭ効果を検出及び／又は補正することができる。

幾つかの実施例において、トラックレット又はコヒーレントグループの周波数及び振幅の展開を使用して、発話又は非発話を識別することができる。例えば、発話は時間の経過に伴って周波数を通して曲線を描く傾向があるが、非発話は、時間的に展開するときに周波数が平坦であることが多い。

幾つかの実施例において、人間に対して、発振器ピーク、トラックレット及びコヒーレント高調波グループを見るためのインタフェースを提示することができる。

幾つかの実施例において、人間は、システムがどの発振器ピーク、トラックレット及び高調波グループを出力又は強調することができるかを判定するのを助けることができる。

幾つかの実施例において、システムは、どの発振器ピーク、トラックレット及び高調波グループを保持すべきであるかに関して、人間の選択から学習することができる。

幾つかの実施例において、システムは、個々のスピーカ又は信号源の発生パターンを学習することができる。これらのパターンは、高調波分離、周波数及び／又は振幅の変化の速度、又は発振器ピークに含まれる可能性がある他の何れかのデータの集約を含むことができる。

幾つかの実施例において、発振器ピーク検出、追跡及びグループ化処理をオーディオ信号用に使用することができる。

幾つかの実施例において、発振器ピーク検出、追跡及びグループ化処理は、限定ではないが、ＲＡＤＡＲ、ＳＯＮＡＲ、ＬＩＤＡＲ、及び音声／オーディオセンサ、ビデオセンサ、及び振動センサを含む、あらゆる信号用に使用することができる。

幾つかの実施例において、トラックレットを使用してコヒーレントグループを形成することができる。コヒーレントグループを形成する処理は、追跡における「区分化」と呼ばれる。例えば、音源において、各トラックレットが高調波を示すことができる。トラックレットは、典型的には、周波数、到達時間及び方向（すなわち、統一ドメインのシグマに関係付けられる）を通じて移動することができ、トラックレットに沿った振幅で変化することができる。これらの形状は、検出されるＡＭ又はＦＭ効果を表す。本明細書で使用される「グループ化」は、互いに移動することができかつ１つのコヒーレント源に由来することができるトラックレットの中から高調波を見出す試みを指すことができる。視覚的に見たときに、以下に説明するように、音声信号の時間周波数表現における掃引曲線は、典型的には発話を示すことができ、平坦な水平線は、多くの場合、車の警報音のような人工的雑音を示すことができる。結果として、人工的な音に対して自然に発生する音を、例えば区分化における形状及びタイプによって分離することができる。分離はまた、分析処理において計算することができる何れかの他のパラメータに基づくことができる。結果として、自動化アルゴリズムを利用して、所与のアプリケーションに望ましいように人工的音を排除し又は増強することができる。例示的かつ非限定的実施形態によれば、視覚表現を編集して所望のトラックレット又はコヒーレントグループに属しかつ視覚的要素の編集からのフィードバックに基づいて信号の要素をスコアリングする信号を識別するために、複数の潜在的にコヒーレントなトラックレットとして信号を見るためのユーザインタフェースを提供することができる。他の実施形態では、個人からの発話などに基づく音声信号は、個人によって生成される信号に対応するトラックレットのグループを容易にすることができるパラメータを識別するために導入することができる。このようにして、スピーカのパターンにおける学習を実行し、当該スピーカに対して設定された特性的特徴が導き出されるようにすることができる。別の実施形態では、個人によって発生された発話は、発生源／個人の既知の署名又は「フィンガープリント」の特徴である統一ドメインパラメータに基づく発生源の「フィンガープリント」に基づいて識別することができる。他の実施形態では、発生源信号は、本開示の範囲内で説明される他のタイプの何れかの信号とすることができる。

公知の追跡アルゴリズムに加えて、追跡器は、新しいアルゴリズムを利用して出力品質を向上させることができる。例えば、位相予測アルゴリズムを使用して、２つのピークが同じ音声源から発生した可能性を予測することができる。一例において、位相予測を使用してピーク補正を実行することができる。

図１４は、位相予測を使用することができる信号成分追跡器２１４によって実行される例示的な方法１４００を示す。方法１４００は、図１３に関して検討した関連付け基準に加えて、「トラックレット」を関連付けるための基準として位相予測を使用することができる。幾つかの実施例において、周波数−位相予測の出力により、追跡器は、発振器ピークに関連付けられるパラメータを再計算することができるようになる。幾つかの実施例において、近接度を使用してピーク補正を実行することができる。例えば、追跡器は、２つの発振器ピークが干渉していることを計算することができ、トラック状態情報を使用して当該干渉を補正することができる。次いで、出力を提供するための発振器ピークを選択することができる。

一例において、ピーク選択の方法は、限定ではないが、統一ドメインシグマ、周波数、及び振幅のようなパラメータを使用してピークを評価する段階、統一ドメインシグマ、周波数、及び振幅のようなパラメータを使用してピークが属するトラックレットを評価する段階、統一ドメインシグマ、周波数、及び振幅のようなパラメータを使用してピークが属することができるコヒーレントグループを評価する段階、高調波「フィンガープリント」を使用してピークが属することができるコヒーレントグループが要求されるスピーカに一致するかどうか評価する段階、周波数−位相予測を使用してトラックレットが「直接経路」源であるように見えるかどうかを識別する段階を含むことができ、トラックレット又はコヒーレントグループのパラメータを評価する際、又は統一ドメインシグマを位相情報と結合することによって距離を推定する際に、ピーク予測試験に合格できないピークのパラメータを予め考慮しておくことができる。

前述したように、トラックレットは、１つの発生源高調波から発生したと判定できる発振器ピークのグループとして定義することができる。一例において、トラックレット形成処理は、シングルサンプル窓から抽出された発振器ピークのセットを含む入力に基づいて実行することができる。次いで、トラックレットは、多くの異なる公知のトラック関連付け方法及びアルゴリズムを使用して形成することができる。アルゴリズムは、前方のトラックレットを予測できる方法、トラックレットと１つのデータ（この場合、発振器ピーク）との間の関連付けコストをコンピュータ計算できる方法、及び割り当ての最適セットを選択できる方法を包含することができる。例証として、トラックレット予測アルゴリズムは、限定ではないが、線形予測、及びカルマンフィルタ予測を含むことができる。幾つかの実施例において、コスト推定アルゴリズムは、限定ではないが、マハラノビス距離のような統計的距離計算、及び周波数及び振幅の差のような単純距離計算を含むことができる。更に一例において、割り当てアルゴリズムは、限定ではないが、Ｇｒｅｅｄｙ関連付け、Ｍｕｎｋｒｅｓ関連付け、及びＪＶＣ関連付けを含むことができる。

トラックレット形成処理の出力は、トラックレットに形成された発振器ピークのセットを含むことができる。

前述したように、幾つかの実施例において、コヒーレントグループを形成することが望ましい場合がある。コヒーレントグループは、同じ音声源によって生成されたと判定できるトラックレットのセットとすることができる。

例示的かつ非限定的実施形態によれば、信号処理方法は、超分解能分析、信号要素を時間的なスナップショットからの周波数トラックレットに割り当てる段階（時間的なスナップショットは、初期時間に始まり最終時間で終わるデータのサンプル窓を使用して、これを分析窓で乗算し、これを周波数ドメインに変換することを示すことができる）、すなわち、データを追跡アルゴリズムによってトラックレットに編成して信号内の周波数トラックレットを識別する段階、並びに周波数、到達の角度、振幅、及びトラックの振幅の傾斜の少なくとも１つを使用して、トラックレットをコヒーレントグループにグループ化するのを助ける段階を含むことができる。

前述したように、幾つかの実施例において、コヒーレントグループを形成することが望ましい場合がある。コヒーレントグループは、同じ音声源によって生成されたと判定されたトラックレットのセットとすることができる。一例において、コヒーレントグループは、入力としてトラックレットのセットを受信することができる処理によって形成することができる。次に、トラックレットのセットは、互いに素であるセットに区分することができる。トラックレットのセットを互いに素のセットに区分するための幾つかの公知のアルゴリズムが存在する。例えば、ユニオンファインドアルゴリズムを利用することができる。アルゴリズムの大部分において、コスト関数を計算し、２つのトラックレットが同じ発生源からである可能性をコンピュータ計算することが必要となる場合がある。これらのコスト関数は、限定ではないが、周波数、振幅、統一ドメインシグマ、及び位相を含む発振器ピークのシングレット表現に格納された特徴の何れかを使用することができる。これらのコスト関数は、スピーカの高調波構造の認識に頼ることができる。コヒーレントグループ形成処理の実行の結果として、出力として、コヒーレントグループに形成されたトラックレットのセットを生成することができる。

例示的かつ非限定的実施形態によれば、統一ドメイン方向推定値をトラックレットの出力されたセットと共に使用して、当該のトラックレットを識別することができる。

幾つかの実施形態では、発振器が時間及び周波数を介して展開するときの位相の展開を予測することが望ましいとすることができる。予測された位相の認識は、限定ではないが、ピークを特定のトラックレットに関連付けなくてはならない可能性のスコアリング、干渉信号からの結果の検出及び／又は修復、脱落又は損失信号の検出及び／又は修復、直接経路対非直接経路信号の検出、圧縮アルゴリズム、及びトラックレットのコヒーレントグループへの関連付けを含む、上記の説明において検討した活動を含む処理の幾つかの段階で使用することができる。

一例において、信号の基本的なモデルは、一般的複素形式

の実数への投影として取ることができる。更に、実施例として、短期間にわたって振幅項を一定のままにすることができると仮定され、すなわち、ｒ（ｔ）＝ｒ₀であり、信号の変化の速度は、θの変化の速度に関連付けることができ、これは、瞬間周波数に関係付けることができる。これにより、

が得られ、θの変化の速度は瞬間周波数を含むことができるので、これにより、時間的に展開することができる信号の周波数及び位相を関係付ける方法が得られる。実際に、測定されたデータに基づいてパラメータを推定することができ、高分解能分析は、瞬間周波数の正確な推定、及びひいては将来の周波数及び位相値の正確な予測を可能にすることができる。

周波数位相予測のためのアルゴリズムは、位相及び瞬間周波数を関係付ける微分方程式

で始めることができ、十分に短い時間窓にわたって、ｆ（ｔ）は、定数プラス線形項として近似することができ（また、当業者にとっては、高位項まで容易に展開を続けることができ）、ｆ（ｔ）＝ｆ₀＋ａｔが得られる。

実施例は更に、データから周波数を推定する段階を含むことができ、これは、変換のＣＳＰＥファミリーから超分解能分析を使用して行うことができる。代替の実施例において、所与のサンプルデータ窓、すなわちｉ番目の窓に対する周波数推定値は、窓の中心において最も正確であると仮定することができ、以下ｆ_iと呼ぶことができる。周波数推定値に対する最良の位置は、限定ではないが、ゼロ交差速度をチェックする段階、周波数推定値に適合させた後に残余誤差を調べる段階などを含む、様々な他の方法によって取得することができる。ｊ番目の窓に対する超分解能周波数推定値は、ｆ_jで与えられることができ、サンプルデータ窓ｊの中央にて最も正確であると仮定することができる（又は様々な他の方法によって再度位置付けられる）。従って、超分解能周波数推定値及び推定値が位置付けられる関連時間を取得することができる。微分方程式が周波数推定値に一致する可能性がある境界条件を仮定して解くことができる場合には、１次近似は、式ａ＝（ｆ_j−ｆ_i）／２Ｔを含むことができる。

ここで、Ｔは２つの周波数推定値の間の時間とすることができる（好ましい実施形態では、２つのサンプルデータ窓の間の時間シフトとして取ることができる）。正味の結果は、位相を時間の関数として導き出すことができるものとすることができ、次式が得られる。

ここでθ₀は、信号の初期位相とすることができる。ここで提示される手法は、超分解能周波数推定値と共に使用する場合に極めて正確であることを示すことができる。

幾つかの実施例において、トラックレットの位相を異なる時間に対して予測することができる。予測と新しい発振器ピークの測定された位相との差を使用して、新しいピークをトラックレットに組み入れなくてはならない可能性をスコアすることができる。

幾つかの実施例において、２つのトラックレットが干渉していると判定することができる場合、各トラックレットの予測された周波数及び位相を使用して、結合された信号パワーが干渉トラックレットに再度割り当てされるように干渉領域を修復することができる。

幾つかの実施例において、トラクレットが所与のフレームにおける紛失データであると判定することができる場合、予測される周波数、振幅、位相、変調タイプ、到達の方向、及び追跡された発振器ピークに含めることができる他の何れかの特性を使用して、推定された発振器ピークを挿入することができる。

幾つかの実施例において、トラックレットの予測される位相と実際の位相との差を使用して、直接経路で又は間接経路を介してセンサに移動するかどうかを判定することができる。

例示的で非限定的な別の実施形態によれば、信号表現の周波数／位相は、超分解能、信号内のコヒーレント信号要素の統一ドメインモデルに基づいて予測することができ、その結果、信号要素は、この予測に基づいて処理することができる。例えば、あらゆる他のフレームの予測を使用して、予測されたフレームの処理のスキップを可能にすることができる。結果として、例えば、フレーム２、４、６及び８を予測するためには、フレーム１、３、５、７を処理するだけでよい。この実施例において、フレーム２の予測を実行し、更にフレーム２がどのようなものであるかを明らかにする推定を行うことができ、従って、精度測定をもたらすことができる。このようにして、例えば、２つのスペクトルピークが一列に並んでどれだけ近接して生成されたかを判定することができる。位置合わせが特定の許容範囲を上回る場合、フレーム２を再計算して、許容可能及び事前に定められた誤差範囲内に確実になるようにすることができる。位置合わせが許容範囲内である場合、更なる予測は必要ではない。

上述したように、例示的かつ非限定的実施形態によれば、信号内のコヒーレント信号要素の超分解能統一ドメインモデルに基づいて、信号表現の周波数／位相を予測することができる。結果として得られるモデルは、周波数、振幅、位相、及び時間を介した信号要素の展開の予測を可能にするのに十分に正確とすることができる。結果として、一部のデータが失われている可能性がある場合、信号要素トラック／トラックレットにギャップを越えさせるようにすることができる。トラックレット交差の場合、予測される値を利用して、内在のトラックレットの挙動及び方向を判定することができる。１つの実施形態において、信号におけるギャップの予測補間を前方及び後方の両方で実行することができ、失われた又は不明瞭なデータの無矛盾の推定値を決定することができる。１つの実施形態において、これは、携帯電話ネットワーク上で実施することができ、欠落したパケットの作用を改善することができる。

他の実施例において、信号表現の周波数及び／又は位相は、信号内のコヒーレント信号要素の超分解能統一ドメインモデル、及び予測に基づく他の要素との信号要素のグループ化に基づいて予測することができる。信号の測定は通常、ランダムよりも正確である方法で時間的に前方の予測を可能にするのに十分に正確である。簡単に言えば、トラックレットがどこに進み、次いで、これらの特性を有するこのようなトラックレットに関する観察がいつ行われたかを予測することができ、観察される現象が実際には前に遭遇した信号要素に関連付けられることを導き出すことができる。

例示的で非限定的な別の実施形態によれば、信号表現の周波数／位相は、信号内のコヒーレント信号要素の超分解能統一ドメインモデルに基づいて予測することができ、その結果、予測に基づいて信号要素を処理することができる。例えば、あらゆる他のフレームの予測を使用して、予測されたフレームの処理のスキップを可能にすることができる。結果として、例えば、フレーム２、４、６及び８を予測するためにフレーム１、３、５、７を処理するだけでよい。この実施例において、フレーム２の予測を行い、フレーム２がどのようなものであるかを明らかにする迅速な推定を行うことができ、従って、精度測定をもたらすことができる。このようにして、例えば、２つのスペクトルピークが一列に並んでどれだけ近接して生成されたかを判定することができる。位置合わせが特定の許容範囲を上回る場合、フレーム２を再計算して、許容可能及び事前に定められた誤差範囲内に確実になるようにすることができる。他方、位置合わせが許容誤差内である場合、更なる予測は必要ではない。

幾つかの実施例において、信号表現の周波数／位相は、信号内のコヒーレント信号要素の超分解能統一ドメインモデルに基づいて予測することができ、予測に基づく不完全な信号表現を完成させるためのデータを提供するのに使用することができる。

幾つかの実施形態では、信号内のコヒーレント信号要素の超分解能統一ドメインモデルに基づく信号表現の周波数／位相を予測し、これを用いて予測に基づく信号要素を処理することができ、ここで信号要素の処理は、予測を使用して信号表現の圧縮を容易にする段階を含むことができる。上記のように、あらゆるフレームを処理する必要がなく、数学的表現で保持される情報をオリジナルデータよりも遙かに少ないビットで表すことができる（すなわち必然的に圧縮することができる）。

発振器ピーク検出段階は、追跡及び／又はグループ化段階の現在の状態からの情報を使用して、その処理決定を導くことができる。技術は更に、以下に説明されるように発振器ピーク選択のトラック知覚適合及び優先順位付けによる干渉の低減を含むことができる。

例示的な技術において、トラック知覚適合を介した干渉の低減を実施することができる。２つの発振器ピークがほとんど同じ周波数上にある場合、これらは干渉する可能性があり、区別可能ではない場合がある。２つのトラックレットが、所与のフレームにおける周波数で交差する軌道上にあると検出された場合、予測された周波数及び振幅を使用して、２つの発振器ピークを生成することができ、この場合、システムは、両方の発振器の総和であるシングルピークだけを検出することができる。

別の例示的な技術において、発振器ピーク選択の優先順位付けを行うことができる。コンピュータ計算上のリソース限界、又は性能又はバッテリ寿命或いは幾つかの他の特徴を最適化する要求に起因して、システムは、検出されるよりも少ない発振器ピークを適合することができる。システムは、トラックレット及び／又はグループ状態情報を使用して、適合される発振器ピークをピックアップすることができる。例えば、音声処理において、当該のスピーカが無矛盾の高調波分離を示す場合、システムは最初に、既存のパターンに適合できる発振器ピークを見出すことを試みることができる。同様に、信号成分の重要度の心理音響的尺度を使用して、処理すべき発振器ピークを優先順位付けすることができる。

別の例示的な技術において、雑音環境からの所望信号の抽出又は雑音環境における所望信号の増強−追跡及びグループ化アルゴリズムを適合されるデータの測定パラメータの何れかと共に使用して、雑音から抽出されるべき又は雑音よりも増強すべきトラックレット又はコヒーレントグループを決定することができる。

例示的かつ非限定的実施形態によれば、不明瞭度尺度又は確実度尺度を追跡器によってトラックレットに割り当てることができる。この不明瞭度尺度は、カルマンフィルタ、ベイズ判定処理、スコアリング関数又は類似の処理で使用することができ、これによって、確実度／不明瞭度尺度を用いて、抽出又は増強しなくてはならないトラックレット又はコヒーレントグループを決定するようにする。更に他の実施形態では、複数のトラックレットの交差は、交差ポイントの処理を助けるのに使用されるトラックレット方向の予測によって識別することができる。例えば、音声処理において、トラックレットが実際に交差したときに、１つの周波数での１つの統合された音声を観測することができる。この実施例において、統合された音声は、交差ポイントで取り出して、自己無撞着とすることができるようにトラックレットの各々に割り当てることができる。

一例において、出力は、入力側で受信されていたピークのサブセットを含むことができる。一部の場合では、これらは、周波数位相予測補正の場合のように補正することができる。

ある範囲の技術を使用して、関連する発振器ピーク及びトラックレットを識別することができる。一例において、プロセッサは、複数の発振器ピークを受信することができ、再合成のための複数の発振器ピークのうちの１又はそれ以上を選択することができる。

代替の実施例において、発振器ピークをスコアリングして、どれが出力に望ましいかを決定することができる。発振器ピークは、到達の時間、周波数、位相、振幅、及び統一ドメイン方向の少なくとも１つを使用してスコアリングすることができる。

代替の実施例において、トラックレットをスコアリングして、出力のためにどれが望ましいかを決定することができる。トラックレットは、到達の時間、周波数、位相、振幅、統一ドメイン方向、これらの特性の何れかの変化、及びこれらの特性の何れか１つの変化の予測可能性の少なくとも１つを使用してスコアリングすることができる。

代替の実施例において、トラックレットのコヒーレントグループをスコアリングして、どれが出力に望ましいかを決定することができる。コヒーレントグループは、到達の時間、周波数、位相、振幅、統一ドメイン方向、並びにこれらの特性の何れかの変化、及びこれらの特性の何れか１つの変化の予測可能性、及び人の既知の高調波周波数パターンのような既知の高調波構造との一致のうちの少なくとも１つを使用してスコアリングすることができる。

代替の実施例において、ピーク、トラックレット、又はコヒーレントグループスコアを使用して、出力にこれを割り当てるか、又は出力からこれを排除することができる。

代替の実施例において、ピーク、トラックレット、又はコヒーレントグループのスコアを使用して、出力におけるその振幅を補正し、これによってその影響を低減又は増幅することができる。

代替の実施例において、ピーク、トラックレット、又はコヒーレントグループスコアを発話認識器のような別のシステムに伝送し、その推定処理を助けることができる。

代替の実施例において、オリジナル信号を出力のための再構成された信号と結合することができる。オリジナル又は再構成信号の何れかを結合の前に減少又は増幅することができる。

代替の実施例において、背景雑音、他の干渉信号、又は望ましくない特性を有する何れかの他の信号のような要素を排除又は縮小することができる。

代替の実施例において、背景を不明瞭にする可能性がある一次信号を除去することによって背景雑音、二次又は他の干渉信号のような要素を明瞭にすることができる。

幾つかの実施例において、図２に示すような信号チャネル再合成モジュール２２０を１又は２以上の実施例に従って使用して、単一の出力チャネルにおける目標発振器ピークの周波数ドメイン表現を作成することができる。一例において、選択された発振器ピークは、シングルチャネル再合成を使用して周波数又は時間ドメイン信号に変換することができる。幾つかの用途では、このような発振器ピークをシステムの出力とすることができる。

シングルチャネル再合成モジュール２２０への入力は、シングルチャネルにおけるこれらの発振器ピークの周波数ドメイン表現を作成するのに使用できるパラメータを含む発振器ピークのセットとすることができる。１又は２以上の実施例において、発振器ピークは、一般的に、限定ではないが、周波数、振幅及び位相を含むパラメータの何れかを包含することができる。更に、サンプル窓（Ａ）及びサンプル窓（Ｂ）と共に使用される分析窓のパラメータは、シングルチャネル事前プロセッサで判定されたものとすることができる。

幾つかの実施例において、シングルチャネル再合成モジュール２２０は、入力にて受信した各発振器ピークを使用して周波数ドメインデータ予測を計算する方法を実行するよう構成することができる。本方法は、シングルチャネル事前プロセッサにおいてサンプル窓（Ａ）及びサンプル窓（Ｂ）をテーパーするのに使用される分析窓の高分解能周波数ドメインバージョンをサンプリングすることによって、発振器の正規化された周波数ドメイン表現を作成する段階を含むことができる。発振器ピークの振幅及び位相でこの発振器の正規化された周波数ドメイン表現を乗算する。本方法は更に、発振器ピークに対応する周波数ドメインデータが計算されると、以前に作成されたスペクトルを合計する段階を含むことができる。一例において、時間ドメインデータが要求される場合、周波数出力を時間ドメインに変換することができる逆ＦＦＴ（ｉＦＦＴ）を実行することができる。

幾つかの実施例において、出力における望ましい特性を提供するために、ある量の背景信号が必要となる場合がある。本明細書で使用される方法の利点は、出力信号の位相を高精度で保持できることである。結果として、オリジナル信号におけるサンプルの位相は、抽出され再合成された信号の位相に一致することができる。一部の状況では、背景信号の追加は、望ましい特性を有する結果をもたらすことができる。これは、オリジナル信号又はオリジナル信号の減衰又は増幅バージョンにミキシングする段階を含む、様々な技術によって達成することができる。幾つかの実施例において、圧縮形式のシングレット表現のようなオリジナル信号のシングレット表現を使用することが望ましく、これによってオリジナル信号は、抽出された信号と再混合する前に再構成することができる。

シングルチャネル再合成モジュール２２０によって実行された方法に基づいて、発振器ピークの選択されたセットに対応するオリジナル信号の部分を正確に表す周波数ドメイン又は時間ドメインデータのセットは、シングルチャネル再合成モジュール２２０からの出力として取得することができる。

幾つかの実施例において、図２に示すようなマルチチャネル再合成モジュール２２２を１又は２以上の実施例に従って使用して、マルチチャネル出力における目標ピークの周波数ドメイン表現を作成することができる。マルチチャネル再合成モジュール２２２は、選択された発振器ピークを周波数又は時間ドメイン信号に変換するよう構成することができる。幾つかの実施例において、このような発振器ピークをシステムの出力とすることができる。

マルチチャネル再合成モジュール２２２は、マルチチャネルにおける発振器ピークの周波数ドメイン表現を作成するために使用されるパラメータ、及びマルチチャネル事前プロセッサ２１０でサンプル窓（Ａ）及びサンプル窓（Ｂ）と共に使用される分析窓のパラメータを含む発振器ピークのセットを入力として受信するよう構成することができる。一例において、発振器ピークは、周波数、振幅、統一ドメインシグマ、及び各チャネルにおける発振器ピークの位相を包含することができる。

マルチチャネル再合成モジュール２２２は、各発振器ピークが各チャネルに対するその周波数ドメインデータ予測を計算するための方法を実行するよう構成することができる。本方法は、統一ドメインシグマ及び入力振幅を使用して当該ピークに対する当該チャネルの振幅を計算する段階を含むことができる。本方法は更に、シングルチャネル事前プロセッサにおけるサンプル窓（Ａ）及びサンプル窓（Ｂ）と共に使用される分析窓の高分解能周波数ドメインバージョンをサンプリングすることによって発振器の正規化された周波数ドメイン表現を作成する段階を含むことができる。ステップ１において計算された振幅及び入力で受信された当該チャネルに対する発振器ピークの位相によって、この発振器の正規化された周波数ドメイン表現を乗算する。本方法は更に、発振器ピークに対応する周波数ドメインデータが計算されると、前のステップで作成されたスペクトルを合計する段階を含むことができる。一例において、チャネルＸに対する周波数ドメインは、全ての発振器ピークに対するチャネルＸの計算された周波数ドメインスペクトルの全ての総和とすることができる。時間ドメインデータが必要とされる場合、逆ＦＦＴ（ｉＦＦＴ）を実行して、周波数出力を時間ドメインに変換することができる。

一例において、畳み込みモデルを使用して、及び安定周波数信号、ＦＭピーク、及びＡＭピークを含む複数の信号要素又は特性の各々を構築するための別個の方法を使用して、再合成信号を信号処理モデルに構築することができる。周波数、振幅、周波数変調及び振幅変調を含む発振器ピークパラメータを再計算して、以下のような異なる窓位置（時間的に僅かに遅れる）又は窓長さに存在することができるパラメータを予測することができる。

一例において、再合成のために、発振器ピーク検出のために使用していたものとは異なる窓の長さを選択することができる。これは、システムが発振器ピーク検出のために使用していたものよりもより最適な窓長さを再合成のために使用するのを可能にする。

一例において、サンプル窓の長さは、必要に応じて調節することができる。特定の条件下では、異なる長さのサンプル窓を使用するよう最適にすることができる。これは、検出された発振器ピークのパラメータを比較のために調節できることに起因して、実施することができる。例えば、強い周波数変調の期間中は、より頻繁にサンプリングすることが有利とすることができる。

幾つかの実施例において、フレームを再合成内でシフトすることができる。例えば、０から１０２４データポイントを使用して、信号の第１スナップショットを取り出すことができる。次に、データポイント５１２から始まり、データポイント１５３６に進み、窓の半分の長さだけシフトすることができる。より小さなスケールの変化が望ましいとすることができ、より少ないデータポイントだけシフトすることが望ましいとすることができる（２５６ずつシフトする）場合、再度シフトして、各信号要素が密接にカバーされる。再合成時には、中央セグメントだけを使用することができ（２５６から７６８及び５１２から１０２４）、フレーム内での前方予測を小さなフレームを作るために行うことができる。例えば、ビデオ入力信号を処理してワイドスクリーンフォーマットから旧式のテレビジョンにビデオを送信する場合、オンザフライで動作を変更して、品質を損なうことなくかつフレームの複雑な操作を実施する必要もなく、ＴＶ画像の中心部を再生し縁部を除去することができるようにする。

マルチチャネル再合成モジュール２２２によって実行される方法に基づいて、選択されたピークに対応するオリジナル信号から周波数ドメインの部分を正確に表すことができる周波数又は時間ドメインのデータの窓は、マルチチャネル再合成モジュール２２２からの出力として取得することができる。

本明細書で記載される信号分離（ＳＳ）技術は、送信、格納、分析又は操作の何れかのための収集機構（マイクロフォン、カメラ、ラジオ受信機、ビデオカメラ、トランスデューサ、又は他の受信機などを含む）を介して信号を送信又は取り込むことができる何れのシステムにも適用することができる。信号は、続いて（限定ではないが）：受信機間で送信（例えば、ＲＦ送信）され、音声通話の送信などのためのオーディオフォーマットで配信、写真又はビデオの送信のような画像又はビデオフォーマットで配信され、発話からテキストへの変換のようなテキストフォーマットで表示され、又はレーダーディスプレイ又は超音波のような画像として解釈及びレンダリングすることができる。

幾つかの実施形態では、ＳＳ技術は、デジタル信号処理を伴う１又は２以上の処理及び／又はシステムに導入することができる。デジタル信号処理は、一般的に、情報信号を補正又は改良するための情報信号の数学的操作として定義され、一連の数又は記号による離散的な時間、離散的な周波数、又は他の離散的なドメイン信号の表現、及びこれらの信号の処理によって特徴付けることができる。ＳＳ技術が恩恵をもたらすことができるサンプルデジタル信号処理分野は、限定ではないが、オーディオ処理及び圧縮、発話処理及び認識、ＲＦ送信、生体測定分析、ソナー及びレーダー、センサアレイ、超音波試験、スペクトル推定、統計分析、デジタル画像、デジタル及びセルラー通信、制御システム、生物医学、医用イメージング、及び地震データを含むことができる。デジタル信号処理は、連続した現実世界のアナログ信号を測定、フィルタリング及び／又は圧縮するのに適用することができる。処理は、典型的には、信号をアナログからデジタル形式に変換してサンプリングし、次いで、アナログ信号を数字のデジタルストリームに変えることができるアナログ−デジタルコンバータを使用してデジタル化することによって開始することができる。典型的には、分析及び送信後、要求される出力信号は、デジタル−アナログコンバータ（ＤＡＣ）を必要とする別のアナログ出力信号とすることができる。

幾つかの実施形態では、ＳＳ技術は、限定ではないが、汎用コンピュータ及びＧＰＵ；専用シングル及びマルチコアプロセッサ（デジタル信号プロセッサなど）；特定用途集積回路（ＡＳＩＣ）のような専用のハードウェア；フィールドプログラマブルゲートアレイ（ＦＰＧＡ）；デジタル信号コントローラ；及びストリームプロセッサの１又はそれ以上で実施することができる。更に、本明細書で記載されるＳＳ技術は、ファームウェア、組み込み型ソフトウェア、ソフトウェアプラットフォーム、独立型ソフトウェアアプリケーション、及び／又はネットワーク又はクラウドに基づくアプリケーション／サービスとして実施することができる。このような実装は、限定ではないが、コンピュータ；携帯電話又はスマートフォン；タブレット；又は他の通信；オーディオ、ビデオ、センサ、レーダー、ソナー又は医療用イメージングデバイス又はシステム；又はデジタル信号処理が性能又は一般的有用性を向上させることができる他の何れかのシステム又はデバイスに適用することができる。

幾つかの実施形態では、本明細書で記載される信号分離技術は、物体の距離、高度、方向、速度又は他の特性を決定する方法として無線波に頼るレーダーベースの物体検出及び追跡システムにおいて利用することができる。レーダーシステムは、その経路における何れかの物体から反射される無線波（又はマイクロ波）のパルスを送信する処理を組み入れ、その後、波のエネルギーの一部を受信機に戻すことができる。レーダーの幾つかの例示的な用途は、限定ではないが、一般的なイメージング、防空及び対ミサイルシステム、航空管制、当該の地形、船舶及び他の海洋ベースのポイントを位置特定する海洋システム、航空機衝突防止システム、海洋監視システム、大気圏外監視及びランデブーシステム、気象追跡及びモニタリング、高度測量及びフライト制御システム、誘導ミサイル目標位置特定システム、地形マッピング、検出及び位置特定システム、石油及びガス発見及び掘削システム、及び地質観察のための地中探知レーダーを含むことができる。

幾つかの実施形態では、ＳＳ技術をレーダーシステムに適用して、処理内の何れかのポイントにおける「雑音」、「干渉」、及び／又は「クラッター」を軽減し、これによって最終用途アプリケーションに送られる最終データの品質を高めることができる。ＳＳ技術は、何れかの他の補正アルゴリズム及びシステムから独立して、又はパルス−ドップラー、移動目標指示、自動利得制御（「ＡＧＣ」）、３Ｄマッピングイメージングアプリケーション、及び／又は水平、垂直、線形及び円形極性形成などのシステムの１又はそれ以上と共に導入することができる。距離が大きくなるにつれて反射信号は急激に減少し、よって雑音がレーダー距離限界を発生させ、所望の信号のパワーが低くなる程、この信号を雑音から区別するのがより困難になる。レーダーシステムは、望ましくない信号、すなわちパッシブ信号及びアクティブ信号の両方を解消して、当該の実際の目標に集中するよう構成しなくてはならない。望ましくない信号の解消は、レーダーシステムの信号対雑音比（「ＳＮＲ」）を定義して、所望の目標信号のレベルを背景雑音又は干渉のレベルと比較することができる。

例示的な実施形態において、ＳＳ技術の導入は、レーダーシステムのＳＮＲを増大させることができ、これにより、周囲の雑音信号、干渉及びクラッターからの実際の目標の分離の改善もたらすことができる。一例において、雑音及び干渉は、全ての電子部品によって発生する可能性がある信号のランダム変動の内部発生源；レーダー受信機において受信された所望のエコー信号に重畳されたランダム変動；及び／又は当該の目標を囲む背景の熱放射のような外部発生源を含む、因子の何れかによって引き起こされる可能性がある。更に、クラッターは、関心のない目標からレーダーオペレータに戻された無線周波数エコーによって起こる可能性がある。このような目標は、自然物体（雨、鳥など）；大気乱流及び他の大気効果（電離層反射など）；人工物体（建物など）；及び／又はチャフなどのレーダー対策手段を含むことができる。一部のクラッターはまた、レーダー送受信機とアンテナとの間の長いレーダー導波管によって引き起こされる可能性がある。本明細書で記載されるＳＳ法及び技術は、上記及び他の干渉信号から効果的に干渉を軽減する役割を果たすことができる。ＳＳ技術は、周波数帯域、スキャンタイプ、利用されるディスプレイプロセッサ及びシステム、及び／又は最終用途及びリンクに関係なく、全ての形式のレーダー信号、装置及びイメージングソフトウェア及びハードウェアに適用することができる。本発明の技術はまた、電磁スペクトルの他の部分を使用する他のシステムにも適用することができる。このようなシステムの一例は、電波ではなくレーザーからの可視光を使用する「ＬＩＤＡＲ」とすることができる。更に、本発明の技術は、ＲＦ機能（例えば、レーダー、通信、及び電子戦）をその機能の性能において拡張、識別、分離、隠ぺい又は他の操作を可能にする拡張可能多機能ＲＦシステムのような他の無線周波ベースの（ＲＦ）システムに適用することができる。

例示的かつ非限定的実施形態によれば、本明細書で前述した技術の何れかの処理又は組み合わせを使用して生成された源分離信号は、（ｉ）オーディオファイル；及び／又は（ｉｉ）オーディオ信号成分；及び／又は（ｉｉｉ）発話特徴ベクトルとして提示される出力を生成することができ、これらの全ては、独立して又は組み合わせて、発話認識エンジン又は生体測定音声識別システムへの入力としての役割を果たすことができる。幾つかの実施形態では、本明細書で記載される信号分離技術は、話し言葉をテキストに翻訳する、音声翻訳を介して自動化システムを制御する、又は話し言葉を自動化処理を介して声以外の他の出力に変換するのに使用できる発話認識システムにおいて利用することができる。発話及び音声認識を改善するためのＳＳの導入は、認識を改善するのに使用される他の何れかのアルゴリズム及びシステムに関係なく、又はこのようなシステムの１又はそれ以上と共に適用することができる。更に、ＳＳは、デジタル信号に変換して発話認識のために処理されることになるデジタルに変換される前に、アナログ信号に再変換することができるオリジナル音声源信号に、又は発話認識処理の直前にデジタルフォーマットに変換することができるオーディオ信号などに適用することができる。

発話認識は、「自動発話認識」（「ＡＳＲ」）、「コンピュータ発話認識」、及び／又は「発話対テキスト」と呼ぶことができる。これらのシステムは、「スピーカ依存」システムの場合などでは、トレーニングを使用することができ、又はスピーカによる訓練をトレーニングを使用しなくてもよい（「スピーカ独立」システムと呼ばれる）。音声認識は、一般に、言っていることとは対照的に、話している人の身元を突き止めることを指している。スピーカの認識は、スピーカ依存システムにおける発話の翻訳業務を簡素化することができ、又はセキュリティ処理の一部として話し手の身元を認証又は検証するのに使用することができる。幾つかの実施形態において、発話認識にＳＳを適用する段階は、アナログ音声信号をデジタルオーディオに変換し、次いで認識された発話に変換することを含むことができる。一例において、デジタルオーディオをより良い音響的表現に変換する段階、発話認識器が予想される音素を認識するような規則を適用する段階、及び発話された音素を判定してこの音素を言葉に変換する段階を含むことができる処理を介して、変換を実行することができる。デジタルオーディオフォーマットは、チャネル数（モノラル対ステレオなど）、ビットレート、及び／又は他の特性の点で変更することができる。

発話認識はまた、発話波形から特徴ベクトルを抽出する段階を含むことができる。抽出は、最初に窓付き高速フーリエ変換（ＦＦＴ）を使用してデジタルオーディオを「周波数ドメイン」に変換することによって達成することができ、結果として得られる出力はスペクトルグラフが生成するものと類似している。このドメインでは、所与のサンプルレートに対する音声の周波数成分を使用して、当該サンプルに対する周波数成分の振幅のグラフを生成することができる。特徴ベクトルは、あらゆる短期間隔において発話信号の窓からコンピュータ計算することができ、発声は、これらの特徴ベクトルのシーケンスとして表すことができる。

幾つかの実施形態において、自動発話認識器エンジンは、人間の声によって生成された異なるタイプの音声に相関付けられる何千ものこのようなグラフのデータベースを含むことができ、当該サンプルで生成されたグラフはデータベースと照合され、音声を記述する数字を生成することができる。所与の発話特徴ベクトルに対する最も可能性のある単語列は、２つのタイプの知識源、すなわち音響知識と言語知識とを使用して発見される。発話認識エンジンは、発話音声の音響的特徴に対して「隠れマルコフモデル」（ＨＭＭ）と呼ばれる数学的技術を使用することができ、言語知識を表現するために確率言語モデルを使用することができる。幾つかの実施例において、大きな背景雑音又は他の周囲環境音のような干渉源は、信号源の誤解釈をもたらすことが多く、ユーザが高品質マイクロフォンを備えた静かな部屋にいる場合に有するのとは異なるベクトルを認識器に判定させることになる。従来では、背景雑音及び変動性の問題は、どの音素が話されたかを見つけ出すために統計モデルを使用して対処されてきたが、強い干渉では、得られる結果は一般的に不十分である。ＳＳ技術を発話認識処理に適用する１つの実施形態において、認識処理の初期ステップへのＳＳの導入は、これにより発話波形から特徴ベクトルが抽出され、他の手法よりも遙かに高い信頼性を有した音素及び発話を求めるロバスト性を極めて向上させることができる。ＳＳの適用は、特徴ベクトルをデジタルオーディオ信号から抽出するときの周囲雑音様の干渉の影響を大幅に低減することができる。ＳＳ処理された信号は、音声認識／識別に対して高い精度を提供することができ、オンボード処理（携帯電話、タブレット及び他のパーソナルデバイスセキュリティ特徴と同様に）又は制御されたアクセスデバイス又はエリア（制限されたアクセス施設、建物、金庫室又は他の安全な場所）におけるリンクされたネットワーク又はクラウドの何れかを使用して、何れかの既存の音声認識又は音声セキュリティシステムに導入することができる。音声／スピーカ認識では、同様の処理を使用して、当該の話し手の特徴ベクトルを抽出することができるが、これらのベクトルは、話し手が元々作成した発話のモデル／ライブラリと比較及び対比させて、類似性スコアを生成することができる。ＳＳ技術は、音声認識に導入され、限定ではないが、デジタル信号に変換されて、発話認識のために処理されることになるデジタルに再度変換される前にアナログ信号に再変換されるオリジナル音声源信号への適用、又は音声認識処理の直前にデジタルに変換されたオーディオ信号への適用を含む、本方法の何れかを介して改善された特徴ベクトルを提供することによる背景雑音又は競合する会話のような干渉を軽減することによって、スコアリングのロバスト性を増強することができる。本明細書で記載されるＳＳ方法及びシステムは、独立した処理技術又は既存のソフトウェアプログラムへのアドオンとして、音声／発話認識を使用した何れかのＰＣ、携帯電話、タブレット、又は他のシステムにおけるハードウェア又はソフトウェアとして実施することができる。

例示的かつ非限定的実施形態によれば、信号要素の表現は、信号のモデルにおいて構築することができる。信号は、個々の話し手に対応するトラック及び／又はトラックレットに分解及びグループ化することができ、分解された信号は特徴ベクトルに変換されて、発話認識エンジンで使用されるように適合される。このような実施形態において、特定の話し手（例えば、電話の所有者）に向けたバイアスを構築及び導入し、環境における他の全ての音声よりも優先してその話し手の発話を自動的に引き出して増強するようにすることができる。

別の実施形態において、発話特徴又は発話ベクトルと呼ぶことができる信号要素の表現は、信号の源信号分離モデルにおいて構築することができる。すなわち、信号は、個々の話し手に対応する発話特徴ベクトルに分解され、分解された表現を発話認識エンジン又は生体測定音声識別システムへの入力として使用することができる。

例示的かつ非限定的実施形態によれば、システムは、源信号分離の協働／分散コンピュータ計算に携わる近接プロセッサを備えた、マイクロフォンのような音声収集デバイスを含む。一部の実施形態において、アルゴリズムは、携帯電話、スマートフォン、タブレット又は他の移動デバイスで使用できるように処理負荷が少ないものであるように拡張可能である。幾つかの実施形態において、処理の一部は、モバイルデバイス上で行い、次いで結果と共に遠隔プロセッサ又はサーバに配信又は送信されて、モバイルデバイスに戻すようにすることができる。

幾つかの実施形態において、ＳＳ技術を補聴器のアプリケーションに使用することができる。補聴器は、音の増幅及びフィルタリングを助けて、聴力低下／難聴の人が音を理解できるようにする何らかの医療デバイスである。補聴器は、音を電気信号に変換することができるマイクロフォン（指向性又は無指向性）からなり、この電気信号がデジタル信号プロセッサによって処理されて、目標とする音を増強し、望ましくない背景雑音を最小にすることができる。結果として得られる目標音は、患者の三半規管内でスピーカを介して増幅及び中継される。患者の制御装置は、音量、雑音低減、及び様々な環境設定のために使用することができる。このデバイスのためのマイクロフォン、ＤＳＰ及び制御装置は、補聴器自体の上又は内部に、或いは外部制御デバイス又は携帯電話に位置付けることができる。

幾つかの実施形態において、本明細書で記載される源信号分離のための方法は、限定ではないが、目標音の増幅、単一の人の発話又は音源への集中化、混み合ったレストランで他の音を遮断／最小化しながらテーブルの会話のような限定領域への集中化、及び／又はユーザが所望の会話又は音源を聴取しないこと及び／又はそのユーザの理解を妨げることを選択できる背景又は他の周囲雑音を最小限又は排除することを目的とした何らかの設計の補聴器デバイスにおいて具現化することができる。これらのＳＳ法は、限定ではないが、耳掛け式補聴器、カナル式補聴器、オープンカナル式補聴器、クローズカナル式補聴器、気導式補聴器、骨伝導式／埋め込み型骨導式補聴器、眼鏡式補聴器、外部デバイスリンク式補聴器、携帯電話ベースの補聴器、ＰＤＡベース補聴器、ｉＰａｄ／タブレットベース補聴器、ＰＣベース補聴器、及び人工内耳を含む、何れかの聴覚支援デバイスにわたって利用することができる。ＳＳ技術はまた、ＦＤＡ調整補聴器及び店頭販売の処方箋なしの音声増幅デバイスの両方を含む聴覚支援デバイスに適用することができる。

幾つかの実施形態において、本明細書で記載されるＳＳ法はまた、携帯電話、テレビジョン、ラジオ、ＰＣ、クラウド、タブレット及び他の聴覚支援リンクデバイスにリンクさせることができる。１つの例示的な実施形態は、ユーザの放送を理解する能力に悪影響を与える可能性がある他の背景又は周囲雑音を最小限に又は遮断しながらユーザが放送を理解することを可能にするテレビジョンへのリンクとすることができる。同様に、このア用途の類似の実施形態は、ユーザが電話を受けている場所での周囲又は背景雑音と、回線の向こう側で発信者によって送信された望ましくない背景雑音の両方を最小に又は排除するように処理された携帯電話伝送の増幅を含むことができる。

幾つかの実施形態において、本明細書で記載されるＳＳ法は、何れかの聴覚支援デバイス上に位置付けられ又は組み込まれた、或いは聴覚支援処理デバイスの外部に位置付けられて無線、赤外線（ＩＲ）、Ｂｌｕｅｔｏｏｔｈ、有線又は他の伝送法を介して当該デバイスに送信される何れかのマイクロフォン（ステレオ又はモノラル、指向性又は無指向性）又はマイクロフォンアレイと連携することを意図することができる。例示的な実施形態は、携帯電話又はタブレットリンクの補聴器とすることができ、この場合、音は、これらのデバイスに記録され、これらを耳に送信して放送することができる。同様に、目標音源を記録するためのマイクロフォンは、ユーザの眼鏡に位置付けられ、又は、衣服もしくは宝飾品類に埋め込まれ、ユーザの首の周りに装着され、ボタン、帽子又は他の衣服もしくはファッションアクセサリに埋め込むことができる。限定ではないが、上記の実施例を含むマイクロフォン設計は、目標音を処理デバイスに送信することができ、ここで本明細書で記載されるＳＳ方法及びシステムは、これらの音を処理するよう構成することができる。アルゴリズム処理は、独立ＤＳＰ上で、又は組み込み式ファームウェアを介してデバイスのＣＰＵで行うことができる。これらの処理プラットフォームの配備は、デバイス自体、外部制御ユニット、タブレット、ＰＣ、ＰＤＡ、携帯電話又はクラウドを介した送信又はセルラー又は無線ネットワークを通じて中央サーバに戻る伝送上とすることができる。相互的補聴器又はアレイマイクロフォンシステムに記録された信号は、デバイス間で、又はリアルタイム又は準リアルタイム処理のため、限定では無く上述のものを含む外部処理ユニットに送信することができる。

一部の実施形態において、本明細書で記載されるＳＳ技術によって処理された信号は、ユーザの耳の中又はその近くのスピーカを介して、又は直接感覚神経処理のための神経又は骨刺激デバイスを介して再生されることになる出力信号に再合成することができる。中継のためのスピーカべースのデバイスは、オープンカナル式及びクローズカナル式システム、ヘッドフォン、電話デバイス、携帯電話、Ｂｌｕｅｔｏｏｔｈ及び他のスピーカベースのデバイスを含む。再合成信号は、同じデバイス（耳掛け式補聴器など）取り込まれ、又は外部処理ユニット（タブレット、携帯電話、ＰＣ又は他の携帯式プロセッサなど）から出力スピーカデバイスに送信することができ、単一の再処理入力、或いは、複数の記録デバイスからの多くの同時記録及び混合入力の組み合わせとすることができる。ＳＳ処理を使用する聴覚支援技術は、臨床プログラムパラメータ又はユーザ制御パラメータを特徴付けて、デバイス処理を特定の環境に対して調節することができる。臨床パラメータの例示的な実施形態は、距離ベースＳＳ及び背景雑音低減設定であり、初期フィッティングの際にプログラムすることができ又は電話又はＰＣ／ウェブインタフェース再プログラミングを介して後で調節することができる。ユーザに基づく制御の例示的な実施形態は、オンボードデバイスダイヤル、外部制御ユニット、又はＰＣ／携帯電話／タブレットベースのアプリケーションを含むことができ、これらは、ユーザが、背景雑音への目標発話の混合、目標発話増幅レベル、リアルタイム又は準リアルタイムの送信の利用、目標音源を収集したい場合のエリア又は方向を管理する距離及びベクトルベースの制御装置、ＴＶ、携帯電話、ラジオ、音声制御システム又は直接インタフェースのための他のＰＣベースのデバイスにタップする能力を制御するのを可能にすることができる。ユーザはまた、レストラン又は近くの会話などの様々なモードにデバイスを設定する能力を有し、或いは、目標発話に対する遅延リードインと中継音の明瞭度又は自然性と間のトレードオフを決定できるように再生のためのリードイン時間を制御することができる。

例示的かつ非限定的実施形態によれば、システムは、マイクロフォンのような音声収集デバイス、又は源信号分離の協働／分散コンピュータ計算に携わるための近接プロセッサを有する通信のための音声送信デバイス（例えば、Ｂｌｕｅｔｏｏｔｈ又は他の送信プロトコルを使用する）を含む。幾つかの実施形態において、アルゴリズムは、補聴器上で使用できるように処理負荷が少ないものであるように拡張可能である。幾つかの実施形態において、一部の処理は、補聴器に転送される結果と共にプロセッサによってリモートサーバに配信することができる。

１つの変形形態では、携帯電話は、より多くの処理を実行できるサーバにデータを送信することができる。一部の場合では、補聴器が実際により多くの処理能力を必要とし、リモートサーバに送信することができない場合、補聴器はユーザのポケットの中の電話のような近接デバイスに送信することができる。電話は、ローカルスーパーブースター又は外部処理システムのように機能することができる。このような例では、補聴器は、定義されたモードに遷移し、追加のコンピュータ計算パワーを使用して処理を携帯電話にオフロードし、処理能力の向上を達成することができる。一例において、制御装置は、実際の携帯電話又はコンピュータタブレット上に配置することができ、これによって例えば、レストランにおいて着席している人が携帯電話をテーブルに置いて、画面をタップし、又はスライダ制御部を動かして、テーブルに着席している人達の方向で処理及び源信号分離を調整するようにすることができる。これに応答して、アルゴリズムは、テーブルに居る人達の会話の増強を助けるよう動作する。図１５は、タブレット又は携帯電話制御のためのこのようなコンピュータ生成インタフェースの例示的で非限定的表現を示す。

別の実施形態において、周囲雑音又は望ましくない背景雑音は、入力源信号から除去して分解源信号を生成することができ、次いで、これを低雑音レベルの周囲又は背景雑音と再結合し、結合された信号を出力することができる。幾つかの実施形態において、ユーザは、再導入された周囲雑音の雑音レベルを動的に又は静的に変更することができる。

幾つかの実施形態において、本明細書で記載されるＳＳ技術は、電話アプリケーションで使用することができる。セルラーネットワークでの移動電話通話では、オーディオが組み込まれたマイクロフォンを介して取り込まれ、続いて、アナログからデジタル信号に変換される（通常は「Ａ−Ｄ」変換と呼ばれる）。次に、結果として得られるデジタル信号が、セルラーネットワークを介して圧縮又は非圧縮形式で最終端末に送信され、これによってオーディオ出力として送信される。伝送処理に沿ったあらゆる場所又は送信のエンドポイントにて、デジタル信号はアナログ信号に戻される。一般的には、送信するために電話（携帯電話、スピーカフォン、ＶｏＩＰ電話及び同様のものなど）によって取り込まれたオーディオは、オーディオファイルの変換も送信も妨げることのない周囲雑音又は他の干渉を包含する可能性があるが、意図された受信機への出力ファイルの一般的品質に影響を与える可能性がある。例えば、移動電話のマイクロフォンは、話し手の音声をピックアップすることができるが、当該の発信者近くで発生した他の会話の雑音を取り込む可能性もあり、これが変換されて通話の受信者に送信される場合がある。オーディオが変換されて受信者に送信された場合、聴取者は、干渉雑音も送信された状態で話し手を理解するのが困難になる可能性がある。一般に、雑音及びエコーキャンセルのような特定のアルゴリズムが取り込みポイント（移動電話におけるなど）にて適用され、この場合、信号は送信のために変換することができるが、適用されるアルゴリズムは、従来的には、雑音／干渉作用の一部を軽減するに過ぎず、受信相手は、送信者の知覚可能性を妨げる恐れのある干渉環境雑音を受信する可能性が依然としてある。

本明細書で記載される源信号分離の方法は、限定ではないが、目標音の増幅及び／又は、望ましくない送信が、呼出側、当該の話し手及び／又は会話に関するユーザの理解に干渉することに起因して、受信相手が聴取及び／又は送信することを望まない背景又は他の周囲雑音を最小限にし又は排除しながら、電話会議で話している携帯電話又は電話のユーザ又は当該の人に焦点を合わせる目的で、何れかの電話アプリケーションに導入することができる。

これらのＳＳ法は、電話アプリケーションの受信者に対する源信号取り込み、変換、送信及び／又は配信／出力の何れかのポイントの間に導入及び適用することができる。ＳＳ法は、通話中に常に適用されるよう統合することができ、或いは、送信者又は受信者が通話中に干渉源の軽減を提供するためにＳＳ法の導入を要求することを可能にする制御機構と共に導入することができる。ＳＳシステム及び方法は、ファームウェア、組み込み式ソフトウェア、独立型ソフトウェアアプリケーション又はプラットフォーム、或いは付加的なソフトウェア機能又は特徴として組み込むことができ、これらは、単独で、或いは雑音低減、通話明瞭化及び／又は他の性能利益のため他のアルゴリズムと共に使用される（携帯電話又はネットワークなど）収集、送信又は配信ポイントから実施することができる。

幾つかの実施形態において、ＳＳアプリケーションは、車両音声制御システムにおいて使用することができ、これは、ロードノイズ、外部環境雑音、ラジオ雑音、ＨＶＡＣ雑音、意図しない車室内雑音及びそれに伴う乗員雑音など又は類似の干渉音源の何れかと混合された目標オーディオ指令の要素を処理する問題に対処することができる。本明細書で記載されるＳＳ法は、車内音声応答システムと共に使用して、正確な音声応答処理システムの処理、自動車制御及び車両セキュリティのために望ましくない又は干渉する背景雑音から目標指令を抽出し増幅することができる。本明細書で記載されるＳＳ法は、音声応答システムによって処理することができる発話又は抽出された発話特徴を使用することを介して、音声指令システムと対話することができる。処理システムは、車両ベースＰＣにおけるオンボードに含まれ、又は車両外部の中央処理サーバに送信することができる。このようなシステムによって制御される音声応答指令の例示的な実施形態は、限定ではないが、車載ナビゲーション、ＨＶＡＣ、窓、ラジオ、座席機能、ワイパー、自動ドアロック及び制御、サンルーフ制御などの自動システム制御装置、並びに携帯電話統合及びｉＰａｄ、タブレット、ｍｐ３、オーディオ及び娯楽デバイス制御のような第三者統合デバイス制御を含むことができる。ＳＳシステムはまた、携帯電話に、或いは、車両中央オーディオ処理システムを通過することができる送信及び受信信号の両方を処理するＢｌｕｅｔｏｏｔｈ及び他のヘッドセットシステムにリンクすることができる。ＳＳ法の付加的な配備は、車両制御及びセキュリティのためのオンボード音声生体認証とすることができる。本明細書で記載されるＳＳシステム及び方法によって取り込まれた発話特徴要素は、各個人ユーザに固有の正確な発話特徴の抽出を可能にすることができる。この制御機能の代表的な配備は、限定ではないが、ドライバ／ユーザ割り当ての車両ロック及びアラーム制御、ドライバエンジンスタート及び停止制御（オンボードで又は携帯電話のような外部制御デバイスを介して起動される）、ナビゲーションシステムのドライバ及び／又は特定のユーザ制御、及び非必須の車両制御システムを含むことができる。

本明細書で記載されるＳＳシステムは、車室内に組み込まれた、又はＢｌｕｅｔｏｏｔｈヘッドセット又は他のハンズフリー携帯電話制御デバイスのような外部システムへのリンクを介して単一のマイクロフォン（ステレオ又はモノラル、指向性又は無指向性）又はマイクフォンのアレイによって可能にすることができる。システムは、音声制御システムが、ドライバの座席、ドライバと乗員の両方の座席、又は指定された生体認証署名を有する個人に対しての指示だけを受け入れることができるように、ユーザによって配備及びプログラムすることができる。また、後部座席の個人が後部ＨＶＡＣシステム又は後部娯楽システムを制御できるように、別個の制御装置を追加することができる。幾つかの実施形態において、ドライブ又は付加的な当事者音声生体認証制御装置は、システムの使用を介して、又は本明細書で記載されるＳＳ法を使用して別のデバイスからのダウンロードされるユーザ音声生体認証プロファイルを介してプログラムすることができる。

幾つかの実施形態において、本明細書で記載されるＳＳ法は、限定ではないが、超音波、ＭＲＩ、ＣＴスキャン、ＰＥＴスキャン、Ｘ線、ＳＰＥＣＴ、ガンマカメライメージング、原子核イメージング、光音響イメージング、胸部サーモグラフィ、及び光学コヒーレンス断層撮影を含む、静的イメージング又は時系列イメージング信号分析を使用する一連の医用イメージングアプリケーションに配備することができる。本明細書で記載されるＳＳ法の適用は、目標画像の分解能の改善及び上述及び他の医用イメージングシステムにおいてイメージング機器によって発生する雑音の低減を可能にすることができる。本明細書で記載されるＳＳ方法及びシステムの例示的な実施形態は、分解能を増強して超音波プローブの重なり合った要素によって生じる雑音を低減するための医用超音波システムにおける用途を含むことができる。ＳＳアルゴリズムは、自立型超音波システム、ＰＣベースシステム、タブレットシステム、スマートフォンアプリ、ＰＤＡ、及び手持ち式システムに組み込むことができる。ＳＳアルゴリズムは、デバイス内部ＣＰＵ、ソフトウェア、又はデバイスにロードされたアプリを実行できるファームウェアとして、或いは、制御ボックス又は超音波プローブ自体に組み込まれたＤＳＰ又は他のチップとして組み込むことができる。改善された超音波のためのＳＳ方法及びシステムは、プローブの個々の要素によって収集されたデータの事前又は事後合計を組み込むことができる。本明細書で記載されるＳＳ方法及びシステムは、目標生体組織における差違を補償するためにビーム角度及び信号強度における調節と適合するように事前及び／又は事後ビーム形成を使用することができる。

幾つかの実施形態において、本明細書で記載されるＳＳ方法及びシステムは、限定ではないが、２Ｄ超音波、３Ｄ超音波、４Ｄ超音波、組織ドップラー、流量ドップラー組織緊張分析、弾力性分析及び他のアプリケーションを含む、何れかの形式の超音波（音波又はエコーなど）イメージングソフトウェア又はアドオンイメージング分析プログラムと共に使用することができる。ＳＳソフトウェアは、診断及び手術アプリケーションの両方を含む全ての臨床診療にわたって適用することができる。ＳＳ拡張超音波画像の実施形態は、超音波支援生体検査、超音波支援カテーテル配置、エコー心臓内科、心臓内科及び心臓病手術アプリケーション、整形外科及び整形外科手術アプリケーション、イメージング及び手術の両方を含む超音波及び他の産科及び婦人科アプリケーション、泌尿器科アプリケーション、胃腸アプリケーション、軟組織アプリケーション、頭部、頸部及び頭蓋アプリケーションを含むことができる。本明細書で記載される主要な超音波アプリケーションは、限定ではないが、複合材料、構造、及び地質調査の超音波分析を含む、獣医及び産業アプリケーションのための超音波ハードウェア及びイメージングソフトウェアプログラムの両方と共に使用することができる。

幾つかの実施形態において、ＳＳ技術は、音声ナビゲーション及び測距（ソナー）に関係付けられるアプリケーション、並びに水中音響アプリケーションに使用することができる。ソナーは、音伝播を使用して、水面上又は水面下で物体をナビゲートし、通信及び／又は検出する。目標物質によって生成された音を「聴く」ことができるパッシブソナー技術に基づくアプリケーション；及び音のパルスを放出してエコーを聴くことができるアクティブソナー技術に基づくアプリケーションを含むことができる２つのタイプのソナーベースアプリケーションが存在することができる。ソナーは、水中での「目標」の音響位置付け及びエコー特性の測定の手段として使用することができ、限定ではないが、潜水艦ナビゲーション、魚雷及び地雷誘導、地下水調査及びマッピング、エコー測深、パイプライン調査、波測定、及び当該の目標の進路、測距、軌道及び速度の決定（目標移動分析などを使用した）を含むアプリケーションで使用することができる。

幾つかの実施形態において、本明細書で記載されるＳＳ方法及びシステムは、モノスタティック、バイスタティック又はマルチスタティック構成で動作することができる音声送信機及び受信機を使用できる何れかの形式のアクティブソナーを用いて信号品質を高めるのに使用することができ、音響周波数は、極めて低い周波数（超低周波）から極めて高い周波数（超音波）まで変化することができる。ソナーは、一定周波数又は可変周波数の「チャープ」の信号生成器、電力増幅器及び電気音響トランスデューサ／アレイを使用して一般的に電気的に生成された音のパルスを利用することができる（受信時にパルス圧縮を可能にする）。ＳＳはまた、要求されるサーチ角度を対象範囲に含むように掃引することができるビームに音響パワーを集中させるように使用できるビーム形成器と共に組み込むことができる。一部の場合では、爆薬を化学的に使用する、又はエアガンを使用する、又はプラズマ音源を使用するなどの他の手段によって音響パルスを作成することができる。

幾つかの実施形態において、本明細書で記載されるＳＳ方法及びシステムは、何れのパルスも送信することなく通常は「聴く」ことができ、一般的に大規模ソニックデータベースに照合して検出した音を比較することによって検出した音源を識別するための様々な技術を有する何れかの形式のパッシブソナーによって信号品質を高めるのに使用することができる。パッシブソナーの使用によって、目標放射雑音レベルが十分に高い場合、目標を識別することができる。しかしながら、幾つかの実施例において、動作は、水の体積弾性率、密度、温度、溶解不純物（通常は塩分）、及び均一な水圧によって決定される音速の変動の影響を受ける可能性がある。

本明細書で記載される１又は２以上の実施形態において、本明細書で記載されるＳＳ法は、アクティブ及びパッシブソナーシステムの全ての形式に適用されて、音の変動に対処し、並びに音又はエコーが受信されたときに分析の処理内の何れかのポイントでの雑音、干渉、及び／又はクラッターを軽減し、これによって最終用途アプリケーションに送られる最終データの品質を向上させることができる。これは、何れかの他の補正アルゴリズム及びシステムにも関係なく、又はビーム形成及び狭ビーム伝送などのこのようなシステムの１又はそれ以上と共に受信、送信又はディスプレイシステムのソフトウェア又はハードウェア構成要素に導入することができる。幾つかの実施例において、所望の目標エコー又は痕跡に干渉する雑音源は、波及び船舶輸送から乱気流及び海洋生物に及ぶ可能性がある。更に、水を通る受信機の動きは、速度依存の低周波数雑音を起こす可能性がある。アクティブソナーが使用される場合、海中の小物体から並びに海底及び海面から散乱が発生する可能性がある。アクティブ及びパッシブソナーに加えて、ＳＳ技術は、限定ではないが、合成アパーチャソナー及びパラメトリック及び非線形ソナーを含む他のソナーに基づくシステムに恩恵を与えるために適用することができる。本明細書で記載されるＳＳ方法及びシステムはまた、水面下でメッセージを送信及び受信するのに使用できる水面下音響通信を含む、水力音響システムに導入することができる。このような通信を利用する幾つかの方法が存在することができるが、最も一般的な方法は、水中聴音器を使用するものを含むことができる。水面下通信は、限定ではないが、マルチパス伝播；チャネルの時間変動；小さな利用可能帯域；及び強力な信号減衰を含む、多くの要因に起因して困難となる可能性があり、これらはＳＳによって対処することができる。

幾つかの実施形態において、本明細書で記載されるＳＳシステム及び方法は、マイクロフォン依存システムにおいて使用することができる。携帯電話及び他の電話システム、ヘッドセット、スピーカフォン及び一般的なマイクロフォンベースのシステム（単独で又はセルラーもしくは他の電話ネットワークと共に使用される）と同様のものは、デバイスユーザの受信、処理及び送信に関する意図しない作用、並びに送信／記録時に存在する意図しない背景雑音及び周囲雑音を有する可能性がある。現行のシステムは、話し手を圧倒する可能性がありかつ受信機／ユーザが意図した送信／記録を理解するのが困難ななる可能性がある他の周囲雑音又は干渉雑音から目標ユーザを分離することができない場合がある。この問題の代表的な実施例は、フライト制御システムを介した航空機雑音の伝送、携帯電話ヘッドセットを介した空港でのＰＡアナウンスの放送、電話会議スピーカシステムを介した室内雑音送信、「ドライブスルー」注文システムを介した自動車雑音及び屋外雑音送信、又はコーチのヘッドセットを通じた観衆雑音送信を含むことができる。

本明細書で記載されるＳＳシステム及び方法は、送信／記録デバイスにおけるマイクロフォンによって取り込まれた望ましくない／意図されない周囲／背景雑音に対するユーザの品質／知覚を改善する目的で、このようなマイクロフォン依存デバイスに組み込むことができる。ＳＳ法は、各デバイスが特定の話し手、或いは近接デバイスユーザのような定義された限定エリア／半径から発生し遠距離場雑音を遮断する音源だけを送信することができるように、最適化することができる。これは、ＳＳ方法及びシステムを使用して、目標とする話し手からであり意図されない背景雑音からではない音を抽出し選択的に送信／記録することによって達成することができる。

このようなシステムの例示的な実施形態は、本明細書で記載されるＳＳシステム及び方法をＢｌｕｅｔｏｏｔｈヘッドセットに付加することを含むことができる。ＳＳ技術は、既存のプロセッサに付加された専用ＤＳＰ又はファームウェアとしてヘッドセットに追加することができる。ＳＳ技術は、結果として得られる信号を送信又は記録する前に、デバイスのマイクロフォン（指向性又は無指向性）によって取り込まれた信号を処理して、意図されない雑音から目標音源を抽出することができる。このことは、記録デバイス又は送信システムが抽出された音源だけを記録でき、従って、当該音源の品質及び明瞭度を確実に高めることができる。一連の処理におけるこの新しいステップは、単独の特徴要素として使用することができ、或いは、他のオーディオ処理及び拡張アルゴリズムと組み合わせて使用することができる。本明細書で記載されるＳＳシステム及び方法の別の例示的な実施形態は、マイクロフォンベースの記録において使用することができる。１つのチャネルでは目標音源を抽出して記録することができ、他方、別のチャネルでは背景雑音を記録することができる。次いで、各チャネルを再混合して、最適な／所望の音効果及び品質にすることができる。

例示的かつ非限定的実施形態によれば、システムは、源信号分離の協働／分散コンピュータ計算に携わる近接プロセッサを備えた、マイクロフォンのような音声収集デバイス、又は通信（例えば、Ｂｌｕｅｔｏｏｔｈ又は別の通信プロトコルを使用した）のための音声送信デバイスを含む。幾つかの実施形態において、一部の処理は、通信システムを介して返信され送信される結果と共にプロセッサによってリモートサーバに配信することができる。

別の実施形態において、目標入力信号とは別個の周囲雑音又は背景雑音は、入力源信号から除去されて分解された源信号を生成することができ、次いで、これをより低い又は低減提示レベルの周囲又は背景雑音と再結合して、結合信号を出力することができる。幾つかの実施形態において、ユーザは、再導入された周囲雑音の提示レベルを動的に又は静的に変えることができる。

幾つかの実施形態において、本明細書で記載されるＳＳシステム及び方法は、音声制御テレビジョン及び他の対話型デバイスベースのアプリケーションに使用することができる。ＴＶ、ビデオゲーム、娯楽システム及び他の対話型デバイスのための音声認識及び音声駆動式指令システムの普及は、干渉雑音、意図しない話し手の割込指令、及び指令認識及び応答に影響を与える背景雑音の問題によって制限されてきた。本明細書で記載されるＳＳ法は、正確な音声認識及び応答を保証する目的で何らかのこのような娯楽デバイスに組み込むことができる。更に、このようなデバイスは、本明細書で記載されるＳＳ法を適用することができる（前の段落で詳述された）ものと類似した発話及び音声認識のネットワーク依存の解決策にリンクされ、又はこれを利用することができる。本明細書で記載されるＳＳシステム及び方法の例示的な実施形態は、テレビジョン機能のための音声応答／音声制御装置においてＳＳの使用を含むことができる。ＳＳによって、システムが、システムにおいて事前プログラムすることができる特定の話し手又はリモート制御装置又は他の類似のデバイスに話し掛ける未知の話し手に焦点を合わせることを可能にすることができる。スピーカの音声指令は、全てのデバイス特徴、並びに限定ではないが、ケーブルＴＶボックス、ＤＶＲシステム、衛星システム、ＤＶＤプレーヤ、統合サウンドシステム、ＰＣ、ビデオゲームシステム／コンソール、インターネット接続性、クラウド接続性、ビデオ会議システム、ＶＯＩＰ／インターネット電話システム、及び他の類似のデバイスを含む、関連デバイスの特徴を制御するよう構成することができる。幾つかの実施例において、ＴＶ音声応答制御装置は、限定ではないが、テレビジョン組み込み型マイクロフォン／スピーカ、専用遠隔制御マイクロフォン／スピーカ、外部マイクロフォン／スピーカシステム、携帯電話、タブレット、ＰＣ、ビデオゲームシステム及びヘッドセットを含む、何れかのマイクロフォン又はスピーカ／マイクロフォン結合システムによって駆動することができる。このような実施例において、制御特徴要素は、指向性／無指向性マイクロフォンを使用することができ、及び／又はＩＲ、Ｂｌｕｅｔｏｏｔｈ、ＷｉＦｉ、ＲＦ又はシステムとの有線リンクを使用することができる。このようなシステムは、双方向対話、すなわち音声駆動式クエリの受け入れ及び応答を可能にすることができ、ビデオ会議、ウェブ会議、ＶＯＩＰ、及びウェブに基づく電話会議のためのインタフェースとして機能することができる。本明細書で記載される音声制御ＴＶのためのＳＳ方法及びシステムは、受信した発話を再合成することができ、又は再合成しない場合もある。雑音環境では、受信した発話は、発話認識エンジン又は音声応答システムを駆動する目的で本明細書で説明したＳＳ数学モデルに基づいて発話特徴又は発話ベクトルとして処理することができる。再合成された発話によって、背景雑音の可変レベルを再度組み込むことができる。システムは、１又は複数の目標音声に応答するように訓練することができる。幾つかの実施形態において、スピーカ認識訓練は、デバイスの初期化の際にデバイス使用又は発話の引用を介して生成することができる。

幾つかの実施形態において、本明細書で記載されるＳＳ方法及びシステムは、電源監視に関係するアプリケーションで使用することができる。電源は、例えば、幾つかのアプリケーションにおいて平均しておよそ５０Ｈｚの連続した低レベル雑音を発生する。電力需要の変動により、この雑音レベルの僅かな変動を引き起こす可能性がある。例えば、電力需要の増大は、雑音レベルを低下させることができるが、需要レベルの低下は、反対の作用を有する可能性がある。電力需要の変動は、何らかの記録に相関付けることができる固有の時間／日付痕跡を提供する機能を送電網に与えることができる。本明細書で記載されるＳＳシステム及び方法を用いて、電気配電網を監視し、監視システムの高精度な時系列痕跡を作成することができる。この痕跡は、何れかの記録デバイス（オーディオ又はビデオ）又は源信号タイプ（アナログ又はデジタル）から導き出すことができる。低レベルオーディオ信号は、システム全体にわたって一貫したものとすることができ、信号分析は、発電所、特定の機械又は何れかの他の場所で行うことができる。本明細書で記載されるＳＳシステム及び方法は、何れかのライブ映像又は記録から電源供給の信号影響を抽出して、電気配電網の高精度時系列痕跡を提供するよう構成することができる。この痕跡は、リアルタイムで又は準リアルタイムで監視され、或いは後で分析することができる。このシステムの例示的な実施形態は、ＳＳを使用して、差し迫った電圧低下、出力スパイク、停電又は電源の寸断を予測することができる。これは、低レベル雑音対履歴規格／予測子における変化を分析することによって、送電網全体レベルで、個別の現場で、又は個々のデバイスで行うことができる。記録デバイスは、上記の場所、機械又はデバイスの何れかで周囲雑音を記録することができ、その結果、ＳＳ法は、他の雑音から目標電気雑音を分離することになる。ＳＳ方法及びシステムは、雑音レベルが何れかの問題をもたらす場合に、電力雑音の測定値を生成して、差し迫った事象の警報を送信するように構成することができる。警報は、デバイス自体で発生させるか、又はネットワーク、無線を介して、又はクラウドを介して、何れかの監視デバイス、ＰＣ、タブレット、携帯電話又は何れかの他のデバイスに送信することができる。

システムの別の例示的な実施形態は、フォレンジックな音声分析に関連付けることができる。この実施形態は、記録が作成された日付及び時刻の識別及び検証を含むことができる。本明細書で記載されるＳＳ方法及びシステムを使用して、記録から電気システム雑音を抽出し、当該信号の高精度数学的表現を生成することができる。当該信号は、電気配電網からの既知の記録に相関付けて、記録が作成された正確な時刻及び日付を決定することができる。このような認証及び／又は検証は、証拠に認められてこのような記録が確実に不当にならないように記録を検証するのに必要とすることができる。分析は、何れかのタイプの記録（オーディオ又はビデオ、デジタル又はアナログなど）、ファイルフォーマット、又は記録の持続時間に対して行うことができる。

適合ユーザインタフェースは、ユーザが、処理の再合成段階のため追跡、グループ化、及びピーク選択を観測してこれと対話できるようにする。ユーザインタフェースは、「オフライン」で使用して格納されたデータを観測し補正することができ、又は「オンライン」で使用して、処理構成要素に命令してリアルタイムでデータと対話することができる。ユーザインタフェースを使用して、データを分析し、成分パラメータを補正することができる。ユーザインタフェースは、ユーザ対話から最適成分パラメータを検出することができる。例えば、再合成のためのデータのユーザ選択が与えられると、適合ユーザインタフェースは、類似のデータを検出するための処理パラメータを計算することができる。

例示的かつ非限定的実施形態によれば、ユーザインタフェースは、トラック、すなわち、視覚的表現をトラック、トラックレット及び／又はコヒーレントグループを備えた信号データの追加、除去又はグループ化の少なくとも１つに編集するための複数の潜在的にコヒーレントなトラックレット及び／又はコヒーレントグループとして信号を観測するために提供される。

別の実施形態において、ユーザインタフェースを利用して、トラック；複数の潜在的にコヒーレントなトラックレット；及び／又はコヒーレントグループとして信号を観測することができ、ユーザは、トラック、トレックレット；及び／又はコヒーレントグループをクリックすることができ、当該トラック、トラックレット及び／又はコヒーレントグループに関連付けられるデータが提示されることになる。別の実施形態において、ユーザインタフェースは、トラック；複数の潜在的にコヒーレントなトラックレット；及び／又はコヒーレントグループとして信号を観測するために利用することができ、ユーザは、当該トラック、トラックレット、及び／又はグループに関する特性データを含む入力に基づいて、インタフェース内でトラック及び／又はトラックレットを検索及び見出すことができる。別の実施形態において、ユーザは、オンザフライでスコアリング関数を変更して、トラック、グループ、及び／又はトラックレットに関連付けられるデータを補正することができる。

図１６を参照すると、上記の実施形態及び説明に従って実施することができるトラックエディタの例示的な実施形態が示されている。図示のように、トラックエディタは、発振器ピークから構成される複数のトラックレットを表示する。様々な例示的かつ非限定的実施形態において、発振器ピークは、トラックＩＤに応じて色付けすることができる。更に他の実施形態において、発振器ピークは、コヒーレントグループＩＤに応じて色付けすることができる。他の実施形態において、発振器ピークは、再合成のために選択されるか否かに応じて色付けするか又は透明に設定することができる。他の実施形態において、発振器ピークは、何れかの他の発振器ピークパラメータに応じて色付けすることができる。他の実施形態において、発振器ピークは、振幅、背景電力に対する振幅に従って、又は等しいサイズでスケール調整することができる。

図１７を参照すると、トラックエディタＧＵＩの例示的かつ非限定的実施形態が示されている。例示的かつ非限定的実施形態によれば、ユーザは、トラックエディタＧＵＩに表示されたデータを選択して、該選択したデータに対する動作を実行することができる。１つの実施形態において、データは、ボックス又は投げ縄などで描かれるエリアによって選択することができる。他の実施形態において、ユーザは、トラックレットの何れかのピークをクリックすることなどによって、トラックレット毎にデータを選択することができる。他の実施形態において、ユーザは、コヒーレントグループの何れかのピークをクリックすることなどによって、コヒーレントグループ毎にデータを選択することができる。更に別の実施形態において、ユーザは、何れかのピークをクリックすることなどによって発振器ピーク毎にデータを選択することができる。

選択されると、ユーザは、データに対して実行されることになる動作を選択することができる。例えば、ユーザは、別の図にデータをプロットすることができ、ここで発振器ピーク統計値、到達方向、時間ドメインオーディオ、スペクトログラムデータ及び同様のものが視覚的にレンダリングされる。幾つかの実施形態において、ユーザは、「ターンオン／ターンオフ」選択肢などを介して再合成のための選択ピークを含むかどうかをシステムに示すことができる。

図１８を参照すると、上述したようにユーザ選択データを表示するためのデータ視覚化器の例示的な実施形態が示されている。

様々な実施形態によるＳＳ方法及びシステムは、ソフトウェア、ハードウェア、ファームウェア、又はこれらの何れかの組み合わせで実施することができる。処理は、好ましくは、様々なコンピュータ装備デバイス（パーソナルコンピュータ、移動電話、イメージングデバイス、補聴器、対話型音声応答システム、電話会議システム、オーディオ記録デバイス、車載音声起動システム、ディクテーションシステム、及び通信システムなど）上で実行される１又は２以上のコンピュータプログラムに実装することができる。このようなデバイスは、とりわけ、コンピュータプロセッサ（汎用及び専用マイクロプロセッサなど）、及びプロセッサ及び入力／出力デバイスによって可読の記憶媒体を含むことができる。各コンピュータプログラムは、デバイスのランダムアクセスメモリに常駐するコードモジュール内の命令のセット（プログラムコード）とすることができる。コンピュータプロセッサによって要求されるまで、命令セットは、一部の場合では、別のコンピュータメモリ（半導体メモリデバイス、ハードディスクドライブ、又は光学ディスクのようなリムーバブルメモリデバイス、外部ハードドライブ、メモリカード、又はフラッシュドライブ）に格納でき、又は別のコンピュータデバイス上に格納されてインターネット又は他のネットワークを介してダウンロードすることができる。

従って、あらゆる信号をその構成要素又は源信号エミッタに分解しかつ信号を全体的に又は部分的に再構成する能力を説明してきた。例示的かつ非制限的実施形態による目標源信号エミッタの正確な抽出を可能にする源信号分離における改良された測定のための新しい方法及びシステムをここで紹介する。

本明細書では経路伝播効果測定及び軽減のための技術も説明する。これらの技術を源信号分離と組み合わせて使用し、当該の信号を正確に識別し、源信号がエミッタから受信機に渡る時にエコー、残響、及び反射信号によって導入される影響を軽減することができる。

本明細書で使用する「経路伝播効果（ＰＰＥ）」とは、エコー及び残響によって起こるような発生源と受信機の間のチャネル効果によって起こる信号への歪みを特徴付けるために使用できる数学的表現に与えられる名前であり、一般的には数学的畳み込みによって実施される。これらの効果は、信号の位相、周波数、及び振幅に変化を引き起こす可能性がある。

本明細書で使用する「経路伝播関数」は、上記に定義した経路伝播効果（ＰＰＥ）に密接に関係付けられ、エコー、反射、残響、及び発生源位置と受信機の間の信号を変化させる他の屋内効果によって起こる信号への歪みを表し、これらの効果がＰＰＥ軽減で使用する数学的関数にどのように包含されるかを表す。これらの効果は、非定常及び非線形である可能性があり、一般的には屋内又は他の環境の特定のポイントから定義され、近くの位置の経路伝播関数とは別であると考えられることがある。

本明細書で使用する「到着角（ＡＯＡ）」は、センサ又はセンサのセットから測定される信号の発生源への方向を指す。

本明細書で使用する「到着時間遅延（ＴＤＯＡ）」は、信号が複数のセンサから測定された時の第１センサでの信号の受信と第２センサでの信号の受信の間の時間量を指す。音声信号処理では、この測定結果はサンプルで推定されることが多く、サンプルレートは、アナログ／デジタルコンバータの出力レートである。

本明細書で使用する「クロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）分析」は、限定されるわけではないが音声信号を含む信号のＴＤＯＡを決定するために相対位相を使用する方法を指す。

本明細書で使用する「シグマ」は、複数のセンサで測定された信号の振幅を使用して計算されるＡＯＡの推定値である。

本明細書で使用する「予測ＸＣＳＰＥ曲線（ＰＸＣ）」は、所与のＴＤＯＡに対する１つの周波数当たりの予測ＸＣＳＰＥを指す。

本明細書で使用する「集約ＸＣＳＰＥタウ推定（ＡＸＴＥ）」は、ＰＸＣトレースの既知のパターンを使用した発振器ピークのセットのＴＤＯＡを測定するための処理を指す。

本明細書で使用する「エンティティパラメータ」は、所与のサウンド発生源又はエンティティからのスペクトルの各部分を識別及び分離するために使用することができる測定値のセットを指す。

以下の例示的かつ非制限的実施形態は、上述のようにｉ）発振器ピーク又はｉｉ）発振器ピークのフレーム又はグループと共に適用することができる５つの新しい測定技術を紹介する。本明細書で紹介するピーク測定ツールの例はＸＣＳＰＥ及びシグマを含む。本出願で紹介する発振器ピークツールのフレーム又はグループは、ＰＨＡＴ、ＸＰＨＡＴ、及びＡＸＴＥを含む。これらのツールの出力は、所与の信号成分の発生源又は目標モデリングを可能にする。

説明する例示的実施形態で紹介するシステム及び方法は、経路伝播効果測定及び軽減の新しい方法及びシステムを使用可能にすることができる。経路伝播効果測定は、改良された発生源識別、追跡、及び分離を提供する。経路伝播軽減は、残響及びエコーの効果を管理するための新しい技術を提供し、源信号エミッタをクリーンにするのを助けるか又は残響をクリーン信号に導入する。

これらの例示的実施形態は、正確な源信号分離を可能にし、残響を効率的に管理し、当該の源信号を識別するための新しい技術を提供することができる。３つの主なシステム及び方法は、限定されるわけではないが、（１）改良された測定、（２）エンティティ及びパラメータ推定、及び（３）経路伝播効果測定及び軽減を含む上記に概説した源信号分離システム及び方法を強化する。

図１９を参照すると、例示的かつ非制限的実施形態による方法が示されている。図示のように、ステップ１９００で、経路伝播効果軽減及びＴＤＯＡ推定への入力を形成するための時間ドメイン信号が分析のために選択される。ステップ１９０２で、経路伝播効果軽減をシングレット変換処理の前に入力信号に適用することができる（例えば、処理の１つより多い反復が適用される場合、入力信号は再度処理される前にＰＰＥ軽減を適用することができる）。同様に、ステップ１９０４で、信号ベースのＴＤＯＡ推定をシングレット変換処理の前に実行することができ、この段階で適用される方法は、必ずしもシングレット変換処理で発見された超分解能情報に頼らない。ステップ１９０６で、超分解能／シングレット変換がＳＳＳで説明したように実行される。次にステップ１９０８で、以下に詳しく説明するように、エンティティマネージャが、ｘＰＨＡＴ又はＡＸＴＥなどの処理を使用してＴＤＯＡ推定値を調整する（又は最初の時間のＴＤＯＡ推定値を計算する）ことができる。エンティティマネージャは、更にエンティティ検出を実行して、当該の信号に寄与するエンティティを決定することができ、経路伝播推定を実行して残響及びエコーなどの効果を測定することができる。

次にステップ１９１０で、追跡及びグループ化モジュールが、発振器ピークをトラックレット及びコヒーレントグループのその現在のセットに追加して、発振器ピーク、トラックレット、発振器ピークのフレーム及び発振器ピークのコヒーレントグループが当該のエンティティによって生成された可能性を使用して更新することができる。追跡及びグループ化モジュールは、ＰＰＥパラメータを使用して、各エンティティによって生成された発振器ピークを推定する場合の高い精度を達成することができる。図示のように、追跡及びグループ化モジュールは、追跡及びグループ情報をエンティティマネージャに送信して、ステップ１９０８を繰り返してエンティティパラメータを更新することができる。最後にステップ１９１２で、出力の所望の発振器ピークが選択される。これらの発振器ピークは、発振器ピークＰＰＥ軽減を使用する再合成の前又は信号ベースのＰＰＥ軽減を使用する再合成の後のいずれかにＰＰＥ軽減を適用することができる。また、ＰＰＥ軽減方法は、高分解能スケールで適用することができるか、又は基礎変換分解能のスケールで適用することができる。

上述のように、例示的かつ非制限的実施形態により、個々の発振器ピーク及び／又は発振器ピークのフレーム又はグループのいずれかと共に作用する多数の測定技術を本明細書で開示している。これらの技術は、出力推定値を提供するために基礎変換分解能周波数スペクトルのあらゆる信号に適用することができるが、上述した高分解能分析技術と共に使用する時に最も効率的である。

第１個別発振器ピーク分析ツールは、信号の到達の方向を推定するために使用することができるクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）を含む。具体的には、源信号分離（ＳＳＳ）を介して得られた発振器ピークが使用され、限定されるわけではないが相対位相（ＸＣＳＰＥ）及び相対パワー（シグマ）を利用する方法を含む方法を使用して到達方向（ＤＯＡ）推定を展開する。次にこれらの測定を介して得られたパターンを使用して、経路伝播効果（ＰＰＥ）の観察される効果を補正及び較正することができる。

クロスチャネル複素スペクトル位相分析（ＸＣＳＰＥ）は、ＳＳＳで説明した高分解能スケールで測定された相対位相又は位相前進を使用して、信号成分のＴＤＯＡを決定する方法である。信号が複数のセンサを使用して測定される場合、発生源から各センサまでの移動距離の差が、各センサの様々な位相測定値を結果として生じる。この技術は、上述したＳＳＳで定義されたＣＳＰＥ方法の拡張であり、数学的導出を以下に詳述する。

当業者であれば、複数のセンサの位相差がＴＤＯＡを推定するために前もって使用されていることを理解するであろう。しかし、このような測定は、特に干渉がある場合は不正確である。複数のチャネルからの周波数及び位相測定を備えた発振器ピークを入力として取り出し、クロスチャネルＣＳＰＥ（ＸＣＳＰＥ）を介して導出された表示フライト時間計算を出力する発振器ピーク測定処理は、位相差の正確な尺度を提供し、ＴＯＤＡの正確な尺度をもたらす。

このような処理により、ＴＤＯＡ＝（（Ｎ／（２^*ＰＩ））／ｆｒｅｑ）^*ａｎｇｌｅ（ｃｏｎｊ（ｓｐｅｃＡ０）^*ｓｐｅｃＡ１）であり、ここで、Ｎ＝ＦＦＴの全長、ｆｒｅｑ＝ＦＦＴビンで測定される高分解能周波数である。これは、高分解能ＣＳＰＥ周波数とすることができ、ｓｐＥｃＡ０＝マイクロフォン０によって測定された当該の周波数に関連付けられる複素スペクトル、すなわちウィンドウ信号の変換、及びｓｐｅｃＡ１＝マイクロフォン１によって測定された当該の周波数に関連付けられる複素スペクトルである。

この計算の結果は、時間ドメインサンプルで測定されたマイクロフォン１と比較したマイクロフォン０の到達時間差である。これは、前進のサンプルの固定数を導入するので、マイクロフォンデータストリームの１つ又は両方の時間ラグサンプルウィンドウを使用することが簡単である点に留意されたく、当業者は、本方法の本質を変えることなく変動を受け入れるように式を補正できることが分かるであろう。

受信機と発生源位置の間のスペーシングに依存する何らかの閾値よりも高い周波数に対して、センサ間の分離よりも短い波長で２πラップが導入される。従って、以下、予測ＸＣＳＰＥ曲線（ＰＸＣ）として定義されるＸＣＳＰＥ測定の予想パターンは、以下の図２０に示されるようにＴＤＯＡパターンにおけるこの２πラッピングに対応する不連続性を示す。この像において、水平線は、到達の時間差によって起こる位相差に２πラップがあることを示す不連続であり、図における境界がテーパリングであるという事実は、２πラップのフライト時間の寄与が測定では観察されないという事実に関係付けられる。

測定値から予測ＸＣＳＰＥまでの距離を計算するための方法をここで説明する。図２１に関して示すように、測定ＸＣＳＰＥから予測ＸＣＳＰＥまでの距離（すなわちＰＸＣトレース上）は、ラップアラウンド効果を考慮に入れなくてはならない。正しいＸＣＳＰＥ距離は、図２１に示された直接経路と間接／ラップアラウンド経路の短い方である。

ＣＳＰＥは、１つより多い受信機又はセンサで受信される信号の分析に拡張することができる。このような場合、信号が所与の発生源位置で発生し、受信機に伝播すると仮定する。受信機／センサの物理的な大きさが、受信機／センサの位置が空間的に離れていることを要求するので、信号は、受信機に到達するために様々な経路を伝播しなくてはならない。最も単純な場合では、これが、センサ１で受信された信号とセンサ２で受信された信号の間のオフセットを作成する効果を有し、これを使用してクロスＣＳＰＥ（ＸＣＳＰＥ）を作成することができる。

上述したＣＳＰＥの最も単純なバージョンの場合とは対照的に、信号が単一の受信機でサンプルされ、オフセットがサンプルの整数毎に信号をシフトすることによって作成される場合、ＸＣＳＰＥの場合ではオフセットは未知の量になる。標準的なＣＳＰＥが実際の内在周波数を見出すために使用される時は、ＸＣＳＰＥを使用して、未知のオフセットを解くことができ、次にこれがセンサ１で受信された信号とセンサ２で受信された信号間の（分数）サンプル遅延を表わす。また、以下の詳細な説明に示すように、（分数）サンプル遅延を個々の周波数で推定することができ、実際には、様々な周波数が信号の１つより多い発生源位置から生じる場合に様々な結果を提供することができる。

ＸＣＳＰＥの１つの目標は、受信機／センサ１で受信された信号と受信機／センサ２で受信された信号の間の信号の成分の位相展開を分析することであり、受信された信号間にサンプル遅延のある未知の分数値が存在する。センサ１でＮサンプルポイント及びセンサ２からＮサンプルポイントの別のデータウィンドウを処理すると仮定する。共通の慣例に従いながら、センサ１のデータをチャネル１データ及びセンサ２のデータをチャネル２データと呼ぶ。受信された信号間の時間遅延をΔによって指示させ（ここでΔは分数遅延とすることができ、負とすることができる）、受信したデータベクトルをチャネル１に対して

及びチャネル２に対して

として定義し、ここで各データベクトルは、データのＮサンプルを表わす。（殆どの場合に、チャネルのサンプリングは、時間同期であると考えられ、アナログ／デジタルコンバータのタイミングを支配するマスタクロックが存在することを意味するが、他の場合では、２つのチャネルのタイミングが独立している場合がある。この後者の場合では、チャネル間の未知の分数サンプル遅延の計算に含まれるチャネル間の余分の時間ベースの同期遅延が存在し、ＸＣＳＰＥを使用して、未知である場合に同期遅延を見出すことができ、他の遅延は既知か又は小さい。）

ＸＣＳＰＥ計算における第１ステップは、

をチャネル１データの変換とし、

をチャネル２データの変換とすると、チャネルデータの変換（ＦＦＴ、ＤＦＴ、ＤＣＴ、又は他の変換）を取ることである。次に、

及び

の複素共役のアダマール積を考える。ＣＳＰＥは、関連付けられる周波数

と共に、積（要素毎に基づいて取られる）

として定義され、ここで演算子

は、積から生じる複素エントリの角度を取ることを示す。この周波数推定値は、ＤＦＴにインヒーレントな改良された分解能を提供する。

正弦データにおけるＸＣＳＰＥ方法を例証するために、周期ｐ＝ｑ＋δを有する複素正弦の形態の信号を取り、ここでｑは整数であり、δは１より小さい振幅の分数偏差、すなわち

である。チャネル１データに対して、信号の全体の位相がゼロに設定され、複素正弦のサンプルを書くことができる（全体の位相期が、単純さのためにチャネル１でゼロに設定されるようにチャネル１及びチャネル２の両方に対する計算から引き出される）と仮定する。

（１）

最初の添え字１は、これがチャネル１データであることを示し、第２添え字０は、これが検討中の最初の０番目のデータウィンドウであることを示す。１つのサンプルのシフトを取る場合、ＣＳＰＥに対する以前のように、以下が得られる。

（２）

チャネル２がチャネル１とは基本的に無関係であるので、信号が受信機１に到達した時間と信号が受信機２に到達した時間の間のΔの遅延が存在する。従って、同じ源信号の独立したサンプルが得られ、従って、これらは、チャネル２及びデータウィンドウｉに対する

として指定される。

（１０）

次に、センサ２のシフト信号を見た場合、以下が得られる。

チャネル１からチャネル２への信号展開を比較した場合、以下が観察される。

チャネル１とチャネル２の間のＸＣＳＰＥを形成するために、データウィンドウのいずれのペアの変換も取り、第１変換（チャネル１から）及び第２変換（チャネル２から）の共役間のアダマール積を取ることができる。

及び

に対してこれを示す場合、２つの異なるチャネルから第１データウィンドウを使用すると、結果が以下になる。

（１）

標準的なＣＳＰＥが（ｑ＋δ）の値を戻すので、標準的なＣＳＰＥと組み合わせてＸＣＳＰＥを使用してチャネル間の遅延を見出すことができる。従って、遅延因子Ｄを見出すためにすべきことの全ては、上記の積の角度を取り、ＣＳＰＥ周波数（ｑ＋δ）を分割し、スケーリング係数Ｎ／２πによって調整し、チャネル間のＸＣＳＰＥ遅延を与えることである。

（１）

（ｑ＋δ）のＣＳＰＥ周波数は、一般的に高分解能周波数に対応する分数値である点に留意すべきであり、ＣＳＰＥが利用されない場合、周波数値がオリジナル変換分解能から取られる時に、この値は、一般的に最も近い整数ベースでのみ既知になる。従って、ＸＣＳＰＥへのＣＳＰＥの拡張は、センサ／マイクロフォン１とセンサマイクロフォン２の信号の到達間の遅延Δの決定を可能にする。

ＸＣＳＰＥ分析は、入力として独立チャネルの別々の変換を取り、最初に超分解能周波数を分析して次に異なるチャネルのスペクトル間のアダマール積を使用する（チャネルの１つの複素共役が取られる場合）ことによって、１つのチャネルの発振器ピークと他のチャネルの発振器ピークの状態間の位相前進を確かめることができるが、２つのチャネルの間に２πより大きな位相前進がある場合、次に測定結果はモジュロ２πである。単一の発生源からの信号を分離するために、余分の２π回転の可能性の存在を分析する必要がある。

サンプルの分数値にわたる位相前進が内在信号成分の周波数に依存するので、信号の右及び左チャネル間の位相前進の測定は、位相前進がいくら正確に推定されるとしても、位相ラップアラウンド効果によって不明瞭になることが明らかであり、測定される結果はモジュロ２πである。測定は、一般的には、［０、２π］又は［−π、π］の主値の領域に入るように制限されるが、信号周波数が十分高い場合、位相は、測定間の余分のフル２π回転だけ前進することができ、一貫性を維持するために、測定値は主値の領域に制限される。この効果は、多くの場合に事前計算することができ、一般的には効果を考慮することができる。

（分数）周波数ビンｆ_iの信号に対して、１つのサンプル当たりの位相前進は、Ｎポイントサンプルウィンドウに対してｆ_i＊２π／Ｎである。ＸＣＳＰＥだけが主値の領域の角度回転を測定し、次にＮ／２πだけリスケールしてｆｉを発見し、

である場合、次にＸＣＳＰＥだけが

を与えることができ、降下されたフル２π回転の整数を存在させることができる。しかし、所与の周波数の範囲及び所与のマイクロフォン又はセンサの分離（センサに対する信号の接近の角度によって起こるあらゆる角効果を考慮に入れる）の場合、適用しなければならない２π補正の整数倍を事前計算することができる。従って、我々は以下の式を解くＫの値を発見しようとする。

あるいは、２πを取り除いた代わりの形態である。

次に、Ｋの正しい値が確かめられた状態で、センサ０及びセンサ１の信号の到着間の（分数）サンプルの数のＰ値を２π／Ｎ*ｆ_iによって再スケーリングすることによって見出すことができる。言及しなければならない１つの詳細は、主値の領域が［−π、π］からである場合、ｍｏｄマップは、ゼロにセンタリングされたマップにわずかに補正しなければならない。［０、２π］の主値の領域で定義された従来のｍｏｄマップによって、（７／２）πの値は（３／２）πにマッピングされるが、［−π、π］の主値の領域が使用される場合、（７／２）πを（−１／２）πにマップしなければならない。主値の領域のこの再マッピングは、ＸＣＳＰＥによって測定される位相差がＫ^*２πによって増加されかつＫの値が周波数値の範囲によって決定される時に決定することが重要である。特定の計算又はソフトウェアパッケージによって使用される主値の領域は適正に定義され、これによって当業者は必要に応じて調整を行うことができる。

チャネル０の信号とチャネル１で受信された信号の間に１０サンプルシフトがあるテストケースを考える。ＦＦＴウィンドウが長さ２０４８サンプル（又は２０４８サンプルにゼロパッドされた１０２４サンプル）、及び４４１００サンプル／秒のサンプルレートであると仮定する場合、各周波数ビンは、約２１．５３Ｈｚ／ビンに対応する。この例に対して、ビン２５０の中心の信号を考える。ビン２５０が２０４８ポイントのウィンドウ当たり２５０周期を有するので、８．１９２サンプル／周期になり、１０サンプルシフトが１．２２０７０３１２５周期（すなわち１０サンプル／８．１９２サンプル／周期）に対応する。位相前進がフル周期より大きいので、対応するラジアン尺度は１．２２０７０３１２５^*２πになるが、主値の結果は０．２２０７０３１２５周期^*２π（ラジアン／周期）＝１．３８６７１８６３２ラジアンを与え（９デシマル位置に丸められる）、余分の２πラジアンが追加される場合、結果は７．６６９９０３９３９４３ラジアンであり、（２π／Ｎ）ｆ_i項によって分割する場合、結果は予想されるように１０サンプルである。

信号は何であれ、Ｎサンプルのウィンドウ内のビンｆ_binにあるので、上述した結果は、特に複数のセンサ／受信機／マイクロフォンを備えたシステムに対して適切であり、センサ／受信機／マイクロフォンの間の遅延がＮ／ｆｂｉｎより大きい場合、追加しなければならない余分の２π位相回転が存在する。主値の領域が［−π、π］である場合、余分の２π回転に追加する必要が、周波数ビン数ｆ_bin＞Ｎ／（２ｆ_bin）に対して及びその後のＮ／（２ｆ_bin）のあらゆる偶数倍数に対して発生する。

シグマと指定された導出されたパラメータについてここで十分に説明する。シグマ推定は、測定されたパワー比を使用して信号の到達角（ＡＯＡ）を推定する方法である。信号が複数のセンサを使用して測定される場合、測定される振幅の比率はＡＯＡの指示子である。

当業者であれば、ＡＯＡを測定するためにパワーが以前に使用されていることを理解するであろう。これは真であるが、測定は、特に干渉が存在する場合に不正確である。また、シグマ推定の改良は、発振器ピークに関連付けられる高分解能測定を使用して生じる。

以下の図面及び図表に対して、シグマは０からπ／２まで測定され、ここで０は信号測定がセンサ０だけで起こることを示し、π／２は、信号測定がセンサ１だけで起こることを示し、π／４は、信号測定が両方のセンサで等しく起こることを示す。入力は、複数のチャネルからの周波数及び振幅測定を備えた発振器ピークを含むとする。ｍａｇ０としてチャネル１の発振器ピークの振幅を定義し、チャネル１の発振器ピークの振幅をｍａｇ１として定義する場合、次にシグマの値は、関係式

から見出すことができる。ａｔａｎ２（チャネル１の振幅、チャネル０の振幅）として与えられる標準的な関数を使用する疑似コードを使用して推定ＡＯＡを含む出力を導出することができ、ここで、ａｔａｎ２＝正接（又は逆正接関数）であり、所与の四分円で角度に対して正しい符号を戻すように定式化され、及びチャネル０、１の振幅＝チャネル０、１それぞれにおけるこの発振器ピークによって測定されるスペクトルを生成した発振器の振幅である。

シグマに対する経路伝播効果及びその影響をここで説明する。シグマパラメータに対するデバイス、環境、及び残響効果、及び信号の位相展開の分析に見られる効果とのそれらの関係を考える。統一ドメイン表現（ＳＳＳで説明）からｒ_Lを左チャネルの振幅とし、ｒ_Rを右チャネルの振幅とし、ｍをレッグｒ_L及びｒ_Rを有する直角三角形の斜辺とし、σを角度変数とすると、次式が得られる。

信号の発生源から受信機への直接経路到達の仮定に関わる問題（エコー又は残響効果など）があることを認める場合、測定された信号に存在する建設的又は破壊的干渉が存在する可能性があり、これは、信号の周波数（及び信号の相対的位相）に依存する可能性がある。例えば、エコー又は残響効果がある場合、１つのチャネル（又は両方）のパワーは、人工的に増加又は減少させることができる。この段落の目標は、信号をその適正な関係に戻すパワースケーリング係数を発見できる方法を示すことであり、これによって再計算されたシグマ値が補正される。

室内残響効果によって影響される値から正しい値を区別するために、添え字「真」を値に追加して、影響を受けない直接経路のみの場合に対して、以下が得られることが分かる。

これを残響又はエコーを有する場合と比較する必要があり、ここで測定された値（エコー又は残響効果を含む）に以下のようにラベルを付けるものとする。

残響／エコーによって起こる相対的効果としてシグマにおける偏差の問題を見ることができ、（近似の）真値としてシグマの中央値又は平均値を選ぶことができ、ここでσ_trueは、一般的に定数であると仮定され、σ‐σ_trueを予想される値からの偏差と考える。また例証であるが制限ではない場合では、ｒ_L＝ｒ_Ltrueであると仮定することが単純であり、ｒ_Rに加えられる補正係数を考えることができるものとし、αを周波数ｆの関数としてｒ_Rtrue＝α（ｆ）ｒ_Rが得られる。

シグマの正接（ｔａｎ（σ_true））に対する仮定される定値をｋと呼ぶことにすると、我々は以下を見出す。

従って、所与の周波数では、α（ｆ）を見出すことができ、振幅を補正することによって、

であることを示すことができ、測定シグマ値が次式になることが分かる。

結果は次式になるように保証される。

次に、発振器ピークシグマ値からのシグマ偏差曲線の計算されたスムーズな推定値を取り、補正された振幅に後方に作業する。これは、計算において、周波数の関数としてシグマ偏差曲線を抽出するために処理及びフィルタすることができる近似平均シグマ偏差曲線（すなわちシグマの平均値からの偏差）を導出できるという事実から直接続かなくてはならない。所与の周波数でのシグマの結果偏差をΔσによって示す場合、次に予想されるシグマ値の正接を再度ｋにする場合、次に実際の測定されるシグマ値は、ｋ＋Δσと書くことができ、結果は、所望の振幅補正が次式によって与えられることになる。

従って、一部の値に対しては比率が１に近くなり、他の値に対して比率が１から離れることになるので、振幅補正の量は、シグマ値及びシグマ値が主値の領域内に入る場合に依存する。これは、シグマ偏差における変動を考慮に入れる。

更なる実施形態により、２つの正弦の和が同じ周波数の位相シフト正弦であることを明示的に示すことができる。以下を検討する。

余弦を複素指数に変換する場合、次式を得る。

和の順序を再構成する場合、２つの複素共役ピースの和を有することが分かる。

（^*）

（^*）の第１項だけを考えかつｆ₀発振器部及び第１位相を除去すると、次式を得る。

τ＝φ₁−φ₀を定義する場合、位相項を分割して和を対称にし、次式を得る。

対称にされた和は複素共役である２つの複素指数であるが、振幅項α₀及びα₁は等しくない点に留意されたい。これらが等しくないので、結果は主軸α₀＋α₁及び短軸α₁−α₁と共に楕円に沿うことになる。

複素共役ペアにおける第２項

が無視され、この項に同じステップを実行する場合、再度複素共役を得る。

更に単純化して次式を得ることができる。

複素共役であることを除いて、（^*）の第１項から等価の項を得て、これらが結合された時に結果が次式になる。

しかし、括弧の項が互いの複素共役であるので、有用な更なる単純化が存在する。

この結果は、式Ａｃｏｓθ＋Ｂｓｉｎθであり、標準的な「トライアングルトリック」を使用して和を調節された位相を備えた単一の正弦に変換することができる。

Ａ及びＢが直角三角形の非斜辺側であり、角度反対側Ｂがθである直角三角形を考えると、

及び

とすると、

及び

である。この方式でＡ及びＢ及びθを選ぶ場合、結果は次式になる。

次に標準的な三角形アイデンティティを使用してこれを更に次式に単純化することができる。

θ＝ｔａｎ-1（Ｂ／Ａ）とする。τ＝φ₁−φ₀及び最終項が次式になる点に留意されたい。

続けて単純化すると次式になる。

及び

上記の表現は、同じ周波数であるが異なる振幅及び位相の２つの正弦の和に対して、反射される経路信号と直接経路信号の和のための優良モデル、従ってＸＣＳＰＥ計算における残響／エコーの効果を理解するための優良な表現を提供する点に留意されたい。また、直接経路と反射経路の間（実際には、発生源と受信機の間の様々な長さのあらゆる２つの経路の間）の所与の経路長差が、測定される位相差にどのように影響を与えるかを考えることができ、この効果は、周波数の関数の通りに変化すると理解することができる。

例えば、２つの信号間の経路長差がＬ（ｃｍ）である場合、信号間の到達の時間差（及び従って、信号の全対応部分）はＬ（ｃｍ）／ｖ（ｃｍ／秒）＝ｘ（秒）であり、音声信号に対する典型的条件の下である場合、サウンドの速度は約ｖ＝３４３００ｃｍ／秒である。次に、Ｒのサンプルレート（サンプル／秒）でデータを収集する場合、到達の時間差のサンプルの数はｘ（秒）^*Ｒ（サンプル／秒）＝Ｐ（サンプル）であり、Ｐがサンプルの分数値になる。例えば、２つの経路の間の長さに１０ｃｍの差がありサンプルレートが１秒当たり４４１００サンプル（ＣＤサンプルレートと同じ）である場合、Ｌ＝１０ｃｍ及びｘ＝｛１０（ｃｍ）／３４３００（ｃｍ／秒）｝及びＰ＝｛１０（ｃｍ）／３４３００（ｃｍ／秒）｝^*４４１００（サンプル／秒）＝１２．８５７サンプルである。例示的実施例では、サウンドの速度が一定であると仮定されるが、当業者は、速度信号伝播が一定ではないか又は環境条件によって影響を受け、又は例えば信号の周波数の関数の通りに変化する場合に式を適応化できる点に留意されたい。

遅延のサンプルの数が既知である状態で、所与の周波数又は周期の信号の位相前進を算定することができる。標準的なＦＦＴでは、ビンを周波数ビンと示すことが多いが、周期‐ビンとしてこれらを考えることも等しく的確であり、Ｑ番目の周波数ビンの中心である信号が、どんなサンプルウィンドウが使用されようともＱ周期を正確に包含する信号に対応することを理解した上で本明細書における説明は共通の慣例に従い周波数ビンと呼ぶ。Ｑを分数値と考えられない理由はなく、標準的なＣＳＰＥアルゴリズムは、信号がどのように分析されて周期Ｑの分数値を発見できるかを明確に示す（この場合、ＦＦＴ又はＤＦＴ又は他の変換において暗黙的な測定処理は、値のラウンド（Ｑ）に最も近い周波数ビンにおけるピークを有する幾つかの周波数ビンに渡って信号のパワーを分配又はスメアアウトする）。いずれの場合においても、Ｎポイントサンプルウィンドウに渡るＱ周期の信号に対して（ここでＱは分数とすることができる）、位相前進はサンプルウィンドウに渡って２^*π^*Ｑラジアンである。これは、あらゆるサンプルに対して（２πＱ）／Ｎの位相前進（ラジアン／サンプル）が存在することを意味する。従って、Ｐサンプル遅延の合計位相前進は、Ｐ^*（２πＱ）／Ｎによって与えられる。この位相前進が（分数）周波数ビンＱに依存するので、位相前進が周波数の関数の通りに変化するのは明らかである。

ＸＣＳＰＥのためのこの分析の意味は、ＸＣＳＰＥにおける値が標準的なＣＳＰＥの超分解能技術を使用して測定されたチャネル間の位相差に直接関係付けられるということである。しかし、残響／エコー効果がある時は、変則の位相変化が導入される。この変則位相変化は、φ₁−φ₀であると上記に示されているが、これは、受信した信号間の遅延におけるサンプルの数に直接関係付けられ、φ₁−φ₀＝Ｐ（２π／Ｎ）Ｑであり、ここでＰは反射された経経路差から計算される。

受信機分離及び位置（例えば、音声信号に対するマイクロフォンの位置付け）のような情報を含む測定セットアップに関する情報を知った時に、チャネル間の予想される遅延を確かめることができ、予想される位相前進とチャネル間の測定された位相前進を比較して残響の効果を露出できるようになる。また、残響／エコーによって起こる変則の位相変化が、予測されるＸＣＳＰＥパターンによって明らかにされるパターンとは異なるパターン有する二次効果であるので、チャネル間の予測される位相前進を推定することができる。

残響／エコーによって起こる変則の位相変化の推定は、音声信号の右チャネルだけにエコーが影響を与えられるようにできる場合に最も単純に提示される。残響／エコーが存在しない場合、ＸＣＳＰＥは、チャネル間の位相差φ_R−φ_Lに比例した結果を与え、ここでφ_Rは、所与の周波数に対する右チャネルの信号位相であり、φ_Lは、左チャネルの信号位相である。上述のように、右チャネルにエコー／残響がある場合、測定される位相は、

に変更され、ＸＣＳＰＥの結果は、代わりに

に比例する。ＸＣＳＰＥ技術は十分正確であり、殆どの場合に、この変則の位相変化を分離し、従って、後方に働き、干渉残響／エコー信号の特徴を決定することができる。図３３を参照してこれを図２０のＰＸＣトレースパターンと比較した場合、固定位相遅延に対する一般的なＰＸＣトレースパターンの周りの変動があることが分かる（−６サンプルの遅延に対して図２０に示すように）。この変動は、残響又はエコーによって誘発される効果に対応する。

ＴＤＯＡの測定は、これまで文献において考えられてきた。以下は、発振器ピーク形成で利用可能な超分解能を使用したアルゴリズム及びそのアルゴリズムの改良を示している。位相変換（別名ＰＨＡＴ）アルゴリズムは、限定されるわけではないが音声を含む信号のためのＴＤＯＡ推定値を決定するための方法である。この方法は、複数のセンサで受信されたスペクトルの推定ＴＤＯＡをもたらす。この方法は、逆高速フーリエ変換のような変換を介した位相抽出及び到達時間差ドメインへの変換が続くクロススペクトル分析を包含する。

一部の例示的かつ非制限的実施形態では、ＰＨＡＴアルゴリズムをＴＤＯＡ推定器として使用することができる。音声ファイルのためのＰＨＡＴ計算の例が図２３に関して示されている。この例では、スピーカが円を描いて動き、マイクロフォンのアレイの一方の側にあるＴＤＯＡから他の側のＴＤＯＡに動く。音声の単一のフレームのＰＨＡＴ計算は、図表の上部部分に示されており、大体２つのサンプルのＴＤＯＡのピークを示している。以下の図２３のヒートマップは、当業技術で既知の通りに音声の一連のフレームのＰＨＡＴ計算を示している。

例示的かつ非制限的実施形態により、ＴＤＯＡ推定値を計算するために当該の発生源によって生成された可能性のあるスペクトルの部分をピックするための上述された発振器ピーク表現を使用したＰＨＡＴアルゴリズムに対する高分解能手法が説明される。従って、上述した方法を使用して、発振器ピークを事前に選別して単一発生源に主に関連付けられるサブセットを選択することができる。ＸＰＨＡＴと呼ばれるこの方法は、高分解能周波数分析及び発振器ピークに包含されるＸＣＳＰＥ情報の使用を介したサブサンプルＴＤＯＡ分解能をもたらすので、多くの場合に標準的なＰＨＡＴよりも好ましい。またこの方法は、発生源に関係付けられない信号の位相寄与をＴＤＯＡ推定の前に除去することができ、低ＳＮＲ条件で安定した結果をもたらすので、多くの場合に好ましい。

このような方法は、入力として発振器ピークのセットを受信し、１又は２以上のＴＤＯＡ推定値を出力する。まず、発振器ピークのセットが選択される。次に、信号が、測定ＸＣＳＰＥ及び周波数を使用して各発振器ピークの到達時間差ドメインで合成される。次に全ての選択された発振器ピークの到達時間差ドメイン信号が合計され、最大の振幅が決定されて１又は２以上のアクティブＴＤＯＡを識別する。ｋ＝ピーク指数、ω_k＝ラジアン／サンプルのピーク周波数、ｔ＝サンプルにおける時間とすると、ω_kのＸＣＳＰＥの結果に対応して

及び、到達時間差ドメインにおける時間合成に対応して

最後に、

は遅延推定値であり、ここで最大値のセットを選択することもできる。

例示的かつ非制限的実施形態により、集約ＸＣＳＰＥＴａｕ推定（ＡＸＴＥ）の方法が提供される。一部又は全部の成分部分のＴＤＯＡは、ＸＣＳＰＥ計算の既知のパラメータを使用することによって決定することができる。

上述のように、所与のＴＤＯＡの周波数の範囲の予想ＸＣＳＰＥ値は、次式を使用して計算することができる。

各周波数に対して、

予測ＸＣＳＰＥ＝ＴＤＯＡ−（ＦＦＴ＿長さ／周波数）^*フロア（（周波数＋ＦＦＴ＿長さ／（２^*ＴＤＯＡ））／（ＦＦＴ＿長さ／ＴＤＯＡ））又は、単純化して、予測ＸＣＳＰＥ＝ＴＤＯＡ−（ＦＦＴ＿長さ／周波数）^*フロア（０．５＋周波数^*ＴＤＯＡ／ＦＦＴ＿長さ）

ここで、予測ＸＣＳＰＥ＝ＴＤＯＡ及び周波数ペアが与えられた予想ＸＣＳＰＥ、及び周波数の変動がＰＸＣトレースを与える場合の予測ＸＣＳＰＥ値のセットであり、ＦＦＴ＿長さ＝時間ドメインから周波数ドメインに音声を変換するために使用されるフルＦＦＴ長であり、かつＴＤＯＡ＝分数サンプルの単位でのセンサ／マイクロフォン１からセンサマイクロフォン２への（又は存在する場合にセンサ／マイクロフォンのペア間の）測定された信号の実際の到達時間差である。

「フロア」関数は、その引数をその引数の絶対値よりも小さい次の整数にマップする。

更に、固定ＴＤＯＡのＸＣＳＰＥ値のセットの累積距離を計算することができかつ予測可能である。下の表は、幾つかのサンプルＴＤＯＡに対する全てのＴＤＯＡまでの累積距離を示す。この計算のための方法は以下の通りである。まず、３．６サンプルのサンプル遅延などのサンプルＴＤＯＡが与えられると、上述のように予測ＰＸＣトレースを計算する。この曲線を基準セットと呼ぶ。次に、ＴＤＯＡ値の所望の範囲に対して、これらの値の各々のＰＸＣトレースを計算する。これらのＰＸＣトレースを評価セットと呼ぶ。次に、各周波数ビンに対して、上述のように基準セットＰＸＣトレースと全ての評価セットＰＸＣトレースの距離を計算する。図２４を参照すると、０のＴＤＯＡを有する信号の上記の計算のサンプル結果の例示的実施形態が示されている。

図２５を参照すると、３．６のＴＤＯＡを有する信号の上記の計算の結果が示されている。図２５の曲線は図２４の曲線を遷移させたものである点に留意されたい。形式におけるこの一貫性は、入力として発振器ピークのセットを使用して発振器ピークのグループのＴＤＯＡを決定しＴＤＯＡの範囲及び発生源の可能性のあるＴＤＯＡのセットまでの累積距離を出力するための方法に関する以下に説明する最適化計算を可能にする。この方法は以下の通りである。まず、ＴＤＯＡ値の所望の範囲に対して、各ＴＤＯＡのＰＸＣを計算する。次に、セットの各発振器ピークに対して、その周波数でのテストＸＣＳＰＥ値と計算されたＰＸＣの差を計算して、２ｐｉラップを考慮に入れ、二乗されたこの距離をこのＴＤＯＡの累積エラーに追加する。この計算のサンプルは、図２６に関して例証されており、発振器ピークのセットが可能性のあるＰＸＣと比較され、−１１の最小値が、発生源の位置に対する正確な遅延を示す。

スピーカが円を描いて動き、マイクロフォンのアレイの１つの側のＴＤＯＡから他方の側のＴＤＯＡに移動する以下の例にこの方式の有用性を見ることができる。図２７を参照すると、マイクロフォンのペアから約１０フィートの所で円を描いて動くサウンド発生源と、約１１サンプルＴＤＯＡで固定されている第２サウンド発生源を包含するレコーディングで行われるＡＸＴＥ計算の例示的かつ非制限的実施形態が示されている。画像の各列は、図２６に示されるように１つのＡＸＴＥ計算に対応するが、高さが、画像の垂直線に沿ってグレイスケール値に変換される。（解釈し易いように、図表値は、図２６に示された最小値が最大値になるように逆転されている）。図表の白いエリアは、サウンド発生源のＴＤＯＡ位置に対応する可能性がある。

ＡＸＴＥの最適化計算を包含する様々な例示的かつ非制限的実施形態により、ＴＤＯＡを計算するための計算効率の高いアルゴリズムを使用することが望ましい。これらの場合では、ルックアップテーブルを使用してＡＸＴＥを計算することができる。各可能な周波数とＸＣＳＰＥのペアに対して、所望のＰＸＣまでの距離を計算してルックアップテーブルに記憶することができる。

集約ＸＣＳＰＥ距離のエンティティを検出するための例示的な方法が提供される。集約ＸＣＳＰＥ距離計算における極小値（連続的な関数の計算法からの極大／極小点の関連での）はサウンド発生源であることが多い。幾つかのサウンド発生源が存在する場合、これらをすべて検出することができる。一部の実施形態では、所与のＴＤＯＡに対応する発振器ピークのセットの寄与を累積距離から取り除いて、サウンド発生源を検出するために他のハーダーをアンマスクすることができる。

図２８を参照すると、図２７に関して上述したのと同じシナリオが示されているが、エンティティが検出されている。この図表では、検出のサイズは、そのＴＤＯＡに近いフレームのパワーのパーセントによってスケーリングされる。本明細書で説明する方法を使用すると、上述のように移動サウンド発生源があり、同時に約１０サンプルの一定のＴＤＯＡの第２発生源があることが明らかである。

図２９及び３０を参照すると、自動車内部の２つのスピーカの録音に適用されるＡＸＴＥ法が示されている。この場合では、スピーカが固定されて大きく動かないので２つのスピーカのＴＤＯＡは比較的一定しており、マイクロフォンが車の中心にあるので、ドライバシート及び乗客シートの発生源は、マイクロフォンに対して対称的に位置付けられ、この結果、ＴＤＯＡ推定のために反対の符号であるが類似の絶対値を生じる点に留意されたい。

源信号エミッタのパラメータの推定のための方法の例示的かつ非制限的実施形態が提供される。これらのパラメータを使用して、発振器ピークがその発生源によって生成される可能性を推定することができる。これらのパラメータは、経路伝播効果の推定の一部としても使用することができる。

様々な実施形態により、このような方法は、その入力として発振器ピークを受信し、限定されるわけではないが、基礎のピッチの平均値及び相違、１つの周波数当たりのパワーの平均値及び相違、１つの周波数当たりのＸＣＳＰＥの平均値及び相違、及び１つの周波数当たりのシグマの平均値及び相違を含む発生源パラメータを出力する。

エンティティのパラメータを推定するこのような方法は、当該のスピーカ又はエンティティに関連付けられる可能性のある発振器ピークのセットを選ぶ時に始まる。次に、各パラメータに対する発振器ピークの平均値及び相違統計値が計算される。次に、平均基礎ピッチなどのこれらの統計値の一部がフレームレベルで集約される。また平均パワー又は平均シグマなどのこれらの統計値の一部は周波数ビンレベルで集約される。

シグマ、ＸＣＳＰＥ、及びパワーの測定された統計値が図３１−３３に関して示されている。

ＸＣＳＰＥ及び／又はシグマ測定結果を使用した発振器ピークの選択をここで説明する。以下に図３４に関して例証するように、シグマ及び／又はＸＣＳＰＥ測定結果を使用して、発振器ピークが当該のサウンド発生源によって生成された可能性を決定することができる。この可能性は、個々の発振器ピーク、上述のようにトラックロットに組み入れられた発振器ピークのグループ、又は上記に説明したようにコヒーレントグループの一部であると決定された発振器ピークのグループに対して計算することができる。これらの可能性は、ユーザ指定のパラメータ、カメラ顔検出のような外部プロンプトなどの予想される値を使用して、以下に説明するようなエンティティパラメータを使用して、又はベイズなどの確率フレームワークを使用して計算することができる。図示のように、ステップ３４００で、ＸＣＳＰＥ及び／又はシグマ測定結果を有する発振器ピークがステップ３４０２への入力を形成する。同様に、ステップ３４０４で、予想ＴＤＯＡ及びシグマがステップ３４０２への入力を形成する。ステップ３４０２で、ステップ３４０６への入力を形成する結果と共に信号成分追跡器／集約器／選択器分離器が実行され、発振器ピークが当該の１又は２以上のスピーカとして選択される。

図３５を参照すると、ＴＤＯＡ推定を使用した発振器ピークの選択のための例示的な方法が示されている。図示のように、フレームベースのＴＤＯＡ測定結果を使用して、発振器ピークが当該のサウンド発生源によって生成された可能性を決定することができる。この可能性は、個々の発振器ピーク、上述のようにトラックレットに組み入れられた発振器ピークのグループ、又は上述のようにコヒーレントグループの一部であると決定された発振器ピークのグループに対して計算することができる。これらの可能性は、ユーザ指定のパラメータ、カメラ顔検出のような外部プロンプトなどの予想値を使用して、以下に説明するようにエンティティパラメータを使用して、又はベイズなどの確率フレームワークを使用して計算することができる。

一般的な形式で、システムはＴＤＯＡ値を使用して、所望のＴＤＯＡから来るサウンド発生源があるかどうか決定する。コンテンツの一部が所望のＴＤＯＡから来ると決定されたフレームで発生する発振器ピークは、当該の信号から来る可能性がある。

これらのＴＤＯＡ推定値は、ＰＨＡＴなどの既知のアルゴリズムを使用して生成することができるか、又はｘＰＨＡＴ又は集約ＸＣＳＰＥＴＤＯＡ推定（ＡＸＴＥ）などのアルゴリズムを使用して発振器ピーク自体の高分解能情報を使用して計算することができる。一部の応用では、本方法の組合せを利用することができ、発振器ピークベースの計算を使用して、オリジナル信号に基づく推定値を更に調整する。

図示のように、ステップ３５００で、信号ベースのＴＤＯＡ推定器は、ステップ３５０２への入力を提供し、ＸＣＳＰＥ及び／又はシグマ測定結果及びフレームＴＤＯＡ推定値を有する発振器ピークがステップ３５０４への入力を形成する。ステップ３５０４で、ステップ３５０６への入力を形成する結果と共に信号成分追跡器／集約器／選択器分離器が実行され、発振器ピークが当該の１又は２以上のスピーカとして選択される。

この方式の利点は多い。発振器ピークのサブセットをピークベースのＴＤＯＡ推定に含めることができ、システムが、当該の信号をマスクする可能性がある他の発生源からの「雑音」又は強力な寄与を除去するのを可能にする。発振器ピークベースのＴＤＯＡ推定は、多くの場合、より正確にサブサンプル分解能を可能にする。発振器ピークベースのＴＤＯＡ推定は、可変分解能を使用することができ、当該のエリアには高分解能を他のエリアには粗分解能を提供する。この方式を使用して、必要な場合にコンピュータ計算の効率を上げることができる。発振器ピークベースのＴＤＯＡ推定は、信号ベースのＴＤＯＡ推定値から偽ＴＤＯＡ推定値を拒否するための手段として使用することができる。発振器ピークベースのＴＤＯＡ推定は、別の異なる発生源位置から来る信号スペクトルの別の成分における別々の異なる推定値を可能にすることができる。

図３６を参照すると、エンティティパラメータを使用する発振器ピークの選択のための方法の例示的実施形態が示されている。図示のように、フレームベースのエンティティパラメータを使用して、当該のサウンド発生源によって発振器ピークが生成された可能性を決定することができる。この可能性は、個々の発振器ピーク、上述のようにトラックレットに組み入れられた発振器ピークのグループ、又は上述のようにコヒーレントグループの一部であると決定された発振器ピークのグループに対して計算することができる。これらの可能性は、ユーザ指定のパラメータなどの予想値、カメラ顔検出などの外部プロンプト、以下に説明するようにエンティティパラメータを使用して、又はベイズなどの確率フレームワークを使用するなどの以下のいずれかを使用して計算することができる。このような応用では、発振器ピークのシグマ、ＸＣＳＰＥ、パワー及び他のパラメータがエンティティパラメータと比較される。これらのパラメータは、限定されるわけではないが、以前に追跡されたデータ、真のＡＯＡ及びマイクロフォン配置を含む録音の既知の物理的レイアウト、及びカメラ顔検出などの外部キューを含む多種多様な方法で生成することができる。

図示のように、ステップ３６００で、信号ベースのＴＤＯＡ推定器がステップ３６０２への入力を提供し、ＸＣＳＰＥ及び／又はシグマ測定結果及びフレームＴＤＯＡ推定値を有する発振器ピークがステップ３６０４への入力を形成する。ステップ３６０４で、エンティティ推定器がステップ３６０６から入力としてＸＰＨＡＴ及び／又は集約ＸＣＳＰＥＴＤＯＡ推定値を受信して、ステップ３６０８に出力を提供し、ステップ３６１０への入力を形成する結果と共に信号成分追跡器／集約器／選択器分離が実行され、発振器ピークが当該の１又は２以上のスピーカとして選択される。

図３７を参照すると、追跡出力を使用してエンティティパラメータを推定するための方法の例示的実施形態が示されている。図示のように、ステップ３７０２で、ＳＳＳで元々提示されていた追跡モジュールを使用して、１つの発生源又はエンティティから来る高い可能性を有するトラックを定義することができる。次にステップ３７０４で、発生源のエンティティパラメータの推定値が計算され、これらが３７０２に渡される。ステップ３７０２で、発振器ピークの選択が、戻されたエンティティパラメータに基づいて行われる。３７０２と３７０４の間の処理ループは、必要な場合に反復することができる。このモードでは、当該の発生源によって生成された高い可能性を有すると決定された発振器ピークが、ステップ３７０６で出力段階に渡される。エンティティパラメータが追跡の前に利用可能である場合、これらはこの処理によって更新又は置き換えることができる。

一部の実施形態では、エンティティ推定モジュールは、信号分離処理の一部として使用することができる。エンティティ推定器は、パラメータファイル、既存のエンティティパラメータ、及び外部キューを含む信号発生源の利用可能な推定値を使用して、アクティブサウンド生成器又はエンティティのリストを維持することができる。エンティティ推定器は、ステップ３８０２で、中心決定方法として機能することができ、存在するエンティティの数に関する推定、並びにエンティティを記述及び区別するパラメータを継続的に更新することができる。

一部の実施形態では、エンティティ推定器は、ＴＤＯＡ推定値３８０６を使用して、発振器ピーク３８０４のフレームが当該のエンティティによって大部分生成されたと決定することができる。このような場合では、エンティティ推定器がそのフレームを使用して、モジュール３８０８のそのエンティティの既知のパラメータを更新することができる。

一部の実施形態では、エンティティ推定器は、ステップ３８１０で、ＴＤＯＡの複数の測定結果を使用して、サウンド生成器の物理的位置を決定することができる。他の実施形態では、エンティティ推定器がカルマンフィルタなどの公知のアルゴリズムの使用を試み、移動エンティティのＴＤＯＡ推定値又は物理的位置を更新することができる。図３９を参照すると、ＸＣＳＰＥ、シグマ、及びＴＤＯＡ推定を使用して源信号分離を強化するシステムが示されている。図示のように、本明細書で説明する測定技術は、源信号分離を強化するために使用される。まず、超分解能モジュールが入力信号３９０２を発振器ピークに変換する。このような発振器ピークは、ＸＣＳＰＥ及びシグマ測定結果を包含する。次に超分解能モジュールが、ステップ３９０４でＰＨＡＴなどのアルゴリズムを使用して音声のフレームにＴＤＯＡ推定を行う。一部の場合では、ＴＤＯＡ推定器が当該の発生源の方向から重大な寄与を検出しない場合はこの処理に従事しないよう超分解能モジュールを構成することができる。エンティティ推定器３９０６は、ＴＤＯＡ推定値及びピークベースのＴＤＯＡ（ＸＰＨＡＴ又はＡＸＴＥ）推定３９１２を使用して、ＴＤＯＡ推定値を更に調整して発振器ピークの現在のセットに寄与された既知又は未知のエンティティを決定する。次に、エンティティ推定器は、発振器ピーク、現在のエンティティパラメータ、及びＴＤＯＡ推定値を追跡モジュール３９０８に提供する。追跡モジュール３９０８は、発振器ピークをトラックレットのその現在のセット及びコヒーレントグループに追加して、発振器ピーク、トラックレット、発振器ピークのフレーム、及び発振器ピークのコヒーレントグループが各エンティティによって生成された可能性を使用して更新される。追跡モジュール３９０８は、これらの可能性をエンティティ推定器３９０６に提供し、エンティティ推定器３９０８がエンティティパラメータ３９１０を更新する。各エンティティの選択された発振器ピークが集約され、出力モジュール３９１４に渡される。

図４０を参照すると、経路伝播効果測定及び軽減のための方法の例示的実施形態が示されている。シグマ及びクロスチャネルＣＳＰＥが、より正確な経路伝播効果（ＰＰＥ）測定及びパラメータ識別を可能にするＡＯＡの改良された尺度及びＴＤＯＡ推定値を提供する。図４０は、ＰＰＥ測定処理を表わすが制限ではない概要を示す。

信号発生源と信号受信機間の経路伝播効果（ＰＰＥ）は、反射、残響、及び干渉を含む複数の効果から構成される。これらの効果は、位相の歪み及びパワーの変動を引き起こす。信号が上述された発振器ピーク測定処理を使用して測定された時に、これらの効果を検出することができる。

入力：分析及び分離され、エンティティのセットに割り当てられた発振器ピークのセットがＰＰＥ軽減段階４０００に入力される。

発振器ピークの入力セットから、１つのエンティティに対応するサブセットが、更なるＰＰＥ分析及びＰＰＥ軽減４００２のために選択される。

ステップ４００４で、シグマ及びＸＳＣＰＥのＰＰＥ歪みの分析が、測定シグマ値を平均予想シグマ値と、及び測定ＸＣＳＰＥ値を所与のエンティティの予想されるＰＸＣトレースと比較することによって計算される。これらの偏差は、周波数の関数として計算され４００６、４００８でパラメータとして記憶することができる。一部の実施形態では、４００６で偏差にフィルタリング技術を適用することを要求することができ、これによって例えば、偏差のゆっくり変化する部分だけが許可される。また４００８のＰＰＥパラメータは、周波数の関数、関数表現、変換された空間における表現、及び有用ないずれかの他の形態として偏差の形態で記憶することができる。

図４１及び４２は、エコーのない‐６サンプルのＴＤＯＡを有する信号の測定ＸＣＳＰＥ値の例示的かつ非制限的実施形態を示す。ＸＣＳＰＥ値は‐６のＴＤＯＡのＰＸＣトレースに極めて近付く傾向がある点に留意されたい。

図４３及び４４は、付加的なエコーのある同じ信号の例示的実施形態を示す。ＸＣＳＰＥ値が‐６ＴＤＯＡＰＸＣトレース付近で発振する点に留意されたい。

図４５は、同じ信号に対する測定シグマ値の例示的実施形態を示す。発振パターンも示している点に留意されたい。

図４６は、同じ図表の測定シグマ及びＸＣＳＰＥ発振（周波数／ナイキストによって乗算）の例示的実施形態を示す。発振は位相の一定オフセットを備えた同じ周期を有する点に留意されたい。

図４７は、図４６に示した図表のＦＦＴを使用した周波数ドメインへの変換の例示的実施形態を示す。両方がビン２００あたりで強力なピークを有する点に留意されたい。シグマ及びＸＣＳＰＥの定期発振、及び従ってこのピークの位置は、最も強力なエコー経路の時間遅延の関数である。このドメインで、発振変動の部分だけに集中するフィルタリング技術を利用して発振変動の他の部分を除去するか又は変更することができ、例えば、ローパスフィルタが発振変動に加えられる場合は、発振変動のゆっくり変化する成分だけが残る。

例示的かつ非制限的実施形態により、経路伝播効果（ＰＰＥ）の軽減のための方法を説明する。経路伝播効果（ＰＰＥ）のパラメータが既知である場合、効果を軽減することができる。この変換は、時間ドメイン信号、周波数ドメイン信号、又は発振器ピークのセットに適用することができる。前に推定された経路伝播効果（ＰＰＥ）を使用して、他の信号における経路伝播効果（ＰＰＥ）の効果を除去することができる。図４８−５０を参照すると、エコーの効果が取り除かれたシグマ及びＸＣＳＰＥの図表が示されている。変動のスケールは、大まかには図４３−４４に示されたオリジナルの変動及び図４５に示されたシグマ変動よりも小さい振幅の大きさである点に留意されたい。

一実施形態では、経路伝播効果（ＰＰＥ）パラメータと、時間ドメイン、周波数ドメイン、又は発振器ピーク表現のうちの１つの信号とは、軽減された経路伝播効果（ＰＰＥ）の効果を有する信号又は発振器ピークである結果出力と共に入力を形成する。まず、振幅及びシグマは、経路伝播効果除去の数学に関して以下に説明する処理を使用して補正することができる。次に、位相の変動は、以下に同様に説明する処理を使用して補正することができる。要求される場合に、以下に説明する処理を利用してＴＤＯＡチャネル遅延を同様に除去することができる。

これらの補正の各々は、信号の知覚品質にダメージを与えないようにスケーリングすることができる。これらは発振器ピークの補正を表すが、これらの例示的な方法を使用して、伝達関数法を使用して全信号に加えられる補正を作成することができる。これは、サブビン分析に基づく全周波数ビンへの補間及び外挿によって達成することができる。

ここでは経路伝播効果除去の数学を説明する。脱残響処理の標準的な定式化では、例えば屋内の全残響効果を得ようとして、次に、屋内の残響効果による受信信号の測定変換の解析を試みて、残響効果なしのオリジナル信号の推定バージョンを達成することができるが、これらの技術は、低分解能効果から影響を被り、所与のマイクロフォン／受信機位置に対する所与の発生源位置に関連付けられる固有の残響特性を明らかにしない。これらのアイデアが発振器ピークの高分解能空間に持ち越された時に、細かいスケールで経路伝播効果を補正することができ、所与のマイクロフォン／受信機位置に対する所与の発生源位置に関連付けられる固有の残響特性の検出を可能にし、１つより多い発生源が存在する場合、異なる経路伝播補正を発振器ピークのサブセットに適用することができる。例えば、残響効果を除去するが、到着の方向によって起こる効果を残し拡張するために経路伝播補正を選び、かつ変更することができる。これが、改良された明瞭度を達成できるように空間における様々な源信号を分離する又は様々な位置の源信号に（知覚的に）フォーカスするために経路伝播補正の使用を可能にすることができる。

上述のように、経路伝播効果は、受信した信号の振幅及び位相に対する摂動に見られる。例えば、「残響のある条件でのＸＣＳＰＥの意味」の段落では、特異な位相変化

が、残響によって起こるＸＣＳＰＥへの偏差を測定することが分かる。所与の源信号の最適ＸＣＳＰＥ曲線（予測ＸＣＳＰＥ曲線（ＰＸＣ））及び源信号に関連付けられるピークのＸＣＳＰＥ値の間の偏差を見る場合に、これは、測定されたデータで観察することができる。一般的にこの騒音測定では、これらの信号における残響によって起こる偏差を経時的に平均化して（又は偏差の中央値などの別の統計値を取る）測定された発振器ピークにおける経路伝播効果の集約推定を達成することができる。また、この集約推定値は、例えば上述した技術を使用して所与の源信号に関連付けられる発振器ピークのサブセットから作り上げることができ、様々な軽減補正を単一のデータのフレーム内の発振器ピークの様々なサブセットに適用することができる。また、例えば発生源が移動している場合に、経路伝播推定値が発生源の追跡を継続できるよう推定値を変更及び更新できるように、集約されるデータのフレームの数を変えることによって経路伝播効果推定の時間適応を可能にすることができる。

一実施形態では、集約偏差曲線が、使用されたフレームのセットの偏差の中央値として取られる。具体的には、集約偏差曲線は、発振器ピークとＰＸＣトレースのＸＣＳＰＥ値間の差の周波数の関数としての中央値として計算され、距離がＰＸＣまでの直接距離（の絶対値）又はＰＸＣまでのラップアラウンド距離の短い方であることを考慮に入れる。この中央値は、ある程度の雑音の存在を示す可能性があるか、又は重要でない作用によって影響を受けることがあり、ローパスフィルタリング又はバンドパスフィルタリングなどのフィルタリング技術を集約偏差曲線に適用して低減された偏差曲線を選択することができる。

補正又は軽減されることになる（ＲＤＣ）。同様に、発振器ピークのシグマ値と全体の平均シグマ値の差に基づくシグマ偏差曲線（ＳＤＣ）を有することが有用であり、ＳＤＣは図４５及び４６のように周波数の関数の通りに変化して、類似のフィルタリング技術を同様にＳＤＣに適用することができる。いずれかの要求されるフィルタリングが適用された状態で、ＰＰＥをＲＤＣ及びＳＤＣから構成することができ、ＰＰＥ関数の知識によって、適用できる２つの補正／軽減が存在する。第１の補正／軽減は、到達時間差と最適ＰＸＣ曲線によって示される発生源と受信機の間の全体の伝播経路遅延を補正することである。第２の補正は、発生源から受信機への経路伝播で遭遇する残響又はエコー効果を軽減することである。軽減関数は、ＲＤＣ関数から計算可能な位相に関係する成分と共に振幅及び位相成分を有する。振幅に関係する成分は、ＳＤＣ関数から計算可能である。

処理における第１ステップは、ＲＤＣ及びＳＤＣを使用してＰＰＥの関数式を見出すことである。ＲＤＣは、元々はサンプル遅延の単位を使用する座標系で計算され、図２１のＸＣＳＰＥ境界の幅に関係付けられる変換係数によって乗算しなければならない。次式：

を見ると、ここで幅（ｆ）は、周波数の関数の通りのＸＣＳＰＥ境界の幅である、ＰＰＥ角度（０）＝０は、同様に条件として課せられる。これらの値は他の座標系でも見出すことができるが、当業者であれば、分数サンプル空間から位相に関係する座標に変換できるであろう。振幅に関係する成分では、マグニチュードが

から計算され、この場合では、振幅調整が、全体の遅延に関係するチャネル間の全体のパワー差を考慮に入れるためのσ_mean部分を含む。マグニチュード及び位相部を使用して、チャネル０の信号をチャネル１の信号に変換する及び逆もまた同様に行う経路伝播関数（一般的にＰＰＥ）の推定値を計算する。これらをＰＰＦ０ｔｏ１及びＰＰＦ１ｔｏ０と呼び、

及び

として形成され、ここでゼロ周波数又はＤＣビンの値は、実値（一般的に１）並びにナイキストビン（一般的に０）に設定しなければならない。

複素ドメインの平均化処理で発振器ピーク自体を使用してＰＰＥ０ｔＯ及びＰＰＥ１ｔｏ０関数を推定することもできる。この平均化は、

及び

を設定することによって達成され、ここで振幅０及び振幅１は、チャネル０、１それぞれの発振器ピークの振幅値の全てを保持するベクトルであり、位相０及び位相１は、チャネル０、１それぞれの発振器ピークの位相値の全てを保持するベクトルである。ビン×ビンベースで、又はサブビン×ビンベースで、

によって与えられた複素積をＰＰＦ１ｔｏ０の推定値にかつ

をＰＰＦ０ｔｏ１の推定値に累積して、和を累積した後で、各和のエントリの数によって分割する（これは、ビン×ビンベース又はサブビン×ビンベースで行われる）。

更に別の例において、一部の事例では、発振器ピークのグループ（又はサブグループ）の展開が主に全体の信号遅延及び全体の残響を生成する少ない（１又は幾つかの）重大なエコー効果によって支配されることが、ＲＤＣ及びＳＤＣの分析から明らかになる。これらの場合では、ＲＤＣ及びＳＤＣの変換を取ることで、図４７に示すように残響の重大な成分を明らかにすることができる。重大な成分だけを維持することで、

のように受信機／マイクロフォンの信号の近似を作成することができるが、多くの成分が保たれる。これは、デルタ関数のストリング

による畳み込みとして再公式化することができ、周波数ドメインで、結果は、ｓ₀（ｔ）の変換とデータ関数のストリングの変換の積である。遅延が整数サンプル値である時は数学的公式が簡単であるが、そうでない場合は、周波数ドメインで作用することができ、分数サンプル遅延の変換が形式

であることを見出すことができ、ここで

は、変換空間における正周波数ビンのベクトルであり、Ｐは分数サンプル遅延であり、Ｎは分析ウィンドウにおけるサンプルの数であり（ゼロによるパディングを含むことができる）、符号は、変換のフォーマット及び遅延の符号に基づいて選ばれる。負周波数ビンは、正周波数ビンの複素共役から作成され、ＤＣ及びナイキストビンを実数にしなければならない。関数ＰＰＥ０ｔＯ及びＰＰＥ１ｔｏ０を探している場合、一般的には、チャネル０から１及びチャネル１から０への展開を見てこの畳み込み形式を使用して展開オペレータを作成するだけで十分である。

ＰＰＦ０ｔＯ及びＰＰＦ１ｔｏ０の値が計算された状態で、結果は、コンピュータ計算で使用された発振器ピークのグループ又はサブグループがチャネル０から１又はチャネル１から０にどのように展開したかを示す展開オペレータを表わす。

次にＰＰＦ関数を利用して幾つかの方法で信号を変換することができる。一実施形態では、ＰＰＥ展開オペレータが、チャネル０の信号を受信機／マイクロフォン１の位置までの途中にわたって展開する近似形式に変換するために使用され、かつ逆方向のチャネル１の信号でも同様である。この形式で、ＰＰＦ計算で使用された発振器ピークのサブセットが他のチャネルにコヒーレントに変換されるが、同じ発生源位置を持たない他の信号（発振器ピーク形態とすることができる）は、他のチャネルでコヒーレントではない信号に変換し、信号を結合することによって、所望のエンティティからの信号のリインフォースメントを自然に獲得し、コヒーレントではない信号の部分的な相殺又は破壊的干渉を得る。これは、一般的には、当該の信号、すなわち当該のエンティティに関連付けられる発振器ピークのサブグループを拡張し、同時に他の信号成分のパワーを減少させる効果を有する。別の実施形態では、展開オペレータＰＰＥ０ｔｏ１及びＰＰＥ１ｔｏ０を、当該のエンティティに関連付けられる発振器ピークのサブグループだけに適用することができる。

第２の（一般的に好ましい）実施形態では、ＰＰＦ関数を使用して、信号をマイクロフォンの間の中間ポイントにある仮想位置に展開させることができる。一般的に、これは、チャネル（当該のエンティティに関連付けられる発振器ピークのサブグループ）の１つから信号を前進させて他のチャネルからの信号を遅らせる段階を要求し、これによって信号が、間のどこかのポイントに展開する（これは実際には受信機／マイクロフォンを接続するセグメントの外側とすることができるが、中間点は、最も有用な使用位置である）。この方法は、特定の例で解説することができ、展開オペレータＰＰＦ０ｔｏ１及びＰＰＦ１ｔｏ０が、中間位置、ＰＰＦ０ｔｏｍｉｄ及びＰＰＦ１ｔｏｍｉｄに達するために新しい展開オペレータを作成するため使用される。これはまず、十分に高い周波数（上述のように）に対して発生する余分の２π位相展開を最初に計算する段階を必要とし、これらの値は、使用される特定のＰＸＣトレースに結び付けられ、すなわち余分の２π位相は発生源位置に依存する。これは、事前計算値ｅｘｔｒａ＿２＿ｐｉと呼び、周波数の関数の通りに（ステップ関数の通りに）変化することを認識する。ＰＰＦ０ｔｏ１角度をＰＰＥ０ｔＯの位相角度とし、ＰＰＦ１ｔｏ角度をＰＰＦ１ｔｏ０の位相角度とする。次に中間位置への展開オペレータの新しい位相角度が次式によって与えられる。

及び

ここで、ｅｘｔｒａ＿２＿ｐｉ項の符号は、計算で使用される方向に応じて変化する可能性がある。次に、振幅の変化を残響の効果を中和するために加えなくてはならない。これを行うために、

及び

とすると、ここで括弧は、ベクトルの複素マグニチュードを取ることを意味する。マグニチュードの滑らかな再マッピングを作成するために、

及び

を定義し、更にΔ_α＝１−α及びΔ_β＝β−１を定義することが有用である。κ＋γ＝１になるように

の値が選択された場合、ＳＤＣの変動を軽減するパワーのスムーズな変換が、調節項

及び

によって与えられ、これらの調節項は、σ_meanに関するシグマの変動を考慮に入れる。一般性の損失なく、以下のように中間位置へのσ_meanの全体的なシフト（この式ではπ／４）を生成する係数を選ぶことができ、

しかし、

である。ここで中間値が計算され、中間展開オペレータへの全体のＰＰＦを

及び

として計算することができる。最後に、ＰＰＦ０ｔｏ＿ｍｉｄ及びＰＰＦ１ｔｏ＿ｍｉｄオペレータが発振器ピークに加えられた時に、最終結果は（一般的に）変更された振幅及び位相を有し、ＰＰＥ軽減発振器ピークとして再度記憶することができ、信号が時間ドメインで再構成された場合に、残響効果が軽減される。

一部の場合では、指数位相項を１に設定することによって振幅補正の適用だけを選ぶことができ、又は振幅補正を１に設定することによって位相補正だけの適用を要求することができる。最後に、ＲＤＣ及びＳＤＣに包含される残響効果だけを取り出すことを選択できるが、信号はσ_meanのはっきり見える位置に残る。主な特徴は、ＰＰＥ及びＰＰＦ関数の知識が、信号の様々なはっきり見える位置への再マッピング及び再位置決めを可能にするということである。当業者は、表現を使用して、遅延、エコー及び残響効果に対応し、これらを要求されるどのような方式でも変更することができる。

上記に定義したＰＰＦ関数は、発振器ピークを直接使用することなく生音声ファイル（インウェーブフォーマットなど）に更に適用することができる。これは、ＰＰＦ関数を所与の変換長に対する最も近い周波数ビンにマッピングして次に変換関数として補正されたＰＰＦ関数を使用することによって行われる。これは、一実施形態ではオリジナル音声ファイルが、再マップ抽出発振器ピークファイルに位置合わせされた空間位置に再マッピングすることができるように行われ、再マッピングされたオリジナルがスケールダウン（静かに）又はアップ（騒々しく）され、次に抽出された発振器ピークファイルと再結合されて、拡張処理済み出力ファイルを作成する。

遅延補正及び残響補正が発振器ピークに適用された時に、変更された発振器ピークの完全ファイルを再合成することができ、結果信号は、遅延及び残響の経路伝播効果を大幅に軽減される。

図５１を参照すると、経路伝播効果パラメータをエンティティパラメータに組み入れて拡張信号分離を可能にする方法が示されている。例えば、経路伝播の効果の１つは、源信号のＸＣＳＰＥ及びシグマ測定への歪みを誘発することである。これらの歪みが測定される場合、シグマ成分追跡器が、これらの測定結果を使用して、当該の発生源によって生成される発振器ピークを正確に推定することができる。これらのＰＰＥ測定結果の各々を特定の発生源位置から来る信号の指紋のソートとして使用することができ、エンティティ推定器が、測定結果、ＰＰＥパラメータ、ＸＰＨＡＴ又はＡＸＴＥＴＤＯＡ推定値、ＰＰＥ／ＰＰＦ関数形式のいずれかをモニタし、発振器ピークを追跡及びグループ化し、これは、エンティティの発振器ピークセットを出力する前に別個のエンティティに分離することができる。

ＰＰＥパラメータが既知である場合、その効果を音声信号などの信号で軽減することができる。信号からの経路伝播効果を除去するための技術は、上述している。一部の実施形態では、信号ＰＰＥ軽減は、ＳＳＳ超分解能モジュールの前に実行することができる。これは、所与の発生源のシグマ及びＸＣＳＰＥの歪みを除去する効果を有する。代わりに、反復処理としてこれを見ることができ、これによってＰＰＥ軽減が実行され、当該の信号／エンティティを安定化し、次に出力がシステムに入力され再度分析される。

一部の実施形態では、信号ＰＰＥ軽減は、ＳＳＳ再合成モジュールの後に実行することができる。この場合、信号ＰＰＥ軽減器は、再構成される発生源に固有のパラメータを使用することができる。一部の場合では、ＰＰＥパラメータの複数のセットを図５２に関して示すように音声の別々の部分に適用することができる。

ＰＰＥパラメータが既知である場合、これらの効果は、発振器ピークで軽減することができる。発振器ピークから経路伝播効果を除去するための技術は、上述している。

一部の実施形態では、発振器ピークＰＰＥ軽減は、いずれかのエンティティ検出又は当該の信号としての発振器ピークの選択の前に実行することができる。これは、所与の発生源のシグマ及びＸＣＳＰＥの歪みを除去する効果を有する。

一部の実施形態では、発振器ピークＰＰＥ軽減は、発振器ピークが当該の信号として選択された後に実行することができる。この場合、発振器ピークＰＰＥ軽減器は、再構成される発生源に固有のパラメータを使用することができる。一部の場合では、ＰＰＥパラメータの複数のセットは、図５３に関して示すように音声の別々の部分に適用することができる。

図５４を参照すると、ＰＰＥ推定及びエンティティ検出を使用して個々のサウンド発生源に対する経路伝播効果を除去するための方法が示されている。具体的には、図５４は、エンティティ推定の一部として経路伝播効果を推定して当該のエンティティによって作成されている可能性がある発振器ピークが選択された状態でこれらのＰＰＥを軽減する例示的実施形態を示す。まず、超分解能モジュール５４００が音声を発振器ピークに変換する。これらの発振器ピークはＸＣＳＰＥ及びシグマ測定結果を包含する。超分解能モジュールが、ＰＨＡＴ又はＸＰＨＡＴ又はＡＸＴＥのようなアルゴリズムを使用して音声のフレームにおけるＴＤＯＡ推定を実行する。一部の場合では、ＴＤＯＡ推定器が当該の発生源の方向から重大な寄与を検出しない場合に処理しないように超分解能モジュールを構成することができる。エンティティ推定器５４０２は、ＴＤＯＡ推定値及びピークに基づくＴＤＯＡ推定を使用し、ＴＤＯＡ推定値を微調整して発振器ピークの現在のセットに寄与した既知又は未知のエンティティを決定する。エンティティ推定器５４０２は、発振器ピークに包含されるＸＣＳＰＥ及びシグマの測定結果と結合したＴＤＯＡ推定値及びピークベースのＴＤＯＡ推定値を使用して経路伝播効果を推定する。エンティティ推定器５４０２は、発振器ピーク、現在のエンティティパラメータ、ＴＤＯＡ推定値、及びＰＰＥパラメータを追跡モジュール５４０４に提供する。追跡モジュール５４０４は、発振器ピークをトラックレットのその現在のセット及びコヒーレントグループに追加し、発振器ピーク、トラックレット、発振器ピークのフレーム、及び発振器ピークのコヒーレントグループが、各エンティティによって生成された可能性を使用して更新される。追跡器５４０４は、ＰＰＥパラメータを使用して、各エンティティによって生成された発振器ピークを推定する場合の高い精度を達成する。追跡モジュールは、これらの可能性をエンティティ推定器５４０２に提供する。エンティティ推定器５４０２は、エンティティパラメータ及びＰＰＥパラメータを更新する。経路伝播効果は、出力５４０６の前に任意的に発振器ピークで軽減される。発振器ピークＰＰＥ軽減器５４０６は、発振器ピークを生成した可能性のあるエンティティに関連付けられるＰＰＥパラメータを使用する。

一部の例示的実施形態では、物理的な空間における源信号エミッタの位置を推定するのが望ましい。ＴＤＯＡ及び他の推定値をジオロケーション推定値に変換するための公知の技術が存在する。本明細書では、ＣＳＰＥ及びＸＣＳＰＥから得られた正確な情報を使用して拡張されたジオロケーション機能を提供する１つの技術を説明する。発振器ピークベースの到達時間差推定値を入力として使用することができる。

クロスチャネルＣＳＰＥ（ＸＣＳＰＥ）測定結果をＴＤＯＡ又はあらゆる数の信号経路長差を使用する信号処理技術に適用してより正確なジオロケーション推定値を提供することができる。クロスチャネルＣＳＰＥＴＤＯＡ測定結果によって提供されるより高いサブサンプル分解能は、精度を向上させる。

一例示的かつ非制限的実施形態では、長楕円座標変換の使用を介した双曲漸近推定と共にＸＣＳＰＥを使用して、推定値を生み出す信号発生源（及び、２より多いチャネルのアンテナアレイの場合は範囲）を計算することができる。ＴＤＯＡの改良された測定結果は、ダウンストリームアルゴリズムの結果の精度を損なうことなく低ＳＮＲ環境に対応する能力を実現し、高ＳＮＲ環境における最新の技術の更なる改良に役立つ。

双曲線漸近推定によるジオロケーションの場合、改良された精度は、遠距離信号分離で最も有用な極めて効率的な空間フィルタリング技術を可能にする。双曲線漸近推定の中間出力は、信号の所与のＴＤＯＡからの可能な発生源位置によって決定される双曲線経路である。

例示的かつ非制限的な例では、ＸＣＳＰＥを使用して、複数の源信号を有する複雑な音声環境から単一のスピーカを抽出することができる。図５５を参照すると、音楽及び他の背景雑音がある中での個々の発話の図表が示されている。

ＸＣＰＳＥベアリング推定値は、ＳＳＳ処理における到達方向の分析を意味して、図５６に関して見られるような他のサウンド発生源エミッタから当該の目標スピーカ／サウンド発生源を識別、目標にする及び抽出するのを可能にする。

近距離では、各受信機までの信号発生源位置の合計経路長に追加される各付加的な波長が、到達の方向に大きな変化を結果として生じることがある。しかし、発生源が受信アレイから十分離れている場合、源信号の合計経路長に追加される付加的な波長は、到達方向に無視してもよい変化を結果として生じる。クロスチャネルＣＳＰＥ結果の入力からのアルゴリズムの改良された精度は、当該の信号を包含する領域に空間的カットを作るのを可能にする。この測定結果の潜在的な精度が与えられた場合、更なるアプリケーションは、制限されるわけではないが、パッシブソナー及び経時的な信号の空間追跡、マルチパス信号識別を含むことができる。

ＸＣＳＰＥ測定結果は、経時的に源信号エミッタ位置及び移動を決定する場合の優良な精度並びに複数の源信号エミッタからの曖昧なＤＯＡ推定値を解く能力を可能にするＴＤＯＡ及びベアリング推定値における高い精度を実現する。複数のＴＤＯＡ推定値を使用することによって源信号分離技術にこれらの推定値を適用することができ、発振器ピークを選択して経時的に源信号エミッタを追跡するのを可能にする。

上述した源信号分離（ＳＳＳ）技術は、送信、記憶、分析、又は操作のいずれかのための収集機構（例えば、マイクロフォン、カメラ、無線受信機、ビデオカメラ、トランスデューサ、又は他の受信機）を介した信号を送信又は取り込むあらゆるシステムに適用することができ、引き続いて信号は、（制限されるわけではないが）受信機間で送信（例えば無線送信）、音声フォーマットでの配信（例えば音声呼出しの送信）、画像又はビデオフォーマットでの配信（例えば写真又はビデオの送信）、テキストフォーマットで表示（例えば、音声からテキストに変換）、又は画像として解釈及びレンダリング（例えば、レーダーディスプレイ又は超音波）することができる。

ＳＳＳ技術は、デジタル信号処理を包含する１又は２以上の処理及び／又はシステムに導入することができる。デジタル信号処理は、一般的に、情報信号の数学的操作として定義され、情報信号を補正又は改良し、これらの信号の数値又は記号のシーケンス及び処理による離散的な時間、離散的な周波数、又は他の離散的なドメイン信号の表現によって特徴付けられる。ＳＳＳ技術が利益を分配できるサンプルデジタル信号処理の分野は、制限ではないが音声処理及び圧縮、発話処理及び認識、無線送信、生体測定分析、ソナー及びレーダー、センサアレイ、超音波テスト、スペクトル推定、統計分析、デジタル画像、デジタル及びセルラー通信、制御システム、生物医学、医療画像化、及び地震データを含む。

連続的な現実世界のアナログ信号を測定、フィルタリング、及び／又は圧縮するためにデジタル信号処理を適用することができる。この処理は、一般的には、信号をアナログからデジタル形式に変換することにより、サンプリングして次にアナログ／デジタルコンバータ（ＡＤＣ）を使用してこれをデジタル化することによって開始され、次にアナログ信号を数のデジタルストリームに変える。一般的に、分析及び送信後に、要求される出力信号は、デジタル／アナログコンバータ（ＤＡＣ）を必要とする別のアナログ出力信号である。

ＳＳＳ技術は、限定されるわけではないが、汎用コンピュータ及びＧＰＵ、専用シングル及びマルチコアプロセッサ（ＤＳＰなど）、特定用途向け集積回路（ＡＳＩＣ）などの専用ハードウェア、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、デジタル信号コントローラ、及びストリームプロセッサの１又はそれ以上で実施することができる。加えて、本明細書で説明するＳＳＳ技術は、ファームウェア、組込み式ソフトウェア、ソフトウェアプラットフォーム、独立ソフトウェアプリケーション、及び／又はネットワーク又はクラウドベースのアプリケーション／サービスとして実施することができる。このような実装は、限定されるわけではないが、コンピュータ、セルラー電話又はスマートフォン、タブレット、又は他の通信、音声、ビデオ、レーダー、ソナー又は医療画像化デバイス又はシステム、又はいずれかの他のシステム又はデバイスに適用することができ、これによってデジタル信号処理が性能又は一般的な有用性を向上させることができる。

本明細書で説明する信号分離技術は、物体の範囲、高度、方向、速度、又は他の特徴を決定するための方法として、無線波だけに頼るレーダーに基づく物体検出及び追跡システムで利用することができる。レーダーシステムは、その経路におけるあらゆる物体に反射され、波のエネルギーの一部を続いて受信機に戻す無線波（又はマイクロ波）のパルスを送信するプロセスを組み入れる。

レーダーのサンプル使用は、限定されるわけではないが、一般的な画像化、防空及び対ミサイルシステム、航空トラフィック制御、地形、船舶及び当該の他の海洋ベースのポイントを位置付けるための航海システム、航空機衝突防止システム、海洋探査システム、宇宙探査及びランデブーシステム、気象追跡及びモニタリング、高度測量及びフライト制御システム、誘導ミサイル目標位置付けシステム、地形マッピング、検出及び位置システム、油田及びガス発見及び掘削システム、及び地質学の観察のための地上貫通レーダーを含むことができる。

本明細書で説明するＳＳＳ技術は、プロセス内のあらゆるポイントで「雑音」、「干渉」、及び／又は「クラッター」を軽減するためにレーダーシステムに適用することができ、これによって最終使用アプリケーションに配信される最終データの品質を拡張する。ＳＳＳ技術は、いずれの他の補正アルゴリズム及びシステムに関係なく又はパルスドップラー、移動ターゲット表示、自動利得制御（「ＡＧＣ」）、３Ｄマッピング画像化アプリケーション、及び／又は水平、垂直、直線及び回転偏光などのシステムの１又はそれ以上と共に導入することができる。

反射された信号は、距離が増加するにつれて急速に減衰し、雑音がレーダー範囲制限を導入し、所望の信号のパワーが低い程、雑音から識別するのが難しくなる。レーダーシステムは、当該の実際のターゲットに集中しながら望ましくない信号（パッシブ及びアクティブの両方）に打ち勝たなくてはならない。望ましくない信号に打ち勝つことは、所望のターゲット信号のレベルを背景雑音又は干渉のレベルと比較するレーダーシステムの信号対雑音比（「ＳＮＲ」）を定義する。

ＳＳＳ技術の導入は、レーダーシステムのＳＮＲを上げることができ、周囲の雑音信号、干渉、及びクラッターから実際のターゲットを分離する場合の改良をもたらす。一般的には、雑音及び干渉は、（ｉ）全ての電子構成要素によって生成される信号におけるランダム変動の内部発生源、（ｉｉ）レーダー受信機で受信された所望のエコー信号に重なったランダム変動、及び／又は（ｉｉｉ）外部発生源、例えば当該のターゲットを囲む背景の熱放射によって起こる可能性がある。クラッターとは、一般的には、自然の物体（例えば、雨、鳥）、大気の乱気流及び他の大気の影響（例えば、電離層反射）、人が作ったもの（例えば、建物）、及び／又はチャフのようなレーダーの対抗手段を含むレーダーオペレータにとって当該のないターゲットから戻される無線周波数エコーを指す。あるクラッターは、レーダー送受信機とアンテナの間の長いレーダー導波路によっても起こる可能性がある。本明細書で説明するＳＳＳ方法及び技術は、上記の及び他の干渉信号からの干渉を効率よく軽減する。

本明細書で説明するＳＳＳ技術は、周波数帯、スキャンタイプ、利用されるディスプレイプロセッサ及びシステム、及び／又は最終使用及びリンクに関わらず、レーダー信号、機器及び画像化ソフトウェア及びハードウェアの全ての形態に適用することができる。

本発明の技術は、電磁スペクトルの他の部分を使用する他のシステムにも適用することができる。１つの例は、無線波ではなくレーザーからの可視光を使用する「ＬＩＤＡＲ」である。

加えて、本発明の技術は、その機能の性能に拡張、識別、分離、隠す、又はそうでなければ操作されるＲＦ機能（例えば、レーダー、通信、及び電子戦）を可能にする拡張可能多機能ＲＦシステムなどの他の無線周波数ベース（ＲＦ）システムに適用することができる。

例示的かつ非制限的実施形態により、本明細書で前述したあらゆる処理又は組合せを使用して生成される発生源分離信号は、（ｉ）音声ファイル、及び／又は（ｉｉ）音声信号成分、及び／又は（ｉｉｉ）発話特徴ベクトルとして提示される出力を生成することができ、その全てが単独で又は組み合わさって、発話認識エンジン又は生体音声識別システムへの入力として機能することができる。本明細書で説明する信号分離技術は、発話認識システムで利用することができ、言葉を文字に変換する、音声翻訳を介して自動化システムを制御する、又は自動化処理を介して言葉を声以外の他の出力に変換するために使用することができる。

発話及び声認識を改良するための本明細書で説明するＳＳＳの導入は、認識を改良するために使用されるいずれの他のアルゴリズム及びシステムにも無関係に、又はこのようなシステムの１又はそれ以上と共に適用することができる。加えて、本明細書で説明するＳＳＳは、デジタル信号に変換されかつ発話認識のために処理されるようデジタルに一度変換される前にアナログ信号に再変換されたオリジナル音声源信号、又は発話認識処理の直前にデジタルに変換された音声信号に適用することができる。

発話認識は、「自動発話認識」（「ＡＳＲ」）、「コンピュータ発話認識」、及び／又は「発話対テキスト」と呼ぶことができる。これらのシステムは、トレーニングを使用することができるか（「スピーカ依存」）、又はスピーカによるトレーニングを使用しなくてもよい（「スピーカ独立」システムと呼ばれる）。声認識は、一般的に、話していることとは対照的に、話している人のアイデンティティを見出すことを指す。スピーカを認識することは、スピーカ依存システムで発話を翻訳するタスクを単純化することができるか、又はセキュリティ処理の一部としてスピーカのアイデンティティを認証又は検証するために使用することができる。

発話認識に適用される方法は、一般的に、以下のプロセス、すなわち、（ｉ）デジタル音声の優良な音響表現への変換、（ｉｉ）発話認識器が予想される音調を知るような規則の適用、（ｉｉｉ）話されている音調の決定、及び（ｉｖ）音調の言葉への変換を介してデジタル音声への及び認識される発話へのアナログ音声信号の変換に最初は頼る。デジタル音声フォーマットは、チャネルの数（例えばモノ対ステレオ）、ビットレート、及び／又は他の特徴の点で変えることができる。

音声認識特徴では、ベクトルが発話波形から抽出される。一般的には、これは、ウィンドウ高速フーリエ変換（ＦＦＴ）を使用して最初にデジタル音声を「周波数ドメイン」に変換することによって達成され、スペクトルグラフが生成するものに類似の出力を結果として生じる。このドメインでは、所与のサンプルレートのサウンドの周波数成分を使用して、そのサンプルの周波数成分の振幅のグラフを生成することができる。特徴ベクトルは、通常、あらゆる短周期隔の発話信号のウィンドウからコンピュータ計算され、発話は、これらの特徴ベクトルのシーケンスとして表される。

自動発話認識器エンジンは、人間の声によって生成された様々なタイプのサウンドに相関付けられる何千ものグラフのデータベースを含み、そのサンプルで生成されたグラフがデータベースと照合され、サウンドを表す番号を生成する。所与の発話特徴ベクトルに対する最も可能性の高い言葉のシーケンスが、２つのタイプの知識発生源、すなわち音響知識と言語知識を使用して発見される。発話認識エンジンは、発話サウンドの音響特徴のための「隠しマルコフモデル」（ＨＭＭ）と呼ばれる数学的技術を使用し、確率論的言語モデルが、言語知識を表すために使用される。

騒々しい背景雑音又は他の周囲環境の音などの干渉因子によって発生源の誤った解釈に至ることが多く、ユーザが高品質マイクロフォンのある静かな部屋にいる場合に有するものとは異なるベクトルを認識器が決定することになる。伝統的には、背景雑音及び可変問題は、話されている音素を見つけ出すために統計的モデルを使用して対処されるが、強力な干渉によって結果は一般的に良くない。

認識処理の初期ステップへの本明細書で説明するＳＳＳの導入、これによって発話波形から抽出された特徴ベクトルは、他の方式よりも高い信頼度で音素及び発話を決定するロバスト性を大いに増すことができる。本明細書で説明するＳＳＳのアプリケーションは、デジタル音声信号から特徴ベクトルを抽出する時に周囲雑音のような干渉因子の影響を大いに軽減することができる。ＳＳＳ処理信号は音声認識／識別の高い精度を提供し、オンボード処理（携帯電話、タブレット及び他のパーソナルデバイスセキュリティ特徴によって）又は制御されたアクセスデバイス又はエリア（例えば、制限されたアクセス施設、建物、丸天井の部屋又は他の保護された位置）のためのネットワーク又はクラウドへのリンクのいずれかを使用して、いずれの既存の音声認識又は音声セキュリティシステムにも導入することができる。

音声／スピーカ認識に対しては、類似の処理が使用され、当該のスピーカの特徴ベクトルを抽出するが、これらのベクトルは、スピーカによって元々作成されていた発話のモデル／ライブラリに比較及び対比され、類似性スコアが生成される。本明細書で説明するＳＳＳ技術を音声認識に導入して、（ｉ）デジタル信号に変換されて発話認識のために処理するために一度デジタルに変換される前にアナログ信号に再変更されるオリジナル音声源信号へのアプリケーション、又は（ｉｉ）音声認識プロセスの直前にデジタルに変換された音声信号へのアプリケーションのいずれかを介して改良された特徴ベクトルを配信することによって背景雑音又は競合する会話などの干渉を軽減することによってスコアリングのロバスト性を拡張することができる。本明細書で説明するＳＳＳ方法及びシステムは、独立処理技術又は既存のソフトウェアプログラムへのアドオンとして、いずれのＰＣ、携帯電話、タブレット、又は声／発話認識を使用する他のシステムにおいてもハードウェア又はソフトウェアとして実施することができる。

例示的かつ非制限的実施形態により、信号要素の表現は、信号のモデルにおいて開発することができる。信号は、個々のスピーカに対応するトラック及び／トラックレットに分解及びグループ化することができ、分解された信号は、発話認識エンジンで使用するようになっている特徴ベクトルに変換される。このような実施形態では、環境における全ての他のサウンドよりもその発話を自動的に引き出し拡張するために、特定のスピーカ（例えば、電話の所有者）に向けたバイアスを開発及び導入することができる。

別の実施形態では、発話特徴又は発話ベクトルと呼ぶことができる信号要素の表現は、信号の源信号分離モデルにおいて開発することができる。次に信号は、個々のスピーカに対応する発話特徴ベクトルに分解することができ、分解された表現は、発話認識エンジン又は生体音声識別システムへの入力として使用される。

例示的かつ非制限的実施形態により、システムは、源信号分離の協調／分散コンピューティングに関わる近くのプロセッサと共に、マイクロフォンなどのサウンド収集デバイスを含む。一部の実施形態では、携帯電話、スマートフォン、タブレット又は他の移動デバイスで使用することができるように、処理が集中しないようアルゴリズムをスケーリングすることができる。一部の実施形態では、処理の一部を移動デバイスで行い、結果と共に処理の一部を遠隔プロセッサ又はサーバに分散又は送信することができ、移動デバイスに戻すことができる。

補聴器は、聴覚障害／聴力損失のある人がサウンドを理解できるようにサウンドの増幅及びフィルタリングを助けるあらゆる医療デバイスである。補聴器は、サウンドを電気信号に変換するマイクロフォン（指向性又は全方向性）を含み、電気信号はデジタル信号プロセッサによって処理され、目標サウンドを拡張し不要な背景雑音を最小にする。得られる目標サウンドは次に患者の三半規管のスピーカを介して増幅及び再放送される。患者の制御は、音量、雑音の低減、及び様々な環境設定に使用することができる。マイクロフォン、ＤＳＰ及びデバイスの制御は、補聴器自体に又はその内部に又は外部制御デバイス又は携帯電話に位置付けることができる。

本明細書で説明する源信号分離のための方法は、限定されるわけではないが、目標サウンドの増幅、話している１人の人又はサウンド発生源への集中、制限された領域（レストランで他の音を消す／最小にしている間の混雑したレストランのテーブルでの会話など）への集中、及び／又はユーザが聞くことを選んでいない及び／又は所望の会話又はサウンド発生源のユーザの理解に干渉する背景又は他の周囲雑音を最小にする又は無くす目的であらゆる補聴器デバイスの設計に実施することができる。

本明細書で説明するこれらのＳＳＳ方法は、限定されるわけではないが、耳の後ろの補聴器、耳管内の補聴器、開耳管補聴器、閉耳管補聴器、空気伝導補聴器、骨伝導／骨固定補聴器、眼鏡ベースの補聴器、外部デバイスにリンクした補聴器、携帯電話ベースの補聴器、ＰＤＡベースの補聴器、ｉＰａｄ／タブレットベースの補聴器、ＰＣベースの補聴器及蝸牛インプラントを含むあらゆる聴力支援デバイスに渡って利用することができる。聴力支援デバイスでのアプリケーションは、ＦＤＡ調整補聴器及び店頭の処方箋なしのサウンド増幅デバイスの両方を含む。

本明細書で説明するＳＳＳ方法は、携帯電話、テレビジョン、ラジオ、ＰＣ、クラウド、タブレット及び他の聴力支援リンクデバイスにリンクすることもできる。１つの例示的実施形態は、ユーザが放送を理解する能力を損なう他の背景又は周囲雑音を最小にするか又は消してユーザが放送を理解するのを可能にするテレビジョンへのリンクになる。同様に、このアプリケーションの類似の実施形態は、ユーザが呼出し並びに電話の相手側の発呼者によって送信される不要な背景雑音を受信するサイトで周囲又は背景雑音を最小にする又は無くすように処理された携帯電話送信の増幅である。

本明細書で説明するＳＳＳ方法は、あらゆる聴力支援デバイスに位置付けられるか又は組み入れられ、又は聴力支援処理デバイスとは離れて位置付けられ、無線、ＩＲ、Ｂｌｕｅｔｏｏｔｈ、有線又は他の送信方法を介してそのデバイスに送信されるあらゆるマイクロフォン（ステレオ又はモノ、指向性又は全方向性）又はマイクロフォンアレイと共に作用するよう意図される。例示的実施形態は、携帯電話又はタブレットにリンクした補聴器であり、サウンドがこれらのデバイスに録音され、放送のために耳に送信される。同様に、目標サウンド発生源を録音するためのマイクロフォンは、ユーザの眼鏡に位置付ける、衣服又は宝飾品に埋め込む、ユーザの首の回りに装着する、ボタン、帽子、又は他の衣服又はファッションアクセサリに埋め込むことができる。

限定されるわけではないが上記の例を含むマイクロフォンの設計は、目標サウンドを処理デバイスに送信して、本明細書で説明するＳＳＳ方法及びシステムが、処理デバイスでサウンドを処理するものである。アルゴリズム処理は、組込み式ファームウェアを介して独立ＤＳＰ又はデバイスＣＰＵにおいて実行することができる。これらの処理プラットフォームの配備は、デバイス自体、外部制御ユニット、タブレット、ＰＣ、ＰＤＡ、携帯電話又はクラウドを介した送信又はセルラー又は無線ネットワークを通じて中央サーバに戻る送信上とすることができる。二者間の補聴器又はアレイマイクロフォンシステムに記録された信号は、リアルタイム又はリアルタイムに近い処理のために上述されたものを限定ではなく含むデバイス全体に又は外部処理ユニットに送信することができる。

本明細書で説明するＳＳＳ技術によって処理された信号は、出力信号に再合成され、スピーカを介して又はユーザの耳の近くで又は直接知覚神経系の処理のために神経又は骨刺激デバイスを介して再生される。再放送のためのスピーカベースのデバイスは、開耳管及び閉耳管システム、ヘッドフォン、電話デバイス、携帯電話、Ｂｌｕｅｔｏｏｔｈ及び他のスピーカベースのデバイスを含む。再合成信号は、同じデバイス（耳の後ろの補聴器など）で取り込む又は外部処理ユニット（タブレット、携帯電話、ＰＣ又は他の携帯式プロセッサなど）から出力スピーカデバイスに送信することができ、単一の再処理入力又は複数の記録デバイスから同時に記録されミキシングされた多くの入力の結合とすることができる。

本明細書で説明するＳＳＳ処理を使用する聴力支援技術は、臨床のプログラムパラメータ又はユーザ制御のパラメータを扱い、デバイス処理を特定の環境に調整することができる。臨床パラメータの例示的実施形態は、初期フィッティングの時間にプログラムできるか又は電話又はＰＣ／ウェブインタフェースリプログラミングを介して続けて調整できる距離ベースのＳＳＳ及び背景雑音低減設定になる。ユーザベースの制御の例示的実施形態は、オンボードデバイスダイヤル、外部制御ユニット、又はユーザが、目標発話と背景雑音の混合、目標発話増幅のレベル、リアルタイム又はリアルタイムに近い送信の使用、目標サウンド発生源を収集したいときのエリア又は方向を支配するための距離及びベクトルベースの制御、ＴＶ、携帯電話、ラジオ、音声制御システム又は直接インタフェースのための他のＰＣベースのデバイスにタップする能力を制御するのを可能にするＰＣ／携帯電話／タブレットベースのアプリケーションになる。ユーザは、レストラン又は近くの会話などの様々なモードにデバイスを設定するか、又はユーザが目標発話の遅延リードイン対再放送サウンドの明瞭度又は自然さの間のトレードオフを決定できるように再生のリードイン時間を制御する能力を有することもできる。

例示的かつ非制限的実施形態により、システムは、マイクロフォンなどのサウンド収集デバイス、又は通信のためのサウンド送信デバイス（例えばＢｌｕｅｔｏｏｔｈ又は他の送信プロトコルを使用する）を源信号分離の協働／分散コンピューティングに携わるための近くのプロセッサと共に含む。一部の実施形態では、補聴器で使用できるように処理が集中しないようにアルゴリズムは拡張可能である。一部の実施形態では、一部の処理を、補聴器に転送される結果と共にプロセッサによって遠隔サーバに分散することができる。

一変形では、携帯電話は、多くの処理を実行することができるサーバにデータを送信することができる。一部の事例では、補聴器が現実により多くの処理パワーを必要として遠隔サーバに送信できない時、あなたのポケットの電話などの近くのデバイスに送信することができる。電話は、ローカルスーパーブースター又は外部処理システムのように作用することができる。このような例では、補聴器が定義されたモードに移行して、余分のコンピュータパワーを使用して処理を携帯電話にオフロードし、向上した機能を達成する。一例では、制御は、実際の携帯電話又はコンピュータタブレットに配置することができ、これによって例えばレストランに座っている人がテーブルの下に携帯電話を置いて画面をタップするか又はスライダ制御を動かしてテーブルに座っている人の方向に処理及び源信号分離を合わせることができる。これに応答して、アルゴリズムが同じテーブルの会話の拡張を助けるよう機能する。

図５７を参照すると、タブレット又は携帯電話制御のコンピュータ生成インタフェースの例示的かつ非制限的実施形態が示されている。

別の実施形態では、周囲の雑音又は望ましくない背景雑音を入力源信号から取り除いて、低雑音レベルで周囲又は背景雑音と再結合できる分解された源信号を生成して結合信号を出力することができる。一部の実施形態では、ユーザは、再導入される周囲雑音の雑音レベルを動的に又は静的に変えることができる。

セルラーネットワークにおける移動電話呼出しでは、音声は、埋込式マイクロフォンを介して取り込まれ、続いてアナログからデジタル信号に変換される（一般的には「Ａ−Ｄ」変換と呼ばれる）。得られるデジタル信号は、圧縮又は非圧縮形態でセルラーネットワークを介して最終端末に送信され、これによって音声出力として配信される。送信処理に沿うあらゆる場所で又は配信のエンドポイントで、デジタル信号がアナログ信号に変換される。

一般的には、送信のための電話（例えば、セルラー、スピーカフォン、ＶｏＩＰなど）によって取り込まれる音声は、周囲の雑音又は他の干渉を含む可能性があり、音声ファイルの変換及び送信を妨げることはないが、意図された受信者への出力ファイルの一般的な品質に影響を与える可能性がある。例えば移動電話のマイクロフォンはスピーカの音声をピックアップすることができるが、当該の発呼者の近くで起こる他の会話の雑音も取り込むことがあり、これが変換され呼出しの受信者に送信される。音声が変換され受信者に配信された時に、聴取者は、同時に配信される干渉雑音によってスピーカを理解するのが難しいことを見出すことがある。一般的に、雑音及びエコー相殺のようなある一定のアルゴリズムが、取り込みのポイント（例えば移動電話）で適用され、ここで信号が送信用に変えられるが、適用されるアルゴリズムは、伝統的には、雑音／干渉効果の一部だけを軽減し、受信当事者は、送信者の知覚を妨げる可能性がある干渉環境雑音を受信する。

本明細書で説明する源信号分離のための方法は、限定されるわけではないが、目標サウンドの増幅及び／又は携帯電話又は電話ユーザ又は電話会議で話している当該の人にフォーカスすると同時に、望ましくない送信が呼出し当事者、当該のスピーカ及び／又は会話のユーザの理解を妨げるので、受信当事者が聞く及び／送信したくない背景又は他の周囲雑音を最小にするか又は無くすという目的のためにあらゆる電話アプリケーションに導入することができる。

本明細書で説明するこれらのＳＳＳ方法は、源信号取り込み、会話、電話アプリケーションの受信者への送信及び／又は配信／出力のあらゆるポイントの間に導入及び適用することができる。本明細書で説明するＳＳＳ方法は、呼出し中に常に適用できるよう統合することができ、又は送信者又は受信者が本明細書で説明するＳＳＳ方法の導入を要求し呼出し中の干渉因子の軽減を提供するのを可能にする制御機構と共に導入することができる。ＳＳＳシステム及び方法は、ファームウェア、組み込みソフトウェア、独立ソフトウェアプリケーション又はプラットフォーム、又は付加的なソフトウェア機能又は特徴として組み入れることができ、単独で使用するよう、収集、送信又は配信のポイント（例えば携帯電話又はネットワーク）から、又は雑音低減、呼出しの明瞭度及び／又は他の性能利益のための他のアルゴリズムと共に実施することができる。

車載音声制御システムは、以下の又は類似の干渉サウンド発生源、すなわち、道路の雑音、外部環境の雑音、ラジオの雑音、ＨＶＡＣの雑音、意図しない客室の雑音及び随行乗客の雑音のいずれかと混合された目標音声指令の要素を処理するという問題に直面している。本明細書で説明するＳＳＳ方法は、車載音声応答システムと共に使用して、正確な音声応答システム処理、自動車制御及び車両セキュリティのために望ましくない又は干渉背景雑音から目標指令を抽出して増幅することができる。

本明細書で説明するＳＳＳ方法は、音声応答システムによって処理される発話又は抽出された発話特徴の使用を介して音声指令システムと対話することができる。処理システムは、車ベースのＰＣにオンボードで包含することができ、又は車両の外側の中央処理サーバに送信することができる。このようなシステムによって制御される音声応答指令の例示的実施形態は、限定されるわけではないが、車載ナビゲーション、ＨＶＡＣ、ウィンドウ、ラジオ、座席機能、ワイパー、自動ドアロック及び制御、サンルーフ制御などの自動システム制御、及び携帯電話統合及びｉＰｏｄ、タブレット、ｍｐ３、音声及び娯楽デバイス制御などの第三者統合デバイス制御を含む。本明細書で説明するＳＳＳシステムは、車両中央音声処理システムを介して通される送信及び受信信号の両方を処理するために、携帯電話、Ｂｌｕｅｔｏｏｔｈ及び他のヘッドセットシステムにリンクすることもできる。

本明細書で説明するＳＳＳ方法の付加的な配備は、車両制御及びセキュリティのためのオンボード音声生体認証である。本明細書で説明するＳＳＳシステム及び方法によって取り込まれた発話特徴が、各個々のユーザに固有の正確な発話特徴の抽出を可能にする。この制御特徴の代表的な配備は、限定されるわけではないが、ドライバ／ユーザアサイン車両ロック及びアラーム制御、ドライバエンジン始動及び停止制御（オンボード又は携帯電話などの外部制御デバイスを介して初期化）、ナビゲーションシステム及び基本以外の車両制御システムのドライバ及び／又は特定のユーザ制御を含む。

本明細書で説明するＳＳＳシステムは、客室に組み込まれた単一のマイクロフォン（ステレオ又はモノ、指向性又は全方向性）又はマイクロフォンのアレイによって、又はＢｌｕｅｔｏｏｔｈヘッドセット又は他のハンズフリー携帯電話制御デバイスなどの外部システムへの接続を介して可能にすることができる。システムはユーザによって配備及びプログラムすることができ、これによって音声制御システムは、ドライバの座席、ドライバと乗客の両方の座席、又は指定された生体認証署名を持つ個人に対する指示だけを受け入れる。別々の制御を追加することもでき、これによって後部座席の個人が、後部ＨＶＡＣシステム又は後部娯楽システムを制御することができる。

ドライブ又は付加的な当事者音声生体認証制御は、システムの使用を介して又は本明細書で説明するＳＳＳ方法を使用する別のデバイスからのユーザ音声認証プロファイルのダウンロードを介してプログラムすることができる。

本明細書で説明するＳＳＳ方法は、超音波、ＭＲＩ、ＣＴスキャン、ＰＥＴスキャン、Ｘ線、ＳＰＥＣＴ、ガンマ線カメラ画像化、放射性映像、光音響画像化、乳房サーモグラフィ、及び光コヒーレンストモグラフィを含む静的画像化又は時系列画像化信号分析を使用する一連の医療画像化アプリケーションに配備することができる。本明細書で説明するＳＳＳ方法のアプリケーションは、目標画像の向上した分解能及び上述及び他の医療画像化システムにおける画像化機器によって生成される雑音の低減を可能にする。

本明細書で説明するＳＳＳ方法及びシステムの例示的実施形態は、拡張された分解能及び超音波プローブにおける重なり合う要素によって生成される雑音を低減するための医療超音波システムにおけるアプリケーションである。本明細書で説明するＳＳＳアルゴリズムは、自立超音波システム、ＰＣベースのシステム、タブレットシステム、スマートフォンアプリケーション、ｐｄａｓ、及び手持ち式システムに組み入れることができる。本明細書で説明するＳＳＳアルゴリズムは、デバイス内部のＣＰＵ、ソフトウェア、又はデバイスにロードされたアプリケーションから派生するファームウェアとして、又は制御ボックス又は超音波プローブ自体に組み入れられるＤＳＰ又は他のチップとして組み入れることができる。

超音波を向上させるための本明細書で説明するＳＳＳ方法及びシステムは、プローブの個々の要素によって収集されたデータの事前又は事後合計を組み入れることができる。

本明細書で説明するＳＳＳ方法及びシステムは、目標組織の違いを補償するためのビーム角度及び信号強度の調節に矛盾しないように事前及び／又は事後ビーム形成を使用することができる。

本明細書で説明するＳＳＳ方法及びシステムは、限定されるわけではないが、２Ｄ超音波、３Ｄ超音波、４Ｄ超音波、組織ドップラー、流量ドップラー組織緊張分析、弾性分析及び他のアプリケーションを含む超音波（別名、ソノグラフィ又はエコソノゴラフィ）画像化ソフトウェア又はアドオン画像化分析プログラムのいずれの形態とも一緒に使用することができる。

本明細書で説明するＳＳＳソフトウェアは、診断及び手術アプリケーションの両方を含む全ての臨床業務全体に渡って適用することができる。ＳＳＳ拡張超音波画像の実施形態は、超音波支援生体検査、超音波支援カテーテル挿入、心エコー検査、心臓及び心臓病手術アプリケーション、整形外科及び整形外科手術アプリケーション、超音波及び他の産科及び婦人科アプリケーション‐画像化及び手術の両方‐泌尿器科アプリケーソン、胃腸アプリケーション、軟組織アプリケーション、頭部、頸部及び頭蓋アプリケーションを含む。

本明細書で説明する超音波アプリケーションは、限定されるわけではないが、複合材料、構造、及び地質調査の超音波分析を含む獣医学及び工業アプリケーションのための超音波ハードウェア及び画像化ソフトウェアプログラムの両方と共に使用することもできる。

ソナーは、水の表面上又は水中の物体をナビゲートし、物体と通信し、及び／又は物体を検出するためにサウンド伝播を使用する。２つのタイプのソナー、すなわち（ｉ）目標物体によって生成されたサウンドを「リッスン」するパッシブソナー、及び（ｉｉ）サウンドのパルスを発してエコーをリッスンするアクティブソナーがある。ソナーは、水中の「ターゲット」のエコー特性の音響的位置付け及び測定の手段として使用することができ、限定されるわけではないが、潜水艦ナビゲーション、魚雷及び地雷の誘導、水中調査及びマッピング、エコーサウンディング、パイプライン検査、波測定、及び進路、領域、軌跡、及び当該の目標の速度の決定（別名、ターゲットモーション分析）を含むアプリケーションで使用される。

本明細書で説明するＳＳＳ方法及びシステムは、モノスタティック、バイスタティック、又はマルチスタティック構成で動作することができるサウンド送信機及び受信機を使用するアクティブソナーのあらゆる形態の信号品質も拡張するために使用することができ、音響周波数を、非常に低い（超低周波数）から極めて高い（超音波）まで変えることができる。ソナーは、一定した周波数で信号発生器、電力増幅器、及び電気音響トランスデューサ／アレイを使用して一般的には電気的に生成されるサウンドのパルス、又は周波数を変える「チャープ」（受信時にパルス圧縮を可能にする）を利用することができる。ＳＳＳは、要求されるサーチ角度をカバーするようスイープすることができるビームに音響パワーを集中させるために使用されるビーム形成器と共に組み入れることもできる。時には、音響パルスは、他の手段、例えば、（１）火薬を化学的に使用するか、又は（２）エアガン又は（３）プラズマサウンド発生源によって作成することができる。

本明細書で説明するＳＳＳ方法及びシステムを使用して、いずれのパルスも送信することなく一般的に「リッスン」し、かつ一般的には検出されたサウンドを大きなソニックデータベースと比較することによって検出されたサウンドの発生源を識別するための多種多様な技術を有するパッシブソナーのあらゆる形態の信号品質を拡張することができる。パッシブソナーの使用によって、目標放射雑音レベルが十分高い場合、目標を識別することが可能であるが、動作は、水の体積弾性率、密度、温度、溶解不純物（通常は塩分）、及び均一な水圧によって決定されるサウンド速度の変動によって影響を受ける可能性がある。

本明細書で説明するＳＳＳ方法をアクティブ及びパッシブソナーシステムの全ての形態に適用して、サウンド変動に対処すると同時に、サウンド又はエコーが受信された状態での分析の処理内のあらゆるポイントで、雑音、干渉、及び／又は散乱を軽減することができ、これによって最終使用アプリケーションに提供される最終データの品質を拡張する。本明細書で説明するＳＳＳ方法は、あらゆる他の補正アルゴリズム及びシステムに関係なく又はビーム形成及び狭ビーム送信などのシステムの１又はそれ以上と共に、受信、送信又は表示システムのソフトウェア又はハードウェア構成要素に導入することができる。

要求される目標エコー又は痕跡に干渉する雑音の発生源は、波及び船舶から乱気流及び海洋生物に及ぶ。加えて、水を通る受信機の動きは、速度に依存する低周波雑音を生じることもある。アクティブソナーが使用される時は、散乱が、水中の小さな物体から並びに海底及び水面から発生する。

アクティブ及びパッシブソナーに加えて、本明細書で説明するＳＳＳ技術は、限定されるわけではないが、合成アパーチャソナー及びパラメータ及び非線形ソナーを含む他のソナーベースのシステムに利益をもたらすために適用することができる。

本明細書で説明するＳＳＳ方法は、水面下でメッセージを送信及び受信するために使用される水中音響通信を含む水中音響システムに導入することもできる。このような通信を利用する方法には幾つかあるが、最も一般的なものは水中聴音器を使用する方法である。水中通信は、多数の因子のせいで困難であり、多経路伝播、チャネルの時間変動、小さな利用可能帯域幅、及び強力な信号の減衰を含む多数の因子をＳＳＳによって対処することができる。

殆ど携帯電話及び他の電話システムのように、ヘッドセット、スピーカフォン、及び一般的なマイクロフォンベースのシステム（単独で又はセルラー又は他の電話ネットワークと一緒のいずれかで使用される）は、デバイスユーザを受信、処理、及び送信する場合の意図しない効果、並びに送信／録音の時間に存在する意図しない背景雑音及び周囲の雑音を有する。現在のシステムは、スピーカを抑えて意図された送信／録音を受信機／ユーザが理解するのを難しくすることがある他の周囲又は干渉雑音から目標ユーザを分離することができない。この問題の代表的な例には、航空制御システムによる航空機雑音の送信、携帯電話ヘッドセットを介した空港でのＰＡアナウンスメントの放送、カンファレンスコールスピーカシステムを介した室内の雑音放送、「ドライブスルー」注文システムを介した屋外雑音放送、又はコーチのヘッドセットを通じた群衆雑音放送が含まれる。

本明細書で説明するＳＳＳシステム及び方法は、送信／録音デバイスのマイクロフォンによって取り込まれた望ましくない／意図しない周囲／背景雑音に対するユーザの品質／知覚性を向上させる目的のためにこのようなマイクロフォン依存デバイスに組み入れることができる。本明細書で説明するＳＳＳ方法は、特定のスピーカ、又は近接するデバイスユーザなどの定義される制限されたエリア／半径から発するサウンド発生源だけを送信して、遠距離の雑音を消すように各デバイスに対して最適化することができる。これは、本明細書で説明するＳＳＳ方法及びシステムを使用することによって達成され、意図しない背景雑音ではなく目標スピーカからのサウンドを抽出し選択的に送信／録音する。

このようなシステムの例示的実施形態は、Ｂｌｕｅｔｏｏｔｈヘッドセットへの本明細書で説明するＳＳＳシステム及び方法の追加である。ＳＳＳ技術は、既存のプロセッサに追加される専用ＤＳＰ又はファームウェアとしてヘッドセットに追加することができる。ＳＳＳ技術は、デバイスマイクロフォン（指向性又は全方向性）によって取り込まれた信号を処理して、結果信号が送信又は記録される前に、意図しない雑音から目標サウンド発生源を抽出することができる。これは、記録デバイス又は送信システムが抽出されたサウンド発生源だけを記録することを仮定し、従ってそのサウンド発生源の品質及び知覚性を上げる。処理チェーンにおけるこの新しいステップは、独立型特徴として使用でき、又は他の音声処理及び拡張アルゴリズムと共に使用することができる。

本明細書で説明するＳＳＳシステム及び方法の別の例示的実施形態は、マイクロフォンベースの記録に使用される。目標サウンド発生源を１つのチャネルで抽出及び記録することができ、背景雑音は別のチャネルで記録される。次に各チャネルが、最適／所望のサウンド効果及び品質のために再ミキシングされる。

例示的かつ非制限的実施形態により、システムは、マイクロフォンなどのサウンド収集デバイス、又は通信のためのサウンド送信デバイス（例えば、Ｂｌｕｅｔｏｏｔｈ又は別の通信プロトコルを使用する）を源信号分離の協働／分散コンピューティングに携わる近くのプロセッサと共に含む。一部の実施形態では、何らかの処理は、プロセッサによって遠隔サーバに分散することができ、結果は、戻されて通信システムを介して送信される。

別の実施形態では、目標入力信号とは別の周囲雑音又は背景雑音を入力源信号から取り除いて、より低い又は低減提示レベルで周囲又は背景雑音と再結合できる分解源信号を生成して結合信号を出力することができる。一部の実施形態では、ユーザは、再導入された周囲雑音の提示レベルを動的に又は静的に変えることができる。

ＴＶ、ビデオゲーム、娯楽システム、及び他の対話型デバイスのための音声認識及び音声駆動式指令システムの普及は、干渉雑音、意図しないスピーカ割込指令、及び指令認識及び応答に影響を与える背景雑音の問題によって制限されてきた。本明細書で説明するＳＳＳ方法は、正確な音声認識及び応答を保証する目的でいずれのこのような娯楽デバイスにも組み込むことができる。加えて、このようなデバイスをリンクすることができるか、又は本明細書で説明するＳＳＳ方法を適用することができる説明した（前の詳細な段落）ものに類似の発話及び音声認識に対するネットワーク依存ソリューションを利用することができる。

本明細書で説明するＳＳＳシステム及び方法の例示的実施形態は、テレビジョン機能のための音声応答／音声制御におけるＳＳＳの使用である。本明細書で説明するＳＳＳは、システムに事前プログラムすることができる特定のスピーカ又は遠隔制御又は他の類似のデバイスに話しかけている未知のスピーカにシステムがフォーカスするのを可能にする。スピーカの音声指令は、限定されるわけではないが、ケーブルＴＶボックス、ＤＶＲシステム、衛星システム、ＤＶＤプレーヤ、一体型サウンドシステム、ＰＣ、ビデオゲームシステム／コンソール、インターネット接続性、クラウド接続性、ビデオ会議システム、ＶＯＩＰ／インターネット電話システム、及び他の類似のデバイスを含む全てのデバイス特徴及び関係付けられるデバイスの特徴を制御する。

ＴＶ音声応答制御は、限定されるわけではないが、テレビジョン組み込みマイクロフォン／スピーカ、専用遠隔制御マイクロフォン／スピーカ、外部マイクロフォン／スピーカシステム、携帯電話、タブレット、ＰＣ、ビデオゲームシステム及びヘッドセットを含むあらゆるマイクロフォン又はスピーカ／マイクロフォン結合システムによって駆動することができる。制御特徴は、指向性／全方向性マイクロフォンを使用することができるか、又はシステムへのＩＲ，Ｂｌｕｅｔｏｏｔｈ、ｗｉｆｉ、ＲＦ又は有線リンケージを使用することができる。

システムは、音声駆動式クエリを受け入れかつ応答する２方向の対話を許可し、それはまた、ビデオ会議、ウェブ会議、ＶＯＩＰ、及びウェブベースの会議呼出しのためのインタフェースとしても機能する。

本明細書で説明する音声制御ＴＶのためのＳＳＳ方法及びシステムは、受信された発話を再合成できるか又は再合成しなくてもよい。騒々しい環境では、発話認識エンジン又は音声応答システムを駆動する目的で本明細書で説明するＳＳＳ数学モデルに基づいて受信された発話を発話特徴又は発話ベクトルとして処理することができる。再合成された発話と一緒に背景雑音の変化するレベルを再度組み入れることができる。

システムを訓練して、目標音声又は複数の音声に応答することができる。スピーカ認識訓練は、デバイスの使用又はデバイス初期化の時の発話の言及を介して生成することができる。

電源は、連続した低レベル雑音、例えば一部のアプリケーションでは平均して大体５０Ｈｚを発する。電力需要における変動は、この雑音レベルにわずかな変動を起こし、増加した電気需要が雑音レベルを低下させ、低減された需要レベルが反対の効果を有する。電力需要における変動は、いずれかの記録に相関付けることができる固有の時間／日付署名を提供する能力を電力送電網に与える。

本明細書で説明するＳＳＳシステム及び方法を使用して、送電網をモニタしてシステムの高精度の時系列痕跡を作成することができる。この痕跡は、いずれの記録デバイス（音声又はビデオ）又は源信号タイプ（アナログ又はデジタル）からも得られる。低レベル音声信号は、システム全体に渡って一貫性があり、信号分析は、生成ステーション、特定の機械、又はいずれの他の位置でも行うことができる。本明細書で説明するＳＳＳシステム及び方法は、あらゆる生フィード又は記録から電気供給の信号影響を抽出して、送電網の高精度の時系列痕跡を提供する。この痕跡は、リアルタイム、ほぼリアルタイムでモニタするか、又は続いて分析することができる。

このシステムの例示的実施形態は、差し迫ったブラウンアウト、電力スパイク、電力故障、又は電源の途絶を予測するための本明細書に説明したＳＳＳの使用である。これは、送電網全体のレベルで、個々の現場で、又は低レベル雑音対履歴上での基準／予測子における変化を分析することによって個々のデバイスで発生させることができる。記録デバイスは、上記の位置、機械、又はデバイスのいずれかで周囲雑音を記録し、次に本明細書で説明するＳＳＳ方法が、他の雑音から目標電気雑音を分離する。本明細書で説明するＳＳＳ方法及びシステムは、電力雑音の読取り値を生成して、雑音レベルがいずれかの問題をもたらす場合に差し迫った事象の警告を送信する。警告は、デバイス自体に表示されるか、又はネットワークを介して、無線で又はクラウドを介して、あらゆるモニタリングデバイス、ＰＣ、タブレット、携帯電話又はいずれかの他のデバイスに送信される。

法医学の音声分析におけるこのシステムの別の例示的実施形態は、記録が作成された時間の日付及び時刻の識別及び検証になる。本明細書で説明するＳＳＳ方法及びシステムを使用して、記録から電気システムの雑音を抽出してその信号の高精度の数学的表現を生成することができる。その信号は、送電網からの既知の記録に相関付けられ、記録が作成された正確な時間及び日付を決定することができる。このような認証／検証は、証拠につながる記録を検証し、このような記録の質が落ちないようにするために必要である。記録（音声又はビデオ、デジタル又はアナログ）、ファイルフォーマット、又は記録の持続時間のいずれのタイプにも分析を行うことができる。

一例示的かつ非制限的実施形態では、本出願で紹介された新しい測定ツール及び経路伝播技術は、目標環境のルームスケーピング又はサウンドマッピングを可能にする。経路伝播軽減方法によって提供されたエコー及び反射信号要素（残響）に関する情報は、信号が生成された環境の構造に関する重要なジオロケーションの手掛かりを提供する。例えば、その信号の様々な反射又は間接的バウンス経路と結合したエミッタ信号の受信は、部屋の形状又は源信号エミッタと受信機の間の様々な干渉構造に関する重要な図形及び距離情報を提供する。この情報を使用して、部屋の形状又は源信号エミッタの回りの地理的な特徴を決定することができ、エミッタ又は様々な他のエンティティの動きを追跡するために使用することができる風景又は数学的データの画像（２Ｄ又は３Ｄ）のいずれかを提供する。

ルームスケーピング処理のパラメータを使用して、出力信号のシェーピングを通知し、空間認知を達成することができる。これらのパラメータは、合成信号を測定又は作成することができる。例えば、ビデオゲーム又は家庭用娯楽システムの音声をシェーピングして仮想サウンドスケープを生成することができる。サウンドスケープは、リスナーに、サウンド発生源がビデオゲームでユーザの後ろから来るという認知又はホームシアターシステムにおける正確なロケーションサウンド生成を与えるなどの位相又はスピーカ混合を変えることによるサウンド発生源に関連付けられる位置の感覚を与える。

一例示的かつ非制限的実施形態では、本明細書で説明するＸＣＳＰＥ技術及び新しい測定ツールによって与えられる高分解能信号分析は、正確なＡＯＡ及びＴＤＯＡ推定値を提供する。これらの正確な推定値をＳＳＳシステム及び方法と共に使用して、個々の源信号エミッタを更に正確に位置付け、追跡し、更に目標にすることができる。本発明の技術は発生源不可知であり、制限されるわけではないが、音声、ビデオ、ソナー、レーダー、超音波又はアレイ受信機又は時系列分析を利用する他の信号取り込みデバイスを含む多種多様な入力信号と共に使用することができる。逆に、ジオロケーションデータを使用して、出力信号の形状を通知及び作り変え、所望の効果を達成することができる。例示的かつ非制限的実施形態は、所与の位置の組織の１つのタイプ、又はソナー又はレーダーの物体の認識をマスクするための出力信号のシェーピングに作用するように作り変えられた超音波セラピー又は強度変調放射線治療の提供である。

これらのアルゴリズムによって提供される正確なＴＤＯＡ及びＰＰＥ推定を使用して、ビーム形成システムの性能を拡張することができる。

フィットユーザインタフェースは、ユーザが、追跡、グループ化、及び処理の再合成段階のピーク選択を見て対話するのを可能にする。ユーザインタフェースは、「オフライン」で使用して、記憶されたデータを閲覧及び補正することができ、又は「オンライン」でリアルタイムで処理構成要素に命令してデータと対話することができる。ユーザインタフェースを使用して、データを分析して構成要素パラメータを補正することができる。ユーザインタフェースは、ユーザ対話から最適構成要素パラメータを検出することができる。例えば、再合成のデータのユーザ選択が与えられた場合、フィットユーザインタフェースは、類似のデータを検出するための処理パラメータを計算することができる。

例示的かつ非制限的実施形態により、信号をトラックとして、すなわち、トラック、トラックレット、及び／又はコヒーレントグループを有する追加、除去、又はグループ信号データのうちの少なくとも１つに視覚表現を編集するための複数の潜在的にコヒーレントなトラックレット及び／又はコヒーレントグループとして見るためのユーザインタフェースが提供される。

別の実施形態では、ユーザインタフェースを利用して、信号をトラックとして、すなわち、複数の潜在的にコヒーレントなトラックレット、及び／又はユーザがトラック、トラックレットをクリックすることができるコヒーレントグループ、及び／又はトラック、トラックレット、及び／又はコヒーレントグループに関連付けられるデータが提示されるコヒーレントグループとして見ることができる。別の実施形態では、信号をトラック、複数の潜在的にコヒーレントなトラックレット、及び／又はコヒーレントなグループとして見るためにユーザインタフェースを利用することができ、ユーザは、そのトラック、トラックレット、及び／又はグループに関する特徴データを含む入力に基づいてインタフェース内のトラック及び／又はトラックレットを検索及び見出すことができる。別の実施形態では、ユーザは、オンザフライでスコアリング関数を変更して、トラック、グループ、及び／又はトラックレットに関連付けられるデータを補正することができる。

図５８を参照すると、実施形態及び上記の説明により実施することができるトラックエディタの例示的実施形態が示されている。図示のように、トラックエディタは、発振器ピークを含む複数のトラックレットを表示する。様々な例示的かつ非制限的実施形態では、トラックＩＤに従って発振器ピークを色分けすることができる。更に他の実施形態では、コヒーレントグループＩＤに従って発振器ピークを色分けすることができる。他の実施形態では、発振器ピークが再合成に選択されるかどうかに従って発振器ピークを色分けするか又は透明に設定することができる。他の実施形態では、あらゆる他の発振器ピークパラメータに従って発振器ピークを色分けすることができる。他の実施形態では、振幅、背景パワーに対する振幅に従って、又は等しいサイズによって、発振器ピークをスケーリングすることができる。

図５９を参照すると、事後再合成トラックエディタＧＵＩの例示的かつ非制限的実施形態が示されている。例示的かつ非制限的実施形態により、ユーザは、選択されたデータに動作を実行するために、事後再合成トラックエディタＧＵＩに表示されたデータを選択することができる。一実施形態では、ボックス又はラッソーによって描くことによりエリアでデータを選択することができる。他の実施形態では、ユーザは、トラックレットのいずれかのピークをクリックすることによってトラックレットによってデータを選択することができる。他の実施形態では、ユーザは、コヒーレントグループのいずれかのピークをクリックすることによってコヒーレントグループによってデータを選択することができる。更に別の実施形態では、ユーザは、いずれかのピークをクリックすることによって発振器ピークによってデータを選択することができる。

選択された状態で、ユーザは、データに実行する動作を選択することができる。例えば、ユーザは、別の図にデータを示すことができ、発振器ピーク統計値、到達の方向、時間ドメイン音声、スペクトル写真データなどが視覚的にレンダリングされる。一部の実施形態では、ユーザは、「ターンオン／ターンオフ」選択肢などを介して再合成のための選択ピークを含むかどうかシステムに示すことができる。

図６０を参照すると、上述のようにユーザ選択データを表示するためのデータ視覚化器の例示的実施形態が示されている。

様々な実施形態によるＳＳＳ方法及びシステムは、ソフトウェア、ハードウェア、ファームウェア、又はこれらのいずれかの組合せで実施することができる。処理は、多種多様なコンピュータ付属デバイス（例えば、パーソナルコンピュータ、移動電話、画像化デバイス、補聴器、対話型音声応答システム、会議電話システム、音声記録デバイス、車載音声起動システム、口述システム、及び通信システム）で実行される１又は２以上のコンピュータプログラムで実施されるのが好ましい。このようなデバイスは、とりわけ、コンピュータプロセッサ（例えば、汎用及び専用マイクロプロセッサ）、プロセッサによって可読の記憶媒体、及び入力及び出力デバイスを含む。各コンピュータプログラムは、デバイスのランダムアクセスメモリに常駐するコードモジュールの命令のセット（プログラムコード）とすることができる。コンピュータプロセッサによって要求されるまで、命令のセットは、場合によっては別のコンピュータメモリ（例えば、半導体メモリデバイス、ハードディスクドライブ、又は光学ディスクのような取り外し可能メモリデバイス、外部ハードドライブ、メモリカード、又はフラッシュドライブ）に記憶することができ、又は別のコンピュータデバイスに記憶してインターネット又は他のネットワークを介してダウンロードすることができる。

図６１を参照すると、方法の例示的かつ非制限的実施形態が示されている。ステップ６１００で、信号が、複数の信号レコーダによって記録される。次にステップ６１０２で、少なくとも１つの超分解能技術が信号に適用され、複数の発振器ピークに対する複数の周波数成分を含む信号の発振器ピーク表現を生成する。次にステップ６１０４で、信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性が計算され、信号レコーダと複数の発振器ピークのフライト時間測定の間の複数の発振器ピークの空間展開の尺度を生成する。次にステップ６１０６で、複数の発振器ピークの周波数成分及び少なくとも１つのＸＣＳＰＥ属性に対応する既知の予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースが識別される。最後に、ステップ６１０８で、識別されたＰＸＣトレースは、信号の起点に対応する空間属性を決定するために利用される。

図６２を参照すると、方法の例示的かつ非制限的実施形態が示されている。まずステップ６２００で、信号が、複数の信号レコーダによって記録される。次にステップ６２０２で、少なくとも１つの超分解能技術が信号に適用され、複数の発振器ピークに対する複数の周波数成分を含む信号の発振器ピーク表現を生成する。次にステップ６２０４で、信号レコーダと複数の発振器ピークのフライトの測定時間の間の複数の発振器ピークの空間展開の尺度を生成するために信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性が計算される。次にステップ６２０６で、複数の発振器ピークの周波数成分及び少なくとも１つのＸＣＳＰＥ属性に対応する既知の予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースが識別される。ステップ６２０８で、複数の発振器ピークの各々の図示された位置のＰＸＣトレースから外れる偏差が測定され、ステップ６２１０で、経路伝播効果（ＰＰＥ）が、偏差とオリジナル信号内の残響の量とに少なくとも一部基づいて決定される。

以上、幾つかの例示的実施形態を説明してきたが、様々な変更、補正、及び改良が、当業者には容易に想起されることは理解できる。このような変更、補正、及び改良は、本開示の一部を形成することを意図することができ、本開示の精神及び範囲内にあるものとすることができる。本明細書に提示される幾つかの実施例は、機能又は構造的要素の特定の組み合わせを包含するが、これらの機能及び要素は、本開示に従って他の方法で組み合わせて同じ又は異なる目的を達成することができる点を理解されたい。詳細には、１つの実施形態に関して検討された動作、要素、及び特徴は、他の実施形態における類似の又は他の役割から除外されるものではない。更に、本明細書で記載される要素及び構成要素は更に、付加的な構成要素に分割され又は互いに結合されて、同じ機能を実行するための幾つかの構成要素を形成することができる。

幾つかの実施形態だけが図示され説明されたが、添付の請求項に記載される精神及び範囲から逸脱することなく、これらの実施形態に対して多くの変更及び補正を行い得ることは、当業者には明らかであろう。本明細書に引用された国内外を含む全ての特許出願及び特許、並びに他の全ての公表物は、法的に認められる全ての範囲までその全体が本明細書に組み込まれる。

本明細書で記載される方法及びシステムは、プロセッサ上でコンピュータソフトウェア、プログラムコード、及び／又は命令を実行する機械を通じて部分的に又は全体的に配備することができる。本明細書で記載される様々な実施形態は、機械上での方法として、又は機械の一部もしくは機械に関連するシステム又は装置として、或いは、機械の１又はそれ以上で実行されるコンピュータ可読媒体において具現化されたコンピュータプログラム製品として実施することができる。実施形態において、プロセッサは、サーバ、クラウドサーバ、クライアント、ネットワークインフラストラクチャ、移動コンピュータプラットフォーム、固定コンピュータプラットフォーム、又は他のコンピュータプラットフォームの一部とすることができる。プロセッサは、プログラム命令、コード、バイナリ命令及びその他を実行することができるコンピュータ又は処理デバイスの何れかのタイプとすることができる。プロセッサは、信号プロセッサ、デジタルプロセッサ、組み込みプロセッサ、マイクロプロセッサ又はコプロセッサのような何れかの変形形態（数学コプロセッサ、グラフィックコプロセッサ、通信コプロセッサ及びその他）及び格納されたプログラムコード又はプログラム命令の実行を直接的又は間接的に容易にすることができる同様のものとすることができ、或いはこれらを含むことができる。更に、プロセッサは、マルチプログラム、スレッド、及びコードの実行を可能にすることができる。スレッドは、プロセッサの性能を高め、アプリケーションの同時処理を容易にするよう同時に実行することができる。実装として、本明細書で記載される方法、プログラムコード、プログラム命令及び同様のものは、１又は２以上のスレッドにおいて実装することができる。スレッドは、関連付けられる優先順位を割り当てることができる他のスレッドを生成することができ、プロセッサは、優先順位又はプログラムコードにおいて提供される命令に基づく何れかの他の順序に基づいて、これらのスレッドを実行することができる。プロセッサ、又はプロセッサを利用する何れかの機械は、本明細書及びその他で説明された方法、コード、命令及びプログラムを格納するメモリを含むことができる。プロセッサは、本明細書及びその他で説明された方法、コード、及び命令を格納することができる記憶媒体にインタフェースを介してアクセスすることができる。コンピュータ又は処理デバイスによって実行することができる方法、プログラム、コード、プログラム命令又は他のタイプの命令を格納するためのプロセッサに関連付けられた記憶媒体は、限定ではないが、ＣＤ−ＲＯＭ、ＤＶＤ、メモリ、ハードディスク、フラッシュドライブ、ＲＡＭ、ＲＯＭ、キャッシュ及び同様のもののうちの１又はそれ以上を含むことができる。

プロセッサは、マルチプロセッサの速度及び性能を拡張することができる１又は２以上のコアを含むことができる。実施形態において、処理は、デュアルコアプロセッサ、クアドコアプロセッサ、他のチップレベルマルチプロセッサ、及び２又はそれ以上の独立コア（ダイと呼ばれる）を組み合わせたものとすることができる。

本明細書で記載される方法及びシステムは、サーバ、クライアント、ファイアウォール、ゲートウエイ、ハブ、ルータ、又は他のこのようなコンピュータ及び／又はネットワーキングハードウェア上でコンピュータソフトウェアを実行する機械を介して一部又は全体的に配備することができる。ソフトウェアプログラムは、ファイルサーバ、プリントサーバ、ドメインサーバ、インターネットサーバ、イントラネットサーバ、クラウドサーバ、及び二次サーバ、ホストサーバ、分散サーバ及び同様のもののような他の変形形態を含むことができるサーバに関連付けることができる。サーバは、メモリ、プロセッサ、コンピュータ可読媒体、記憶媒体、ポート（物理的及び仮想）、通信デバイス、及び有線又は無線媒体を介して他のサーバ、クライアント、機械、及びデバイスにアクセスすることができるインタフェース及びその他のうちの１又はそれ以上を含むことができる。本明細書及びその他で説明する方法、プログラム、又はコードは、サーバによって実行することができる。更に、本出願で説明する方法の実行に必要な他のデバイスは、サーバに関連付けられるインフラストラクチャの一部として考えることができる。

サーバは、限定ではないが、クライアント、他のサーバ、プリンタ、データベースサーバ、プリントサーバ、ファイルサーバ、通信サーバ、分散サーバ、ソーシャルネットワーク、及びその他を含む、他のデバイスへのインタフェースを提供することができる。更に、この結合及び／又は接続は、ネットワーク全体にわたるプログラムのリモート実行を容易にすることができる。これらのデバイスの一部又は全部のネットワーキングは、本開示の範囲から逸脱することなく１又は２以上の位置でのプログラム又は方法の並行処理を容易にすることができる。更に、インタフェースを介してサーバに付属したデバイスの何れもが、方法、プログラム、コード及び／又は命令を格納することができる少なくとも１つの記憶媒体を含むことができる。セントラルリポジトリは、異なるデバイス上で実行されるプログラム命令を提供することができる。この実装では、リモートのリポジトリが、プログラムコード、命令、及びプログラムのための記憶媒体として機能することができる。

ソフトウェアプログラムは、ファイルクライアント、プリントクライアント、ドメインクライアント、インターネットクライアント、イントラネットクライアント、並びに二次クライアント、ホストクライアント、分散クライアント及び同様のもののような他の変形形態を含むことができるクライアントに関連付けることができる。クライアントは、メモリ、プロセッサ、コンピュータ可読媒体、記憶媒体、ポート（物理的及び仮想）、通信デバイス、及び有線又は無線媒体を介して、他のクライアント、サーバ、機械、及びデバイスにアクセスできるインタフェースなどのうちの１又はそれ以上を含むことができる。本明細書及びその他で記載される方法、プログラム、又はコードは、クライアントによって実行することができる。更に、本出願で説明される方法の実行に必要な他のデバイスは、クライアントに関連付けられるインフラストラクチャの一部として考えることができる。

クライアントは、限定ではないが、サーバ、他のクライアント、プリンタ、データベースサーバ、プリントサーバ、ファイルサーバ、通信サーバ、分散サーバ及びその他を含む他のデバイスへのインタフェースを提供することができる。更に、この結合及び／又は接続は、ネットワーク全体にわたるプログラムのリモート実行を容易にすることができる。これらのデバイスの一部又は全部のネットワーキングは、本開示の範囲から逸脱することなく１又は２以上の位置でのプログラム又は方法の並行処理を容易にすることができる。更に、インタフェースを介してクライアントに付属したデバイスの何れもが、方法、プログラム、アプリケーション、コード及び／又は命令を格納することができる少なくとも１つの記憶媒体を含むことができる。セントラルリポジトリは、異なるデバイス上で実行されるプログラム命令を提供することができる。この実装では、リモートリポジトリが、プログラムコード、命令、及びプログラムのための記憶媒体として機能することができる。

本明細書で記載される方法及びシステムは、ネットワークインフラストラクチャを介して一部又は全体的に配備することができる。ネットワークインフラストラクチャは、コンピュータデバイス、サーバ、ルータ、ハブ、ファイアウォール、クライアント、パーソナルコンピュータ、通信デバイス、及びルーティングデバイス及び他のアクティブ及びパッシブデバイス、当該技術分野で既知のモジュール及び／又はコンポーネントのような要素を含むことができる。ネットワークインフラストラクチャに関連付けられる１又は複数のコンピュータ及び／又は非コンピュータデバイスは、他の構成要素とは別に、フラッシュメモリ、バッファ、スタック、ＲＡＭ、ＲＯＭ、及び同様のもののような記憶媒体を含むことができる。本明細書及びその他で説明する処理、方法、プログラムコード、命令は、ネットワークインフラストラクチャ要素の１又はそれ以上によって実行することができる。本明細書で記載される方法及びシステムは、サービス型ソフトウェア（ＳＡＡＳ）、プラットフォーム・アズ・ア・サービス（ＰａａＳ）、及び／又はインフラストラクチャ・アズ・ア・サービス（ＩａａＳ）の特徴を包含するものを含む、何れかのタイプのプライベート、コミュニティ、又はハイブリッドクラウドコンピューティングネットワーク又はクラウドコンピューティング環境と共に使用するよう適合することができる。

本明細書及びその他で説明する方法、プログラムコード、及び命令は、マルチセルを有するセルラーネットワーク上で実施することができる。セルラーネットワークは、周波数分割多重アクセス（ＦＤＭＡ）ネットワーク又はコード分割多重アクセス（ＣＤＭＡ）ネットワークの何れかとすることができる。セルラーネットワークは、移動デバイス、セルサイト、基地局、リピータ、アンテナ、タワー、及び同様のものを含むことができる。セルネットワークは、ＧＳＭ、ＧＰＲＳ、３Ｇ、ＥＶＤＯ、メッシュ、又は他のネットワークタイプとすることができる。

本明細書及びその他で説明する方法、プログラムコード、及び命令は、移動デバイス上で又は移動デバイスを介して実行することができる。移動デバイスは、ナビゲーションデバイス、携帯電話、移動電話、移動携帯情報端末、ラップトップ、パームトップ、ネットブック、ページャ、電子書籍リーダ、音楽プレーヤ及び同様のものを含むことができる。これらのデバイスは、他の構成要素とは別に、フラッシュメモリ、バッファ、ＲＡＭ、ＲＯＭ及び１又は２以上のコンピュータデバイスのような記憶媒体を含むことができる。移動デバイスに関連付けられるコンピュータデバイスは、格納されているプログラムコード、方法、及び命令の実行を可能にすることができる。或いは、移動デバイスは、他のデバイスと協働して命令を実行するよう構成することができる。移動デバイスは、サーバに接続されプログラムコードを実行するように構成された基地局と通信することができる。移動デバイスは、ピアツーピアネットワーク、メッシュネットワーク、又は他の通信ネットワークで通信することができる。プログラムコードは、サーバに関連付けられた記憶媒体上に格納され、サーバ内に組み込まれたコンピュータデバイスによって実行することができる。基地局は、コンピュータデバイス及び記憶媒体を含むことができる。記憶デバイスは、基地局に関連付けられるコンピュータデバイスによって実行されるプログラムコード及び命令を格納することができる。

コンピュータソフトウェア、プログラムコード、及び／又は命令は、機械可読媒体に格納及び／又はアクセスすることができ、該機械可読媒体は、コンピュータ構成要素、デバイス、及び、ある時間の間隔でコンピュータ計算するために使用されるデジタルデータを保存する記録媒体；ランダムアクセスメモリ（ＲＡＭ）として既知の半導体記憶装置；光学ディスク、ハードディスクのような磁気記憶装置の形式、テープ、ドラム、カード及び他のタイプのような永久記憶装置のための一般的な大容量記憶装置；プロセッサレジスタ、キャッシュメモリ、揮発性メモリ、不揮発性メモリ；ＣＤ、ＤＶＤのような光学記憶装置；フラッシュメモリ（ＵＳＢスティック又はキーなど）、フロッピーディスク、磁気テープ、紙テープ、パンチカード、独立型ＲＡＭディスク、Ｚｉｐドライブ、取り外し可能大容量記憶装置、オフライン、及び同様のもののような取り外し可能媒体；動的メモリ、静的メモリ、読出し／書込み記憶装置、可変記憶装置、読出し専用、ランダムアクセス、シーケンシャルアクセス、位置アドレス指定可能、ファイルアドレス指定可能、コンテンツアドレス指定可能、ネットワーク接続憶装置、記憶エリアネットワーク、バーコード、磁気インク、及び同様のもののような他のコンピュータメモリを含むことができる。

本明細書で記載される方法及びシステムは、物理的及び／又は無形品目を１つの状態から別の状態に変換することができる。本明細書で記載される方法及びシステムは、物理的及び／又は無形品目を表すデータを１つの状態から別の状態に変換することができる。

図面全体を通してフローチャート及びブロック図に含まれる説明され図示された要素は、要素間の論理的境界を示唆する。しかしながら、ソフトウェア又はハードウェアエンジニアリングの実施によれば、図示の要素及びその機能は、モノリシックソフトウェア構造として、又は独立型ソフトウェアモジュールとして、或いは外部ルーチン、コード、サービスなど、又はこれらの何れかの組み合わせを利用するモジュールとして、格納されているプログラム命令を実行することができるプロセッサを有する機械上にコンピュータ実行可能媒体を介して実装することができ、全てのこのような実装は、本開示の範囲内とすることができる。このような機械の実施例は、限定ではないが、携帯情報端末、ラップトップ、パーソナルコンピュータ、移動電話、他の可搬式コンピュータデバイス、医療用機器、有線又は無線通信デバイス、トランスデューサ、チップ、計算機、衛星、タブレットＰＣ、電子書籍、ガジェット、電子デバイス、人工知能を有するデバイス、コンピュータデバイス、ネットワーキング機器、サーバ、ルータ及び同様のものを含むことができる。更に、フローチャート及びブロック図に示された要素又は何れかの他の論理的構成要素は、プログラム命令を実行することができる機械上に実装することができる。従って、前述の図面及び説明は、開示されるシステムの機能的な態様を記載しているが、これらの機能的な態様を実施するためのソフトウェアの特定の構成は、明示的に記載されるか又は関連から明らかでない限り、これらの説明から推測するべきではない。同様に、上記に識別され説明された様々なステップを変更できること、及びステップの順序は本明細書に開示される技術の特定の応用に適応させることができることは、理解されるであろう。全てのこのような変形及び補正は、本開示の範囲内にあるものとする。同様に、様々なステップに対する順序の図示及び／又は説明は、特定の用途によって要求されない限り、又は明示的に記載されるか又は関連から明らかでない限り、これらのステップに対する実行の特定の順序が必須であるものと理解すべきではない。

上述の方法及び／又は処理、及びこれらに関連付けられるステップは、ハードウェア、ソフトウェア、又は、特定の応用に対して適切なハードウェアとソフトウェアの何れかの組み合わせにおいて実施することができる。ハードウェアは、汎用コンピュータ及び／又は専用コンピュータデバイス又は特定コンピュータデバイス、或いは特定のコンピュータデバイスの特定の態様もしくは構成要素を含むことができる。処理は、内部及び／又は外部メモリと共に、１又は２以上のマイクロプロセッサ、マイクロコントローラ、組み込みマイクロコントローラ、プログラマブルデジタル信号プロセッサ又は他のプログラマブルデバイスで実現することができる。処理は、これに加えて又は代替として、特定用途集積回路、プログラマブルゲートアレイ、プログラマブルアレイ論理、又は電子信号を処理するように構成することができる何れか他のデバイス又はデバイスの組み合わせで具現化することができる。更に、処理の１又はそれ以上が機械可読媒体上で実行できるコンピュータ実行可能コードとして実現できることは理解されるであろう。

コンピュータ実行可能コードは、Ｃなどの構造化プログラミング言語、Ｃ＋＋のようなオブジェクト指向プログラミング言語、又は上記のデバイスのうちの１つで実行するために格納、コンパイル又は翻訳することができる他の何れかの高レベル又は低レベルプログラミング言語（アセンブリ言語、ハードウェア記述言語、及びデータベースプログラミング言語及び技術を含む）、並びにプロセッサ、プロセッサアーキテクチャ、又は異なるハードウェア及びソフトウェアの組み合わせ、或いはプログラム命令を実行できる何れかの他の機械の異種の組み合わせを使用して作成することができる。

従って、一態様において、上述の方法及びその組み合わせは、１又は２以上のコンピュータデバイスで実行されたときにそのステップを実行するコンピュータ実行可能コードにおいて具現化することができる。別の態様では、本方法は、そのステップを実行するシステムにおいて具現化することができ、また、幾つかの方法でデバイス全体にわたって分散することができ、或いは、機能の全てを専用の独立デバイス又は他のハードウェアに統合することができる。別の態様では、上述の処理に関連付けられるステップを実行するための手段は、上述のハードウェア及び／又はソフトウェアの何れかを含むことができる。全てのこのような並び換え及び組み合わせは、本開示の範囲内にあるものとする。

本開示は、図示され詳細に説明された好ましい実施形態に関して開示したが、ここでの様々な補正及び改良は、当業者には容易に明らかになるであろう。従って、本開示の精神及び範囲は、上記の実施例によって限定されず、法的に許容される広範な意味で理解すべきである。

本開示の説明の関連における用語「ａ（１つの）」及び「ａｎ（１つの）」及び「ｔｈｅ（その）」及び類似の指示物体の使用（特に添付の請求項における）は、別途示されていない限り、又は関連によって明確に否定されていない限り、単数と複数の両方を含むものと解釈すべきである。用語「ｃｏｍｐｒｉｓｉｎｇ（含む）」、「ｈａｖｉｎｇ（有する）」、「ｉｎｃｌｕｄｉｎｇ（含む）」、及び「ｃｏｔａｉｎｉｎｇ（包含する）」は、別途示されていない限り、オープンエンドの用語として解釈すべきである（すなわち、「限定ではないが、含む」を意味する）。本明細書における値の範囲の記述は、本明細書に別途示されていない限り、範囲内に含まれる各別個の値をそれぞれに示す簡易的方法として機能するものとし、各別個の値は、本明細書で個々に記載されるかのように本明細書に組み込まれる。本明細書で記載される全ての方法は、本明細書において別途示されない限り、又は関連によって他に明確に否定されない限り、何らかの適切な順序で実行することができる。本明細書で提供される何れか及び全ての実施例、又は例示的な表現（例えば、「のような」）の使用は、単に、本開示を明確にするためのものであり、別途請求項に記載されない限り、本開示の範囲を限定するものではない。本明細書における表現は、本開示の実施に必須のものとして請求項に記載されていない何れかの要素を示すものと解釈すべきではない。

本明細書により、当業者は、現在最良のものと考えられるものを実施及び利用することが可能となるが、当業者であれば、本明細書における特定の実施形態、方法、及び実施例の変形形態、結合、及び等価物の存在を理解し認識するであろう。従って、本開示は、上述の実施形態、方法、及び実施例によって限定されるべきではなく、本開示の範囲及び精神内にある全ての実施形態及び方法によって限定されるべきである。

本明細書で参照された全ての文書は、これにより引用によって組み込まれる。

１９００入力：時間ドメイン信号
１９０２信号ＰＰＥ軽減
１９０４信号ＴＤＯＡ推定
１９０６超分解能／シングレット変換処理
１９０８エンティティ管理

Claims

信号を処理する方法であって、
複数の信号レコーダによって記録された信号を取り出す段階と、
前記信号に少なくとも１つの超分解能技術を適用して、複数の発振器ピークに対する複数の周波数成分を含む該信号の発振器ピーク表現を生成する段階と、
前記信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性を計算して、前記信号レコーダ間の前記複数の発振器ピークの空間展開の尺度を生成する段階と、
前記発振器ピークの前記周波数成分と該複数の発振器ピークの少なくとも１つのＸＣＳＰＥ属性とに対応する予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースを識別する段階と、
前記識別したＰＸＣトレースを利用して前記信号の起点に対応する空間属性を決定する段階と、
を含むことを特徴とする方法。
前記ＰＸＣトレースを識別する段階は、
複数の可能なＰＸＣトレースを検討する段階と、
前記複数の前記発振器ピークの各々と前記複数の可能なＰＸＣトレースの各々との間の合計二乗距離を測定する段階と、
を含む、
ことを特徴とする請求項１に記載の方法。
前記距離は、直接距離とラップアラウンド距離のうちの短い方であることを特徴とする請求項２に記載の方法。
前記複数の可能なＰＸＣトレースのサブセットが、マイクロフォンの形状に少なくとも一部基づく事前選択処理の後に利用されることを特徴とする請求項２に記載の方法。
前記複数の可能なＰＸＣトレースのサブセットが、前記複数の発振器ピークの属性に少なくとも一部基づく事前選択処理の後に利用されることを特徴とする請求項２に記載の方法。
前記少なくとも１つの超分解能技術は、ＸＣＳＰＥ分析とシグマに対する振幅偏差補正とで構成される群から選択されることを特徴とする請求項１に記載の方法。
前記空間属性は、方向であることを特徴とする請求項１に記載の方法。
信号を受信するように構成された複数の信号レコーダと、
プロセッサによって実行された時に該プロセッサをして、
少なくとも１つの超分解能技術を前記信号に適用して、複数の発振器ピークに対する複数の周波数成分を含む該信号の発振器ピーク表現を生成させ、
前記信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性を計算して、前記信号レコーダ間の複数の発振器ピークの空間展開の尺度を生成させ、
前記発振器ピークの前記周波数成分と該複数の発振器ピークの少なくとも１つのＸＣＳＰＥ属性とに対応する予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースを識別させ、かつ
前記識別したＰＸＣトレースを利用して前記信号の起点に対応する空間属性を決定させる、
命令を記憶する非一時的コンピュータ可読媒体と、
を含むことを特徴とするシステム。
前記ＰＸＣトレースを識別させることは、
複数の可能なＰＸＣトレースを検討させること、及び
前記複数の前記発振器ピークの各々と前記複数の可能なＰＸＣトレースの各々との間の合計二乗距離を測定させること、
を含む、
ことを特徴とする請求項８に記載のシステム。
前記距離は、直接距離とラップアラウンド距離のうちの短い方であることを特徴とする請求項９に記載のシステム。
前記複数の可能なＰＸＣトレースのサブセットが、マイクロフォンの形状に少なくとも一部基づく事前選択処理の後に利用されることを特徴とする請求項９に記載のシステム。
前記複数の可能なＰＸＣトレースのサブセットが、前記複数の発振器ピークの属性に少なくとも一部基づく事前選択処理の後に利用されることを特徴とする請求項９に記載のシステム。
前記少なくとも１つの超分解能技術は、ＸＣＳＰＥ分析とシグマに対する振幅偏差補正とで構成される群から選択されることを特徴とする請求項８に記載のシステム。
前記空間属性は、方向であることを特徴とする請求項８に記載のシステム。
信号を処理する方法であって、
複数の信号レコーダによって記録された信号を取り出す段階と、
前記信号に少なくとも１つの超分解能技術を適用して、複数の発振器ピークに対する複数の周波数成分を含む該信号の発振器ピーク表現を生成する段階と、
前記信号に対する少なくとも１つのクロスチャネル複素スペクトル位相展開（ＸＣＳＰＥ）属性を計算して、前記信号レコーダ間の前記複数の発振器ピークの空間展開の尺度を生成する段階と、
前記複数の発振器ピークの前記周波数成分と少なくとも１つのＸＣＳＰＥ属性とに対応する既知の予測ＸＣＳＰＥ曲線（ＰＸＣ）トレースを識別する段階と、
前記複数の発振器ピークの各々に対するプロット位置の前記ＰＸＣトレースから外れる偏差を測定する段階と、
前記偏差とオリジナル信号内の残響の量とに少なくとも一部基づいて経路伝播効果（ＰＰＥ）を決定する段階と、
を含むことを特徴とする方法。
前記ＰＰＥは、位相関連の偏差を含むことを特徴とする請求項１５に記載の方法。
前記ＰＰＥを利用して信号放出エンティティを識別する段階を更に含むことを特徴とする請求項１６に記載の方法。
前記ＰＰＥを利用して前記信号から残響の影響を除去する段階を更に含むことを特徴とする請求項１６に記載の方法。
前記ＰＰＥは、振幅関連の偏差を含むことを特徴とする請求項１５に記載の方法。
前記ＰＰＥを利用して信号放出エンティティを識別する段階を更に含むことを特徴とする請求項１９に記載の方法。
前記ＰＰＥを利用して前記信号から残響の影響を除去する段階を更に含むことを特徴とする請求項１９に記載の方法。