JP7422946B2

JP7422946B2 - ベイジアングラフ探索を用いたニューラルネットワークアーキテクチャの自動構築

Info

Publication number: JP7422946B2
Application number: JP2023516860A
Authority: JP
Inventors: 俊昭秋濃; ワン，イェ; デミア，アンダク; エルドグムス，デニズ
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2020-07-02
Filing date: 2021-02-26
Publication date: 2024-01-26
Anticipated expiration: 2041-02-26
Also published as: US20220004875A1; WO2022004057A1; EP3980942A1; CN115769228A; JP2023529242A

Description

本発明は、人工ニューラルネットワークの自動構築システムに関し、特にベイジアングラフ探索を用いた人工ニューラルネットワークの自動構築システムに関する。

深層ニューラルネットワーク（ＤＮＮ）に基づく深層学習技術の大きな進歩は、ビデオ、音声および画像のメディア信号処理と、電波、電気パルスおよび光ビームの物理データ処理と、心拍数、温度、および血圧のための生理データ処理とを含むデータ処理における様々な課題を解決してきた。例えば、ＤＮＮは、脳波図（ＥＥＧ）および筋電図（ＥＭＧ）などのユーザの生理データを分析することによって、ヒューマンマシンインターフェイス（ＨＭＩ）のより実用的な設計を可能にした。しかしながら、このような生体信号は、各被験者の生体状態に依存して非常に変動しやすい。したがって、典型的なＨＭＩシステムは、頻繁な較正をたびたび必要とする。

この課題を解決するために、条件付き変分オートエンコーダ（Ａ－ＣＶＡＥ）を用いた敵対的訓練を使用する被験者不変方法が登場し、ユーザ較正を低減することによって、上出来なＨＭＩシステムを実現している。標準的なＤＮＮ分類器と比較して、エンコーダ、ニューサンス条件付きデコーダおよび敵対的ネットワークに追加の機能ブロックを統合することは、優れた被験者不変性能を提供する。ＤＮＮ構造は、より多くの機能ブロックおよびより多くの潜在ノードを有するように、潜在的に拡張され得る。しかしながら、殆どの研究は、人間の設計に依存して、ＤＮＮのブロック接続およびアーキテクチャを決定する。具体的には、ＤＮＮ技術は、多くの場合、人間の洞察力でデータモデルを知っている専門家によって手作業で作られる。ＤＮＮアーキテクチャの最適化は、試行錯誤を必要とする。異なるＤＮＮアーキテクチャを自動的に探索するために、自動機械学習（オートＭＬ：automated machine learning）の新しいフレームワークが提案された。オートＭＬによるハイパーパラメータおよびアーキテクチャ探索の自動化は、被験者不変の生体信号処理に適したＤＮＮ設計を容易にすることができる。

タスクに関連している特徴を捕捉し、ニューサンス変量に対して不変であるデータ表現を学習することが、依然として機械学習の重要な課題である。ＶＡＥは、自動関連アーキテクチャを組み込む変分ベイズ推論法を導入し、生成モデルおよび推論モデルを共同で学習することができる。この方法は、ニューサンスを表すために使用され得る条件付き変数を導入するＣＶＡＥ、および潜在表現からニューサンス変数を分離するための正則化ＶＡＥによって拡張された。敵対者という概念は、ＧＡＮ（Generative Adversarial Networks）と共に導入され、無数のアプリケーションに採用されている。同時に開発されたＡＬＩ（Adversarially Learned Inference）およびＢｉＧＡＮ（Bidirectional GAN）は、オートエンコーダを訓練するための敵対的方法を提案する。また、敵対的訓練をＶＡＥに組み込み、潜在表現を正則化および分離することによって、ニューサンスロバスト学習を実現する。ハイパーパラメータ最適化を用いてＤＮＮモデルを検索することは、オートＭＬと呼ばれる関連フレームワークにおいて徹底的に研究されてきた。自動化方法は、アーキテクチャ検索、学習ルール設計、および拡張探索を含む。殆どの研究は、進化的最適化フレームワークまたは強化学習フレームワークのいずれかを用いて、ハイパーパラメータを調整するまたは予め選択された構築ブロックからネットワークアーキテクチャを構築する。最近のオートＭＬ－ゼロは、ヒトの知識および洞察力を排除し、ゼロから、完全に自動化された設計を行うための拡張を検討している。

しかしながら、探索空間の爆発的な増加によって、オートＭＬは、最良のハイパーパラメータを見つけるために多くの探索時間を必要とする。また、正当な理由付けがなければ、殆どのリンク接続の探索空間は、無意味となる。したがって、より系統的な探索方法を用いたニューラルネットワークの自動構築を行うためのシステムを開発する必要がある。

本開示は、ベイジアン（Bayesian）グラフ探索を用いた人工ニューラルネットワークの自動構築を行うためのシステムおよび方法に関する。具体的には、本発明のシステムは、オートベイズ（AutoBayes）と呼ばれる自動ベイジアン推論フレームワークを導入した。オートベイズは、分類器、エンコーダ、デコーダ、推定器および敵対的ネットワークブロックをリンクする異なるグラフィカルモデルを探索することによって、ニューサンス不変機械学習パイプラインを最適化する。また、オートベイズは、潜在変数を複数の断片に分割し、被験者／セッション変動およびタスクラベルに異なる関係を課す解きほぐされた表現（disentangled representation）を正当化することができる。このフレームワークは、訓練中に被験者およびクラスラベルにアクセスできる一連の生理データセットに適用され、変分モデリングおよび敵対的訓練を含む／含まない被験者転移学習を分析する能力を提供する。このフレームワークは、半教師ありマルチクラス分類、および異なるドメイン内のデータセットの再構築タスクにおいても有効に利用することができる。

本発明は、既存の先行技術に対して、以下の５つの重要且つ非自明な利点、すなわち、
ａ．オートベイズは、ＤＮＮブロックのハイパーパラメータを探索するのではなく、データに固有の潜在的なグラフィカルモデルを探索する利点、
ｂ．オートベイズは、探索されたベイジアングラフに基づいて、タスク分類器、特徴エンコーダ、デコーダ、ニューサンスインジケータおよび敵対的ネットワークに条件付き審査および敵対的審査を課すために複数のＤＮＮブロックを接続する方法の明確な理由を提供する利点、
ｃ．オートベイズは、ベイズボールアルゴリズムおよび順序付き因数分解を用いて、異なる推論モデルを探索するための系統的自動化フレームワークを提供する利点、
ｄ．このフレームワークは、複数の潜在表現および複数のニューサンス因子に適用するように拡張可能である利点、および
ｅ．オートベイズは、完全教師ありの訓練に加えて、半教師あり学習に適したいくつかの関連グラフィカルモデルを自動的に構築することができる利点を有する。

本開示のいくつかの実施形態は、オートベイズと呼ばれる新しい概念が、様々な異なるベイジアングラフモデルを探索することによって、ニューサンスロバストＨＭＩシステムに適した最良の推論戦略の探索を容易にするという認識に基づく。本発明の方法は、ベイズボールアルゴリズムを用いて、分類器、エンコーダ、デコーダ、ニューサンス推定器および敵対的ＤＮＮブロックの間に妥当なリンク接続を自動的に構築することができる。本発明者らは、実証実験解析として、様々な神経データセット／生理データセットに対するオートベイズの利益を実証する。本発明者らは、最良のグラフモデルと最悪のグラフモデルとの間の大きな性能ギャップを観察し、グラフ探索なしで１つの決定論的モデルを使用する場合、分類結果が潜在的に悪くなる可能性があることを暗示する。さらに、１つの生理データセットに対する最良のモデルが異なるデータに対して常に最良に機能するわけではないため、オートベイズを用いて、特定のデータセットに対する適応モデルを生成することを促す。一実施形態は、オートＭＬを統合するようにオートベイズフレームワークを拡張することによって、各ＤＮＮブロックのハイパーパラメータを最適化する。また、ランダム変数の数と共に可能なベイジアングラフの急激に増大する探索空間は、漸進的なエッジプルーニング／グラフティングの因子グラフに対する確率伝搬法分析によって解決される。

本発明によって、オートＭＬは、考慮すべき明確な理論的理由を有する潜在的なアーキテクチャを効率的に探索することができる。本発明の方法は、データセットが有向ベイジアングラフを用いて仮定的にモデル化されるという認識に基づいて実現されるため、オートベイズ法と呼ばれる。一実施形態は、同時確率分布の異なる因数分解次数を有するベイジアングラフ探索を使用する。また、本発明は、ベイジアングラフ仮説を介してベイズボールアルゴリズムから導出された条件付き非依存性に基づいて、プルーニングリンクを含むコンパクトなアーキテクチャを作成するための方法を提供する。さらに別の方法は、異なる尤度の因数分解順序を用いて、推論グラフを最適化することによって、生成グラフおよび推論グラフの結合を自動的に構築することができる。これは、条件付きリンクを含む／含まないＶＡＥに基づく自然なアーキテクチャを実現する。また、別の実施形態は、ニューサンスパラメータから独立した潜在変数に付随する敵対的ネットワークを用いた敵対的訓練を用いて、ニューサンスロバスト特徴の抽出を実現する。さらに別の場合では、条件付きグラフティングを用いた意図的に冗長なグラフを用いて、ニューサンスロバスト特徴の抽出を促進する。別の実施形態は、半教師あり設定に変分サンプリングを使用する。別の実施形態は、テンソル投影を用いて、１つのデータ構造を別の次元不整合のデータ構造に変換する方法を提供する。さらに別の実施形態は、複数の異なるベイジアングラフの推定値を組み合わせることによって性能を改善するアンサンブルグラフを使用する。一実施形態は、動的アテンションネットワークを用いてアンサンブル方法を実現する。また、ＶＡＥのサイクルの一貫性および異なる推論グラフのモデルの一貫性は、共同で対処される。別の実施形態は、グラフニューラルネットワークを用いてデータの幾何学情報を活用し、確率伝搬法を用いてベイジアングラフ全体のプルーニング戦略を支援することによって、関連性を検証する。また、各ＤＮＮブロックのハイパーパラメータは、オートベイズとオートＭＬを統合することによって調整される。発散の代わりに、ウォッサステイン距離（Wasserstein distance）を使用してもよい。

システムは、訓練データセットの複製によく適したベイジアングラフモデルに関連する最良の推論グラフモデルを検索するフレームワークを系統的に自動化するための方法を提供する。提案されたシステムは、データ、クラスラベル、被験者識別（ＩＤ）および固有の潜在表現に関して同時確率分布を因数分解することによって、様々な異なるベイジアングラフを自動的に定式化する。ベイジアングラフを仮定すると、いくつかの有意義な推論グラフが、高精度推定を達成するために冗長リンクをプルーニングするためのベイズボールアルゴリズムを介して生成される。被験者ＩＤなどのニューサンスパラメータに対するロバスト性を促進するために、探索されたベイジアングラフは、変分モデリングおよび潜在の解きほぐし（disentanglement）を含む／含まない敵対的訓練を使用する推論を提供することができる。１つの実施形態として、本発明者らは、オートベイズが様々な生理データセットにおいて優れた性能を達成できることを実証する。

本発明のさらなる理解を提供するために含まれる添付の図面は、本発明の実施形態を示し、説明と共に本発明の原理を説明する。

図１（ａ）～１（ｃ）は、本開示の実施形態に従って、潜在変数Ｚおよび半ラベル付きニューサンスＳに基づいて所定のデータＸを分類Ｙするための推論方法を示す図である。図２（ａ）～２（ｃ）は、本開示のいくつかの実施形態に従って、完全接続ベイジアングラフ、Ｚ－第１の因子分解推論モデル、およびＳ－第１の因子分解推論モデルに対応するベイジアンモデル（グラフ）、Ｚ－第１の推論、およびＳ－第１の推論を示す図である。図３（ａ）～３（ｋ）は、本開示のいくつかの実施形態に従って、自動探索に基づいたデータ生成モデルの例示的ベイジアングラフを示す図である。図４（ａ）～４（ｌ）は、本開示のいくつかの実施形態に従って、生成モデルＤ～Ｇ、ＪおよびＫに関連するＺ－第１の推論グラフモデルおよびＳ－第１の推論グラフモデルを示す図である。図５は、本開示のいくつかの実施形態に従って、生成モデルＫと推論モデルＫｚとをペアリングするための一般的なネットワーク構造を示す概略図である。図６Ａは、本開示の実施形態に従って、変分／非変分設定および敵対的／非敵対的設定における再構築損失、ニューサンス分類スコアおよびタスク分類スコアを示すデータセットの性能を示す図である。図６Ｂは、本開示の実施形態に従って、変分／非変分設定および敵対的／非敵対的設定における再構築損失、ニューサンス分類スコアおよびタスク分類スコアを示すデータセットの性能を示す図である。図６Ｃは、本開示の実施形態に従って、変分／非変分設定および敵対的／非敵対的設定における再構築損失、ニューサンス分類スコアおよびタスク分類スコアを示すデータセットの性能を示す図である。図７Ａは、本開示の実施形態に従って、最良の推論戦略がデータセットに大きく依存することを示すデータセットの性能を示す図である。図７Ｂは、本開示の実施形態に従って、最良の推論戦略がデータセットに大きく依存することを示すデータセットの性能を示す図である。図７Ｃは、本開示の実施形態に従って、最良の推論戦略がデータセットに大きく依存することを示すデータセットの性能を示す図である。図８（ａ）～８（ｊ）は、本開示の実施形態に従って、陰影付き条件付きノードを含むベイズボールアルゴリズムの基本規則を示す図である。図９は、本開示の実施形態に従って、オートベイズアルゴリズムの全体的な手順を説明する例示的なアルゴリズムを示す図である。図１０は、本開示の実施形態に従って、分類器、エンコーダ、デコーダ、推定器、および敵対者の例示的なＤＮＮブロックを示す図である。図１１は、本開示の実施形態に従って、プロセッサ、メモリおよびインターフェイスで構成されたシステムを示す概略図である。

以下、図面を参照しながら、本発明の様々な実施形態を説明する。なお、図面は、縮尺通りに描かれておらず、全ての図面において、同様の構造または機能を有する要素は、同様の参照番号によって示されている。また、図面は、本発明の特定の実施形態の説明を容易にすることを意図している。図面は、本発明の網羅的な説明としてまたは本発明の範囲に対する限定として意図されていない。さらに、本発明の特定の実施形態に関連して記載された特徴は、必ずしもその実施形態に限定されず、本発明の任意の他の実施形態において実施することができる。

図１（ａ）、１（ｂ）および１（ｃ）は、本開示の実施形態に従って、潜在変数Ｚおよび半ラベル付きニューサンス変量Ｓに基づいて所定のデータＸを分類Ｙするための推論方法を示す３つの分類器ネット（ａ）、（ｂ）および（ｃ）を示す概略図である。

本発明の方法論の核心は、データ特徴Ｘと、タスクラベルＹと、ニューサンス変量ラベルＳと、（可能な）潜在表現Ｚとを表すランダム変数の間の確率的関係を取得するグラフィカルベイズモデルを考察することである。最終的な目標は、測定されたデータ特徴ＸからタスクラベルＹを推測することである。この目標は、Ｓによって（部分的に）ラベルされたニューサンス変量（例えば、被験者間／セッション間の変量）の存在によって妨げられる。また、必要に応じて、これらのモデルに潜在表現Ｚ（および必要に応じてＺ_１、Ｚ_２、．．．、によってさらに示される）を導入することによって、Ｓ、ＸおよびＹとの間の基礎的関係を取得することを支援する。

図２（ａ）、２（ｂ）および２（ｃ）に示されたグラフィカルモデルは、潜在的に固有の非依存性の仮定をデータセットに与えないため、最も包括的である。しかしながら、生体信号の基礎的な非依存性に応じて、これらのグラフのいくつかのエッジをプルーニングすることができるかもしれない。例えば、データがＳおよびＺに独立したマルコフ連鎖Ｙ－Ｘを有する場合、ＸとＹとの間のリンクを除き、全てのリンクが合理的ではないため、図１（ａ）をもたらす。これは、高い自由度を有する最も複雑な推論モデルが、任意のデータセットに対して常に最良に機能するとは限らないことを意味する。これは、ハイパーパラメータ設計に加えて、データセットにマッチする推論因子グラフおよび対応するベイジアングラフモデルの最良対を自動的に探索する拡張オートＭＬフレームワークを検討する動機付けになる。

オートベイズは、まず、図２（ａ）の完全連鎖グラフのリンクを切断することによって、任意の潜在的ベイジアングラフを探索することによって、可能な非依存性を課す。次いで、各仮説ベイジアングラフに対してベイズボールアルゴリズムを採用して、異なる推論戦略に対する条件付き非依存性（例えば、図２（ｂ）完全連鎖Ｚ－第１の推論グラフおよび図２（ｃ）の完全連鎖Ｓ－第１の推論グラフ）を調べる。ベイズボールは、図２（ｂ）および２（ｃ）の完全連鎖推論グラフにおけるリンクの妥当なプルーニングを正当化し、およびＺがＳから独立している場合に潜在的な敵対的打ち切り（sensoring）を正当化する。このプロセスは、例えば、良好な推論で、推論ブロック、生成ブロックおよび敵対的ブロックの接続を自動的に構築することによって、図１（ｃ）の任意のモデルから図１（ｂ）のＡ－ＣＶＡＥ分類器を構築する。以下では、一般的な場合のシステム構成をより詳細に説明する前に、ベイジアングラフ探索のいくつかの実施形態を説明する。
ベイジアングラフ探索

特定のセンサ測定値、例えば、メディアデータ、物理データ、および生理データの場合、予め真の同時確率を知っていないため、１つの可能性のある生成モデルを仮定する。オートベイズは、測定分布にマッチングする任意の可能性のあるグラフモデルを探索することを目的とする。グラフィカルモデルの最大可能数がＹ、Ｓ、ＺおよびＸを含む４ノードケースに対してさえも巨大であるため、このようなベイジアングラフのいくつかの実施形態は、図３（ａ）～３（ｋ）に示される。各ベイジアングラフは、以下の同時確率因子分解の仮定に対応する（p(x|...)項は、Ｘの生成モデルを指定する）。

（３）
非依存性は、式（１）の完全連鎖ケースからスラッシュでキャンセルされた因子によって明示的に示される。いくつかの変数が条件付きで独立であり得るため、関連する推論戦略は、仮定されたベイジアングラフに応じて変動する。これによって、推論因子グラフ内のリンクをプルーニングすることができる。図４（ａ）～４（ｌ）に示すように、データセットに固有の各ベイジアングラフ仮説に基づいて、ベイズボールアルゴリズムによって、妥当な推論グラフモデルを自動的に生成することができる。具体的には、各モデルの条件付き確率p(y,s,z|x)は、以下のように求めることができる。

ベイジアングラフモデルＣ（被験者依存）
図３（ｃ）に示すように、データＸが被験者ＳおよびタスクＹに直接依存するケースをモデル化することができる。この場合、ベイズボールによる対応する推論モデルを検討することができる。

（４）

このモデルがＺに依存しないため、Ｚ－第１の推論戦略は、Ｓ－第１の推論戦略に減縮される。参考として、この差異を評価するために、追加の第１の推論戦略を検討する。

ベイジアングラフモデルＤ（潜在要約）
図３（ｄ）は、別のグラフィカルモデルを示している。この場合、潜在空間が他の全てのランダム変数を橋渡しする。ベイズボールは、以下のモデルを生成する。

（５）
そのグラフィカルモデルは、図４（ａ）および４（ｂ）にそれぞれ示される。

ベイジアングラフモデルＥ（タスク要約潜在）
図３（ｅ）は、潜在変数を含む別のグラフィカルモデルを示している。この場合、潜在空間は、Ｙのみを要約している。ベイズボールは、以下の推論モデルを生成する。

（６）
これらの推論モデルは、図４（ｃ）および４（ｄ）に示される。なお、生成モデルＥは、ＺおよびＳの間に最低限の依存性を有しないため、敵対的打ち切り（sensoring）を用いて、潜在空間Ｚ内のニューサンス情報Ｓを抑制する必要がある。また、Ｘの生成モデルがＺおよびＳの両方に依存するため、図１（ｂ）に示すＡ－ＣＶＡＥ分類器を使用することが妥当である。

ベイジアングラフモデルＦ（被験者要約潜在）
潜在変数が被験者情報Ｓを要約する図３（ｆ）を検討する。ベイズボールは、図４（ｅ）および４（ｆ）に示す推論グラフを提供する。これらの推論グラフは、以下の式にそれぞれ対応する。

（７）

ベイジアングラフモデルＧ
同時分布が図３（ｇ）のモデルＧに従うと仮定する場合、ベイズボールは、以下の推論モデルを生成する。

（８）
そのグラフィカルモデルは、図４（ｇ）および４（ｈ）に示される。なお、図４（ｈ）の推論モデルＧｓは、図４（ｂ）の推論モデルＤｓと同じである。図３（ｇ）および図３（ｄ）に示すように、推論グラフＧｓおよびＤｓが同じであっても、その生成モデルＸが異なる。具体的には、モデルＧのＶＡＥデコーダは、変動潜在空間Ｚと共にＳをフィードするため、ＣＶＡＥを使用することは、モデルＧに対して妥当であるが、モデルＤに対して妥当ではない。生成モデルのこの差異は、推論グラフのみが同一であるにもかかわらず、推論の性能に異なる影響を与える可能性がある。

ベイジアングラフモデルＨおよびＩ
図３（ｈ）および３（ｉ）に示される生成モデルＨおよびＩの両方は、ベイズボールで有用な条件付き非依存性が見つからないため、グラフがそれぞれ図２（ａ）～２（ｃ）に示される式（２）の完全連結推論戦略を有する。モデルＤｓおよびＧｓの関係と同様に、ベイジアングラフＨおよびＩの推論グラフは、同一であり得るが、その生成モデルＸは、図３（ｈ）および３（ｉ）に示すように異なる。

ベイジアングラフモデルＪ（解きほぐされた潜在：Disentangled Latent）
より多くの頂点を有するベイジアングラフを一般化するために、複数の潜在ベクトルをさらに検討する。図３（ｊ）および３（ｋ）に示すように、２つの潜在空間を有するグラフモデルの２つの実施形態に着目する。これらのモデルは、単一の潜在変数ＺがＳおよびＹにそれぞれ関連付けられる２つの部分Ｚ_１およびＺ_２に分離されることを除き、モデルＤと同じクラスである。図３（ｊ）のベイジアングラフの場合、ベイズボールは、以下の２つのモデルを含むいくつかの推論戦略を生成する。

（９）これらのモデルは、図４（ｉ）および（ｊ）に示される。なお、Ｚ_２がニューサンス変量Ｓにわずかしか依存しないため、被験者／セッション変動に対して敵対的訓練を使用すべきである。

ベイジアングラフモデルＫ（条件付き解きほぐされた潜在：Conditionally Disentangled Latent）
図３（ｋ）のＺ_１およびＺ_２を連結する別の修正モデルは、図４（ｋ）および４（ｌ）に示された以下の推論モデルを生成する。

（１０）
モデルＪとの主な違いは、この推論グラフがＺ_１およびＺ_２を用いてＹを推論することである。

ベイズボールアルゴリズム
本発明のシステムは、ベイズボールアルゴリズムに基づいて、条件付き非依存性を分析することによって、推論因子グラフ内のリンクの自動プルーニングを容易にする。図８に示すように、ベイズボールアルゴリズムは、１０個のルールのみを使用して、条件付き非依存性を特定する。特定の有向ベイジアングラフに対して、グラフ分離基準を適用することによって、他のノードに条件付けを与える２つの独立ノードセット間の条件付き非依存性を判断することができる。具体的には、ベイズボールが図８の停止矢印記号に当たることなく進むことができる場合、無指向性経路が起動される。いくつかの他の条件付きノードが陰影付けされているときに２つのノードセット間にアクティブパスが存在していない場合、これらのランダム変数セットは、条件付きで独立している。本発明は、ベイズボールアルゴリズムを用いて、オートベイズアルゴリズムに対する２つの独立ノードの非依存関係を特定するリストを生成する。

オートベイズアルゴリズム
図９は、本開示のいくつかの実施形態に従って、図３および４だけではないより包括的なケースに関し、アルゴリズム１の擬似コードに記載されたオートベイズアルゴリズムの一般的な手順を示す。オートベイズは、仮説ベイジアングラフ仮定に基づいて、ベイズボールアルゴリズムを用いて、非冗長推論因子グラフを自動的に構築する。得られた条件付き非依存性およびプルーニングされた因子グラフに応じて、エンコーダ、デコーダ、分類器、ニューサンス推定器および敵対者のＤＮＮブロックを合理的に接続する。全てのＤＮＮブロックは、変分ベイズ推論において、敵対的学習を用いて訓練される。なお、一実施形態として、各ＤＮＮブロックのハイパーパラメータは、オートベイズフレームワーク上のオートＭＬによってさらに最適化されてもよい。

本発明のシステムは、メモリバンクを用いて、ハイパーパラメータ、訓練可能な変数、中間ニューロン信号、ならびに順方向パス信号および逆方向パス勾配を含む仮演算値を記憶する。本発明のシステムは、冗長リンクをコンパクトにプルーニングするように、ベイズボールアルゴリズムに基づいて様々なベイジアングラフを探索することによって、ＤＮＮブロックを再構成する。オートベイズは、まず、ベイジアンモデルをデータセットと照合するためのいくつかの異なる基準に基づいて、完全連鎖有向ベイジアングラフを作成することによって、特定の置換順序で全てのノードを接続する。次いで、このシステムは、完全連鎖ベイジアングラフ内の特定の組み合わせのグラフエッジをプルーニングする。次に、ベイズボールアルゴリズムを用いて、２つの独立ノード間の条件付き独立関係をリストアップする。仮説された各ベイジアングラフについて、別の完全連鎖有向因子グラフが、データ信号Ｘと関連付けられたノードから構築され、異なる因子分解順序で他のノードを推論する。次いで、独立性リストに応じて、完全連鎖因子グラフ内の冗長リンクをプルーニングすることによって、ＤＮＮリンクをコンパクトにすることができる。別の実施形態では、冗長リンクを意図的に維持し、漸進的にグラフトする。プルーニングされたベイジアングラフおよびプルーニングされた因子グラフは、生成モデルおよび推論モデルが一致するように組み合わせられる。組み合わせられたグラフィカルモデルが与えられると、エンコーダ、デコーダ、分類器、推定器、および敵対的ネットワークの全てのＤＮＮブロックは、モデルに関連して関連付けられる。このオートベイズは、試験データセットの新しいデータドメインに転送され得るニューサンスロバスト推論を実現する。

オートベイズアルゴリズムは、４つを超えるノード因子に対して一般化することができる。このような実施形態の例として、ニューサンス変量Ｓはさらに、教師あり設定、半教師あり設定、および教師なし設定の組み合わせに従って、複数ドメイン側情報としての変量Ｓ_１、Ｓ_２、．．．、Ｓ_Ｎの複数の因子に分解される。実施形態の別の例では、潜在変数はさらに、解きほぐされた（disentangled）特徴ベクトルとしての潜在変数Ｚ_１、Ｚ_２、．．．、Ｚ_Ｌの複数の因子に分解される。図５は、このような実施形態の１つを示す。例えば、分解された因子を有する実施形態の場合、ニューサンス変量は、被験者識別、セッション番号、生体状態、環境状態、センサ状態、位置、向き、サンプリング率、時間および感度などの異なる因子にグループ化される。

一実施形態は、異なるグラフィカルモデルを探索する時に、性能を改善するために探索された全ての異なるモデルの出力を例えば加重和と共に使用して、アンサンブル性能を実現する。さらに別の実施形態は、最良の重みを学習する追加のＤＮＮブロックを使用して、異なるグラフィカルモデルを合併する。この実施形態は、アテンションネットワークを用いて、所定のデータに対して関連するグラフィカルモデルを適応的に選択することによって実現される。元の同時確率が同一であるため、この実施形態は、異なるグラフィカルモデル間のコンセンサス平衡を検討する。また、この実施形態は、エンコーダ／デコーダＤＮＮブロックのサイクル整合性を認識する。
実験評価を含む実施可能な実施例

例示的なデータセット
本発明者らは、以下のように、公的に入手可能な生理データセットおよびベンチマークＭＮＩＳＴに対するオートベイズの性能を実験的に実証する。

ＱＭＮＩＳＴは、ライタＩＤ番号を含む拡張ラベル情報を有するベンチマーク手書き数字画像ＭＮＩＳＴデータセットである。６万個の訓練サンプルのうち、２８×２８グレースケールピクセル画像から、｜Ｙ｜＝１０個の数字を分類するためのライタの数は、｜Ｓ｜＝５３９である。

ストレスは、神経学的ストレスレベルを考慮した生理データセットである。｜Ｓ｜＝２０人の被験者から得られた個別のストレス状態の数は、｜Ｙ｜＝４である。データは、３００個のサンプルの心拍数、皮膚電位、温度および動脈酸素レベルを含み、Ｃ＝７個のセンサを用いて記録された。

ＲＳＶＰは、迅速連続視覚提示（ＲＳＶＰ）眠気を示すＥＥＧデータである。Ｔ＝１２８個のサンプルのＣ＝１６個のチャネルの４１４００個のエポックの３セッションにおける被験者の数は、｜Ｓ｜＝１０である。感情誘発、休息状態、または運動画像／実行タスクのラベルの数は、｜Ｙ｜＝４である。

ＭＩは、PhysioNet ＥＥＧ運動イメージ（ＭＩ）データセットである。このデータセットは、｜Ｓ｜＝１０６人の被験者のＣ＝６４個のチャンネルのＴ＝４８０個のサンプルからなる。９０回の試験のＭＩタスクの種類は、｜Ｙ｜＝４である。

ＥｒｒＰは、ＥＥＧデータセットのエラー関連電位（ＥｒｒＰ）である。このデータは、スペルタスクに参加している｜Ｓ｜＝１６人の被験者からなり、３４０回の試験でＴ＝２５０個のサンプルのＣ＝５６個のチャネルから記録される。誤または正のフィードバックの２値ラベルの数は、｜Ｙ｜＝２である。

Ｎｉｎａｐｒｏは、１０人の被験者の義手の指動作を検出するためのＥＭＧデータセットである。被験者は、１２回の指動作を繰り返し、その動画がラップトップの画面上に示される。各動作の繰り返しが５秒間続き、その後３秒間の休息が続く。筋肉活動は、２００ＨｚのレートでＣ＝１６個の能動差動ワイヤレス電極を含む２つのＭｙｏアームバンド（Thalmic社製品）を用いて収集された。

上述した例示的なデータセットは、様々な異なるセンサモダリティ、具体的には、画像、脳波（ＥＥＧ）、筋電図（ＥＭＧ）、体温、心拍数などを含む。これらの例に加えて、本発明のシステムは、センサ測定値、例えば、ａ）画像、写真、映画、テキスト、文字、音声、音楽、オーディオ、スピーチなどのメディアデータと、ｂ）電波、光信号、電気パルス、温度、圧力、加速度、速度、振動、力などの物理データと、ｃ）心拍数、血圧、質量、湿度、脳波、筋電図、心電図、筋音図、眼電図、電気皮膚反応、脳磁図、および皮質電図などの生理データとの組み合わせを含む様々なデータセットに適用可能である。

モデル実装
各ＤＮＮブロックは、信号を層から層に順次に渡すように、訓練可能な変数と相互に接続されたニューロンノードを含む一組の層を指定するハイパーパラメータを用いて構成されている。訓練可能な変数は、確率的勾配降下、適応運動量、適応勾配、適応境界、ネステロフ加速勾配、および二乗平均平方根伝搬などの勾配法を用いて数値的に最適化される。勾配法は、ＤＮＮブロックの出力が、平均二乗誤差、交差エントロピー、構造類似度、負の対数尤度、絶対誤差、交差共分散、クラスタリング損失、発散、ヒンジ損失、ヒューバー損失、負のサンプリング、ワッサースタイン距離、およびトリプレット損失などのより小さい損失値を提供するように、訓練データを用いてＤＮＮブロックの訓練可能なパラメータを更新する。複数の損失関数は、訓練スケジュールポリシーに従って、いくつかの正則化係数でさらに重み付けられる。

いくつかの実施形態では、ＤＮＮブロックは、ハイパーパラメータに従って再構成可能である。したがって、ＤＮＮブロックは、完全接続層、畳み込み層、グラフ畳み込み層、リカレント層、ルーピー接続、スキップ接続、および調整済み線形変量、双曲線正接、シグモイド、ゲート線形、ソフトマックス、および閾値を含む一組の非線形アクティベーションを含むインセプション層の組み合わせで構成される。ＤＮＮブロックは、ドロップアウト、スワップアウト、ゾーンアウト、ブロックアウト、ドロップコネクト、ノイズ注入、シェイキングおよびバッチ正規化の組み合わせでさらに正則化される。さらに別の実施形態では、層パラメータは、調整可能なハイパーパラメータによって指定されたメモリのサイズを低減するためにさらに量子化される。

実施形態の１つの例として、全てのモデルは、０．００１という初期学習率を有するＡｄａｍオプティマイザを用いて、６４というミニバッチサイズで訓練された。学習率は、検証損失が頭打ちとなるたびに半分になる。４つの層を含むコンパクトな畳み込みニューラルネットワーク（ＣＮＮ）は、エンコーダネットワークＥとして採用され、Ｃ×Ｔ個のマルチチャネル生物医学データから特徴を抽出する。最初の３層は、長期、中期および短期の時間依存性を活用する１次元（Ｄ）時間畳み込みカーネルを有する。各時間畳み込みの後に、バッチの正規化および整流線形ユニット（ＲｅＬＵ）の活性化を行う。最終の畳み込み層は、全てのチャネルの１Ｄ空間畳み込みである。オートベイズは、ガウス事前確率に基づいて、決定論的潜在エンコーダまたは変分潜在エンコーダのいずれかを選択する。元のデータは、同じカーネル解像度の１Ｄ空間および時間転置畳み込みを適用するデコーダネットワークによって再構成されている。データは、訓練データ（７０％）および検証データ（３０％）に分けられる。全ての方法は、データ増強なしであり、データ正規化で初期化される。敵対的訓練が利用可能であるモデルの正則化パラメータλ_aは、０．０１に設定される。

図１０は、図５のＤＮＮモデルパラメータを示す図である。Ｃｏｎｖ（ｈ，ｗ）^ｃ _ｇは、グループｇのｃ個の出力チャネルに対してカーネルサイズ（ｈ，ｗ）を有する２Ｄ畳み込み層を示す。ＦＣ（ｈ）は、ｈ個の出力ノードを有する完全接続層を示す。ＢＮは、バッチ正規化を示す。２Ｄデータセットの場合、我々は、エンコーダおよびデコーダブロックに対して深層ＣＮＮを使用する。分類器、ニューサンス推定器、および敵対的ＤＮＮブロックに対して、我々は、隠れノードが入力次元から２倍にされた３つの層を有するマルチ層パーセプトロン（ＭＬＰ）を使用する。また、我々は、ＲｅＬＵ活性化に加えて、バッチ正規化（ＢＮ）を使用する。ストレスデータセットなどの表形式のデータについては、ＣＮＮは、比率０．２で、ＲｅＬＵ活性化およびドロップアウトを有する３層ＭＬＰに置換された。また、ＭＬＰ分類器は、２Ｄ入力次元の場合、例えばモデルＡにおいてＣＮＮに置換された。潜在次元の数は、６４個に選択された。２Ｄデータなどを例えばモデルＤｓ内のＣＮＮエンコーダに供給する必要がある場合、我々は、補間を用いて、２Ｄデータを追加のチャネル入力として連結する。リンク連結の別の実施形態では、システムは、次元毎に訓練可能な線形フィルタを有する多次元テンソル投影を用いて、次元的に不整合なリンクの低次元信号を高次元信号に変換する。

別の実施形態は、各ＤＮＮブロックのハイパーパラメータ探索および学習スケジューリングを行うために、オートＭＬをオートベイズに統合する。なお、オートベイズとオートＭＬを容易に統合することによって、個々のＤＮＮブロックの任意のハイパーパラメータを最適化することができる。より具体的には、システムは、強化学習、進化戦略、微分進化、粒子スワーム、遺伝的アルゴリズム、アニーリング、ベイジアン最適化、ハイパーバンド、および多目的ラマッキアン進化を用いて、異なる組み合わせの離散的なハイパーパラメータ値および継続的なハイパーパラメータ値を探索することによって、ハイパーパラメータを修正する。

また、本発明のシステムは、ＤＮＮブロックが新しい被験者などの新しいニューサンス変量を含む新しいデータセットに対してロバストであり得るように、いくつかの訓練可能な変数を解凍することによって訓練されたＤＮＮブロックを改良するポスト訓練ステップとして採用されるさらなる試験ステップを提供する。この実施形態は、ＨＭＩシステムの新しいユーザの較正時間を低減することができる。

結果
図６および７の結果は、最良の推論戦略がデータセットに大きく依存することを示唆している。具体的には、１つのデータセットに対する最良のモデルは、異なるデータセットに対して最良に機能しない。例えば、モデルＫｚは、ストレスデータセットに対して最良であったが、単純モデルＢは、ＥｒｒＰデータセットに対して最良であった。このことは、各標的データセットに対して、異なる推論戦略を適応的に検討すべきであることを示唆する。オートベイズは、このような適応的フレームワークを提供する。さらに、各データセットに対して、最良のモデルと最悪のモデルとの間の大きな性能差が観察された。例えば、モデルＤｚは、ＭＩデータセットに対して９３．１％のタスク精度を達成したが、モデルＥｓは、ＭＩデータセットに対して２５．５％のタスク精度を達成した。このことは、異なるモデルを探索しない場合、１つの特定のモデルが良好な性能を達成できない可能性があることを意味する。また、再構築損失は、グラフモデルを選択するための良好な指標ではない場合がある。一実施形態は、可能なグラフを効率的に探索するために、グラフニューラルネットワークを用いて因子グラフを関連付け、確率伝搬法を適用することによって、完全連鎖グラフからグラフエッジを漸進的にプルーニングする。具体的には、一組の訓練スケジュールは、学習レート、正則化重みおよび因数分解置換の適応制御と、確率伝搬法を用いて訓練データと検証データとの間の相違を測定することによってより低い優先度のリンクをプルーニングするためのポリシーとを含む。
敵対的訓練を用いた変分ベイズ推定

変分ＡＥ
オートベイズは、例えば、図３（ｅ）のモデルＥに潜在変数が含まれる場合、自動エンコーダアーキテクチャを自動的に構築することができる。この場合、Ｚが再構成Ｘおよび推論Ｙの限界を定めるための確率的ノードを表すため、ＶＡＥが必要とされる。バニラオートエンコーダとは対照的に、ＶＡＥは、潜在ｐ（ｚ）の限界分布を仮定することによって変分推論を使用する。変分法において、我々は、通常分散のような事前分布からＺを再パラメータ化することによって、限界を定める。また、我々は、ベイジアングラフモデルに応じて、条件付け変数として、Ｓに対して半教師ありの再パラメータ化（すなわち、Ｓに対する再構築損失を組み込むこと）を検討することができる。Ｙおよび／またはＳに対する条件付けは、グラフィカルモデル仮定との整合性に依存する。ＶＡＥは、ＣＶＡＥの特例であるため、以下、より一般的なＣＶＡＥをさらに詳細に説明する。

条件付きＶＡＥ
ベイジアングラフにおいてＸがＺと共にＳまたはＹに直接依存する場合、オートベイズは、ＣＶＡＥアーキテクチャ、例えば、図３のモデルＥ／Ｆ／Ｇ／Ｈ／Ｉを生成する。これらの生成モデルに対して、デコーダＤＮＮは、ＳまたはＹを条件付きパラメータとして供給する必要がある。また、他のベイジアングラフに対して、第１の推論戦略は、ＣＶＡＥにおいて条件付きエンコーダ、例えば、潜在変数ＺがＳに依存する図４のモデルＤｓ／Ｅｓ／Ｆｓ／Ｇｓ／Ｊｓ／Ｋｓを必要とする。

さらに別の実施形態では、敵対的ＤＮＮブロックは、一組の潜在ベクトルがニューサンス変量の組み合わせに最小限に関係するように、勾配上昇および勾配下降の交互更新を用いて訓練可能な変数を学習するように構成されている。また、敵対的ＤＮＮブロックは、エンコーダＤＮＮブロックとデコーダＤＮＮブロックとの相違（サイクル整合性損失と呼ばれる）を最小限にするように構成されている。
半教師あり学習：カテゴリサンプリング

半教師あり学習を行うためのグラフモデル
被験者ＩＤまたはセッションＩＤなどのニューサンス値Ｓは、半教師あり方法を必要とする典型的な生理データセットに対して、特に新しいユーザとのＨＭＩシステム展開の試験段階に対して、常に利用可能であるとは限らない。いくつかのグラフィカルモデルは、このような半教師あり訓練によく適している。例えば、図３に示すベイジアングラフモデルのうち、モデルＣ／Ｅ／Ｇ／Ｉは、Ｘを再現するのにニューサンスＳを必要とする。Ｓの真のラベルが利用可能でない場合、デコーダＤＮＮの全ての可能なカテゴリに対してＳを限界化する必要がある。他のベイジアングラフであっても、図４の対応する推論因子グラフは、半教師あり設定にとって便利ではない場合がある。具体的には、モデルＥｚ／Ｆｚ／Ｊｚ／Ｋｚは、エンドノードにおいて推論Ｓを有するが、他の推論モデルは、推論Ｓを用いて他のパラメータを推論する。半教師あり設定においてＳが欠落しているかまたは未知である場合、中間ノードにおいてＳを有する推論グラフは、全ての可能なニューサンスカテゴリをサンプリングする必要があるため、不便である。例えば、図５に示すモデルＫｚは、Ｓの限界化を必要としないため、半教師ありデータセットに容易に適用可能である。

図１１は、本開示のいくつかの実施形態に従って、人工ニューラルネットワークアーキテクチャの自動構築を行うためのシステム５００の例を示すブロック図である。システム５００は、信号を送受信するように構成された一組のインターフェイスおよびデータリンク１０５と、少なくとも１つのプロセッサ１２０と、メモリ（または一組のメモリバンク）１３０と、記憶装置１４０とを含む。プロセッサ１２０は、メモリ１３０に接続され、記憶装置１４０に記憶されたコンピュータ実行可能なプログラムおよびアルゴリズムを実行する。一組のインターフェイスおよびデータリンク１０５は、ヒューマンマシンインターフェイス（ＨＭＩ）１１０およびネットワークインターフェイスコントローラ１５０を含んでもよい。プロセッサ１２０は、記憶装置１４０からコンピュータ実行可能なプログラムおよびアルゴリズムをアップロードするメモリ１３０に接続され、コンピュータ実行可能なプログラムおよびアルゴリズムを実行することができる。記憶装置１４０に記憶されたコンピュータ実行可能なプログラムおよびアルゴリズムは、再構成可能な深層ニューラルネットワーク（ＤＮＮ）１４１、ハイパーパラメータ１４２、スケジューリング基準１４３、順方向／逆方向データ１４４、一時キャッシュ１４５、ベイズボールアルゴリズム１４６、およびオートベイズアルゴリズム１４７であってもよい。

システム５００は、一組のインターフェイスおよびデータリンクを介して、信号を受信することができる。信号は、訓練データ、検証データおよび試験データからなるデータセットを含み、信号は、多次元信号Ｘ内の一組の乱数因子を含み、乱数因子の一部は、識別するタスクラベルＹと、ニューサンス変量Ｓとに関連付けられる。

場合によっては、再構成可能なＤＮＮブロック（ＤＮＮ）１４１の各々は、多次元信号Ｘを複数の潜在変数Ｚにエンコードすること、潜在変数Ｚをデコードすることによって多次元信号Ｘを再構築すること、タスクラベルＹを分類すること、ニューサンス変量Ｓを推定すること、ニューサンス変量Ｓを敵対的に推定すること、またはグラフィカルモデルを選択することのいずれかを行うように構成されている。この場合、メモリバンクは、ハイパーパラメータ、訓練可能な変数、中間ニューロン信号、ならびに順方向パス信号および逆方向パス勾配を含む仮演算値をさらに含む。

少なくとも１つのプロセッサ１２０は、インターフェイスおよびメモリバンク１３０に接続され、信号およびデータセットを再構成可能なＤＮＮブロック１４１に提供するように構成されている。また、少なくとも１つのプロセッサ１２０は、ベイズボールアルゴリズム１４６を用いてベイジアングラフ探索を実行して、ＤＮＮブロックを再構成することによって、メモリバンク１３０内のハイパーパラメータ１４０を修正し、冗長リンクをコンパクトにプルーニングするように構成されている。

システム５００は、ユーザの生理データを分析することによって、ヒューマンマシンインターフェイス（ＨＭＩ）の設計に適用することができる。システム５００は、ネットワーク１９０ならびに一組のインターフェイスおよびデータリンク１０５を介して、生理データ１９５Ｂをユーザの生理データとして受信することができる。いくつかの実施形態では、システム５００は、一組のセンサ１１１から脳波（ＥＥＧ）および筋電図（ＥＭＧ）をユーザの生理データとして受信することができる。

上述した本開示の実施形態は、多くの方法で実装されてもよい。例えば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実装されてもよい。ソフトウェアで実装される場合、ソフトウェアコードは、単一のコンピュータに設けられたまたは複数のコンピュータに分散されたことにも拘らず、任意の適切なプロセッサまたは一組のプロセッサ上で実行されてもよい。このようなプロセッサは、集積回路として実装されてもよい。１つの集積回路要素は、１つ以上のプロセッサを含むことができる。しかしながら、プロセッサは、任意の適切な回路で実装されてもよい。

また、本開示の実施形態は、一例として提供された方法として具現化されてもよい。本方法の一部として実行される動作は、任意の適切な方法で順序付けられてもよい。したがって、例示的な実施形態において順次に実行される動作とは異なる順序で動作を実行すること、一部の動作を同時に実行することを含み得る実施形態を構築することができる。

請求項において請求項要素を修飾するための順序用語、例えば第１、第２などの使用は、別の請求項要素に対する１つの請求項要素の優先順位、前後順位もしくは順序、または方法の動作を実行する時間順序を意味しておらず、単に請求項要素を区別するためのラベルとして使用され、（順序用語を使用することによって）特定の名前を有する１つの請求項要素と同じ名前を有する別の要素とを区別させる。

好ましい実施形態を参照して本発明を説明したが、理解すべきことは、本発明の精神および範囲内で、様々な他の改造および修正を行うことができることである。

したがって、添付の特許請求の範囲は、本発明の真の精神および範囲内にある全ての変形および修正を網羅する。

Claims

人工ニューラルネットワークアーキテクチャの自動構築を行うためのシステムであって、
信号を送受信するように構成された一組のインターフェイスおよびデータリンクを含み、前記信号は、訓練データ、検証データおよび試験データからなるデータセットを含み、前記信号は、センサ測定値の組み合わせを含み、多次元信号Ｘ内の一組の乱数因子をさらに含み、前記乱数因子の一部は、識別するタスクラベルＹとニューサンス変量Ｓとに関連付けられ、
一組の再構成可能な深層ニューラルネットワーク（ＤＮＮ）ブロックを記憶するための一組のメモリバンクを含み、前記再構成可能なＤＮＮブロックは、前記多次元信号Ｘを複数の潜在変数Ｚにエンコードすること、前記潜在変数Ｚをデコードすることによって前記多次元信号Ｘを再構築すること、前記タスクラベルＹを分類すること、前記ニューサンス変量Ｓを推定すること、前記ニューサンス変量Ｓを敵対的に推定すること、またはグラフィカルモデルを選択することのいずれかを行うように構成され、前記メモリバンクは、ハイパーパラメータ、訓練可能な変数、中間ニューロン信号、ならびに順方向パス信号および逆方向パス勾配を含む仮演算値をさらに含み、
前記インターフェイスおよび前記メモリバンクに接続され、前記信号および前記データセットを前記再構成可能なＤＮＮブロックに提出するように構成された少なくとも１つのプロセッサを含み、前記少なくとも１つのプロセッサは、ベイズボールアルゴリズムを用いてベイジアングラフ探索を実行し、前記ＤＮＮブロックを再構成することによって、前記メモリバンク内の前記ハイパーパラメータを修正し、冗長リンクをコンパクトにプルーニングするように構成されている、システム。
前記少なくとも１つのプロセッサは、
一組の訓練スケジュールと、前記再構成可能なＤＮＮブロックの一組の内部層と、前記データセットの基礎をなす一組の基準とを指定するように、前記ハイパーパラメータを修正するステップと、
前記一組の基準に従って、複数のノードをグラフエッジにリンクし、前記多次元信号Ｘ、前記タスクラベルＹ、前記ニューサンス変量Ｓおよび前記潜在変数Ｚに対して、特定の置換順序でグラフノードを前記乱数因子に関連付けるように構成された完全連鎖有向ベイジアングラフを作成するステップと、
前記データセットの確率挙動を表す仮説ベイジアングラフモデルを指定する前記一組の基準に従って、置換された完全連鎖ベイジアングラフ内のグラフエッジの特定の組み合わせをプルーニングするステップと、
前記ベイズボールアルゴリズムを用いて、プルーニングされたベイジアングラフ内の２つの独立ノード間の条件付き非依存性関係をリストするステップと、
他のノードを推論するために、データ信号Ｘに関連付けられたノードに由来する別の完全連鎖有向因子グラフを作成するステップと、
ノード接続をコンパクトにするように、非依存性リストに従って、完全連鎖因子グラフ内の冗長リンクをプルーニングするステップと、
生成モデルと推論モデルとが一致するように、仮説グラフモデルに従って、プルーニングされたベイジアングラフとプルーニングされた因子グラフとを合併するステップと、
敵対的再構成可能なＤＮＮブロックを、前記非依存性リスト内の前記ニューサンス変量Ｓの一部に非依存である一部の潜在ノードＺに取り付けるステップと、
合併された因子グラフによって指定されたリンク接続に従って、フィードすべき複数のデータを連結する複数のリンクを、エンコーダ、デコーダ、ニューサンス推定器およびタスク分類器の他の前記再構成可能なＤＮＮブロックに割り当てるステップと、
指定された訓練スケジュールに従って、変分サンプリングおよび勾配法を用いて、エンコード、デコード、推定、分類、敵対的推定およびモデル選択を行うために、接続されたＤＮＮブロックを用いて構築された前記再構成可能なＤＮＮブロックの全てを訓練するステップと、
前記検証データに対する前記再構成可能なＤＮＮブロックの全ての出力に基づいて、モデルセレクタＤＮＮを用いて、グラフモデルを選択するステップと、
指定されたスケジュールに従って、上記の実行を繰り返すステップと、
前記試験データおよびニューサンスロバスト性で転送されるオンザフライの新しい着信データに対して、訓練された再構成可能なＤＮＮブロックを試験するステップとを実行する、請求項１に記載のシステム。
前記変分サンプリングは、乱数発生器およびソフトマックス温度に基づいて、ニアワンホットベクトルを生成するためのガンベルソフトマックストリックを用いて、パラメータ化トリックの事前分布としての等尺性正規分布を有する前記潜在変数、および未知のニューサンス変量およびタスクラベルを有するカテゴリ変数を得るために採用される、請求項２に記載のシステム。
リンク連結は、複数の訓練可能な線形フィルタを含む多次元テンソル投影を用いて、次元不整合リンクの低次元信号を変換するステップをさらに含む、請求項２に記載のシステム。
前記モデル選択は、エンコーダ／デコーダＤＮＮブロックのモデルコンセンサス、注目メカニズムおよびサイクル整合性を考慮するモデルセレクタＤＮＮブロックに従って、重み付きアンサンブル和を用いて、仮説グラフィカルモデルの複数の出力を選出するステップをさらに含み、請求項２に記載のシステム。
前記再構成可能なＤＮＮブロックは、完全接続層、畳み込み層、グラフ畳み込み層、リカレント層、ルーピー接続、スキップ接続、および調整済み線形変量、双曲線正接、シグモイド、ゲート線形、ソフトマックス、および閾値を含む一組の非線形アクティベーションを含むインセプション層の組み合わせで構成され、ドロップアウト、スワップアウト、ゾーンアウト、ブロックアウト、ドロップコネクト、ノイズ注入、シェイキングおよびバッチ正規化の組み合わせで正則化され、
層パラメータは、前記プロセッサによって調整される複数のハイパーパラメータによって指定されたメモリのサイズを低減するためにさらに量子化される、請求項１に記載のシステム。
前記訓練は、前記再構成可能なＤＮＮブロックの出力が目的関数の組み合わせの中でより小さい損失値を提供するように、前記訓練データを用いて前記再構成可能なＤＮＮブロックの前記訓練可能なパラメータを更新し、
前記目的関数は、平均二乗誤差、交差エントロピー、構造類似度、負の対数尤度、絶対誤差、交差共分散、クラスタリング損失、発散、ヒンジ損失、ヒューバー損失、負のサンプリング、ワッサースタイン距離、およびトリプレット損失の組み合わせをさらに含み、
損失関数は、前記指定された訓練スケジュールに従って調整された複数の正則化係数を用いて、重み付けられる、請求項２に記載のシステム。
前記勾配法は、確率的勾配降下、適応運動量、適応勾配、適応境界、ネステロフ加速勾配、および二乗平均平方根伝搬の組み合わせを採用して、前記再構成可能なＤＮＮブロックの前記訓練可能なパラメータを最適化する、請求項２に記載のシステム。
前記データセットは、センサ測定値の組み合わせを含み、
前記センサ測定値は、
画像、写真、映画、テキスト、文字、音声、音楽、オーディオ、スピーチなどのメディアデータと、
電波、光信号、電気パルス、温度、圧力、加速度、速度、振動、力などの物理データと、
心拍数、血圧、質量、湿度、脳波、筋電図、心電図、筋音図、眼電図、電気皮膚反応、脳磁図、および皮質電図などの生理データとをさらに含む、請求項１に記載のシステム。
前記ニューサンス変量は、被験者識別、セッション番号、生体状態、環境状態、センサ状態、位置、向き、サンプリング率、時間および感度などの異なる因子にグループ化される、請求項１に記載のシステム。
前記再構成可能なＤＮＮブロックの各々は、一組の人工ニューロンノードを有する一組の層を指定するハイパーパラメータをさらに含み、
隣接する層からの一対の前記ニューロンノードは、複数の訓練可能な変数および活性化関数に相互に接続され、前の層からの信号を次の層に順次に渡す、請求項１に記載のシステム。
前記ニューサンス変量Ｓは、教師あり設定、半教師あり設定、および教師なし設定の組み合わせに従って、複数のドメイン側情報として複数の変量因子Ｓ１、Ｓ２、ＳＮにさらに分解され、
前記潜在変数は、解きほぐされた特徴ベクトルとして複数の潜在変数因子Ｚ１、Ｚ２、・・・、ＺＬにさらに分解される、請求項１に記載のシステム。
前記ハイパーパラメータを修正することは、強化学習、進化戦略、微分進化、粒子スワーム、遺伝的アルゴリズム、アニーリング、ベイジアン最適化、ハイパーバンド、および多目的ラマッキアン進化の組み合わせを用いて、異なる組み合わせの離散的なハイパーパラメータ値および継続的なハイパーパラメータ値を探索する、請求項２に記載のシステム。
前記試験するステップは、前記再構成可能なＤＮＮブロックが新しいニューサンス変量を含む新しいデータセットに適応するように、前記訓練可能な変数の組み合わせを解凍することによって、前記訓練された再構成可能なＤＮＮブロックを改良するためのポスト訓練ステップをさらに含む、請求項２に記載のシステム。
前記敵対的再構成可能なＤＮＮブロックは、一組の潜在ベクトルが前記ニューサンス変量の組み合わせに最小限に関係するように、勾配上昇および勾配下降の交互更新を用いて前記訓練可能な変数を学習するように構成され、
前記敵対的再構成可能なＤＮＮブロックはさらに、エンコーダＤＮＮブロックとデコーダＤＮＮブロックとの相違を最小限にするように構成されている、請求項２に記載のシステム。
前記一組の訓練スケジュールは、学習レート、正則化重み、因数分解置換および前記訓練データと前記検証データとの間の相違を測定する確率伝搬法を用いてより低い優先度のリンクをプルーニングするためのポリシーの適応制御を含む、請求項２に記載のシステム。