JP2023501198A

JP2023501198A - 証明可能ロバストな深層生成モデルを用いたシステム及び方法

Info

Publication number: JP2023501198A
Application number: JP2022525134A
Authority: JP
Inventors: ジーグコルタージェレミー; カブリタコンデッサフィリペ
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2019-10-28
Filing date: 2020-10-20
Publication date: 2023-01-18
Anticipated expiration: 2040-10-20
Also published as: US11657290B2; JP7295338B2; KR20220083833A; CN114586046A; DE112020003343T5; WO2021083731A1; US20210125107A1

Abstract

機械学習システムは、エンコーダネットワーク及びデコーダネットワークを含む。機械学習システムは、センサデータと許容可能摂動のｌｐノルム球体の半径とを含む入力データを取得するように構成されている。入力データに基づいて入力バウンディングデータが生成される。入力バウンディングデータをエンコーダネットワークの第１及び第２の出力にそれぞれ伝播させることにより、第１のバウンディングデータ及び第２のバウンディングデータが生成される。第１のバウンディングデータと第２のバウンディングデータとに基づき、潜在変数に関連づけられて第３のバウンディングデータが生成される。第３のバウンディングデータをデコーダネットワークの出力に伝播させることにより、第４のバウンディングデータが生成される。第１、第２、第３及び第４のバウンディングデータに基づきエビデンス下限の下限を生成することによって、入力データに関してロバストネス認証が確立される。許容可能摂動に対する防御に関して機械学習システムにロバストネスをもたらすロバストネス認証に基づき、エンコーダネットワーク及びデコーダネットワークが更新される。

Description

本開示は、概して機械学習システムに関するものであり、より具体的には、敵対的攻撃に対してロバストな深層生成モデルに関する。

背景
一般に、深層ニューラルネットワークのような機械学習システムは、敵対的攻撃の影響を受け易い。一例として、機械学習システムはその入力を介して攻撃される可能性がある。かかる敵対的攻撃には入力に対する摂動が含まれ、これによって、機械学習システムの出力に変化が引き起こされる。例えば、敵対的攻撃がセンサデータに関係する場合には、センサデータに対する摂動により、機械学習システムは、例えば、誤った出力データを供給することによって、望ましくない挙動を示すおそれがあり、それにより、不利な結果及び作用が引き起こされる。分類という状況において、及び、それよりも少数ではあるが、物体検出又はイメージセグメンテーションといった他の教師あり学習という状況において、敵対的攻撃に関係する研究がいくつか存在する一方、敵対的攻撃に対する防御ソリューションを備えた生成モデルを提供することに関しては、多くの研究が存在しているようには思われない。

概要
以下は、後で詳細に説明する特定の実施形態の概要である。説明される態様は、これらの特定の実施形態の簡単な概要を読み手に提供するために提示されるものに過ぎず、これらの態様の説明は、本開示の範囲を限定することを意図したものではない。実際に、本開示は、以下において明示的には記載されないことがある種々の態様を包含し得るものである。

少なくとも１つの態様によれば、コンピュータ実装による方法は、入力データを取得するステップを含む。入力データは、センサデータと許容可能摂動のｌ_ｐノルム球体の半径とを含む。この方法は、入力データに基づいて入力バウンディングデータを生成するステップを含む。この方法は、入力バウンディングデータをエンコーダネットワークの第１及び第２の出力に伝播させることにより、第１のバウンディングデータ及び第２のバウンディングデータを生成するステップを含む。この方法は、潜在変数に関連づけられかつエンコーダネットワークの出力に基づく、第３のバウンディングデータを生成するステップを含む。この方法は、第３のバウンディングデータをデコーダネットワークの出力に伝播させることにより、第４のバウンディングデータを生成するステップを含む。この方法は、第１のバウンディングデータ、第２のバウンディングデータ、第３のバウンディングデータ及び第４のバウンディングデータに基づき、エビデンス下限（ＥＬＢＯ）の下限を生成することによって、入力データに関してロバストネス認証を確立するステップを含む。この方法は、エンコーダネットワーク及びデコーダネットワークを含む機械学習システムが、許容可能摂動に対する防御に関してロバストであるように、ロバストネス認証に基づきエンコーダネットワーク及びデコーダネットワークを更新するステップを含む。

少なくとも１つの態様によれば、システムは、アクチュエータ、センサシステム、非一時的コンピュータ可読媒体及び制御システムを含む。センサシステムは、少なくとも１つのセンサを含む。非一時的コンピュータ可読媒体は、機械学習システムの損失関数の下限を設定するロバストネス認証に基づきトレーニングされたエンコーダネットワーク及びデコーダネットワークを有する機械学習システムを格納している。制御システムは、センサシステム及び機械学習システムとの通信に基づきアクチュエータを制御するように動作可能である。制御システムは、少なくとも１つの電子プロセッサを含み、この電子プロセッサは、センサシステムからのセンサデータと摂動からの摂動データとを含む入力データを取得するように動作可能であり、ここで、センサデータは、摂動データによって摂動されている。機械学習システムを介して入力データが処理される。機械学習システムを介して出力データが生成される。出力データは、センサデータの再構成体である。出力データは、摂動データによって摂動されない尤度に関連づけられている。尤度は、ＥＬＢＯに対応する。センサデータ及び出力データは、機械学習システムに関連づけられたモデル分布に対応する分布内データである。機械学習システムは、たとえ摂動データが、入力データをモデル分布から外れた分布外データであると機械学習システムに識別させて処理させるように構成されていたとしても、入力データを分布内データの範囲内にあるものとして識別して処理する。

少なくとも１つの態様によれば、非一時的コンピュータ可読媒体は少なくともコンピュータ可読データを含み、このコンピュータ可読データは、電子プロセッサによって実行されるときに、摂動に対してロバストであるように機械学習システムをトレーニングするための方法を実施するために実行可能である。この方法は、センサデータと許容可能摂動のｌ_ｐノルム球体の半径とを含む入力データを取得するステップを含む。この方法は、入力データに基づいて入力バウンディングデータを生成するステップを含む。この方法は、入力バウンディングデータをエンコーダネットワークの第１及び第２の出力に伝播させることにより、第１のバウンディングデータ及び第２のバウンディングデータを生成するステップを含む。この方法は、潜在変数に関連づけられかつエンコーダネットワークの出力に基づく、第３のバウンディングデータを生成するステップを含む。この方法は、第３のバウンディングデータをデコーダネットワークの出力に伝播させることにより、第４のバウンディングデータを生成するステップを含む。この方法は、第１のバウンディングデータ、第２のバウンディングデータ、第３のバウンディングデータ及び第４のバウンディングデータに基づき、エビデンス下限（ＥＬＢＯ）の下限を生成することによって、入力データに関してロバストネス認証を確立するステップを含む。この方法は、エンコーダネットワーク及びデコーダネットワークを含む機械学習システムが、許容可能摂動に対する防御に関してロバストであるように、ロバストネス認証に基づきエンコーダネットワーク及びデコーダネットワークを更新するステップを含む。

本発明のこれらの及びその他の特徴、態様及び利点について、以下の詳細な説明において図面を参照しながら論じるが、それらの図面全体を通して、同種の参照符号は、類似の又は同種の部分を表す。

本開示の１つの例示的な実施形態による、機械学習システムを含むシステムを示す図である。本開示の１つの例示的な実施形態による、移動機械技術に関する図１Ａのシステムの１つの実施例を示す図である。本開示の１つの例示的な実施形態による、製造技術に関する図１Ａのシステムの１つの実施例を示す図である。本開示の１つの例示的な実施形態による、証明可能ロバストな深層生成モデルのトレーニングに関するフローチャートである。本開示の１つの例示的な実施形態による、トレーニングされた図２Ａの証明可能ロバストな深層生成モデルの動作に関するフローチャートである。本開示の１つの例示的な実施形態による、証明可能ロバストな深層生成モデルのトレーニングに関するブロック図である。本開示の例示的な実施形態による、変分オートエンコーダを含む証明可能ロバストな深層生成モデルのトレーニングについての概念図である。本開示の１つの例示的な実施形態による、証明可能ロバストな深層生成モデルのトレーニング方法についてのフローチャートである。本開示の１つの例示的な実施形態による入力データの非限定的な実施例を示す図である。本開示の１つの例示的な実施形態による入力データの非限定的な実施例を示す図である。本開示の１つの例示的な実施形態による入力データの非限定的な実施例を示す図である。本開示の１つの例示的な実施形態による入力データの非限定的な実施例を示す図である。１つの例示的な実施形態による、種々の生成モデルに関して第１のデータセットに対する敵対的攻撃の作用を表したグラフを示す図である。１つの例示的な実施形態による、種々の生成モデルに関して第２のデータセットに対する敵対的攻撃の作用を表したグラフを示す図である。

詳細な説明
例示として図示され説明された本明細書に記載の実施形態及びそれらの実施形態の利点の多くは、これまでの説明によって理解されるであろうし、開示された保護対象から逸脱することなく又はその利点の１つ若しくは複数を犠牲にすることなく、構成要素の形態、構造及び配置について種々の変更をなし得る、ということが明確になるであろう。実際にこれらの実施形態の記載された形態は、説明のためのものであるに過ぎない。これらの実施形態について種々の変形及び代替形態を受け容れる余地があり、本明細書に続く特許請求の範囲は、かかる変更を網羅し包含するものであり、開示された特定の形態に限定されるものではなく、むしろ、本開示の着想及び範囲に合致するあらゆる変形、等価物及び代替を包含することが意図されている。

本明細書において説明するように、実施形態は、生成モデルというコンテキストにおける証明可能ロバストなトレーニングの適用に関する。より具体的には実施形態は、教師ありの分類タスクではなく、教師なしの生成モデルというコンテキストにおける損失関数に関係する証明可能境界を構築するものである。１つの実施形態によれば、例えば、証明可能ロバストなトレーニングは、変分オートエンコーダ（ＶＡＥ）などのような少なくとも１つの生成モデルに関する。これに関して、正真正銘にロバストな下限が、尤度の変分下限に対して定義され、次いで、この下限が、証明可能ロバストなＶＡＥ（“ｐｒｏＶＡＥ”）を生成するために、トレーニング中に最適化される。同様に、これらの証明可能ロバストな生成モデルは、敵対的攻撃（例えば、生成モデルのもとでそれらの尤度を劇的に低下させるように入力を摂動しようと試みる敵対者）に対して、複数の生成モデルから成る制御グループに比較してかなりロバストである、と評価される。

図１Ａには、１つの例示的な実施形態によるシステム１００のブロック図が示されている。システム１００は、１つ又は複数のセンサを備えたセンサシステム１１０を含む。例えば、センサシステム１１０は、イメージセンサ、カメラ、レーダセンサ、光検出及び測距（ＬＩＤＡＲ）センサ、サーマルセンサ、超音波センサ、赤外線センサ、モーションセンサ、衛星に基づくナビゲーションセンサ（例えば、全地球測位システム（ＧＰＳ）センサ）、任意の適当なセンサ又はこれらの任意の組合せを含む。センサシステム１１０は、制御システム１２０と通信するように動作可能である。

制御システム１２０は、センサシステム１１０の１つ又は複数のセンサから直接又は間接的にセンサデータを取得するように構成されている。入力データ（例えば、センサデータ及び／又はセンサデータに基づくイメージデータ）を受信すると、制御システム１２０は、処理システム１４０を介し機械学習システム２００と連携して、この入力データを処理するように構成されている。これに関連して、処理システム１４０は少なくとも１つのプロセッサを含む。例えば、処理システム１４０は、電子プロセッサ、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、マイクロプロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、任意の適当な処理技術又はこれらの任意の組合せを含む。この入力データの処理に基づき、処理システム１４０は、機械学習システム２００を介して出力データを生成するように動作可能である。付加的に又は選択的に、処理システム１４０は、機械学習システム２００の出力データを分類する分類データを生成するように動作可能である。同様に、処理システム１４０は、機械学習システム２００の分類データ及び／又は出力データに基づいて、アクチュエータシステム１７０に制御データを供給するように動作可能である。

１つの例示的な実施形態によれば、機械学習システム２００はメモリシステム１６０内に格納されている。１つの例示的な実施形態によれば、メモリシステム１６０は、少なくとも本明細書において開示される動作及び機能を可能にするために、種々のデータを格納し、それらのデータへのアクセスを提供するように構成されたコンピュータ又は電子ストレージシステムである。１つの例示的な実施形態によれば、メモリシステム１６０は、単一のデバイス又は複数のデバイスを含む。１つの例示的な実施形態においては、メモリシステム１６０は、電気的、電子的、磁気的、光学的な技術、半導体技術、電磁的な技術又は任意の適当な技術を含み得る。例えば、１つの例示的な実施形態によれば、メモリシステム１６０は、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、フラッシュメモリ、ディスクドライブ、メモリカード、光学ストレージデバイス、磁気ストレージデバイス、メモリモジュール、任意の適当な種類のメモリデバイス又はこれらの任意の組合せを含み得る。１つの例示的な実施形態によれば、制御システム１２０及び／又は処理システム１４０から見て、メモリシステム１６０は、近距離若しくは遠距離に設けられており、又は、これらの組合せとして（例えば、一部は近距離に、一部は遠距離に）設けられている。例えば、メモリシステム１６０は、処理システム１４０から、及び／又は、制御システム１２０の他の構成要素から、遠距離に設けられた少なくとも１つのクラウドに基づくストレージシステム（例えば、クラウドに基づくデータベースシステム）を含み得る。

１つの例示的な実施形態によれば、機械学習システム２００は、少なくとも１つの深層ニューラルネットワークを含む。より具体的には、深層ニューラルネットワークは、少なくとも１つの証明可能ロバストなトレーニング済み生成モデル（“ＰＲＯＶＡＥ”）を含む。入力データに応答して、処理システム１４０は（機械学習システム２００と連携して）、入力データの再構成体である出力データを生成するように動作可能である。例えば、入力データがセンサデータ（及び／又はセンサデータに基づくイメージデータ）である場合、処理システム１４０は、機械学習システム２００を介して、センサデータの再構成体である出力データを生成するように動作可能である。他の例として、入力データが、摂動データによって摂動されたセンサデータ（及び／又はセンサデータに基づくイメージデータ）を含む場合、処理システム１４０は、機械学習システム２００を介して、センサデータの再構成体である出力データを生成するように動作可能であり、この場合、尤度作用は、摂動データによって破壊されない。機械学習システム２００のこの特徴は、かかる摂動データによっても機械学習システム２００の尤度作用及び／又は出力データにおいて劇的な変化を引き起こさないという点において、敵対的攻撃に対する防御ソリューションを提供する上で有利である。

これに加えて、システム１００は、センサシステム１１０及びアクチュエータシステム１７０に関係する制御システム１２０の動作に寄与する他の構成要素を含む。例えば、図１に示されているように、メモリシステム１６０は、同様に、システム１００の動作に関係する他の関連データを、このシステム１００の１つ又は複数の構成要素（例えば、センサシステム１１０、機械学習システム２００、アクチュエータシステム１７０等）に関連させて格納するように構成されている。これに加えて、制御システム１２０は入力／出力（Ｉ／Ｏ）システム１３０を含み、この入力／出力（Ｉ／Ｏ）システム１３０は、システム１００に関係する１つ又は複数のＩ／Ｏデバイスへの１つ又は複数のインタフェースを含む。同様に、制御システム１２０は、システム１００の機能を支援する又はそれに寄与する、任意の適当なハードウェア、ソフトウェア又はそれらの組合せなど、他の機能モジュール１５０を提供するように構成されている。例えば、他の機能モジュール１５０は、オペレーティングシステム及び通信技術を含み、この通信技術によってシステム１００の構成要素は、本明細書において説明するように互いに通信することができる。少なくとも図１Ａの実施例で説明した構成によれば、システム１００を種々の技術において適用することができる。

図１Ｂには、移動機械技術（例えば、ロボット等）に関するシステム１００の第１の用途の実施例が示されている。図１Ｂの場合、システム１００は、車両１０によって使用され、この車両１０において制御システム１２０は、センサシステム１１０からのセンサデータに従って、車両１０の少なくとも１つのアクチュエータシステム１７０を制御する。より具体的には、非限定的な実施例として、制御システム１２０は、センサシステム１１０からのセンサデータを使用して、エンティティ（例えば、物体）を識別するように構成されている。例えば、システム１００は、イメージセンサからイメージデータを取得すると、標識（例えば、停止標識）を識別するように構成されている。他の実施例として、システム１００は、イメージセンサ及びＬＩＤＡＲセンサから取得されたセンサデータに基づいて生成されたイメージデータから、歩行者を検出するように構成されている。これに関して、センサデータは、センサシステム１１０の１つ又は複数のセンサから生成及び／又は取得される。この実施例によれば、少なくともセンサデータ及び／又はイメージデータを受信すると、処理システム１４０は、機械学習システム２００を介して、センサデータ（及び／又はイメージデータ）がエンティティに関連した分布に基づき生成された及び／又は当該分布内にある、という尤度を高い値で推定すると、センサデータ（及び／又はイメージデータ）からエンティティを識別するように構成されている。有利には、ＰＲＯＶＡＥ２００Ａは、入力データ（例えば、センサデータ及び／又はイメージデータ）が摂動（例えば、ノイズ）によって摂動されたとしても、高い尤度値を推定するように構成されており、それによって、分布外の攻撃に対してロバストである。例えば、非限定的な実施例として、センサシステム１１０からのセンサデータを含む非摂動／摂動入力データを受信した場合に、処理システム１４０が機械学習システム２００を介して、（そのモデル分布内において）他の車両をエンティティとして識別したときは、制御システム１２０は、識別されたこの車両との衝突を回避するためにアクチュエータシステム１７０（例えば、ステアリングシステム、ブレーキングシステム又は任意の適当なアクチュエータシステム）を制御するように構成されている。この実施例によれば、アクチュエータシステム１７０は、自律的、高度に自律的、部分的に自律的、条件付きで自律的、又は、運転者支援された車両の運転機能を制御若しくは支援するように構成されている。

図１Ｃには、製造技術に関するシステム１００の第２の用途の実施例が示されている。図１Ｃの場合、システム１００は、製造システム２０によって使用され、この製造システム２０において制御システム１２０は、センサシステム１１０からのセンサデータに従って、製造機械２２の少なくとも１つのアクチュエータシステム１７０を制御する。より具体的には、非限定的な例として、制御システム１２０は、製品２４の欠陥のある構成要素のイメージの分布をモデリングすることによって、製品２４における故障を識別するように構成されている。このケースにおいては、ＰＲＯＶＡＥ２００Ａは、センサデータが比較的小さい（及び／又は知覚不可能な）摂動によって摂動されるケースであっても、製品２４の構成要素における欠陥又は故障を識別するように構成されている。例えば、摂動された入力データが製品２４の欠陥のある構成要素のイメージを含む場合には、処理システム１４０は、機械学習システム２００を介して、製品２４が欠陥であると識別し、摂動データによって意図されるように製品２４が欠陥ではないとは識別しないように構成されている。このケースでは、この摂動された入力データの処理に応答して、制御システム１２０は、欠陥製品を欠陥製品の分布に属するものとして分類するように構成されており、機械学習システム２００の出力及び／又は製品２４が欠陥製品２４の分布内にあるという分類に基づいて、アクチュエータシステム１７０を制御するように構成されている。この非限定的な実施例によれば、例えば、アクチュエータシステム１７０は、製品２４が欠陥であると識別することに基づいて、ロボット又は製造機械のアクションを制御するように構成されている。

第１の用途（図１Ｂ）及び第２の用途（図１Ｃ）に対して付加的に又は選択的に、システム１００（及び／又は制御システム１２０）は、他の用途においても同様に動作可能である。例えば、制御システム１２０は、これらのタイプの機械学習システム２００をトレーニングするために使用されるトレーニングデータを生成するように構成されている。さらに、システム１００（及び／又は制御システム１２０）は、同様に、コンピュータ制御機械、ロボット、家電製品、電動工具、電子パーソナルアシスタント、ヘルスケア／医療システム、移動機械、セキュリティシステム、シミュレーションシステム等といった種々の分野において適用可能である。さらに、システム１００（及び／又は制御システム１２０及び／又は機械学習システム２００）は、上述の用途に限定されるものではなく、摂動に対して証明可能ロバストな少なくとも１つのトレーニング済み生成モデルを備えた機械学習システム２００から利益を得る任意の適当な用途に適用可能である。

図２Ａには、１つの例示的な実施形態による、少なくとも１つの証明可能ロバストな生成モデル（例えば、ＰＲＯＶＡＥ２００Ａ）を生成するための、機械学習システム２００用のトレーニングプロセス２０４に関するフローチャートが示されている。図２Ａに示されているように、生成モデル（例えば、ＶＡＥ）は、トレーニングプロセス２０４（図４）を介して分布内データ２０２によってトレーニングされる。一例として、分布内データ２０２とは、生成モデルに関連したｘ∈Ｄの分布から選択又は取り出された入力データを指す。この特徴は、証明可能ロバストな生成モデルが、トレーニングプロセス２０４中に、他のタイプのトレーニングデータ（例えば、分布外データ、摂動データ、敵対的サンプル等）を必要としないため、有利である。分布内データ２０２によるトレーニングプロセス２０４が完了すると、証明可能ロバストなトレーニング済み生成モデル（例えば、ＰＲＯＶＡＥ２００Ａ）が生成され、動作の準備が整う。

図２Ｂには、１つの例示的な実施形態による、少なくとも１つの証明可能ロバストなトレーニング済み生成モデル（例えば、ＰＲＯＶＡＥ２００Ａ）を含む、機械学習システム２００の動作に関するフローチャートが示されている。このフローチャートによって、証明可能ロバストな生成モデルの利点が強調される。例えば、有利には、摂動データ２０８によって摂動された分布内データ２０２を含む入力データを受信すると、ＰＲＯＶＡＥ２００Ａは、この入力データが分布内データであると識別するように、さらに同様に、分布内データ２０２である出力データを生成するように、動作可能である。選択的に、図示されてはいないが、摂動データによって摂動されない分布内データ２０２を含む入力データを受信すると、分布内データ２０２である出力データを生成するように、ＰＲＯＶＡＥ２００Ａが構成されている。

図３Ａは、１つの例示的な実施形態による証明可能ロバストな深層生成モデルのトレーニングに関するブロック図である。図３Ａに示されているように、トレーニングプロセス２０４は、少なくともメモリシステム３００と処理システム３１０とを含む。１つの例示的な実施形態によれば、メモリシステム３００は、少なくとも本明細書において開示される動作及び機能を可能にするために、種々のデータを格納し、それらのデータへのアクセスを提供するように構成されたコンピュータ又は電子ストレージシステムである。１つの例示的な実施形態によれば、メモリシステム３００は、単一のデバイス又は複数のデバイスを含む。１つの例示的な実施形態においては、メモリシステム３００は、電気的、電子的、磁気的、光学的な技術、半導体技術、電磁的な技術又は任意の適当な技術を含む。例えば、メモリシステム３００は、ＲＡＭ、ＲＯＭ、フラッシュメモリ、ディスクドライブ、メモリカード、光学ストレージデバイス、磁気ストレージデバイス、メモリモジュール、任意の適当な種類のメモリデバイス又はこれらの任意の組合せを含む。１つの例示的な実施形態によれば、処理システム３１０から見て、メモリシステム３００は、近距離若しくは遠距離に設けられており、又は、これらの組合せとして（例えば、一部は近距離に、一部は遠距離に）設けられている。例えば、メモリシステム３００は、処理システム３１０から遠距離に設けられた少なくとも１つのクラウドに基づくストレージシステム（例えば、クラウドに基づくデータベースシステム）を含むように構成されている。

１つの例示的な実施形態によれば、図３Ａに示されているように、メモリシステム３００は、少なくとも、トレーニングデータ３０２と、機械学習データ３０４と、証明可能ロバストな生成モデル（“ＰＲＯＶＡＥ”）２００Ａとを含む。トレーニングデータ３０２は、少なくともセンサデータ（及び／又はセンサデータに基づくイメージデータ）を含む。有利には、トレーニングプロセス２０４は、入力データとして摂動を必要とせずに、許容可能摂動に対してトレーニングするように動作可能である。同様に、機械学習データ３０４は、ＰＲＯＶＡＥ２００Ａをトレーニング及び生成するための方法４００（図４）に関連した機械学習アルゴリズム、並びに、種々のバウンディングデータ（例えば、ベクトルデータ）、ロバストネス認証等といった他の関連データ３０４Ａ（図３Ｂ）を含む。ＰＲＯＶＡＥ２００Ａは、そのトレーニング及び／又は動作に関連したニューラルネットワークデータ（例えば、種々の層、パラメータデータ、ε_{ｔｒａｉｎ}データ等）を含む。トレーニングプロセス２０４が完了すると、ＰＲＯＶＡＥ２００Ａは、図１Ａのシステム１００又は任意の適当なアプリケーションによって配備可能及び／又は使用可能となる。

トレーニングデータ３０２（例えば、センサデータ及び／又はセンサデータに基づくイメージデータ）を受信すると、処理システム３１０は、機械学習データ３０４と連携して生成モデルをトレーニングするように構成されている。これに関連して、処理システム３１０は、少なくとも１つのプロセッサを含む。例えば、処理システム３１０は、電子プロセッサ、ＣＰＵ、ＧＰＵ、マイクロプロセッサ、ＦＰＧＡ、ＡＳＩＣ、任意の適当な処理技術又はこれらの任意の組合せを含む。１つの例示的な実施形態によれば、処理システム３１０は、トレーニングデータ３０２及び機械学習データ３０４に基づき、証明可能ロバストなトレーニング済み生成モデル（“ＰＲＯＶＡＥ”）２００Ａを生成するために、メモリシステム３００と通信する。

図３Ｂには、例示的な実施形態による、証明可能ロバストな生成モデル（例えば、ＰＲＯＶＡＥ２００Ａ）を生成するための生成モデル（例えば、ＶＡＥ）のトレーニングの概念図が示されている。一般的に、ＶＡＥは、エンコーダネットワークを有する少なくとも１つのエンコーダと、デコーダネットワークを有するデコーダとを含む。これに関して、エンコーダは、認識モデルを含むのに対し、デコーダは、生成モデルをそれぞれ含む。１つの例示的な実施形態によれば、少なくとも図３Ｂに示されているように、エンコーダ及びデコーダは、入力に対する摂動作用を伝播するために区間境界伝播（ＩＢＰ）技術を使用する。摂動作用は、ＶＡＥ全体に伝播する。同様に、便宜上、証明可能ロバストなトレーニングプロセスについて図４を参照しながら説明する際に役立つように、図３Ｂには、ＶＡＥのいくつかの構成要素（例えば、μ（ｘ）、σ（ｘ）、ｇ（ｚ）等）のマッピング、及び、ＶＡＥに関係する他の関連データ３０４Ａのいくつかの表現が示されている。同様に、図３Ｂには、センサデータｘ（例えば、手書きの数字「４」を含む入力イメージ３０４Ｂ）の例と、センサデータの再構成体である出力データ

（例えば、再構成された手書きの数字「４」を含む出力イメージ３０４Ｃ）の例とが示されている。入力イメージ３０４Ｂ及び出力イメージ３０４Ｃは、両方とも、分布内データとして識別される（又は「手書きの数字」の分布内において識別される）。

一般に、ＶＡＥは、対数尤度に対する境界に基づいてトレーニングされ、この場合、処理システム３１０は、敵対的な状況においてはさらにバウンディングするように構成されている。ＶＡＥは、いわゆるエビデンス下限（ＥＬＢＯ）Ｌ（ｘ）に基づいてトレーニングされ、このエビデンス下限は、確率ｐ（ｘ）を潜在変数ｚ∈Ｒ^ｋにより表し、次いで、尤度を

のようにバウンディングする。ここで、ｑ（ｚ│ｘ）は、いわゆる変分分布であり、これは、事後分布ｐ（ｚ│ｘ）を近似しようと試みるが（このケースにおいては、境界が狭い）、より扱い易い分布クラスを介してそれを行う。ＶＡＥの状況においては、処理システム３１０は、

を選択する。

ここで、μ_θ（ｘ）及び

は、入力ｘからの正規分布ｑの平均及び分散を予測するエンコーダネットワークであり、ｇ_θ（ｚ）は、潜在ベクトルｚであるときに入力空間においてサンプルを生成するデコーダネットワークである。

これらの前提の下で、ＥＬＢＯは、以下の明示的な形態を有する。即ち、

ここで、Ｃは、定数である。一般にエンコーダ及びデコーダのネットワークは、以下の式、即ち、

によって表される下限を最大化するように、協働してトレーニングされる。

例えば、確率的勾配降下法を使用し、ここで、処理システム３１０は、サンプリング手順ｚ～Ν（μ（ｘ）；σ^２（ｘ）Ｉ）を等価のプロセスｚ＝μ（ｘ）＋σ（ｘ）・ε～Ν（０，Ｉ）と置き換えて、サンプルを引き出し、平均及び分散の項をいわゆる再パラメータ化技術を介して逆伝播可能であることを保証する。

図４には、１つの例示的な実施形態による、証明可能ロバストな生成モデル（例えば、ＰＲＯＶＡＥ２００Ａ）を生成するためのトレーニングプロセス２０４の方法４００のフローチャートが示されている。この方法４００によれば、深層生成モデルへの分布外攻撃に対するロバストな防御を定式化する技術的問題についての解決手段が提供される。方法４００によれば、許容可能摂動についてＥＬＢＯの下限を設定する証明可能ロバストな深層生成モデル（例えば、ＰＲＯＶＡＥ２００Ａ）を取得することによって、かかる防御が達成される。より具体的には、方法４００は、Δε_{ｔｒａｉｎ}（ｘ）を許容可能摂動のセットとして識別し、ｘを中心にセンタリングされた半径ε_{ｔｒａｉｎ}の球体としてｌ_∞を識別する。本開示においては、表記の明瞭性のために、これらの用語Δε_{ｔｒａｉｎ}（ｘ）とΔ（ｘ）とが交換可能に使用される。

処理システム３１０は、考えられる全ての摂動δ∈Δ（ｘ）についてＥＬＢＯの下限を、Ｌ（ｘ）≦Ｌ（ｘ＋δ）≦ｌｏｇ（ｐ（ｘ＋δ））として取得するように構成されている。この下限によって、ＥＬＢＯのロバストネス認証が提供される。Δ（ｘ）における任意の可能な摂動のＥＬＢＯに対して及ぼされる作用は、Ｌによって下限が設定される。下限Ｌの最適化によって、Δ（ｘ）（ｘ周囲の半径ε_{ｔｒａｉｎ}のｌ_∞球体）内において考えられる限り最強の分布外攻撃に対してロバストであるように、ネットワークが効果的にトレーニングされる。

ＥＬＢＯの下限を設定する目的で、処理システム３１０は、μ_θ、σ_θ及びｇ_θの層にわたってＩＢＰを実施し、このようにすることにより、処理システム３１０は、ＥＬＢＯに関して入力空間における許容可能摂動の伝播についての境界を取得する。従って、処理システム３１０は、摂動された入力ＫＬ（ｑ（ｚ│ｘ＋δ）||ｐ（ｚ））のカルバックライブラー（ＫＬ）ダイバージェンスと、摂動された条件付き対数尤度

の期待値との両方をバウンディングするように構成されている。これを行うために、処理システム３１０は、エンコーダネットワークμ_θ及びδ_θにＩＢＰを実施し、かつ、デコーダネットワークｇ_θにＩＢＰを実施する。

方法４００に対する準備として、処理システム３１０は、エンコーダネットワーク及びデコーダネットワークの構成ブロックに下限及び上限を伝播する。一般に、構成ブロックは、少なくとも、線形層及び畳み込み層並びに要素ごとの単調活性化関数を含む。これらの特徴によって処理システム３１０は、深層ニューラルネットワーク（例えば、ＶＡＥ）の入力から出力まで、種々の区間境界を順次に接続することができる。本開示においては、表記の便宜及び明確性のために、μの上限は、

として表され、下限はμとして表され、これらは、多次元エンティティを扱う場合に要素ごとに考慮される。

線形演算子に関して、処理システム３１０は、Ｗｖを、ｖに適用される線形演算子Ｗとみなし、

を、ｖの要素ごとの上限及び下限とみなす。処理システム３１０は、線形演算子Ｗを正及び負の演算子Ｗ＝Ｗ_＋＋Ｗ_－に分解し、これにより、Ｗ_＋＝ｍａｘ（Ｗ，０）及びＷ_－＝ｍｉｎ（Ｗ，０）となるようにし、ここで、ｍａｘ及びｍｉｎは、要素ごとの最大値及び最小値に相当する。次いで、処理システム３１０は、線形演算子の上限及び下限をｖに適用する。より具体的には、処理システム３１０は、畳み込み層及び線形層を保持する上限（式７）及び下限（式８）を、それらの線形特性に基づき適用する。

単調関数に関して、処理システム３１０は、ｖ^ｔ－１に要素ごとに適用される単調（非減少又は非増加）関数としてｖ^ｔ＝ｈ（ｖ^ｔ－１）を表すように構成されている。処理システム３１０は、ｖ^ｔの上限及び下限をｈにより表現し、ｖ^ｔ－１の上限及び下限を以下のように表現する。即ち、

これらの境界は、ＲｅＬＵ及びシグモイドなどの単調活性化関数を保持する。

ｌ_２ノルム二乗に関して、処理システム３１０は、ｖの下限及び上限への要素ごとの依存性が存在することを認識することによって、ｖのｌ_２ノルム二乗の下限及び上限を取得するように構成されている。ここで、ｖ^ｉは、ｖのｉ番目の構成要素を表すとすると、

であるため、処理システム３１０は、

及びｖの関数として個々の上限及び下限を以下のように取得する。

準備が実施された後、処理システム３１０は、方法４００を実行して、例えば、少なくとも１つの対数尤度関数に関して、ワーストケースの摂動から取得されたロバストネス認証を最適化する。方法４００は、１回又は複数回の反復（又はエポック）を含む。このケースにおいては、各反復（又はエポック）は、境界伝播を通してロバストネス認証を計算すること（例えば、ステップ４０２～４１２）と、ロバストネス認証を最適化すること（例えば、ステップ４１４）とを含み、それによって、ロバストにトレーニングされたエンコーダ及びデコーダのネットワーク（例えば、ステップ４１６）がもたらされる。図４を参照すると、方法４００は、下記の記載において説明するように、少なくとも、以下の実施形態を含む。

ステップ４０２において、処理システム３１０は、入力ｘを取得し、この入力ｘにおいて少なくとも１つの境界を生成するように構成されている。例えば、入力ｘは、Ｘ＝｛ｘ_１，...，ｘ_ｎ｝のようなトレーニングデータを含み、ここで、

である。ｘ∈Ｘであるとすると、処理システム３１０は、入力ｘ_ｉに対する入力バウンディングデータを生成するように構成されている。入力バウンディングデータは、入力ｘ_ｉに対する上限データと、入力ｘ_ｉに対する下限データとを含む。

同様に、第１の符号化構成要素μ_θ（ｘ）及び第２の符号化構成要素σ_θ（ｘ）であるとすると、処理システム３１０は、エンコーダネットワークを、ＲｅＬＵ活性化を有する畳み込み層のシーケンスとなるように構築し、その際、少なくとも１つの最後の層は、少なくとも１つの全結合線形層である。これに加えて、入力ｘとしての摂動を必要とすることなく、処理システム３１０は、摂動データをδ∈Δε_{ｔｒａｉｎ}（ｘ_ｉ）として定義し、かつ、許容可能摂動入力の下限及び上限を以下のように表すことにより、任意の許容可能摂動入力ｘ_ｉ＋δを考慮するように、動作可能である。

ステップ４０４において、処理システム３１０は、エンコーダネットワークの出力の境界を生成するように構成されている。これらの境界は、ＶＡＥの第１のバウンディングデータ及び第２のバウンディングデータを含む。第１及び第２のバウンディングデータは、エンコーダの第１及び第２の符号化構成要素の個々の出力に関係する。より具体的には、処理システム３１０は、第１の符号化構成要素μ_θ（ｘ）の出力に対する第１の上限データと第１の下限データとを生成するように構成されている。これに加えて、処理システム３１０は、第２の符号化構成要素σ_θ（ｘ）の出力に対する第２の上限データと第２の下限データとを生成するように構成されている。処理システム３１０は、第２の符号化構成要素σ_θ（ｘ）の第２のバウンディングデータとは無関係に、第１の符号化構成要素μ_θ（ｘ）の第１のバウンディングデータを生成するように構成されている。これに関して、処理システム３１０は、第１のバウンディングデータと第２のバウンディングデータとを同時に又は異なる時点において生成するように構成されている。

式７乃至式８における線形層及び畳み込み層並びに式９乃至式１０における活性化関数のための区間境界伝播により、処理システム３１０は、エンコーダネットワークの出力をｘ _ｉ及び

のＩＢＰに基づきエンコーダネットワークの構成要素全体にわたり、

を介してバウンディングするように構成されている。

ここで、μ_ｉ＝μ_θ（ｘ_ｉ）及びσ_ｉ＝σ_θ（ｘ_ｉ）は、エンコーダの出力であり、μ _θ及び

並びにσ _θ及び

は、それぞれエンコーダネットワークの下限及び上限値の伝播に対応する。その結果、符号化構成要素μ_ｉ及びσ_ｉの出力に対する境界が得られ、同様に（対数及び指数は、単調非減少であるため）、摂動Δ（ｘ_ｉ）の大きさε_{ｔｒａｉｎ}の関数としてｌｏｇ σ_ｉが得られる。

エンコーダネットワークの出力に対して境界が与えられている場合には、処理システム３１０は、Ν（μ_ｉ，σ_ｉＩ）とΝ（０，Ｉ）との間のＫＬダイバージェンスを

を介してバウンディングするように構成されている。

ここで、

は、エンコーダによって出力されたｉ番目のサンプルの二乗平均及び共分散のｊ番目の構成要素を表す。これに加えて、処理システム３１０は、エンコーダネットワークの終端部分におけるμ_ｉ及びσ_ｉに対する境界から続けて、デコーダネットワークを介してＩＢＰを実施することができるように構成されている。

ステップ４０６において、処理システム３１０は、“ε”により表される少なくとも１つのサンプルを取り出し、“ｚ”により表される潜在変数に対する境界を計算するように構成されている。例えば、処理システム３１０は、再パラメータ化技術を介して潜在変数に対する境界（又はＶＡＥの第３のバウンディングデータ）を取得するように構成されている。より具体的には、再パラメータ化は線形演算子であるため、再パラメータ化技術を用いることによって、潜在変数に対する境界は、式７乃至式８における線形演算子に対する境界の結果から得られる。

例えば、処理システム３１０は、ε～Ν（０，１）、ε_＋＝ｍａｘ（ε，０）かつε_－＝ｍｉｎ（ε，０）によって表される１つのサンプルを、ε＝ε_＋＋ε_－＝となるよう処理するように構成されており、ここで、０は、平均を表し、Ｉは、共分散のための単位ベクトルを表す。この再パラメータ化技術は、潜伏変数をｚ_ｉ＝μ_ｉ＋σ_ｉεとして表現することによって、エンコーダからランダム性を切り離す。再パラメータ化技術を使用した後、処理システム３１０は、

として表される潜在変数ｚ_ｉをバウンディングする（例えば、第３のバウンディングデータを生成する）ように構成されている。

ステップ４０８において、処理システム３１０は、デコーダネットワークｇ_θ（ｘ）の出力に対する境界を生成するように構成されている。これに関して、処理システム３１０は、ＶＡＥの第４のバウンディングデータを生成するように構成されており、この第４のバウンディングデータは、デコーダネットワークｇ_θ（ｘ）の第４の上限データと第４の下限データとを含む。例えば、ステップ４０８の後、潜在変数（即ち、ｚ）に対する境界は、次いで、デコーダネットワークｇ_θを介して伝播され、このデコーダネットワークｇ_θは、ＲｅＬＵ活性化及びシグモイド活性化（例えば、単調活性化関数、この場合、式９乃至式１０により境界を伝播可能）を有する線形層及び畳み込み層（例えば、線形演算子、この場合、式７乃至式８により境界を伝播可能）を含む。従って、処理システム３１０は、エンコーダネットワークによる場合のように、潜在ベクトルｚ_ｉに対する境界の関数として、デコーダネットワークの出力に対する境界を供給するように構成されている。

これに加えて、処理システム３１０は、条件付き対数尤度ｌｏｇｐ（ｘ_ｉ｜ｚ_ｉ）をバウンディングする問題に対処する。このようにするために、処理システム３１０は、

における対角共分散σ_θＩを確定する。かくして処理システム３１０は、条件付き対数尤度のバウンディング問題を、バウンディング問題||ｘ_ｉ－ｇ_θ（ｚ_ｉ）||^２へと低減する。式１１乃至式１２を解くと、処理システム３１０は、

を介してこの関数をバウンディングするように構成されている。

ここで、処理システム３１０は、ｘの要素全体にわたりｊにおいて要素ごとの最大値及び最小値並びに合計を取り出すように構成されている。

ステップ４１０において、処理システム３１０は、損失関数として機能するＥＬＢＯＬに対する少なくとも１つの境界を生成することによって、ロバストネス認証を生成するように構成されている。より具体的には、処理システム３１０は、ＥＬＢＯに対して下限データを生成するように構成されている。例えば、ＥＬＢＯは、ＫＬダイバージェンスの負を考慮するので、処理システム３１０は、エンコーダネットワーク及びデコーダネットワークに対する上限及び下限と、条件付き対数尤度に対する関連した下限及びＫＬダイバージェンスに対する上限とを組み合わせ、それによって、以下の下限から下限データを取得する。

この場合、エンコーダネットワークに対する上限及び下限が伝播され、再パラメータ化技術は、以下のとおりである。

ＥＬＢＯに対して結果として得られた下限によって、摂動されたサンプルｌｏｇｐ（ｘ_ｉ＋δ）の対数尤度の下限が設定され、これは、摂動に関するロバストネス認証として機能する。このことが意味するのは、エンコーダに供給される入力区間境界がｘ_ｉ－ε_{ｔｒａｉｎ}１及びｘ_ｉ＋ε_{ｔｒａｉｎ}１（半径ε_{ｔｒａｉｎ}のｘ_ｉでセンタリングされたｌ_∞球体）であるとして、Ｌ≧αである場合には、このことにより全てのδ：||δ||_∞≦ε_{ｔｒａｉｎ}について、ｌｏｇｐ（ｘ＋δ）≧αであることが保証される、ということである。

方法４００は、下限を最適化することによってＶＡＥをトレーニングすることを含む。例えば、処理システム３１０は、ＥＬＢＯＬを直接最適化する代わりに、ロバストネス認証の最適化に対応して、ＥＬＢＯＬの下限を最適化することによって、証明可能ロバストな深層生成モデルをトレーニングする。

ステップ４１４において、処理システム３１０は、ＥＬＢＯの下限を最適化するように、エンコーダネットワーク及びデコーダネットワークを更新するように構成されている。例えば、処理システム３１０は、ＶＡＥのパラメータを更新し、ＥＬＢＯＬの下限値を直接最大化するように動作可能である。このケースにおいては、パラメータ（即ち、θ）は、少なくとも内部の重み付けを含み、これらの重み付けは、ＶＡＥのエンコーダネットワーク及びデコーダネットワークに関連づけられている。

ステップ４１６において、処理システム３１０は、ロバストにトレーニングされたネットワークを出力するように構成されており、これらのネットワークは、少なくとも、第１のエンコーダネットワークμ_θ（ｘ）、第２のエンコーダネットワークσ_θ（ｘ）及びデコーダネットワークｇ_θ（ｘ）を含む。一旦、処理システム３１０がロバストにトレーニングされたネットワークを出力すると、処理システム３１０は、使用する目的でＰＲＯＶＡＥ２００Ａを配備又は送信するように構成される。例えば、一旦、ロバストにトレーニングされると、ＰＲＯＶＡＥ２００Ａは、図１Ａのシステム１００又は任意の適当なアプリケーションによって配備可能及び／又は使用可能となる。

さらに、方法４００は、図４に示したステップに限定されるものではなく、方法４００が類似の又は実質的に類似の機能、効果及び／又は結果を提供する、ということを前提として、種々の変更を含み得る。これに関して、１つの変形実施例として、ＩＢＰの代わりに、ステップ４０４、４０６及び４１０において他の境界伝播技術を含むように、方法４００が構成される。それら他の境界伝播技術によって、より厳格な境界を提供することができるが、その代償として、ＩＢＰによって提供されるものよりも遥かに複雑になる。他の変形実施例として、方法４００は、ステップ４０８、４１０及び４１２を２回以上（例えば、設定された回数だけ）実施し、そのセットに関する結果を平均することを含む。付加的に又は選択的に、方法４００は、

を解くために、モンテカルロ積分を実行することを含む。さらに他の変形実施例として、方法４００はさらに、分類器を介して生成モデルの出力を分類することを含み、これにより、新たなロバストネス認証が、誤って分類されたサンプルに対するペナルティを含むようになり、このペナルティによって、対数尤度の減少がバウンディングされるだけでなく、分類出力がノイズ又は敵対的攻撃によって変更されないことも保証される。

図５Ａ、図５Ｂ、図５Ｃ及び図５Ｄには、１つの例示的な実施形態による入力データの非限定的な実施例が示されている。入力データのこれらの実施例には、ＭｏｄｉｆｉｅｄＮａｔｉｏｎａｌＩｎｓｔｉｔｕｔｅｏｆＳｔａｎｄａｒｄｓａｎｄＴｅｃｈｎｏｌｏｇｙデータベース（「ＭＮＩＳＴデータベース」）から取得されたサンプル画像（例えば、手書きの数字のイメージ）が含まれる。より具体的には、図５Ａには、摂動されていないイメージデータ５００を含み摂動データを含まない、入力データの非摂動サンプルが示されている。これに対して、図５Ｂ乃至図５Ｄには、摂動データによって摂動されたこの同一のイメージデータ５００を含む、入力データの敵対的サンプルが示されている。例えば、図５Ｂには、イメージデータ５００（図５Ａ）を含む敵対的サンプル５０２が、ＰＲＯＶＡＥに対する射影勾配降下（ＰＧＤ）攻撃と共に示されている。一方、図５Ｃには、ＰＲＯＶＡＥ２００Ａにおいてε_{ｔｒａｉｎ}＝０．０１のＰＧＤ攻撃を受けたイメージデータ５００（図５Ａ）を含む敵対的サンプル５０４が示されている。図５Ｄには、ＰＲＯＶＡＥ２００Ａにおいてε_{ｔｒａｉｎ}＝０．１のＰＧＤ攻撃を受けたイメージデータ５００（図５Ａ）を含む敵対的サンプル５０６が示されている。

例示的な査定によれば、イメージデータ５００の非摂動サンプルに基づいて、ＶＡＥ及びＰＲＯＶＡＥ２００Ａが評価される。イメージデータ５００のこの非摂動サンプルが、ＶＡＥに入力データとして与えられた場合には、損失は、Ｌ＝－２８．２８として表される。比較として、例えば、イメージデータ５００の非摂動サンプルが、ε_{ｔｒａｉｎ}＝０．０１であるＰＲＯＶＡＥ２００Ａに入力データとして与えられた場合には、損失は、Ｌ＝－３１．１０として表される。他の比較として、例えば、イメージデータ５００の非摂動サンプルが、ε_{ｔｒａｉｎ}＝０．１であるＰＲＯＶＡＥ２００Ａに入力データとして与えられた場合には、損失は、Ｌ＝－４１．３１として表される。これらの査定によって実証されるように、ＶＡＥとＰＲＯＶＡＥ２００Ａとの間の性能に有意な差は存在しない。しかも、損失値によって実証されるように、ＶＡＥ及びＰＲＯＶＡＥ２００Ａは、分布内データであり手書きの数字の範囲内にあるものとして、イメージデータ５００を正確に識別して処理するように動作可能である。

他の例示的な査定によれば、ＶＡＥ及びＰＲＯＶＡＥ２００Ａが、摂動データによりイメージデータ５００（図５Ａ）が摂動される、入力データの摂動されたサンプルに基づき評価される。これに関して、攻撃されたデータのこれらの敵対サンプルに関してＶＡＥとＰＲＯＶＡＥ２００Ａとを比較すると、ＶＡＥに比較してＰＲＯＶＡＥ２００Ａの利点が強調される。より具体的には、敵対的サンプル５０２がＶＡＥに入力データとして与えられた場合には、損失はＬ＝－１１３．９７として表される。即ち、このケースにおいては、Ｌ＝－１１３．９７であるので、敵対的サンプル５０２が手書きの数字のイメージデータ５００を含んでいるにもかかわらず、摂動データの攻撃に起因して、ＶＡＥは、この敵対的サンプル５０２を分布外データであるとして（例えば、手書きの数字の範囲内にないものとして）誤って解釈する。これとは対照的に、敵対的サンプル５０４が、ε_{ｔｒａｉｎ}＝０．０１であるＰＲＯＶＡＥ２００Ａに入力データとして与えられた場合には、損失は、Ｌ＝－５９．０８として表され、この場合、ＰＲＯＶＡＥ２００Ａは、この敵対的サンプル５０４を分布内データであるとして（例えば、手書きの数字の範囲内にあるものとして）正確に識別して処理し、これによって、ＶＡＥに比較してロバストであることが示される。他の比較として、敵対的サンプル５０６が、ε_{ｔｒａｉｎ}＝０．１であるＰＲＯＶＡＥに入力データとして与えられた場合には、損失は、Ｌ＝－５０．０６として表され、この場合、ＰＲＯＶＡＥ２００Ａは、この敵対的サンプル５０６を分布内データであるとして（例えば、手書きの数字の範囲内にあるものとして）正確に識別して処理し、これによって、ＶＡＥに比較してロバストであることが示される。さらに、図６Ａ及び図６ＢにもＰＲＯＶＡＥ２００Ａの利点が示されており、これらの図面には、ＶＡＥとＰＲＯＶＡＥ２００Ａとの比較が含まれている。

図６Ａ及び図６Ｂには、それぞれ異なるε_{ｔｒａｉｎ}の値でトレーニングされた複数の分類器について、ＥＬＢＯＬによって表されるような、損失に対する敵対的攻撃（例えば、０≦ε_{ａｔｔａｃｋ}≦０．２である半径ε_{ａｔｔａｃｋ}のｌ_∞球体におけるＰＧＤ攻撃）の作用のグラフィカル表示を含むグラフが示されている。図６Ａには、第１のデータセット（例えば、ＭＮＩＳＴデータベースからのサンプルイメージ）に基づくグラフ６００が示されているのに対して、図６Ｂには、第２のデータセット（例えば、ＣａｎａｄｉａｎＩｎｓｔｉｔｕｔｅＦｏｒＡｄｖａｎｃｅｄＲｅｓｅａｒｃｈ（ＣＩＦＡＲ１０）データベースからのサンプルイメージ）に基づくグラフ６１０が示されている。図６Ａの場合、ＶＡＥ表現６０２は、第１のデータセットに基づきε_{ｔｒａｉｎ}＝０に対応する。図６Ｂの場合、ＶＡＥ表現６１２は、第２のデータセットに基づきε_{ｔｒａｉｎ}＝０に対応する。ＶＡＥ表現６０２及び６１２の各々によれば、非ロバストな分類器に関する損失Ｌの急速な減衰が明確に示されており、証明可能ロバストな分類器をトレーニングすることによって、ε_{ａｔｔａｃｋ}＝０である非摂動データに対してＬの低い値を犠牲にして、この減衰がどのようにして緩和されるのかが示されている。これに加えて、比較のために、図６Ａ及び図６Ｂは、それぞれ第１のデータセット及び第２のデータセットに基づくｐｒｏＶＡＥ（ε_{ｔｒａｉｎ}＝０．０１）表現６０４及び６１４が示されている。同様に、比較のために、図６Ａ及び図６Ｂは、それぞれ第１のデータセット及び第２のデータセットに基づくｐｒｏＶＡＥ（ε_{ｔｒａｉｎ}＝０．１０）表現６０６及び６１６が示されている。従って、図６Ａ及び図６Ｂに示されているように、ｐｒｏＶＡＥ表現６０４、６０６、６１４及び６１６各々は、ＶＡＥ表現６０２及び６１２と比較して、ε_{ａｔｔａｃｋ}を増加させるために、より良好に機能する。

本明細書において説明したように、実施形態には、数多くの有利な特徴及び利点が含まれている。例えば、実施形態は、尤度の変分下限（即ち、ＥＬＢＯ）に対するロバストな下限を定義し、証明可能ロバストな生成モデルをトレーニングするためにそれらの下限を最適化することに基づく、証明可能ロバストな生成モデルのトレーニング及び生成に関する。これらの実施形態によれば、生成モデルの領域における敵対的攻撃即ち分布外攻撃に対する証明可能な防御が導入され、このような攻撃の場合、モデルの分布内のサンプルが摂動されて、その尤度が低減される。

これに加えて、図６Ａ乃至図６Ｂによれば、この証明可能な防御の有効性が確証され、モデルのロバストネスに関連した他のトレードオフが導入される。例えば、図６Ａ乃至図６Ｂには、図４のトレーニングプロセスを介してロバストにトレーニングされていなかったＶＡＥと比較して、ＰＲＯＶＡＥ２００Ａが、（例えば、ε_{ｔｒａｉｎ}が増加したときに、ε_{ａｔｔａｃｋ}のより高い値でより高い対数尤度を有することによって）敵対的攻撃に対してより良好な防御をもたらすことが示されている。さらに、本開示における教示を、分布内に含める攻撃に対する防御の形成に関係する改善の方向へと拡張可能であり、そのような攻撃の場合には、敵対的攻撃が分布外のサンプル

を摂動して、あたかも分布に属するものであるかのように見せかける可能性がある（ｘ∈Ｄ）。

同様に、実施形態は、敵対的攻撃に対する機械学習システム（例えば、深層生成モデル）の感受性に関連した技術的問題に対する技術的解決手段を提供することにおいて有利である。これらの敵対的攻撃は、入力データに知覚し得ない変化を引き起こすことが知られており、この変化は、尤度関数の劇的な変化につながる可能性があり、それによって、不正確な出力データが供給される。この技術的問題の対処にあたり、本明細書において開示した実施形態は、機械学習システムの入力に対するこれらの小さい変化（例えば、摂動）によっても機械学習システムの尤度機能に劇的な変更がもたらされないロバストな生成モデルを提供する。従って、上述のように、本明細書において説明した実施形態は、敵対的攻撃に対する防御解決手段を備えた生成モデルを提供する上で有利である。

即ち、上述の説明は、例示的なものであって限定的なものではなく、特定の用途及びその要件の文脈において提供される、ということが意図されている。当業者であれば、これまでの説明から、本発明を種々の形態で実装し得ること、及び、種々の実施形態を単独で又は組み合わせて実装し得ることを理解することができる。従って、本発明の実施形態をそれらの特定の実施例に関連して説明してきたが、本明細書において定義された一般的な原理を、説明された実施形態の着想及び範囲から逸脱することなく、他の実施形態及び用途に適用することができ、本発明の実施形態及び／又は方法の真の範囲は、図示され説明された実施形態に限定されるものではない。なぜならば、図面、明細書及び添付の特許請求の範囲を精査すると、当業者には種々の変形が明らかになるからである。例えば、構成要素及び機能を、説明された種々の実施形態とは異なるように分離又は結合することができ、さらに、それらを異なる用語を用いて説明することができる。これら及びその他の変形、修正、追加及び改良は、以下の特許請求の範囲において定義された本開示の範囲内に含まれ得る。

Claims

摂動に対してロバストであるように機械学習システムをトレーニングするためのコンピュータ実装による方法であって、
センサデータと許容可能摂動のｌ_ｐノルム球体の半径とを含む入力データを取得するステップと、
前記入力データに基づいて入力バウンディングデータを生成するステップと、
前記入力バウンディングデータをエンコーダネットワークの第１の出力に伝播させることにより、第１のバウンディングデータを生成するステップと、
前記入力バウンディングデータを前記エンコーダネットワークの第２の出力に伝播させることにより、第２のバウンディングデータを生成するステップと、
前記第１のバウンディングデータ及び前記第２のバウンディングデータに基づき、潜在変数に関連づけられた第３のバウンディングデータを生成するステップと、
前記第３のバウンディングデータをデコーダネットワークの出力に伝播させることにより、第４のバウンディングデータを生成するステップと、
前記第１のバウンディングデータ、前記第２のバウンディングデータ、前記第３のバウンディングデータ及び前記第４のバウンディングデータに基づき、エビデンス下限（ＥＬＢＯ）の下限を生成することによって、前記入力データに関してロバストネス認証を確立するステップと、
前記エンコーダネットワーク及び前記デコーダネットワークを含む前記機械学習システムが、前記許容可能摂動に対する防御に関してロバストであるように、前記ロバストネス認証に基づき前記エンコーダネットワーク及び前記デコーダネットワークを更新するステップと
を含む、
機械学習システムをトレーニングするためのコンピュータ実装による方法。
前記ＥＬＢＯは、条件付き対数尤度関数を含み、
前記エンコーダネットワーク及び前記デコーダネットワークを更新する前記ステップは、前記ＥＬＢＯの前記下限を最適化するステップを含む、
請求項１に記載のコンピュータ実装による方法。
前記エンコーダネットワーク及び前記デコーダネットワークを更新する前記ステップは、前記ＥＬＢＯの前記下限を最大化するために、前記ＥＬＢＯの前記下限に基づき前記エンコーダネットワーク及び前記デコーダネットワークのパラメータを更新するステップを含む、
請求項１に記載のコンピュータ実装による方法。
前記機械学習システムは、前記エンコーダネットワーク及び前記デコーダネットワークを含む変分オートエンコーダを含み、
前記潜在変数は、前記変分オートエンコーダに関連づけられている、
請求項１に記載のコンピュータ実装による方法。
前記エンコーダネットワークは、前記エンコーダネットワークの前記第１の出力を生成するための第１の符号化構成要素と、前記エンコーダネットワークの前記第２の出力を生成するための第２の符号化構成要素とを含み、
前記第１のバウンディングデータを生成する前記ステップは、前記第１の符号化構成要素の第１の上限データ及び第１の下限データを生成するステップを含み、
前記第２のバウンディングデータを生成するステップは、前記第２の符号化構成要素の第２の上限データ及び第２の下限データを生成するステップを含む、
請求項１に記載のコンピュータ実装による方法。
前記ロバストネス認証は、||δ||_∞≦ε_{ｔｒａｉｎ}を満たす全てのδについて、ｌｏｇｐ（ｘ＋δ）≧Ｌ（ｘ＋δ）≧Ｌ（ｘ）を保証するために、前記ＥＬＢＯの前記下限を生成し、ここで、
ｘは、前記センサデータを表し、
δは、摂動データを表し、
Ｌ（ｘ＋δ）は、前記摂動データによって摂動された前記センサデータに基づく前記ＥＬＢＯを表し、
Ｌ（ｘ）は、前記ＥＬＢＯの前記下限を表し、
ε_{ｔｒａｉｎ}は、前記許容可能摂動のｌ_ｐノルム球体の半径を表す、
請求項１に記載のコンピュータ実装による方法。
前記入力バウンディングデータは、前記入力データの上限データ及び下限データを含み、
前記第１のバウンディングデータは、前記エンコーダネットワークの第１の符号化構成要素の第１の出力の第１の上限データ及び第１の下限データを含み、
前記第２のバウンディングデータは、前記エンコーダネットワークの第２の符号化構成要素の第２の出力の第２の上限データ及び第２の下限データを含み、
前記第３のバウンディングデータは、前記潜在変数に関連づけられた第３の上限データ及び第３の下限データを含み、
前記第４のバウンディングデータは、前記デコーダネットワークの出力の第４の上限データ及び第４の下限データを含む、
請求項１に記載のコンピュータ実装による方法。
アクチュエータと、
少なくとも１つのセンサを含むセンサシステムと、
機械学習システムを格納している非一時的コンピュータ可読媒体と、
前記センサシステム及び前記機械学習システムとの通信に基づき前記アクチュエータを制御する制御システムと
を含むシステムであって、
前記機械学習システムは、当該機械学習システムの損失関数の下限を設定するロバストネス認証に基づきトレーニングされたエンコーダネットワーク及びデコーダネットワークを有し、
前記制御システムは、少なくとも１つの電子プロセッサを含み、当該少なくとも１つの電子プロセッサは、以下のように動作可能であり、即ち、
前記センサシステムからのセンサデータと摂動からの摂動データとを含む入力データを取得し、前記センサデータは、前記摂動データによって摂動され、
前記機械学習システムを介して前記入力データを処理し、
前記機械学習システムを介して出力データを生成し、前記出力データは、前記センサデータの再構成体であり、前記出力データは、前記摂動データによって摂動されてない尤度に関連している、
ように動作可能であり、
ここで、
前記センサデータ及び前記出力データは、前記機械学習システムに関連したモデル分布に対応する分布内データであり、
前記機械学習システムは、たとえ前記摂動データが、前記入力データを前記モデル分布から外れた分布外データであると前記機械学習システムに識別させて処理させるように構成されていたとしても、前記入力データを前記分布内データの範囲内にあるものとして識別して処理する、
システム。
前記制御システムは、前記出力データの分類に応じて分類データを生成するように動作可能であり、
前記制御システムは、前記分類データに基づいて前記アクチュエータに対する制御データを生成するように動作可能であり、
前記アクチュエータは、前記制御データに応答してアクションを実行する、
請求項８に記載のシステム。
前記機械学習システムは、変分オートエンコーダを含み、前記変分オートエンコーダは、摂動に対してロバストであるようにトレーニングされており、前記エンコーダネットワーク及び前記デコーダネットワークを含む、
請求項８に記載のシステム。
前記制御システムと通信する前に、前記変分オートエンコーダは、以下のステップを含むトレーニングプロセスによりトレーニングされる、即ち、
他のセンサデータと許容可能摂動のｌ_ｐノルム球体の半径とを含むトレーニングデータに基づき、入力バウンディングデータを生成するステップと、
前記入力バウンディングデータをエンコーダネットワークの第１の出力に伝播させることにより、第１のバウンディングデータを生成するステップと、
前記入力バウンディングデータを前記エンコーダネットワークの第２の出力に伝播させることにより、第２のバウンディングデータを生成するステップと、
前記第１のバウンディングデータ及び前記第２のバウンディングデータに基づき、潜在変数に関連づけられた第３のバウンディングデータを生成するステップと、
前記第３のバウンディングデータを前記デコーダネットワークの出力に伝播させることにより、第４のバウンディングデータを生成するステップと、
前記第１のバウンディングデータ、前記第２のバウンディングデータ、前記第３のバウンディングデータ及び前記第４のバウンディングデータに基づき、エビデンス下限（ＥＬＢＯ）の下限を生成することによって、前記トレーニングデータに関してロバストネス認証を確立するステップと、
前記機械学習システムが、前記許容可能摂動に対する防御に関してロバストであるように、前記ロバストネス認証に基づき前記エンコーダネットワーク及び前記デコーダネットワークを更新するステップと
を含むトレーニングプロセスによりトレーニングされる、
請求項１０に記載のシステム。
前記機械学習システムは、以下のようにトレーニングされる、即ち、
前記エンコーダネットワーク及び前記デコーダネットワークを更新する前記ステップが、前記ＥＬＢＯの前記下限を最大化するために、前記ＥＬＢＯの前記下限に基づき前記エンコーダネットワーク及び前記デコーダネットワークのパラメータを更新するステップを含む
ようにトレーニングされる、
請求項１１に記載のシステム。
前記機械学習システムは、以下のようにトレーニングされる、即ち
前記ロバストネス認証が、||δ||_∞≦ε_{ｔｒａｉｎ}を満たす全てのδについて、ｌｏｇｐ（ｘ＋δ）≧Ｌ（ｘ＋δ）≧Ｌ（ｘ）を保証するために、前記ＥＬＢＯの前記下限を生成し、ここで、
ｘは、前記センサデータを表し、
δは、摂動データを表し、
Ｌ（ｘ＋δ）は、前記摂動データによって摂動された前記センサデータに基づく前記ＥＬＢＯを表し、
Ｌ（ｘ）は、前記ＥＬＢＯの前記下限を表し、
ε_{ｔｒａｉｎ}は、許容可能摂動のｌ_ｐノルム球体の半径を表す
ようにトレーニングされる、
請求項１１に記載のシステム。
前記入力バウンディングデータは、前記トレーニングデータの上限データ及び下限データを含み、
前記第１のバウンディングデータは、前記エンコーダネットワークの第１の符号化構成要素の出力の第１の上限データ及び第１の下限データを含み、
前記第２のバウンディングデータは、前記エンコーダネットワークの第２の符号化構成要素の出力の第２の上限データ及び第２の下限データを含み、
前記第３のバウンディングデータは、前記潜在変数に関連づけられた第３の上限データ及び第３の下限データを含み、
前記第４のバウンディングデータは、前記デコーダネットワークの出力の第４の上限データ及び第４の下限データを含む、
請求項１１に記載のシステム。
少なくともコンピュータ可読データを含む非一時的コンピュータ可読媒体であって、前記コンピュータ可読データは、電子プロセッサによって実行されるときに、摂動に対してロバストであるように機械学習システムをトレーニングするための方法を実施するために実行可能であり、当該方法は、以下のステップを含む、即ち、
センサデータと許容可能摂動のｌ_ｐノルム球体の半径とを含む入力データを取得するステップと、
前記入力データに基づいて入力バウンディングデータを生成するステップと、
前記入力バウンディングデータをエンコーダネットワークの第１の出力に伝播させることにより、第１のバウンディングデータを生成するステップと、
前記入力バウンディングデータを前記エンコーダネットワークの第２の出力に伝播させることにより、第２のバウンディングデータを生成するステップと、
前記第１のバウンディングデータ及び前記第２のバウンディングデータに基づき、潜在変数に関連づけられた第３のバウンディングデータを生成するステップと、
前記第３のバウンディングデータをデコーダネットワークの出力に伝播させることにより、第４のバウンディングデータを生成するステップと、
前記第１のバウンディングデータ、前記第２のバウンディングデータ、前記第３のバウンディングデータ及び前記第４のバウンディングデータに基づき、エビデンス下限（ＥＬＢＯ）の下限を生成することによって、前記入力データに関してロバストネス認証を確立するステップと、
前記エンコーダネットワーク及び前記デコーダネットワークを含む前記機械学習システムが、前記許容可能摂動に対する防御に関してロバストであるように、前記ロバストネス認証に基づき前記エンコーダネットワーク及び前記デコーダネットワークを更新するステップと
を含む、
非一時的コンピュータ可読媒体。
前記ＥＬＢＯは、条件付き対数尤度関数を含み、
前記エンコーダネットワーク及び前記デコーダネットワークを更新する前記ステップは、前記ＥＬＢＯの前記下限を最適化するステップを含む。
請求項１５に記載の非一時的コンピュータ可読媒体。
前記エンコーダネットワーク及び前記デコーダネットワークを更新する前記ステップは、前記ＥＬＢＯの前記下限を最大化するために、前記ＥＬＢＯの前記下限に基づき前記エンコーダネットワーク及び前記デコーダネットワークのパラメータを更新するステップを含む、
請求項１５に記載の非一時的コンピュータ可読媒体。
前記機械学習システムは、前記エンコーダネットワーク及び前記デコーダネットワークを含む変分オートエンコーダを含み、
前記潜在変数は、前記変分オートエンコーダに関連づけられている、
請求項１５に記載の非一時的コンピュータ可読媒体。
前記エンコーダネットワークは、第１の符号化構成要素と第２の符号化構成要素とを含み、
前記第１のバウンディングデータを生成する前記ステップは、前記第１の符号化構成要素の第１の出力の第１の上限データ及び第１の下限データを生成するステップを含み、
前記第２のバウンディングデータを生成するステップは、前記第２の符号化構成要素の第２の出力の第２の上限データ及び第２の下限データを生成するステップを含む、
請求項１５に記載の非一時的コンピュータ可読媒体。
前記ロバストネス認証は、||δ||_∞≦ε_{ｔｒａｉｎ}を満たす全てのδについて、ｌｏｇｐ（ｘ＋δ）≧Ｌ（ｘ＋δ）≧Ｌ（ｘ）を保証するために、前記ＥＬＢＯの前記下限を生成し、ここで、
ｘは、前記センサデータを表し、
δは、摂動データを表し、
Ｌ（ｘ＋δ）は、前記摂動データによって摂動された前記センサデータに基づく前記ＥＬＢＯを表し、
Ｌ（ｘ）は、前記ＥＬＢＯの前記下限を表し、さらに
ε_{ｔｒａｉｎ}は、許容可能摂動のｌ_ｐノルム球体の半径を表す、
請求項１５に記載の非一時的コンピュータ可読媒体。