JP7288905B2 - ロバスト推定問題の確率的最適化のためのシステムおよび方法 - Google Patents

ロバスト推定問題の確率的最適化のためのシステムおよび方法 Download PDF

Info

Publication number
JP7288905B2
JP7288905B2 JP2020529188A JP2020529188A JP7288905B2 JP 7288905 B2 JP7288905 B2 JP 7288905B2 JP 2020529188 A JP2020529188 A JP 2020529188A JP 2020529188 A JP2020529188 A JP 2020529188A JP 7288905 B2 JP7288905 B2 JP 7288905B2
Authority
JP
Japan
Prior art keywords
computer
objective
implemented method
argument
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020529188A
Other languages
English (en)
Other versions
JP2021504836A5 (ja
JP2021504836A (ja
Inventor
ポール フリードランダー,マイケル
ローナウグ,プーヤ
セフェリー,ベールーズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
1QB Information Technologies Inc
Original Assignee
1QB Information Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1QB Information Technologies Inc filed Critical 1QB Information Technologies Inc
Publication of JP2021504836A publication Critical patent/JP2021504836A/ja
Publication of JP2021504836A5 publication Critical patent/JP2021504836A5/ja
Application granted granted Critical
Publication of JP7288905B2 publication Critical patent/JP7288905B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N10/00Quantum computing, i.e. information processing based on quantum-mechanical phenomena
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/08Computing arrangements based on specific mathematical models using chaos models or non-linear system models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Nonlinear Science (AREA)
  • Complex Calculations (AREA)

Description

相互参照
本出願は、2017年12月1日に出願された米国仮特許出願第62/593,563号、および2017年8月8日に出願された米国仮特許出願第62/716,041号の優先権を主張するものであり、各々の出願は全体として参照によって本明細書に組み込まれる。
様々な工学分野において、ロバスト推定問題は、たとえ直接的な数学的モデル化が存在し得るとしても、それを数的に直接解決するにはしばしば複雑すぎる。確率的最適化は、構成関数を部分的に評価するためにランダム性を使用する、関数を最小化あるいは最大化するためのアプローチであり、非常に複雑なモデルを最適化するために適用可能であり得る。
本開示の方法およびシステムは、ロバスト推定問題中の様々な目的関数の平滑化を有利に可能にし、それによって、推定問題を正確に解く代わりにサンプリングを使用して、そのような関数を確率的勾配法による計算に適用できるようにする。そのような方法およびシステムは、シミュレートされたプロセスおよび/または量子プロセス、とりわけ、量子アニーリングプロセス、古典的なコンピューター、半古典的なコンピューター、あるいは量子プロセッサー/デバイスの熱的または断熱的緩和、および/または他の物理プロセスを使用して、サンプリングデバイスによってサンプリングすることができるボルツマン分布に対する滑らかな関数近似の勾配を有利に接続する。
本開示は、ロバスト推定問題の確率的最適化のためのシステムを提供し、このシステムは、最大マージン原理および/または最尤原理を有する数学的または統計的な関数を介して表現されるモデルのパラメーターを学習または推定するために使用され得、学習されたモデルパラメーターは、数学的または統計的な関数のインスタンスを決定する。特に、モデルパラメーターは、統計関数がグラフィックモデル、例えば、横磁場イジングモデル、あるいは多体系の他の古典的または量子モデルのエネルギー関数である場合に、予測のために確率的グラフィックモデルの重みを決定し得る。このアプローチは、多くの機械学習アルゴリズムおよびタスクのための一般的なフレームワークをもたらし得る。機械学習アルゴリズムの非限定的な例としては、構造化サポートベクターマシン(SSVM)が挙げられる。
本開示のシステムおよび方法は、複雑な推定問題が、文書のクラスタリング、群集内の集団検出、推奨システム、半教師あり学習、およびアクティブラーニングなどのデータサイエンスでの様々な用途において解決されるように、データサイエンスの技術分野を有利に改善することができる。本明細書で開示されるシステムと方法はさらに、名詞句共参照解析(noun phrase coreference resolution)などの自然言語処理における様々な用途、および画像分割などの画像処理用途を有し得る。
1つの態様において、本開示は、サンプリングデバイスを使用して、ロバスト推定問題の確率的最適化のためのコンピューターで実施される方法を提供し、上記方法は、デジタルコンピューターによって、ロバスト推定問題のデータを受け取る工程であって、データは:重複しない部分集合へ分類された損失関数の集合であって、損失関数の集合中の各損失関数が第1の引数と第2の引数を受け取り、第1の引数と第2の引数は独立しており、第1の引数はその値として連続ベクトルを使用し、第2の引数はその値として離散ベクトルを使用する、損失関数の集合;損失関数の集合中の各損失関数の許容可能な離散ベクトルの集合;および、損失関数の集合中の各損失関数の第1の引数のための当初の連続ベクトル;を含む、工程;デジタルコンピューターによって、連続ベクトルの現在値を、当初の連続ベクトルとして設定する工程;デジタルコンピューターによって、スケーリングパラメーターの集合のスケジュールを受け取る工程;デジタルコンピューターによって、スケジュールに少なくとも部分的に基づいてスケーリングパラメーターの集合の初期値を設定する工程;および、ロバスト推定問題の解の精度を決定するためのルールの集合を含む停止基準が満たされるまで:スケーリングパラメーターの集合の現在値を決定する工程であって、現在値が、スケーリングパラメーターの集合のスケジュールに少なくとも部分的に基づく、工程;重複しない部分集合から損失関数の部分集合を選択する工程であって、選択が非反復あるいは反復である、工程;損失関数の選択された部分集合の各損失関数の次の工程を繰り返す工程:サンプリングデバイスによって、離散ベクトルの1つ以上のサンプルを生成する工程であって、1つ以上のサンプルの各サンプルは、損失関数に関連付けられる許容可能な離散ベクトルの集合から生成され、1つ以上のサンプルの各サンプルは、スケーリングパラメーターの集合と損失関数によって少なくとも部分的に決定された確率分布に基づき生成され、損失関数の第1の引数は、連続ベクトルの現在値をとる、工程;デジタルコンピューターによって、1つ以上の勾配を得る工程であって、1つ以上の勾配の各々が第1の引数に対して得られた損失関数であり;損失関数の第1の引数は、連続ベクトルの現在値をとり、第2の引数は、1つ以上のサンプルから、選択されたサンプルの値をとり、選択されたサンプルは、非反復的に選択される、工程;および、デジタルコンピューターによって、1つ以上の勾配の平均値を得る工程;デジタルコンピューターによって、1つ以上の勾配の平均値の和および/または部分和を得る工程であって、上記和は、損失関数の選択された部分集合中のすべての損失関数に対するものであり、部分和は、損失関数の選択された部分集合中の1つを超える損失関数に対するものである、工程;デジタルコンピューターによって:v1)1つ以上の勾配の平均値の和あるいは部分和、v2)スケーリングパラメーターの集合の現在値、v3)1つ以上の勾配の平均値の和あるいは部分和の履歴の少なくとも一部、および/または、v4)スケーリングパラメーターの集合の値の履歴の少なくとも一部;に少なくとも部分的に基づいて検索方向を計算する工程;デジタルコンピューターによって:vi1)スケーリングパラメーターの集合の現在値、vi2)損失関数の集合、vi3)スケーリングパラメーターの集合の値の履歴の少なくとも一部、および/または、vi4)損失関数の集合の履歴の少なくとも一部;に少なくとも部分的に基づいてステップ長を計算する工程;ステップ長と検索方向を使用して、更新された現在の連続ベクトルをデジタルコンピューターによって計算する工程;ならびに、デジタルコンピューターによって、更新された現在の連続ベクトルとなるように連続ベクトルの現在値を設定する工程、を含む。
本開示は、複雑なロバスト推定問題を解決するためのサンプリングデバイスを有利に利用する。サンプリングデバイスは、スケーリングパラメーターの集合のスケジュールおよびロバスト推定問題のデータを得るために、量子プロセッサーと量子デバイス制御システムを備えることができる。量子プロセッサーは、デジタルコンピューターと量子デバイス制御システムに結合され得る。量子プロセッサーは、複数のキュービットと複数のカプラーを備えてもよく、複数のカプラーの各カプラーは、複数のキュービットの2つのキュービットの交差点(crossing)で通信可能な結合を提供するためのものである。離散ベクトルの1つ以上のサンプルは、ボルツマン分布に従うこともある。
サンプリングデバイスは光パラメトリック発振器のネットワークであり得、上記ネットワークは:光学装置であって、光エネルギー源からエネルギーを受信し、複数の光パラメトリック発振器を生成するように構成された光学装置;および、複数の結合装置であって、その各々が複数の光パラメトリック発振器の光パラメトリック発振器と制御可能に結合する、結合装置を含む。サンプリングデバイスは、中央処理装置、例えば、デジタルコンピューターあるいはモバイルデバイス、および、中央処理装置に結合された記憶装置を備え得る。記憶装置は、スケーリングパラメーターのスケジュールおよびロバスト推定問題のデータを得るためのアプリケーションを備え得る。そのようなアプリケーションは、ウェブアプリケーションまたはモバイルアプリケーションであり得る。
サンプリングデバイスは再構成可能なデジタルハードウェア、中央処理装置、および記憶装置を備え得、中央処理装置と記憶装置は、再構成可能なデジタルハードウェアに結合される。再構成可能なデジタルハードウェアは、スケーリングパラメーターのスケジュールおよびロバスト推定問題のデータを得るために適合され得、および、再構成可能なデジタルハードウェアは、マルコフ連鎖モンテカルロアルゴリズムを実施するように適合される。マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッド量子アニーリングであり得る。マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッドアニーリングであり得る。マルコフ連鎖モンテカルロアルゴリズムは、ギブスサンプリングであり得る。
集合の損失関数は1つ以上の損失関数を備え得る。
ロバスト推定問題の確率的最適化は、構造化サポートベクターマシンの訓練に関連付けられ得る。損失関数の重複しない部分集合の各部分集合は、2つの損失関数しか備えないこともある。ロバスト推定問題の確率的最適化は、画像分割に関連付けられ得る。
ロバスト推定問題の確率的最適化は、圧縮センシングからの双対基底追跡問題に関連付けられ得る。
ロバスト推定問題の確率的最適化は、半教師あり学習に関連付けられ得る。ロバスト推定問題のデータは、1つ以上の画像分割問題に関連付けられ得る。ロバスト推定問題のデータは、1つ以上の圧縮センシング問題からの双対基底追跡問題に関連付けられ得る。ロバスト推定問題のデータは、半教師あり学習に関連付けられ得る。ロバスト推定問題のデータは、名詞句共参照解析問題から得られ得る。ロバスト推定問題のデータは、アクティブラーニングに関連付けられ得る。ロバスト推定問題のデータは、1つ以上の画像タグ付け問題に関連付けられ得る。ロバスト推定問題のデータは、推奨システムに関連付けられ得る。
スケーリングパラメーターのスケジュールの集合は、ユーザーによって手動で、あるいは、アルゴリズムあるいはコンピュータプログラムによって、決定することができる。スケーリングパラメーターの集合のスケジュールは、スケーリングパラメーターの集合の履歴に基づいて機械学習アルゴリズムを使用して決定することができる。
デジタルコンピューターは、サンプリングデバイスに対して遠隔に位置することができる。
停止基準は、現在の連続ベクトルと更新された現在の連続ベクトルとの間の距離の大きさに少なくとも部分的に基づき得る。
損失関数は、引数の第1および第2の集合の合成関数から構成可能である。
1つ以上の勾配を得る操作において、1つ以上の勾配の各々は、第1の引数に関して得られる損失関数であってもよく、連鎖律の反復適用から構成される。連鎖律の反復適用は自動微分を使用して実施され得る。
場合によっては、合成関数の変関数(argument function)には、微分可能な特徴抽出器(feature extractors)がある。場合によっては、微分可能な特徴抽出器には、ディープニューラルネットワークがある。
検索方向の計算は、確率的勾配降下法(SGD)、確率的平均勾配法(SAGとSAGA)、確率的分散減少勾配(SVRG)、および確率的双対座標上昇(stochastic dual coordinate ascent)(SDCA)の1つ以上を利用し得る。
ステップ長の計算は、適応勾配降下法のうちの1つを使用し、限定されないが、Adam、減少平均平方(RMS)、RMSProp、およびAdaGradを含み得る。
1つの態様において、本開示は、サンプリングデバイスを使用して、ロバスト推定問題の確率的最適化のためのシステムを提供し、上記システムは、デジタルコンピューターを備え、上記デジタルコンピューターは:ロバスト推定問題のデータを受け取ることであって、データは:重複しない部分集合へ分類された損失関数の集合であって、損失関数の集合中の各損失関数が第1の引数と第2の引数を受け取り、第1の引数と第2の引数は独立しており、第1の引数はその値として連続ベクトルを使用し、第2の引数はその値として離散ベクトルを使用する、損失関数の集合;損失関数の集合中の各損失関数の許容可能な離散ベクトルの集合;および、損失関数の集合中の各損失関数の第1の引数のための当初の連続ベクトル;を含む、こと;連続ベクトルの現在値を、当初の連続ベクトルとして設定すること;スケーリングパラメーターの集合のスケジュールを受け取ること;スケジュールに少なくとも部分的に基づいてスケーリングパラメーターの集合の当初の初期値を設定すること;および、ロバスト推定問題の解の精度を決定するためのルールの集合を含む停止基準が満たされるまで:スケーリングパラメーターの集合の現在値を決定することであって、現在値が、スケーリングパラメーターの集合のスケジュールに少なくとも部分的に基づく、こと;重複しない部分集合から損失関数の部分集合を選択することであって、選択が非反復あるいは反復である、こと;損失関数の選択された部分集合の各損失関数の次の工程を繰り返すこと:サンプリングデバイスによって、離散ベクトルの1つ以上のサンプルを生成する工程であって、1つ以上のサンプルの各サンプルは、損失関数に関連付けられる許容可能な離散ベクトルの集合から生成され、1つ以上のサンプルの各サンプルは、スケーリングパラメーターの集合と損失関数によって少なくとも部分的に決定された確率分布に基づき生成され、損失関数の第1の引数は、連続ベクトルの現在値をとる、工程;1つ以上の勾配を得る工程であって、1つ以上の勾配の各々が第1の引数に対して得られた損失関数であり;損失関数の第1の引数は、連続ベクトルの現在値をとり、第2の引数は、1つ以上のサンプルから、選択されたサンプルの値をとり、選択されたサンプルは、非反復的に選択される、工程;および、1つ以上の勾配の平均値を得る工程;1つ以上の勾配の平均値の和および/または部分和を得ることであって、上記和は、損失関数の選択された部分集合中のすべての損失関数に対するものであり、部分和は、損失関数の選択された部分集合中の1つを超える損失関数に対するものである、こと;v1)1つ以上の勾配の平均値の和あるいは部分和、v2)スケーリングパラメーターの集合の現在値、v3)1つ以上の勾配の平均値の和あるいは部分和の履歴の少なくとも一部、および/または、v4)スケーリングパラメーターの集合の値の履歴の少なくとも一部;に少なくとも部分的に基づいて検索方向を計算すること;vi1)スケーリングパラメーターの集合の現在値、vi2)損失関数の集合、vi3)スケーリングパラメーターの集合の値の履歴の少なくとも一部、および/または、vi4)損失関数の集合の履歴の少なくとも一部;に少なくとも部分的に基づいてステップ長を計算すること;ステップ長と検索方向を使用して、更新された現在の連続ベクトルを計算すること;ならびに、更新された現在の連続ベクトルとなるように連続ベクトルの現在値を設定すること、を行うように構成される。
本開示は、複雑なロバスト推定問題を解決するためのサンプリングデバイスを有利に利用する。サンプリングデバイスは、スケーリングパラメーターの集合のスケジュールおよびロバスト推定問題のデータを得るために、量子プロセッサーと量子デバイス制御システムを備えることができる。量子プロセッサーは、デジタルコンピューターと量子デバイス制御システムに結合され得る。量子プロセッサーは、複数のキュービットと複数のカプラーを備えてもよく、複数のカプラーの各カプラーは、複数のキュービットの2つのキュービットの交差点で通信可能な結合を提供するためのものである。離散ベクトルの1つ以上のサンプルは、ボルツマン分布に従うこともある。
サンプリングデバイスは光パラメトリック発振器のネットワークであり得、上記ネットワークは:光学装置であって、光エネルギー源からエネルギーを受信し、複数の光パラメトリック発振器を生成するように構成された光学装置;および、複数の結合装置であって、その各々が複数の光パラメトリック発振器の光パラメトリック発振器と制御可能に結合する、結合装置を含む。サンプリングデバイスは、中央処理装置、例えば、デジタルコンピューターあるいはモバイルデバイス、および、中央処理装置に結合された記憶装置を備え得る。記憶装置は、スケーリングパラメーターのスケジュールおよびロバスト推定問題のデータを得るためのアプリケーションを備え得る。そのようなアプリケーションは、ウェブアプリケーションまたはモバイルアプリケーションであり得る。
サンプリングデバイスは再構成可能なデジタルハードウェア、中央処理装置、および記憶装置を備え得、中央処理装置と記憶装置は、再構成可能なデジタルハードウェアに結合される。再構成可能なデジタルハードウェアは、スケーリングパラメーターのスケジュールおよびロバスト推定問題のデータを得るために適合され得、および、再構成可能なデジタルハードウェアは、マルコフ連鎖モンテカルロアルゴリズムを実施するように適合される。マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッド量子アニーリングであり得る。マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッドアニーリングであり得る。マルコフ連鎖モンテカルロアルゴリズムは、ギブスサンプリングであり得る。
集合の損失関数は1つ以上の損失関数を備え得る。
ロバスト推定問題の確率的最適化は、構造化サポートベクターマシンの訓練に関連付けられ得る。損失関数の重複しない部分集合の各部分集合は、2つの損失関数しか備えないこともある。ロバスト推定問題の確率的最適化は、画像分割に関連付けられ得る。
ロバスト推定問題の確率的最適化は、圧縮センシングからの双対基底追跡問題に関連付けられ得る。
ロバスト推定問題の確率的最適化は、半教師あり学習に関連付けられ得る。ロバスト推定問題のデータは、1つ以上の画像分割問題に関連付けられ得る。ロバスト推定問題のデータは、1つ以上の圧縮センシング問題からの双対基底追跡問題に関連付けられ得る。ロバスト推定問題のデータは、半教師あり学習に関連付けられ得る。ロバスト推定問題のデータは、名詞句共参照解析問題から得られ得る。ロバスト推定問題のデータは、アクティブラーニングに関連付けられ得る。ロバスト推定問題のデータは、1つ以上の画像タグ付け問題に関連付けられ得る。ロバスト推定問題のデータは、推奨システムに関連付けられ得る。
スケーリングパラメーターのスケジュールの集合は、ユーザーによって手動で、あるいは、アルゴリズムあるいはコンピュータプログラムによって、決定することができる。スケーリングパラメーターの集合のスケジュールは、スケーリングパラメーターの集合の履歴に基づいて機械学習アルゴリズムを使用して決定することができる。
デジタルコンピューターは、サンプリングデバイスに対して遠隔に位置することができる。
停止基準は、現在の連続ベクトルと更新された現在の連続ベクトルとの間の距離の大きさに少なくとも部分的に基づき得る。
損失関数は、引数の第1および第2の集合の合成関数から構成可能である。
1つ以上の勾配を得る操作において、1つ以上の勾配の各々は、第1の引数に関して得られる損失関数であってもよく、連鎖律の反復適用から構成される。連鎖律の反復適用は自動微分を使用して実施され得る。
場合によっては、合成関数の変関数(argument function)には、微分可能な特徴抽出器(feature extractors)がある。場合によっては、微分可能な特徴抽出器には、ディープニューラルネットワークがある。
検索方向の計算は、確率的勾配降下法(SGD)、確率的平均勾配法(SAGとSAGA)、確率的分散減少勾配(SVRG)、および確率的双対座標上昇(SDCA)の1つ以上を利用し得る。
ステップ長の計算は、適応勾配降下法のうちの1つを使用し、限定されないが、Adam、減少平均平方(RMS)、RMSProp、およびAdaGradを含み得る。
別の態様において、サンプリングデバイスを使用して、ロバスト推定問題の確率的最適化のためのコンピューターで実施される方法は、(a)デジタルコンピューターによって、上記ロバスト推定問題のデータを受け取る工程であって、上記データが:(i)重複しない部分集合へと分類された目的関数あるいは損失関数の集合であって、損失関数の上記集合中のそれぞれの目的関数あるいは損失関数が、第1の引数と第2の引数を受け入れる、集合;および、(ii)上記目的関数あるいは損失関数の上記集合中のそれぞれの目的関数あるいは損失関数の許容可能なベクトルの集合、を含む、工程;(b)上記デジタルコンピューターによって、ベクトルの現在値を設定する工程;(c)上記デジタルコンピューターによって、スケーリングパラメーターの集合のスケジュールを受け取る工程;および、(d)停止基準が満たされるまで:(i)上記スケジュールに少なくとも部分的に基づいてスケーリングパラメーターの上記集合の現在値を決定する工程;(ii)上記重複しない部分集合から上記の目的関数あるいは損失関数の部分集合を選択する工程;(iii)上記の目的関数あるいは損失関数の上記選択された部分集合のそれぞれの目的関数あるいは損失関数について以下の工程を繰り返す工程:(1)上記サンプリングデバイスによって、上記の目的関数あるいは損失関数に関連付けられる許容可能なベクトルの上記集合からベクトルの1つ以上のサンプルを生成する工程;(2)上記デジタルコンピューターによって、1つ以上の勾配を得る工程であって、上記1つ以上の勾配の各々が上記第1の引数に対して得られた上記の目的関数あるいは損失関数のものである、工程;および、(3)上記デジタルコンピューターによって、上記1つ以上の勾配の平均値を得る工程;(iv)上記デジタルコンピューターによって、上記1つ以上の勾配の上記平均値の和あるいは部分和を得る工程であって、上記和は、上記の目的関数あるいは損失関数の上記選択された部分集合中のすべての目的関数あるいは損失関数に関するものであり、上記部分和は、上記損失関数の上記選択された部分集合中の1つを超える目的関数あるいは損失関数に関するものである、工程;(v)上記デジタルコンピューターによって:v1)上記1つ以上の勾配の上記平均値の上記和あるいは上記部分和;v2)スケーリングパラメーターの上記集合の上記現在値;v3)上記1つ以上の勾配の上記平均値の上記和あるいは上記部分和の履歴の少なくとも一部;および、v4)スケーリングパラメーターの上記集合の上記値の履歴の少なくとも一部;の1つ以上に少なくとも部分的に基づいて検索方向を計算する工程;(vi)上記デジタルコンピューターによって:vi1)スケーリングパラメーターの上記集合の上記現在値;vi2)上記損失関数の上記選択された部分集合;vi3)スケーリングパラメーターの上記集合の値の履歴の少なくとも一部、および、vi4)上記の目的関数あるいは損失関数の上記選択された部分集合の履歴の少なくとも一部;の1つ以上に少なくとも部分的に基づいて、ステップ長を計算する工程;および、(vii)上記デジタルコンピューターによって、上記ステップ長と上記検索方向に基づいて上記ベクトルの上記現在値を設定する工程、を含む。上記の目的関数あるいは損失関数は、上記の第1の引数と第2の引数の1つ以上の合成関数を備え得る。上記デジタルコンピューターによって、1つ以上の勾配を得る工程であって、上記1つ以上の勾配の各々が上記第1の引数に対して得られた上記の目的関数あるいは損失関数のものである、工程が、連鎖律の反復適用を含み得る。上記連鎖律は自動微分を使用して実施され得る。上記合成関数の1つ以上の変関数は微分可能な特徴抽出器を備え得る。上記微分可能な特徴抽出器はディープニューラルネットワークを備え得る。上記デジタルコンピューターによって、検索方向を計算する工程は、確率的勾配降下法(SGD)、確率的平均勾配法(SAGとSAGA)、確率的分散減少勾配(SVRG)、あるいは確率的双対座標上昇(SDCA)の1つ以上を使用する工程を含み得る。上記デジタルコンピューターによって、ステップ長を計算する工程は、上記適応勾配降下法の1つ以上を使用する工程を含み、上記適応勾配降下法は、適応モーメント推定(Adam)、減少平均平方(RMS)、二乗平均平方根プロパゲーション(RMSProp)、および/または適応勾配アルゴリズム(AdaGrad)を含む。上記サンプリングデバイスは、スケーリングパラメーターの上記集合の上記スケジュールおよび上記ロバスト推定問題の上記データを得るために、量子プロセッサーと量子デバイス制御システムを備え得る。上記量子プロセッサーは、上記デジタルコンピューターと上記量子デバイス制御システムに結合され得る。上記量子プロセッサーは、複数のキュービットと複数のカプラーを備えてもよく、上記複数のカプラーの各カプラーは、上記複数のキュービットの2つのキュービットの交差点で通信可能な結合を提供するためのものである。離散ベクトルの上記1つ以上のサンプルは、ボルツマン分布に従うこともある。上記サンプリングデバイスは、光パラメトリック発振器のネットワークを備え得、上記ネットワークは:(a)光学装置であって、光エネルギー源からエネルギーを受信し、複数の光パラメトリック発振器を生成するように構成された光学装置;および、(b)複数の結合装置であって、その各々が上記複数の光パラメトリック発振器の光パラメトリック発振器と制御可能に結合する、結合装置を含む。上記サンプリングデバイスは、中央処理装置と、上記中央処理装置に結合された記憶装置を備え得る。上記記憶装置は、上記スケーリングパラメーターの上記スケジュールおよび上記ロバスト推定問題の上記データを得るためのアプリケーションを備え得、上記アプリケーションはマルコフ連鎖モンテカルロアルゴリズムを実行するように構成される。上記サンプリングデバイスは再構成可能なデジタルハードウェア、中央処理装置、および記憶装置を備え得、上記中央処理装置と上記記憶装置は、上記再構成可能なデジタルハードウェアに結合される。上記再構成可能なデジタルハードウェアは、上記スケーリングパラメーターの上記スケジュールと、上記ロバスト推定問題の上記データを得るように構成され得、上記再構成可能なデジタルハードウェアは、マルコフ連鎖モンテカルロアルゴリズムを実行するように構成され得る。上記マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッド量子アニーリングを含み得る。上記マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッドアニーリングを含み得る。上記マルコフ連鎖モンテカルロアルゴリズムは、ギブスサンプリングを含み得る。目的関数あるいは損失関数の上記集合は、1つ以上の目的関数あるいは損失関数を備え得る。上記ロバスト推定問題の上記確率的最適化は、構造化サポートベクターマシンの訓練に関連付けられ得る。目的関数あるいは損失関数の上記重複しない部分集合の各部分集合は、2つの目的関数あるいは損失関数しか備えないこともある。上記ロバスト推定問題の上記データは、画像分割問題に関連付けられ得る。上記ロバスト推定問題の上記データは、圧縮センシング問題からの上記双対基底追跡問題に関連付けられ得る。上記ロバスト推定問題の上記データは、半教師あり学習に関連付けられ得る。上記ロバスト推定問題の上記データは、名詞句共参照解析問題から得られ得る。上記ロバスト推定問題の上記データは、アクティブラーニングに関連付けられ得る。上記ロバスト推定問題の上記データは、画像タグ付け問題に関連付けられ得る。上記ロバスト推定問題の上記データは、推奨システムに関連付けられ得る。スケーリングパラメーターの上記集合の上記スケジュールは、ユーザーによって、あるいはアルゴリズムによって自動的に決定され得る。上記デジタルコンピューターは、上記サンプリングデバイスに対して遠隔に位置し得る。上記停止基準は、上記現在の連続ベクトルと上記更新された現在のするベクトルとの間の距離の大きさに少なくとも部分的に基づき得る。上記第1の引数と第2の引数は独立してもよく、第1の引数はその値として連続ベクトルを使用し得、上記第2の引数はその値として離散ベクトルを使用し得、および、許容可能なベクトルの上記集合は、許容可能な離散ベクトルの集合を含み得る。(1)は上記サンプリングデバイスによって、離散ベクトルの1つ以上のサンプルを生成する工程を含み得、上記1つ以上のサンプルの各サンプルは、上記の目的関数あるいは損失関数に関連付けられる許容可能な離散ベクトルの上記集合から生成され、上記1つ以上のサンプルの各サンプルは、スケーリングパラメーターの集合と上記の目的関数あるいは損失関数によって少なくとも部分的に決定された確率分布に基づき生成され、上記の目的関数あるいは損失関数の上記第1の引数は、上記連続ベクトルの上記現在値をとる。(2)は上記デジタルコンピューターによって、1つ以上の勾配を得る工程を含み得、上記1つ以上の勾配の各々が上記第1の引数に対して得られた上記の損失関数のものである、工程;上記損失関数の上記第1の引数は、上記連続ベクトルの現在値をとり、上記第2の引数は、上記1つ以上のサンプルから、選択されたサンプルの値をとり、上記選択されたサンプルは、非反復的に選択される。上記停止基準は、上記ロバスト推定問題の解の精度を決定するためのルールの集合を含み得る。目的関数あるいは損失関数の上記部分集合の上記選択は、非反復的あるいは反復的であり得る。
別の態様において、サンプリングデバイスを使用して、ロバスト推定問題の確率的最適化のためのシステムは、デジタルコンピューターを含み得、上記デジタルコンピューターは:(a)上記ロバスト推定問題のデータを受け取ることであって、上記データが:(i)重複しない部分集合へと分類された目的関数あるいは損失関数の集合であって、損失関数の上記集合中のそれぞれの目的関数あるいは損失関数が、第1の引数と第2の引数を受け入れる、集合;および、(ii)上記目的関数あるいは損失関数の上記集合中のそれぞれの目的関数あるいは損失関数の許容可能なベクトルの集合、を含む、こと;(b)ベクトルの現在値を設定すること;(c)スケーリングパラメーターの集合のスケジュールを受け取ること;および、(d)停止基準が満たされるまで:(i)上記スケジュールに少なくとも部分的に基づいてスケーリングパラメーターの上記集合の現在値を決定すること;(ii)上記重複しない部分集合から上記の目的関数あるいは損失関数の部分集合を選択すること;(iii)上記の目的関数あるいは損失関数の上記選択された部分集合のそれぞれの目的関数あるいは損失関数について以下の工程を繰り返すこと:(1)上記サンプリングデバイスによって、上記の目的関数あるいは損失関数に関連付けられる許容可能なベクトルの上記集合からベクトルの1つ以上のサンプルを生成する工程;(2)上記デジタルコンピューターによって、1つ以上の勾配を得る工程であって、上記1つ以上の勾配の各々が上記第1の引数に対して得られた上記の目的関数あるいは損失関数のものである、工程;および、(3)上記1つ以上の勾配の平均値を得る工程;(iv)上記1つ以上の勾配の上記平均値の和あるいは部分和を得ることであって、上記和は、上記の目的関数あるいは損失関数の上記選択された部分集合中のすべての目的関数あるいは損失関数に関するものであり、上記部分和は、上記損失関数の上記選択された部分集合中の1つを超える目的関数あるいは損失関数に関するものである、こと;(v):v1)上記1つ以上の勾配の上記平均値の上記和あるいは上記部分和;v2)スケーリングパラメーターの上記集合の上記現在値;v3)上記1つ以上の勾配の上記平均値の上記和あるいは上記部分和の履歴の少なくとも一部;および、v4)スケーリングパラメーターの上記集合の上記値の履歴の少なくとも一部;の1つ以上に少なくとも部分的に基づいて検索方向を計算すること;(vi):vi1)スケーリングパラメーターの上記集合の上記現在値;vi2)上記損失関数の上記選択された部分集合;vi3)スケーリングパラメーターの上記集合の値の履歴の少なくとも一部、および、vi4)上記の目的関数あるいは損失関数の上記選択された部分集合の履歴の少なくとも一部;の1つ以上に少なくとも部分的に基づいて、ステップ長を計算すること;および、(vii)上記ステップ長と上記検索方向に基づいて上記ベクトルの上記現在値を設定すること、を行うように構成される。上記の目的関数あるいは損失関数は、上記の第1の引数と第2の引数の1つ以上の合成関数を備え得る。上記デジタルコンピューターによって、1つ以上の勾配を得る工程であって、上記1つ以上の勾配の各々が上記第1の引数に対して得られた上記の目的関数あるいは損失関数のものである、工程が、連鎖律の反復適用を含み得る。上記連鎖律は自動微分を使用して実施され得る。上記合成関数の1つ以上の変関数は微分可能な特徴抽出器を備え得る。上記微分可能な特徴抽出器はディープニューラルネットワークを備え得る。上記デジタルコンピューターによって、検索方向を計算する工程は、確率的勾配降下法(SGD)、確率的平均勾配法(SAGとSAGA)、確率的分散減少勾配(SVRG)、あるいは確率的双対座標上昇(SDCA)の1つ以上を使用する工程を含み得る。上記デジタルコンピューターによって、ステップ長を計算する工程は、上記適応勾配降下法の1つ以上を使用する工程を含み、上記適応勾配降下法は、適応モーメント推定(Adam)、減少平均平方(RMS)、二乗平均平方根プロパゲーション(RMSProp)、および/または適応勾配アルゴリズム(AdaGrad)を含む。上記サンプリングデバイスは、スケーリングパラメーターの上記集合の上記スケジュールおよび上記ロバスト推定問題の上記データを得るために、量子プロセッサーと量子デバイス制御システムを備え得る。上記量子プロセッサーは、上記デジタルコンピューターと上記量子デバイス制御システムに結合され得る。上記量子プロセッサーは、複数のキュービットと複数のカプラーを備えてもよく、上記複数のカプラーの各カプラーは、上記複数のキュービットの2つのキュービットの交差点で通信可能な結合を提供するためのものである。離散ベクトルの上記1つ以上のサンプルは、ボルツマン分布に従うこともある。上記サンプリングデバイスは、光パラメトリック発振器のネットワークを備え得、上記ネットワークは:(a)光学装置であって、光エネルギー源からエネルギーを受信し、複数の光パラメトリック発振器を生成するように構成された光学装置;および、(b)複数の結合装置であって、その各々が上記複数の光パラメトリック発振器の光パラメトリック発振器と制御可能に結合する、結合装置を含む。上記サンプリングデバイスは、中央処理装置と、上記中央処理装置に結合された記憶装置を備え得る。上記記憶装置は、上記スケーリングパラメーターの上記スケジュールおよび上記ロバスト推定問題の上記データを得るためのアプリケーションを備え得る。上記アプリケーションはマルコフ連鎖モンテカルロアルゴリズムを実行するように構成される。上記サンプリングデバイスは再構成可能なデジタルハードウェア、中央処理装置、および記憶装置を備え得、上記中央処理装置と上記記憶装置は、上記再構成可能なデジタルハードウェアに結合される。上記再構成可能なデジタルハードウェアは、上記スケーリングパラメーターの上記スケジュールと、上記ロバスト推定問題の上記データを得るように構成され得、上記再構成可能なデジタルハードウェアは、マルコフ連鎖モンテカルロアルゴリズムを実行するように構成され得る。上記マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッド量子アニーリングを含み得る。上記マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッドアニーリングを含み得る。上記マルコフ連鎖モンテカルロアルゴリズムは、ギブスサンプリングを含み得る。目的関数あるいは損失関数の上記集合は、1つ以上の目的関数あるいは損失関数を備え得る。上記ロバスト推定問題の上記確率的最適化は、構造化サポートベクターマシンの訓練に関連付けられ得る。目的関数あるいは損失関数の上記重複しない部分集合の各部分集合は、2つの目的関数あるいは損失関数しか含まないこともある。上記ロバスト推定問題の上記データは、画像分割問題に関連付けられ得る。上記ロバスト推定問題の上記データは、圧縮センシング問題からの上記双対基底追跡問題に関連付けられ得る。上記ロバスト推定問題の上記データは、半教師あり学習に関連付けられ得る。上記ロバスト推定問題の上記データは、名詞句共参照解析問題から得られ得る。上記ロバスト推定問題の上記データは、アクティブラーニングに関連付けられ得る。上記ロバスト推定問題の上記データは、画像タグ付け問題に関連付けられ得る。上記ロバスト推定問題の上記データは、推奨システムに関連付けられ得る。スケーリングパラメーターの上記集合の上記スケジュールは、ユーザーによって、あるいはアルゴリズムによって自動的に決定され得る。上記デジタルコンピューターは、上記サンプリングデバイスに対して遠隔に位置し得る。上記停止基準は、上記現在の連続ベクトルと上記更新された現在のするベクトルとの間の距離の大きさに少なくとも部分的に基づき得る。上記第1の引数と第2の引数は独立してもよく、第1の引数はその値として連続ベクトルを使用し得、上記第2の引数はその値として離散ベクトルを使用し得、および、許容可能なベクトルの上記集合は、許容可能な離散ベクトルの集合を含み得る。(1)は上記サンプリングデバイスによって、離散ベクトルの1つ以上のサンプルを生成する工程を含み得、上記1つ以上のサンプルの各サンプルは、上記の目的関数あるいは損失関数に関連付けられる許容可能な離散ベクトルの上記集合から生成され、上記1つ以上のサンプルの各サンプルは、スケーリングパラメーターの集合と上記の目的関数あるいは損失関数によって少なくとも部分的に決定された確率分布に基づき生成され、上記の目的関数あるいは損失関数の上記第1の引数は、上記連続ベクトルの上記現在値をとる。(2)は上記デジタルコンピューターによって、1つ以上の勾配を得る工程を含み得、上記1つ以上の勾配の各々が上記第1の引数に対して得られた上記の損失関数のものである、工程;上記損失関数の上記第1の引数は、上記連続ベクトルの現在値をとり、上記第2の引数は、上記1つ以上のサンプルから、選択されたサンプルの値をとり、上記選択されたサンプルは、非反復的に選択される。上記停止基準は、上記ロバスト推定問題の解の精度を決定するためのルールの集合を含み得る。目的関数あるいは損失関数の上記部分集合の上記選択は、非反復的あるいは反復的であり得る。
本開示の別の態様は、1つ以上のコンピュータプロセッサによる実行に際し、上記または本明細書のどこかに記載の方法のいずれかを実行する、機械実行可能コードを含む非一時的なコンピューター可読媒体を提供する。
本開示の別の態様は、1つ以上のコンピュータプロセッサと、それに結合された非一時的なコンピューター可読媒体(例えば、コンピュータメモリー)とを含むシステムを提供する。非一時的なコンピューター可読媒体は、1つ以上のコンピュータプロセッサによる実行に際し、上記または本明細書のどこかに記載の方法のいずれかを実行する機会実行可能コードを含む。
本開示のさらなる態様および利益は、以下の詳細な説明から、当業者に容易に明らかとなり、ここでは、本開示の例示的な実施形態のみが示され、記載される。以下の記載から分かるように、本開示は他のおよび異なる実施形態であってもよく、そのそれぞれの詳細は、すべてが本開示から逸脱することなく、様々な明白な点において修正が可能である。従って、図面と記載は本来、例示的なものとしてみなされ、限定的なものであるとはみなされない。
引用による組み込み
本明細書で言及される出願公開、特許、および特許出願はすべて、あたかも個々の出願公開、特許、あるいは特許出願がそれぞれ参照により組み込まれることが具体的かつ個別に示されている場合と同様の範囲で、参照により本明細書に組み込まれる。参照により組み込まれる特許公開、特許、または特許出願が本明細書に含まれる開示に矛盾するという程度まで、本明細書は、そのような矛盾のある題材に取って代わるおよび/またはそれに優先することを意図している。
本主題の特徴と利点のより良い理解は、例証的な実施形態と添付の図面を説明する以下の詳細な記載を参照することによって得られる:
サンプリングデバイスを使用して、ロバスト推定問題の確率的最適化のための方法の非限定的な例のフローチャートを示す。 ロバスト推定問題の確率的最適化のためのシステムの非限定的な例を示す。
本発明の様々な実施形態が本明細書中に示され記述された一方、そのような実施形態が一例として提供されているにすぎないことは当業者に明らかになるであろう。多くの変更、変化、および置換が、本発明から逸脱することなく当業者に想到され得る。本明細書に記載される本発明の実施形態の様々な代替物が利用され得ることを理解されたい。
本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が明確に指定していない限り、複数の基準を含む。「または」への任意の言及は、別段の定めがない限り、「および/または」を包含することを意図している。
本明細書で開示されるように、「変数」とは本明細書の「引数」の同等物である。
本明細書で開示されたように、ベクトルの値、例えば、連続ベクトルまたは離散ベクトルを設定することは、ベクトルのすべての要素の設定値であり得る。その他の場合において、ベクトルの値を設定することは、ベクトルの1つ以上の要素の設定値であり得る。ロバスト推定問題
1つの態様において、本開示は、ロバスト推定問題を解決するための確率的最適化方法内でサンプリングデバイスを利用する方法およびシステムを提供する。方法およびシステムは、機械学習方法において効率的でロバストな最適化テクニックを可能にするフレームワークを提供し得る。機械学習方法の非限定な例としては:構造的なサポートベクターマシン(SSVM)、半教師あり学習、およびアクティブラーニングが挙げられる。これらの方法は、自然言語処理(例えば、名詞句共参照解析)、コンピュータビジョンと画像処理(例えば、画像分割、画像タグ付け)、およびデータサイエンス(例えば、文書のクラスタリング、群集内の集団検出、推奨システム、半教師あり学習、およびアクティブラーニングなど)などの用途に役立ち得る。
ロバスト推定問題は、計算タスクに対する解が見出され得る推定または仮定のロバスト性および/または精度に関連付けられ得る。言い換えれば、解が得られ得る推定や仮定からどれだけ多くの逸脱が生じうるか。推定方法のロバスト性は、例えば、非理想的な予測や最も信頼性の低い予測に対しても、確率を高めたり、あるいは優れた性能を保証したりするモデルを訓練することによって、外れ値に対するその抵抗性に関連することもある。ロバスト推定問題は方程式(1)のように表現され得る:
Figure 0007288905000001
ここで、
Figure 0007288905000002
は、n次元の実ベクトル空間中の許容可能なベクトルを規定する集合であり得;
Figure 0007288905000003
は、n次元の実ベクトル空間中のベクトルを実数の値にマッピングする関数であり得;すべての
Figure 0007288905000004
は、実数値関数であり得;
Figure 0007288905000005
は実数であり得、
Figure 0007288905000006
は、引数yが値をとることができるベクトル(ベクトルの有限集合など)の集合であり得、iとiは、それぞれ1~mまでと1~mまでの範囲の独立した添え字であり得、および、xとyは、それぞれCと、
Figure 0007288905000007
からの任意のベクトルであり得る2つの引数(2つの独立した引数など)であり得る。本明細書で記載されるロバスト推定問題の最適化は、方程式(1)で記載される最小化問題、あるいは、方程式(1)と同等であり得るかまたは方程式(1)によって記載され得る任意の他の問題を解決することを指すこともある。場合によっては、集合Cは凸集合であり、関数f(x)とすべての関数
Figure 0007288905000008
は凸であり、すべての実数
Figure 0007288905000009
は正である。そのような場合、方程式(1)によって記載された最適化問題は凸最適化問題になり、大域的最適解の都合のいい近似値を作成するために、凸最適化方法を使用することができる。そのような凸最適化方法は、多項式時間でスケーリングする手続きを用いて効率的に実装することができる。しかしながら、その他の場合、最適化問題は非凸であり得る。例えば、潜在的なSSVM最適化問題のように、実数
Figure 0007288905000010
が負であり得るとき、最適化問題は非凸であり得る。別の例として、関数
Figure 0007288905000011
がニューラルネットに対応する場合のように、関数
Figure 0007288905000012
が非凸であるとき、(1)の中の最適化問題は非凸であり得る。
関数(例えば、目的関数あるいは損失関数)
Figure 0007288905000013
(本明細書では、g(x,y)とも呼ばれる)のうちの1つを参照すると、関数
Figure 0007288905000014
は、最大値が一意に達成されるxに関してのみ微分可能であり得る。その場合、最大値(例えば、
Figure 0007288905000015
)が一意でない場合、g(x,y)は単に劣微分可能(subdifferentiable)であり得、劣微分は方程式(2)によって以下のように与えられ得る:
Figure 0007288905000016
ここで、coは凸包の表記法であり得、∂xはxに関して偏導関数であり得る。その後、この集合の要素を計算する(例えば、∂g(x)をコンピューターで計算する)ことは、結局、方程式(1)の内部最大化問題
Figure 0007288905000017
を解くことと、閾値あるいは最大値を達成する点yでxに関してg(x,y)を微分することになり得る。
場合によっては、目的関数あるいは損失関数g(x,y)は、任意の実数値関数であり得る。場合によっては、目的関数あるいは損失関数g(x,y)は、任意の実数値関数であり得、第2の引数yは離散的であり、第1の引数xは離散ベクトルである。場合によっては、目的関数あるいは損失関数g(x,y)は、任意の実数値関数であり得、第2の引数yは継続ベクトルであり、第1の引数xは離散ベクトルである。場合によっては、目的関数あるいは損失関数g(x,y)は、任意の実数値関数であり得、第2の引数yは継続ベクトルであり、第1の引数xは継続ベクトルである。場合によっては、目的関数あるいは損失関数g(x,y)は、任意の実数値関数であり得、第2の引数yは離散ベクトルであり、第1の引数xは継続ベクトルである。
場合によっては、目的関数あるいは損失関数g(x,y)は、その第2の引数yで線形であり得る。場合によっては、目的関数あるいは損失関数g(x,y)は、その第2の引数yで二次式であり得る。もし目的関数あるいは損失関数g(x,y)がその第2の引数yにおいて二次式である場合、方程式(1)の内部最大化は、いくつかのm、および、xに依存し得る対称行列Q(x)とベクトルc(x)について、方程式(3)のような二次最適化問題(2値変数の二次最適化問題など)と言い変えることができ:
Figure 0007288905000018
ここで、方程式(3)の左辺式の解yは、方程式(3)の右辺の解zから構成することができる。ここで、変数zは、変数yの符号化(2進符号化など)に対応し得る。いくつかの実施形態では、このような符号化は、計算可能なマッピングz→yによって与えることができる。したがって、gの劣勾配は、二次最適化問題(2進法の二次最適化問題などの)を解くことにより得ることができる。
方程式(1)は、連続ベクトルxの関数であり得る関数f(x)を含むことができ、連続ベクトルは実数値であってもよい。関数f(x)は、方程式(1)の最適化を調整し得る。関数f(x)はオプションの関数であり得、変数xがとり得る1つ以上の可能な値に対して0の値をとることもある。例えば、構造化サポートベクターマシン(SSVM)では、f(x)はregularizerであり得、これは、過剰適合を減らすのに役立ち得る。
方程式(1)では、xは、制約集合Cからその値を取ることができる第1の変数または引数であってもよく、実数値を含んでもよい。制約集合Cは多くの連続ベクトルを含み得、その数は1以上の任意の数であり得る。それぞれの連続ベクトルは実数値を含み得る。ロバスト推定問題の最適化は、yによって決定されるxに関してのみ閾値化または最小化を含み得、その一方で、ベクトルyは「内部」であってもよい。
ロバスト推定問題のデータ
本明細書に記載されるロバスト推定問題の確率的最適化のための方法は、ロバスト推定問題のデータを得る工程を含み得る。そのようなデータは、生データから手動あるいは自動であらかじめ生成されてもよい。そのようなデータは、デジタルコンピューターによって得られてもよい。そのようなデータは、本明細書に記載されるロバスト推定問題などの、ロバスト推定問題の確率的最適化のための本明細書に記載される方法によって、少なくとも部分的に利用されてもよい。
ロバスト推定問題のそのようなデータは、反復最適化プロセスが当初の値で開始することができるように、方程式(1)の1つ以上のパラメーターおよび/または引数の当初の値を含み得る。
ロバスト推定問題のそのようなデータは目的関数あるいは損失関数の集合を含み得、ここで、各目的関数あるいは損失関数は、
Figure 0007288905000019
として表すことができ、iとiは、添え字i∈{1,...,m}とi∈{1,...,m}を有する独立した添え字であり、xは連続ベクトルであり得、および
Figure 0007288905000020
は離散ベクトルであり得る。添え字iは、目的関数または損失関数の重複しない部分集合を選択する最適化プロセスの1つ以上の全反復のための定数であってもよく、予め決められた選択手順に基づいて他の反復のために選択されてもよい。添え字iは、添え字iに対応するそれぞれ重複しない部分集合中の目的関数または損失関数の数に対する添え字であってもよい。
目的関数あるいは損失関数の集合は、1つ以上の目的関数あるいは損失関数を含み得る。目的関数あるいは損失関数の集合は、複数の目的関数あるいは損失関数を含み得る。1つの目的関数あるいは損失関数のみが集合に含まれている場合では、目的関数または損失関数の部分集合は目的関数あるいは損失関数の集合であり得る。目的関数あるいは損失関数の集合が2つ以上の目的関数あるいは損失関数を含む場合、目的関数あるいは損失関数の集合は、重複しない部分集合へと分類され得る。目的関数または損失関数の重複しない部分集合の各々は、わずか2つの目的関数あるいは損失関数のみを含み得る。各部分集合は、1、2、3、4、5、6、10、20、30、50、60、70、80、90、100またはそれより多くの目的関数あるいは損失関数を含んでいてもよい。各部分集合は少なくとも約1、2、3、4、5、6、10、20、30、40、50、60、70、80、90、100またはそれより多くの目的関数あるいは損失関数を含んでいてもよい。その他の場合において、各部分集合は、最大約1、2、3、4、5、6、10、20、30、40、50、60、70、80、90、100、またはそれより少ない目的関数あるいは損失関数を含んでいてもよい。目的関数あるいは損失関数の集合間で、各目的関数あるいは損失関数は第1の引数xおよび第2の引数yを受け入れることができる。第1および第2の引数は独立引数であってもよい。第1および第2の引数は依存引数であってもよい。第1の引数はその値として連続ベクトルをとる場合があり、第2の引数はその値として離散ベクトルをとる場合がある。
ロバスト推定問題のそのようなデータは、各目的関数あるいは損失関数の線型結合の重み(linear-combination weight)を含み得:方程式(1)中の各損失関数は、全体的な和へのその寄与に影響を及ぼすスカラー
Figure 0007288905000021
であり得る、重みによって重み付けされてもよい。
ロバスト推定問題のそのようなデータは、変数yが値をとることができる各損失関数について、許容可能な離散ベクトルの集合
Figure 0007288905000022
を含んでいてもよい。
ロバスト推定問題のそのようなデータは、第1の反復における全損失関数の第1の引数についての当初の連続ベクトルを含み得る。ロバスト推定問題のそのようなデータは、第1の反復における1つ以上の損失関数の第1の引数についての初期連続ベクトルを含み得る。
ロバスト推定問題の方法は、反復最適化プロセスの第1の反復中のスケーリングパラメーターの集合の現在値を、スケーリングパラメーターの集合の当初の値に設定することができる。当初の値は、本明細書に記載されるスケジュールに少なくとも部分的に基づく場合がある。後の反復では、スケーリングパラメーターの集合の現在値は、本明細書で記載されるように、スケジュールに少なくとも部分的に基づいて更新されてもよい。
ロバスト推定問題を解決するための方法は、スケーリングパラメーターの集合のスケジュールを受け取るか、あるいは生成することができ、そこからスケーリングパラメーターの集合の現在値を得ることができる。上記スケジュールは、ユーザーによって先験的に決定されるか、あるいは選択されたアルゴリズムによって自動的に調節されてもよい。スケーリングパラメーターの集合の当初の値は、スケジュールに含まれているか、あるいはスケジュールに少なくとも部分的に基づいていてもよい。スケジュールは理論的または経験的知識に基づいて生成され得る。スケジュールは、以下から選択される1つ以上のアルゴリズムあるいは手順を使用して生成されてもよい:統計的アルゴリズムあるいは手順、パターン認識アルゴリズムあるいは手順、機械学習アルゴリズムあるいは手順、深層学習アルゴリズムあるいは手順、人工知能アルゴリズムあるいは手順、ニューラルネットなど。上記スケジュールは、スケーリングパラメーターの集合の歴史的価値を用いて生成されてもよい。スケーリングパラメーターの集合は、任意の実数の値をとり得る。スケーリングパラメーターの集合は、任意の0ではない実数の値をとり得る。スケーリングパラメーターの集合は、任意の正の数および/または負の数の値をとり得る。
スケーリングパラメーターの集合は、本明細書のロバスト推定問題を解くための「ソフトマックス関数」において使用されてもよい。「ソフトマックス関数」は、方程式(4)のような滑らかな関数で、方程式(1)、例えば、
Figure 0007288905000023
の「最大」関数を近似することができ:
Figure 0007288905000024
式中、xは連続ベクトルであり得、
Figure 0007288905000025
は、離散ベクトルであり得、この離散ベクトルは、変数yが値をとり得る許容可能な状態の離散集合
Figure 0007288905000026
から選択され、
Figure 0007288905000027
は目的関数または損失関数であり得、ここで、iとiは添え字i∈{1,...,m}およびi∈{1,...,m}を有する、依存した添え字または独立した添え字であり得、ならびにβは、スケーリングパラメーターの集合のスケジュールから値を得る、スケーリングパラメーターの集合中の要素であり得る。方程式(4)では、βはスケーリングパラメーターの集合中で唯一の要素であってもよい。
より高い値を有するそれらのβは、より低い値と比べて、方程式(4)中の左側の「最大」関数のより良い近似を可能にすることができる。しかし、より高い値は、トレードオフとしてサンプルの生成を遅くする可能性がある。最適化が比較的低いβで始まり、それが徐々に増加する場合、より高い値を有するスケーリングパラメーターの集合で始める場合と比べて、より少数の反復ステップで最適化問題を解くことができる。
方程式(4)のように、ソフトマックス近似と本明細書において同等な「スムースマックス(Smooth-max)」の近似は、以下の受益者プロパティ(beneficiary properties)を有する。
最大関数h(z)=max{z,...,z}は、方程式(5)のソフトマックス関数によって近似することができ:
Figure 0007288905000028
式中、μは1/βと同等の正のパラメーターであり得る。
最大関数h(z)=max{z,...,z}は、関数の集合(1集合の非線形関数など)で構成され得、方程式(4.1a)および(4.1b)のように、最大関数およびその滑らかな近似がともに考慮され得る:
Figure 0007288905000029
方程式(4.1b)のようなこの滑らかな近似のプロパティは、成分関数gの滑らかなプロパティに依存し得る。方程式(1)の文脈では、Y中の各要素はi=1:mで指標付けされてもよく、m=|Y|であり、ゆえに、
Figure 0007288905000030
であり、ここで、
Figure 0007288905000031
である。
最大化されることになっている、i∈{1,...,m}とi∈{1...,m}により指標付けされた目的関数あるいは損失関数
Figure 0007288905000032
を参照すると、本明細書に記載されるソフトマックスは、目的関数あるいは損失関数
Figure 0007288905000033
の各々に別々に適用することができ、ここで、
Figure 0007288905000034
である。
関数
Figure 0007288905000035
(ここで、
Figure 0007288905000036
コンパクト(compact)である)は、凸であり得、定数Lおよび有界ノルム
Figure 0007288905000037
を有するリプシッツ連続勾配を有しており、i=1:mである。
Figure 0007288905000038
にする。その後、方程式(4.1a)および(4.1b)に記述される関数は、以下の3つのステートメントの1つ以上を満たし得る:
Figure 0007288905000039
たとえ未合成の(uncomposed)滑らかな近似のリプシッツ定数が無限大ノルムで記述され得るとしても、これらのステートメントに現れるノルムは2ノルムであり得る。方程式(4.1b)中で与えられる滑らかな近似の勾配は以下によって与えられ得:
Figure 0007288905000040
式中、
Figure 0007288905000041
である。滑らかな近似hμの勾配は、勾配の平均値または加重平均値として得られ得る。したがって、近似hμの勾配は期待値として得ることができ、iは確率変数であり得る。iが方程式(5)から与えられたボルツマン分布に従う確率変数であり得る場合、近似値hμの勾配は期待値として得られ得:
Figure 0007288905000042
式中、
Figure 0007288905000043
はスケーリングパラメーターの集合における唯一の要素であり得る。
反復最適化プロセス
ロバスト推定問題の確率的最適化のための方法は、少なくとも1つの停止基準が満たされるまで、反復最適化プロセスの各反復における1つ以上の工程を反復して実施する工程を含み得る。そのような停止基準は、ロバスト推定問題の精度、感度、あるいは特異性の1つ以上を決定するための1つ以上のルールを含むルールの集合を含み得る。停止基準は、最適化プロセスの1反復における現在の連続ベクトルと、同じ反復あるいは異なる反復(例えば、前または後の反復)における更新された現在の連続ベクトルとの間の距離の大きさに少なくとも部分的に基づき得る。
各反復では、反復最適化プロセスの1つ以上の工程は、スケーリングパラメーターの集合の現在値を決定することを含み得る。現在値は、スケーリングパラメーターの集合のスケジュールに少なくとも部分的に基づき得る。
各反復では、反復最適化プロセスの1つ以上の工程は、重複しない部分集合から目的関数または損失関数の部分集合を、非反復的にあるいは反復的に選択することを含み得る。
各反復では、1つ以上のサブ工程は、目的関数あるいは損失関数の選択された部分集合の各目的関数あるいは損失関数に対して実施され得る。1つ以上のサブ工程は、方程式(1)中の変数または引数yに関する離散ベクトルの1つ以上のサンプルを生成することを含み得る。1つ以上のサンプルの各サンプルは、特定の目的関数あるいは損失関数に関連する許容可能な離散ベクトルの集合から選択され得る。1つ以上のサンプルの各サンプルは確率分布に基づいて生成され得る。場合によっては、確率分布は、スケーリングパラメーターの集合および特定の目的関数あるいは損失関数によって少なくとも部分的に決定される。損失関数の第1の引数は、反復における連続ベクトルの現在値を取り得る。例えば、各サンプルは、方程式(6)における確率分布に従って生成され得:
Figure 0007288905000044
式中、xは、各反復におけるすべてのサンプルに対する固定連続ベクトルとして保持され、および、βはスケーリングパラメーターであり得る。1つ以上のサンプルの各々は、本明細書に開示されるサンプリングデバイスを使用して生成さてれてもよい。例えば、k個の数のサンプルが生成され得、k個のサンプルが
Figure 0007288905000045
となるように、各サンプルは許容可能な状態の集合から選択され得、および、式中、i∈{1,...,m}の選択は、目的関数あるいは損失関数の選択された部分集合を表し得、およびi∈{1,...,m}は選択された部分集合における関数を表し得る。サンプルの確率分布は、任意の単一の確率分布あるいは様々な確率分布の任意の組み合わせであり得る。
本明細書のサンプリングデバイスは、ボルツマンモデルに従って分布されたサンプルを生成する、ランダムまたは擬似ランダムのジェネレータを含み得る。そのようなサンプリングデバイスは、ハードウェア(例えば、専用コンピューティングデバイス、量子プロセッサー、非古典コンピューター、量子コンピュータシステム、デジタルコンピューター、デジタル処理デバイスなど)および/または「ボルツマンサンプリング」を実施するように構成されるソフトウェアを含み得る。その後、近似勾配は、あらかじめ選択されたレベルの精度で、ロバスト推定問題を解くために使用することができる。サンプリングデバイスの利用およびサンプリングデバイスの接続は、複雑なロバスト推定問題を解くことができるように、ボルツマン分布に対する滑らかな関数近似の勾配を有利に接続ことができる。サンプリングデバイスは、方程式(6)で与えられたボルツマン分布の数学的定義によって決定される、1つ以上のプロパティを示し得る。サンプリングデバイスは、方程式(6)で与えられたボルツマン分布の数学的定義によって決定された1つ以上のプロパティを示すように構成され得る、任意のハードウェア、ソフトウェア、あるいはハードウェアとソフトウェアの組み合わせを含み得る。場合によっては、様々な構成を観察する規格化周波数は、それぞれの構成の方程式(6)で与えられた、数学的に定義される確率から選択された距離内にある。1つ以上のサンプルは、離散ベクトルのものであり得、および/またはボルツマン分布に従い得る。
ロバスト推定問題を解くためのシステムは、サンプル数を生成するためのサンプリングデバイスを含み得る。サンプリングデバイスは、スケーリングパラメーターの集合のスケジュール、ロバスト推定問題のデータ、あるいはそれらの組み合わせを得るための量子プロセッサーおよび量子デバイス制御システムを備え得る。量子プロセッサーは、デジタルコンピューターおよび量子デバイス制御システムに結合され得る。量子プロセッサーは、複数のキュービットと複数のカプラーを備えることができ、複数のカプラーの各カプラーは、複数のキュービットの2つのキュービットの交差点で通信結合を提供する。デジタルコンピューターは、サンプリングデバイスに対して遠隔に位置してもよい。
量子プロセッサーまたは量子コンピューターは、1つ以上の断熱量子コンピューター、量子ゲートアレイ、一方向量子コンピューター、トポロジカル量子コンピューター、量子チューリング機械、超伝導体ベースの量子コンピューター、イオントラップ量子コンピューター、トラップされた原子量子コンピューター(trapped atom quantum computer)、光格子、量子ドットコンピュータ、スピンを用いた量子コンピューター、空間ベースの量子コンピューター、Loss-DiVincenzo量子コンピューター、核磁気共鳴(NMR)ベースの量子コンピューター、溶液NMR量子コンピューター、固体NMR量子コンピューター、固体NMR Kane量子コンピューター、electrons-on-heliumの量子コンピューター、空洞量子電気力学ベースの量子コンピューター、分子磁石量子コンピューター、フラーレンベースの量子コンピューター、線形光学量子コンピューター、ダイヤモンドベースの量子コンピューター、窒素空孔(NV)ダイヤモンドベースの量子コンピューター、ボース=アインシュタイン凝縮ベースの量子コンピューター、トランジスタベースの量子コンピューター、および希土類金属イオンにドープした無機結晶ベースの量子コンピューターを含む。量子プロセッサーまたは量子コンピューターは、以下の1つ以上を備え得る:量子アニーラー、Ising solver、光パラメトリック発振器、および量子計算のゲートモデル。
量子プロセッサーまたは量子コンピューターは、1つ以上のキュービットを備え得る。1つ以上のキュービットは、超伝導キュービット、トラップされたイオンのキュービット、トラップされた原子のキュービット、光子キュービット、量子ドットのキュービット、電子スピンベースのキュービット、核スピンベースのキュービット、分子磁石のキュービット、フラーレンベースのキュービット、ダイヤモンドベースのキュービット、窒素空孔(NV)ダイヤモンドベースのキュービット、ボース=アインシュタイン凝縮ベースのキュービット、トランジスタベースのキュービット、あるいは希土類金属イオンにドープした無機結晶ベースのキュービットを含み得る。
サンプリングデバイスは、光パラメトリック発振器のネットワークであって、上記ネットワークは、光エネルギー源からエネルギーを受け取り、かつ複数の光パラメトリック発振器を生成するように構成される光学デバイスを含む、ネットワークと;複数の結合装置であって、その各々は、複数の光パラメトリック発振器の1つの光パラメトリック発振器を制御可能に結合する、複数の結合装置と、を含み得る。サンプリングデバイスは、基準位相に関連する光パルスの干渉を介して、二体相互作用、三体相互作用、あるいは多体相互作用をシミュレートする、光パラメトリック発振器のネットワークを含み得る。サンプリングデバイスは、その熱平衡の近くに留まるか、あるいはその定常状態に近づくことができる、調整可能および/または制御可能な多体相互作用を用いた1つ以上の物理システムを含み得る。
ロバスト推定問題を解くためのシステムは、デジタルコンピューター、あるいはその使用が含まれ得る。サンプリングデバイスは、デジタルコンピューター、中央処理装置、および上記中央処理装置に結合される記憶装置を含み得る。サンプリングデバイスは、スケーリングパラメーターのスケジュール、ロバスト推定問題のデータ、またはそれらの組み合わせを得るために、アプリケーション、ソフトウェアモジュール、コンピュータプログラム、ユーザーコンソール、あるいはそれらの使用を含み得る。アプリケーション、ソフトウェアモジュール、あるいはそれらの使用は、モンテカルロベースのアルゴリズムを実施するために適合され得る。モンテカルロベースのアルゴリズムは、シミュレーテッドアニーリング、シミュレーテッド量子アニーリング、ギブスサンプリング、あるいは任意のそれらの組み合わせを含み得る。
サンプリングデバイスは、再構成可能なデジタルハードウェア、中央処理装置、および記憶装置を含み得、上記中央処理装置ならびに記憶装置は再構成可能なデジタルハードウェアに結合される。再構成可能なデジタルハードウェアは、スケーリングパラメーターのスケジュール、ロバスト推定問題のデータ、あるいはそれらの組み合わせを得るために適合され得る。再構成可能なデジタルハードウェアは、モンテカルロベースのアルゴリズムを実施するために適合され得る。モンテカルロベースのアルゴリズムは、シミュレーテッドアニーリング、シミュレーテッド量子アニーリング、ギブスサンプリング、あるいは任意のそれらの組み合わせを含み得る。
1つ以上の所与のスケーリングパラメーターあるいはユーザー指定のパラメーターでボルツマン分布の近似を生成するためのデバイスおよびシステムは、本明細書におけるサンプリングデバイスとして使用することができる。本明細書のサンプリングデバイスは、シミュレーテッドアニーリング、モンテカルロ、および/または量子モンテカルロ法を利用することができるデバイスあるいはシステムであり得る。サンプリングデバイスは、プロセッサー、デジタル処理デバイス、デジタルコンピューター、CPU、あるいは任意の他のカスタマイズされたハードウェア、例えば、フィールドプログラマブルゲートアレイ(FPGA)、グラフィックスプロセッシングユニット(GPU)、特定用途向け集積回路(ASIC)、またはそれらの組み合わせで実行されるアルゴリズムを含み得る。サンプリングデバイスは、量子回路に基づく量子計算システム、量子アニーリングの物理的実現および/または近似実現、あるいは量子断熱計算を実行する計算デバイス、あるいはそれらの組み合わせを含み得る。
本明細書におけるロバスト推定問題の確率的最適化は、構造化サポートベクトルマシン(SSVM)の訓練に関連付けられる場合がある。ロバスト推定問題の確率的最適化は、画像分割、画像のタグ付け、および/または推奨システムに関連付けられる場合がある。ロバスト推定問題の確率的最適化は、圧縮センシングからの双対基底追跡問題に関連付けられる場合がある。ロバスト推定問題の確率的最適化は、教師なし学習、半教師あり学習、教師あり学習、および/またはアクティブラーニングに関連付けられる場合がある。
1つ以上のサブ工程は、第1の引数xに関して得られた目的関数または損失関数の勾配を得ることを含んでもよく、ここで、目的関数または損失関数の第1の引数は、連続ベクトルの現在値をとることができ、目的関数または損失関数の第2の引数yは、選択されたサンプルの値をとることができる。k個のサンプル(y,...,y)∈yは、方程式(6)を使用する確率に従って、サンプリングデバイスを使用して生成することができ、xは固定したままであり得る。各サンプルyについて、添え字jは1からkまでの範囲であり得、関数
Figure 0007288905000046
の勾配は、それらの現在値で評価される連続変数xに対して評価され得る。そのサンプルについて、yは方程式(7)を使用して生成され得る:
Figure 0007288905000047
例えば、選択された目的関数または損失関数に対するk個サンプルの総数があり得る場合(kは任意の整数であり得る)、k個サンプルの1つの各勾配でk個の勾配を生成することができる。各勾配は、同じ現在の連続ベクトルをとる第1の引数x、および選択されたサンプルの値をとる目的関数または損失関数の第2の引数yで得ることができる。勾配は、サンプリングデバイスによって生成されたサンプルを使用して、デジタルコンピューターを用いて得ることができる。サンプリングデバイスは、デジタルコンピューター、量子コンピューター、あるいは任意の他の1つのデジタル処理デバイス、および/または任意の他の複数のデジタル処理デバイスを備え得る。他のデジタル処理デバイスは、制限されないが、デジタルコンピューターおよび量子コンピューターを少なくとも含むハイブリッドコンピューターを備え得る。
1つ以上のサブ工程は、方程式(8)を使用して、方程式(7)で得られた1つ以上の勾配の平均値を得ることを含み得る:
Figure 0007288905000048
例えば、k個のサンプルに対して得られたk個の勾配がある場合、k個の勾配の平均値を得ることができる。kは1を超える整数であり得る。kが1と等しい場合、1つ以上の勾配の平均値は単一の勾配と等しくなり得る。
各反復では、反復最適化プロセスの1つ以上の工程は、1つ以上の勾配の平均値の和および/または部分和を得ることを含み得、ここで、和は、目的関数または損失関数の選択された部分集合中のすべての目的関数あるいは損失関数についてのものであり得、部分和は、目的関数または損失関数の選択された部分集合中の1を超える目的関数あるいは損失関数についてのものであり得る。和および/または部分和は、方程式(9)のような勾配の平均値の線型結合であり得る:
Figure 0007288905000049
例えば、目的関数または損失関数の選択された部分集合は、4つの目的関数あるいは損失関数を含んでいてもよく;および、各目的関数あるいは損失関数についての勾配の平均値が得られてもよい。本明細書の和は、その関連する重みを乗算した勾配の4つの異なる平均値を合計することを含み得るが、部分和は、その関連する重みを乗算した勾配の任意の2つあるいは3つの異なる平均値を合計することを含み得る。選択された部分集合に1つの目的関数あるいは損失関数しかない場合、和は、上記1つの目的関数あるいは損失関数のその関連する重量を乗算した勾配の平均値であってもよい。目的関数または損失関数の選択された部分集合は、少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、あるいはそれ以上の目的関数あるいは損失関数を含んでいてもよい。目的関数または損失関数の選択された部分集合は、最大約100、90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2、あるいは1つの目的関数あるいは損失関数を含んでいてもよい。目的関数または損失関数の選択された部分集合は、前述の値のいずれか2つによって定義された範囲内にある、目的関数または損失関数の数を含んでいてもよい。
各反復では、反復最適化プロセスの1つ以上の工程は、以下の任意の1つ以上に少なくとも部分的に基づいて検索方向を計算することをさらに含み得る:v1)1つ以上の勾配の平均値の和あるいは部分和(例えば、加重和あるいは加重部分和)、v2)スケーリングパラメーターの集合の現在値、v3)1つ以上の勾配の平均値の和あるいは部分和の履歴の少なくとも一部、および/またはv4)スケーリングパラメーターの集合の値の履歴の少なくとも一部。特定の要素の履歴、例えば、本明細書の勾配の平均値の和は、特定の要素の現在値(目的関数または損失関数の現在の選択された部分集合についての)、および/または特定の要素の以前の値(目的関数または損失関数の以前に選択された部分集合についての)を含み得る。この検索方向、あるいは同等に降下方向-dは、現在の
Figure 0007288905000050
に依存してもよく、および、iの以前の選択に対する
Figure 0007288905000051
の以前の計算に依存してもよい。
反復最適化プロセスの1つ以上の工程は、方向-dが最適化方程式(1)に向かって進むことを確実にするか、あるいは、方向-dが最適化方程式(1)に向かって進む確率を増大する傾向があるステップ長αを計算することを含んでもよい。ステップ長は、以下の1つ以上に少なくとも部分的に基づいて計算され得る:vi1)スケーリングパラメーターの集合の現在値、vi2)損失関数の選択された部分集合、vi3)スケーリングパラメーターの集合の値の履歴の少なくとも一部、および/またはvi4)損失関数の選択された部分集合の履歴の少なくとも一部。本明細書における目的関数または損失関数の選択された部分集合の履歴は、目的関数あるいは損失関数の現在の選択された部分集合、および/または目的関数または損失関数の1つ以上の以前に選択された部分集合を含んでもよい。反復最適化プロセスの1つ以上の工程は、ステップ長および検索方向を使用して、更新された現在の連続ベクトルを計算し、連続ベクトルの現在値を更新された現在の連続ベクトルに設定することさらに含み得る。更新は、方程式(10)から与えられ得る:
Figure 0007288905000052
式中、
Figure 0007288905000053
は制約集合C上の射影を表示する。一連の更新は方程式(1)の近似解に収束し得る。
図1は、サンプリングデバイスを使用して、ロバスト推定問題の確率的最適化のための方法(100)の非限定的な例のフローチャートを示す。第1の操作(102)では、方法(100)は、(例えば、デジタルコンピューターによって)ロバスト推定問題のデータを受け取る工程を含み得る。上記データは、重複しない部分集合へと分類された目的関数あるいは損失関数の集合を含むことができる。損失関数の集合中の各目的関数あるいは損失関数は、第1および第2の引数を受け入れ得る。上記データは、目的関数あるいは損失関数の集合中の各目的関数あるいは損失関数の許容ベクトルの集合をさらに含み得る。
第2の操作(104)では、方法(100)は、連続ベクトルの現在値を(例えば、デジタルコンピューターによって)設定する工程を含み得る。
第3の操作(106)では、方法(100)は、スケーリングパラメーターの集合のスケジュールを(例えば、デジタルコンピューターによって)受け取る工程を含み得る。
第4の操作(108)では、方法(100)は、上記スケジュールに少なくとも部分的に基づいて、スケーリングパラメーターの集合の現在値を決定する工程を含み得る。
第5の操作(110)では、方法(100)は、重複しない部分集合から目的関数または損失関数の部分集合を選択する工程を含み得る。
第6の操作(112)では、方法(100)は、複数の目的関数あるいは損失関数の各目的関数あるいは損失関数の1つ以上の勾配を得るために、一連の工程を繰り返す工程を含み得る。一連の工程は、サンプリングデバイスによって、目的関数あるいは損失関数に関連する許容ベクトルの集合からのベクトルの1つ以上のサンプルを生成する工程を含み得る。一連の工程は、(例えば、デジタルコンピューターによって)1つ以上の勾配を得る工程を含み得る。1つ以上の勾配の各々は、第1の引数に関して得られた目的関数あるいは損失関数のものであってもよい。一連の工程は、(例えば、デジタルコンピューターによって)1つ以上の勾配の平均値を得る工程を含み得る。
第7の操作(114)では、方法(100)は、(例えば、デジタルコンピューターによって)1つ以上の勾配の和あるいは部分和を得る工程を含み得る。和は、目的関数あるいは損失関数の選択された部分集合中のすべての目的関数あるいは損失関数についてのものであり得る。部分的和は、目的関数あるいは損失関数の選択された部分集合中の1つを超える目的関数あるいは損失関数についてのものであり得る。
第8の操作(116)では、方法(100)は、(例えば、デジタルコンピューターによって)検索方向を計算する工程を含み得る。検索方向は、以下の1つ以上に少なくとも部分的に基づき得る:v1)1つ以上の勾配の平均値の和あるいは部分和;v2)スケーリングパラメーターの集合の現在値;v3)1つ以上の勾配の平均値の和あるいは部分和の履歴の少なくとも一部;および、v4)スケーリングパラメーターの集合の値の履歴の少なくとも一部。
第9の操作(118)では、方法(100)は、(例えば、デジタルコンピューターによって)ステップ長を計算する工程を含み得る。ステップ長は、以下の1つ以上に少なくとも部分的に基づき得る:vi1)スケーリングパラメーターの集合の現在値;vi2)目的関数あるいは損失関数の選択された部分集合;vi3)少なくとも集合のスケーリングパラメーターの値の履歴の一部;および、vi4)目的関数あるいは損失関数の選択された部分集合の履歴の少なくとも一部。
第10の操作(120)では、方法(100)は、(例えば、デジタルコンピューターによって)ステップ長および検索方向に基づいて連続ベクトルの現在値を設定する工程を含み得る。
第11の操作(122)では、方法(100)は、連続ベクトルの現在値を提供する工程を含み得る。
第4の操作(108)、第5の操作(110)、第6の操作(112)、第7の操作(114)、第8の操作(116)、第9の操作(118)、第10の操作(120)、および第11の操作(122)の任意の1、2、3、4、5、6、7、あるいは8つは、停止基準を満たすまで繰り返され得る。停止基準は、本明細書に記載される任意の停止基準であってもよい。
目的関数あるいは損失関数は、第1および第2の引数の1つ以上の合成関数を含み得る。(例えば、デジタルコンピューターによって)1つ以上の勾配を得る工程であって、1つ以上の勾配の各々が第1の引数に対して得られた目的関数あるいは損失関数のものであり得る工程は、連鎖律の反復的適用を含み得る。連鎖律の反復的適用は、自動微分を使用して実施されてもよい。合成関数の1つ以上の変関数は微分可能な特徴抽出器を含んでいてもよい。微分可能な特徴抽出器は、ディープニューラルネットワークを備え得る。
(例えば、デジタルコンピューターによって)検索方向を計算する工程は、確率的勾配降下法(SGD)、確率的平均勾配法(SAGおよびSAGA)、確率的分散減少勾配法(SVRG)、および/または確率的双対座標上昇法(SDCA)の1つ以上の使用を含み得る。
(例えば、デジタルコンピューターによって)ステップ長を計算する工程は、1つ以上の適応勾配降下法の使用を含み得る。適応勾配降下法は、適応モーメント推定(Adam)、減少平均平方(RMS)、二乗平均平方根のプロパゲーション(RMSProp)、および/または適応勾配アルゴリズム(AdaGrad)を含み得る。
サンプリングデバイスは、スケーリングパラメーターの集合のスケジュールおよびロバスト推定問題のデータを得るための量子プロセッサーおよび量子デバイス制御システムを備えていてもよい。量子プロセッサーは、デジタルコンピューターおよび量子デバイス制御システムに結合され得る。量子プロセッサーは、本明細書に記載される任意の量子プロセッサーあるいは量子コンピューターを備えていてもよい。量子プロセッサーは、複数のキュービットおよび複数のカプラーを含んでも良い。複数のカプラーの各カプラーは、複数のキュービットの2つのキュービットの交差点で通信結合を提供するものであり得る。ベクトルの1つ以上のサンプルがボルツマン分布に従い得る。サンプルデバイスは光パラメトリック発振器のネットワークであってもよい。ネットワークは、光エネルギー源からエネルギーを受け取り、複数の光パラメトリック発振器および複数の結合装置を生成するように構成された光学デバイスを含み得、その各々は、複数の光パラメトリック発振器の1つの光パラメトリック発振器を制御可能に結合する。サンプリングデバイスは、中央処理装置と、中央処理装置に結合された記憶装置とを備え得る。記憶装置は、スケーリングパラメーターのスケジュールおよびロバスト推定問題のデータを得るためのアプリケーションを備えていてもよく、上記アプリケーションは、マルコフ連鎖モンテカルロアルゴリズムを実行するように構成されてもよい。サンプリングデバイスは、再構成可能なデジタルハードウェア、中央処理装置、および記憶装置を備え得る。中央処理装置および記憶装置は、再構成可能なデジタルハードウェアに結合され得る。再構成可能なデジタルハードウェアは、スケーリングパラメーターのスケジュールおよびロバスト推定問題のデータを得るように構成されてもよく、再構成可能なデジタルハードウェアは、マルコフ連鎖モンテカルロアルゴリズムを実行するように構成されてもよい。マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッド量子アニーリングを含み得る。マルコフ連鎖モンテカルロアルゴリズムは、シミュレーテッドアニーリングを含み得る。マルコフ連鎖モンテカルロアルゴリズムは、ギブスサンプリングを含み得る。
目的関数あるいは損失関数の集合は、1つ以上の目的関数あるいは損失関数を含み得る。目的関数あるいは損失関数の重複しない部分集合の部分集合は、わずか2つの目的関数あるいは損失関数のみを含み得る。
ロバスト推定問題の確率的最適化は、構造化サポートベクターマシンの訓練に関連付けられてもよい。ロバスト推定問題のデータは、画像分割問題に関連付けられてもよい。ロバスト推定問題のデータは、圧縮センシング問題からの双対基底追跡問題に関連付けられてもよい。ロバスト推定問題のデータは、半教師あり学習に関連付けられてもよい。ロバスト推定問題のデータは、名詞句共参照解析問題から得られてもよい。ロバスト推定問題のデータは、アクティブラーニングに関連付けられてもよい。ロバスト推定問題のデータは、画像のタグ付け問題に関連付けられてもよい。ロバスト推定問題のデータは、推奨システムに関連付けられてもよい。
スケーリングパラメーターのスケジュールの集合は、ユーザーによって決定されるか、あるいは自動的にアルゴリズムによって決定されてもよい。
停止基準は、現在のベクトルと更新された現在のベクトルとの間の距離の大きさに少なくとも部分的に基づき得る。第1および第2の引数は独立していてもよく、第1の引数はその値として連続ベクトルを使用してもよく、第2の引数はその値として離散ベクトルを使用してもよく、許容ベクトルの集合は許容可能な離散ベクトルの集合を含んでいてもよい。
本明細書で提供される方法(100)に基づく多くの変形、変更、および適例えば、方法(100)の操作の順序は、変更されてもよく、操作の一部が除去されてもよく、操作の一部が重複されてもよく、および、追加の操作が適宜加えられてもよい。操作の一部は連続して実施され得る。操作の一部は並行して実施され得る。操作の一部は1回実施され得る。操作の一部は1回より多く実施され得る。操作の一部はサブ操作を含み得る。操作の一部は自動化され得、操作の一部は手動で行われ得る。
図2は、サンプルデバイスを使用して、ロバスト推定問題の確率的最適化のためのシステム(200)の非限定的な例を概略的に示す。システムは、量子計算システムと相互作用するデジタルコンピューターを備え得る。システム(200)は、デジタルコンピューター(202)および非古典的計算システムを備えることがき、これは量子計算システム(204)であってもよい。システム(200)は、図1の方法(100)を実行することができる。システム(200)は、例えば、米国特許公報第2017/0357539号および第2018/0091440号に記載される通りであり得、その各々が参照によって全体が本明細書に組み込まれる。量子計算システム(204)は、1以上の超伝導キュービットを含み得る。量子計算システムは、本明細書に記載される任意の量子コンピューターまたは量子プロセッサーを備え得る。量子計算システムは、本明細書に記載される任意の量子計算キュービットを備え得る。デジタルコンピューター(202)は、データを送信および/または受信することによって、(例えば、直通無線を経由して、あるいはネットワーク上で)量子計算システム(204)と通信することができる。デジタルコンピューターおよびそのキュービットは互いに遠隔に位置してもよい。デジタルコンピューターおよびそのキュービットは、互いに遠隔であり得る。いくつかの実施形態では、デジタルコンピューター(202)は任意のタイプあってもよい。デジタルコンピューター(202)は、デスクトップコンピューター、ラップトップコンピューター、タブレットパーソナルコンピュータ、サーバー、あるいはスマートフォンであってもよい。デジタルコンピューター(202)は、マイクロプロセッサー、ディスプレイ装置(304)、入力装置(306)、通信ポート(308)、データバス(310)、記憶装置(312)、およびネットワークインターフェースカード(NIC)(322)とも呼ばれる中央処理装置(CPU)(302)を備えてもよい。CPU(302)はシングルコアプロセッサーまたはマルチコアプロセッサーであってもよい。デジタルコンピューター(202)は、並行処理のための複数のプロセッサーを備えてもよい。ディスプレイ装置(304)は、ユーザーインターフェース(UI)を備え得る。
UIの例としては、限定されないが、グラフィカルユーザーインターフェース(GUI)およびウェブベースのユーザーインターフェースが挙げられる。
CPU(302)はコンピューター命令を処理するために使用され得る。CPU(302)の様々な実施形態が提供され得る。例えば、中央処理装置(302)は、3.6GHzで動作し、Intel(商標)によって製造されるCPUコア i7 3820であってもよい。
ディスプレイ装置(304)は、ユーザーにデータを表示するために使用され得る。当業者は、様々なタイプのディスプレイ装置(304)が使用され得ることを認識するだろう。ディスプレイ装置(304)は液晶ディスプレイ(LCD)モニターであってもよい。ディスプレイ装置(304)は、例えば、容量性または抵抗性のタッチスクリーンなどのタッチスクリーンを有し得る。
通信ポート(308)は、デジタルコンピューター(202)とデータを共有するために使用され得る。通信ポート(308)は、例えば、キーボードおよびマウスをデジタルコンピューター(202)に接続するための、ユニバーサルシリアルバス(USB)ポートを備え得る。通信ポート(308)は、データネットワークを介した別のコンピューターとデジタルコンピューター(202)の接続を可能にするためのIEEE 802.3ポートなどのデータネットワーク通信ポートをさらに備えてもよい。当業者は、通信ポート(308)の様々な代替的な実施形態が提供され得ることを理解するだろう。通信ポート(308)はイーサネットポートおよびマウスポートを備え得る。
記憶装置(312)は、コンピューター実行可能命令を記憶するために使用され得る。記憶装置(312)は、オペレーティングシステムモジュール(314)を備えてもよい。オペレーティングシステムモジュール(314)は様々なタイプのものであってもよい。いくつかの実施形態では、オペレーティングシステムモジュール(314)は、Apple(商標)によって製造されるOS X Yosemiteであってもよい。
記憶装置(312)は1つ以上のアプリケーションをさらに備えることができる。中央処理装置(302)、ディスプレイ装置(304)、入力装置(306)、通信ポート(308)、および記憶装置(312)の1つ以上は、データバス(310)を介して相互接続されてもよい。
システム(202)は、ネットワークインターフェースカード(NIC)(322)をさらに備えてもよい。アプリケーション(320)は、データバス(310)に沿ってNIC(322)へと適切な信号を送ることができる。次に、NIC(322)は、量子デバイス制御システム(324)にそのような情報を送ることができる。
量子計算システム(204)は、複数の量子ビットおよび複数の結合装置を備えることができる。量子計算システム(204)のさらなる説明が、例えば、米国特許公報第2006/0225165号に開示され、これは、参照によってその全体が本明細書に組み込まれる。
量子計算デバイスの量子計算システム(204)は、量子デバイス制御システム(324)および量子プロセッサーあるいは量子コンピューター(330)を備えることができる。制御システム(324)は、対応する結合の結合強度を調整することが可能な量子計算システム(204)の複数の結合(328)における各結合のための結合制御装置、ならびに、各キュービット上の局所場バイアスを設定することが可能な量子計算システム(204)の複数キュービット(326)における各キュービットのための局所場バイアス制御装置を備え得る。
本明細書に記載されるような方法は、コンピュータシステム(200)の電子記憶場所、例えば、記憶装置(312)または電子記憶装置などに記憶された機械(例えば、コンピュータ処理装置)実行可能なコードとして実行され得る。いくつかの実施形態では、機械実行可能なまたは機械読み取り可能なコードは、ソフトウェアの形で提供されてもよい。使用中、コードはCPU(302)により実行され得る。場合によっては、上記コードは、電子記憶装置から検索され、かつCPU(302)による即時のアクセスのために記憶装置(312)に記憶することができる。いくつかの状況において、電子記憶装置は除外することができ、機械実行可能命令が記憶装置(312)に記憶される。
コードを実行するように適合されたプロセッサーを有するマシンと共に使用するために、コードは予めコンパイルかつ構成されてもよいし、あるいは実行時にコンパイルされてもよい。コードは、予めコンパイルされた様式か、コンパイルされたままの様式で、コードを実行可能なように選択できる、プログラミング言語で提供され得る。
コンピュータシステム(1101)などの本明細書中に提供されるシステムおよび方法の態様は、プログラミングにおいて具体化され得る。この技術の様々な態様は、典型的に一種の機械可読媒体上で保持され、あるいはそれに埋め込まれる、機械(または、プロセッサ)実行可能コードおよび/または関連データの形の「製品」または「製造用品」として考慮され得る。機械実行可能コードは、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶することができる。「記憶」型の媒体は、様々な半導体メモリ、テープドライブ、ディスクドライブなどの、コンピューターやプロセッサーなどの有形メモリ、あるいはその関連するモジュールのいずれかまたは全てを含むことができ、これらは、ソフトウェアのプログラミングのための非一時的な記憶をいつでも提供することができる。ソフトウェアの全てまたは一部は、時に、インターネットまたは様々な他の電気通信ネットワークを介して通信されてもよい。そのような通信は、例えば、1つのコンピューターまたはプロセッサーから別のものへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへの、ソフトウェアのローディングを可能にし得る。したがって、ソフトウェア要素を保持することができる別のタイプの媒体には、有線電気ネットワークおよび/または光陸上通信線ネットワーク、および/または様々なエアリンクを介して、ローカルデバイス間の物理インターフェース全体で使用されるような、光、電気、および電磁波が含まれる。そのような波を運ぶ物理要素、例えば、有線リンクまたは無線のリンク、電気リンク、または光リンクは、ソフトウェアを有する媒体としても考えられ得る。本明細書に使用されるように、非一時的な有形「記憶」媒体に限定されない限り、コンピューターまたは機械の「可読媒体」などの用語は、実行のためにプロセッサーに命令を提供する際に関与する任意の媒体を指す。
従って、コンピューター実行可能コードなどの機械可読媒体は、有形ストレージ媒体、搬送波媒体、または物理的伝送媒体を含むが、これに限定されない、多くの形態をとってもよい。不揮発性ストレージ媒体は、例えば、図面に示されるデータベースなどを実装するために使用され得るような、任意のコンピューターなどにおける、記憶装置のいずれかなどの光学ディスクまたは磁気ディスクを含む。揮発性ストレージ媒体は、そのようなコンピュータプラットフォームのメインメモリなどの動的メモリを含む。有形送信媒体は、同軸ケーブル;コンピュータシステム内のバスを含むワイヤーを含む、銅線および光ファイバーを含んでいる。搬送波送信媒体は、無線周波(RF)および赤外線(IR)データ通信中に生成されるものなどの、電気信号または電磁気信号、あるいは音波または光波の形態をとり得る。したがって、コンピューター可読媒体の共通の形式は、例えば:フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の物理的な記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、他のメモリチップあるいはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を伝達するケーブルもしくはリンク、またはコンピューターがプログラミングのコードおよび/またはデータを読み取ることができる他の媒体を含む。コンピューター可読媒体のこれらの形態の多くは、実行のためにプロセッサーに1つ以上の命令の1つ以上のシーケンスを運ぶことに関与し得る。
この明細書と請求項で使用されるように、特に明記されていない限り、用語「約」、「実質的に」、および「おおよそ」は、実施形態に応じて、数値の+/-1%、+/-2%、+/-3%、+/-4%、+/-5%、+/-6%、+/-7%、+/-8%、+/-9%、+/-10%、+/-11%、+/-12%、+/-14%、+/-15%、または+/-20%未満であるか、またはそれに等しい変動を意味する。非限定的な例として、約100メートルは、実施形態に応じて、95メートル~105メートル(100メートルの+/-5%)、90メートル~110メートル(100メートルの+/-10%)、あるいは85メートル~115メートル(100メートルの+/-15%)の範囲を表す。
本開示の方法およびシステムは、米国特許公報第2017/0357539号および第2018/0091440号に記載されるものなどの他の方法およびシステムと組み合わせるか、あるいはそれらによって変更することができ、それらの各々は、参照によって全体が本明細書に組み込まれる。
本発明の好ましい実施形態が本明細書で示されかつ記載されてきたが、こうした実施形態がほんの一例として提供されているに過ぎないということは当業者にとって明白である。本発明が本明細書内で提供された特定の実施例によって限定されることは、意図されていない。本発明は前述の明細書を参照して記載されているが、本明細書における実施形態の説明および例示は、限定的な意味で解釈されることは意図されていない。多くの変更、変化、および置換が、本発明から逸脱することなく、当業者には思い浮かぶであろう。さらに、本発明の全ての態様は、様々な条件および変数に依存する、本明細書で述べられる特定の描写、構成、または相対的な比率に限定されないことが理解されよう。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用され得ることを理解されたい。それゆえ、本発明は、任意のそのような代替物、修正物、変形物、または同等物にも及ぶものと企図される。以下の特許請求の範囲は本発明の範囲を定義するものであり、この特許請求の範囲およびその同等物の範囲内の方法および構造は、それにより包含されることが、意図されている。

Claims (29)

  1. 問題の最適化のための、コンピューターで実施される方法であって、前記方法は、
    (a)デジタルコンピューターによって、前記問題に対応するデータを受け取る工程であって、前記データが1つ以上の目的関数を含み、ここで、前記1つ以上の目的関数の1つの目的関数が、第1の引数と第2の引数を受け入れるように構成される、工程と、
    (b)前記目的関数について、(i)前記第2の引数の値をサンプリングデバイスに提供することであって、ここで、前記サンプリングデバイスの1つ以上のサンプルは、前記第2の引数の内部最適化を行うために使用される、提供すること、(ii)前記内部最適化に基づいて、前記目的関数の1つ以上の勾配または劣勾配を得ること、(iii)前記勾配または前記劣勾配に基づいて、1つ以上の古典的な最適化プロトコルを実施し、それにより、前記第1の引数の外部最適化を得ること、および(iv)前記外部最適化を出力すること、を少なくとも行うために、前記デジタルコンピューターを使用する工程と、
    を含む、コンピューターで実施される方法。
  2. 停止基準が満たされるまで反復的に(b)を繰り返す工程をさらに含む、請求項1に記載のコンピューターで実施される方法。
  3. 前記1つ以上の目的関数は損失関数を含む、請求項1に記載のコンピューターで実施される方法。
  4. 前記目的関数は、前記第1の引数と前記第2の引数の1つ以上の合成関数を含む、請求項1に記載のコンピューターで実施される方法。
  5. (b)の(ii)は、連鎖律の1以上の適用によって実施される、請求項1に記載のコンピューターで実施される方法。
  6. 前記1以上の適用は、前記連鎖律の1以上の反復適用を含む、請求項5に記載のコンピューターで実施される方法。
  7. 前記1以上の適用は自動微分を使用して実施される、請求項5に記載のコンピューターで実施される方法。
  8. 前記合成関数の1つ以上の変関数は1つ以上の微分可能な特徴抽出器を含む、請求項に記載のコンピューターで実施される方法。
  9. 前記1つ以上の微分可能な特徴抽出器は1つ以上のディープニューラルネットワークを備える、請求項8に記載のコンピューターで実施される方法。
  10. 前記データは前記第2の引数の許容値の集合をさらに含む、請求項1に記載のコンピューターで実施される方法。
  11. (b)は、許容値の前記集合から前記1つ以上のサンプルを生成するために、前記サンプリングデバイスを使用することを含む、請求項10に記載のコンピューターで実施される方法。
  12. 確率分布に基づいて前記1つ以上のサンプルを生成する工程をさらに含む、請求項10に記載のコンピューターで実施される方法。
  13. 前記確率分布は、前記目的関数とスケーリングパラメーターの集合によって少なくとも部分的に決定される、請求項12に記載のコンピューターで実施される方法。
  14. (b)の(iii)は、確率的勾配降下法(SGD)、確率的平均勾配法(SAGまたはSAGA)、確率的分散減少勾配法(SVRG)、確率的双対座標上昇法(SDCA)、適応モーメント推定法(Adam)、減少平均平方法(RMS)、二乗平均平方根プロパゲーション法(RMSProp)、および適応勾配アルゴリズム法(AdaGrad)からなる群から選択される、1つ以上のメンバーを適用することを含む、請求項1に記載のコンピューターで実施される方法。
  15. 前記サンプリングデバイスは少なくとも1つの非古典的なコンピューターを備える、請求項1に記載のコンピューターで実施される方法。
  16. 前記少なくとも1つの非古典的なコンピューターは、少なくとも1つの量子コンピューターを含む、請求項15に記載のコンピューターで実施される方法。
  17. 前記少なくとも1つの非古典的なコンピューターは、少なくとも1つの量子アニーラーを含む、請求項15に記載のコンピューターで実施される方法。
  18. 前記デジタルコンピューターは、前記サンプリングデバイスに対して遠隔に位置する、請求項1に記載のコンピューターで実施される方法。
  19. 前記サンプリングデバイスは1つ以上の光パラメトリック発振器を含む、請求項1に記載のコンピューターで実施される方法。
  20. 前記問題はロバスト推定問題を含む、請求項1に記載のコンピューターで実施される方法。
  21. 前記サンプリングデバイスは、マルコフ連鎖モンテカルロ法を実行するように構成される再構成可能なデジタルハードウェアを含む、請求項1に記載のコンピューターで実施される方法。
  22. 前記マルコフ連鎖モンテカルロ法は、シミュレーテッドアニーリング法、シミュレーテッド量子アニーリング法、およびギブスサンプリング法からなる群から選択される1つ以上のメンバーを含む、請求項21に記載のコンピューターで実施される方法。
  23. 前記問題の前記最適化は、構造化サポートベクターマシン(SVM)の訓練に関連付けられる、請求項1に記載のコンピューターで実施される方法。
  24. 前記問題に対応する前記データは、画像分割問題、圧縮センシング問題、圧縮センシング問題からの基底追跡問題、圧縮センシング問題からの双対基底追跡問題、半教師あり学習問題、名詞句共参照解析問題、アクティブラーニング問題、画像タグ付け問題、および推奨システムからなる群から選択される1つ以上のメンバーと関連付けられる、請求項1に記載のコンピューターで実施される方法。
  25. 前記サンプリングデバイスは、少なくとも1つのデジタルコンピューター、フィールドプログラマブルゲートアレイ、グラフィックスプロセッシングユニット、または特定用途向け集積回路を含む、請求項1に記載のコンピューターで実施される方法。
  26. サンプリングデバイスを使用したロバスト推定問題の確率的最適化のための、コンピューターで実施される方法であって、前記方法は、
    (a)デジタルコンピューターによって、前記ロバスト推定問題のデータを受け取る工程であって、ここで、前記データが、
    i.重複しない部分集合へと分類された目的関数あるいは損失関数の集合であって、目的関数あるいは損失関数の前記集合中の前記目的関数あるいは前記損失関数が、第1の引数と第2の引数を受け入れるように構成される、目的関数あるいは損失関数の集合と、
    ii.前記目的関数あるいは前記損失関数の許容可能な離散ベクトルの集合と、
    を含む、工程、
    (b)前記デジタルコンピューターによって、連続ベクトルの現在値を設定する工程、
    (c)前記デジタルコンピューターによって、スケーリングパラメーターの集合のスケジュールを受け取る工程、および、
    (d)停止基準が満たされるまで、
    i.前記スケジュールに少なくとも部分的に基づいて、スケーリングパラメーターの前記集合の現在値を決定する工程、
    ii.前記重複しない部分集合から前記目的関数あるいは前記損失関数の部分集合を選択する工程、
    iii.前記目的関数あるいは前記損失関数について以下の工程を繰り返す工程、
    1.前記サンプリングデバイスによって、前記目的関数あるいは前記損失関数に関連付けられる許容可能な離散ベクトルの前記集合から離散ベクトルの1つ以上のサンプルを生成する工程、
    2.前記デジタルコンピューターによって、1つ以上の勾配を得る工程であって、
    前記1つ以上の勾配は、前記第1の引数に対して得られた前記目的関数あるいは前記損失関数のものである、工程、および、
    3.前記デジタルコンピューターによって、前記1つ以上の勾配の平均値を得る工程、
    iv.前記デジタルコンピューターによって、前記1つ以上の勾配の前記平均値の和あるいは部分和を得る工程であって、前記和は、前記目的関数あるいは前記損失関数の選択された部分集合中のすべての目的関数あるいは損失関数に関するものであり、前記部分和は、前記目的関数あるいは損失関数の前記選択された部分集合中の1つを超える目的関数あるいは損失関数に関するものである、工程、
    v.前記デジタルコンピューターによって、v1)前記1つ以上の勾配の前記平均値の前記和あるいは前記部分和;v2)スケーリングパラメーターの前記集合の前記現在値、v3)前記1つ以上の勾配の前記平均値の前記和あるいは前記部分和の履歴の少なくとも一部、および、v4)スケーリングパラメーターの前記集合の値の履歴の少なくとも一部の1つ以上に少なくとも部分的に基づいて、検索方向を計算する工程、
    vi.前記デジタルコンピューターによって、vi1)スケーリングパラメーターの前記集合の前記現在値、vi2)前記目的関数あるいは前記損失関数の前記選択された部分集合、vi3)スケーリングパラメーターの前記集合の値の履歴の少なくとも一部、およびvi4)前記目的関数あるいは前記損失関数の前記選択された部分集合の履歴の少なくとも一部の1つ以上に少なくとも部分的に基づいて、ステップ長を計算する工程、および、
    vii.前記デジタルコンピューターによって、前記ステップ長と前記検索方向に基づいて前記連続ベクトルの前記現在値を設定する工程、ならびに、
    viii.前記連続ベクトルの前記現在値を提供する工程、
    を含む、コンピューターで実施される方法。
  27. デジタルコンピューターとサンプリングデバイスとを備えた、問題の最適化のためのシステムであって、
    前記デジタルコンピューターは、少なくとも、
    i.前記問題に対応するデータを受け取ることであって、前記データが1つ以上の目的関数を含み、ここで、前記1つ以上の目的関数の1つの目的関数が、少なくとも第1の引数と第2の引数を受け入れるように構成される、受け取ること、
    ii.前記目的関数について、(i)前記第2の引数の値を前記サンプリングデバイスに提供すること、(ii)前記サンプリングデバイスから前記第2の引数の内部最適化を得ること、(iii)前記内部最適化に基づいて、前記目的関数の1つ以上の勾配または劣勾配を得ること、(iv)前記勾配または前記劣勾配に基づいて、1つ以上の古典的な最適化プロトコルを実施し、それにより、前記第1の引数の外部最適化を得ること、および(v)前記外部最適化を出力すること、を行うように構成され、ならびに、
    ここで、前記サンプリングデバイスは前記内部最適化を行うように構成される、
    システム。
  28. 前記サンプリングデバイスは、少なくとも1つの非古典的なコンピューター、デジタルコンピューター、フィールドプログラマブルゲートアレイ、グラフィックスプロセッシングユニット、または特定用途向け集積回路を含む、請求項27に記載のシステム。
  29. 前記非古典的なコンピューターは、少なくとも1つの量子コンピューターまたは少なくとも1つの量子アニーラーを含む、請求項28に記載のシステム。
JP2020529188A 2017-12-01 2018-11-30 ロバスト推定問題の確率的最適化のためのシステムおよび方法 Active JP7288905B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762593563P 2017-12-01 2017-12-01
US62/593,563 2017-12-01
US201862716041P 2018-08-08 2018-08-08
US62/716,041 2018-08-08
PCT/CA2018/051534 WO2019104443A1 (en) 2017-12-01 2018-11-30 Systems and methods for stochastic optimization of a robust inference problem

Publications (3)

Publication Number Publication Date
JP2021504836A JP2021504836A (ja) 2021-02-15
JP2021504836A5 JP2021504836A5 (ja) 2022-01-06
JP7288905B2 true JP7288905B2 (ja) 2023-06-08

Family

ID=66664257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020529188A Active JP7288905B2 (ja) 2017-12-01 2018-11-30 ロバスト推定問題の確率的最適化のためのシステムおよび方法

Country Status (6)

Country Link
US (1) US20200364597A1 (ja)
EP (1) EP3718026B1 (ja)
JP (1) JP7288905B2 (ja)
CN (1) CN111670438B (ja)
CA (1) CA3083008A1 (ja)
WO (1) WO2019104443A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11797641B2 (en) 2015-02-03 2023-10-24 1Qb Information Technologies Inc. Method and system for solving the lagrangian dual of a constrained binary quadratic programming problem using a quantum annealer
CA2881033C (en) 2015-02-03 2016-03-15 1Qb Information Technologies Inc. Method and system for solving lagrangian dual of a constrained binary quadratic programming problem
JP7223174B2 (ja) * 2019-06-14 2023-02-15 ザパタ コンピューティング,インコーポレイテッド ロバストな振幅推定のための工学的尤度関数を用いたベイズ推論のためのハイブリッド量子古典コンピュータ
CA3126553A1 (en) 2019-06-19 2020-12-24 1Qb Information Technologies Inc. Method and system for mapping a dataset from a hilbert space of a given dimension to a hilbert space of a different dimension
CN113128444B (zh) * 2021-04-28 2023-02-03 奇瑞汽车股份有限公司 一种损失函数获取方法、计算机可读存储介质及电子设备
CN113705793B (zh) * 2021-09-03 2023-04-07 北京百度网讯科技有限公司 决策变量确定方法及装置、电子设备和介质
CN115906601A (zh) * 2021-09-29 2023-04-04 株式会社日立制作所 电力管理系统的优化方法及装置
CN116880438B (zh) * 2023-04-03 2024-04-26 材谷金带(佛山)金属复合材料有限公司 退火设备控制系统的故障检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150363358A1 (en) 2014-06-12 2015-12-17 1Qb Information Technologies Inc. Method and system for continuous optimization using a binary sampling device
JP2016206795A (ja) 2015-04-17 2016-12-08 Kddi株式会社 実空間情報によって学習する識別器を用いて物体を追跡する装置、プログラム及び方法
WO2017033326A1 (ja) 2015-08-27 2017-03-02 株式会社日立製作所 半導体装置および情報処理装置
WO2017168865A1 (ja) 2016-03-28 2017-10-05 ソニー株式会社 情報処理装置及び情報処理方法
US20170323195A1 (en) 2016-05-09 2017-11-09 1Qb Information Technologies Inc. Method and system for improving a policy for a stochastic control problem

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT263400B (de) * 1966-10-06 1968-07-25 Wolfgang Dipl Ing Dr Wehrmann Schaltungsanordnung zur meßtechnischen Bestimmung statistischer Parameter stochastischer Prozesse
EP3745322A1 (en) * 2011-07-06 2020-12-02 D-Wave Systems Inc. Quantum processor based systems and methods that minimize an objective function
US9189455B2 (en) * 2012-05-29 2015-11-17 Xerox Corporation Adaptive weighted stochastic gradient descent
US9465773B2 (en) * 2012-08-17 2016-10-11 International Business Machines Corporation Data-driven distributionally robust optimization
CN103618315B (zh) * 2013-12-10 2016-07-06 广州供电局有限公司 一种基于bart算法和超吸收壁的电网电压无功优化方法
CN105426882B (zh) * 2015-12-24 2018-11-20 上海交通大学 一种人脸图像中快速定位人眼的方法
CN106651089B (zh) * 2016-09-19 2020-09-11 清华大学 生产调度问题的分布集鲁棒模型的建模及优化求解方法
JP7134949B2 (ja) * 2016-09-26 2022-09-12 ディー-ウェイブ システムズ インコーポレイテッド サンプリングサーバからサンプリングするためのシステム、方法、及び装置
CN106503803A (zh) * 2016-10-31 2017-03-15 天津大学 一种基于拟牛顿方法的受限玻尔兹曼机迭代映射训练方法
CN106847248B (zh) * 2017-01-05 2021-01-01 天津大学 基于鲁棒性音阶轮廓特征和向量机的和弦识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150363358A1 (en) 2014-06-12 2015-12-17 1Qb Information Technologies Inc. Method and system for continuous optimization using a binary sampling device
JP2016206795A (ja) 2015-04-17 2016-12-08 Kddi株式会社 実空間情報によって学習する識別器を用いて物体を追跡する装置、プログラム及び方法
WO2017033326A1 (ja) 2015-08-27 2017-03-02 株式会社日立製作所 半導体装置および情報処理装置
WO2017168865A1 (ja) 2016-03-28 2017-10-05 ソニー株式会社 情報処理装置及び情報処理方法
US20170323195A1 (en) 2016-05-09 2017-11-09 1Qb Information Technologies Inc. Method and system for improving a policy for a stochastic control problem

Also Published As

Publication number Publication date
CN111670438A (zh) 2020-09-15
EP3718026A1 (en) 2020-10-07
CA3083008A1 (en) 2019-06-06
US20200364597A1 (en) 2020-11-19
CN111670438B (zh) 2023-12-29
WO2019104443A1 (en) 2019-06-06
EP3718026A4 (en) 2021-08-18
JP2021504836A (ja) 2021-02-15
EP3718026B1 (en) 2023-11-29

Similar Documents

Publication Publication Date Title
JP7288905B2 (ja) ロバスト推定問題の確率的最適化のためのシステムおよび方法
AU2022200224B2 (en) Constructing and programming quantum hardware for quantum annealing processes
US20200410384A1 (en) Hybrid quantum-classical generative models for learning data distributions
US20210365826A1 (en) Discrete variational auto-encoder systems and methods for machine learning using adiabatic quantum computers
US11093669B2 (en) Method and system for quantum computing
US10275422B2 (en) Systems and methods for finding quantum binary optimization problems
CN108140146B (zh) 使用绝热量子计算机的离散变分自动编码器系统和方法
US20210166148A1 (en) Variationally and adiabatically navigated quantum eigensolvers
US20150193692A1 (en) Systems and methods of finding quantum binary optimization problems
Denil et al. Toward the implementation of a quantum RBM
CN109983481A (zh) 用于从采样服务器中采样的系统、方法和装置
US10339442B2 (en) Corrected mean-covariance RBMs and general high-order semi-RBMs for large-scale collaborative filtering and prediction
US20230267170A1 (en) Information processing system, information processing method, and non-transitory computer-readable recording medium for information processing program
Pellatt et al. Speeding up deep neural architecture search for wearable activity recognition with early prediction of converged performance
EP4354359A1 (en) Solving optimization problems on shallow circuits using a quantum computer
CN113962319A (zh) 用于训练预测模型和预测数据的方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211126

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230126

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20230315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R150 Certificate of patent or registration of utility model

Ref document number: 7288905

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150