JP2021089731A - クラス分類器を訓練するための装置および方法 - Google Patents

クラス分類器を訓練するための装置および方法 Download PDF

Info

Publication number
JP2021089731A
JP2021089731A JP2020199674A JP2020199674A JP2021089731A JP 2021089731 A JP2021089731 A JP 2021089731A JP 2020199674 A JP2020199674 A JP 2020199674A JP 2020199674 A JP2020199674 A JP 2020199674A JP 2021089731 A JP2021089731 A JP 2021089731A
Authority
JP
Japan
Prior art keywords
classifier
classification
actuator
class
player
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020199674A
Other languages
English (en)
Inventor
フェイトニー リサール
Fathony Rizal
フェイトニー リサール
シュミット フランク
Frank Schmidt
シュミット フランク
ジーグ コルター ジェレミー
Zieg Kolter Jeremy
ジーグ コルター ジェレミー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Carnegie Mellon University
Original Assignee
Robert Bosch GmbH
Carnegie Mellon University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH, Carnegie Mellon University filed Critical Robert Bosch GmbH
Publication of JP2021089731A publication Critical patent/JP2021089731A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/60Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor
    • A63F13/67Generating or modifying game content before or while executing the game program, e.g. authoring tools specially adapted for game development or game-integrated level editor adaptively or by learning from player actions, e.g. skill level adjustment or by storing successful combat sequences for re-use
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/4155Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by programme execution, i.e. part programme or machine function execution, e.g. selection of a programme
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C3/00Registering or indicating the condition or the working of machines or other apparatus, other than vehicles
    • G07C3/005Registering or indicating the condition or the working of machines or other apparatus, other than vehicles during manufacturing process
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/10Movable barriers with registering means
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40496Hierarchical, learning, recognition level controls adaptation, servo level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Manufacturing & Machinery (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Image Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)

Abstract

【課題】分解できない性能メトリックについてクラス分類器の性能を最適化する。【解決手段】訓練システム140において、入力信号(xi)をクラス分類するためのクラス分類器60、特に2値クラス分類器を訓練するためのコンピュータ実装方法であって、分解できないメトリックが、訓練データセットの入力信号(xi)に対応するクラス分類(yi)と、クラス分類器から得られる入力信号の対応する予測されたクラス分類との間の整合性を測定するものであり、分解できないメトリックがクラス分類(yi)と予測されたクラス分類との混同行列による複数の項にどのように依存するかを特徴付ける、重み付け係数を提供するステップと、提供された前記重み付け係数に応じてクラス分類器60を訓練するステップと、を含む。【選択図】図8

Description

本発明は、クラス分類器を訓練するための方法、このクラス分類器を使用するための方法、コンピュータプログラムおよび機械可読記憶媒体、制御システム、ならびに訓練システムに関する。
先行技術
Zhan Shi,Xinhua Zhang,and Yaoliang Yu, Bregman divergence for stochastic variance reduction: Saddle-point and adversarial prediction,Advances in Neural Information Processing Systems, 2017の6033-6043頁には、指数関数的なフルサイズの条件付き分布についての最適化を多項式サイズの周辺分布において低減する周辺化を使用する敵対的予測技法を適用して、Fスコアメトリックを最適化するための機械学習方法を開示している。
Hong Wang,Wei Xing,Kaiser Asif,and Brian Ziebart, Adversarial prediction games for multivariate losses,Advances in Neural Information Processing Systems, 2015の2710-2718頁には、幾つかの性能メトリックについてクラス分類器を訓練する二重オラクル技法の使用を開示している。
本発明の利点
正解率メトリックは最も一般的な評価測定値であるが、多くの用途では、サンプルごとの測定値への加法分解が行えない、すなわち、評価データセット内の個々のサンプルの寄与の合計として表現することができない、より複雑な評価メトリックの使用が要求される。
現実世界の用途では、機械学習アルゴリズムの性能は、好ましくは、関心対象の問題のために特別にカスタマイズされた評価メトリックによって測定される。このような評価メトリックは、分解できないメトリックであることが多い。
例えば、例えば工業生産環境において生産品が仕様通りに生産されているか否かを自動的に検査するために使用されうる光学検査タスクでは、このような分解できないメトリックの例として、適合率、再現率、特異度、またはFβスコアを使用することが望ましいものとされうる。
例えば、「1」のラベルが「OK」を意味し、「0」が「OKではない」を意味するものと仮定する。適合率、すなわち真陽性サンプルと予測陽性サンプルとの比率は、どれだけ多くの「1」ラベルが実際に正しいかの割合を測定する。適合率100%のエンドオブライン検査からは、1つの不良品も出荷されないことになる。高い適合率のために訓練された機械では、全ての「1」ラベルを信頼し、「0」としてラベル付けされた生産品のみについて(非常に高価となりうる)再検査を実施することも想定されうる。
再現率、すなわち、真陽性と実陽性との比率は、実際にどれだけ多くの「OK」ケースが正しくラベル付けされているかの割合を測定する。再現率が非常に高い場合、「0」としてラベル付けされた商品の高価となる再検査を見送り、同商品を直ちに廃棄することが想定されうる。
特異度、すなわち真陰性と実陰性との比率は、どれだけの数の「OKではない」ケースが「0」として正しくラベル付けされているかの割合を測定する。特異度が高ければ、「1」としてラベル付けされた全ての商品を直ちに出荷することが想定されうる。
βは、高い適合率および高い再現率の両方の目標を満たす、適合率(β=0)と、適合率および再現率(β=1)間の調和平均との間の滑らかな補間と考えることができる。
これらのメトリックは、他の用途でも重要である。例えば、例えば受信したビデオ画像のセマンティックセグメンテーションに依存するタスク(例えば、自動運転車における歩行者の検出またはビデオ監視システムにおける不審物の検出など)では、Fが重要な最適化目標である。これは、画像の大部分を占めるオブジェクトでは、通常、再現率が適合率よりも高いが、小さなオブジェクトではその逆であるためである。同時に生じる低い再現率および低い適合率にペナルティを科すことにより、得られるセグメンテーションが向上する。
クラス分類器を使用してユーザコマンドを解釈する自動パーソナルアシスタントの場合、自動パーソナルアシスタントが可能な限り多くの実際のコマンドを正しく認識することが所望されうるが、この場合、高い適合率が望ましい評価メトリックとなりうる。
クラス分類器の出力に応じてアクセスを許可しうるアクセス制御システムの場合、権限を有さない人物にアクセスが許可されないことが所望されうる。このようなシステムでは、高い特異度が望ましいものとなりうる。
さらに、Fβメトリックの使用は、不均衡なデータセットを伴うクラス分類タスクに有用である。医療分野では、例えば撮像システムの画像を評価する際に、再現率、特異度、および情報利用性が良好なクラス分類性能を保証する好ましいメトリックとなる。
言い換えれば、訓練における、このような分解できないメトリックにしたがった最適化は、実用的な価値が高い。しかし、分解できないメトリックについての訓練アルゴリズムは、実用的な用途、特に、典型的には勾配ベースの手法を用いて訓練が行われる深層アーキテクチャの表現力に依存する現在の機械学習用途では、広く利用されてはいない。関心対象となる評価メトリックを最適化するように訓練される代わりに、これらは、分解できないメトリックも間接的に最適化されることを期待して、交差エントロピー誤差を最小化するように訓練されうる。
独立請求項1の特徴を有する方法は、勾配ベースの学習手順を使用して、分解できない広範な性能メトリックについてクラス分類器の性能を最適化でき、これらのメトリックに関する性能の改善がもたらされる、という利点を有する。
更なる改善について、従属請求項に示す。
本発明の開示
第1の態様において、本発明は、分解できないメトリックにしたがって性能を最適化するように入力信号をクラス分類するためのクラス分類器、特に2値クラス分類器を訓練するためのコンピュータ実装方法であって、分解できないメトリックが、訓練データセットの入力信号に対応するクラス分類と、前記クラス分類器から得られる前記入力信号の対応する予測されたクラス分類との間の整合性を測定するものであり(言い換えれば、メトリックは、クラス分類と、対応する予測されたクラス分類とがどの程度良好に一致するかを測定するものであり)、前記方法が、
−前記分解できないメトリックが前記クラス分類と前記予測されたクラス分類との混同行列による複数の項にどのように依存するかを特徴付ける、重み付け係数を提供するステップと、
−提供された前記重み付け係数に応じて前記クラス分類器を訓練するステップと、を含む方法に関する。本発明は、提供された重み付け係数に応じて、分解できない広範なメトリックについてクラス分類器の最適化を自動的に実行できる、という利点を有する。
前記分解できないメトリックは、重み付け係数a,b,f,gを用いる式
Figure 2021089731
によって与えられてよく、ここで、aおよびbはスカラー値であり、fおよびgはパラメータ化(パラメータなしを含む)関数であり、TP,TN,PP,PN,AP,およびANは、前記混同行列のエントリであって、
Figure 2021089731
のように提示されうる。
このような形態で書くことができる分解できないメトリックにより、提供された前記重み付け係数に応じて前記クラス分類器を効率的に訓練できることが判明した。
なお、エントリPNおよびANに関する依存性が冗長であり、以下では無視される。
このようなメトリックの例について、次の表に示す。すなわち、
Figure 2021089731
である。
好ましくは、前記最適化は、敵対的予測法として、すなわち、第1のプレーヤ(予測者)と第2のプレーヤ(敵対者)との間の2人用ゲームの均衡、より具体的にはナッシュ均衡を見つけることによって実行され、前記第1のプレーヤが、前記データの(全ての)入力値に対応する第1のクラス分類を見つけようとし、前記第2のプレーヤが、前記データの(全ての)入力値に対応する第2のクラス分類を見つけようとし、前記第1のクラス分類および前記第2のクラス分類に基づいて前記混同行列が評価される前記メトリックの期待値を、前記第1のプレーヤは最大化しようとし、前記第2のプレーヤは最小化しようとし、第2のクラス分類が、モーメントマッチング制約を受ける。
数学では、前記敵対的予測を、
Figure 2021089731
のように定式化することができ、ここで、
Figure 2021089731
は第1のプレーヤの確率的予測であり、
Figure 2021089731
は敵対者の分布であり、
Figure 2021089731
は経験分布である。
敵対的なプレーヤは、特徴の期待値が経験的な特徴の統計値と一致する条件付き確率
Figure 2021089731
を選択することにより、訓練データを近似する必要がある。一方、予測者は、期待されるメトリックを最大化する任意の条件付き確率
Figure 2021089731
を自由に選択する。
ここで、Φが前記クラス分類器の特徴ベクトルを表す。例えば、前記クラス分類器がニューラルネットワークによって与えられる場合、Φは、特徴に対する線形クラス分類器として機能する最後の全結合層への入力である。特徴関数は、加法的、すなわち、Φ(x,y)=ΣΦ(x,y)である。単純化のために、以下では、Φ(x,y=0)=0を仮定することができる(そうでない場合、Φ’(x,0)=0およびΦ’(x,1)=Φ(x,1)−Φ(x,0)により、特徴抽出器φをφ’で置き換えることができる。
前記ミニマックス最適化の境界条件は、「モーメントマッチング制約」と呼ばれるものであり、言い換えれば、「モーメントマッチング制約」とは、前記特徴ベクトルΦのテストデータについての経験的な期待値が、入力信号(x)の経験分布
Figure 2021089731
および出力信号(y)の敵対者の予測の条件付き確率
Figure 2021089731
についての前記特徴ベクトルΦの期待値と一致することを意味する。
なお、この説明は、2値クラス分類器に焦点を当てているが、一般的なクラス分類器の訓練に容易に適用しうることに留意されたい。このために、複数の2値クラス分類器を使用して一般的な前記クラス分類器を作ることが想定されうる。例えば、一般的なクラス分類器が入力データをクラス分類する各クラスについて単一の2値クラス分類器を作ることが想定されうるが、ここで、前記2値クラス分類器はそれぞれ、前記入力データが関連するクラスに属するか否かを決定しなければならない。代替的に、2値分岐を有するツリー状の分類で、目標クラスの総数を配置することも想定されうるが、ここで、複数の2値クラス分類器。
当該敵対的予測法で前記最適化を実行することは、敵対者に対して性能メトリックをロバストに最大化する方法である。言い換えれば、得られるクラス分類器は、よりロバストである。本発明は、この敵対的予測フレームワークをクラス分類問題に適用して、分解できないメトリックを訓練中に最適化する方法を示す。
例えば、前記最適化は、前記モーメントマッチング制約に対応するラグランジュ乗数の最適値を見つけることによって実行されてもよく、ここでは、前記2値クラス分類器の全結合層の訓練されたパラメータが、前記ラグランジュ乗数の前記最適値と等しい値に設定される。(なお、前記ラグランジュ乗数はベクトル値化されることに留意されたい)。これは、凸凹鞍点問題の強い二元性を利用しており、
Figure 2021089731
のように書くことができる。
前記全結合層のパラメータは、モーメントマッチング制約の下で、それらをラグランジュ乗数の前記最適値と等しく設定することにより、簡便に最適化できることが判明している。
これを効率的に解くために、好ましくは、前記期待値は、前記第1のクラス分類および/または前記第2のクラス分類の周辺確率に基づいて計算され、ここで、前記周辺確率は、所与の入力値のクラス分類が所定のクラス分類に等しく、かつ全てのクラス分類の合計が所定の合計値に等しくなる、周辺確率を表す。
言い換えれば、前記第1のクラス分類の周辺確率
Figure 2021089731
は、n個の項目(nが訓練データセット内のサンプル数である)を有するベクトルとして書くことができ、
Figure 2021089731
(すなわち、y=1かつ
Figure 2021089731
であるイベントの周辺確率)に等しい要素
Figure 2021089731
で表すことができる。
同様に、敵対者の対応する周辺確率についても
Figure 2021089731
と表す。前記第2の(敵対的な)プレーヤのクラス分類の周辺確率は、
Figure 2021089731
によって、
Figure 2021089731
として表される。
合計の周辺確率は、
Figure 2021089731
かつ
Figure 2021089731
として表される。
このことが式(2)の解にどのように寄与するかを理解するために、式(2)の内部ミニマックス問題、すなわち、
Figure 2021089731
について考える。
上記の表記を使用すると、指数関数的なサイズの条件付き確率
Figure 2021089731
および
Figure 2021089731
についての上記のメトリックの期待値を、以下のように、周辺確率変数についての関数の和、すなわち
Figure 2021089731
として表すことができる。
幾つかのメトリック(例えば、適合率、再現率、F値、感度、特異度)は、ゼロによる除算を避けるために特殊ケースを実施する。真陽性を含むメトリックの場合、特殊ケースは、通常、
Figure 2021089731
のように定義され、一方、真陰性を有するメトリックの場合、これらのケースは、
Figure 2021089731
のように定義される。
ここで、
Figure 2021089731
および
Figure 2021089731
は、クラス分類器が全てのサンプルをそれぞれ陰性および陽性として予測することを意味する。特殊ケースが実施されるようなメトリックである場合、式(3)は、それに応じて修正されなければならない。例えば、真陽性および真陰性の両方の特殊ケースが実施される場合、式(3)は、
Figure 2021089731
のようになる。
各列P(:,k)
Figure 2021089731
を表す、n×nの周辺分布行列Pを表すとする。同様に、
Figure 2021089731
につき、行列Qを表すとする。各列が各サンプルの特徴を表す、すなわちΨ:,i=Φ(x,y=1)およびmが特徴の数である、n×n行列として、Ψを表すとする。次いで、式(2)を、
Figure 2021089731
のように書き換えることができ、ここで、Δは、
Figure 2021089731
のように表される有効な周辺確率の行列の集合である。
前記最適化を解く非常に効率的な方法として、これらの2人のプレーヤの一方のみにおいて線形プログラムを解くことによって前記2人用ゲームを解くことを想定することができる。これが可能となるのは、式(5)のQについての内部最小化を、
Figure 2021089731
の形式の線形プログラムとして解くことができるためであり、ここで、c(Q)がQの線形関数であり、Z(Q)がQの線形行列値関数であり、これらは両方とも、メトリックの形態によって解析的に定義される。
幾つかの機械学習の設定では、他のメトリックに関する制約を条件として性能メトリックを最適化することが望ましい場合がある。このことは、異なる性能メトリックの間にトレードオフの関係がある場合に生じる。
例えば、機械学習システムは、再現率が事前に定義可能な閾値よりも大きいことを条件として、予測の適合率の最適化を所望することがある。これらのタスクでは、敵対的予測公式は、
Figure 2021089731
のように書くことができ、ここで、tはメトリック制約の数であり、τは事前に定義可能な閾値である。上で概説したように、これは
Figure 2021089731
のように計算することができ、ここで、Γは、
Figure 2021089731
のように定義される周辺確率行列の集合である。
したがって、本発明の更なる態様によれば、前記分解できないメトリックにしたがった前記性能の前記最適化は、前記クラス分類と前記予測されたクラス分類との間の整合性を測定する第2のメトリックの期待値の不等式制約をさらに受ける。
これも、
Figure 2021089731
の形式の線形プログラムとして解くことができる。
ここで、μが定数であり、B(l)が行列であり、これらは両方とも、l番目のメトリック制約およびグランドトゥルースラベルによって解析的に定義される。
本発明の実施形態について、以下の図を参照してより詳細に説明する。
環境中のアクチュエータを制御する、クラス分類器を有する制御システムを示す図である。 少なくとも部分的に自律的なロボットを制御する制御システムを示す図である。 製造機械を制御する制御システムを示す図である。 自動パーソナルアシスタントを制御する制御システムを示す図である。 アクセス制御システムを制御する制御システムを示す図である。 監視システムを制御する制御システムを示す図である。 撮像システムを制御する制御システムを示す図である。 クラス分類器を訓練するための訓練システムを示す図である。 クラス分類器の例示的な構造を示す図である。 前記訓練システムによって実行される訓練方法のフローチャート図である。 この訓練方法の一態様のフローチャート図である。
実施形態の説明
図1に示すのは、アクチュエータ10の、その環境20における一実施形態である。アクチュエータ10は、制御システム40と相互作用する。アクチュエータ10は、アクチュエータ制御コマンドAを受信でき、受信した前記アクチュエータ制御コマンドAにしたがって動作できる技術的システムであってもよい。アクチュエータ10およびその環境20は合わせて、アクチュエータシステムと呼ばれる。好ましくは等間隔の距離で、センサ30が、アクチュエータシステムの状態を検知する。センサ30は、複数のセンサを備えてもよい。好ましくは、センサ30は、環境20を撮像する光学センサである。検知した状況を符号化するセンサ30の出力信号S(またはセンサ30が複数のセンサを備える場合、センサそれぞれの出力信号S)が、制御システム40に送信される。
これにより、制御システム40は、センサ信号Sのストリームを受信する。制御システムは、次いで、センサ信号Sのストリームに応じて一連のアクチュエータ制御コマンドAを計算し、制御コマンドは、次いでアクチュエータ10に送信される。
制御システム40は、センサ30のセンサ信号Sのストリームを任意手段としての受信ユニット50で受信する。受信ユニット50は、センサ信号Sを入力信号xに変換する。代替的に、受信ユニット50がない場合、各センサ信号Sは、入力信号xとして直接受け取られてもよい。入力信号xは、例えば、センサ信号Sの一部として与えられてもよい。代替的に、センサ信号Sを処理して入力信号xを得るようにしてもよい。入力信号xは、センサ30によって記録された画像に対応する画像データを含んでもよいし、例えば、センサ30がオーディオセンサである場合、オーディオデータを含んでもよい。言い換えれば、入力信号xは、センサ信号Sにしたがって提供されてもよい。
入力信号xは、次いで、クラス分類器60、例えば画像クラス分類器に送られ、クラス分類器は、例えば、人工ニューラルネットワークによって与えられてもよい。
クラス分類器60は、パラメータ記憶装置Stに記憶されるとともに、それによって提供される、パラメータξによってパラメータ化される。
クラス分類器60は、入力信号xから出力信号yを決定する。出力信号yは、入力信号xに1つ以上のラベルを割り当てる情報を含む。出力信号yは、任意手段としての変換ユニット80に送信され、変換ユニットは、出力信号yを制御コマンドAに変換する。アクチュエータ制御コマンドAは、次いで、それに応じてアクチュエータ10を制御するためにアクチュエータ10に送信される。代替的に、出力信号yは、制御コマンドAとして直接取り込まれてもよい。
アクチュエータ10は、アクチュエータ制御コマンドAを受信し、それに応じて制御され、アクチュエータ制御コマンドAに対応する動作を実行する。アクチュエータ10は、アクチュエータ制御コマンドAを更なる制御コマンドに変換する制御ロジックを備えてもよく、更なる制御コマンドは、次いで、アクチュエータ10を制御するために使用される。
更なる実施形態では、制御システム40は、センサ30を備えてもよい。また更なる実施形態では、制御システム40は、代替的にまたは付加的にアクチュエータ10を備えてもよい。
また更なる実施形態では、制御システム40が、アクチュエータ10の代わりにディスプレイ10aを制御することが想定されうる。
さらに、制御システム40は、プロセッサ45(または複数のプロセッサ)と、実行されると本発明の一態様による方法を制御システム40に実行させる命令が記憶されている、少なくとも1つの機械可読記憶媒体46とを備えてもよい。
図2は、少なくとも部分的に自律的なロボット、例えば、少なくとも部分的に自律的な車両100を、制御システム40が制御するために使用される実施形態を示す。
センサ30は、1つ以上のビデオセンサおよび/または1つ以上のレーダセンサおよび/または1つ以上の超音波センサおよび/または1つ以上のLiDARセンサおよび/または1つ以上の(例えばGPSのような)位置センサを備えてもよい。これらセンサの一部または全部が、必須ではないが、好ましくは、車両100に搭載される。代替的にまたは付加的に、センサ30は、アクチュエータシステムの状態を決定するための情報システムを備えてもよい。このような情報システムの一例は、環境20における現在または将来の天候状態を決定する天候情報システムである。
例えば、入力信号xを使用して、クラス分類器60は、例えば、少なくとも部分的に自律的なロボットの近傍にある物体を検出してもよい。出力信号yは、少なくとも部分的に自律的なロボットの近傍のどこに物体が位置しているかを特徴付ける情報を含んでもよい。次いで、例えば、検出した前記物体との衝突を回避するために、この情報にしたがって制御コマンドAを決定してもよい。
アクチュエータ10は、好ましくは、車両100に搭載されており、車両100のブレーキ、推進システム、エンジン、駆動系、またはステアリング部によって与えられてもよい。検出した前記物体との衝突を車両100が回避するために、アクチュエータ(または複数のアクチュエータ)10を制御するように、アクチュエータ制御コマンドAを決定してもよい。また、検出した物体を、例えば歩行者や樹木など、最も可能性が高いとクラス分類器60が判断するものにしたがってクラス分類し、クラス分類に応じてアクチュエータ制御コマンドAを決定してもよい。
一実施形態では、クラス分類器60は、前方の道路上の車線を識別するように、例えば、前記道路上の路面およびマーキングをクラス分類し、前記マーキング間の路面部分として車線を識別するように、設計されてもよい。ナビゲーションシステムの出力に基づいて、次いで、選択した経路を追跡するのに適した目標車線を選択し、現車線および前記目標車線に応じて、次いで、車両10が車線を変更するべきか、前記現車線に留まるべきかを決定してもよい。次いで、例えば、識別した前記動作に対応する所定の動きパターンをデータベースから取得することにより、制御コマンドAを計算してもよい。
同様に、道路標識または信号機を識別すると、道路標識の識別した種類または前記信号機の識別した状態に応じて、車両10の可能な動きパターンに関する対応する制約を、次いで、例えばデータベースから取得してもよく、前記制約に見合った車両10の将来の経路を計算してもよく、前記軌道を実行すべく車両を操舵するように、前記アクチュエータ制御コマンドAを計算してもよい。
同様に、歩行者および/または車両を識別すると、前記歩行者および/または車両の将来の挙動を推定してもよく、推定した前記将来の挙動に基づいて、次いで、前記歩行者および/または前記車両との衝突を回避するような軌道を選択してもよく、前記軌道を実行すべく車両を操舵するように、前記アクチュエータ制御コマンドAを計算してもよい。
更なる実施形態では、少なくとも部分的に自律的なロボットは、別の移動ロボット(図示せず)によって与えられてもよく、移動ロボットは、例えば、飛行、泳行、潜行、または歩行によって移動してもよい。移動ロボットは、とりわけ、少なくとも部分的に自律的な芝刈り機、または少なくとも部分的に自律的な清掃ロボットであってもよい。上記の実施形態の全てにおいて、移動ロボットの推進ユニットおよび/またはステアリング部および/またはブレーキを制御するように、アクチュエータ制御コマンドAを決定してもよく、これにより、識別した前記物体との衝突を移動ロボットが回避しうる。
更なる実施形態では、少なくとも部分的に自律的なロボットは、環境20における植物の状態を決定するために、センサ30、好ましくは光学センサを使用する園芸ロボット(図示せず)によって与えられてもよい。アクチュエータ10は、化学薬品を散布するためのノズルであってもよい。識別した種および/または植物の識別した状態に応じて、アクチュエータ10に、適切な化学薬品を植物に適量散布させるように、アクチュエータ制御コマンドAを決定してもよい。
また更なる実施形態では、少なくとも部分的に自律的なロボットは、例えば、洗濯機、ストーブ、オーブン、電子レンジ、または食洗機のような家電製品(図示せず)によって与えられてもよい。センサ30、例えば光学センサは、家電製品によって処理される物体の状態を検出してもよい。例えば、家電製品が洗濯機である場合、センサ30は、画像に基づいて洗濯機内の洗濯物の状態を検出してもよい。次いで、洗濯物の検出した材質に応じてアクチュエータ制御信号Aを決定してもよい。
図3に示すのは、例えば生産ラインの一部としての、製造システム200の製造機械11(例えば、パンチカッタ、カッタ、ガンドリル、またはグリッパー)を制御するために、制御システム40が使用される実施形態である。制御システム40は、製造機械11を制御するアクチュエータ10を制御する。
センサ30は、例えば製造された製品12の特性を捕捉する光学センサによって与えられてもよい。クラス分類器60は、これらの捕捉された特性から、製造された製品12の状態、例えば、前記製品12が不良であるか否かを決定してもよい。製造機械11を制御するアクチュエータ10は、次いで、製造された製品12の後続の製造工程のために、製造された製品12の決定された状態に応じて制御されてもよい。代替的に、製造された製品12の決定された状態に応じて、アクチュエータ10が後続の製造された製品12の製造中に制御されることが想定されうる。例えば、アクチュエータ10は、クラス分類器60によって不良であると識別された製品12を選択し、それらが廃棄される前に再検査されうる所定のビンに製品を選別するように制御されてもよい。
図4に示すのは、自動パーソナルアシスタント250を制御するために制御システム40が使用される実施形態である。センサ30は、例えば、ユーザ249のジェスチャのビデオ画像を受信するための、光学センサであってもよい。代替的に、センサ30はまた、例えば、ユーザ249の音声コマンドをオーディオ信号として受信するための、オーディオセンサであってもよい。
制御システム40は、次いで、自動パーソナルアシスタント250を制御するためのアクチュエータ制御コマンドAを決定する。アクチュエータ制御コマンドAは、センサ30のセンサ信号Sにしたがって決定される。センサ信号Sは、制御システム40に送信される。例えば、クラス分類器60は、例えば、ユーザ249によって行われたジェスチャを識別するためのジェスチャ認識アルゴリズムを実行するように、構成されてもよい。制御システム40は、次いで、自動パーソナルアシスタント250に送信するためのアクチュエータ制御コマンドAを決定してもよい。制御システムは、次いで、前記アクチュエータ制御コマンドAを自動パーソナルアシスタント250に送信する。
例えば、識別し、クラス分類器60によって認識したユーザジェスチャにしたがって、アクチュエータ制御コマンドAを決定してもよい。制御コマンドは、自動パーソナルアシスタント250に、データベースから情報を取得させ、この取得された情報をユーザ249による受信に適した形態で出力させる情報を含んでもよい。
更なる実施形態では、自動パーソナルアシスタント250の代わりに、制御システム40が、識別されたユーザジェスチャにしたがって制御される家電製品(図示せず)を制御することが想定されうる。家電製品は、洗濯機、ストーブ、オーブン、電子レンジ、または食洗機であってもよい。
図5に示すのは、制御システムがアクセス制御システム300を制御する実施形態である。アクセス制御システムは、アクセスを物理的に制御するように設計されてもよい。アクセス制御システムは、例えばドア401を備えてもよい。センサ30は、アクセスが許可されるか否かを決定するための関連するシーンを検出するように構成される。センサは、例えば、人物の顔を検出するための画像またはビデオデータを提供するための光学センサであってもよい。クラス分類器60は、例えば、データベースに記憶されている既知の人物との同一性を照合することにより、この画像またはビデオデータを解釈し、それにより人物の同一性を決定するように構成されてもよい。次いで、クラス分類器60の解釈に応じて、例えば、決定した同一性にしたがって、アクチュエータ制御信号Aを決定してもよい。アクチュエータ10は、アクチュエータ制御信号Aに応じてアクセスを許可するか、または許可しないロックであってもよい。物理的ではない論理的なアクセス制御も可能である。
図6に示すのは、制御システム40が監視システム400を制御する実施形態である。この実施形態は、図5に示した実施形態とほぼ同一である。したがって、異なる態様についてのみ詳細に記載する。センサ30は、監視下にあるシーンを検出するように構成される。制御システムは、必ずしもアクチュエータ10を制御せず、ディスプレイ10aを制御する。例えば、機械学習システム60は、シーンのクラス分類、例えば、光学センサ30によって検出されるシーンが不審であるかどうか、を決定してもよい。ディスプレイ10aに送信されるアクチュエータ制御信号Aは、次いで、例えば、機械学習システム60によって不審であると判断された物体を強調表示するために、例えば、決定されたクラス分類に応じてディスプレイ10aに表示内容を調節させるように構成されてもよい。
図7に示すのは、撮像システム500、例えば、MRI装置、X線撮像装置、または超音波撮像装置を制御するための制御システム40の実施形態である。センサ30は、例えば撮像センサであってもよい。機械学習システム60は、検知された画像の全部または一部のクラス分類を決定してもよい。次いで、アクチュエータ制御信号Aは、このクラス分類にしたがって選択され、それによりディスプレイ10aを制御してもよい。例えば、機械学習システム60は、検知された画像のある領域を潜在的に異常であると解釈してもよい。この場合、ディスプレイ10aに画像を表示させ、潜在的に異常な領域を強調表示させるように、アクチュエータ制御信号Aを決定してもよい。
図8に示すのは、クラス分類器60を訓練するための訓練システム140の実施形態である。訓練データユニット150が、クラス分類器60に送られる入力信号xを決定する。例えば、訓練データユニット150は、少なくとも1セットTの訓練データが記憶されているコンピュータ実装データベースStにアクセスしてもよい。少なくとも1セットTは、入力信号xと、対応する望ましい出力信号yとの対を含む。望ましい出力信号yは、評価ユニット180に送られる。訓練データのセットTは、訓練データの完全なセットであってもよい。訓練データのセットはまた、訓練がバッチで行われる場合、訓練データの選択されたバッチであってもよい。
クラス分類器60は、入力信号xから出力信号
Figure 2021089731
を計算するように構成される。これらの出力信号
Figure 2021089731
はまた、評価ユニット180に送られる。
修正ユニット160が、評価ユニット180からの入力に応じて、更新されたパラメータξ’を決定する。更新されたパラメータξ’は、パラメータ記憶装置Stに送信されて、現在のパラメータξを置き換える。
さらに、訓練システム140は、プロセッサ145(または複数のプロセッサ)と、実行されると本発明の一態様による方法を制御システム140に実行させる命令が記憶されている少なくとも1つの機械可読記憶媒体146とを備えてもよい。
図9に示すのは、クラス分類器60の例示的な構造であり、この実施形態では、クラス分類器は、パラメータまたは重みξによってパラメータ化されたニューラルネットワークによって与えられる。入力データxは、入力層61に供給され、処理された後、連続して隠れ層62および63に送られる。層63の出力は、特徴マップΦである。クラス分類器60が畳み込みニューラルネットワークである場合、層61,62,および63は、少なくとも1つの畳み込み層を備える。層61,62,および63をパラメータ化するパラメータをwと呼ぶ。特徴マップΦは、パラメータξによってパラメータ化された全結合層64に送られる。出力Φ・ξは、出力Φ・ξのためのソフトマックス変換と、最高のソフトマックススコアに対応するクラス分類のラベルyをクラス分類器60の出力信号として選択するargmax関数とを計算することを含む最終層65に送られる。
図10に示すのは、訓練システム140によって実行されうる、クラス分類器60を訓練するための訓練方法の実施形態を概説するフローチャート図である。第1のステップ(1000)では、ラグランジュ乗数値θが、例えばランダムに、または所定の値、例えば0として初期化される。全結合層64のパラメータξが、ラグランジュ乗数値θに等しく設定される。式(M)で定義されるようなメトリックを特徴付けるパラメータa,b,f,gと同様に、データセットTが提供される。任意手段として、式(7)で与えられるような制約を特徴付けるパラメータも提供される。
次いで(1010)にて、式(5)(または制約が設けられる場合には(7))の内部ミニマックス問題として記述される最適化問題の最適値Qが計算される。加えて、行列Ψが計算される。この計算の詳細については、図11に関連して説明する。
次いで(1020)にて、インクリメントdθ=−Ψ(Q*T1−y)が計算され、ここで、y=(y1,…yは、訓練データセットのクラス分類を有するベクトルである。
次いで(1030)にて、例えば、インクリメントdθの絶対値が所定の閾値未満であるかどうかを検査することにより、方法が収束したかどうかが検査される。
方法が収束した場合、アルゴリズムが停止され、訓練が完了する(1060)。
そうでない場合、任意手段としてのステップ(1040)で、dθに対するインクリメントが、全結合層64のパラメータξに対するインクリメントとして取られ、残りのネットワークを通じて、すなわち、層63,62および61を通じて誤差逆伝播されて、パラメータwに対するインクリメントdwが得られ、方法はステップ(1050)へと続く。代替的に、パラメータwは一定のままであることができ、方法は、ステップ(1030)から直接ステップ(1050)に分岐する。
ステップ(1050)では、パラメータθ,ξおよびwが、
θ←θ+dθ
w←w+dw
ξ←θ
として更新される。
次いで、方法は、ステップ(1010)へと続き、方法がステップ(1060)で終了するまで繰り返される。
図11に示すのは、ステップ(1010)にて式(5)(または(7))で記述したような内部ミニマックス問題の最適値Qを計算する方法のフローチャート図である。
まず(2010)にて、ベースとなるn×n行列D,E,Fが、
Figure 2021089731
として提供される。
次いで(2020)にて、Z(Q)が、
Z(Q)=QD+diag(1,…,1/n)Q1111−diag(1,…,1/n)QE11−diag(1,…,1/n)Q11+QE+diag(1,…,1/n)Fdiag(1,…,1/n)Q11
のような記号表現として提供される。
次いで(2030)にて、Z(Q)からZ’(Q)=Z(Q)・diag(1,…,n)によって線形変換された表現Z’(Q)が提供される。
さらに、式(S1)および(S2)で定義されるような特殊ケースを実施する必要がない場合、c(Q)がc(Q)=0として計算される。(S1)を実施したい場合、Z(Q)が、
(diag(1,…,1/n)11−Id)diag(1,…,1/n)11
によって増加され、c(Q)がc(Q)=1−1diag(1,…,1/n)Q1となり、Idがn×n次元の恒等行列である。
(S2)が実施される場合、Z(Q)がn×n次元の行列Eによって増加され、この行列は、それがQnnに設定される位置(n,n)を除いて、どこでも0である。
次いで(2040)にて、データセットT内の全ての入力信号xが、特徴ベクトルΦ(x)を得るためにクラス分類器(60)を通じて伝播される。列が各サンプルの特徴を
Ψ:,i=Φ(x
として表す、n×m行列Ψ(nがデータセットT内のデータのサンプル数であり、mが特徴の数である)と、行列Wとが、
W=Ψθ1
として計算される。
式(7)を解く場合、クラス分類器(60)の得られる出力値も、
Figure 2021089731
として記憶される。
次いで、式(5)を解く場合、(2050)にて、Qが、
Figure 2021089731
の線形プログラムの最適値として計算される。
式(7)を解く場合、式(7)の各制約について、行列B(i)およびスカラーμが、
Figure 2021089731
を計算することにより、定義される。
これは、各制約iに対して、l=Σについて、ベクトル
Figure 2021089731
を定義し、任意のiについて、(S1)も(S2)も実施されない場合、
(i)=D+E(1−y)+diag(1,…,1/n)[F+(n−l)E]1
μ=0
を設定することによって行われる。
(S1)が実施される場合、l=Σ>0である限り、上述の表現は同じままである。l=0である場合、上記の変数が、
(i)=−diag(1,…,1/n)11
μ=1
のように設定される。
(S2)が実施される場合、l=Σ<nである限り、(S1の特殊ケースの前の)上述の表現は同じままである。l=nである場合、n×n次元の行列としてμ=0およびB(i)を選択し、この行列は、それが1である位置(n,n)を除いて、どこでも0である。
次いで、
Figure 2021089731
の線形プログラムを解くことにより、Qを最適値として得る。
これにより、方法が終了する。
用語「コンピュータ」は、所定の計算命令を処理するための任意の装置を対象として含む。これらの計算命令は、ソフトウェアの形態であってもよく、ハードウェアの形態であってもよく、またはソフトウェアとハードウェアの混合形態であってもよい。
説明したようにソフトウェアのみにおいてプロシージャが完全に実施されるわけではないことがさらに理解される。プロシージャはまた、ハードウェアの形態でも、ソフトウェアとハードウェアとの混合形態でも実施することができる。

Claims (15)

  1. 分解できないメトリックにしたがって性能を最適化するように入力信号(x)をクラス分類するためのクラス分類器(60)、特に2値クラス分類器を訓練するためのコンピュータ実装方法であって、前記分解できないメトリックは、訓練データセットの入力信号(x)に対応するクラス分類(y)と、前記クラス分類器から得られる前記入力信号の対応する予測されたクラス分類
    Figure 2021089731
    との間の整合性を測定するものであり、前記方法は、
    −前記分解できないメトリックが前記クラス分類(y)と前記予測されたクラス分類
    Figure 2021089731
    との混同行列による複数の項(RP,TN,PP,AP,AN)にどのように依存するかを特徴付ける、重み付け係数(a,b,f,g)を提供するステップと、
    −提供された前記重み付け係数(a,b,f,g)に応じて前記クラス分類器(60)を訓練するステップと、
    を含む、方法。
  2. 前記分解できないメトリックが、式
    Figure 2021089731
    によって与えられ、ここで、aおよびbはスカラー値であり、fおよびgは関数であり、TP,TN,PP,PN,AP,およびANは、前記混同行列のエントリ、すなわちTP=「真陽性」、TN=「真陰性」、PP=「予測陽性」、PN=「予測陰性」、AP=「実陽性」、およびAN=「実陰性」である、請求項1記載の方法。
  3. 前記最適化が、第1のプレーヤ(P)と第2のプレーヤ(Q)との間の2人用ゲームの均衡を見つけることによって実行され、前記第1のプレーヤ(P)が、訓練データ(T)の入力信号(x)に対応する第1のクラス分類
    Figure 2021089731
    を見つけようとし、前記第2のプレーヤ(Q)が、前記訓練データ(T)の入力値(x)に対応する第2のクラス分類
    Figure 2021089731
    を見つけようとし、前記第1のクラス分類
    Figure 2021089731
    および前記第2のクラス分類
    Figure 2021089731
    に基づいて前記混同行列が評価される前記メトリックの期待値を、前記第1のプレーヤ(P)が最大化しようとし、前記第2のプレーヤ(Q)が最小化しようとし、前記第2のクラス分類
    Figure 2021089731
    は、モーメントマッチング制約を受ける、請求項2記載の方法。
  4. 前記最適化が、前記モーメントマッチング制約に対応するラグランジュ乗数(θ)の最適値を見つけることによって実行され、前記2値クラス分類器(60)の全結合層(64)の訓練されたパラメータが、前記ラグランジュ乗数(θ)の前記最適値と等しく設定される、請求項3記載の方法。
  5. 前記期待値が、前記第1のクラス分類
    Figure 2021089731
    および/または前記第2のクラス分類
    Figure 2021089731
    の周辺確率
    Figure 2021089731
    に基づいて計算される、請求項4記載の方法。
  6. 前記最適化が、2人のプレーヤ(P,Q)の一方のプレーヤのみにおいて線形プログラムを解くことによって前記2人用ゲームを解くことを含む、請求項5記載の方法。
  7. 前記分解できないメトリックにしたがった前記性能の前記最適化が、前記クラス分類(y)と前記予測されたクラス分類
    Figure 2021089731
    との間の整合性を測定する第2のメトリックの期待値の不等式制約をさらに受ける、請求項1から6までのいずれか1項記載の方法。
  8. センサ信号をクラス分類するクラス分類器(60)を使用するためのコンピュータ実装方法であって、前記クラス分類器(60)は、請求項1から7までのいずれか1項記載の方法によって訓練され、前記方法が、
    −センサ(30)からのデータを含むセンサ信号(S)を受信するステップと、
    −前記センサ信号(S)に依存する入力信号(x)を決定するステップと、
    −前記入力信号(x)を前記クラス分類器(60)に供給して、前記入力信号(x)のクラス分類を特徴付ける出力信号(y)を得るステップと、
    を含む、方法。
  9. アクチュエータ(10)を制御するためのアクチュエータ制御信号(A)を提供するために、請求項1から7までのいずれか1項記載の方法によって訓練されたクラス分類器(60)を使用するためのコンピュータ実装方法であって、請求項8記載の方法のステップを全て含み、
    −前記出力信号(y)に応じて前記アクチュエータ制御信号(A)を決定するステップをさらに含む、方法。
  10. 前記アクチュエータ(10)が、少なくとも部分的に自律的なロボット(100)および/または製造機械(200)および/またはアクセス制御システム(300)を制御する、請求項9記載の方法。
  11. プロセッサ(45,145)によって実行される際に、請求項1から10までのいずれか1項記載の方法を、前記方法のステップの全てによってコンピュータに実行させるように構成されている、コンピュータプログラム。
  12. 請求項11記載のコンピュータプログラムが記憶されている、機械可読記憶媒体(46,146)。
  13. アクチュエータ(10)を動作させるための制御システム(40)であって、前記制御システム(40)が、請求項1から7までのいずれか1項記載の方法によって訓練されたクラス分類器(60)を備え、かつ前記クラス分類器(60)の出力にしたがって前記アクチュエータ(10)を動作させるように構成されている、制御システム(40)。
  14. 請求項8から10までのいずれか1項記載の方法を実行するように構成されている、制御システム(40)。
  15. 請求項1から7までのいずれか1項記載の方法を実行するように構成されている、訓練システム(140)。
JP2020199674A 2019-12-02 2020-12-01 クラス分類器を訓練するための装置および方法 Pending JP2021089731A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP19212867.6A EP3832550A1 (en) 2019-12-02 2019-12-02 Device and method for training a classifier
EP19212867 2019-12-02

Publications (1)

Publication Number Publication Date
JP2021089731A true JP2021089731A (ja) 2021-06-10

Family

ID=68762600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020199674A Pending JP2021089731A (ja) 2019-12-02 2020-12-01 クラス分類器を訓練するための装置および方法

Country Status (5)

Country Link
US (1) US11960991B2 (ja)
EP (1) EP3832550A1 (ja)
JP (1) JP2021089731A (ja)
KR (1) KR20210068993A (ja)
CN (1) CN112990248A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4105847A1 (en) * 2021-06-16 2022-12-21 Robert Bosch GmbH Device and method to adapt a pretrained machine learning system to target data that has different distribution than the training data without the necessity of human annotations on target data
CN115857359B (zh) * 2022-12-27 2023-07-28 广东非凡实业有限公司 高强度泥土的制备工艺及其系统
CN117197029B (zh) * 2023-04-28 2024-05-03 浙江工交机械股份有限公司 球销的自动化生产线及其方法
CN116824517B (zh) * 2023-08-31 2023-11-17 安徽博诺思信息科技有限公司 基于可视化的变电站运维安全管控系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9256944B2 (en) * 2014-05-19 2016-02-09 Rockwell Automation Technologies, Inc. Integration of optical area monitoring with industrial machine control

Also Published As

Publication number Publication date
CN112990248A (zh) 2021-06-18
US11960991B2 (en) 2024-04-16
KR20210068993A (ko) 2021-06-10
US20210165391A1 (en) 2021-06-03
EP3832550A1 (en) 2021-06-09

Similar Documents

Publication Publication Date Title
JP2021089731A (ja) クラス分類器を訓練するための装置および方法
US20200326667A1 (en) Robust multimodal sensor fusion for autonomous driving vehicles
KR20190136893A (ko) 강건한 자동화 학습 시스템을 생성하고 훈련된 자동화 학습 시스템을 시험하기 위한 방법, 장치 및 컴퓨터 프로그램
US11741356B2 (en) Data processing apparatus by learning of neural network, data processing method by learning of neural network, and recording medium recording the data processing method
CN114386614A (zh) 用于训练机器学习系统的方法和装置
Wang et al. Deep reinforcement learning enables adaptive-image augmentation for automated optical inspection of plant rust
US20210264261A1 (en) Systems and methods for few shot object detection
JP2023118101A (ja) 機械学習システムに対する敵対的パッチを特定するための装置及び方法
US20230031755A1 (en) Generative adversarial network for processing and generating images and label maps
US20230004826A1 (en) Device and method for classifying a signal and/or for performing regression analysis on a signal
US20220198781A1 (en) Device and method for training a classifier
US20220108152A1 (en) Method for ascertaining an output signal with the aid of a machine learning system
CN110334244B (zh) 一种数据处理的方法、装置及电子设备
CN113302630A (zh) 改进针对“对抗示例”的鲁棒性的设备和方法
US20220101129A1 (en) Device and method for classifying an input signal using an invertible factorization model
US20220101128A1 (en) Device and method for training a classifier using an invertible factorization model
EP3690760B1 (en) Device and method to improve the robustness against adversarial examples
US12020166B2 (en) Meta-learned, evolution strategy black box optimization classifiers
EP4296910A1 (en) Device and method for determining adversarial perturbations of a machine learning system
US20220019944A1 (en) System and method for identifying and mitigating ambiguous data in machine learning architectures
EP4343619A1 (en) Method for regularizing a neural network
US20230080736A1 (en) Out-of-distribution detection and recognition of activities with inertial measurement unit sensor
US20240169225A1 (en) Method and apparatus for creating a machine learning system
US20230351262A1 (en) Device and method for detecting anomalies in technical systems
US20210374549A1 (en) Meta-learned, evolution strategy black box optimization classifiers

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210104

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231017