JP2023180242A

JP2023180242A - ニューラルネットワークをトレーニングするための方法及び装置

Info

Publication number: JP2023180242A
Application number: JP2023093762A
Authority: JP
Inventors: ブランツトーマス; Branz Thomas; ハンゼルマンマルクス; Hanselmann Markus; ゲンスレアンドレアス; Genssle Andreas
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2022-06-08
Filing date: 2023-06-07
Publication date: 2023-12-20
Also published as: KR20230168966A; CN117196001A; US20230401836A1; DE102022205824A1

Abstract

【課題】技術システムのセンサ信号に基づいてセンサ信号に関する分類及び／又は回帰結果を特徴付ける出力信号を算定する第１のニューラルネットワークをトレーニングする方法、装置、プログラム及び記憶媒体を提供する。【解決手段】方法は、技術システム（自律型のロボット等）の動作中に、制御システム４０が、環境２０のセンサ信号Ｓを受信するステップと、第１のニューラルネットワーク６１により、センサ信号に基づいて第１の出力信号ｙ１を算定するステップと、第１のニューラルネットワークとは別のアーキテクチャを有する第２のニューラルネットワーク６２により、センサ信号に基づいて第２の出力信号ｙ２を算定するステップと、第１のニューラルネットワークのパラメータΦ１を適応化することによって、第２の出力信号に依存して第１のニューラルネットワークをトレーニングするステップと、を含む。【選択図】図１

Description

本発明は、ニューラルネットワークをトレーニングするための方法、トレーニング装置、コンピュータプログラム、及び、機械可読記憶媒体に関する。

発明の利点
特にセーフティクリティカルな（安全上重要な）技術システムにおける機械学習システムの開発、特にニューラルネットワークの開発は、動作中に機械学習システムによって下された決定が不所望の及び／又は危険な結果をもたらさないことを保証するための厳格なテストストラテジを生じさせる。

機械学習システムは、データに基づいて自身の決定を算定するので、公知の方法は、先ず、対応する技術システムの煩雑な複数回のテスト測定（英語：ｔｅｓｔｒｕｎｓ又はｖａｌｉｄａｔｉｏｎｒｕｎｓ）によってデータを収集し、続いて、これらのデータを、例えば、技術システムから外部の計算センタへ伝送しなければならず、その後、この外部の計算センタ内において機械学習システムの挙動を分析及び／又は適応化することができるようになることを示している。

こうした手法は、上述したニューラルネットワークの緩慢な開発サイクル、さらに、膨大な量のデータの伝送の必要を生じさせる。

２つの制限を少なくとも改善すること、即ち、機械学習システムのより迅速な開発サイクルを可能にし、その際に伝送されるデータの量を低減することが望ましい。

独立請求項１の特徴を備えた方法の利点は、より迅速な開発サイクルが可能となり、かつ、伝送されるデータの量の低減が可能となるように、ニューラルネットワークをトレーニングすることができることにある。

発明の開示
第１の態様においては、本発明は、技術システムのセンサ信号に基づいて当該センサ信号に関する分類及び／又は回帰結果を特徴付ける出力信号を算定するように構成されている第１のニューラルネットワークをトレーニングするための方法であって、
ａ．技術システムの動作中に当該技術システムのセンサ信号を受信するステップと、
ｂ．第１のニューラルネットワークにより、センサ信号に基づいて第１の出力信号を算定するステップと、
ｃ．第１のニューラルネットワークとは別のアーキテクチャを有する第２のニューラルネットワークにより、センサ信号に基づいて第２の出力信号を算定するステップと、
ｄ．第１のニューラルネットワークのパラメータを適応化することによって第１のニューラルネットワークをトレーニングするステップであって、第１のニューラルネットワークは、第２の出力信号に依存してトレーニングされる、ステップと、
を含む方法に関する。

本方法の各ステップは、特にコンピュータによって実行することができ、即ち、本方法は、特に、コンピュータ実装された方法とすることができる。

本方法は、例えば、技術システムの動作中に第２のニューラルネットワークを使用して、第２のニューラルネットワークが技術システムにより測定されたセンサ信号に基づきこの技術システムによって実行されるべきアクションを特徴付ける出力信号を算定することによって技術システムの挙動を制御することとして理解することができる。第２のニューラルネットワークと並行して、第１のニューラルネットワークも同様に出力信号を算定することができ、この出力信号と第２のニューラルネットワークの出力信号とを比較することができる。

センサ信号は、第１のニューラルネットワークの入力又は第２のニューラルネットワークの入力として理解することができる。ニューラルネットワークによる、センサ信号に基づく出力信号の算定は、特に、ニューラルネットワークがセンサ信号を入力として受け取り、このセンサ信号を処理し、この処理によってニューラルネットワークから出力される出力信号を算定することとして理解することができる。

センサ信号は、特に、例えば、カメラのような光学センサ、ＬｉＤＡＲセンサ又はサーマルカメラ、及び、レーダセンサ、超音波センサ又は圧電センサであるセンサの信号として理解することができる。一般的に、本方法は、センサ信号を方法に供給することができるあらゆるセンサに対して使用することができる。

第１のニューラルネットワークの出力信号及び／又は第２のニューラルネットワークの出力信号は、特にセンサ信号の分類を特徴付けることができる。代替的に又は付加的に、第１のニューラルネットワークの出力信号及び／又は第２のニューラルネットワークの出力信号は、センサ信号に関する回帰結果（即ち、実数値又は実数値ベクトル）を特徴付けることもできる。出力信号は、例えば、対象物検出及び／又はセマンティックセグメンテーションを特徴付けることもできる。

第２のニューラルネットワークは、特に、例えば、上述した方法とは別の開発ストラテジ及び／又はテストストラテジによって、セーフティクリティカルな技術システムにおいて使用されるように、既にリリースされているニューラルネットワークとして理解することができる。ここで、上述したことがらにより、第１のニューラルネットワークは、第２のニューラルネットワークの挙動に対応する又は少なくとも類似しているという観点において、検査可能かつ適応化可能である。ここでは、挙動とは、特に、入力として特定のセンサ信号を受け取った場合に、ニューラルネットワークがどのような出力信号を算定するかということであると理解することができる。

本方法の目的は、技術システムの動作に介入することなく第１のニューラルネットワークを適応化することとして理解することができる。有利には、このようにして、セーフティクリティカルな技術システムにおいて、潜在的にセーフティクリティカルな技術システムへの介入を行うことなく第１のニューラルネットワークを開発及び／又はテストすることができる。

例えば、第１の出力信号に対する第２の出力信号の距離が予め定められた閾値に達している又は予め定められた閾値を上回る場合、第１のニューラルネットワークのパラメータを適応化することができる。当該適応化は、必ずしも技術システムの計算ユニットによって実行する必要はなく、むしろ、技術システムの外部の計算ユニットにおいて実行可能である。

こうした背景から、本方法の好ましい実施形態においては、特に、第１のニューラルネットワークのアーキテクチャと第２のニューラルネットワークのアーキテクチャとの相違により、第１のニューラルネットワークの方が第１の出力信号の算定のためにより少ない計算容量及び／又はより少ないメモリ量しか必要としないこととなる。

発明者らは、第１のニューラルネットワークが、計算容量及びメモリ消費に関して最適化可能であり、ここで、第２のニューラルネットワークを基準として第１のニューラルネットワークのパフォーマンスを保持し得ることが当該実施形態の利点であることを確認することができた。ここで、パフォーマンスとは、ニューラルネットワークがセンサ信号に基づいて所望の出力信号を算定することができるニューラルネットワークの能力であると理解することができる。これは、ニューラルネットワークの標準化能力としても理解することができる。

本方法は、少なくとも方法ステップａ．乃至方法ステップｃ．が、埋め込み型計算アーキテクチャにおいて実行される場合に、特に好ましい。埋め込み型計算アーキテクチャの典型的な特徴は、通常のコンピュータと比較して大幅に低減された計算容量及び／又は大幅に低減されたメモリ量である。例えば、技術システムが、第２のニューラルネットワークにより制御される少なくとも部分的に自動化された車両又はロボットであることが想定される。これらのケースにおいては、技術システムの計算ユニットにおいて、第１のニューラルネットワークを、第２のニューラルネットワークと並行して動作させることができる。

ニューラルネットワークのアーキテクチャとは、特に、ニューラルネットワークのモデル選択であると理解することができる。モデル選択は、特に、ニューラルネットワークの入力がどのような形式を有すべきであるか、どの層が（特にどのタイプの層が）どのような順序によりどのような層接続状態において（例えば、フィードフォワードで又はリカレントで）ニューラルネットワークの入力信号を通過させるか、及び、どのようにニューラルネットワークの出力信号を合成するかを特徴付けるものである。ニューラルネットワークのアーキテクチャは、出力信号の計算に必要な計算容量及び／又は必要メモリ量に大きい影響を及ぼすものとして理解することができる。

本方法の好ましい実施形態においては、第１のニューラルネットワークの少なくとも１つの層が、そのパラメータ化において第２のニューラルネットワークの１つの層に相当し、第１のニューラルネットワークの層のパラメータは、トレーニング中に適応化されないことも可能である。

パラメータ化とは、層のハイパーパラメータと層の重みとの双方を意味するものと理解されたい。したがって、当該特徴は、第２のニューラルネットワークの少なくとも１つの層が第１のニューラルネットワークの層と同一であることとして理解することができる。この場合、これらの層は、それぞれのハイパーパラメータについてもそれぞれの重みについても同一である。このことは、少なくとも１つの層が第１のニューラルネットワークと第２のニューラルネットワークとの間で共有されることとして理解することもできる。例えば、複数の層の部分区間（ニューラルネットワークの下位ネットワーク又はニューラルネットワークのサブネットワークとしても知られる）の全体が第１のニューラルネットワークと第２のニューラルネットワークとの間で共有されることも想定される。例えば、第１のニューラルネットワークは、ニューラルネットワークの最後の複数の層、例えば、最後の３つの層を変更することによる、第２のニューラルネットワークの補正を特徴付けることができる。

本方法のこうした特徴の利点は、トレーニング中に適応化すべき層の数が少ないため、必要な計算容量及び／又は必要なメモリ量が大幅に低減されることにある。そのうえ、これにより、本方法のステップｄ．を埋め込み型計算アーキテクチャにおいて実行することができる。なぜなら、必要な計算容量及び／又は必要なメモリ量をこのように大幅に低減して最小化することができるからである。

一般的に、本方法のステップｄ．は、ステップａ．乃至ステップｃ．を実行するコンピュータ、即ち、好適には、技術システムの一部であるコンピュータによっても実行することができる。

本方法の他の特徴においては、ステップｄ．は、技術システムの外部にあるコンピュータによって実行されるものとしてもよい。

これは、技術システムが、例えば、第１の出力信号と第２の出力信号との差を例えば移動無線のような無線伝送媒体を用いて外部のコンピュータへ転送し、この外部のコンピュータにおいて出力信号が分析され、第１のニューラルネットワークが場合により適応化可能となることとして理解することができる。

特に、第１の出力信号及び／又は第２の出力信号の基準が満たされている場合、第１の出力信号及び／又は第２の出力信号を技術システムの外部にあるコンピュータへ転送するように構成可能である。ここでの基準は、例えば、第１の出力信号及び／又は第２の出力信号が予め定められた閾値を超えて相互に偏差している場合にのみ、技術システムの外部にあるコンピュータへ伝達されるように構成可能である。

特に、本方法はさらに、第２の出力信号に基づいて技術システムの駆動制御信号が算定されるように構成可能である。

換言すれば、第２の出力信号を、技術システムのアクションを決定するための尺度として使用することができる。駆動制御信号は、例えば、技術システムのアクションを引き起こす技術システムのアクチュエータの制御に使用することができる。

以下に、本発明の実施形態を、添付の図面を参照しながら、より詳細に説明する。

アクチュエータを駆動制御する制御システムの構造を示す概略図である。制御システムの一部を示す図である。少なくとも部分的に自律型のロボットを制御する実施例を示す概略図である。製造システムを制御する実施例を示す概略図である。トレーニングシステムを示す概略図である。

実施例の説明
図１は、制御システム（４０）と相互作用する、環境（２０）内のアクチュエータ（１０）を示している。環境（２０）は、好適には規則的な時間間隔で、センサ（３０）、例えばカメラセンサのような光学センサにおいて検出されるが、このセンサは、例えばステレオカメラのように複数のセンサによって構成されたものであってもよい。センサ（３０）のセンサ信号（Ｓ）（又は、複数のセンサの場合には、それぞれ１つのセンサ信号（Ｓ））が制御システム（４０）へ伝達される。これにより、制御システム（４０）は、センサ信号（Ｓ）のシーケンスを受信する。制御システム（４０）は、センサ信号（Ｓ）のシーケンスから駆動制御信号（Ａ）を算定し、この駆動制御信号（Ａ）がアクチュエータ（１０）へ伝送される。

制御システム（４０）は、任意選択手段としての受信ユニット（５０）においてセンサ（３０）のセンサ信号（Ｓ）のシーケンスを受信し、この受信ユニット（５０）がセンサ信号（Ｓ）のシーケンスを入力信号（ｘ）のシーケンスへと変換する（代替的に、各センサ信号（Ｓ）がそれぞれ直接に入力信号（ｘ）として受け取られるものとしてもよい）。入力信号（ｘ）は、例えば、センサ信号（Ｓ）の一部分又はさらに処理されたものであってよい。換言すれば、入力信号（ｘ）は、センサ信号（Ｓ）に依存して算定される。入力信号（ｘ）のシーケンスは、第１のニューラルネットワーク（６１）に供給される。さらに、入力信号（ｘ）のシーケンスは、第２のニューラルネットワーク（６２）にも供給される。

第１のニューラルネットワーク（６１）及び第２のニューラルネットワーク（６２）は、好適には、パラメータメモリ（Ｐ）に格納されており、かつ、このパラメータメモリ（Ｐ）から供給されるパラメータ（Φ_１，Φ_２）によってパラメータ化される。ニューラルネットワーク（６１，６２）は、それぞれのアーキテクチャにおいて、好適には、ニューロン数及び／又は層数及び／又は層若しくはニューロンの接続状態において異なっている。好適には、当該相違により、第１のニューラルネットワーク（６１）の方が、第２のニューラルネットワーク（６２）と比較して、入力信号（ｘ）に基づいた出力の算定により少ない計算容量及び／又はより少ないメモリ量しか必要としないことになる。

第２のニューラルネットワーク（６２）は、入力信号（ｘ）から第２の出力信号（ｙ_２）を算定する。第２の出力信号（ｙ_２）は、任意選択手段としての変換ユニット（８０）に供給され、この変換ユニット（８０）が、第２の出力信号（ｙ_２）から駆動制御信号（Ａ）を算定し、アクチュエータ（１０）を対応して駆動制御するために、この駆動制御信号（Ａ）をアクチュエータ（１０）に供給する。

アクチュエータ（１０）は、駆動制御信号（Ａ）を受信し、対応して駆動制御されて対応するアクションを実行する。アクチュエータ（１０）は、この場合、（必ずしも構造的に統合されていなくてよい）制御論理回路を含み得るものであり、この制御論理回路が、制御信号（Ａ）から第２の制御信号を算定し、次いで、この第２の制御信号によってアクチュエータ（１０）を駆動制御する。

さらに、第１のニューラルネットワーク（６１）は、入力信号（ｘ）から第１の出力信号（ｙ_１）を算定する。第１の出力信号（ｙ_１）及び第２の出力信号（ｙ_２）は、好適には入力信号（ｘ）と共に比較ユニット（７０）に供給される。比較ユニット（７０）は、好適には、第１の出力信号（ｙ_１）と第２の出力信号（ｙ_２）との差を算定するように構成可能である。当該差は、例えば、メトリック、例えば、ユークリッド距離によって、又は、コサイン距離のような類似性尺度によって、算定することができる。任意選択手段としての伝送（ｏ）を用いて、例えば、５Ｇ又は６Ｇに基づく無線伝送（ｏ）を用いて、算定された差を別のコンピュータへ伝送することができ、この場合、当該別のコンピュータにおいて差を検査することができる。例えば、制御システムの動作時間にわたる典型的な差値を検査することができ、これにより、第１のニューラルネットワーク（６１）が第２のニューラルネットワーク（６２）と比較して同一の出力信号又は少なくとも類似した出力信号を算定したかどうかに関する情報が得られる。なお、好ましくは、２つの出力信号（ｙ_１，ｙ_２）に加えて、入力信号（ｘ）が伝送（ｏ）の一部として共に伝送される。次いで、当該別のコンピュータが、例えば、第１のニューラルネットワーク（６１）をトレーニングすることができ、又は、第１のニューラルネットワーク（６１）が既にトレーニングされている場合には、さらにトレーニングすることができる。トレーニングに際して、第２の出力信号（ｙ_２）を所望の出力信号として選択することができ、入力信号（ｘ）に関して第２の出力信号（ｙ_２）に相当する又は可能な限り類似した出力信号が算定されるように、第１のニューラルネットワーク（６１）をトレーニングすることができる。好ましくは、差が予め規定された閾値を上回る場合にのみ、伝送（ｏ）を実行することができる。

ただし、伝送（ｏ）を行わず、例えば勾配降下法を用いて、差と入力信号（ｘ）とに基づいて、比較ユニット（７０）が第１のニューラルネットワーク（６１）を適応化することもできる。

当該差は、好ましくは、損失関数（英語：ｌｏｓｓｆｕｎｃｔｉｏｎ）の損失値（英語：ｌｏｓｓｖａｌｕｅ）を特徴付けることができ、ここで、損失関数は、第１の出力信号（ｙ_１）と第２の出力信号（ｙ_２）とに基づいて損失値を算定する。損失関数は、例えば、２乗ユークリッド損失関数（英語：ｓｑｕａｒｅｄＥｕｃｌｉｄｅａｎｌｏｓｓ又はｍｅａｎｓｑｕａｒｅｄｅｒｒｏｒｌｏｓｓ）であるものとしてよい。

他の実施形態においては、制御システム（４０）は、センサ（３０）を含む。さらに他の実施形態においては、制御システム（４０）は、代替的に又は付加的に、アクチュエータ（１０）も含む。

さらなる好ましい実施形態においては、制御システム（４０）は、少なくとも１つのプロセッサ（４５）と少なくとも１つの機械可読記憶媒体（４６）とを含み、この機械可読記憶媒体（４６）には、少なくとも１つのプロセッサ（４５）上において実行される際に、制御システム（４０）に本発明に係る方法を実行させるためのコマンドが記憶されている。

代替的な実施形態においては、アクチュエータ（１０）に代えて又はこれに加えて、ディスプレイユニット（１０ａ）が設けられている。

図２は、第１のニューラルネットワーク（６１）及び第２のニューラルネットワーク（６２）に関する制御システムの一部を示している。それぞれのネットワークは、ニューロン（Ｎ）を含み、このニューロンに基づいて、それぞれのネットワークが入力信号（ｘ）に関してそれぞれの出力信号（ｙ_１，ｙ_２）を算定する。ニューラルネットワーク（６１，６２）のニューロン（Ｎ）は、好適にはそれぞれ層（６１_１，６１_２，６１_３，６１_４，６２_１，６２_２，６２_３，６２_４，６２_５）内に配置されている。第２のニューラルネットワーク（６２）は、第２の出力信号（ｙ_２）を算定するために、より多くのニューラル及びより多くのニューロン（Ｎ）間の接続を含むため、より少ないニューロン（Ｎ）及びより少ないニューロン間の接続を有する第１のニューラルネットワーク（６１）と比較して、必要メモリ量及び計算容量が増大する。

好ましくは、この実施例においては、第１のニューラルネットワーク（６１）が、第２のニューラルネットワーク（６２）の層（６２_２）の出力に基づいて第１の出力信号（ｙ_１）を算定することも可能である。このことは、特に、第１のニューラルネットワーク（６１）及び第２のニューラルネットワーク（６２）のアーキテクチャの一部が同等である場合に、例えば、同等のパラメータ化の層及び同一のパラメータ値を含む場合に、実行可能となる。この実施例においては、このことは、第１のニューラルネットワーク（６１）の最初の２つの層（６１_１，６１_２）について、又は、第２のニューラルネットワークの最初の２つの層（６２_１，６２_２）について、当てはまる。したがって、好適には、第２のニューラルネットワーク（６２）の第２の層（６２_２）の出力を直接に第１のニューラルネットワーク（６１）の第３の層（６１_３）のための入力として使用することができる。このことは、図中においては、略記号（ＳＣ）によって示されている。この場合、第１のニューラルネットワーク（６１）が入力信号（ｘ）を最初の２つの層（６１_１，６１_２）を通して導く必要はない。なぜなら、この実施例においては、最初の２つの層（６１_１，６１_２，６２_１，６２_２）が同一であるため、第２の層（６１_２）において算定される出力が第２のニューラルネットワーク（６２）の第２の層（６２_２）の出力に相当するからである。このようにすれば、同様の結果をもたらすはずの計算演算を省略することができる。

第１のニューラルネットワーク（６１）におけるいわゆる「飛び越された」層（６１_１，６１_２）は、特に第１のニューラルネットワーク（６１）のトレーニング中に考慮されず、従って、そのパラメータが適応化されない可能性がある。代替的に、第１のニューラルネットワーク（６１）の最初の２つの層（６１_１，６１_２）のトレーニングのために、第２のニューラルネットワーク（６２）の最初の２つの層（６２_１，６２_２）からの勾配をコピーすることができる。トレーニングのこのような特徴は、他のアーキテクチャにも適用することができ、図２に示した具体的な実施例に限定されるものではない。

図３は、少なくとも部分的に自律型のロボット、ここでは少なくとも部分的に自律型の自動車（１００）を制御するために、制御システム（４０）をどのように使用することができるかを示している。

センサ（３０）は、例えば、好適には自動車（１００）内に配置されたビデオセンサであり得る。

第２のニューラルネットワーク（６２）は、入力画像（ｘ）において検出可能な対象物を識別するように、即ち、対象物検出を実行するように構成されている。

好適には自動車（１００）に配置されているアクチュエータ（１０）は、例えば、自動車（１００）のブレーキ、駆動機構又はステアリング部であるものとしてよい。このとき、特に対象物が所定のクラスの対象物、例えば歩行者である場合、自動車（１００）と、例えば第２のニューラルネットワーク（６２）によって識別された対象物との衝突が阻止されるように、１つ又は複数のアクチュエータ（１０）を駆動制御すべく、駆動制御信号（Ａ）を算定することができる。

代替的に又は付加的に、駆動制御信号（Ａ）によってディスプレイユニット（１０ａ）を駆動制御することができ、例えば識別された対象物を表示することができる。また、自動車（１００）と、識別された複数の対象物のうちのいずれかとの衝突が切迫していると判定された場合には、ディスプレイユニット（１０ａ）を駆動制御信号（Ａ）により駆動制御して、光学的又は音響的な警告信号を出力させることも想定される。警告信号を用いた警告は、触覚的な警告信号を用いて、例えば自動車（１００）のステアリングホイールのバイブレーションによっても行うこともできる。

代替的に、少なくとも部分的に自律型のロボットは、他の移動ロボット（図示せず）、例えば、飛行、泳行、潜行又は歩行により移動するロボットであるものとしてもよい。移動ロボットは、例えば、少なくとも部分的に自律型の芝刈り機又は少なくとも部分的に自律型の掃除ロボットであるものとしてよい。こうした場合においても、少なくとも部分的に自律型のロボットと、例えば第２のニューラルネットワーク（６２）によって識別された対象物との衝突が阻止されるように、移動ロボットの駆動機構及び／又はステアリング部を駆動制御すべく、駆動制御信号（Ａ）を算定することができる。

図４は、製造システム（２００）の製造機械（１１）を操作するアクチュエータ（１０）が駆動制御されることにより、制御システム（４０）が製造機械（１１）の駆動制御のために使用される実施例が示されている。製造機械（１１）は、例えば、打ち抜き、鋸断、穿孔、及び／又は、切断を行う機械であるものとしてよい。また、製造機械（１１）がグリッパを用いて製造製品（１２ａ，１２ｂ）を把持するように構成されていることも想定される。

この場合、センサ（３０）は、例えば、製造製品（１２ａ，１２ｂ）を載置することができるコンベヤベルト（１３）の搬送面を検出するビデオセンサであるものとしてよい。第２のニューラルネットワーク（６２）は、例えばコンベヤベルト上の製造製品（１２ａ，１２ｂ）の位置を算定するように構成可能である。この場合、製造機械（１１）を操作するアクチュエータ（１０）を、製造製品（１２ａ，１２ｂ）の算定された位置に依存して駆動制御することができる。例えば、アクチュエータ（１０）は、製造製品（１２ａ，１２ｂ）の予め定められた個所において製造製品（１２ａ，１２ｂ）の打ち抜き、鋸断、穿孔、及び／又は、切断が行われるように駆動制御可能である。

さらに、第２のニューラルネットワーク（６２）を、製造製品（１２ａ，１２ｂ）の位置に代えた又はこれに加えた他の特性を算定するように構成することも想定される。特に、製造製品（１２ａ，１２ｂ）が欠陥を有するかどうか及び／又は損傷しているかどうかを第２のニューラルネットワーク（６２）が判定することが想定される。この場合、製造機械（１１）が、欠陥を有する及び／又は損傷した製造製品（１２ａ，１２ｂ）を選別除去するように、アクチュエータ（１０）を駆動制御することができる。

図５は、トレーニングデータセット（Ｔ）を用いて第１のニューラルネットワーク（６１）をトレーニングするためのトレーニングシステム（１４０）の一実施例を示している。トレーニングデータセット（Ｔ）は、第１のニューラルネットワーク（６１）のトレーニングに使用される複数の入力信号（ｘ_ｉ）を含み、ここで、トレーニングデータセット（Ｔ）はさらに、それぞれの入力信号（ｘ_ｉ）に対して、この入力信号（ｘ_ｉ）に対応する所望の出力信号（ｔ_ｉ）を含む。

トレーニングに際して、トレーニングデータユニット（１５０）は、コンピュータに実装されたデータベース（Ｓｔ_２）にアクセスする。データベース（Ｓｔ_２）は、それぞれ、制御システム（４０）から伝達された伝送（ｏ）を含む。当該伝送（ｏ）に基づいて、トレーニングデータユニット（１５０）はトレーニングデータセット（Ｔ）を呼び出し、入力信号（ｘ_ｉ）に対して所望の出力信号（ｔ_ｉ）としての第２の出力信号を供給する。好適には、トレーニングデータセット（Ｔ）は、制御システム（４０）によって伝送されたすべての伝送（ｏ）を含む。

トレーニングデータユニット（１５０）は、トレーニングデータセット（Ｔ）から、少なくとも１つの入力信号（ｘ_ｉ）とこの入力信号（ｘ_ｉ）に対応する所望の出力信号（ｔ_ｉ）とを好適にはランダムに算定し、入力信号（ｘ_ｉ）を第１のニューラルネットワーク（６１）に伝達する。第１のニューラルネットワーク（６１）は、入力信号（ｘ_ｉ）に基づいて出力信号（ｙ_ｉ）を算定する。

所望の出力信号（ｔ_ｉ）及び算定された出力信号（ｙ_ｉ）は、補正ユニット（１８０）へ伝達される。

次いで、所望の出力信号（ｔ_ｉ）と算定された出力信号（ｙ_ｉ）とに基づいて、補正ユニット（１８０）により、第１のニューラルネットワーク（６１）のための新たなパラメータ（Φ’）が決定される。このために、補正ユニット（１８０）は、所望の出力信号（ｔ_ｉ）と算定された出力信号（ｙ_ｉ）とを損失関数（英語：ＬｏｓｓＦｕｎｃｔｉｏｎ）を用いて比較する。損失関数は、算定された出力信号（ｙ_ｉ）が所望の出力信号（ｔ_ｉ）からどれだけ偏差しているかを特徴付ける第１の損失値を算定する。損失関数として、この実施例においては、負の対数尤度関数（英語：ｎｅｇａｔｉｖｅｌｏｇ－ｌｉｋｅｈｏｏｄｆｕｎｃｔｉｏｎ）が選択される。代替的な実施例においては、他の損失関数を想定することもできる。

算定された出力信号（ｙ_ｉ）及び所望の出力信号（ｔ_ｉ）がそれぞれ、例えばテンソルの形態の複数の下位信号を含み、ここで、所望の出力信号（ｔ_ｉ）のそれぞれ１つの下位信号が、算定された出力信号（ｙ_ｉ）の下位信号に対応することが想定される。例えば、第１のニューラルネットワーク（６１）が対象物検出のために構成されており、第１の下位信号が入力信号（ｘ_ｉ）の一部に関する対象物の出現確率をそれぞれ特徴付け、第２の下位信号が対象物の正確な位置を特徴付けることが想定される。算定された出力信号（ｙ_ｉ）及び所望の出力信号（ｔ_ｉ）が複数の対応する下方信号を含む場合、好適には、それぞれ対応する下方信号に対して適当な損失関数を用いて第２の損失値が算定され、算定された第２の損失値が、例えば重み付け和によって第１の損失値に適宜に結合される。

補正ユニット（１８０）は、第１の損失値に基づいて新たなパラメータ（Φ’）を算定する。この実施例においては、このことは、勾配降下法、好適には、確率的勾配降下法、Ａｄａｍ法、又は、ＡｄａｍＷ法によって行われる。他の実施例においては、トレーニングは、進化アルゴリズム又は２次最適化（英語：ｓｅｃｏｎｄ－ｏｒｄｅｒＯｐｔｉｍｉｚａｔｉｏｎ）に基づくものであってよい。

算定された新しいパラメータ（Φ’）は、モデルパラメータメモリ（Ｓｔ_１）に記憶される。好適には、算定された新しいパラメータ（Φ’）は、パラメータ（Φ_１）として第１のニューラルネットワーク（６１）に供給される。

他の好ましい実施例においては、説明しているトレーニングを予め定められた回数の反復ステップにわたって反復し、又は、第１の損失値が予め定められた閾値を下回るまで反復する。代替的に又は付加的に、テストデータセット又は検証データセットに関する平均的な第１の損失値が予め定められた閾値を下回った場合、トレーニングが終了されることも想定される。複数回の反復のうちの少なくとも１回において、以前の反復において決定された新しいパラメータ（Φ’）が、第１のニューラルネットワーク（６１）のパラメータ（Φ_１）として使用される。

さらに、トレーニングシステム（１４０）は、少なくとも１つのプロセッサ（１４５）と少なくとも１つの機械可読記憶媒体（１４６）とを含み得るものであり、この機械可読記憶媒体（１４６）は、プロセッサ（１４５）によって実行される際にトレーニングシステム（１４０）に本発明の態様のうちの１つによるトレーニング方法を実行させるための命令を含む。

トレーニングシステム（１４０）は、好ましくは、制御システム（４０）から物理的に分離されている。２つのシステムは、例えばそれぞれのステップシーケンスを実行するための別個のコンピュータを含む。トレーニングシステム（１４０）と制御システム（４０）とは、例えば、ＬＡＮ又はインターネットのようなネットワーク接続を介して相互に通信することができる。当該方法においては、移動無線及び／又はワイヤレスの伝送路も同様に可能である。

「コンピュータ」なる用語には、設定可能な計算規則を処理する任意の装置が含まれる。この計算規則は、ソフトウェアの形態で又はハードウェアの形態で又はソフトウェアとハードウェアとの混合形態で存在し得る。

一般的に、複数形は、インデクスと理解することができ、即ち、複数の要素のうちのそれぞれの要素に、一義的なインデクス、好適には複数形に含まれる要素に対する連続する整数が割り当てられる。好適には、複数形がＮ個の要素を含み、ここでＮが複数の要素の個数である場合、各要素に１乃至Ｎの整数が割り当てられる。

Claims

技術システム（１００，２００）のセンサ信号（Ｓ）に基づいて前記センサ信号（Ｓ）に関する分類及び／又は回帰結果を特徴付ける出力信号を算定するように構成されている第１のニューラルネットワーク（６１）をトレーニングするための方法であって、
ａ．前記技術システム（１００，２００）の動作中に前記技術システム（１００，２００）のセンサ信号（Ｓ）を受信するステップと、
ｂ．前記第１のニューラルネットワーク（６１）により、前記センサ信号（Ｓ）に基づいて第１の出力信号（ｙ_１）を算定するステップと、
ｃ．前記第１のニューラルネットワーク（６１）とは別のアーキテクチャを有する第２のニューラルネットワーク（６２）により、前記センサ信号（Ｓ）に基づいて第２の出力信号（ｙ_２）を算定するステップと、
ｄ．前記第１のニューラルネットワーク（６１）のパラメータ（Φ_１）を適応化することによって前記第１のニューラルネットワーク（６１）をトレーニングするステップであって、前記第１のニューラルネットワーク（６１）は、前記第２の出力信号（ｙ_２）に依存してトレーニングされる、ステップと、
を含む方法。
前記第１の出力信号（ｙ_１）と前記第２の出力信号（ｙ_２）との差に基づいて前記適応化が算定される、請求項１に記載の方法。
前記第１のニューラルネットワーク（６１）のアーキテクチャと前記第２のニューラルネットワーク（６２）のアーキテクチャとの相違により、前記第１のニューラルネットワーク（６１）の方が前記第１の出力信号（ｙ_１）の算定により少ない計算容量及び／又はより少ないメモリ量しか必要としないこととなる、請求項１又は２に記載の方法。
前記第１のニューラルネットワーク（６１）の少なくとも１つの層は、そのパラメータ化において前記第２のニューラルネットワーク（６２）の層に相当し、前記第１のニューラルネットワーク（６１）の当該層のパラメータは、前記トレーニング中に適応化されない、請求項１乃至３のいずれか一項に記載の方法。
前記ステップｂ．及び前記ステップｃ．は、前記技術システム（１００，２００）の埋め込み型計算ユニット（４５）によって実行される、請求項１乃至４のいずれか一項に記載の方法。
前記ステップｄ．は、前記技術システム（１００，２００）の外部にあるコンピュータによって実行される、請求項５に記載の方法。
前記第２の出力信号（ｙ_２）に基づいて、前記技術システム（１００，２００）の駆動制御信号（Ａ）が算定される、請求項１乃至６のいずれか一項に記載の方法。
前記センサ信号（Ｓ）は、カメラセンサ（３０）によって供給され、画像を特徴付けている、請求項１乃至７のいずれか一項に記載の方法。
前記技術システム（１００）は、少なくとも部分的に自動化された車両（１００）又はロボット（２００）である、請求項１乃至８のいずれか一項に記載の方法。
請求項１乃至９のいずれか一項に記載の方法を実施するように構成されているトレーニング装置（１４０）。
コンピュータプログラムであって、当該コンピュータプログラムがプロセッサ（４５，１４５）によって実行されるときに、請求項１乃至９のいずれか一項に記載の方法が実施されるように構成されているコンピュータプログラム。
請求項１１に記載のコンピュータプログラムが記憶されている機械可読記憶媒体（４６，１４６）。