WO2020045193A1

WO2020045193A1 - 訓練方法、訓練装置、学習済みモデル、推定方法、推定装置、プログラム及び非一時的コンピュータ可読媒体

Info

Publication number: WO2020045193A1
Application number: PCT/JP2019/032674
Authority: WO
Inventors: 丸山　宏; 健太大野
Original assignee: 株式会社ＰｒｅｆｅｒｒｅｄＮｅｔｗｏｒｋｓ
Priority date: 2018-08-28
Filing date: 2019-08-21
Publication date: 2020-03-05
Also published as: JP2022016709A

Abstract

出力が所定の条件を満たすように構成されたニューラルネットワークを生成する。訓練方法は、訓練対象であるニューラルネットワークモデルに、入力データを入力し、前記ニューラルネットワークモデルの出力データを取得し、前記出力データが有界集合に属するように第１変換し、前記第１変換されたデータが、前記有界集合から、所定領域内に属するように第２変換し、前記第２変換されたデータについて誤差逆伝播処理を実行して、前記ニューラルネットワークモデルを訓練する、ことを備える。

Description

訓練方法、訓練装置、学習済みモデル、推定方法、推定装置、プログラム及び非一時的コンピュータ可読媒体

　本発明は、訓練方法、訓練装置、学習済みモデル、推定方法、推定装置、プログラム及び非一時的コンピュータ可読媒体に関する。

　深層学習等の統計的機械学習システムにおいては、その出力は多次元ユークリッド空間（例えば、n次元）の点として表され、一般的にはその値についてある条件を満たすという保証をすることは容易ではない。すなわち、Rⁿのいずれの点についても、その値が出力される可能性を排除することは困難である。一般には、深層ニューラルネットワークの出力は、n次元実数空間上のどの点にも現れうるので、このようなニューラルネットワークを安全に関わる制御に用いることは容易ではなかった。

D. Amodei, et.al., "Concrete problem in ai safety," arXiv preprint, arXiv:1606.06565, 2016, [インターネット], https://arxiv.org/abs/1606.06565

　そこで、本発明の実施形態は、その出力が所定の条件を満たすように構成されたニューラルネットワークに関する、訓練方法、訓練装置学習済みモデル、推定方法、推定装置、プログラム及び非一時的コンピュータ可読媒体を提供する。

　一実施形態によれば、訓練方法は、
　訓練対象であるニューラルネットワークモデルに、入力データを入力し、
　前記ニューラルネットワークモデルの出力データを取得し、
　前記出力データが有界集合に属するように第１変換し、
　前記第１変換されたデータが、前記有界集合から、所定領域内に属するように第２変換し、
　前記第２変換されたデータについて誤差逆伝播処理を実行して、前記ニューラルネットワークモデルを訓練する、
　ことを備える。

一実施形態に係る訓練装置のブロック図。ニューラルネットワークモデルの出力分布の一例を示す図。第１変換後のデータ分布の一例を示す図。第２変換の一例を示す図。第２変換後のデータ分布の一例を示す図。一実施形態に係る訓練装置の処理の流れを示すフローチャート。拘束条件を満たす空間の一例を示す図。第２変換の一例を示す図。一実施形態に係る推定装置のブロック図。一実施形態に係る実装例。

　以下、図面を参照して実施形態について詳しく説明する。なお、図面は一例として模式的に示すものであり、実施形態は、これらの図面に限定されるものではない。

　まず、本実施形態における概略について説明する。学習済みのニューラルネットワークにおいて、出力に拘束条件を有することがある。例えば、装置に搭載されているセンサにより取得された情報を学習済みモデルに入力して制御信号を推定する場合には、当該装置の可動範囲等が拘束条件となる。別の例としては、店舗において売り上げ、残りの商品等をPOS（Point of Sales）で取得した情報を学習済みモデルに入力して入荷依頼をする場合には、費用、収納場所等が拘束条件となる。

　このような出力の拘束条件を考慮せずにモデルの訓練を行った場合、入力されたデータに対して拘束条件外の推定値を出力する場合がある。このような訓練を行った学習済みモデルは、推定値に基づいて自動運転等をすることにより、事故や余分なコストを負う可能性がある。例えば、ドローンの自動操縦において、拘束条件外の値を出力することにより、壁に衝突したり、飛行禁止区域又は制御範囲外に突入したりする。別の例として、POSにおいて、商品を陳列及びストックすることができないような発注をしたりする。このような場合に、拘束条件外の推定値を、例えば最近傍の境界上に収束させると、境界上の推定値が多くなり、必ずしも実用的であるとは言えなくなる。本実施形態に係る訓練装置は、このような状態を回避可能な学習済みモデルを訓練する。

　（第１実施形態）
　図１は、一実施形態に係る訓練装置の機能を示すブロック図である。訓練装置１は、入力部１０と、記憶部１２と、順伝播部１４と、第１変換部１６と、第２変換部１８と、誤差算出部２０と、逆伝播部２２と、更新部２４と、出力部２６と、を備える。

　入力部１０は、訓練データの入力を受け付ける。訓練データは、例えば、教師あり学習用のデータとラベルデータとの組み合わせでもよいし、教師なし学習用のデータであってもよい。また、交差検証等に用いるバリデーションデータを評価用に受け付けてもよい。

　記憶部１２は、訓練装置１に必要となるデータを格納する。データとは、例えば、入力部１０が受け付けた訓練データを備えてもよい。また、訓練装置１がコンピュータで実行される場合には、当該コンピュータ（ハードウェア資源）を用いて具体的に実現するソフトウェアによる情報処理を実行するためのプログラムが格納されていてもよい。具体的には、記憶部１２は、訓練装置１の各種手段を実行するためのプログラム、及び、学習対象であるニューラルネットワークモデルの各種パラメータ等を格納してもよい。この他、必要なタイミングにおいて種々のデータを格納する。

　順伝播部１４は、入力部１０が受け付けたデータをニューラルネットワークモデルに入力し順伝播させて、ニューラルネットワークモデルの出力を取得する。

　第１変換部１６は、順伝播部１４により取得されたデータを、第１変換する。第１変換とは、ニューラルネットワークの出力データを、有限の空間内に写像する変換である。この変換は、出力が有界で微分可能な連続関数、例えば、シグモイド関数を用いて実行される。条件を満たす関数であれば、シグモイド関数でなくともよく、別の例としては、ハイパボリックタンジェント関数、ロジスティック関数、誤差関数等であってもよい。さらに、空間内の全ての点において微分可能である必要もなく、ほとんど全ての点において微分可能な関数であってもよく、又は、全ての点において近似的に微分値が算出できるような関数であってもよい。

　第１変換部１６は、例えば、シグモイド関数を用いて、ニューラルネットワークの出力であるRⁿの空間における点を［－10，10］ⁿの空間へと変換する。空間内の全ての軸において同じ変換をしなくてもよく、軸により異なる変換を行ってもよい。有界領域の境界の絶対値は10である必要は無く、±1や、0であってもよいし、他の値であってもよい。

　図２は、ニューラルネットワークモデルの出力空間を示す図である。図２においては、限られた有限の空間としているが、出力空間はこれに限られるものではなく、空間を構成するいずれかの次元において±∞の境界を有していてもよい。第１変換部１６は、この図２のように特に制限が掛けられない状態において分布している出力値を、第１変換を実行することにより、有限の領域に投射する。

　空間Ｓ１０は、訓練対象となるニューラルネットワークモデルの出力空間の一部を示す。例えば、空間Ｓ１０は、２次元空間であり、それぞれの軸の領域が（－∞，＋∞）である空間である。これに対して、領域Ｃ１０は、ニューラルネットワークモデルの出力が満たすべき条件を示す領域である。訓練により、ニューラルネットワークモデルの出力が領域Ｃ１０に属するようにする。

　図３は、第１変換部１６により変化された後の図２に示すデータの集合の一例を示す図である。第１変換部１６は、例えば、各次元に対して以下に示すシグモイド関数を用いた変換により空間Ｓ１０を有界の空間Ｓ１１へと変換する。

　式中の20、10の値は、出力空間の規格化に基づいた所定値であり、任意に変更することが可能である。aは、ゲインを表す定数であり、任意の値を取ることが可能である。例えば、領域Ｃ１０に属しないニューラルネットワークの出力を後述の第２変換において境界線に近づけたい場合には、ゲインを大きくする。この他、ニューラルネットワークモデルの出力に基づいて、適切にゲインは設定することが可能である。

　図２における領域Ｃ１０は、図３においては領域Ｃ１１へと変換される。上述したゲインaを大きくするほど、領域Ｃ１１の境界は、空間Ｓ１１の境界へと近づく。

　この領域Ｃ１１内に、ピボットＰ１１を設定する。ピボットＰ１１は、例えば、領域Ｃ１１の重心により表される点である。なお、図２、図３においては、領域Ｃ１０、Ｃ１１が凸型の多角形である例を示している。領域Ｃ１１が凸型の多角形である場合には、ピボットＰ１１は、重心に限られるものではなく、領域Ｃ１１内においてニューラルネットワークモデルの出力を収束させたい任意の点としてもよい。例えば、部屋においてドローン等のデバイスを自動的に運転させる場合には、部屋の中央の点に対応する点をピボットとしてもよいし、店舗における自動入荷の場合には、利益が一番大きくなる点をピボットとしてもよい。

　第２変換部１８は、第１変換され有界となったデータを拘束条件に合致するように変換する。例えば、拘束条件の境界を第１変換部１６による変換と同じ変換を施すことによりあらかじめ算出しておき、この境界内に第１変換部１６により変換された値が含まれるように、各点の変換を行う。

　図４は、第２変換の説明のための図である。空間Ｓ１１内の領域Ｃ１１外の点Ｐ１がどのように変換されるかを説明する。なお、ピボットＰ１１を簡単のため、点Ｏと記載する。以下、ピボットＰ１１は、図において星形の記号を用いて示す。

　まず、点Ｏから点Ｐ１へと向かう半直線ｒ１を考える。領域Ｃ１１の境界と半直線ｒ１の交点をＱ１、空間Ｓ１１の境界と半直線ｒ１との交点をＲ１とする。第２変換部１８は、ＯＲ１とＯＰ１との比でＯＱ１を内分する点Ｓ１を算出し、点Ｐ１を点Ｓ１へと変換する。すなわち、｜ＯＲ１｜：｜ＯＰ１｜＝｜ＯＱ１｜：｜ＯＳ１｜となるような点Ｓ１に点Ｐ１を投射する。このような第２変換により、空間Ｓ１１に属する点は、全て領域Ｃ１１に属する点へと変換される。

　領域Ｃ１１に属する点Ｐ２についても同様である。すなわち、点Ｏから点Ｐ２へと向かう半直線ｒ２に対して、領域Ｃ１１、空間Ｓ１１との交点をＱ２、Ｒ２とする。そして、第２変換部１８により、｜ＯＲ２｜：｜ＯＰ２｜＝｜ＯＱ２｜：｜ＯＳ２｜となる点Ｓ２に点Ｐ２が変換される。

　図５は、第２変換後のニューラルネットワークモデルからの出力分布を示す図である。この図５に示すように、第１変換後の点は、全て第２変換後において領域Ｃ１１内の点へと変換される。このように変換されることにより、訓練対象となるモデルの出力は、全て所定の条件を満たす点へと変換される。このように変換することにより、自動運転による不慮の事故や、自動入荷における過剰な在庫等を出力する推定を回避することが可能となる。

　このように、図２に示されたような空間Ｓ１０におけるばらつきを有したデータは、第１変換部１６、第２変換部１８におけるそれぞれの変換により、所定の条件を満たす領域Ｃ１１内の点へと変換される。

　誤差算出部２０は、第１変換部１６及び第２変換部１８において変換されたニューラルネットワークからの出力及び教師データと、に基づいて誤差を算出する。教師データの変換値は、記憶部１２に余裕があるのであればあらかじめ算出しておいてもよいし、入力データに関する変換と並列に、適宜算出してもよい。

　逆伝播部２２は、誤差算出部２０が算出した誤差に基づいて、誤差逆伝播処理を実行する。第１変換部１６における変換が微分可能な変換であるので、出力層から入力層へ向けて、各層において勾配を求めることが可能であるので誤差逆伝播法により訓練を行うことが可能である。

　更新部２４は、逆伝播部２２が逆伝播した結果に基づいて、ネットワークのパラメータを更新する。更新されたネットワークは、所定の条件を満たすと学習済みモデルとして出力部２６を介して出力される。所定の条件を満たすまでは、更新されたネットワークについて、さらに、順伝播部１４の処理から最適化を係属する。所定の条件とは、一般的な機械学習と同様に、所定エポック数の訓練が終了した、評価値が所定値に達した、等の条件であればよい。

　出力部２６は、訓練が終了した学習済みモデルを出力する。出力部２６は、外部へとパラメータ等を出力してもよいし、又は、記憶部１２にパラメータ等を出力し、格納させてもよい。

　次に、上記で説明した処理の流れについてフローチャートを用いて説明する。図６は、本実施形態に係る訓練の流れを示すフローチャートである。

　まず、入力部１０からデータを入力する（Ｓ１００）。次に、順伝播部１４は、入力されたデータをネットワークに順伝播させる（Ｓ１０２）。ネットワークは、例えば、パラメータが記憶部１２に記憶されており、訓練を行うタイミングでプロセッサにより形成される。この順伝播により、入力データがネットワークにより出力データとなり出力される。

　次に、第１変換部１６は、ネットワークにより出力されたデータを第１変換する（Ｓ１０４）。この第１変換により、ネットワークから出力されたデータが有界の領域内のデータへと変換される。また、第１変換部１６は、当該出力データの元となる入力データに対応する教師データを第１変換する。

　次に、第２変換部１８は、第１変換されたデータを第２変換する（Ｓ１０６）。この第２変換により、第１変換により有界化されたデータが拘束条件を満たすように変換される。また、第２変換部１８は、第１変換された教師データを第２変換する。なお、教師データの第１変換、第２変換は、このタイミングではなくともよく、入力データをネットワークに入力するタイミング等、誤差を算出するタイミングの前までに実行されればよい。

　次に、誤差算出部２０は、第２変換された入力データと、第２変換された教師データとの誤差を算出する（Ｓ１０８）。この誤差の算出は、一般的な訓練方法における任意の手法に基づいて実行される。

　次に、逆伝播部２２は、誤差を逆伝播する（Ｓ１１０）。この逆伝播の結果に基づいて、更新部２４は、ネットワークのパラメータを更新する（Ｓ１１２）。更新されたパラメータは、例えば、記憶部１２に記憶される。逆伝播と更新とは、必要であれば、繰り返し実行される。

　このＳ１００からＳ１１２の処理は、訓練の終了条件を満たすまで繰り返され、ネットワークが更新される。終了条件は、一般的な訓練方法における終了条件、例えば、エポック数が所定値に達した、誤差が所定値を下回った等の終了条件とする。

　訓練が終了すると、出力部２６は、更新されたネットワークのパラメータ等、ネットワークを構成するために必要な情報を出力する（Ｓ１１４）。ここで、出力とは、インタフェース等を介して訓練装置１の外部へ出力することも、記憶部１２に記憶することも含めた概念であるものとする。

　以上のように、第１変換及び第２変換をすることにより、ネットワークにどのようなデータが入力されたとしても、拘束条件を自然に満たすような出力を得ることができるネットワークを訓練することが可能となる。

　訓練が終了したネットワークについては、訓練時と同様のタイミングにおいて上記の有界化された空間から拘束条件を満たす領域への変換をする。そして、必要に応じて、ネットワークから取得した推定値を、有界化された空間から有界化前の空間へと逆変換することにより現実の空間における解を取得することが可能となる。ここで、現実の空間とは、推定したい解が存在し得る空間、例えば、ドローンやロボットの場合には、２次元又は３次元空間、POSの場合には、各商品とそれに対する入荷量等を示す空間のことを言う。

　なお、上記においては、拘束条件を満たす空間は、凸状の空間であるとしたが、境界線と交わらずに空間内の全ての点と線分を有することが可能な少なくとも１点のピボットが定義できる空間であれば構わない。すなわち、拘束条件を満たす空間は、図７に示すような星状空間であってもよい。もちろんこの場合、ピボットは、拘束条件を満たす空間における全ての点との間の線分が境界と交わらないように選択する。

　また、本実施形態においては、出力空間は２次元であるものとして説明したが、これには限られない。例えば、３次元以上の任意の次元の空間であってもよいし、スカラー（１次元）であってもよい。３次元以上のｎ次元の場合には、第１変換により出力空間は、ｎ次元のハイパーキューブとなり、領域Ｃ１０は、少なくとも１点の前述の要件を満たすピボットが定義できるｎ次元の凸の閉空間となる。これは、以下に示す実施形態においても同様である。

　上記の実施形態においては、ニューラルネットワーク、第１変換部１６、第２変換部１８がそれぞれ備えられるものとしたが、第１変換部１６、第２変換部１８は、それぞれニューラルネットワークと独立して備えられる必要はない。すなわち、ニューラルネットワークの層として、第１変換部１６、第２変換部１８が備えられてもよい。このように、設計することにより、第１変換部１６、及び、第２変換部１８の機能を備えた学習済みのニューラルネットワークを生成することも可能である。上述したように、各変換は、微分可能な演算で記載されるため、これらの層を備えるニューラルネットワークにおいても、誤差逆伝播によりパラメータの更新を実行することが可能である。

　この場合、第１変換、第２変換において、オフセット、バイアス（ゲイン）等を設定することも可能である。これらオフセット、バイアス等の値をも訓練することにより、ニューラルネットワークにより推定された値をより望ましい推定値とすることも可能である。

　（第２実施形態）
　前述の実施形態においては、有界化した空間の内側に拘束条件が収まるようにしたが、これには限られない。例えば、有界化した後に、当該空間からはみ出すような拘束条件の空間にデータを変換してもよい。

　図８は、本実施形態に係る有界化した後の空間と、有界化された拘束条件を満たす領域との関係を示す図である。このように、空間Ｓ１２からはみ出すように、領域Ｃ１２が存在していてもよい。

　例えば、ピボットＰ１２からみて点Ｐ３に対して半直線を引くと、点Ｏ、点Ｑ３、点Ｒ３の順番で並んでいる場合には、前述の実施形態と同様に、線分ＯＱ３を｜ＯＲ３｜：｜ＯＰ３｜の比で内分する点に対応する解を、拘束条件を満たす解とする。

　一方で、点Ｐ４のように、ピボットＰ１２から半直線を引くと、点Ｏ、点Ｒ４、点Ｑ４の順番で並んでいる場合には、前述の実施形態と異なり、外分する点を解として取得する。すなわち、｜ＯＲ４｜：｜ＯＰ４｜＝｜ＯＱ４｜：｜ＯＳ４｜となるように、点Ｓ４を取得して拘束条件を満たす解とする。

　以上のように、本実施形態によれば、拘束条件を満たす領域を有界化した空間よりも拡げることも可能である。このように空間、領域を設定することにより、有界化する関数等の自由度を向上させることが可能となる。

　また、訓練時に、有界化された空間外の点を含めることもできる。これは、強化学習等において、非実効的な解を設定して訓練を行うことを可能とする。

　なお、前述の全ての実施形態において、有界化された空間から拘束条件を満たす領域への変換は、内分、外分する単純な計算により求められるものとしたが、これには限られない。例えば、空間内の点から領域内の点への変換は、全単射であり、順序保存ができる変換により実行されてもよい。さらに、連続な変換であることが望ましい。

　このような変換を行うことにより、訓練が終了したネットワークからの出力が第１変換及び第２変換後の点を推定するとしても、第２変換の逆変換及び第１変換の逆変換を行うことにより、現実の空間へと推定値を変換することが可能となる。

　また、上記の全単射、順序保存を満たす上で、ほぼあらゆる点において微分可能な変換を用いてもよい。このような微分可能な変換を用いることにより、この空間から拘束条件への変換もまた、ネットワークに組み込むことが可能となる。このように、変換をも訓練により更新することにより、より柔軟な拘束条件内の解を推定するネットワークを構成することも可能となる。ネットワークに変換が組み込まれて最適化される場合には、この逆変換を求めることにより、現実の空間における解を取得することも可能となる。

　（第３実施形態）
　図９は、本実施形態に係る推定装置の機能を示すブロック図である。推定装置２は、入力部２８と、記憶部３０と、訓練済モデル３２と、第１変換部３４と、第２変換部３６と、出力部３８と、を備える。推定装置２は、入力部２８を介してデータを入力すると、訓練済モデル３２により推定された値を、適切な範囲へと変換して出力する。

　入力部２８は、データの入力を受け付ける。データは、例えば、ドローンの操縦であれば、ドローン自身が撮影したデータ、又は、ユーザが指定した速度、目標位置データ等のドローンのおかれている環境、又は、操縦に関するデータである。ドローン以外の場合においても、目標の状況に関する情報であればよい。

　記憶部３０は、推定装置２において必要な情報を格納する。例えば、入力部２８を介して入力されたデータを記憶部３０に格納してもよい。また、訓練済モデル３２、第１変換部３４、第２変換部３６がソフトウェアによる処理である場合には、当該ソフトウェアに関する実行ファイル、各種パラメータ等を格納してもよい。また、出力部３８が出力するデータを格納してもよい。

　訓練済モデル３２は、例えば、前述の各実施形態において訓練されたニューラルネットワークを備える。第１変換部３４と、第２変換部３６は、それぞれ前述の各実施形態と同様の変換を行うものである。

　なお、第１実施形態で記載したように、訓練時において、ニューラルネットワークに第１変換部３４及び第２変換部３６を備えることもできる。この場合、推定装置２において第１変換部３４及び第２変換部３６は、必須の構成ではなく、訓練済モデル３２において、第１変換及び第２変換を実行できる構成であってもよい。

　推定装置２は、出力部３８を介して訓練済モデル３２により推定された値であって適切な拘束条件にしたがった推定値を出力する。

　以上のように、本実施形態によれば、解の範囲に限定がある場合にも、当該範囲に収まる推定値を出力することができる。例えば、車両、ドローン等の自動運転、POSサービスの自動化、その他の解が存在する望ましい領域がある場合にもニューラルネットワークを適用することが可能となる。例えば、自動運転においては、出力範囲を安全な運行ができる範囲に限定することにより、自動運転における安全性をより向上させることも可能となる。

　前述した実施形態における訓練装置１及び推定装置２の各機能は、アナログ回路、デジタル回路又はアナログ回路とデジタル回路の混合回路で実現されてもよい。また、訓練装置１及び推定装置２は各機能の制御を行う制御回路を備えていてもよい。これらの各回路は、ASIC（Application Specific Integrated Circuit）、FPGA（Field Programmable Gate Array）等により実装されてもよい。

　上記の全ての記載において、訓練装置１及び推定装置２の一部または全部は、ハードウェアで構成されていてもよいし、CPU等が実行するソフトウェア（プログラム）の情報処理で構成されてもよい。ソフトウェアの情報処理で構成される場合には、訓練装置１、推定装置２及びそれらの少なくとも一部の機能を実現するソフトウェアをフレキシブルディスクやCD-ROM等の記憶媒体に収納し、コンピュータに読み込ませることにより、ソフトウェアの情報処理が実行されてもよい。また、通信ネットワークを介して当該ソフトウェアがダウンロードされてもよい。このようにして、コンピュータを上記の実施形態の装置とすることができる。また、このようにして、ソフトウェアによる情報処理がハードウェア資源を用いて具体的に実現されてもよい。さらに、ソフトウェアがASIC、FPGA等の回路に実装されることにより、ソフトウェアにより実行されることを想定していた情報処理がハードウェアにより実行されてもよい。モデルの生成や、生成したモデルを利用した処理は、例えば、GPU等のアクセラレータを使用して行ってもよい。

　ソフトウェアを収納する記憶媒体の種類は特に限定されるものではない。記憶媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスクやメモリ等の固定型の記憶媒体であってもよい。記憶媒体は、コンピュータ内部に備えられてもよいし、コンピュータ外部に備えられてもよい。

　図１０は、一実施形態におけるハードウェア構成の一例を示すブロック図である。訓練装置１及び推定装置２は、プロセッサ７１と、主記憶装置７２と、補助記憶装置７３と、ネットワークインタフェース７４と、デバイスインタフェース７５と、を備え、これらがバス７６を介して接続されたコンピュータ７として実現できる。

　なお、図１０のコンピュータ７は、各構成要素を一つ備えているが、同じ構成要素を複数備えていてもよい。また、図１０では、１台のコンピュータ７が示されているが、ソフトウェアが複数のコンピュータにインストールされて、当該複数のコンピュータそれぞれがソフトウェアの同一の又は異なる一部の処理を実行してもよい。この場合、コンピュータそれぞれがネットワークインタフェース７４等を介して通信して処理を実行する分散コンピューティングの形態であってもよい。

　訓練装置１及び推定装置２の各種演算は、１又は複数のプロセッサ（例えば、GPU等のアクセラレータ）を用いて、又は、ネットワークを介した複数のコンピュータを用いて、並列処理で実行されてもよい。また、各種演算が、プロセッサ内に複数ある演算コアに振り分けられて、並列処理で実行されてもよい。また、本開示の処理、手段等の一部又は全部は、ネットワークを介してコンピュータ７と通信可能なクラウド上に設けられた処理回路及び記憶装置の少なくとも一方により実行され又は機能されるものであってもよい。このように、１台又は複数台のコンピュータによる並列コンピューティングの形態であってもよい。

　プロセッサ７１は、コンピュータの制御装置及び演算装置を含む電子回路（処理回路、Processing circuit、Processing circuitry）であってもよい。また、プロセッサ７１は、コア数を限定しないＣＰＵ又はＧＰＵであってもよいし、専用の処理回路を含む半導体装置等であってもよい。プロセッサ７１は、コンピュータ７の内部構成の各装置等から入力されたデータやプログラムに基づいて演算処理を行い、演算結果や制御信号を各装置等に出力することができる。プロセッサ７１は、コンピュータ７のOS（Operating System）や、アプリケーション等を実行することにより、コンピュータ７を構成する各構成要素を制御してもよい。換言すると、訓練装置１及び推定装置２、並びにそれらの各ハードウェア構成は、１又は複数のプロセッサ７１により実現されてもよい。ここで、処理回路は、１チップ上に配置された１又は複数の電気回路を指してもよいし、２つ以上のチップあるいはデバイス上に配置された１又は複数の電気回路を指してもよい。複数の電子回路を用いる場合、各電子回路は有線又は無線により通信してもよい。

　主記憶装置７２は、プロセッサ７１が実行する命令及び各種データ等を記憶する記憶装置であり、主記憶装置７２に記憶された情報がプロセッサ７１により読み出される。補助記憶装置７３は、主記憶装置７２以外の記憶装置である。なお、これらの記憶装置は、電子情報を格納可能な任意の電子部品を意味するものとし、メモリでもストレージでもよい。また、メモリには、揮発性メモリと、不揮発性メモリがあるが、いずれでもよい。訓練装置１及び推定装置２内において各種データを保存するためのメモリは、主記憶装置７２又は補助記憶装置７３により実現されてもよい。例えば、記憶部１２、３０は、この主記憶装置７２又は補助記憶装置７３に実装されていてもよい。別の例として、コンピュータ７がアクセラレータを備える場合には、記憶部１２、３０は、当該アクセラレータに備えられているメモリ内に実装されていてもよい。

　また、メモリ（記憶装置）１つに対して、複数のプロセッサが物理的又は電気的に接続されてもよいし、単数のプロセッサが物理的又は電気的に接続されてもよい。プロセッサ１つに対して、複数のメモリ（記憶装置）が物理的又は電気的に接続されてもよい。一実施形態におけるハードウェアが少なくとも１つのメモリ（記憶装置）とこのメモリ（記憶装置）に接続される複数のプロセッサで構成される場合、複数のプロセッサのうち少なくとも１つのプロセッサが、少なくとも１つのメモリ（記憶装置）に物理的に又は電気的に接続される構成を含んでもよい。また、複数のコンピュータに含まれるメモリ（記憶装置）とプロセッサによって、この構成が実現されてもよい。さらに、メモリ（記憶装置）がプロセッサと一体になっている構成（例えば、L1キャッシュ、L2キャッシュを含むキャッシュメモリ）を含んでもよく、この場合、これらメモリ（記憶装置）へのアクセスを制御するメモリコントローラをさらに含んでもよい。

　ネットワークインタフェース７４は、無線又は有線により、通信ネットワーク８に接続するためのインタフェースである。ネットワークインタフェース７４は、既存の通信規格に適合したものを用いればよい。ネットワークインタフェース７４により、通信ネットワーク８を介して通信接続された外部装置９Ａと情報のやり取りが行われてもよい。

　外部装置９Ａは、例えば、カメラ、モーションキャプチャ、出力先デバイス、外部のセンサ、入力元デバイス等が含まれる。外部装置９Ａとして、外部のメモリ（記憶装置）、例えば、ネットワークストレージ等を備えてもよい。また、外部装置９Ａは、訓練装置１及び推定装置２の構成要素の一部の機能を有する装置でもよい。そして、コンピュータ７は、訓練装置１及び推定装置２の処理結果の一部又は全部を、クラウドサービスのように通信ネットワーク８を介して受信してもよいし、コンピュータ７の外部へと送信してもよい。

　デバイスインタフェース７５は、外部装置９Ｂと直接接続するUSB（Universal Serial Bus）等のインタフェースである。外部装置９Ｂは、外部記憶媒体でもよいし、ストレージ装置でもよい。記憶部１２、３０は、外部装置９Ｂにより実現されてもよい。

　外部装置９Ｂは出力装置でもよい。出力装置は、例えば、画像を表示するための表示装置でもよいし、音声等を出力する装置等でもよい。例えば、LCD（Liquid Crystal Display）、CRT（Cathode Ray Tube）、PDP（Plasma Display Panel）、スピーカ等があるが、これらに限られるものではない。

　なお、外部装置９Ｂは入力装置でもよい。入力装置は、キーボード、マウス、タッチパネル等のデバイスを備え、これらのデバイスにより入力された情報をコンピュータ７に与える。入力装置からの信号はプロセッサ７１に出力される。

　本明細書において、「a、b及びcの少なくとも1つ（一方）」又は「a、b又はcの少なくとも1つ（一方）」の表現（同様な表現を含む）は、a、b、c、a-b、a-c、b-c、a-b-cのいずれかの組み合わせを含む。また、a-a、a-b-b、a-a-b-b-c-c等のいずれかの要素の複数のインスタンスとの組み合わせをカバーする。さらに、a-b-c-dのように、さらにdを有する組み合わせ、すなわち、a、b及び／又はc以外の他の要素が加えられた組み合わせをカバーする。

　本明細書において、「データに基づいて」の表現（同様な表現を含む）は、特に断りがない場合、各種データそのものを入力として用いる場合や、各種データに何らかの処理を行ったもの（例えば、ノイズ加算したもの、正規化したもの、各種データの中間表現等）を入力として用いる場合を含む。

　以上、本開示の実施形態について詳述したが、本開示は上記した個々の実施形態に限定されるものではない。特許請求の範囲に規定された内容及びその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲において種々の追加、変更、置き換え及び部分的削除等が可能である。例えば、前述した全ての実施形態において、説明に用いた数値は、一例として示したものであり、これらに限られるものではない。

１：訓練装置、
１０、２８：入力部、
１２、３０：記憶部、
１４：順伝播部、
１６、３４：第１変換部、
１８、３６：第２変換部、
２０：誤差算出部、
２２：逆伝播部、
２４：更新部、
２６、３８：出力部
３２：訓練済モデル

Claims

　訓練対象であるニューラルネットワークモデルに、入力データを入力し、
　前記ニューラルネットワークモデルの出力データを取得し、
　前記出力データが有界集合に属するように第１変換し、
　前記第１変換されたデータが、前記有界集合から、所定領域内に属するように第２変換し、
　前記第２変換されたデータについて誤差逆伝播処理を実行して、前記ニューラルネットワークモデルを訓練する、
　訓練方法。
　前記第１変換は、微分可能な演算である、請求項１に記載の訓練方法。
　前記第１変換は、シグモイド関数に基づいた変換を行う、請求項２に記載の訓練方法。
　前記所定領域は、星状領域である、請求項１から請求項３のいずれかに記載の訓練方法。
　前記所定領域は、凸型領域である、請求項４に記載の訓練方法。
　前記所定領域に属する所定点から、前記第１変換されたデータまでの距離と、前記所定点から前記第１変換されたデータを接続する半直線上に投射されるように、前記第１変換されたデータを前記第２変換する、請求項４に記載の訓練方法。
　前記半直線上における前記所定点から、前記第１変換されたデータまでの距離及び前記有界集合の境界までの距離、の比率と、前記第２変換されたデータまでの距離及び前記所定領域の境界までの距離、の比率が等しくなるように、前記第２変換する、請求項６に記載の訓練方法。
　前記半直線上において、前記所定点と、前記第１変換されたデータとを、内分又は外分して前記第２変換する、請求項６又は請求項７に記載の訓練方法。
　前記ニューラルネットワークモデルが、当該ニューラルネットワークモデルを構成する層において、前記第１変換と前記第２変換を実行し、前記有界集合における前記所定領域内に属するデータを出力し、
　誤差逆伝播処理を実行して、前記第１変換と前記第２変換の処理を含んだ前記ニューラルネットワークモデルを訓練する、
　請求項１から請求項８のいずれかに記載の訓練方法。
　請求項１から請求項９のいずれかに記載の訓練方法を用いて訓練された前記ニューラルネットワークモデルを備える、学習済みモデル。
　メモリと、
　１又は複数のプロセッサと、を備え、
　前記１又は複数のプロセッサは、
　　訓練対象であるニューラルネットワークモデルに、入力データを入力し、
　前記ニューラルネットワークモデルにおいて前記入力データを順伝播し、出力データを取得し、
　前記出力データが有界集合に属するように第１変換し、
　前記第１変換されたデータが、前記有界集合から、所定領域内に属するように第２変換し、
　前記第２変換されたデータについて逆伝播処理を実行して、前記ニューラルネットワークモデルを訓練する、
　ように構成される、
　訓練装置。
　学習済みのニューラルネットワークモデルに、入力データを入力し、
　前記ニューラルネットワークモデルの出力データを取得し、
　前記出力データが有界集合に属するように変換し、
　前記有界集合に属するように変換されたデータが所定領域内に属するよう変換する、
　推定方法。
　メモリと、
　１又は複数のプロセッサと、を備え、
　前記１又は複数のプロセッサは、
　　学習済みのニューラルネットワークモデルに、入力データを入力し、
　　前記ニューラルネットワークモデルの出力データを取得し、
　　前記出力データが有界集合に属するように変換し、
　　前記有界集合に属するように変換されたデータが所定領域内に属するように変換する、
　推定装置。
　コンピュータに、
　訓練対象であるニューラルネットワークモデルに、入力データを入力する手段、
　前記ニューラルネットワークモデルにおいて前記入力データを順伝播し、の出力データを取得する手段、
　前記出力データが有界集合に属するように第１変換する手段、
　前記第１変換されたデータが、前記有界集合から、所定領域内に属するように第２変換する手段、
　前記第２変換されたデータについて逆伝播処理を実行して、前記ニューラルネットワークモデルを訓練する手段、
　として機能させるプログラム。
　１又は複数のプロセッサに実行させると、
　訓練対象であるニューラルネットワークモデルに、入力データを入力し、
　前記ニューラルネットワークモデルにおいて前記入力データを順伝播し、の出力データを取得し、
　前記出力データが有界集合に属するように第１変換し、
　前記第１変換されたデータが、前記有界集合から、所定領域内に属するように第２変換し、
　前記第２変換されたデータについて逆伝播処理を実行して、前記ニューラルネットワークモデルを訓練する、
　ことを備える方法、
　を実行するプログラムを格納した非一時的コンピュータ可読媒体。