WO2020189498A1

WO2020189498A1 - 学習装置、方法及びプログラム

Info

Publication number: WO2020189498A1
Application number: PCT/JP2020/010809
Authority: WO
Inventors: 美紀尾藤; 慎介花村
Original assignee: 株式会社ＧｅｅｋＧｕｉｌｄ
Priority date: 2019-03-15
Filing date: 2020-03-12
Publication date: 2020-09-24
Also published as: AU2020240239A1; US20210266383A1; WO2020189496A1; CA3106843A1; EP3940567A1; JPWO2020189496A1; EP3940567A4; US11943277B2

Abstract

【課題】　機械学習技術の利用者と提供者の双方の要求を満たすことができるセキュアなシステムにおける学習技術を提供すること。【解決手段】　機械学習モデルの学習装置であって、前記機械学習モデルは、入力側変換処理部と、出力側変換処理部と、を備え、前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部と、前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成部と、前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成部と、前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新部と、を備える学習装置が提供される。

Description

学習装置、方法及びプログラム

　この発明は、機械学習技術を利用した学習装置、方法及びプログラム等に関する。

　近年、ＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）、特に、機械学習技術が注目を集めており、様々な用途や課題解決への機械学習技術の適用が試みられている。例えば、製造業者や製造ラインの自動化業者等が、工場内等に設置される産業用ロボットに機械学習技術を適用し、より適切な制御を行おうとすること等が試みられている（例えば、特許文献１）。

特開２０１７－０３００１４号公報

　ところで、機械学習技術は未だ普く浸透しているとは言い難い。そのため、特定の対象へと機械学習技術を適用する場合には、機械学習技術に関する専門的知見を保有する事業者等が、機械学習技術に関する知見は持たないものの特定の課題を抱える利用者へと、機械学習技術を提供する形式で行われる場合が多い。

　しかしながら、このとき、機械学習技術の提供者は、一般に、機械学習に関するコンピュータプログラム等を利用者へと提供することには慎重である。当該プログラムの意図しない転用や流出、リバースエンジニアリング等のリスクが存在するためである。

　一方、機械学習技術の利用者としては、機械学習を行うために自らの保有する様々なデータ、特に生データを機械学習技術の提供者を含む第三者へと提供することには慎重となる。それらのデータは個人情報や営業秘密等に該当する場合が多く、非常に繊細な取扱いが必要となる情報であるためである。

　すなわち、従前、機械学習技術の利用者と提供者のそれぞれの事情により、機械学習技術の利用が十分に進まない場合があった。

　本発明は、上述の技術的背景の下になされたものであり、その目的とすることころは、機械学習技術の利用者と提供者の双方の要求を満たすことができるセキュアなシステムを提供することにある。また、そのようなシステムに好適な学習技術を提供することも目的とする。

　本発明のさらに他の目的並びに作用効果については、明細書の以下の記述を参照することにより、当業者であれば容易に理解されるであろう。

　上述の技術的課題は、以下の構成を有する学習装置等により解決することができる。

　すなわち、本発明に係る学習装置は、機械学習モデルの学習装置であって、前記機械学習モデルは、前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部と、前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成部と、前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成部と、前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新部と、を備える。

　このような構成によれば、入力側変換処理部と出力側変換処理部との間が欠落した機械学習モデルにおいても、第１の中間出力と第２の中間出力との対応関係に基づいて、入力側変換処理部と出力側変換処理部のパラメータを適切に更新することができる。従って、例えば、中間出力のみを外部装置とやり取するセキュアな変換システムにおいても、適切に機械学習を行うことが可能となる。

　なお、ここで、第１の中間出力及び第２の中間出力の語は、いずれも、（予測）変換モデル各段階の単なる出力のみならず、当該出力値を暗号化するなどの所定の変換を行った値も含むものである。

　前記パラメータ更新部は、前記近似出力と、前記学習用入力データに対応する教師データとの誤差を演算する誤差演算部と、前記誤差を、前記出力側変換処理部、前記近似関数、及び前記入力側変換処理部へと逆伝播する誤差逆伝播部と、前記誤差逆伝播部にて伝播した前記誤差に基づいて、前記出力側変換処理部と前記入力側変換処理部のパラメータを更新する教師あり学習用パラメータ更新部と、を備えてもよい。

　前記学習用入力データに基づく前記第１の中間出力と、前記学習用入力データに基づく前記第２の中間出力との対応関係を学習用入出力テーブルとして記憶する、ものであってもよい。

　前記学習装置は、さらに、前記学習用入出力テーブルを外部装置へと送信するテーブル送信部を備える、ものであってもよい。

　前記外部装置において、前記学習用入出力テーブルに基づいて教師有り学習が行われる、ものであってもよい。

　前記外部装置は、前記第１の中間出力に基づいて前記学習装置へと前記第２の中間出力を提供する、ものであってもよい。

　前記中間出力対応テーブルは、前記機械学習モデルにおいて予測処理を行うことにより生成されたものであってもよい。

　前記近似関数は、誤差逆伝播法が適用可能な関数であってもよい。

　前記機械学習モデルは、階層型の人工ニューラルネットワークであってもよい。

　前記パラメータ更新部は、さらに、前記近似出力に基づいて前記近似関数のパラメータを更新する、近似関数パラメータ更新部を備えてもよい。

　前記近似関数は、バイパス関数を含むものであってもよい。

　前記近似関数は、複数の異なる近似関数の重み付き和により構成される、ものであってもよい。

　本発明は、学習方法としても観念することができる。すなわち、本発明に係る学習方法は、学習装置を用いた機械学習モデルの学習方法であって、前記機械学習モデルは、前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、前記学習装置は、前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部を備え、前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成ステップと、前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成ステップと、前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新ステップと、を備えている。

　本発明は、学習プログラムとしても観念することができる。すなわち、本発明に係る学習プログラムは、学習装置上での機械学習モデルの学習プログラムであって、前記機械学習モデルは、前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、前記学習装置は、前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部を備え、前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成ステップと、前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成ステップと、前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新ステップと、を備えている。

　本発明は、学習システムとしても観念することができる。すなわち、本発明に係る学習システムは、機械学習モデルの学習システムであって、前記機械学習モデルは、前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部と、前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成部と、前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成部と、前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新部と、を備えている。

　本発明によれば、機械学習技術の利用者側と提供者側の双方の要求を満たすことができるセキュアなシステムにおける学習技術を提供することができる。

図１は、システムの全体構成図（第１の実施形態）である。図２は、サーバのハードウェア構成図である。図３は、ロボットのハードウェア構成図である。図４は、ロボットに関する機能ブロック図（第１の実施形態）である。図５は、サーバに関する機能ブロック図（第１の実施形態）である。図６は、ロボットにおける予測処理（第１の実施形態）（その１）である。図７は、ロボットにおける予測処理（第１の実施形態）（その２）である。図８は、サーバにおける予測処理（第１の実施形態）である。図９は、予測処理に関する概念図（第１の実施形態）である。図１０は、システムの全体構成図（第２の実施形態）である。図１１は、中間サーバのハードウェア構成図である。図１２は、中間サーバに関する機能ブロック図（第２の実施形態）である。図１３は、中間サーバにおける予測処理（第２の実施形態）（その１）である。図１４は、中間サーバにおける予測処理（第２の実施形態）（その２）である。図１５は、最終サーバにおける予測処理（第２の実施形態）である。図１６は、予測処理に関する概念図（第２の実施形態）である。図１７は、ロボットに関する機能ブロック図（第３の実施形態）である。図１８は、中間サーバに関する機能ブロック図（第３の実施形態）である。図１９は、最終サーバに関する機能ブロック図（第３の実施形態）である。図２０は、ロボットにおける学習処理（第３の実施形態）である。図２１は、近似データに関する概念図である。図２２は、中間サーバにおける記憶処理（第３の実施形態）である。図２３は、中間サーバにおける学習処理（第３の実施形態）である。図２４は、最終サーバにおける記憶処理（第３の実施形態）である。図２５は、最終サーバにおける学習処理（第３の実施形態）である。図２６は、学習処理に関する概念図（第３の実施形態）である。図２７は、システムの全体構成図（変形例）である。図２８は、バイパス関数を利用する例に関する概念図である。図２９は、バイパス関数の概念図である。図３０は、サブ近似関数を利用した近似の概念図である。

　以下、本発明に係るシステム等の実施の一形態を、添付の図面を参照しつつ、詳細に説明する。なお、以下の実施形態においては、予測処理の語を用いることがある。当業者には明らかな通り、予測処理の語は、学習済モデルの順方向演算処理を意味し、従って、例えば、単に変換処理、推論処理等といった語と置換することができる。

　＜１．第１の実施形態＞
＜１．１　システムの構成＞
まず、図１～図５を参照しつつ、本実施形態におけるシステム１０の構成について説明する。

　図１は、本実施形態に係るシステム１０の全体構成図である。同図から明らかな通り、通信機能を有するサーバ１と、通信機能を有する複数（Ｎ個）のロボット３とが、サーバ・クライアントシステムを構成しており、それらは互いに、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）及びＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）を介して接続されている。なお、ＷＡＮは例えばインターネットであり、ＬＡＮは例えば工場内等に設置されている。

　図２は、サーバ１のハードウェア構成について示す図である。同図から明らかな通り、サーバ１は、制御部１１、記憶部１２、Ｉ／Ｏ部１３、通信部１４、表示部１５、入力部１６を備え、それらはシステムバス等を介して互いに接続されている。制御部１１は、ＣＰＵ又はＧＰＵ等のプロセッサで構成されており各種プログラムの実行処理を行う。記憶部１２は、ＲＯＭ、ＲＡＭ、ハードディスク、フラッシュメモリ等の記憶装置であり、各種データや動作プログラム等を記憶している。Ｉ／Ｏ部１３は、外部装置との入出力等を行うものである。通信部１４は、例えば所定の通信規格に基づいて通信を行う通信ユニットであり、本実施形態におけるクライアント装置であるロボット３との通信を行う。表示部１５は、ディスプレイ等と接続され所定の表示を行う。入力部１６は、例えばキーボードやマウス等により管理者からの入力を受け付けるものである。

　図３は、ロボット３のハードウェア構成について示す図である。ロボット３は、例えば、工場内等に配置される産業用ロボットである。同図から明らかな通り、ロボット３は、制御部３１、記憶部３２、Ｉ／Ｏ部３３、通信部３４、表示部３５、検知部３６及び駆動部３７を備え、それらはシステムバス等を介して互いに接続されている。制御部３１は、ＣＰＵ又はＧＰＵ等のプロセッサで構成されており各種プログラムの実行処理を行う。記憶部３２は、ＲＯＭ、ＲＡＭ、ハードディスク、フラッシュメモリ等の記憶装置であり、各種データや動作プログラム等を記憶している。Ｉ／Ｏ部３３は、外部装置との入出力等を行うものである。通信部３４は、例えば所定の通信規格に基づいて通信を行う通信ユニットであり、本実施形態ではサーバ１との通信を行う。表示部３５は、ディスプレイ等と接続され所定の表示を行う。検知部３６は、センサと接続されセンサ情報をデジタルデータとして検出する。駆動部３７は、制御部からの指令に応じて、接続される（図示しない）モータ等を駆動する。

　図４は、ロボット３の制御部３１に関する機能ブロック図である。同図から明らかな通り、制御部３１は、センサ情報取得部３１１、予測処理部３１２、暗号化処理部３１９、ハッシュ化処理部３１３、情報取得要否判定部３１４、キャッシュ情報取得処理部３１５、サーバ情報取得処理部３１６、復号化部３１７及び駆動指令部３１８を備えている。

　センサ情報取得部３１１は、検知部３６にて取得されたセンサ情報を取得する。予測処理部３１２は、ニューラルネットワークを教師有り学習することにより生成された予測モデル（学習済モデル）の構成等に関する基本情報や重み情報等を読み込むと共に、入力されたデータに基づいて所定の予測出力を生成する。暗号化処理部３１９は、入力されたデータを公開鍵等により暗号化する処理を行う。ハッシュ化処理部３１３は、入力された情報をハッシュ化して対応するハッシュ値、すなわち、規則性の無い固定長の値を生成する。情報取得要否判定部３１４は、所定のデータに対して既にそれと対応するデータが所定のテーブル中に記憶されているか否かを判定する。キャッシュ情報取得処理部３１５は、情報取得要否判定部３１４において所定のデータに対応するデータが存在すると判断された場合にその対応するデータを取得する。サーバ情報取得処理部３１５は、サーバ１へと所定のデータを送信して当該データに対応するデータを受信する。復号化部３１７は、公開鍵等により暗号化されたデータを暗号鍵にて復号化処理する。駆動指令部３１８は、出力データに基づいてモータ等を駆動する。

　図５は、サーバ１の制御部１１に関する機能ブロック図である。同図から明らかな通り、制御部１１は、データ入力受付部１１１、復号化処理部１１２、予測処理部１１３、暗号化処理部１１４及びデータ送信部１１５を備えている。

　データ入力受付部１１１は、ロボット３から送信されるデータ入力を受け付ける。復号化処理部１１２は、公開鍵等により暗号化されたデータを暗号鍵等により復号化する。予測処理部１１３は、ニューラルネットワークを教師有り学習することにより生成された予測モデル（学習済モデル）の構成等の基本情報や重み情報等を読み込むと共に、入力されたデータに基づいて所定の予測出力を生成する。暗号化処理部１１４は、入力されるデータを公開鍵等により暗号化する。データ送信部は、送信対象データをロボット３へと送信する処理を行う。

　＜１．２　システムの動作＞
次に、図６～図９を参照しつつ、システム１０の動作について説明する。

　図６及び図７を参照しつつ、本実施形態におけるロボット３の予測処理動作について説明する。本実施形態において、ロボット３は、取得したセンサ情報に基づいて所定の予測処理を行いモータ等の動作部を駆動するものである。

　ロボット３において、予測処理が開始すると、センサ情報取得部３１１を介してセンサ情報（Ｉ）を取得する処理が行われる（Ｓ１）。続いて、このセンサ情報（Ｉ）を予測処理部３１２へと入力して入力段階から第１の中間層まで予測処理を行い入力側中間層データ（Ｘ１）を生成する（Ｓ３）。

　生成された入力側中間層データ（Ｘ１）は、暗号化処理部３１９において公開鍵により暗号化され暗号化入力側中間層データ（Ｘ１'）が生成される（Ｓ５）。暗号化入力側中間層データ（Ｘ１'）は、その後、ハッシュ化処理部３１３によりハッシュ化され、ハッシュ値（Ｙ１）が生成される（Ｓ７）。

　続いて、情報取得要否判定処理部３１４は、ハッシュテーブルを読み出し、生成されたハッシュ値（Ｙ１）に対応する暗号化出力側中間層データ（Ｚ１'）がハッシュテーブル中に存在するか否かを判定する（Ｓ９）。出力側中間層データ（Ｚ１）は、後述するように、第１の中間層より出力層寄りの第２の中間層出力を表しており、暗号化出力側中間層データ（Ｚ１'）は、サーバ１において公開鍵により暗号化された第２の中間層の出力を表している。

　判定（Ｓ９）の結果、ハッシュ値（Ｙ１）に対応する暗号化出力側中間層データ（Ｚ１'）がハッシュテーブル中に存在する場合（Ｓ１１ＹＥＳ）、キャッシュ情報取得処理部３１５は、当該暗号化出力側中間層データ（Ｚ１'）をキャッシュ情報として取得する処理を行う（Ｓ１３）。

　一方、判定の結果、ハッシュ値（Ｙ１）に対応する暗号化出力側中間層データ（Ｚ１'）がハッシュテーブル中に存在しない場合（Ｓ１１ＮＯ）、サーバ情報取得処理部３１６は、暗号化入力側中間層データ（Ｘ１'）をサーバ１へと送信し（Ｓ１５）、その後所定の待機状態（Ｓ１７ＮＯ）へと移行する。この待機状態において、サーバ１より暗号化出力側中間層データ（Ｚ１'）を受信すると、待機状態が解除され（Ｓ１７ＹＥＳ）、受信した暗号化出力側中間層データ（Ｚ１'）を前記ハッシュ値（Ｙ１）と対応付けて保存する処理が行われる（Ｓ１９）。なお、この間のサーバ１の動作は図８において詳述する。

　復号化部３１７は、取得した暗号化出力側中間層データ（Ｚ１'）を秘密鍵により復号化することで出力側中間層データ（Ｚ１）を生成する（Ｓ２１）。その後、予測処理部３１２は、生成された出力側中間層データ（Ｚ１）に基づいて、第２の中間層から出力層までの予測処理を行い最終出力（Ｏ）を生成する（Ｓ２３）。その後、駆動指令部３１８は、最終出力（Ｏ）に基づいてモータ等の駆動部へと駆動指令を行う（Ｓ２５）。この駆動処理が完了すると、再度、センサ情報の取得処理が行われ（Ｓ１）、以後、一連の処理（Ｓ１～Ｓ２５）が繰り返される。

　次に、図８を参照しつつ、サーバ１の予測処理動作について説明する。

　サーバ１において予測処理が開始すると、サーバ１は、データ入力受付部１１１により所定の待機状態へと移行する（Ｓ３１ＮＯ）。この状態において、ロボット３からの暗号化入力側中間層データ（Ｘ１'）を受信すると待機状態が解除され（Ｓ３１ＮＯ）、復号化処理部１１２により、受信した暗号化入力側中間層データ（Ｘ１'）を秘密鍵により復号化して入力側中間層データ（Ｘ１）を生成する処理が行われる（Ｓ３３）。その後、予測処理部１１３は、この入力側中間層データ（Ｘ１）を入力として第１の中間層から第２の中間層までの予測処理を行い、出力側中間層データ（Ｚ１）を生成する（Ｓ３５）。

　暗号化処理部１１４は、この出力側中間層データ（Ｚ１）を公開鍵を用いて暗号化して、暗号化出力側中間層データ（Ｚ１）を生成する（Ｓ３７）。その後、データ送信部１１５は、暗号化出力側中間層データ（Ｚ１'）をロボット３へと送信する（Ｓ３９）。この送信処理が終了すると、サーバ１は、再び受信待機状態（Ｓ３１）へと戻り、以後、一連の処理（Ｓ３１～Ｓ３９）が繰り返される。

　図９は、本実施形態に係るシステム１により実現される予測処理の概念図である。同図において、上段は、ロボット３において行われる予測処理の概念図であり、下段は、サーバ１において行われる予測処理の概念図である。また、同図の左側が入力側、右側が出力側を示している。

　同図から明らかな通り、ロボット３においてセンサ情報（Ｉ）が入力されると、予測処理部３１２は、入力段階から第１の中間層までの間の予測処理を行い、入力側中間層データ（Ｘ１）を生成する。その後、入力側中間層データ（Ｘ１）は、暗号化を経てサーバ１へと送信され、サーバ１において復号化される。

　サーバ１において、予測処理部１１３は、入力側中間層データ（Ｘ１）を入力として、第１の中間層から第２の中間層までの予測処理を行い、出力側中間層データ（Ｚ１）を生成する。その後、出力側中間層データ（Ｚ１）は、暗号化を経てロボット３へと送信され、ロボット３において復号化される。

　ロボット３において、予測処理部３１２は、第２の中間層から出力層までの間の予測処理を行い、最終出力（Ｏ）を生成する。

　このような構成によれば、機械学習を用いた予測処理を行う上で、クライアント装置（ロボット３）とサーバとの間では、抽象化された中間出力のみが送受信され、生データを送受信する必要がない。従って、クライアント装置のユーザは、個人情報や営業秘密等の情報を確実に保護することができる。また、予測モデルの提供者にとっては、クライアント装置側へと予測モデルの全体を提供する必要がない。従って、アルゴリズムやそのアルゴリズムを実装したプログラムの漏洩等のリスクを低減することができる。すなわち、予測モデルの利用者側と提供者側の双方の要求を満たすことができるセキュアな予測システムを提供することができる。

　また、ハッシュテーブルへと記憶されているデータに関してはサーバへの問合せが不要となるので、サーバ利用コストを削減することができ、また、予測処理の高速化を実現することができる。また、システムを継続的に利用してハッシュテーブルへと十分な情報の蓄積を行えば、クライアント装置をほぼ自律的に動作させることも可能となる。

　さらに、クライアント装置とサーバとの間で通信される中間出力については暗号化処理がなされている。そのため、一層のデータの安全が図られている。

　加えて、上述の実施形態においては、ハッシュ化処理がなされている。これにより、データの安全性が向上すると共に、ハッシュテーブルにおける検索処理の高速化により、判定処理の高速化を実現することができる。

　＜２．第２の実施形態＞
本実施形態では、システム２０において、サーバが多段階に配置される。

　＜２．１　システムの構成＞
図１０～図１２を参照しつつ、本実施形態に係るシステム２０の構成について説明する。本実施形態においては、サーバ５、６が多段で構成されている。

　図１０は、本実施形態に係るシステム２０の全体構成図である。同図から明らかな通り、本実施形態に係るシステム２０は、サーバ５とクライアント装置としての複数のロボット７（７－１～７－Ｎ）とがネットワークを介して通信により接続される点において第１の実施形態と同一である。しかしながら、本実施形態は、ロボット７と最終サーバ５との間に中間サーバ６が介在する点において第１の実施形態と相違する。この中間サーバ６は、例えば機械学習技術のベンダ（ＡＩベンダ）等により運用される。

　図１１は、ロボット７と最終サーバ５との間に介在する中間サーバ６のハードウェア構成について示す図である。同図から明らかな通り、中間サーバ６は、制御部６１、記憶部６２、Ｉ／Ｏ部６３、通信部６４、表示部６５、入力部６６を備え、それらはシステムバス等を介して互いに接続されている。制御部６１は、ＣＰＵ又はＧＰＵ等のプロセッサで構成されており各種プログラムの実行処理を行う。記憶部６２は、ＲＯＭ、ＲＡＭ、ハードディスク、フラッシュメモリ等の記憶装置であり、各種データや動作プログラム等を記憶している。Ｉ／Ｏ部６３は、外部装置との入出力等を行うものである。通信部６４は、例えば所定の通信規格に基づいて通信を行う通信ユニットであり、最終サーバ５及びクライアント装置としてのロボット７との通信を行う。表示部６５は、ディスプレイ等と接続され所定の表示を行う。入力部６６は、例えばキーボードやマウス等により管理者からの入力を受け付けるものである。

　図１２は、中間サーバ６の制御部６１に関する機能ブロック図である。同図から明らかな通り、制御部６１は、データ入力受付部６１１、復号化処理部６１２、予測処理部６１３、暗号化処理部６１４、ハッシュ化処理部６１５、情報取得要否判定部６１６、キャッシュ情報取得処理部６１７、サーバ情報取得処理部６１８及びデータ送信部６１９を備えている。

　データ入力受付部６１１は、ロボット３又は最終サーバ５から送信されるデータ入力を受け付ける。復号化処理部６１２は、公開鍵等により暗号化されたデータを暗号鍵等により復号化する。予測処理部６１３は、ニューラルネットワークを教師有り学習することにより生成された予測モデル（学習済モデル）の構成等の基本情報や重み情報等を読み込むと共に、入力されたデータに基づいて所定の予測出力を生成する。暗号化処理部６１４は、入力されるデータを公開鍵等により暗号化する。ハッシュ化処理部６１５は、入力された情報をハッシュ化して対応するハッシュ値、すなわち、規則性の無い固定長の値を生成する。情報取得要否判定部６１６は、所定のデータに対して既にそれと対応するデータが所定のテーブル中に記憶されているか否かを判定する。キャッシュ情報取得処理部６１７は、情報取得要否判定部６１６において所定のデータに対応するデータが存在すると判断された場合にその対応するデータを取得する。サーバ情報取得処理部６１８は、最終サーバ５へと所定のデータを送信して当該データに対応するデータを受信する。データ送信部６１９は、送信対象データをロボット３又は最終サーバ５へと送信する処理を行う。

　なお、最終サーバ５とロボット７のハードウェア構成は、第１の実施形態のサーバ１とロボット３の構成と略同一であるので、ここでは記載を省略する。

　＜２．２　システムの動作＞
次に、図１３～図１６を参照しつつ、本実施形態に係るシステム２０の動作について説明する。

　ロボット７の動作は、第１の実施形態と略同一である。すなわち、図６及び図７において示した通り、情報取得要否判定処理部３１４における判定（Ｓ９）の結果、ハッシュ値（Ｙ１）に対応する暗号化出力側中間層データ（Ｚ１'）がハッシュテーブル中に存在しない場合（Ｓ１１ＮＯ）、サーバ情報取得処理部３１６は、第１の暗号化入力側中間層データ（Ｘ１'）を中間サーバ６へと送信し（Ｓ１５）、その後所定の待機状態（Ｓ１７ＮＯ）へと移行する。この待機状態において、サーバ１より第１の暗号化出力側中間層データ（Ｚ１'）を受信すると、待機状態が解除され（Ｓ１７ＹＥＳ）、受信した第１の暗号化出力側中間層データ（Ｚ１'）を前記ハッシュ値（Ｙ１）と対応付けて保存する処理が行われる（Ｓ１９）。

　図１３及び図１４は、中間サーバ６の予測処理動作に関するフローチャートである。中間サーバ６は、予測処理が開始すると、データ入力受付部６１１により所定の待機状態に移行する（Ｓ５１ＮＯ）。その後、ロボット７から第１の暗号化入力側中間層データ（Ｘ１'）を受信すると（Ｓ５１ＹＥＳ）、待機状態が解除される。その後、復号化処理部６１２は、受信した第１の暗号化入力側中間層データ（Ｘ１'）を秘密鍵により復号化処理し、第１の入力側中間層データ（Ｘ１）を生成する（Ｓ５３）。

　予測処理部６１３は、復号化した第１の入力側中間層データ（Ｘ１）に基づいて、第１の中間層から第３の中間層までの予測処理を行って第２の入力側中間層データ（Ｘ２）を生成する（Ｓ５５）。暗号化処理部６１４は、第２の入力側中間層データ（Ｘ２）を公開鍵で暗号化して第２の暗号化入力側中間層データ（Ｘ２'）を生成する（Ｓ５７）。また、ハッシュ化処理部６１５は、第２の暗号化入力側中間層データ（Ｘ２'）をハッシュ化処理して第２のハッシュ値（Ｙ２）を生成する（Ｓ５９）。

　その後、情報取得要否判定部６１６は、中間サーバ６に記憶された第２のハッシュテーブルを読み出し、生成された第２のハッシュ値（Ｙ２）に対応する第２の暗号化出力側中間層データ（Ｚ２'）が第２のハッシュテーブル中に存在するか否かを判定する（Ｓ６１）。この判定（Ｓ９）の結果、第２のハッシュ値（Ｙ２）に対応する第２の暗号化出力側中間層データ（Ｚ２'）がハッシュテーブル中に存在する場合（Ｓ６３ＹＥＳ）、キャッシュ情報取得処理部６１７は、当該第２の暗号化出力側中間層データ（Ｚ２'）をキャッシュ情報として取得する処理を行う（Ｓ６５）。

　一方、判定の結果、第２のハッシュ値（Ｙ２）に対応する第２の暗号化出力側中間層データ（Ｚ２'）が第２のハッシュテーブル中に存在しない場合（Ｓ６３ＮＯ）、サーバ情報取得処理部６１８は、第２の暗号化入力側中間層データ（Ｘ２'）をサーバ１へと送信し（Ｓ６７）、その後所定の待機状態（Ｓ６９ＮＯ）へと移行する。この待機状態において、最終サーバ５より第２の暗号化出力側中間層データ（Ｚ２'）を受信すると、待機状態が解除され（Ｓ６９ＹＥＳ）、受信した第２の暗号化出力側中間層データ（Ｚ２'）を前記第２のハッシュ値（Ｙ２）と対応付けて保存する処理が行われる（Ｓ７１）。なお、この間の最終サーバ５の動作は図１５において後述する。

　復号化処理部６１２は、取得した第２の暗号化出力側中間層データ（Ｚ２'）を秘密鍵により復号化することで第２の出力側中間層データ（Ｚ２）を生成する（Ｓ７３）。その後、予測処理部６１３は、生成された第２の出力側中間層データ（Ｚ２）に基づいて、第４の中間層から第２の中間層までの予測処理を行い、第１の出力側中間層データ（Ｚ１）を生成する（Ｓ７５）。暗号化処理部６１４は、第１の出力側中間層データ（Ｚ１）に暗号化処理を行い第１の暗号化出力側中間層データ（Ｚ１'）を生成する（Ｓ７７）。その後、データ送信部６１９は、第１の暗号化出力側中間層データ（Ｚ１'）をロボット７へと送信する。この送信処理が終了すると、中間サーバ６は再び受信待機状態（Ｓ５１ＮＯ）へと戻り、以後、一連の処理（Ｓ５１～Ｓ７９）が繰り返される。

　図１５は、最終サーバ５の予測処理動作に関するフローチャートを示している。

　予測処理が開始すると、最終サーバ５は、データ入力受付部１１１により所定の待機状態へと移行する（Ｓ８１ＮＯ）。この状態において、中間サーバ６からの第２の暗号化入力側中間層データ（Ｘ２'）を受信すると待機状態が解除される（Ｓ８１ＹＥＳ）。復号化処理部１１２は、受信した第２の暗号化入力側中間層データ（Ｘ２'）を秘密鍵により復号化する処理を行い、第２の入力側中間層データ（Ｘ２）を生成する（Ｓ８３）。その後、予測処理部１１３は、この第２の入力側中間層データ（Ｘ２）を入力として第３の中間層から第４の中間層までの予測処理を行い、第２の出力側中間層データ（Ｚ２）を生成する（Ｓ８５）。

　暗号化処理部１１４は、この第２の出力側中間層データ（Ｚ２）を公開鍵を用いて暗号化して、第２の暗号化出力側中間層データ（Ｚ２'）を生成する（Ｓ８７）。その後、データ送信部１１５は、第２の暗号化出力側中間層データ（Ｚ２'）を中間サーバ６へと送信する（Ｓ８９）。この送信処理が終了すると、最終サーバ５は再度受信待機状態（Ｓ８１）へと戻り、以後、一連の処理（Ｓ８１～Ｓ８９）が繰り返される。

　図１６は、本実施形態に係るシステム２０により実現される予測処理の概念図である。同図において、上段は、ロボット７において行われる予測処理の概念図であり、中段は、中間サーバ６において行われる予測処理の概念図であり、下段は、最終サーバ５において行われる予測処理の概念図である。また、同図において左側が入力側、右側が出力側を示している。

　同図から明らかな通り、ロボット３においてセンサ情報（Ｉ）が入力されると、予測処理部３１２は、入力段階から第１の中間層までの間の予測処理を行い、第１の入力側中間層データ（Ｘ１）を生成する。その後、第１の入力側中間層データ（Ｘ１）は、暗号化を経て中間サーバ６へと送信され、中間サーバ６において復号化される。

　中間サーバ６において、予測処理部６１３は、第１の中間層から第３の中間層までの間の予測処理を行い、第２の入力側中間層データ（Ｘ２）を生成する。その後、第２の入力側中間層データ（Ｘ２）は、暗号化を経て最終サーバ５へと送信され、最終サーバ５において復号化される。

　最終サーバ５において、予測処理部１１３は、第２の入力側中間層データ（Ｘ２）を入力として、第３の中間層から第４の中間層までの予測処理を行い、第２の出力側中間層データ（Ｚ２）を生成する。その後、第２の出力側中間層データ（Ｚ２）は、暗号化を経て中間サーバ６へと送信され、中間サーバ６において復号化される。

　中間サーバ６において、予測処理部６１３は、第４の中間層から第２の中間層までの間の予測処理を行い、第１の出力側中間層データ（Ｚ１）を生成する。その後、第１の出力側中間層データ（Ｚ１）は、暗号化を経てロボット７へと送信され、ロボット７において復号化される。

　ロボット７において、予測処理部３１２は、第２の中間層から出力層までの間の予測処理を行い、最終出力（Ｏ）を生成する。

　このような構成によれば、サーバが多段に設けられていることから、クライアント装置及び各サーバにおける個々の装置の処理負担を軽減することができると同時に、多段化によるスケールメリットによりクライアント装置における予測性能の向上も見込むことができる。しかも、このように多段化を行っても、各サーバはキャッシュ情報に基づいた予測処理も行うことから処理の低速化が生じにくい。なお、予測モデルが分散配置されるのでよりシステムの安全性の向上等も見込まれ、また、複数の管理者による各サーバの分担管理も可能となる。

　＜３．第３の実施形態＞
本実施形態では、システム３０が予測処理に加えて学習処理を行う。

　＜３．１　システムの構成＞
本実施形態に係るシステム３０の構成は、第２の実施形態において示したものと略同一である。尤も、ロボット７、中間サーバ６及び最終サーバ５の各制御部が、予測処理に加えて学習処理のための機能ブロックを有する点において相違する。

　図１７は、ロボット７の制御部７１０の機能ブロック図である。

　同図において、予測処理部７１０１の内容は、図４において示した構成と略同一であるので詳細な説明は省略する。ただし、予測処理部７１０１は、さらにキャッシュテーブル追加処理部７１０９を備える点において異なる。キャッシュテーブル追加処理部７１０９は、図７において復号化処理（Ｓ２１）を行って出力側中間層データ（Ｚ１）を生成した後に、当該出力側中間層データ（Ｚ１）を、対応する入力側中間層データ（Ｘ１）と共に、キャッシュテーブルへと追加記憶させる処理を行う。このキャッシュテーブルは後述の学習処理に用いられる。

　制御部７１０は、さらに、学習処理部７１０２を有している。学習処理部７１０２は、データ読出部７１０２、近似関数生成処理部７１１６、予測処理部７１１７、誤差逆伝播処理部７１１８、パラメータ更新処理部７１１９、暗号化処理部７１２０、及びデータ送信処理部７１２１を備えている。

　データ読出部７１１５は、ロボット７内に記憶されている種々のデータの読出処理を行う。近似関数生成処理部７１１６は、所定の入出力の対応関係に関するキャッシュテーブルに基づき、後述の手法にて近似関数を生成する。予測処理部７１１７は、ニューラルネットワークを教師有り学習することにより生成された予測モデル（学習済モデル）の構成等の基本情報や重み情報等を読み込むと共に、入力されたデータに基づいて所定の予測出力を生成する。

　誤差逆伝播処理部７１１８は、予測モデルの出力と教師データとを比較して得られた誤差をモデルの出力側から入力側へと伝播させる処理（Ｂａｃｋ　Ｐｒｏｐａｇａｔｉｏｎ）を行う。パラメータ更新処理部７１１９は、予測モデルの出力と教師データとの誤差を小さくするよう重み等のモデルのパラメータを更新する処理を行う。暗号化処理部７１２０は、所定の対象データを公開鍵等により暗号化する処理を行う。データ送信処理部７１２１は、所定の対象データを中間サーバ６へと送信する処理を行う。

　図１８は、中間サーバ６の制御部６１０の機能ブロック図である。

　同図において、予測処理部６１０１の内容は、図１２において示した構成と略同一であるので詳細な説明は省略する。ただし、予測処理部６１０１は、さらにキャッシュテーブル追加処理部６１１２を備える点において異なる。キャッシュテーブル追加処理部６１１２は、図１４において復号化処理（Ｓ７５）を行って第２の出力側中間層データ（Ｚ２）を生成した後に、当該第２の出力側中間層データ（Ｚ２）を、対応する第２の入力側中間層データ（Ｘ２）と共に、キャッシュテーブルへと追加記憶させる処理を行う。このキャッシュテーブルは後述の学習処理に用いられる。

　制御部６１０は、さらに、学習処理部６１０２を有している。学習処理部６１０２は、データ入力受付部６１２３、データ読出部６１１５、サンプリング処理部６１１６、近似関数生成処理部６１１７、予測処理部６１１８、誤差逆伝播処理部６１１９、パラメータ更新処理部６１２０、暗号化処理部６１２１、及びデータ送信処理部６１２２を備えている。

　データ入力受付部６１２３は、ロボット７から受信する第１のキャッシュテーブル等の種々のデータを受信して復号化し記憶する処理を行う。データ読出部６１１５は、中間サーバ６内に記憶されている種々のデータの読出処理を行う。サンプリング処理部６１１６は、キャッシュテーブルから学習対象となるデータセットを選択する処理を行う。近似関数生成処理部６１１７は、所定の入出力の対応関係に関するキャッシュテーブルに基づき、後述の手法にて、近似関数を生成する。予測処理部６１１８は、ニューラルネットワークを教師有り学習することにより生成された予測モデル（学習済モデル）の構成等の基本情報や重み情報等を読み込むと共に、入力されたデータに基づいて所定の予測出力を生成する。

　誤差逆伝播処理部６１１９は、予測モデルの出力と教師データとを比較して得られた誤差をモデルの出力側から入力側へと伝播させる処理（Ｂａｃｋ　Ｐｒｏｐａｇａｔｉｏｎ）を行う。パラメータ更新処理部６１２０は、予測モデルの出力と教師データとの誤差を小さくするよう重み等のモデルのパラメータを更新する処理を行う。暗号化処理部６１２１は、所定の対象データを公開鍵等により暗号化する処理を行う。データ送信処理部６１２２は、所定の対象データをロボット７又は最終サーバ５へと送信する処理を行う。

　図１９は、最終サーバ５の制御部５１０の機能ブロック図である。

　同図において、予測処理部５１０１の内容は、図５において示した構成と略同一であるので詳細な説明は省略する。

　制御部５１０は、さらに、学習処理部５１０２を有している。学習処理部５１０２は、データ入力受付部５１１５、データ読出部５１１０、サンプリング処理部５１１１、予測処理部５１１２、誤差逆伝播処理部５１１３、及びパラメータ更新処理部５１１４を備えている。

　データ入力受付部５１１５は、中間サーバ６から受信する第２のキャッシュテーブル等の種々のデータを受信して復号化し記憶する処理を行う。データ読出部５１１０は、最終サーバ５内に記憶されている種々のデータの読出処理を行う。サンプリング処理部５１１１は、第２のキャッシュテーブルから学習対象となるデータセットを選択する処理を行う。予測処理部５１１２は、ニューラルネットワークを教師有り学習することにより生成された予測モデル（学習済モデル）の構成等の基本情報や重み情報等を読み込むと共に、入力されたデータに基づいて所定の予測出力を生成する。

　誤差逆伝播処理部５１１３は、予測モデルの出力と教師データとを比較して得られた誤差をモデルの出力側から入力側へと伝播させる処理（Ｂａｃｋ　Ｐｒｏｐａｇａｔｉｏｎ）を行う。パラメータ更新処理部５１１４は、予測モデルの出力と教師データとの誤差を小さくするよう重み等のモデルのパラメータを更新する処理を行う。

　＜３．２　システムの動作＞
続いて、図２０～図２６を参照しつつ、システム３０の動作について説明する。なお、予測処理動作については第２の実施形態と略同一であるのでここでは説明を省略する。

　図２０は、ロボット７における学習処理動作のフローチャートである。同図から明らかな通り、学習処理動作が開始すると、データ読出部７１１５は、ロボット７内に記憶され教師データに相当する入出力データテーブルから一対の入出力対（Ｘ０、Ｚ０）を読み出す（Ｓ１０１）。この読み出しを行うと、予測処理部７１１７は、入力データＸ０に基づいて、予測モデルの入力層から第１の中間層へと至る区間において予測処理を行ない入力側中間層データ（Ｘ１－ｓ１）を生成する（Ｓ１０３）。

　一方、これら（Ｓ１０１～Ｓ１０３）と並行して、データ読出部７１１５は、予測処理時にロボット７へと蓄積された第１の入力側中間層データ（Ｘ１）と第１の出力側中間層データ（Ｚ１）との対応関係を含む第１のキャッシュテーブルを読み出す処理を行う（Ｓ１０５）。第１のキャッシュテーブルを読み出した後、この第１のキャッシュテーブルに基づいて、近似関数を生成する処理が行われる（Ｓ１０７）。

　ここで、近似関数の生成処理について詳細に説明する。第１の入力側中間層（説明の便宜上、仮にＸ層とする）のデータ（Ｘ１）を入力として、第１の出力側中間層（説明の便宜上、仮にＺ層とする）のデータ（Ｚ１）を生成するデータ変換（キャッシュ変換）は、以下のように表すことができる。

　ここで、ｎ個のニューロンから成るＸ層のデータを表すベクトルは以下のように表すことができる。

　同様に、Ｎ個のニューロンから成るＺ層のデータを表すベクトルは以下のように表すことができる。

　また、Ｚ層のｋ番目の値ｚｋは数式（１）より、他のＮ－１個の値と独立して計算が可能であるから、以下の通り表すことができる。

　このとき、変換関数Ｓｋは、キャッシュ変換の性質により、Ｘ層のデータベクトルの各成分値の組み合わせが第１のキャッシュテーブル内に存在しなければ、対応するＺ層のｋ番目の値へと変換することができない。そのため、次のような１次方程式である数式（５）により近似する。

　なお、数式（５）の変数は、下記のｎ＋１個である。

　従って、数式（５）の解を求めるためには、数式（４）からｎ＋１個のデータを抽出して、以下のｎ＋１元１次連立方程式を解けばよいこととなる。

　なお、このｎ＋１個のデータを抽出する際には、近似値を得たい点の近傍のキャッシュデータを選出することが好ましい。近似値を得たい点の近傍のキャッシュデータを可能な限り抽出することで、近似誤差の変動を抑制することができるためである。このようなキャッシュデータの抽出に関する概念図が図２１に示されている。

　ここで、以下の通り、定義することができる。

　そうすると、数式（７）は、下記の通り簡潔に表現することができる。

　ｎ＋１次の正方行列であるＡが正則行列であれば、数式（９）は一意に以下の解ｖｋをもつ。

　すなわち、数式（９）をガウスの消去法等のアルゴリズムに則り、コンピュータで演算することで、数式（１０）の解ｖｋを得ることができる。この解ｖｋを代入することで、数式（５）は以下のように表すことができる。

　すなわち、この数式（１１）が近似式となる。なお、同数式から明らかな通り、Ｘ層のデータベクトルの各成分について近似的に偏微分が可能であるので、例えば、Ｚ層からＸ層への誤差逆伝播等も容易に行うことができる。すなわち、キャッシュテーブルが対応する学習モデル部分の前後、すなわち、例えば入力側・出力側の各機械学習モデルが多階層ニューラルネットワークモデルであっても、誤差逆伝播法を用いて高速に学習処理を行うことができる。

　図２０のフローチャートに戻り、第１の入力側中間層データ（Ｘ１－ｓ１）の生成処理（Ｓ１０３）と近似関数の生成処理（Ｓ１０７）が完了すると、予測処理部７１１７により、第１の入力側中間層データ（Ｘ１）と近似関数に基づいて、第１の中間層から第２の中間層へと至る区間の予測処理が行われ出力側中間層データ（Ｚ１－ｓ１）が生成される（Ｓ１０９）。また、その後、予測処理部７１１７は、出力側中間層データ（Ｚ１－ｓ１）を入力として、第２の中間層から出力層へと至る区間の予測処理を行い、最終出力（Ｚ０－ｓ１）を生成する（Ｓ１１１）。

　誤差逆伝播処理部６１１９は、教師データに係る教師出力（Ｚ０）と最終出力（Ｚ０－ｓ１）との誤差を生成し、当該誤差又はそれに基づく所定の値（例えば、二乗平均誤差等）を、例えば、最急降下法等の手法により出力側から入力側へと伝播する（Ｓ１１３）。

　その後、パラメータ更新処理部７１１９は、逆伝播された誤差等に基づいて、学習モデルのうち、近似関数部分を除く、入力層から第１の中間層へと至る区間と、第２の中間層から出力層へと至る区間の重み等のパラメータを更新する処理を行う（Ｓ１１５）。

　その後、ロボット７は、第１のキャッシュテーブルを送信することが許可されているか否かを所定の設定情報から確認する（Ｓ１１７）。その結果、送信許可がない場合には、学習終了判定（Ｓ１２１）を行い、終了しない場合（Ｓ１２１ＮＯ）には、再度すべての処理（Ｓ１０１～Ｓ１２１）を繰り返す。一方、終了する場合（Ｓ１２１ＹＥＳ）には、学習処理は終了する。

　一方、キャッシュテーブルの送信許可がある場合（Ｓ１１７ＹＥＳ）には、データ送信処理部７１２１は、暗号化処理部７１２０による暗号化を施した第１のキャッシュテーブルを中間サーバ６へと送信する処理を行う（Ｓ１１９）。なお、その後、学習終了判定（Ｓ１２１）が行われる。

　次に、中間サーバ６の学習処理動作について説明する。

　図２２は、ロボット７から送信される第１のキャッシュテーブルの受信及び記憶処理に関するフローチャートである。同図から明らかな通り、中間サーバ６において学習処理が開始すると、データ入力受付部６１２３は、データ受信待機状態へと移行する（Ｓ１３１）。この状態において、暗号化された第１のキャッシュテーブルに相当するデータを受信すると（Ｓ１３１ＹＥＳ）、データ受信待機状態は解除され、受信した第１のキャッシュデータを秘密鍵等により復号化し（Ｓ１３３）、記憶部へと記憶する処理（Ｓ１３５）が行われる。この記憶処理が終了すると、再び中間サーバ６は受信待機状態（Ｓ１３１ＮＯ）へと移行する。

　図２３は、図２２に示した第１のキャッシュテーブルの受信処理と平行して実行される、中間サーバ６における学習処理動作に関するフローチャートである。同図から明らかな通り、学習処理が開始すると、データ読出部６１１５は、中間サーバ６内に記憶され教師データに相当する入出力データテーブルから入出力対（Ｘ１－ｓ１、Ｚ１－ｓ１）を読み出す（Ｓ１４１）。入出力対が読み出されると、サンプリング処理部６１１６は、学習に使用する入出力対を抽出する（Ｓ１４３）。この抽出処理の後、予測処理部６１１８は、入力データ（Ｘ１－ｓ１）に基づいて、予測モデルの第１の中間層から第３の中間層へと至る区間において予測処理を行なって、第２の入力側中間層データ（Ｘ２－ｓ２）を生成する（Ｓ１４５）。

　一方、これら（Ｓ１４１～Ｓ１４５）と並行して、データ読出部６１１５は、予測処理時に中間サーバ６へと蓄積された第２の入力側中間層データ（Ｘ２）と第１の出力側中間層データ（Ｚ２）との対応関係を含む第２のキャッシュテーブル（Ｘ２、Ｚ２）を読み出す処理を行う（Ｓ１４７）。第２のキャッシュテーブルを読み出した後、この第２のキャッシュテーブルに基づいて、第２の入力側中間層データ（Ｘ２）に基づいて第２の出力側中間層データ（Ｚ２）を生成するような近似関数を生成する処理が行われる（Ｓ１４９）。なお、近似関数の生成処理はロボット７における近似関数生成と同様である。

　第２の入力側中間層データ（Ｘ２－ｓ２）の生成処理（Ｓ１４５）と近似関数の生成処理（Ｓ１４９）が完了すると、予測処理部６１１８により、第２の入力側中間層データ（Ｘ２－ｓ２）と近似関数に基づいて、第３の中間層から第４の中間層へと至る区間の予測処理が行われ第２の出力側中間層データ（Ｚ２－ｓ２）が生成される（Ｓ１５１）。また、その後、予測処理部６１１８は、第２の出力側中間層データ（Ｚ２－ｓ２）を入力として、第４の中間層から第２の中間層へと至る区間の予測処理を行い、第２の出力側予測出力（Ｚ１－ｓ２）を生成する（Ｓ１５３）。

　誤差逆伝播処理部６１１９は、教師データ（Ｚ１－ｓ１）と第２の出力側予測出力（Ｚ１－ｓ２）との誤差を生成し、当該誤差又はそれに基づく所定の値（例えば、二乗平均誤差等）を、例えば、最急降下法等の手法により出力側から入力側へと伝播する（Ｓ１５５）。

　その後、パラメータ更新処理部６１２０は、逆伝播された誤差等に基づいて、学習モデルのうち、近似関数部分を除く、第１の中間層から第３の中間層へと至る区間と、第４の中間層から第２の中間層へと至る区間の重み等のパラメータを更新する処理を行う（Ｓ１５７）。

　その後、中間サーバ６は、第２のキャッシュテーブル（Ｘ２－ｓ２、Ｚ２－ｓ２）を送信することが許可されているか否かを所定の設定情報から確認する（Ｓ１５９）。その結果、送信許可がない場合には、学習終了判定（Ｓ１６３）を行い、終了しない場合（Ｓ１６３ＮＯ）には、再度すべての処理（Ｓ１４１～Ｓ１６３）を繰り返す。一方、終了する場合（Ｓ１６３ＹＥＳ）には、学習処理は終了する。

　一方、キャッシュテーブルの送信許可がある場合（Ｓ１５９ＹＥＳ）には、データ送信処理部６１２２は、暗号化処理部６１２１による暗号化を施した第２のキャッシュテーブルを最終サーバ５へと送信する処理を行う（Ｓ１６１）。なお、その後、学習終了判定（Ｓ１６３）が行われる。

　次に、最終サーバ５の学習処理動作について説明する。

　図２４は、中間サーバ６から送信される第２のキャッシュテーブル（Ｘ２－ｓ２、Ｚ２－ｓ２）の受信及び記憶処理に関するフローチャートである。同図から明らかな通り、最終サーバ５において学習処理が開始すると、データ入力受付部５１１５は、データ受信待機状態へと移行する（Ｓ１７１）。この状態において、暗号化された第２のキャッシュテーブルに相当するデータを受信すると（Ｓ１７１ＹＥＳ）、データ受信待機状態は解除され、受信した第２のキャッシュデータを秘密鍵等により復号化し（Ｓ１７３）、記憶部へと記憶する処理（Ｓ１７５）が行われる。この記憶処理が終了すると、再び最終サーバ５は受信待機状態（Ｓ１７１ＮＯ）へと移行する。

　図２５は、図２４に示した第２のキャッシュテーブルの受信処理と平行して実行される、最終サーバ５における学習処理動作に関するフローチャートである。学習処理が開始すると、データ読出部５１１０は、キャッシュテーブルを読み出す処理を行う（Ｓ１８１）。その後、サンプリング処理部（Ｓ５１１１）は、キャッシュテーブルから学習対象となる入出力対を抽出する（Ｓ１８３）。

　予測処理部５１１２は、読み出された第２の入力側中間層データ（Ｘ２－ｓ２）に基づき、第３の中間層から第４の中間層までの予測処理を行い、第２の出力側中間層データ（Ｚ２－ｓ３）を生成する（Ｓ１８５）。誤差逆伝播処理部５１１３は、第２の出力側中間層データ（Ｚ２－ｓ３）と教師データ（Ｚ２－ｓ２）との誤差を生成し、当該誤差又はそれに基づく所定の値（例えば、二乗平均誤差等）を、例えば、最急降下法等の手法により出力側から入力側へと伝播する（Ｓ１８７）。

　その後、パラメータ更新処理部５１１４は、逆伝播された誤差等に基づいて、学習モデルの重み等のパラメータを更新する処理を行う（Ｓ１８９）。パラメータの更新処理が行われると、学習の終了判定が行われ、所定の終了条件が満たされていない場合（Ｓ１９１ＮＯ）には、再度一連の処理（Ｓ１８１～Ｓ１８９）が行われる。一方、所定の終了条件が満たされた場合（Ｓ１９１ＹＥＳ）には、学習処理は終了する。

　図２６は、本実施形態に係るシステム３０により実現される学習処理の概念図である。同図において、上段は、ロボット７において行われる学習処理の概念図であり、中段は、中間サーバ６において行われる学習処理の概念図であり、下段は、最終サーバ５において行われる学習処理の概念図である。また、同図において左側が入力側、右側が出力側を示している。

　同図から明らかな通り、ロボット７において入力情報（Ｘ０）が入力されると、予測処理部７１１７は、入力段階から第１の中間層までの間の予測処理を行い、第１の入力側中間層データ（Ｘ１－ｓ１）を生成する。一方、近似関数生成処理部７１１６により、第１のキャッシュテーブル（Ｘ１、Ｚ１）に基づいて近似関数（Ｆ（ｘ））が生成される。予測処理部７１１７は、第１の入力側中間層データ（Ｘ１－ｓ１）と近似関数（Ｆ（ｘ））に基づいて、第１の出力側中間層データ（Ｚ１－ｓ１）を生成する。また、第１の出力側中間層データ（Ｚ１－ｓ１）に基づいて最終出力データ（Ｚ０－ｓ１）が生成される。誤差逆伝播処理部７１１８は、この最終出力データ（Ｚ０－ｓ１）と教師データ（Ｚ０）との間の誤差を最終出力段階から近似関数を経て入力段階まで逆伝播させる。その後、パラメータ更新処理部７１１９は、最終出力段階から第２の中間層、第１の中間層から入力段階までの間の重みを含むパラメータが更新される。また、このとき生成された第１のキャッシュテーブル（Ｘ１－ｓ１、Ｚ１－ｓ１）は、所定条件下で中間サーバ６へと提供される。

　また、同図から明らかな通り、中間サーバ６において第１の入力側中間層データ（Ｘ１－ｓ１）が入力されると、予測処理部６１１８は、第１の中間層から第３の中間層までの間の予測処理を行い、第２の入力側中間層データ（Ｘ２－ｓ２）を生成する。一方、近似関数生成処理部６１１７により、第１のキャッシュテーブル（Ｘ１－ｓ１、Ｚ１－ｓ１）に基づいて近似関数（Ｇ（ｘ））が生成される。予測処理部６１１８は、第２の入力側中間層データ（Ｘ２－ｓ２）と近似関数（Ｇ（ｘ））に基づいて、第２の出力側中間層データ（Ｚ２－ｓ２）を生成する。また、第２の出力側中間層データ（Ｚ２－ｓ２）に基づいて第１の出力側中間層データ（Ｚ１－ｓ２）が生成される。誤差逆伝播処理部６１１９は、この最終出力データ（Ｚ１－ｓ２）と教師データ（Ｚ１－ｓ１）との間の誤差を第２の中間層から近似関数を経て第１の中間層まで逆伝播させる。その後、パラメータ更新処理部６１２０は、第２の中間層から第４の中間層、第３の中間層から第１の中間層までの間の重みを含むパラメータを更新する。また、このとき生成された第２のキャッシュテーブル（Ｘ２－ｓ２、Ｚ２－ｓ２）は、所定条件下で最終サーバ５へと提供される。

　さらに、同図から明らかな通り、最終サーバ５において第２の入力側中間層データ（Ｘ２－ｓ２）が入力されると、予測処理部５１１２は、第３の中間層から第４の中間層までの間の予測処理を行い、第２の出力側中間層データ（Ｚ２－ｓ３）を生成する。誤差逆伝播処理部５１１３は、この第２の出力側中間層データ（Ｚ２－ｓ３）と教師データ（Ｚ２－ｓ２）との間の誤差を第４の中間層から第３の中間層まで逆伝播させる。その後、パラメータ更新処理部５１１４は、第４の中間層から第４の中間層までの間の重みを含むパラメータが更新される。

　＜４．変形例＞
本発明は上述の実施形態の構成・動作に限定されるものではなく、様々に変形することが可能である。

　第３の実施形態において、キャッシュテーブルから生成される近似関数は学習処理の際のみ使用されるものとして記載した。しかしながら、本発明はこのような構成に限定されない。例えば、予測処理の目的で、それまでに得られているキャッシュテーブルに基づいて近似関数を生成し、第１の入力側中間層データ（Ｘ１）と近似関数とに基づいて、第１の中間層から第２の中間層へと至る区間の予測処理を行い出力側中間層データ（Ｚ１）を生成してもよい。このような構成によれば、例えば一定程度ハッシュテーブルへとデータが蓄積された後においては、サーバ側への問合せ頻度を大幅に減らすか又は問い合わせを行うことなく予測処理を行うことが可能となる。

　上述の実施形態においては、入力側中間層データ（Ｘ）（例えばＸ１又はＸ２）を暗号化、ハッシュ化した後に、当該ハッシュ値をキーとしてハッシュテーブル検索処理を行っている（例えば、図６のＳ１１、図１３のＳ５５など）。しかしながら、本発明はこのような構成に限定されない。従って、例えば、入力側中間層データ（Ｘ）について丸め処理を行った後に暗号化及び／又はハッシュ化し、ハッシュテーブル検索してもよい。丸め処理とは、入力側中間層データ（Ｘ）が属する集合をＵとしたときに、集合Ｕに属する特定の入力側中間層データにつき同じ値（Ｘ＿ｕ））（代表値）を持つものとみなす処理である。例えば、入力側中間層データ（Ｘ）の一部のノード値（ニューロン発火値）につき、数値の切り上げ又は切り下げ処理等を行って整数値に離散化させ複数の整数値の集合を形成してもよい。このような構成によれば、過去に得られたハッシュ値との一致性を向上させ、処理の高速化等を実現することができる。

　上述の実施形態においては、クライアント装置としてのロボット７は中間サーバ６又はサーバ１との間で直接通信する構成とした。しかしながら、このような構成に限定されない。図２７は、変形例に係るシステム４０の全体構成図である。同構成においてはシステム４０は、予測処理を行うサーバ２と、サーバ２とＷＡＮを介して接続され、かつ、ＬＡＮに接続された仲介サーバ８と、ＬＡＮに接続されたクライアント装置としてのロボット９とから構成されている。本変形例においては、サーバ２とクライアント装置９との間の情報のやり取りは仲介サーバ８を介して行われることとなる。

　上述の実施形態では、機械学習アルゴリズムとして、ニューラルネットワーク（又はディープラーニング）を用いた教師あり学習を例示した。しかしながら、本発明はそのような構成に限定されない。従って、例えば、他の分割可能であって、同様な形式で中間値を取り扱うことが可能な機械学習アルゴリズムを利用してもよい。また、教師あり学習のみならず、例えば、ＧＡＮ（Ｇｅｎｅｒａｔｉｖｅ　Ａｄｖｅｒｓａｒｉａｌ　Ｎｅｔｗｏｒｋｓ）やＶＡＥ（Ｖａｒｉａｔｉｏｎａｌ　Ａｕｔｏ　Ｅｎｃｏｄｅｒ）、ＳＯＭ（Ｓｅｌｆ－Ｏｒｇａｎｉｚｉｎｇ　Ｍａｐ）等の教師なし学習や、強化学習を利用してもよい。なお、強化学習を行う場合には、例えば、シミュレータ上での予測処理等を利用してもよい。

　上述の実施形態における学習処理においては、近似関数を式５において示した１次方程式により近似することで生成した。しかしながら、近似手法はこのような例に限定されず、他の手法により近似を行ってもよい。

　例えば、近似関数としてバイパス関数を利用してもよい。図２８は、バイパス関数を利用する例に関する概念図である。同図において、Ｈ（ｘ）は、式５等で示された１次方程式による近似関数を表し、Ｊ（ｘ）は、バイパス関数を表し、全体として近似関数を形成している。同図から明らかな通り、バイパス関数であるＪ（ｘ）は、１次方程式による近似関数Ｈ（ｘ）を迂回（バイパス）するように並列的に配置されている。なお、いずれの関数も誤差逆伝播法を適用可能である。

　図２９は、バイパス関数Ｊ（ｘ）の概念図である。同図の例にあっては、入力側中間層のノード数の方が出力側中間層のノード数より大きい場合が示されている。入力側中間層からデータが入力されると、バイパス関数Ｊ（ｘ）は、より少ないノード数（例えば、入力側中間層のノード数の半分程度）のプーリング層によりデータ圧縮を行う。その後、プーリング層におけるノード出力は、出力側中間層へと提供される。このとき、プーリング層から出力側中間層への結合が存在しないノードに対してはゼロ（０）が提供される（ゼロパディング）。

　例えば、入力側中間層のノード数ｎ＿ｘが３２個、出力側中間層のノード数ｎ＿ｚが２０個の場合、プーリング層のノード数は入力側中間層のノード数ｎ＿ｘの半分の１６個となる。このとき、プーリング手法としては、隣り合うノード値との平均を採る平均プーリング等を利用することができる。その後、プーリング層からの１６個の出力は出力側中間層へと提供される。このとき、プーリング層のノードと対応付かない４個の出力側中間層のノードに対しては、ゼロ（０）が提供される。なお、本変形例ではプーリング層を利用しているが、必ずしもプーリング層を利用する必要はなく、例えば、そのままデータを素通りさせる迂回路を形成してもよい。

　このような構成によれば、キャッシュテーブルに基づいて生成される近似関数を迂回することで誤差逆伝播が促進され、その結果、学習の効率化を行うことができる。

　また、例えば、近似関数として、複数のサブ近似関数の和を用いてもよい。図３０は、サブ近似関数の和を利用した近似の概念図である。同図から明らかな通り、近似関数の出力は、複数の異なる近似関数Ｋ＿１（ｘ）、Ｋ＿２（ｘ）、Ｋ＿３（ｘ）、・・・Ｋ＿ｎ（ｘ）（以下、便宜上、これらの関数をサブ近似関数と呼ぶ）にそれぞれ寄与係数ａ＿１、ａ＿２、ａ＿３、・・・ａ＿ｎを掛け合わせた値の総和（重み付き和）となる。なお、このとき、寄与係数ａ＿ｉ（ｉ＝１、２、・・・ｎ）はそれぞれ０以上１以下の値をとり、ａ＿ｉの総和は１、すなわち、ａ＿１＋ａ＿２＋・・・＋ａ＿ｎ＝１となる。この寄与係数は固定値であってもよいし、順方向演算や誤差逆伝播の度に異なる値を与える等変動させてもよい。各サブ近似関数は、キャッシュテーブルに基づいて生成される近似関数であり、ニューラルネットワークや上述の実施形態において利用した１次方程式による近似関数等である。なお、いずれのサブ近似関数も誤差逆伝播法を適用可能に構成されている。

　このような構成によれば、近似関数前後の階層とのアンサンブル効果により近似精度の向上が見込まれ、その結果、キャッシュテーブルにおけるデータ蓄積が不十分な場合であっても近似精度の維持又は向上を見込むことができる。

　上述の実施形態においては、ロボット、中間サーバ、最終サーバ等はすべての単一の装置として例示した。しかしながら、本発明はそのような構成に限定されない。従って、例えば、装置構成の一部を外部装置として別に設けてもよい。例えば、外部の大容量記憶ストレージを設置しサーバ等の装置と接続してもよい。また、単一の装置でなく、複数の装置を用いて分散処理等を行ってもよい。さらに、仮想化技術等を用いてもよい。

　上述の実施形態においては、一つのクライアント装置が１つのハッシュテーブルを保持するものとしたが、本発明はこのような構成に限定されない。従って、例えば、複数のクライアント装置間でハッシュテーブルを共有してもよい。これにより、各クライアント装置においてそれぞれ行われた予測処理のキャッシュが共有のものとして蓄積されていくので、より迅速に、サーバ利用コストの低減、処理の高速化、クライアント装置の自律的な動作などを実現することができる。なお、ハッシュテーブルの共有は、例えば、図２７のシステムにおける仲介サーバ８を用いて行われてもよいし、分散ハッシュテーブル等の技術を用いてサーバ等を介さずに直接各クライアント装置間で互いに情報の照会をすることにより行われてもよい。

　上述の実施形態においては学習処理を逐次的に行う例を示したが、このような構成に限定されない。従って、例えば、複数の入出力対に対応する誤差を一定程度蓄積させた後にバッチ的にパラメータ更新を行うような構成としてもよい。また、予測処理と平行して学習処理を行うような所謂オンライン学習を行ってもよい。

　上述の実施形態においては、クライアント装置としてロボットを例示した。しかしながら、本発明はこのような構成に限定されない。クライアント装置は、物理的動作を伴うかを問わず、あらゆる装置を含むものとして解釈されるべきである。例えば、クライアント装置には、スマートフォン、タブレット端末、パーソナルコンピュータ、スマートスピーカ、ウェアラブル端末などあらゆる情報処理装置を含むことに留意されたい。

　上述の実施形態においては、ロボットの動作情報（センサ信号やモータ信号）を学習対象としたが本発明はこのような構成に限定されない。従って、例えば、学習対象データは、撮像信号、音声信号、画像信号、動画像信号、言語情報、文字情報などあらゆる情報を含み、例えば、音声認識処理、画像信号処理、自然言語処理等など様々な目的の処理を行ってもよい。

　上述の実施形態においては、クライアント装置は、入力側中間層（Ｘ）と出力側中間層（Ｚ）との間の演算をサーバ側に演算させる構成としているものの、本発明はこのような構成に限定されない。従って、例えば、クライアント装置も所定の分割された中間層を一部保持し、複数回、サーバと部分的な予測結果の送受信を行うことで予測処理を行ってもよい。

　上述の実施形態においては、誤差逆伝播法により逆伝播された誤差に基づいて学習モデルのうち近似関数を除いた部分について重み等のパラメータ更新処理を行った（例えば、Ｓ１１５、Ｓ１５７など）。しかしながら、本発明はこのような構成に限定されない。従って、例えば、近似関数部分のパラメータについても更新処理を行ってもよい。

　本発明は、機械学習技術を利用するすべての産業において利用可能である。

１　　サーバ
３　　ロボット
５　　最終サーバ
６　　中間サーバ
７　　ロボット
８　　仲介サーバ
１０　　システム

Claims

　機械学習モデルの学習装置であって、
　前記機械学習モデルは、
　　前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、
　　前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、
　前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部と、
　前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成部と、
　前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成部と、
　前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新部と、を備える学習装置。
　前記パラメータ更新部は、
　前記近似出力と、前記学習用入力データに対応する教師データとの誤差を演算する誤差演算部と、
　前記誤差を、前記出力側変換処理部、前記近似関数、及び前記入力側変換処理部へと逆伝播する誤差逆伝播部と、
　前記誤差逆伝播部にて伝播した前記誤差に基づいて、前記出力側変換処理部と前記入力側変換処理部のパラメータを更新する教師あり学習用パラメータ更新部と、を備える請求項１に記載の学習装置。
　前記学習用入力データに基づく前記第１の中間出力と、前記学習用入力データに基づく前記第２の中間出力との対応関係を学習用入出力テーブルとして記憶する、請求項２に記載の学習装置。
　前記学習装置は、さらに、
　前記学習用入出力テーブルを外部装置へと送信するテーブル送信部を備える、請求項３に記載の学習装置。
　前記外部装置において、前記学習用入出力テーブルに基づいて教師有り学習が行われる、請求項４に記載の学習装置。
　前記外部装置は、前記第１の中間出力に基づいて前記学習装置へと前記第２の中間出力を提供する、請求項４に記載の学習装置。
　前記中間出力対応テーブルは、前記機械学習モデルにおいて予測処理を行うことにより生成されたものである、請求項１に記載の学習装置。
　前記近似関数は、誤差逆伝播法が適用可能な関数である、請求項１に記載の学習装置。
　前記機械学習モデルは、階層型の人工ニューラルネットワークである、請求項１に記載の学習装置。
　前記パラメータ更新部は、さらに、
　前記近似出力に基づいて前記近似関数のパラメータを更新する、近似関数パラメータ更新部を備える、請求項１に記載の学習装置。
　前記近似関数は、バイパス関数を含むものである、請求項１に記載の変換システム。
　前記近似関数は、複数の異なる近似関数の重み付き和により構成される、請求項１に記載の変換システム。
　学習装置を用いた機械学習モデルの学習方法であって、
　前記機械学習モデルは、
　　前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、
　　前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、
　前記学習装置は、
　前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部を備え、
　前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成ステップと、
　前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成ステップと、
　前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新ステップと、を備える学習方法。
　学習装置上での機械学習モデルの学習プログラムであって、
　前記機械学習モデルは、
　　前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、
　　前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、
　前記学習装置は、
　前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部を備え、
　前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成ステップと、
　前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成ステップと、
　前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新ステップと、を備える学習プログラム。
　機械学習モデルの学習システムであって、
　前記機械学習モデルは、
　　前記機械学習モデルの入力段階から第１の中間段階へと至る前記機械学習モデルの一部であって、前記機械学習モデルへの入力データに基づいて変換処理を行うことにより前記機械学習モデルの前記第１の中間段階における第１の中間出力を生成する、入力側変換処理部と、
　　前記第１の中間段階より出力側に近い第２の中間段階から出力段階へと至る前記機械学習モデルの一部であって、第２の中間段階に対する入力に基づいて変換処理を行うことにより前記機械学習モデルの出力データを生成する、出力側変換処理部と、を備え、
　前記機械学習モデルにおける前記第１の中間出力と前記第２の中間出力との対応関係を表す中間出力対応テーブルを記憶する中間出力対応テーブル記憶部と、
　前記中間出力対応テーブルに基づいて、前記第１の中間出力を入力として前記第２の中間出力を生成する関数の近似関数を生成する近似関数生成部と、
　前記入力側変換処理部、前記近似関数、及び前記出力側変換処理部に基づいて、学習用入力データに基づく近似出力を生成する、近似出力生成部と、
　前記近似出力に基づいて前記出力側変換処理部と前記入力側変換処理部のパラメータを更新するパラメータ更新部と、を備える学習システム。