JP2019159693A

JP2019159693A - 情報処理装置、情報処理端末、及びプログラム

Info

Publication number: JP2019159693A
Application number: JP2018044447A
Authority: JP
Inventors: 和之田坂; Kazuyuki Tasaka; 茂之酒澤; Shigeyuki Sakasawa; 絵美明堂; Emi Meido
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2018-03-12
Filing date: 2018-03-12
Publication date: 2019-09-19
Anticipated expiration: 2038-03-12
Also published as: JP6901423B2

Abstract

【課題】異なる正答率の学習モデルを提供する。【解決手段】情報処理装置１において、機械学習部１１０は、目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成する。パラメータ改変部１１１は、モデルパラメータの一部を改変した改変パラメータを生成する。正答率算出部１１２は、改変パラメータにおけるテスト用入力データの正答率を算出する。記憶部１０は、パラメータ改変部１１１に改変させるモデルパラメータの改変パターン毎に、正答率算出部１１２が算出した正答率を紐づけて記憶する。【選択図】図２

Description

本発明は、情報処理装置、情報処理端末、及びプログラムに関し、特に、ニューラルネットワークの正答率を調整する技術に関する。

近年、ＣＰＵ（Central Processing Unit）及びＧＰＵ（Graphics Processing Unit）の高速化、メモリの大容量化、及びニューラルネットワークを用いた機械学習技術が急速に進んできている。このため、数十万から百万といったオーダーの学習データを用いる機械学習が可能となり、精度の高い識別技術や分類技術が確立されつつある（非特許文献１参照）。

Yangqing Jia, Evan Shelhamer, Jeff Donahue, Sergey Karayev, Jonathan Long, Ross Girshick, Sergio Guadarrama, and Trevor Darrell. Caffe: Convolutional architecture for fast feature embedding. In Proceedings of the 22nd ACM international conference on Multimedia (pp. 675-678). ACM.

大量の学習データに基づく機械学習を実行するためには大量の計算コストがかかる。また、大量の学習データを用意すること、及び用意した学習データを機械学習に用いるためにする前処理にも膨大な労力を要する。学習モデルを生成したモデル作成者がその学習モデルを第三者に利用させることで利益を得ようとする場合に、利用者に請求する対価に応じて学習モデルの性能を変えられると便利である。

本発明はこれらの点に鑑みてなされたものであり、異なる正答率の学習モデルを提供することを目的とする。

本発明の第１の態様は、情報処理装置である。この装置は、目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成する機械学習部と、前記モデルパラメータの一部を改変した改変パラメータを生成するパラメータ改変部と、前記改変パラメータにおけるテスト用入力データの正答率を算出する正答率算出部と、前記パラメータ改変部に改変させるモデルパラメータの改変パターン毎に、前記正答率算出部が算出した正答率を紐づけて記憶する記憶部と、を備える。

前記パラメータ改変部は、前記ニューラルネットワークを構成する複数の層のうち、前記モデルパラメータを改変するための層を選択する選択部と、前記選択部が選択した層のモデルパラメータを所定の値に置換する置換部と、置換後の前記正答率と、前記モデルパラメータの改変の目標とする目標正答率とを比較する比較部と、（１）前記正答率が前記目標正答率よりも高い場合、前記選択部に選択した層よりも入力層側の層を再選択させ、（２）前記正答率が前記目標正答率よりも低い場合、前記選択部に前記選択した層よりも出力層側の層を再選択させ、（３）前記正答率と前記目標正答率との差が所定の範囲に収まる場合、前記置換部が置換したモデルパラメータを改変パラメータとして出力する改変制御部と、を備えてもよい。

前記情報処理装置は、前記情報処理装置とは異なる情報処理端末から当該情報処理端末のユーザに許可されている正答率を取得する許可正答率取得部と、前記記憶部が記憶している正答率のうち、前記許可正答率取得部が取得した正答率に類似する正答率に対応する改変パターンを選択する改変パターン選択部と、選択された前記改変パターンに基づいて改変された前記モデルパラメータを、通信ネットワークを介して前記情報処理端末に送信するモデルパラメータ送信部と、をさらに備えてもよい。

前記情報処理装置は、通信ネットワークを介して前記情報処理装置とは異なる情報処理端末から前記ニューラルネットワークに入力するタスクデータを取得するタスクデータ取得部と、前記パラメータ改変部による改変がなされていない前記モデルパラメータに前記タスクデータを入力した結果を取得する検出実行部と、前記通信ネットワークを介して前記検出実行部が取得した結果を前記情報処理端末に送信する結果送信部と、をさらに備えてもよい。

本発明の第２の態様は、情報処理端末である。この端末は、目的タスクを検出するために生成されたニューラルネットワークに関するモデルパラメータであって、前記目的タスクの正答率が高い方の第１モデルパラメータと、前記第１モデルパラメータよりも前記目的タスクの正答率が低い第２モデルパラメータと、の２つのモデルパラメータを取得するモデルパラメータ取得部と、前記２つのモデルパラメータのうち、前記第１モデルパラメータの使用回数の上限値を取得する利用制限数取得部と、前記第１モデルパラメータと前記第２モデルパラメータとのいずれか一方のモデルパラメータに検出対象のタスクデータを入力した結果を取得する検出実行部と、前記検出実行部による前記第１モデルパラメータの使用回数が前記上限値を下回る場合前記第１モデルパラメータを選択し、前記使用回数が前記上限値に到達した場合前記第２モデルパラメータを選択するモデルパラメータ選択部と、を備える。ここで、前記検出実行部は、前記モデルパラメータ選択部が選択したモデルパラメータを用いて、タスクデータの出力結果を取得する。

本発明の第３の態様は、プログラムである。このプログラムは、コンピュータに、目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成させる機能と、前記モデルパラメータの一部を改変した改変パラメータを生成させる機能と、前記改変パラメータにおけるテスト用入力データの正答率を算出させる機能と、改変するモデルパラメータの改変パターン毎に、前記算出した正答率を紐づけて記憶部に記憶させる機能と、を実現させる。

本発明の第４の態様も、プログラムである。このプログラムは、コンピュータに、目的タスクを検出するために生成されたニューラルネットワークに関するモデルパラメータであって、前記目的タスクの正答率が高い方の第１モデルパラメータと、前記第１モデルパラメータよりも前記目的タスクの正答率が低い第２モデルパラメータと、の２つのモデルパラメータを取得する機能と、前記２つのモデルパラメータのうち、前記第１モデルパラメータの使用回数の上限値を取得する機能と、前記第１モデルパラメータの使用回数の累積が前記上限値を下回る場合前記第１モデルパラメータを選択し、前記使用回数の累積が前記上限値に到達した場合前記第２モデルパラメータを選択する機能と、選択されたモデルパラメータを用いて、タスクデータの出力結果を取得する機能と、を実現させる。

本発明によれば、異なる正答率の学習モデルを提供することができる。

実施の形態に係るニューラルネットワークの構成を模式的に示す図である。実施の形態に係る情報処理装置の機能構成を模式的に示す図である。実施の形態に係るパラメータ変更部の内部構成を模式的に示す図である。実施の形態に係る改変パターンデータベースのデータ構造を模式的に示す図である。実施の形態に係る情報処理システムの全体構成を模式的に示す図である。実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。変形例に係る情報処理端末の機能構成を模式的に示す図である。

＜実施の形態の概要＞
図１は、実施の形態に係るニューラルネットワークの構成を模式的に示す図である。以下、図１を参照して、実施の形態の概要を述べる。

実施の形態に係る情報処理装置が利用するニューラルネットワークは、全体としては、入力層、中間層、及び出力層を含む一般的な構成である。図１の上段に示すように、実施の形態に係る情報処理装置は、入力層に入力した基本学習用データが中間層を伝搬し、最終的に出力層が出力したデータ列と、基本学習用データに対応する正解ラベルとの誤差を損失関数を用いて算出する。情報処理装置は、算出した誤差に基づいて、誤差逆伝搬法を用いて中間層に設定された重みを更新する。

実施の形態に係る情報処理装置が利用するニューラルネットワークは、中間層の一部が改変されている。具体的には、図１の下段に示すように、中間層の中から選択された層である改変対象層において、一部のノードが除去されている。図１の下段において、白丸はニューラルネットワークにおける通常のノードであり、黒丸は除去されたノードである。

ニューラルネットワークは、中間層の各ノードの出力を隣接する層に伝搬していくことで最終的な識別精度を達成するように設計されている。したがって、ノードを除去することは各ノード間のつながりを断ち切ることになるため、学習モデルの正答率を下げることになる。

なお、ノードを除去することは、そのノードの出力を次のノードに入力する際に乗じられる係数、すなわち学習モデルのモデルパラメータの値を０に改変することと等価である。ノードを除去することは、モデルパラメータの複雑さを下げることになるため、しばしば学習モデルの圧縮にも用いられる。例えば、ＩｏＴ（Internet Of Things）機器のように計算リソースの乏しいデバイスで学習モデルを実行する場合には、ノードを除去してサイズを小さくした学習モデルが用いられることがある。

実施の形態に係る情報処理装置は、モデルパラメータに施す改変パターンを変更しながら、その学習モデルの正答率を算出する。情報処理装置は、モデルパラメータに施す改変パターンと正答率とを紐づけて保持しておく。これにより、実施の形態に係る情報処理装置１は、異なる正答率の学習モデルを提供することができる。

＜情報処理装置１の機能構成＞
図２は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部１０と制御部１１とを備える。

記憶部１０は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部１１は、情報処理装置１のＣＰＵやＧＰＵ等のプロセッサであり、記憶部１０に記憶されたプログラムを実行することによって機械学習部１１０、パラメータ改変部１１１、正答率算出部１１２、許可正答率取得部１１３、改変パターン選択部１１４、モデルパラメータ送信部１１５、タスクデータ取得部１１６、検出実行部１１７、及び結果送信部１１８として機能する。

なお、図２は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部１１を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

機械学習部１１０は、目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成する。機械学習部１１０は、生成したモデルパラメータを記憶部１０に記憶させる。

パラメータ改変部１１１は、機械学習部１１０が生成したモデルパラメータの一部を改変した改変パラメータを生成する。具体的には、パラメータ改変部１１１は、ニューラルネットワークのモデルパラメータを構成する重み係数の一部を別の値に置換することによって得られる新たなモデルパラメータを改変パラメータとして生成する。パラメータ改変部１１１が重み係数を置換する値は、元のモデルパラメータと異なればどのような値でもよいが、一例としては０である。

正答率算出部１１２は、パラメータ改変部１１１が生成した改変パラメータにおけるテスト用入力データの正答率を算出する。ここで「テスト用入力データ」とは、モデルパラメータの正答率を測定するために用意された固定のデータセットである。正答率算出部１１２は、同一のテスト用入力データを用いて改変パラメータの正答率を算出するため、異なる改変パラメータの正答率を同じ条件下で算出することができる。

記憶部１０は、パラメータ改変部１１１に改変させるモデルパラメータの改変パターン毎に、正答率算出部１１２が算出した正答率を紐づけて記憶する。これにより、実施の形態に係る情報処理装置１は、異なる正答率の学習モデルを提供することができる。

図３は、実施の形態に係るパラメータ改変部１１１の内部構成を模式的に示す図である。実施の形態に係るパラメータ改変部１１１は、選択部１１１０、置換部１１１１、比較部１１１２、及び改変制御部１１１３を含む。

選択部１１１０は、ニューラルネットワークを構成する複数の層のうち、モデルパラメータを改変するための層を選択する。置換部１１１１は、選択部１１１０が選択した層のモデルパラメータを所定の値に置換する。比較部１１１２は、置換部１１１１による置換後の正答率と、モデルパラメータの改変の目標とする目標正答率とを比較する。

改変制御部１１１３は、正答率が目標正答率よりも高い場合、選択部１１１０に、選択した層よりも入力層側の層を再選択させる。一般に、ニューラルネットワークにおいては、入力層に近い層のほうが、入力層から遠い層よりも、正答率に大きく影響することが知られている。改変制御部１１１３は、パラメータの改変対象とする改変対象層を入力層に近づけることにより、置換部１１１１による置換後の正答率を下げることができる。

改変制御部１１１３は、正答率が前記目標正答率よりも低い場合、選択部１１１０に、選択した層よりも出力層側の層を再選択させる。上記と同様の理由により、改変制御部１１１３は、改変対象層を入力層から遠ざける（すなわち、出力層側に移動する）ことにより、置換部１１１１による置換後の正答率を上げることができる。

さらに、改変制御部１１１３は、正答率と目標正答率との差が所定の範囲に収まる場合、置換部１１１１が置換したモデルパラメータを改変パラメータとして出力する。ここで「所定の範囲」とは、パラメータ改変部１１１がパラメータ改変の目標とする目標正答率との誤差の許容範囲を定める際に参照する「目標正答率誤差許容範囲」である。所定の範囲の具体的な値は正答率の調整の難易度等を勘案して実験により定めればよいが、例えば、目標正答率の前後２％の範囲である。

以上の動作を複数の目標正答率について繰り返すことにより、パラメータ改変部１１１は、複数種類の正答率毎に改変パターンを生成することができる。

図４は、実施の形態に係る改変パターンデータベースのデータ構造を模式的に示す図である。改変パターンデータベースは記憶部１０が保持しており、パラメータ改変部１１１によって管理される。

図４に示すように、改変パターンデータベースは、複数の正答率毎に、パラメータの置換場所、置換前のパラメータの値、及び置換前のモデルサイズに対する置換後のモデルサイズの百分率を対応付けて記憶している。例えば、図４において、正答率が９０％のモデルは、第５層の４番目のノードと、同じく第５層の８番目のノードとが少なくとも置換されている。また、置換前のモデルサイズに対する置換後のモデルサイズは７０％となっており、３０％圧縮されている。

図２の説明に戻る。実施の形態に係る情報処理装置１は、生成した学習モデルを第三者であるユーザに利用させることができる。このとき、情報処理装置１は、ユーザが支払う対価に応じて、そのユーザが利用できる学習モデルの正答率を変更する。

そこで、許可正答率取得部１１３は、通信ネットワークＮを介して情報処理装置１と接続する情報処理端末２に許可されている正答率を取得する。具体的には、許可正答率取得部１１３は、情報処理端末２を識別するための端末識別子と情報処理端末２に許可されている正答率とを紐づけて格納する正答率データベース（不図示）を参照して、情報処理端末２に許可されている正答率を取得する。あるいは、許可正答率取得部１１３は、情報処理装置１に接続する情報処理端末２の内部ストレージに記憶されている正答率を情報処理端末２から受信して取得するようにしてもよい。

改変パターン選択部１１４は、記憶部１０が記憶している正答率のうち、許可正答率取得部１１３が取得した正答率に類似する正答率に対応する改変パターンを選択する。ここで「許可正答率取得部１１３が取得した正答率に類似する正答率」とは、記憶部１０が記憶している正答率のうち許可正答率取得部１１３が取得した正答率以上の正答率であって、許可正答率取得部１１３が取得した正答率と最も近い正答率のことをいう。

モデルパラメータ送信部１１５は、改変パターン選択部１１４が選択した改変パターンに基づいて改変されたモデルパラメータを、通信ネットワークＮを介して情報処理端末２に送信する。これにより、情報処理端末２は、取得したモデルパラメータを用いて自身の端末上で学習モデルを実行し、目的タスクを実現することができる。言い換えると、情報処理端末２は、ひとたび情報処理装置１からモデルパラメータを取得したのちは、情報処理装置１と接続していなくても、オフラインで目的タスクを実行することができる。

上述したように、正答率が低く設定されたモデルパラメータは、正答率が高いモデルパラメータよりも、モデルパラメータのサイズが小さくなる傾向がある。このため、情報処理端末２の計算リソースが少ない場合であっても、正答率が低く設定されたモデルパラメータであれば実行できる場合がある。計算リソースが少ない機器でも実行できるという意味においても、モデルパラメータの正答率を低く設定することには意味がある。

一方、計算リソースが低い機器であっても、通信ネットワークＮを介して情報処理装置１と通信できる場合には、モデルパラメータの演算の一部を情報処理装置１に肩代わりさせることにより、正答率が高いモデルパラメータ（すなわち、実行時の計算負荷が大きいモデルパラメータ）を用いて目的タスクを実現することもできる。

そこで、情報処理装置１は、通信ネットワークＮを介して情報処理装置１とは異なる情報処理端末２からニューラルネットワークのモデルパラメータに入力するタスクデータを取得するタスクデータ取得部１１６を備える。検出実行部１１７は、パラメータ改変部１１１による改変がなされていないモデルパラメータにタスクデータ取得部１１６が取得したタスクデータを入力した結果を取得する。結果送信部１１８は、通信ネットワークＮを介して検出実行部１１７が取得した結果を情報処理端末２に送信する。これにより、情報処理端末２は、通信ネットワークＮを利用して情報処理装置１と通信できるという条件の下では、実行時の計算負荷が大きい高正答率のモデルパラメータを用いて目的タスクを実行することができる。

図５は、実施の形態に係る情報処理システムＳの全体構成を模式的に示す図である。図５に示すように、実施の形態に係る情報処理システムＳは、通信ネットワークＮを介して互いに通信可能な態様で接続する情報処理装置１と情報処理端末２とを含む。情報処理装置１は、中間層の一部を改変して正答率を下げた学習モデルを情報処理端末２に提供している。この場合、情報処理端末２がローカルな環境で学習モデルを実行する場合には、正答率が低下した学習モデルを実行することになる。

情報処理端末２は、情報処理装置１から入力ＡＰＩ（Application Program Interface）と出力ＡＰＩとの提供を受けている。情報処理端末２は、入力ＡＰＩを利用することにより、通信ネットワークＮを介して処理対象とするデータを情報処理装置１に送信することができる。また、情報処理端末２は、出力ＡＰＩを利用することにより、通信ネットワークＮを介して情報処理装置１から学習モデルの実行結果を受信することができる。これにより、情報処理端末２は、目的タスクに求められる正答率や情報処理端末２の置かれた通信環境に応じて、オンラインによる高性能な学習モデルと、オフラインによる低負荷な学習モデルとを選択できる。

＜実施の形態に係る情報処理装置１が実行する情報処理の処理フロー＞
図６は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

機械学習部１１０は、目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成する（Ｓ２）。パラメータ改変部１１１は、機械学習部１１０が生成したモデルパラメータの一部を改変した改変パラメータを生成する（Ｓ４）。正答率算出部１１２は、パラメータ改変部１１１が改変した改変パラメータにおけるテスト用入力データの正答率を算出する（Ｓ６）。記憶部１０は、パラメータ改変部１１１に改変させるモデルパラメータの改変パターン毎に、正答率算出部１１２が算出した正答率を紐づけて記憶する（Ｓ８）。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、異なる正答率の学習モデルを提供することができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。

＜変形例＞
上記では、情報処理端末２は、オンラインでは正答率の高い学習モデルを実行し、オフラインでは正答率が低く設定された学習モデルを実行する場合について説明した。しかしながら、例えば情報処理端末２の計算リソースが十分にあり、情報処理端末２のみで正答率が高く計算負荷の大きい学習モデルを実行できる場合には、情報処理装置１は、情報処理端末２にフルサイズの学習モデルを提供してもよい。

一方で、情報処理装置１が、情報処理端末２によるフルサイズの学習モデルの実行を無制限で許可すると、学習モデルを第三者に利用させることによって情報処理装置１の管理者が得られる利益が損なわれかねない。

そこで、情報処理装置１は、情報処理端末２によるフルサイズの学習モデルの実行に制限を課してもよい。以下、情報処理端末２に課されるフルサイズの学習モデルの実行制限についてより詳細に説明する。

図７は、変形例に係る情報処理端末２の機能構成を模式的に示す図である。変形例に係る情報処理端末２は、記憶部２０と制御部２１とを備える。

記憶部２０は、情報処理端末２を実現するコンピュータのＢＩＯＳ等を格納するＲＯＭや情報処理装置１の作業領域となるＲＡＭ、ＯＳやアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するＨＤＤやＳＳＤ等の大容量記憶装置である。

制御部２１は、情報処理端末２のＣＰＵやＧＰＵ等のプロセッサであり、記憶部２０に記憶されたプログラムを実行することによってモデルパラメータ取得部２１０、利用制限数取得部２１１、検出実行部２１２、及びモデルパラメータ選択部２１３として機能する。

モデルパラメータ取得部２１０は、目的タスクを検出するために生成されたニューラルネットワークに関するモデルパラメータであって、目的タスクの正答率が高い方の第１モデルパラメータと、第１モデルパラメータよりも目的タスクの正答率が低い第２モデルパラメータと、の２つのモデルパラメータを取得する。モデルパラメータ取得部２１０は、例えば、第１モデルパラメータとして、パラメータ改変部１１１による改変がなされていないモデルパラメータを取得する。

利用制限数取得部２１１は、モデルパラメータ取得部２１０が取得した２つのモデルパラメータのうち、第１モデルパラメータの使用回数の上限値を情報処理装置１から取得する。第１モデルパラメータの使用回数の上限値は、例えば情報処理端末２のユーザが情報処理装置１に支払った対価に応じて設定される。

検出実行部２１２は、第１モデルパラメータと第２モデルパラメータとのいずれか一方のモデルパラメータに検出対象のタスクデータを入力した結果を取得する。具体的には、検出実行部２１２は、モデルパラメータ選択部２１３が選択したモデルパラメータを用いて、タスクデータの出力結果を取得する。

モデルパラメータ選択部２１３は、検出実行部２１２による第１モデルパラメータの使用回数が情報処理装置１から取得した上限値を下回る場合、第１モデルパラメータを選択する。また、モデルパラメータ選択部２１３は、検出実行部２１２による第１モデルパラメータの使用回数が上限値に到達した場合、第２モデルパラメータを選択する。これにより、情報処理端末２は、情報処理装置１によって許可された使用回数の上限値に至るまでは、正答率の高いモデルパラメータを用いて目的タスクを実行することができる。

１・・・情報処理装置
１０・・・記憶部
１１・・・制御部
１１０・・・機械学習部
１１１・・・パラメータ改変部
１１１０・・・選択部
１１１１・・・置換部
１１１２・・・比較部
１１１３・・・改変制御部
１１２・・・正答率算出部
１１３・・・許可正答率取得部
１１４・・・改変パターン選択部
１１５・・・モデルパラメータ送信部
１１６・・・タスクデータ取得部
１１７・・・検出実行部
１１８・・・結果送信部
２・・・情報処理端末
２０・・・記憶部
２１・・・制御部
２１０・・・モデルパラメータ取得部
２１１・・・利用制限数取得部
２１２・・・検出実行部
２１３・・・モデルパラメータ選択部
Ｓ・・・情報処理システム
Ｎ・・・通信ネットワーク

Claims

目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成する機械学習部と、
前記モデルパラメータの一部を改変した改変パラメータを生成するパラメータ改変部と、
前記改変パラメータにおけるテスト用入力データの正答率を算出する正答率算出部と、
前記パラメータ改変部に改変させるモデルパラメータの改変パターン毎に、前記正答率算出部が算出した正答率を紐づけて記憶する記憶部と、
を備える情報処理装置。
前記パラメータ改変部は、
前記ニューラルネットワークを構成する複数の層のうち、前記モデルパラメータを改変するための層を選択する選択部と、
前記選択部が選択した層のモデルパラメータを所定の値に置換する置換部と、
置換後の前記正答率と、前記モデルパラメータの改変の目標とする目標正答率とを比較する比較部と、
（１）前記正答率が前記目標正答率よりも高い場合、前記選択部に選択した層よりも入力層側の層を再選択させ、（２）前記正答率が前記目標正答率よりも低い場合、前記選択部に前記選択した層よりも出力層側の層を再選択させ、（３）前記正答率と前記目標正答率との差が所定の範囲に収まる場合、前記置換部が置換したモデルパラメータを改変パラメータとして出力する改変制御部と、
を備える請求項１に記載の情報処理装置。
前記情報処理装置とは異なる情報処理端末から当該情報処理端末のユーザに許可されている正答率を取得する許可正答率取得部と、
前記記憶部が記憶している正答率のうち、前記許可正答率取得部が取得した正答率に類似する正答率に対応する改変パターンを選択する改変パターン選択部と、
選択された前記改変パターンに基づいて改変された前記モデルパラメータを、通信ネットワークを介して前記情報処理端末に送信するモデルパラメータ送信部と、
をさらに備える請求項１又は２に記載の情報処理装置。
通信ネットワークを介して前記情報処理装置とは異なる情報処理端末から前記ニューラルネットワークに入力するタスクデータを取得するタスクデータ取得部と、
前記パラメータ改変部による改変がなされていない前記モデルパラメータに前記タスクデータを入力した結果を取得する検出実行部と、
前記通信ネットワークを介して前記検出実行部が取得した結果を前記情報処理端末に送信する結果送信部と、
をさらに備える請求項１から３のいずれか１項に記載の情報処理装置。
目的タスクを検出するために生成されたニューラルネットワークに関するモデルパラメータであって、前記目的タスクの正答率が高い方の第１モデルパラメータと、前記第１モデルパラメータよりも前記目的タスクの正答率が低い第２モデルパラメータと、の２つのモデルパラメータを取得するモデルパラメータ取得部と、
前記２つのモデルパラメータのうち、前記第１モデルパラメータの使用回数の上限値を取得する利用制限数取得部と、
前記第１モデルパラメータと前記第２モデルパラメータとのいずれか一方のモデルパラメータに検出対象のタスクデータを入力した結果を取得する検出実行部と、
前記検出実行部による前記第１モデルパラメータの使用回数が前記上限値を下回る場合前記第１モデルパラメータを選択し、前記使用回数が前記上限値に到達した場合前記第２モデルパラメータを選択するモデルパラメータ選択部と、を備え、
前記検出実行部は、前記モデルパラメータ選択部が選択したモデルパラメータを用いて、タスクデータの出力結果を取得する、
情報処理端末。
コンピュータに、
目的タスクを検出するためのニューラルネットワークのモデルパラメータを生成させる機能と、
前記モデルパラメータの一部を改変した改変パラメータを生成させる機能と、
前記改変パラメータにおけるテスト用入力データの正答率を算出させる機能と、
改変するモデルパラメータの改変パターン毎に、前記算出した正答率を紐づけて記憶部に記憶させる機能と、
を実現させるプログラム。
コンピュータに、
目的タスクを検出するために生成されたニューラルネットワークに関するモデルパラメータであって、前記目的タスクの正答率が高い方の第１モデルパラメータと、前記第１モデルパラメータよりも前記目的タスクの正答率が低い第２モデルパラメータと、の２つのモデルパラメータを取得する機能と、
前記２つのモデルパラメータのうち、前記第１モデルパラメータの使用回数の上限値を取得する機能と、
前記第１モデルパラメータの使用回数の累積が前記上限値を下回る場合前記第１モデルパラメータを選択し、前記使用回数の累積が前記上限値に到達した場合前記第２モデルパラメータを選択する機能と、
選択されたモデルパラメータを用いて、タスクデータの出力結果を取得する機能と、
を実現させるプログラム。