JP7107340B2

JP7107340B2 - 学習装置、学習方法およびプログラム

Info

Publication number: JP7107340B2
Application number: JP2020146624A
Authority: JP
Inventors: 恭史国定; 素子加賀谷; 蔵人前野
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2020-09-01
Filing date: 2020-09-01
Publication date: 2022-07-27
Anticipated expiration: 2040-09-01
Also published as: JP2022041434A

Description

本発明は、学習装置、学習方法およびプログラムに関する。

ニューラルネットワーク（以下、「ＮＮ」とも表記する。）は、画像認識などにおいて高い性能を有する。しかし、一般的にＮＮは、膨大なパラメータと複雑なモデルとによって構成されており、ＮＮのパラメータとＮＮからの出力結果との関係を解釈することが難しい。そのため、ＮＮのパラメータを人手で修正し、ＮＮの精度を向上させることが困難であるという課題がある。かかる課題を解決するため、ＮＮの構造を工夫することによって、人手によるＮＮのパラメータ修正を可能とする各種の技術が提案されている。

例えば、入力データのうちＮＮが判断のために注目する領域を抽出する機構をＮＮ内に導入する技術が開示されている（例えば、非特許文献１及び非特許文献２など）。かかる技術においては、学習済みのＮＮの注目領域を人間が修正し、修正した注目領域とＮＮの注目領域とが一致するように、ＮＮに再学習を行わせることによって、ＮＮの精度を向上させることができる。

Drew Linsley、他3名、"LEARNING WHAT AND WHERE TO ATTEND"、[online]、［令和2年6月26日検索］、インターネット＜https://arxiv.org/abs/1805.08819＞ Masahiro Mitsuhara、他6名、" Embedding Human Knowledge into Deep NeuralNetwork via Attention Map"、[online]、［令和2年6月26日検索］、インターネット＜https://arxiv.org/abs/1905.03540＞ Chaofan Chen、他5名、"This LooksLike That: Deep Learning for Interpretable Image Recognition"、[online]、［令和2年6月26日検索］、インターネット＜https://arxiv.org/abs/1806.10574＞

しかしながら、非特許文献１および非特許文献２それぞれに記載された技術では、人手によるＮＮのパラメータ修正の際に、人間が得られる情報はＮＮの注目領域のみである。例えば、ＮＮがなぜその領域に注目して判定を行ったのか、ＮＮがなぜ誤判定したのかを人間が推測することができれば、人手によってより的確な修正が行われ得ると考えられる。すなわち、ＮＮの注目領域の情報だけでは、ＮＮによる判断根拠を推測するには不十分である場合がある。人手によるＮＮのパラメータ修正をより容易かつ的確にするためには、ＮＮによる判断根拠の推測の補助となる注目領域以外の情報も提供されることが望まれる。

そこで、ＮＮによる判断根拠の推測の補助となる有用な情報を提示することを可能とする技術が提供されることが望まれる。

上記問題を解決するために、本発明のある観点によれば、学習用データと前記学習用データの正解値とを取得する入力部と、前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、前記類似度に基づいて推論値を出力する推論部と、前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、前記正解値と前記推論値と前記類似度と前記修正データとに基づいて評価結果を得る評価部と、前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、を備える、学習装置が提供される。

前記出力制御部は、前記類似度が前記出力部によって出力されるように前記出力部を制御してもよい。

前記出力制御部は、前記推論値が前記出力部によって出力されるように前記出力部を制御してもよい。

前記評価部は、前記正解値と前記推論値とに基づく第１の誤差と、前記類似度と前記修正データとに基づく第２の誤差とに基づいて、前記評価結果を得てもよい。

前記記録制御部は、前記修正データを入力する操作に基づいて、前記修正データを前記記憶部に記録してもよい。

前記類似度算出部は、前記特徴量を構成する複数の領域単位で前記類似度を算出し、前記出力制御部は、前記学習用データのうち前記プロトタイプとの類似度が所定の類似度よりも高い特徴量が抽出される類似領域の位置が第１の位置として出力されるように制御し、前記記録制御部は、前記類似領域の位置を第１の位置から、前記プロトタイプとの類似度が所定の類似度以下である第２の位置に移動する操作に基づいて、前記修正データを生成してもよい。

前記記録制御部は、前記第１の位置に対応する類似度が前記所定の類似度以下であり、かつ、前記第２の位置に対応する類似度が前記所定の類似度よりも高い修正データを生成してもよい。

前記学習装置は、前記重みパラメータの更新後の第１のニューラルネットワークの第１の精度に基づく所定の処理を実行する処理実行部を備えてもよい。

前記処理実行部は、前記第１の精度が所定の精度よりも低い場合に、前記第１のニューラルネットワークの重みパラメータの更新の停止、または、所定の警告情報の出力を実行してもよい。

前記所定の精度は、あらかじめ定められた値、または、前記評価結果に基づく重みパラメータの更新前における第１のニューラルネットワークの第２の精度であってもよい。

前記処理実行部は、前記評価結果に基づく重みパラメータの更新前における第１のニューラルネットワークの第２の精度と前記第１の精度とが出力されるように制御してもよい。

前記更新部は、前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータととともに前記プロトタイプの更新を行ってもよい。

前記類似度算出部は、複数の学習用データそれぞれにおいて、前記推論部に出力した類似度と、前記類似度に対応する特徴量とを、保存データとして保存し、前記更新部は、前記プロトタイプと最も類似度が高い特徴量を類似特徴量として前記保存データから検出し、前記類似特徴量によって前記プロトタイプを上書きするとともに、前記類似特徴量が抽出された学習用データの前記類似特徴量に対応する領域データによって前記プロトタイプの前記元データを更新してもよい。

前記更新部は、前記類似特徴量によって前記プロトタイプを上書きした場合、前記プロトタイプの更新を停止してもよい。

前記更新部は、前記プロトタイプの元データを、前記第１のニューラルネットワークの重みパラメータの更新後の特徴抽出部に入力させたことに基づいて出力される特徴量によって、前記プロトタイプを更新してもよい。

前記推論部は、前記類似度と第２のニューラルネットワークとに基づいて前記推論値を出力し、前記更新部は、前記正解値と前記推論値と前記類似度と前記修正データとに基づいて前記第２のニューラルネットワークの重みパラメータの更新を行ってもよい。

また、本発明の別の観点によれば、学習用データと前記学習用データの正解値とを取得することと、前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出することと、前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力することと、前記類似度に基づいて推論値を出力することと、前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御することと、ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録することと、前記正解値と前記推論値と前記類似度と前記修正データとに基づいて評価結果を得ることと、前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行うことと、を備える、学習方法が提供される。

また、本発明の別の観点によれば、コンピュータを、学習用データと前記学習用データの正解値とを取得する入力部と、前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、前記類似度に基づいて推論値を出力する推論部と、前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、前記正解値と前記推論値と前記類似度と前記修正データとに基づいて評価結果を得る評価部と、前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、を備える、学習装置として機能させるためのプログラムが提供される。

以上説明したように本発明によれば、ＮＮによる判断根拠の推測の補助となる有用な情報を提示することを可能とする技術が提供される。

本発明の第１の実施形態に係る学習装置の機能構成例を示す図である。特徴抽出部の機能の詳細を説明するための図である。類似度算出部の機能の詳細を説明するための図である。推論部の機能の詳細を説明するための図である。評価部の機能の詳細を説明するための図である。更新部によるプロトタイプデータの更新の第１の例について説明するための図である。更新部によるプロトタイプデータの更新の第２の例について説明するための図である。本発明の第１の実施形態に係る学習装置によって実行される学習段階の動作例を示すフローチャートである。ユーザに類似度を修正させるための類似度修正画面の例を示す図である。本発明の第１の実施形態に係る学習装置によって実行される修正段階の動作例を示すフローチャートである。本発明の第１の実施形態に係る学習装置によって実行される再学習段階の動作例を示すフローチャートである。本発明の第２の実施形態に係る学習装置の機能構成例を示す図である。類似度算出部の機能の詳細を説明するための図である。ユーザに類似度を修正させるための類似度修正画面の例を示す図である。ユーザによる類似度修正後の類似度修正画面の例を示す図である。同実施形態に係る学習装置の例としての情報処理装置のハードウェア構成を示す図である。

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

また、本明細書および図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる数字を付して区別する場合がある。ただし、実質的に同一の機能構成を有する複数の構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。また、異なる実施形態の類似する構成要素については、同一の符号の後に異なるアルファベットを付して区別する場合がある。ただし、異なる実施形態の類似する構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。

（０．実施形態の概要）
本発明の実施形態の概要について説明する。本発明の実施形態では、学習用データと正解値との組み合わせに基づいてニューラルネットワークの学習を行う学習装置について説明する。学習装置においては、ニューラルネットワークの学習が行われた後（学習段階）、学習時に算出された類似度の修正が行われ（修正段階）、修正データに基づいて再度学習が行われる（再学習段階）。類似度については後に説明する。その後、識別装置において、学習済みのニューラルネットワークと識別用データ（テストデータ）とに基づいて推論値が出力される。

本発明の実施形態では、学習装置と識別装置とが同一のコンピュータによって実現される場合を主に想定する。しかし、学習装置と識別装置とは、別のコンピュータによって実現されてもよい。かかる場合には、学習装置によって生成された学習済みのニューラルネットワークが識別装置に提供される。例えば、学習済みのニューラルネットワークは、学習装置から識別装置に記録媒体を介して提供されてもよいし、通信を介して提供されてもよい。以下では、学習装置において実行される「学習段階」「修正段階」「再学習段階」について説明する。

（１．第１の実施形態）
まず、本発明の第１の実施形態について説明する。図１は、本発明の第１の実施形態に係る学習装置１０の機能構成例を示す図である。図１に示されるように、本発明の第１の実施形態に係る学習装置１０は、入力部１１５と、特徴抽出部１２１と、類似度算出部１２２と、推論部１２３と、評価部１４０と、更新部１５０と、出力制御部１６１と、出力部１６２と、操作部１７１と、記録制御部１７２と、処理実行部１８０とを備える。

本発明の第１の実施形態では、特徴抽出部１２１と、類似度算出部１２２と、推論部１２３とが、ニューラルネットワーク１２０によって構成される場合を主に想定する。すなわち、特徴抽出部１２１と、類似度算出部１２２と、推論部１２３とは、ニューロンによって構築される計算グラフが処理順に接続されて構成されており、全体として１つのニューラルネットワークとみなされ得る。以下では、ニューラルネットワークを「ＮＮ」とも表記する。より詳細に、特徴抽出部１２１は、第１のニューラルネットワーク（以下、「特徴抽出ＮＮ」とも表記する。）を含み、推論部１２３は、第２のニューラルネットワーク（以下、「推論ＮＮ」とも表記する。）を含む。

しかし、特徴抽出部１２１と、類似度算出部１２２と、推論部１２３とは、具体的にどのような構成であってもよい。例えば、以下では、特徴抽出部１２１が特徴抽出ＮＮを含み、推論部１２３が推論ＮＮを含む場合を主に想定して説明する。しかし、推論部１２３は、推論ＮＮを含まずに特定の推論アルゴリズムに基づいて推論を行ってもよい。

特徴抽出部１２１、類似度算出部１２２および推論部１２３の他、評価部１４０、更新部１５０、出力制御部１６１、記録制御部１７２および処理実行部１８０などは、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）またはＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などの演算装置を含み、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）により記憶されているプログラムが演算装置によりＲＡＭに展開されて実行されることにより、その機能が実現され得る。このとき、当該プログラムを記録した、コンピュータに読み取り可能な記録媒体も提供され得る。あるいは、これらのブロックは、専用のハードウェアにより構成されていてもよいし、複数のハードウェアの組み合わせにより構成されてもよい。演算装置による演算に必要なデータは、図示しない記憶部によって適宜記憶される。

データセット１１０、特徴抽出ＮＮの重みパラメータ１３２、推論ＮＮの重みパラメータ１３３およびプロトタイプデータ１３４は、図示しない記憶部によって記憶される。また、後に説明するように、保存データ１６０（図７）が用いられる例では、かかる保存データ１６０も図示しない記憶部によって記憶される。かかる記憶部は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ハードディスクドライブまたはフラッシュメモリなどのメモリによって構成されてよい。

初期状態において、特徴抽出ＮＮの重みパラメータ１３２、推論ＮＮの重みパラメータ１３３、および、プロトタイプデータ１３４それぞれには、初期値が設定されている。例えば、これらに設定される初期値は、ランダムな値であってよいが、どのような値であってもよい。例えば、これらに設定される初期値は、あらかじめ学習によって得られた学習済みの値であってもよい。プロトタイプデータ１３４に設定される初期値についての詳細は、後に説明する。

（１－１．学習段階）
まず、本発明の第１の実施形態に係る学習装置１０によって実行される「学習段階」について説明する。

（データセット１１０）
データセット１１０は、複数の学習用データ（入力データ）と当該複数の学習用データそれぞれの正解値とを含んで構成される。なお、本発明の実施形態では、学習用データが画像データである場合（特に、静止画像データである場合）を主に想定する。しかし、学習用データの種類は特に限定されず、次元数調整によって画像データ以外も学習用データとして用いられ得る。例えば、学習用データは、複数のフレームを含んだ動画像データであってもよいし、音響データであってもよい。

（入力部１１５）
入力部１１５は、データセット１１０から学習用データおよび正解値の組み合わせを順次に取得する。入力部１１５は、学習用データおよび正解値の組み合わせを順次にニューラルネットワーク１２０の特徴抽出部１２１に出力する。入力部１１５よりも後段の各ブロックにおいては、前段のブロックからの入力に基づいて順次に各自の処理が繰り返し実行される。

なお、例えば、入力部１１５は、データセット１１０から学習用データおよび正解値の組み合わせを全部取得し終わった場合には、最初から当該組み合わせを取得し直して再度出力する動作を所定の回数繰り返してよい。かかる場合には、入力部１１５よりも後段のブロックにおいても、前段のブロックからの再度の入力に基づいて順次に各自の処理が繰り返し実行されてよい。

（特徴抽出部１２１）
特徴抽出部１２１は、入力部１１５から出力された学習用データと特徴抽出ＮＮとに基づいて特徴量を抽出する。より詳細に、特徴抽出部１２１は、特徴抽出ＮＮに学習用データを入力させたことに基づいて、特徴抽出ＮＮから出力されるデータを特徴量として得る。特徴抽出部１２１は、特徴量を類似度算出部１２２に出力する。ここで、図２を参照しながら、特徴抽出部１２１の機能についてより詳細に説明する。

図２は、特徴抽出部１２１の機能の詳細を説明するための図である。図２を参照すると、入力部１１５から出力された学習用データ（入力データＧ１）が示されている。特徴抽出部１２１は、特徴抽出ＮＮに学習用データ（入力データＧ１）を入力させ、重みパラメータ１３２を用いて特徴抽出ＮＮから出力される特徴量Ｆ１を得る。特徴抽出ＮＮの具体的な構成は限定されない。例えば、特徴抽出ＮＮとしては、畳み込み層およびプーリング層を主として構成されたニューラルネットワークが用いられてもよい。以下では、畳み込み層として、２次元畳み込み層が用いられる場合を主に想定するが、３次元畳み込み層が用いられてもよい。

（類似度算出部１２２）
図１に戻って説明を続ける。類似度算出部１２２は、特徴抽出部１２１から出力された特徴量Ｆ１とプロトタイプデータ１３４との類似度を算出する。そして、類似度算出部１２２は、算出した特徴量Ｆ１とプロトタイプデータ１３４との類似度を推論部１２３に出力する。ここで、図３を参照しながら、類似度算出部１２２の機能についてより詳細に説明する。

図３は、類似度算出部１２２の機能の詳細を説明するための図である。図３を参照すると、特徴量Ｆ１が示されている。また、プロトタイプデータ１３４の例としてプロトタイプＰ１～Ｐ４が示されている。本発明の実施形態では、プロトタイプの数が４つである場合を主に想定するが、プロトタイプの数は限定されない。すなわち、プロトタイプの数は、１つであってもよいし、複数であってもよい。

ここで、プロトタイプは、ニューラルネットワーク１２０が正解値を予測するために必要となる典型的な特徴量であり得る。例えば、ニューラルネットワーク１２０が、入力画像が「犬」であるか「猫」であるかをクラス分類するニューラルネットワークである場合を想定する。かかる場合には、「犬」の典型例が写る画像、および、「猫」の典型例が写る画像それぞれの特徴量がプロトタイプとして用いられればよい。

上記したように、プロトタイプＰ１～Ｐ４に設定される初期値は、ランダムな値であってもよい。しかし、本発明の実施形態においては、このような典型例のデータを特徴抽出部１２１に入力した場合に特徴抽出部１２１から出力されるデータをプロトタイプＰ１～Ｐ４として使用する場合を主に想定する。すなわち、典型例のデータを特徴抽出部１２１に入力した場合に特徴抽出部１２１から出力されるデータを事前に計算し、そのデータをプロトタイプＰ１～Ｐ４の初期値として保存する。

また、プロトタイプＰ１～Ｐ４として使用される特徴量の元データ（例えば、典型例のデータ）、または当該元データを識別するための情報（元データのＩＤ）などいった情報もプロトタイプＰ１～Ｐ４に対応付けられて保存される。典型例のデータは、データセット１１０に含まれる学習用データからユーザによって選択されてもよい。このとき、プロトタイプＰ１～Ｐ４の初期値は、ユーザによって選択された典型例のデータから特徴抽出部１２１によって抽出される特徴量であってよい。

図３に示された例では、類似度算出部１２２によって、特徴量Ｆ１とプロトタイプＰ１との類似度Ｍ１が算出され、特徴量Ｆ１とプロトタイプＰ２との類似度Ｍ２が算出され、特徴量Ｆ１とプロトタイプＰ３との類似度Ｍ３が算出され、特徴量Ｆ１とプロトタイプＰ４との類似度Ｍ４が算出される。

特徴量とプロトタイプＰ１～Ｐ４それぞれとの類似度は、どのように算出されてもよい。例えば、類似度算出部１２２は、特徴量とプロトタイプＰ１～Ｐ４それぞれとの類似度を、特徴量とプロトタイプＰ１～Ｐ４それぞれとにおいて対応する要素同士の差分の二乗和（Ｌ２ノルム）を用いて算出することができる。例えば、Ｌ２ノルムの逆数は、要素同士の差分の二乗和が小さいほど（特徴量とプロトタイプとの距離が近いほど）大きくなるため、類似度として好適に用いられ得る。

一例として、特徴抽出部１２１から出力された特徴量をｚとすると、類似度Ｍは、類似度算出部１２２によって以下の数式（１）に示されるように算出されてよい。

なお、類似度の算出方法は、かかる例に限定されない。例えば、類似度を算出する関数としては、ニューラルネットワークにおける誤差逆伝播法が適用可能な関数であれば、ニューラルネットワークが解決すべき問題に応じて自由に設定されてよい。

（推論部１２３）
図１に戻って説明を続ける。推論部１２３は、類似度算出部１２２から出力された類似度Ｍ１～Ｍ４に基づいて推論を行って推論値を得る。そして、推論部１２３は、推論値を評価部１４０に出力する。ここで、図４を参照しながら、推論部１２３の機能についてより詳細に説明する。

図４は、推論部１２３の機能の詳細を説明するための図である。図４を参照すると、類似度算出部１２２から出力された類似度Ｍ１～Ｍ４が示されている。推論部１２３は、推論ＮＮに類似度Ｍ１～Ｍ４を入力させ、重みパラメータ１３３を用いて推論ＮＮから出力される推論値を得る。なお、本明細書においては、ニューラルネットワークへのデータの入力に基づいてニューラルネットワークから出力されるデータを得ることを広く「推論」と言う。そのため、学習段階においても「推論」という用語が使用される。

推論ＮＮの具体的な構成は、特に限定されない。しかし、推論ＮＮの出力の形式は、学習用データに対応する正解値の形式と合わせて設定されているのがよい。例えば、正解値が分類問題のクラスである場合、推論ＮＮの出力は、クラス数分の長さを有するｏｎｅ－ｈｏｔベクトルであるとよい。

（評価部１４０）
図１に戻って説明を続ける。評価部１４０は、入力部１１５によって取得された正解値に基づいて、推論部１２３から出力された推論値を評価して評価結果を得る。そして、評価部１４０は、評価結果を更新部１５０に出力する。ここで、図５を参照しながら、評価部１４０の機能についてより詳細に説明する。

図５は、評価部１４０の機能の詳細を説明するための図である。図５を参照すると、推論部１２３から出力された推論値が示されている。また、図５を参照すると、入力部１１５によって取得された正解値が示されている。本発明の実施形態では、評価部１４０が、正解値と推論値とに応じた損失関数を評価結果として算出する場合を想定する。ここで、本発明の実施形態において用いられる損失関数は特定の関数に限定されず、一般的なニューラルネットワークにおいて用いられる損失関数と同様の損失関数が用いられてよい。例えば、損失関数は、正解値と推論値との差分に基づく平均二乗誤差であってもよい。

（更新部１５０）
図１に戻って説明を続ける。更新部１５０は、評価部１４０から出力された評価結果に基づいて、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３との更新を行う。これによって、推論部１２３から出力される推論値が正解値に近づくように、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３とが訓練され得る。

また、本発明の第１の実施形態においては、更新部１５０が、評価部１４０から出力された評価結果に基づいて、プロトタイプデータ１３４も更新する場合を主に想定する。これによって、特徴抽出部１２１から出力される特徴量の変化に伴って、典型的な特徴量としてのプロトタイプデータ１３４も変化し得る。しかし、プロトタイプデータ１３４は、更新されなくてもよい。

プロトタイプデータ１３４を更新する手法としては、幾つかの手法が想定され得る。ここでは、プロトタイプデータ１３４の更新の例として、第１の例および第２の例について説明する。以下、図６および図７を参照しながら、更新部１５０によるプロトタイプデータ１３４の更新の第１の例および第２の例についてより詳細に説明する。

図６は、更新部１５０によるプロトタイプデータ１３４の更新の第１の例について説明するための図である。図６を参照すると、評価部１４０から出力された評価結果が示されている。また、プロトタイプデータ１３４の例として、プロトタイプＰ１～Ｐ４が示されている。さらに、当該評価結果に対応する学習用データ（入力データ）が示されている。例えば、更新部１５０は、評価部１４０から出力された評価結果に基づく誤差逆伝播法（バックプロパゲーション）によって、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３とを更新してよい。

第１の例では、更新部１５０は、プロトタイプＰ１～Ｐ４の元データを、特徴抽出ＮＮの重みパラメータ１３２の更新後の特徴抽出部１２１に入力させたことに基づいて出力される特徴量によって、プロトタイプＰ１～Ｐ４を更新する。なお、更新部１５０は、特徴抽出ＮＮの重みパラメータ１３２を更新するたびに、プロトタイプＰ１～Ｐ４を更新してもよい。しかし、更新部１５０は、特徴抽出ＮＮの重みパラメータ１３２を複数回（例えば、１００回など）更新するごとに、プロトタイプＰ１～Ｐ４を１回更新してもよい。これによって、プロトタイプＰ１～Ｐ４の更新に要する演算量が低減され得る。

図７は、更新部１５０によるプロトタイプデータ１３４の更新の第２の例について説明するための図である。図７を参照すると、評価部１４０から出力された評価結果が示されている。また、プロトタイプデータ１３４の例として、プロトタイプＰ１～Ｐ４が示されている。保存データ１６０には、初期状態では特に何も設定されていなくてよい。例えば、更新部１５０は、評価部１４０から出力された評価結果に基づく誤差逆伝播法（バックプロパゲーション）によって、特徴抽出ＮＮの重みパラメータ１３２および推論ＮＮの重みパラメータ１３３とともに、プロトタイプデータ１３４とを更新してよい。

第２の例では、プロトタイプと類似する特徴量（類似特徴量）の抽出元の学習用データ（すなわち、プロトタイプの元データ）が学習装置１０によって検出（探索）される場合を想定する。そして、図示しない識別装置において、学習装置１０によって検出された元データが、類似データとしてテストデータとともに提示される場合を想定する。これによって、類似データとテストデータとの類似性が容易に理解され得る。

より詳細に、類似度算出部１２２は、上記したように、複数の学習用データそれぞれに対して特徴量とプロトタイプＰ１～Ｐ４それぞれとの類似度Ｍ１～Ｍ４を算出し、推論部１２３に出力する。そこで、類似度算出部１２２は、所定のタイミングで、推論部１２３に出力した類似度と、当該類似度に対応する当該特徴量とを、プロトタイプＰ１～Ｐ４それぞれに対応付けて保存データ１６０として保存する。

図７には一例として、プロトタイプＰ１に対して、推論部１２３に出力された複数の類似度（類似度：５０％、類似度：１０％、・・・、類似度：２０％）と、複数の類似度それぞれに対応する特徴量とが保存データ１６０として保存されている例が示されている。しかし、プロトタイプＰ２～Ｐ４それぞれに対応するチャネルの特徴量と類似度も同様に保存される。

なお、ここでは、データセット１１０を用いた学習装置１０による学習が何巡か繰り返し実行された後に（例えば、４回繰り返し実行された後など）、次の巡目（例えば、５巡目など）の類似度と特徴量とが保存される場合を想定する。しかし、類似度と特徴量とが保存されるタイミングは限定されない。すなわち、類似度算出部１２２は、学習装置１０による学習に用いられた複数の学習用データの一部または全部それぞれにおいて、（プロトタイプと特徴量との）類似度と特徴量とをプロトタイプに対応付けて保存すればよい。

類似度算出部１２２による類似度と特徴量との保存が終わると、更新部１５０は、プロトタイプと最も類似度が高い特徴量を類似特徴量として保存データ１６０から検出する。図７に示された例では、類似度が「５０％」の特徴量が類似特徴量として検出される。更新部１５０は、類似特徴量が抽出された学習用データの当該類似特徴量に対応する学習用データを類似データとしてプロトタイプＰ１に対応付ける。なお、更新部１５０は、同様にして、プロトタイプＰ２～Ｐ４それぞれに類似データを対応付ける。

なお、プロトタイプデータ１３４は、学習が終了するまで、重みパラメータ１３２、１３３とともに誤差逆伝播法（バックプロパゲーション）によって更新され続けてもよい。しかし、プロトタイプデータ１３４の更新の第２の例では、更新部１５０が、検出した類似特徴量によってプロトタイプデータ１３４をプロトタイプごとに上書きする場合を想定する。これによって、類似度の算出に用いられるプロトタイプデータ１３４と、提示される類似データとの間の整合性が向上し得る。かかる整合性の観点から、更新部１５０は、学習の途中において、類似特徴量によってプロトタイプデータ１３４を上書きした場合、プロトタイプデータ１３４の更新を停止するのがよい。

なお、更新部１５０は、学習用データに基づく更新が終わるたびに、学習の終了条件が満たされたか否かを判断する。学習の終了条件が満たされていないと判断した場合には、入力部１１５によって次の学習用データが取得され、特徴抽出部１２１、類似度算出部１２２、推論部１２３、評価部１４０および更新部１５０それぞれによって、当該次の入力データに基づく各自の処理が再度実行される。一方、更新部１５０によって、学習の終了条件が満たされたと判断された場合には、学習が終了される。

なお、学習の終了条件は特に限定されず、ニューラルネットワーク１２０の学習がある程度行われたことを示す条件であればよい。具体的に、学習の終了件は、損失関数の値が閾値よりも小さいという条件を含んでもよい。あるいは、学習の終了条件は、損失関数の値の変化が閾値よりも小さいという条件（損失関数の値が収束状態になったという条件）を含んでもよい。あるいは、学習の終了条件は、重みパラメータの更新が所定の回数行われたという条件を含んでもよい。あるいは、評価部１４０によって正解値と推論値とに基づいて精度（例えば、正答率など）が算出される場合、学習の終了条件は、精度が所定の割合（例えば、９０％など）を超えるという条件を含んでもよい。

（学習段階の動作）
図８を参照しながら、本発明の第１の実施形態に係る学習装置１０によって実行される「学習段階」の動作の流れについて説明する。図８は、本発明の第１の実施形態に係る学習装置１０によって実行される学習段階の動作例を示すフローチャートである。

まず、図８に示されたように、入力部１１５は、データセット１１０から入力データ（すなわち、学習用データ）および正解値の組み合わせを取得する。また、特徴抽出部１２１は、重みパラメータ１３２を取得し、推論部１２３は、重みパラメータ１３３を取得し、類似度算出部１２２は、プロトタイプデータ１３４を取得する（Ｓ１１）。

特徴抽出部１２１は、入力部１１５によって取得された学習用データと特徴抽出ＮＮとに基づいて特徴量を抽出する（Ｓ１２）。より詳細に、特徴抽出部１２１は、特徴抽出ＮＮに入力データを入力させ、重みパラメータ１３２を用いて特徴抽出ＮＮから出力される特徴量を得る。特徴抽出部１２１は、特徴量を類似度算出部１２２に出力する。

類似度算出部１２２は、特徴抽出部１２１から出力された特徴量とプロトタイプＰ１～Ｐ４それぞれとの類似度Ｍ１～Ｍ４を算出する（Ｓ１３）。推論部１２３は、類似度算出部１２２から出力された類似度Ｍ１～Ｍ４に基づいて推論を行って推論値を得る（Ｓ１４）。より詳細に、推論部１２３は、推論ＮＮに類似度Ｍ１～Ｍ４を入力させ、重みパラメータ１３３を用いて推論ＮＮから出力される推論値を得る。そして、推論部１２３は、推論値を評価部１４０に出力する。

評価部１４０は、入力部１１５によって取得された正解値に基づいて、推論部１２３から出力された推論値を評価して評価結果を得る（Ｓ１５）。より詳細に、評価部１４０は、正解値と推論値とに応じた損失関数を評価結果として算出する。そして、評価部１４０は、評価結果を更新部１５０に出力する。更新部１５０は、評価部１４０から出力された評価結果に基づいて、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３と、プロトタイプデータ１３４との更新を行う（Ｓ１６）。

更新部１５０は、学習用データに基づく更新が終わるたびに、学習の終了条件が満たされたか否かを判断する（Ｓ１７）。学習の終了条件が満たされていないと判断した場合には（Ｓ１７において「ＮＯ」）、Ｓ１１に動作が移行され、入力部１１５によって次の学習用データが取得され、特徴抽出部１２１、類似度算出部１２２、推論部１２３、評価部１４０および更新部１５０それぞれによって、当該次の入力データに基づく各自の処理が再度実行される。一方、更新部１５０によって、学習の終了条件が満たされたと判断された場合には（Ｓ１７において「ＹＥＳ」）、学習が終了される。

以上、本発明の第１の実施形態に係る学習装置１０によって実行される「学習段階」の動作の流れについて説明した。

（１－２．修正段階）
続いて、本発明の第１の実施形態に係る学習装置１０によって実行される「修正段階」について説明する。なお、以下では、「学習段階」において類似度が一度算出されているものの、「修正段階」において類似度が算出され直される場合を主に想定する。これによって、類似度を記憶しておくために確保すべきメモリ領域が低減され得る。しかし、「学習段階」において、算出された類似度が、図示しない記憶部によって記憶されてもよい。かかる場合には、「修正段階」において、図示しない記憶部によって記憶されている類似度が用いられればよい。

さらに、以下では、「修正段階」が「学習段階」の後に実行される場合を主に想定する。しかし、「学習段階」が実行されずに、「修正段階」が実行され、後に説明する「再学習」に相当する学習が実行されてもよい。かかる場合であっても、「修正段階」において、ユーザによって類似度（類似度の修正データ）が入力される。なお、例えば、ユーザは、学習済みのニューラルネットワーク１２０の修正を担当する者であってよい。「修正段階」においても、学習段階と同様に、入力部１１５、特徴抽出部１２１、類似度算出部１２２および推論部１２３において各自の処理が実行される。

（出力制御部１６１）
推論部１２３によって推論値が算出されると、出力制御部１６１は、入力部１１５によって取得された学習用データ（入力データ）と、プロトタイプに対応付けられている（プロトタイプの）元データとが出力部１６２によって出力されるように出力部１６２を制御する。これによって、ユーザは、学習用データと元データとの比較に基づいて、類似度の修正が可能となる。

さらに、出力制御部１６１は、類似度算出部１２２によって算出された類似度が出力部１６２によって出力されるように出力部１６２を制御してよい。これによって、類似度算出部１２２によって算出された類似度がユーザによって認識され得る。また、出力制御部１６１は、推論部１２３によって得られた推論値が出力部１６２によって出力されるように出力部１６２を制御してもよい。

（出力部１６２）
出力部１６２は、ユーザに対して視覚的な情報を提示する表示部（ディスプレイ）である場合を主に想定する。しかし、出力部１６２の具体的な形態は限定されない。例えば、学習用データが音響データである場合などには、出力部１６２は、ユーザに対して聴覚的な情報を提示する音声出力部（スピーカ）などであってもよい。これによって、ユーザは、学習用データと元データとを聴覚的な情報として知覚した結果に基づいて、類似度を修正することが可能となる。

図９は、ユーザに類似度を修正させるための類似度修正画面の例を示す図である。図９を参照すると、出力部１６２によって表示される類似度修正画面Ｗ１が示されている。図９を参照すると、出力制御部１６１は、入力部１１５によって取得された学習用データ（入力データＧ１）と、プロトタイプに対応付けられている（プロトタイプの）元データＲ１とが出力部１６２によって表示されるように出力部１６２を制御している。

さらに、出力制御部１６１は、類似度算出部１２２によって算出された類似度（「現在の類似度」＝１０％）が出力部１６２によって表示されるように出力部１６２を制御している。また、出力制御部１６１は、推論部１２３によって得られた推論値「０」が出力部１６２によって表示されるように出力部１６２を制御している。ユーザは、入力データＧ１、プロトタイプの元データＲ１、推論値、現在の類似度などを見ながら、各種操作を操作部１７１に対して入力することが可能である。

（操作部１７１）
操作部１７１は、ユーザによって入力される各種操作を受け付ける機能を有する。ここでは、操作部１７１がマウスおよびキーボードによって構成される場合を主に想定する。しかし、操作部１７１の具体的な形態は限定されない。例えば、操作部１７１は、他の入力デバイス（例えば、タッチパネルなど）によって構成されてもよい。

一例として、操作部１７１に対して、ユーザがプロトタイプの元データを前に戻す操作（例えば、ボタンＢ２１を選択する操作）を入力すると、出力制御部１６１は、表示対象のプロトタイプの元データを前に戻してもよい。例えば、プロトタイプＰ２の元データが現在表示されている状態であれば、表示対象のプロトタイプの元データを、プロトタイプＰ２の元データからプロトタイプＰ１の元データに切り替えてもよい。このとき、「推論値」および「現在の類似度」も、切り替え後のデータ（すなわち、プロトタイプＰ１の元データ）に対応する各値に切り替えられてよい。

他の一例として、操作部１７１に対して、ユーザがプロトタイプの元データを先に進める操作（例えば、ボタンＢ２２を選択する操作）を入力すると、出力制御部１６１は、表示対象のプロトタイプの元データを先に進めてもよい。例えば、プロトタイプＰ２の元データが現在表示されている状態であれば、表示対象のプロトタイプの元データを、プロトタイプＰ２の元データからプロトタイプＰ３の元データに切り替えてもよい。このとき、「推論値」および「現在の類似度」も、切り替え後のデータ（すなわち、プロトタイプＰ３の元データ）に対応する各値に切り替えられてよい。

なお、プロトタイプＰ１～Ｐ４それぞれの元データが同時に表示される場合には、ユーザがプロトタイプの元データを前に戻す操作、および、ユーザがプロトタイプの元データを先に進める操作などは不要である。

また、一例として、操作部１７１に対して、ユーザが学習用データ（入力データ）を前に戻す操作（例えば、ボタンＢ１１を選択する操作）を入力すると、出力制御部１６１は、表示対象の学習用データを前に戻してもよい。例えば、２つ目の学習用データが現在表示されている状態であれば、表示対象の学習用データを、２つ目の学習用データから１つ目の学習用データに切り替えてもよい。このとき、「推論値」および「現在の類似度」も、切り替え後のデータ（すなわち、１つ目の学習用データ）に対応する各値に切り替えられてよい。

他の一例として、操作部１７１に対して、ユーザが学習用データ（入力データ）を前に戻す操作（例えば、ボタンＢ１２を選択する操作）を入力すると、出力制御部１６１は、表示対象の学習用データを先に進めてもよい。例えば、２つ目の学習用データが現在表示されている状態であれば、表示対象の学習用データを、２つ目の学習用データから３つ目の学習用データに切り替えてもよい。このとき、「推論値」および「現在の類似度」も、切り替え後のデータ（すなわち、３つ目の学習用データ）に対応する各値に切り替えられてよい。

なお、ユーザが学習用データを前に戻す操作によって、２つ以上前の学習用データに戻されてもよい。あるいは、幾つ前の学習用データに戻すかを、ユーザが選択可能であってもよい。同様に、ユーザが学習用データを先に進める操作によって、２つ以上先の学習用データに進められてもよい。あるいは、幾つ先の学習用データに進めるかを、ユーザが選択可能であってもよい。

ユーザは、類似度の修正データを入力することが可能である。より詳細に、類似度修正画面Ｗ１には、「修正後の類似度」の入力欄Ｎ１が含まれている。ユーザは、現在表示されている学習用データ（入力データＧ１）とプロトタイプの元データＲ１とを比較しながら、「修正後の類似度」の入力欄Ｎ１に対して、入力データＧ１およびプロトタイプの元データＲ１に対応する類似度（すなわち、学習用データから抽出される特徴量とプロトタイプとの類似度）を入力することが可能である。

なお、ここでは、ユーザによる修正作業を簡便にするため、「修正後の類似度」として、「０：類似していない」「１：類似している」の２値のいずれかがユーザによって入力され得る場合を主に想定する。しかし、ユーザは、「修正後の類似度」として、「０：類似していない」と「１：類似している」との間の値を入力可能であってもよい。

（記録制御部１７２）
記録制御部１７２は、修正データを入力する操作に基づいて、当該修正データを類似度修正データ１７３として図示しない記憶部に記録する。より詳細に、操作部１７１に対して、ユーザが修正を実行させる操作（例えば、ボタンＢ８０を選択する操作）を入力すると、記録制御部１７２は、「修正後の類似度」の入力欄Ｎ１に設定された値を修正データとして取得する。記録制御部１７２は、取得した修正データを類似度修正データ１７３として図示しない記憶部に記録する。

一方、操作部１７１に対して、ユーザが修正を取り消す操作（例えば、ボタンＢ７０を選択する操作）を入力すると、出力制御部１６１は、現在表示されている学習用データ（入力データＧ１）とプロトタイプの元データＲ１とに対応する類似度の修正を実行しなくてよい。

なお、記録制御部１７２は、類似度の修正の終了条件が満たされたか否かを判断する。記録制御部１７２は、類似度の修正の終了条件が満たされていないと判断した場合には、引き続き類似度の修正が行われる。一方、記録制御部１７２は、類似度の修正の終了条件が満たされたと判断された場合には、類似度の修正を終了する。

なお、類似度の修正の終了条件は特に限定されない。例えば、類似度の修正の終了条件は、ユーザによって類似度の修正を終了させる操作（例えば、類似度修正画面Ｗ１を閉じる操作など）が入力されたという条件であってもよい。あるいは、類似度の修正の終了条件は、類似度の修正がある程度行われたことを示す条件であってもよい。具体的に、類似度の修正がある程度行われたことを示す条件は、学習段階において誤判定された学習用データ（すなわち、正解値と推論値とが不一致であった学習用データ）に対応する類似度の修正が全部終了したという条件を含んでもよい。

（修正段階の動作）
図１０を参照しながら、本発明の第１の実施形態に係る学習装置１０によって実行される「修正段階」の動作の流れについて説明する。図１０は、本発明の第１の実施形態に係る学習装置１０によって実行される修正段階の動作例を示すフローチャートである。まず、Ｓ２１～Ｓ２４は、学習段階におけるＳ１１～Ｓ１４（図８）と同様に実行される。

出力制御部１６１は、入力部１１５によって取得された学習用データ（入力データ）と、プロトタイプに対応付けられている（プロトタイプの）元データと、推論部１２３によって得られた推論値と、類似度算出部１２２によって算出された類似度とが、出力部１６２によって出力されるように出力部１６２を制御する（Ｓ２５）。

記録制御部１７２は、ユーザの操作に基づいて、類似度修正データ１７３を保存する（Ｓ２６）。より詳細に、記録制御部１７２は、類似度の修正データを入力するユーザの操作に基づいて、当該修正データを類似度修正データ１７３として、図示しない記憶部に記録する。記録制御部１７２は、類似度の修正の終了条件が満たされていないと判断した場合には（Ｓ２７において「ＮＯ」）、引き続き類似度の修正が行われる。一方、記録制御部１７２は、類似度の修正の終了条件が満たされたと判断された場合には（Ｓ２７において「ＹＥＳ」）、類似度の修正を終了する。

以上、本発明の第１の実施形態に係る学習装置１０によって実行される「修正段階」の動作の流れについて説明した。

（１－３．再学習段階）
続いて、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」について説明する。「再学習段階」においても、学習段階と同様に、入力部１１５、特徴抽出部１２１、類似度算出部１２２および推論部１２３において各自の処理が実行される。

評価部１４０は、入力部１１５によって取得された正解値と、推論部１２３から出力された推論値と、類似度算出部１２２によって算出された類似度と、（入力部１１５によって取得された学習用データに対応する）類似度修正データ１７３とに基づいて評価結果を得る。より詳細に、評価部１４０は、正解値と推論値とに基づく第１の誤差と、類似度と類似度修正データとに基づく第２の誤差とに基づいて、評価結果を得る。

これによって、推論部１２３から出力される推論値が正解値に近づくように、かつ、類似度が類似度修正データに近づくように、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３とが訓練され得る。一例として、評価部１４０は、正解値と推論値とに基づく第１の誤差（例えば、正解値と推論値との差分に基づく平均二乗誤差）と、類似度と類似度修正データとに基づく第２の誤差（例えば、類似度と類似度修正データとの差分に基づく平均二乗誤差）とを加算し、加算した結果を評価結果として得る。

なお、類似度修正データが対応付けられていない類似度は、特に第２の誤差は生じずに第１の誤差のみが評価結果に反映されればよい。

更新部１５０は、学習段階と同様に、評価部１４０によって得られた評価結果に基づいて、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３とプロトタイプデータ１３４との更新を行う。

処理実行部１８０は、特徴抽出ＮＮの重みパラメータ１３２、推論ＮＮの重みパラメータ１３３およびプロトタイプデータ１３４の更新後のニューラルネットワーク１２０の精度（第１の精度）が算出される場合、当該ニューラルネットワーク１２０の精度（以下、「再学習段階実行によるニューラルネットワーク１２０の精度」とも言う。）に基づく所定の処理を実行する。これによって、ニューラルネットワーク１２０の精度がどのように変化したかがユーザによって認識され得る。なお、再学習段階実行によるニューラルネットワーク１２０は、再学習段階実行中のニューラルネットワーク１２０であってもよいし、再学習段階終了後のニューラルネットワーク１２０であってもよい。

再学習段階実行によるニューラルネットワーク１２０の精度は、具体的にどのような指標であってもよい。例えば、再学習段階実行によるニューラルネットワーク１２０の精度は、再学習段階実行によるニューラルネットワーク１２０に次の学習用データを入力させた場合に再学習段階実行によるニューラルネットワーク１２０から出力される推論値と、当該次の学習用データの正解値とに基づいて算出される正答率であってもよい。

例えば、処理実行部１８０は、再学習段階実行によるニューラルネットワーク１２０の精度が所定の精度よりも低い場合に、（例えば、再学習段階の実行を続ける必要性が低いことも想定され得るため、）特徴抽出ＮＮの重みパラメータ１３２、推論ＮＮの重みパラメータ１３３およびプロトタイプデータ１３４の更新を停止してもよい。あるいは、処理実行部１８０は、再学習段階実行によるニューラルネットワーク１２０の精度が所定の精度よりも低い場合に、（例えば、再学習段階の実行状況をユーザに知らせるため、）所定の警告情報の出力を実行してもよい。警告情報は、出力部１６２から（例えば、視覚的な情報または聴覚的な情報として）出力されてよい。

ここで、再学習段階実行によるニューラルネットワーク１２０の精度と比較される所定の精度は、あらかじめ定められた値であってもよい。あるいは、再学習段階実行によるニューラルネットワーク１２０の精度と比較される所定の精度は、再学習段階実行前（すなわち、類似度修正データに基づく重みパラメータの更新前）におけるニューラルネットワーク１２０の精度（第２の精度）であってもよい。例えば、再学習段階実行によるニューラルネットワーク１２０の精度と比較される所定の精度は、学習段階実行後（すなわち、類似度修正データを用いずに重みパラメータを更新した後）かつ再学習段階実行前におけるニューラルネットワーク１２０の精度であってもよい。

あるいは、処理実行部１８０は、再学習段階実行前におけるニューラルネットワーク１２０の精度と、再学習段階実行によるニューラルネットワーク１２０の精度とが、出力部１６２によって出力されるように出力部１６２を制御してもよい。これによって、ユーザは、再学習段階が行われることによってニューラルネットワーク１２０の精度がどのように変化したかを、再学習段階実行前後のニューラルネットワーク１２０の精度同士を直接比較することによって認識することができる。

更新部１５０は、学習用データに基づく更新が終わるたびに、再学習の終了条件が満たされたか否かを判断する。再学習の終了条件は、上記した学習の終了条件と同様であってよい。更新部１５０は、再学習の終了条件が満たされていないと判断した場合には、入力部１１５によって次の学習用データが取得され、特徴抽出部１２１、類似度算出部１２２、推論部１２３、評価部１４０および更新部１５０それぞれによって、当該次の入力データに基づく各自の処理が再度実行される。一方、更新部１５０によって、再学習の終了条件が満たされたと判断された場合には、再学習が終了される。

（再学習段階の動作）
図１１を参照しながら、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」の動作の流れについて説明する。図１１は、本発明の第１の実施形態に係る学習装置１０によって実行される再学習段階の動作例を示すフローチャートである。まず、Ｓ３１～Ｓ３５は、学習段階におけるＳ１１～Ｓ１５（図８）と同様に実行される。

評価部１４０は、入力部１１５によって取得された正解値に基づいて、推論部１２３から出力された推論値を評価して暫定的な評価結果（第１の誤差）を得る。そして、評価部１４０は、類似度修正データに基づいて、類似度算出部１２２から出力された類似度を評価して加算分の評価結果（第２の誤差）を得る。評価部１４０は、暫定的な評価結果に加算分の評価結果を加算することによって、暫定的な評価結果を更新する（Ｓ３６）。

Ｓ３７およびＳ３８は、学習段階におけるＳ１６およびＳ１７（図８）と同様に実行される。

以上、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」の動作の流れについて説明した。

（１－４．第１の実施形態のまとめ）
以上に説明したように、本発明の第１の実施形態に係る学習装置１０において、入力部１１５は、学習用データと学習用データの正解値とを取得する。特徴抽出部１２１は、学習用データと特徴抽出ＮＮとに基づいて特徴量を抽出する。類似度算出部１２２は、特徴量の全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する。推論部１２３は、類似度に基づいて推論値を出力する。

そして、出力制御部１６１は、学習用データとプロトタイプの元データとが出力部１６２によって出力されるように出力部１６２を制御する。記録制御部１７２は、ユーザによって入力された操作に基づいて類似度修正データ１７３を図示しない記憶部に記録する。評価部１４０は、正解値と推論値と類似度と類似度修正データ１７３とに基づいて評価結果を得る。更新部１５０は、評価結果に基づいて、特徴抽出ＮＮの重みパラメータの更新を行う。

かかる構成によれば、特徴抽出ＮＮのパラメータとプロトタイプとの類似度に基づいて判定を行うニューラルネットワーク１２０における特徴抽出ＮＮのパラメータをユーザが修正するために、類似度を直接修正するに際して、プロトタイプの元データと学習用データとがユーザに提示される。すなわち、類似度を修正するユーザに際して、判断根拠の推測の補助となる有用な情報をユーザに提示することが可能となる。また、ユーザによって入力された類似度修正データに基づく再学習によって、プロトタイプが適切な特徴量に更新され得る。

以上、本発明の第１の実施形態について説明した。

（２．第２の実施形態）
続いて、本発明の第２の実施形態について説明する。図１２は、本発明の第２の実施形態に係る学習装置２０の機能構成例を示す図である。図１２に示されるように、本発明の第２の実施形態に係る学習装置２０は、本発明の第１の実施形態に係る学習装置１０と同様に、入力部１１５と、特徴抽出部１２１と、推論部１２３と、評価部１４０と、出力部１６２と、操作部１７１と、処理実行部１８０とを備える。さらに、本発明の第２の実施形態に係る学習装置２０は、類似度算出部２２２と、更新部２５０と、出力制御部２６１と、記録制御部２７２とを備える。以下では、類似度算出部２２２、更新部２５０および出力制御部２６１について主に説明を行う。

本発明の第２の実施形態においても、本発明の第１の実施形態と同様に、特徴抽出部１２１と、類似度算出部２２２と、推論部１２３とが、ニューラルネットワーク２２０によって構成される場合を主に想定する。また、本発明の第２の実施形態においても、本発明の第１の実施形態と同様に、特徴抽出部１２１と、類似度算出部２２２と、推論部１２３とは、具体的にどのような構成であってもよい。

類似度算出部２２２、更新部２５０、出力制御部２６１および記録制御部２７２は、ＣＰＵまたはＧＰＵなどの演算装置を含み、ＲＯＭにより記憶されているプログラムが演算装置によりＲＡＭに展開されて実行されることにより、その機能が実現され得る。このとき、当該プログラムを記録した、コンピュータに読み取り可能な記録媒体も提供され得る。あるいは、これらのブロックは、専用のハードウェアにより構成されていてもよいし、複数のハードウェアの組み合わせにより構成されてもよい。演算装置による演算に必要なデータは、図示しない記憶部によって適宜記憶される。プロトタイプデータ２３４は、図示しない記憶部によって記憶される。

初期状態において、プロトタイプデータ２３４には、初期値が設定されている。例えば、これらに設定される初期値は、ランダムな値であってよいが、どのような値であってもよい。例えば、プロトタイプデータ２３４に設定される初期値は、あらかじめ学習によって得られた学習済みの値であってもよい。プロトタイプデータ２３４に設定される初期値についての詳細は、後に説明する。

（２－１．学習段階）
まず、本発明の第２の実施形態に係る学習装置２０によって実行される「学習段階」について説明する。

（データセット１１０～特徴抽出部１２１）
本発明の第２の実施形態に係る学習装置２０においても、本発明の第１の実施形態と同様に、データセット１１０、入力部１１５および特徴抽出部１２１それぞれの機能が発揮される。

（類似度算出部２２２）
類似度算出部２２２は、特徴抽出部１２１から出力された特徴量とプロトタイプデータ２３４との類似度を算出する。そして、類似度算出部２２２は、算出した特徴量とプロトタイプデータ２３４との類似度を推論部１２３に出力する。ここで、図１３を参照しながら、類似度算出部２２２の機能についてより詳細に説明する。

図１３は、類似度算出部２２２の機能の詳細を説明するための図である。図１３を参照すると、特徴量Ｆ１が示されている。また、特徴量Ｆ１には、部分特徴量Ｆ１－１～Ｆ１－Ｎが含まれている。部分特徴量Ｆ１－１～Ｆ１－Ｎそれぞれは、特徴量Ｆ１から切り出された特徴量の一部の領域である。なお、特徴量Ｆ１から部分特徴量Ｆ１－１～Ｆ１－Ｎの切り出し方は限定されない。例えば、部分特徴量Ｆ１－１～Ｆ１－Ｎの中に重複領域を有するもの同士があってもよい。あるいは、特徴量Ｆ１の中には、部分特徴量として切り出されない領域が存在してもよい。

また、図１３を参照すると、プロトタイプデータ２３４の例としてプロトタイプＰ１～Ｐ４が示されている。本発明の第１の実施形態と同様に、本発明の第２の実施形態においても、プロトタイプの数が４つである場合を主に想定するが、プロトタイプの数は限定されない。すなわち、プロトタイプの数は、１つであってもよいし、複数であってもよい。

ここで、プロトタイプは、ニューラルネットワーク２２０が正解値を予測するために必要となる典型的な特徴量であり得る。本発明の第２の実施形態においても、ニューラルネットワーク２２０が、入力画像が「犬」であるか「猫」であるかをクラス分類するニューラルネットワークである場合を想定する。しかし、本発明の第２の実施形態においては、「犬」の典型例が写る画像の一部の領域（以下、「部分領域」とも言う。）、および、「猫」の典型例が写る画像の部分領域それぞれの特徴量がプロトタイプとして用いられる。

部分領域の位置、サイズおよび形状などは限定されない。例えば、特徴抽出部１２１から出力される特徴量のサイズが、Ｃ×Ｈ（高さ）×Ｗ（幅）と表現される場合、プロトタイプＰ１～Ｐ４それぞれのデータサイズは、Ｃ×Ｈ’（高さ）×Ｗ’（幅）（ただし、Ｈ＞Ｈ’かつＷ＞Ｗ’）と表現される。プロトタイプＰ１～Ｐ４それぞれのデータサイズは、特徴抽出部１２１から出力される特徴量から切り出される部分特徴量と同じサイズである。

上記したように、プロトタイプＰ１～Ｐ４に設定される初期値は、ランダムな値であってもよい。本発明の第２の実施形態においては、このような典型例のデータの部分領域を特徴抽出部１２１に入力した場合に特徴抽出部１２１から出力されるデータをプロトタイプＰ１～Ｐ４として使用する場合を主に想定する。すなわち、典型例のデータの部分領域を特徴抽出部１２１に入力した場合に特徴抽出部１２１から出力されるデータを事前に計算し、そのデータをプロトタイプＰ１～Ｐ４の初期値として保存する。

また、プロトタイプＰ１～Ｐ４として使用される特徴量の元データ（例えば、典型例のデータの部分領域）、または当該元データを識別するための情報（元データのＩＤ）などいった情報もプロトタイプＰ１～Ｐ４に対応付けられて保存される。典型例のデータは、データセット１１０に含まれる学習用データからユーザによって選択されてもよい。このとき、プロトタイプＰ１～Ｐ４の初期値は、ユーザによって選択された典型例のデータの部分領域から特徴抽出部１２１によって抽出される特徴量であってよい。

図３に示された例では、類似度算出部１２２によって、特徴量Ｆ１－１～特徴量Ｆ１－ＮそれぞれとプロトタイプＰ１との類似度Ｍ１（類似度マップ）が算出され、特徴量Ｆ１－１～特徴量Ｆ１－Ｎ１それぞれとプロトタイプＰ２との類似度Ｍ２（類似度マップ）が算出され、特徴量Ｆ１－１～Ｆ１－ＮそれぞれとプロトタイプＰ３との類似度Ｍ３（類似度マップ）が算出され、特徴量Ｆ１－１～Ｆ１－ＮそれぞれとプロトタイプＰ４との類似度Ｍ４（類似度マップ）が算出される。

特徴量Ｆ１－１～Ｆ１－ＮとプロトタイプＰ１～Ｐ４との各組み合わせに対応する類似度は、どのように算出されてもよい。例えば、類似度算出部１２２は、特徴量Ｆ１－１～Ｆ１－ＮとプロトタイプＰ１～Ｐ４との各組み合わせに対応する類似度を、各組み合わせにおいて対応する要素同士の差分の二乗和（Ｌ２ノルム）を用いて算出することができる。例えば、Ｌ２ノルムの逆数は、要素同士の差分の二乗和が小さいほど（特徴量とプロトタイプとの距離が近いほど）大きくなるため、類似度として好適に用いられ得る。

一例として、特徴抽出部１２１から出力された特徴量の部分特徴量をｚ’とすると、類似度Ｍｉｊ（ｉ：特徴量からの切り出される領域数、ｊ：プロトタイプ数）は、類似度算出部２２２によって以下の数式（２）に示されるように算出されてよい。なお、類似度の算出方法は、本発明の第１の実施形態と同様に、かかる例に限定されない。

（推論部１２３～評価部１４０）
図１２に戻って説明を続ける。推論部１２３は、本発明の第１の実施形態と同様に、類似度算出部１２２から出力された類似度Ｍ１～Ｍ４に基づいて推論を行って推論値を得る。そして、推論部１２３は、推論値を評価部１４０に出力する。

（更新部２５０）
更新部２５０は、評価部１４０から出力された評価結果に基づいて、特徴抽出ＮＮの重みパラメータ１３２と、推論ＮＮの重みパラメータ１３３との更新を行う。また、本発明の第２の実施形態においては、更新部２５０が、評価部１４０から出力された評価結果に基づいて、プロトタイプデータ２３４も更新する場合を主に想定する。しかし、プロトタイプデータ２３４は、更新されなくてもよい。これらの更新は、本発明の第１の実施形態における更新と同様に実行され得る。

以上、本発明の第２の実施形態に係る学習装置２０によって実行される「学習段階」について説明した。

（２－２．修正段階）
続いて、本発明の第２の実施形態に係る学習装置１０によって実行される「修正段階」について説明する。「修正段階」においても、学習段階と同様に、入力部１１５、特徴抽出部１２１、類似度算出部２２２および推論部１２３において各自の処理が実行される。

（出力制御部２６１）
推論部１２３によって推論値が算出されると、出力制御部２６１は、入力部１１５によって取得された学習用データ（入力データ）と、プロトタイプに対応付けられている（プロトタイプの）元データとが出力部１６２によって出力されるように出力部１６２を制御する。さらに、出力制御部２６１は、類似度算出部２２２によって算出された類似度が出力部１６２によって出力されるように出力部１６２を制御してよい。これによって、類似度算出部２２２によって算出された類似度がユーザによって認識され得る。また、出力制御部２６１は、推論部１２３によって得られた推論値が出力部１６２によって出力されるように出力部１６２を制御してもよい。

図１４は、ユーザに類似度を修正させるための類似度修正画面の例を示す図である。図１４を参照すると、出力部１６２によって表示される類似度修正画面Ｗ２が示されている。図１４を参照すると、出力制御部２６１は、入力部１１５によって取得された学習用データ（入力データＧ１）と、（元データＲ１の特徴量に該当し得る）プロトタイプに対応付けられている（プロトタイプの）元データＲ１とが出力部１６２によって表示されるように出力部１６２を制御している。

さらに、出力制御部２６１は、類似度算出部１２２によって算出された類似度（現在の類似度）が出力部１６２によって表示されるように出力部１６２を制御する。出力制御部２６１は、学習用データ（入力データＧ１）のうち（元データＲ１の特徴量に該当し得る）プロトタイプとの類似度が所定の類似度よりも高い部分特徴量が抽出される領域（以下、「類似領域」とも言う。）の位置が出力部１６２によって表示されるように出力部１６２を制御する。所定の類似度が具体的にどのような値であるかは限定されない。

図１４に示された例では、学習用データ（入力データＧ１）のうち（元データＲ１の特徴量に該当し得る）プロトタイプとの類似度が所定の類似度よりも高い部分特徴量が抽出される類似領域Ｇ１１の位置が示されている。なお、学習用データ（入力データＧ１）のうち類似領域Ｇ１１の外側は、類似度が所定の類似度以下である部分特徴量が抽出される領域（以下、「非類似領域」とも言う。）である。

なお、類似領域Ｇ１１の表現の仕方は限定されない。例えば、図１４に示されたように、類似領域Ｇ１１の輪郭線が表示されてもよいし、類似領域Ｇ１１に対して何らかの修飾（例えば、着色など）が付されてもよい（すなわち、類似領域が可視化されたヒートマップが作成されてもよい）。また、類似領域Ｇ１１の形は図１４に示されたように四角形で表示してもよいし、ヒートマップ状で表示してもよい。

ユーザは、操作部１７１に対して、類似領域Ｇ１１の位置を移動する操作を（例えば、ドラッグアンドドロップ操作などによって）入力することが可能である。なお、類似領域Ｇ１１の位置を移動する操作は、移動後の類似領域Ｇ１１の位置をクリックする操作であってもよい。また、類似領域Ｇ１１の位置の移動前後において、類似領域Ｇ１１のサイズおよび形は同じであってもよいし、類似領域Ｇ１１のサイズおよび形の少なくともいずれか一方が変化してもよい。ユーザが、操作部１７１に対して、類似領域Ｇ１１の位置を第１の位置から、プロトタイプとの類似度が所定の類似度以下である第２の位置に移動する操作を入力すると、記録制御部２７２は、当該操作に基づいて、類似度修正データを生成する。

例えば、図１４に示された例では、類似領域Ｇ１１が入力データＧ１に写る「犬」の「足部」であると判断されている。しかし、ユーザが、入力データＧ１に写る「犬」の「頭部」が類似領域であると考えた場合を想定する。かかる場合、ユーザは、操作部１７１に対して、類似領域Ｇ１１を「犬」の「足部」の位置（第１の位置）から「頭部」の位置（第２の位置）に移動する操作を入力する。

（記録制御部２７２）
図１５は、ユーザによる類似度修正後の類似度修正画面の例を示す図である。図１５を参照すると、出力部１６２によって表示される類似度修正画面Ｗ３が示されている。図１５を参照すると、類似領域Ｇ１１が「犬」の「頭部」に移動されている。このとき、記録制御部２７２は、（移動前の類似領域Ｇ１１の位置である）「足部」の位置に対応する類似度が所定の類似度以下であり、かつ、（移動後の類似領域Ｇ１１の位置である）「頭部」の位置に対応する類似度が所定の類似度よりも高い類似度修正データを生成する。

なお、所定の類似度以下の値、および、所定の類似度よりも高い値それぞれが、具体的にどのような値であるかは限定されない。記録制御部２７２は、生成した類似度修正データを類似度修正データ２７３として図示しない記憶部に記録する。一例として、操作部１７１に対して、ユーザが修正を実行させる操作（例えば、ボタンＢ８０を選択する操作）を入力すると、記録制御部２７２は、生成した類似度修正データを類似度修正データ２７３として図示しない記憶部に記録する。

なお、本発明の第２の実施形態においても、本発明の第１の実施形態と同様に、記録制御部２７２は、類似度の修正の終了条件が満たされたか否かを判断する。記録制御部２７２は、類似度の修正の終了条件が満たされていないと判断した場合には、引き続き類似度の修正が行われる。一方、記録制御部２７２は、類似度の修正の終了条件が満たされたと判断された場合には、類似度の修正を終了する。

以上、本発明の第２の実施形態に係る学習装置２０によって実行される「修正段階」について説明した。

（２－３．再学習段階）
続いて、本発明の第２の実施形態に係る学習装置２０によって実行される「再学習段階」について説明する。本発明の第２の実施形態に係る学習装置２０によって実行される「再学習段階」は、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」と同様である。

以上、本発明の第２の実施形態に係る学習装置２０によって実行される「再学習段階」について説明した。

（２－４．第２の実施形態のまとめ）
以上に説明したように、本発明の第２の実施形態に係る学習装置２０において、類似度算出部２２２は、特徴量の一部の領域（部分領域）と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する。評価部１４０は、正解値と推論値と類似度と類似度修正データ２７３とに基づいて評価結果を得る。更新部１５０は、評価結果に基づいて、特徴抽出ＮＮの重みパラメータの更新を行う。

かかる構成によれば、本発明の第１の実施形態が奏する効果と同様の効果が奏される。また、特徴抽出ＮＮのパラメータを修正するために、学習用データから抽出される特徴量に対応する類似度の修正を、学習用データの部分領域ごとに（領域単位で）行うことが可能となる。

以上、本発明の第２の実施形態について説明した。

（３．ハードウェア構成例）
続いて、本発明の実施形態に係る学習装置１０のハードウェア構成例について説明する。

以下では、本発明の実施形態に係る学習装置１０のハードウェア構成例として、情報処理装置９００のハードウェア構成例について説明する。なお、以下に説明する情報処理装置９００のハードウェア構成例は、学習装置１０のハードウェア構成の一例に過ぎない。したがって、学習装置１０のハードウェア構成は、以下に説明する情報処理装置９００のハードウェア構成から不要な構成が削除されてもよいし、新たな構成が追加されてもよい。

図１６は、本発明の実施形態に係る学習装置１０の例としての情報処理装置９００のハードウェア構成を示す図である。情報処理装置９００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）９０１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）９０２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）９０３と、ホストバス９０４と、ブリッジ９０５と、外部バス９０６と、インタフェース９０７と、入力装置９０８と、出力装置９０９と、ストレージ装置９１０と、通信装置９１１と、を備える。

ＣＰＵ９０１は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置９００内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはＣＰＵバス等から構成されるホストバス９０４により相互に接続されている。

ホストバス９０４は、ブリッジ９０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バス等の外部バス９０６に接続されている。なお、必ずしもホストバス９０４、ブリッジ９０５および外部バス９０６を分離構成する必要はなく、１つのバスにこれらの機能を実装してもよい。

入力装置９０８は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバー等ユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ９０１に出力する入力制御回路等から構成されている。情報処理装置９００を操作するユーザは、この入力装置９０８を操作することにより、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりすることができる。

出力装置９０９は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）ディスプレイ装置、液晶ディスプレイ（ＬＣＤ）装置、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）装置、ランプ等の表示装置およびスピーカ等の音声出力装置を含む。

ストレージ装置９１０は、データ格納用の装置である。ストレージ装置９１０は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。ストレージ装置９１０は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）で構成される。このストレージ装置９１０は、ハードディスクを駆動し、ＣＰＵ９０１が実行するプログラムや各種データを格納する。

通信装置９１１は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置９１１は、無線通信または有線通信のどちらに対応してもよい。

以上、本発明の実施形態に係る学習装置１０のハードウェア構成例について説明した。

（４．まとめ）
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。

１０、２０学習装置
１１０データセット
１１５入力部
１２０、２２０ニューラルネットワーク
１２１特徴抽出部
１２２、２２２類似度算出部
１２３推論部
１３４、２３４プロトタイプデータ
１４０評価部
１５０、２５０更新部
１６０保存データ
１６１、２６１出力制御部
１６２出力部
１７１操作部
１７２、２７２記録制御部
１７３、２７３類似度修正データ
１８０処理実行部

Claims

学習用データと前記学習用データの正解値とを取得する入力部と、
前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度に基づいて推論値を出力する推論部と、
前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、
ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、
前記正解値と前記推論値とに基づく第１の誤差と、前記類似度と前記修正データとに基づく第２の誤差とに基づいて評価結果を得る評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、
を備える、学習装置。
学習用データと前記学習用データの正解値とを取得する入力部と、
前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度に基づいて推論値を出力する推論部と、
前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、
ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、
前記正解値と前記推論値と前記類似度と前記修正データとに基づいて評価結果を得る評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、
を備え、
前記類似度算出部は、前記特徴量を構成する複数の領域単位で前記類似度を算出し、
前記出力制御部は、前記学習用データのうち前記プロトタイプとの類似度が所定の類似度よりも高い特徴量が抽出される類似領域の位置が第１の位置として出力されるように制御し、
前記記録制御部は、前記類似領域の位置を第１の位置から、前記プロトタイプとの類似度が所定の類似度以下である第２の位置に移動する操作に基づいて、前記修正データを生成する、
学習装置。
前記記録制御部は、前記第１の位置に対応する類似度が前記所定の類似度以下であり、かつ、前記第２の位置に対応する類似度が前記所定の類似度よりも高い修正データを生成する、
請求項２に記載の学習装置。
学習用データと前記学習用データの正解値とを取得する入力部と、
前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度に基づいて推論値を出力する推論部と、
前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、
ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、
前記正解値と前記推論値と前記類似度と前記修正データとに基づいて評価結果を得る評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行うととともに前記プロトタイプの更新を行う更新部と、
を備える、学習装置。
前記類似度算出部は、複数の学習用データそれぞれにおいて、前記推論部に出力した類似度と、前記類似度に対応する特徴量とを、保存データとして保存し、
前記更新部は、前記プロトタイプと最も類似度が高い特徴量を類似特徴量として前記保存データから検出し、前記類似特徴量によって前記プロトタイプを上書きするとともに、前記類似特徴量が抽出された学習用データの前記類似特徴量に対応する領域データによって前記プロトタイプの前記元データを更新する、
請求項４に記載の学習装置。
前記更新部は、前記類似特徴量によって前記プロトタイプを上書きした場合、前記プロトタイプの更新を停止する、
請求項５に記載の学習装置。
前記更新部は、前記プロトタイプの元データを、前記第１のニューラルネットワークの重みパラメータの更新後の特徴抽出部に入力させたことに基づいて出力される特徴量によって、前記プロトタイプを更新する、
請求項４に記載の学習装置。
学習用データと前記学習用データの正解値とを取得する入力部と、
前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度と第２のニューラルネットワークとに基づいて推論値を出力する推論部と、
前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、
ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、
前記正解値と前記推論値と前記類似度と前記修正データとに基づいて評価結果を得る評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行い、前記正解値と前記推論値と前記類似度と前記修正データとに基づいて前記第２のニューラルネットワークの重みパラメータの更新を行う更新部と、
を備える、学習装置。
前記出力制御部は、前記類似度が前記出力部によって出力されるように前記出力部を制御する、
請求項１～８のいずれか一項に記載の学習装置。
前記出力制御部は、前記推論値が前記出力部によって出力されるように前記出力部を制御する、
請求項１～９のいずれか一項に記載の学習装置。
前記記録制御部は、前記修正データを入力する操作に基づいて、前記修正データを前記記憶部に記録する、
請求項１～１０のいずれか一項に記載の学習装置。
前記学習装置は、前記重みパラメータの更新後の第１のニューラルネットワークの第１の精度に基づく所定の処理を実行する処理実行部を備える、
請求項１～１１のいずれか一項に記載の学習装置。
前記処理実行部は、前記第１の精度が所定の精度よりも低い場合に、前記第１のニューラルネットワークの重みパラメータの更新の停止、または、所定の警告情報の出力を実行する、
請求項１２に記載の学習装置。
前記所定の精度は、あらかじめ定められた値、または、前記評価結果に基づく重みパラメータの更新前における第１のニューラルネットワークの第２の精度である、
請求項１３に記載の学習装置。
前記処理実行部は、前記評価結果に基づく重みパラメータの更新前における第１のニューラルネットワークの第２の精度と前記第１の精度とが出力されるように制御する、
請求項１２に記載の学習装置。
学習用データと前記学習用データの正解値とを取得することと、
前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出することと、
前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力することと、
前記類似度に基づいて推論値を出力することと、
前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御することと、
ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録することと、
前記正解値と前記推論値とに基づく第１の誤差と、前記類似度と前記修正データとに基づく第２の誤差とに基づいて評価結果を得ることと、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行うことと、
を備える、学習方法。
コンピュータを、
学習用データと前記学習用データの正解値とを取得する入力部と、
前記学習用データと第１のニューラルネットワークとに基づいて特徴量を抽出する特徴抽出部と、
前記特徴量の一部または全部の領域と所定の元データから抽出された特徴量であるプロトタイプとの類似度を算出して出力する類似度算出部と、
前記類似度に基づいて推論値を出力する推論部と、
前記学習用データと前記プロトタイプの前記元データとが出力部によって出力されるように前記出力部を制御する出力制御部と、
ユーザによって入力された操作に基づいて前記類似度の修正データを記憶部に記録する記録制御部と、
前記正解値と前記推論値とに基づく第１の誤差と、前記類似度と前記修正データとに基づく第２の誤差とに基づいて評価結果を得る評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、
を備える、学習装置として機能させるためのプログラム。