WO2022201534A1

WO2022201534A1 - 再学習システム及び再学習方法

Info

Publication number: WO2022201534A1
Application number: PCT/JP2021/013073
Authority: WO
Inventors: 良枝今井; 政人土屋
Original assignee: 三菱電機株式会社
Priority date: 2021-03-26
Filing date: 2021-03-26
Publication date: 2022-09-29
Also published as: EP4296905A4; EP4296905A1; US20240005171A1; JPWO2022201534A1; CN117099098A; JP7412632B2

Abstract

再学習システム（１００）は、教師モデルとして使用される第一のニューラルネットワークによる認識結果に、生徒モデルとして使用される第二のニューラルネットワークの認識結果が近づくように学習された第二のニューラルネットワークを記憶するモデル記憶部（１１３）と、第二のニューラルネットワークを用いて、認識対象を示す認識対象データに対して推論を行うことで、認識対象の認識を行う認識部（１１４）と、認識の確からしさが中程度であるか否かを判断する蓄積判断部（１１６）と、認識の確からしさが中程度である場合に、認識の確からしさが中程度であると判断された認識対象データを、再学習用データとして蓄積する蓄積部（１１７）と、再学習用データを用いて、教師モデルの認識結果に、生徒モデルの認識結果が近づくように、生徒モデルを再学習するモデル学習部（１３３）とを備える。

Description

再学習システム及び再学習方法

　本開示は、再学習システム及び再学習方法に関する。

　近年、データ認識の分野では、知識蒸留が行われている。知識蒸留では、教師モデルとして事前に学習した、大きく、複雑な学習済ニューラルネットワークと、アプリケーション側に配置される生徒モデルとして、より小さく簡素なニューラルネットワークとを用意して、生徒モデルの出力データが教師モデルの出力データに近づくように生徒モデルの学習が行われる。

　例えば、特許文献１では、教師モデルに対応する生徒モデルを訓練する方法が記載されている。

特開２０２０－７１８８３号公報

　しかしながら、知識蒸留では、生徒モデルの認識性能は、教師モデルよりも劣り、知識が適切に転移されていない場合がある。

　そこで、本開示の一又は複数の態様は、転移されていない知識を適切に再学習できるようにすることを目的とする。

　本開示の一態様に係る再学習システムは、教師モデルとして使用される第一のニューラルネットワークによる認識結果に、生徒モデルとして使用される第二のニューラルネットワークの認識結果が近づくように学習された前記第二のニューラルネットワークを記憶するモデル記憶部と、前記第二のニューラルネットワークを用いて、認識対象を示す認識対象データに対して推論を行うことで、前記認識対象の認識を行う認識部と、前記認識の確からしさが中程度であるか否かを判断する判断部と、前記認識の確からしさが中程度である場合に、前記認識の確からしさが中程度であると判断された前記認識対象データを、再学習用データとして蓄積する蓄積部と、前記再学習用データを用いて、前記教師モデルの認識結果に、前記生徒モデルの認識結果が近づくように、前記生徒モデルを再学習するモデル学習部と、を備えることを特徴とする。

　本開示の一態様に係る再学習方法は、教師モデルとして使用される第一のニューラルネットワークによる認識結果に、生徒モデルとして使用される第二のニューラルネットワークの認識結果が近づくように学習された前記第二のニューラルネットワークを用いて、認識対象を示す認識対象データに対して推論を行うことで、前記認識対象の認識を行い、前記認識の確からしさが中程度であるか否かを判断し、前記認識の確からしさが中程度である場合に、前記認識の確からしさが中程度であると判断された前記認識対象データを、再学習用データとして蓄積し、前記再学習用データを用いて、前記教師モデルの認識結果に、前記生徒モデルの認識結果が近づくように、前記生徒モデルを再学習することを特徴とする。

　本開示の一又は複数の態様によれば、転移されていない知識を適切に再学習することができる。

実施の形態１に係る再学習システムの構成を概略的に示すブロック図である。コンピュータの構成を概略的に示すブロック図である。実施の形態１におけるデータ認識装置での動作を示すフローチャートである。実施の形態１における学習装置での動作を示すフローチャートである。実施の形態２に係る再学習システムの構成を概略的に示すブロック図である。

実施の形態１．
　図１は、実施の形態１に係る再学習システム１００の構成を概略的に示すブロック図である。
　再学習システム１００は、データ認識装置１１０と、学習装置１３０とを備える。
　例えば、データ認識装置１１０と、学習装置１３０とは、インターネット等のネットワーク１０１を介して通信することができる。

　なお、再学習システム１００では、学習装置１３０は、教師モデルによる認識結果に、生徒モデルの認識結果が近づくように、その生徒モデルを学習する。ここで、教師モデルとして利用されるニューラルネットワークを第一のニューラルネットワークともいい、第一のニューラルネットワークで学習され、生徒モデルとして使用されるニューラルネットワークを第二のニューラルネットワークともいう。

　データ認識装置１１０は、通信部１１１と、データ取得部１１２と、モデル記憶部１１３と、認識部１１４と、認識結果出力部１１５と、蓄積判断部１１６と、蓄積部１１７とを備える。

　通信部１１１は、通信を行う。ここでは、通信部１１１は、学習装置１３０と通信を行う。

　データ取得部１１２は、認識対象を示すデータである認識対象データを取得する。例えば、データ取得部１１２は、通信部１１１を介して、図示しない他の装置から認識対象データを取得する。ここで、認識対象は、画像、文字又は音等、どのようなものであってもよい。

　モデル記憶部１１３は、認識対象データで示される認識対象を認識するためのニューラルネットである生徒モデルを記憶する。例えば、通信部１１１は、学習装置１３０からの生徒モデルを受信して、モデル記憶部１１３は、その生徒モデルを記憶する。

　認識部１１４は、モデル記憶部１１３に記憶されている生徒モデルを用いて認識対象データに対して推論を行うことで、認識対象データで示される認識対象の認識を行う。認識部１１４は、認識結果を認識結果出力部１１５に与え、認識に使用した認識対象データ及び認識結果の確からしさを示す指標を蓄積判断部１１６に与える。その指標は、例えば、スコア、信頼度又は尤度等といわれているものである。

　認識結果出力部１１５は、認識部１１４で認識された認識結果を出力する。

　蓄積判断部１１６は、認識対象の認識の確からしさが中程度であるか否かを判断する判断部である。
　例えば、蓄積判断部１１６は、認識対象の認識の確からしさを示す指標が、その指標として想定される最大値よりも小さい上限閾値である第一の閾値と、その指標として想定される最小値よりも大きく、第一の閾値よりも小さい下限閾値である第二の閾値との間にある場合に、認識の確からしさが中程度であると判断する。最大値は、その指標がとり得る最大の値であり、最小値は、その指標がとり得る最小の値である。

　具体的には、認識結果の確からしさを示す指標は、通常、０～１の間の値となるため、上限閾値は、１よりも小さい値、下限閾値は、０よりも大きい値で、上限閾値よりも小さい値とすればよい。
　そして、蓄積判断部１１６は、認識の確からしさが中程度である場合には、認識部１１４からの認識対象データを再学習用データとして蓄積部１１７に蓄積する。

　上限閾値及び下限閾値は、予め定められていてもよく、例えば、認識部１１４から与えられる認識対象データ、又は、蓄積部１１７に蓄積される再学習用データに応じて変えられてもよい。
　例えば、蓄積判断部１１６は、上限閾値及び下限閾値の少なくとも何れか一方を、蓄積部１１７に蓄積されている再学習用データで示される認識の確からしさを示す指標の偏りに応じて変えてもよい。

　具体的には、蓄積判断部１１６は、上限閾値及び下限閾値の初期値が予め設定されており、予め定められた期間における、認識部１１４から与えられる認識対象データ、又は、蓄積部１１７に蓄積された再学習用データの中央値、平均値又は最頻値といった代表値に応じて、上限閾値及び下限閾値の少なくとも何れか一方を変更してもよい。例えば、蓄積判断部１１６は、その代表値が、上限閾値及び下限閾値の間に含まれるように、上限閾値及び下限閾値の少なくとも何れか一方を変更してもよい。具体的には、蓄積判断部１１６は、その代表値から予め定められた値だけ大きい値を上限閾値とし、その代表値から予め定められた値だけ小さい値を下限閾値としてもよい。また、蓄積判断部１１６は、その代表値が、上限閾値及び下限閾値の平均値となるように、上限閾値及び下限閾値の少なくとも何れか一方を変更してもよい。さらに、蓄積判断部１１６は、その代表値が、上限閾値及び下限閾値の平均値よりも大きい場合には、上限閾値及び下限閾値の少なくとも何れか一方を、予め定められた値だけ大きくし、その代表値が、上限閾値及び下限閾値の平均値よりも小さい場合には、上限閾値及び下限閾値の少なくとも何れか一方を、予め定められた値だけ小さくしてもよい。

　また、蓄積判断部１１６は、再学習のタイミングで、蓄積部１１７に蓄積されている再学習用データを、通信部１１１を介して、学習装置１３０に送る。

　再学習のタイミングは、例えば、蓄積部１１７に蓄積されている認識対象データの量が予め定められた量に達した場合であってもよい。
　ここで、再学習のタイミングに用いられる、蓄積部１１７に蓄積されている認識対象データの量については、学習装置１３０とデータ認識装置１１０との間の通信トラフィックに応じて定められてもよい。例えば、その通信トラフィックが大きいほど、そのデータ量が小さくなるようにすればよい。

　また、再学習のタイミングは、予め定められた期間が経過する毎であってもよい。
　さらに、再学習のタイミングは、予め定められた一連の動作が終了したタイミングであってもよい。例えば、再学習のタイミングは、ある種類の認識対象の認識が終了して、別の種類の認識対象の認識を開始するタイミングであってもよい。この場合、データ取得部１１２が取得する認識対象データで示される認識対象の種類が変化することになる。例えば、認識対象としての製品のロットが変わる場合等に、認識対象の種類が変化する。

　蓄積部１１７は、蓄積判断部１１６からの認識対象データを再学習用データとして蓄積する。

　以上に記載されたデータ認識装置１１０は、図２に示されているようなコンピュータ１５０で実現することができる。
　コンピュータ１５０は、不揮発性メモリ１５１と、揮発性メモリ１５２と、ＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）１５３と、プロセッサ１５４とを備える。

　不揮発性メモリ１５１は、コンピュータ１５０の処理に必要なデータ及びプログラムを記憶する補助記憶装置である。例えば、不揮発性メモリ１５１は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）である。

　揮発性メモリ１５２は、プロセッサ１５４に作業領域を提供する主記憶装置である。例えば、揮発性メモリ１５２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）である。

　ＮＩＣ１５３は、他の装置と通信するための通信インターフェースである。

　プロセッサ１５４は、コンピュータ１５０での処理を制御する。例えば、プロセッサ１５４は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）又はＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等である。プロセッサ１５４は、マルチプロセッサでもよい。

　例えば、データ取得部１１２、認識部１１４、認識結果出力部１１５及び蓄積判断部１１６は、プロセッサ１５４が不揮発性メモリ１５１に記憶されているプログラムを揮発性メモリ１５２に読み出して、そのプログラムを実行することで実現することができる。
　モデル記憶部１１３及び蓄積部１１７は、不揮発性メモリ１５１により実現することができる。
　通信部１１１は、ＮＩＣ１５３により実現することができる。

　なお、このようなプログラムは、ネットワーク１０１を通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。

　図１に戻り、学習装置１３０は、通信部１３１と、記憶部１３２と、モデル学習部１３３とを備える。

　通信部１３１は、通信を行う。ここでは、通信部１３１は、データ認識装置１１０と通信を行う。例えば、通信部１３１は、データ認識装置１１０からの再学習用データを受信し、そのデータを記憶部１３２に送る。

　記憶部１３２は、データ認識装置１１０からの再学習用データを記憶する。
　さらに、記憶部１３２は、データ認識装置１１０が記憶している生徒モデルと同一の構成を有するモデルである更新対象生徒モデルと、その生徒モデルの教師モデルを記憶している。この場合、記憶部１３２は、教師モデル記憶部として機能する。

　更新対象生徒モデルは、例えば、学習装置１３０において、教師モデルを用いて、生徒モデルを生成した際に、その生徒モデルをデータ認識装置１１０に送信するともに、その生徒モデルと同一のモデルを更新対象生徒モデルとして、記憶部１３２に記憶されたものであってもよい。
　また、更新対象生徒モデルは、生徒モデルの再学習のタイミングで、データ認識装置１１０から通信部１３１を介して取得された生徒モデルであってもよい。

　モデル学習部１３３は、記憶部１３２に記憶されている再学習用データを用いて、記憶部１３２に記憶されている教師モデルの認識結果に、生徒モデルの認識結果が近づくように、その生徒モデルを再学習する。

　例えば、モデル学習部１３３は、記憶部１３２に記憶された再学習用データを用いて、記憶部１３２に記憶されている教師モデルの出力を使用して、生徒モデルを再学習する。
　具体的には、モデル学習部１３３は、記憶部１３２に記憶されている更新対象生徒モデルに対してファインチューニングを行うことで、生徒モデルを再学習する。なお、更新対象生徒モデルは、データ認識装置１１０のモデル記憶部１１３に記憶されている第二のニューラルネットワークモデルと同一のモデルであるため、ここでは、第二のニューラルネットワークモデルに対してファインチューニングが行われていることとなる。

　そして、モデル学習部１３３は、再学習後の更新対象生徒モデルを、生徒モデルとして、通信部１３１を介して、データ認識装置１１０に送る。生徒モデルを受信したデータ認識装置１１０では、受信した生徒モデルをモデル記憶部１１３に記憶させて、以後、記憶された生徒モデルを用いて、認識対象の認識を行う。

　ここで、モデル学習部１３３は、記憶部１３２に記憶された再学習用データのみを用いて更新対象生徒モデルを再学習してもよいが、生徒モデルが生成された際の学習用データの少なくとも一部も加えて、再学習を行ってもよい。このようにすることにより、いわゆる致命的忘却が起きないようにすることができる。この場合、記憶部１３２は、生徒モデルが生成された際の学習用データを記憶しているものとする。この場合、記憶部１３２は、学習用データを記憶する学習用データ記憶部として機能する。

　なお、認識対象データ及び学習用データの両方を用いる場合には、モデル学習部１３３は、再学習用データ及び学習用データの少なくとも何れか一方に重みを付けて再学習を行ってもよい。
　ここで、モデル学習部１３３は、学習用データの少なくとも一部への重みと、再学習用データへの重みとを変えて、生徒モデルを再学習してもよい。この場合、モデル学習部１３３は、例えば、学習用データの重みを、再学習用データの重みよりも軽くしてもよい。

　また、モデル学習部１３３は、再学習用データを入力した際における、生徒モデルでの指標の値と、教師モデルでの指標の値との差に応じて、再学習用データへの重みを変えてもよい。例えば、その差が大きい場合に、再学習用データへの重みを大きくすることで、再学習の効果を大きくすることができる。一方、その差が大きい場合に、再学習用データへの重みを大きくすることで、生徒モデルへの影響を少なくすることもできる。

　以上に記載された学習装置１３０も、図２に示されているようなコンピュータ１５０で実現することができる。

　例えば、モデル学習部１３３は、プロセッサ１５４が不揮発性メモリ１５１に記憶されているプログラムを揮発性メモリ１５２に読み出して、そのプログラムを実行することで実現することができる。
　記憶部１３２は、不揮発性メモリ１５１により実現することができる。
　通信部１３１は、ＮＩＣ１５３により実現することができる。

　図３は、実施の形態１におけるデータ認識装置１１０での動作を示すフローチャートである。
　まず、データ取得部１１２は、認識対象データを取得する（Ｓ１０）。取得された認識対象データは、認識部１１４に与えられる。

　認識部１１４は、モデル記憶部１１３に記憶されている生徒モデルを参照して推論を行うことで、認識対象データで示される認識対象を認識する（Ｓ１１）。認識部１１４での認識結果は、認識結果出力部１１５に与えられる。また、認識部１１４での認識に使用された認識対象データ及び認識結果の確からしさを示す指標は、蓄積判断部１１６に与えられる。

　認識結果出力部１１５は、認識結果を出力する（Ｓ１２）。

　蓄積判断部１１６は、認識結果の確からしさを示す指標が、認識結果の確からしさとして中程度を示しているか否かを判断する（Ｓ１３）。認識結果の確からしさを示す指標が中程度を示している場合（Ｓ１３でＹｅｓ）には、処理はステップＳ１４に進む。認識結果の確からしさを示す指標が中程度を示していない場合（Ｓ１３でＮｏ）には、蓄積判断部１１６は、与えられた認識対象データを削除して、処理をステップＳ１５に進める。

　ステップＳ１４では、蓄積判断部１１６は、認識対象データを再学習用データとして蓄積部１１７に記憶させることで、そのデータを蓄積する。そして、処理はステップＳ１５に進む。

　ステップＳ１５では、蓄積判断部１１６は、再学習のタイミングであるか否かを判断する。再学習のタイミングである場合（Ｓ１５でＹｅｓ）には、処理はステップＳ１６に進み、再学習のタイミングではない場合（Ｓ１５でＮｏ）には、処理は終了する。

　ステップＳ１６では、蓄積判断部１１６は、蓄積部１１７に記憶されている再学習用データを読み出して、その再学習用データを、通信部１１１を介して、学習装置１３０に送る。

　図４は、実施の形態１における学習装置１３０での動作を示すフローチャートである。
　まず、通信部１３１は、データ認識装置１１０からの再学習用データを受信する（Ｓ２０）。受信された再学習用データは、記憶部１３２に送られ、記憶部１３２は、その再学習用データを記憶する。

　次に、モデル学習部１３３は、記憶部１３２に記憶された再学習用データを用いて、記憶部１３２に記憶されている教師モデルの出力を使用して、生徒モデルを再学習する（Ｓ２１）。

　次に、モデル学習部１３３は、再学習後の生徒モデルを、通信部１３１を介して、データ認識装置１１０に送る（Ｓ２２）。再学習された生徒モデルを受信したデータ認識装置１１０では、受信された生徒モデルがモデル記憶部１１３に記憶されて、以後、記憶された生徒モデルを用いて、データの認識が行われる。

　以上のように、実施の形態１では、生徒モデルを使用した認識の確からしさが中程度の認識対象データに基づいて、生徒モデルが再学習されるため、教師モデルから生徒モデルに転移されていない知識を適切に再学習することができる。このため、生徒モデルの汎化性能及び精度を向上させることができる。

　なお、認識の確からしさが中程度の認識対象データを用いて再学習を行う理由は以下の通りである。
　認識の確からしさが高い認識対象データについては、学習が適切に行われていると考えられるため、そのような認識対象データを用いた再学習は不要である。
　認識の確からしさが低い認識対象データについても、「認識対象ではない」という学習が適切に行われていると考えられるため、そのような認識対象データを用いた再学習は不要である。
　認識の確からしさが中程度の認識対象データのみを蓄積することで、蓄積するデータ量を少なくすることができる。

実施の形態２．
　図５は、実施の形態２に係る再学習システム２００の構成を概略的に示すブロック図である。
　再学習システム２００は、データ認識装置２１０と、学習装置２３０とを備える。
　例えば、データ認識装置２１０と、学習装置２３０とは、インターネット等のネットワーク１０１を介して通信することができるものとする。

　データ認識装置２１０は、通信部１１１と、データ取得部１１２と、モデル記憶部１１３と、認識部１１４と、認識結果出力部１１５と、蓄積判断部２１６とを備える。
　実施の形態２におけるデータ認識装置２１０の通信部１１１、データ取得部１１２、モデル記憶部１１３、認識部１１４及び認識結果出力部１１５は、実施の形態１におけるデータ認識装置１１０の通信部１１１、データ取得部１１２、モデル記憶部１１３、認識部１１４及び認識結果出力部１１５と同様である。
　また、実施の形態２におけるデータ認識装置２１０は、実施の形態１におけるデータ認識装置１１０の蓄積部１１７を備えていない。

　蓄積判断部２１６は、認識部１１４からの指標が中程度を示す場合には、認識部１１４からの認識対象データを再学習用データとして、通信部１１１を介して、学習装置２３０に送る。

　学習装置２３０は、通信部１３１と、記憶部２３２と、モデル学習部２３３と、蓄積部２３４とを備える。
　実施の形態２における学習装置２３０の通信部１３１は、実施の形態１における学習装置１３０の通信部１３１と同様である。
　但し、実施の形態２における通信部１３１は、データ認識装置２１０からの再学習用データを受信して、そのデータを蓄積部２３４に与える。

　蓄積部２３４は、データ認識装置１１０からの再学習用データを記憶することで、そのデータを蓄積する。

　記憶部２３２は、データ認識装置１１０が記憶している生徒モデルと同一の構成を有するモデルである更新対象生徒モデルと、その生徒モデルの教師モデルを記憶する。
　なお、実施の形態２では、蓄積部２３４が設けられているため、記憶部２３２は、データ認識装置２１０からの再学習用データを記憶しない。なお、記憶部２３２は、生徒モデルが生成された際の学習用データを記憶していてもよい。

　モデル学習部２３３は、再学習のタイミングで、蓄積部２３４に記憶された再学習用データを用いて、記憶部２３２に記憶されている教師モデルの出力を使用して、生徒モデルを再学習する。ここでは、モデル学習部２３３は、記憶部２３２に記憶されている更新対象生徒モデルに対してファインチューニングを行うことで、生徒モデルの再学習を行う。

　そして、モデル学習部２３３は、再学習後の更新対象生徒モデルを、生徒モデルとして、通信部１３１を介して、データ認識装置２１０に送る。生徒モデルを受信したデータ認識装置２１０では、受信した生徒モデルをモデル記憶部１１３に記憶させて、以後、記憶された生徒モデルを用いて、データの認識を行う。

　以上に記載された学習装置２３０も、図２に示されているようなコンピュータ１５０で実現することができる。
　具体的には、蓄積部２３４も不揮発性メモリ１５１により実現することができる。

　なお、実施の形態２では、モデル学習部２３３が再学習のタイミングであるか否かを判断しているが、実施の形態２は、このような例に限定されない。例えば、実施の形態１と同様に、蓄積判断部２１６が再学習のタイミングであるか否かを判断してもよい。この場合、蓄積判断部２１６は、再学習のタイミングである場合に、通信部１１１を介して学習装置２３０に、再学習の指示を送ればよい。そして、このような指示を受けた学習装置２３０のモデル学習部２３３が、生徒モデルの再学習を行えばよい。

　なお、以上に記載された実施の形態１及び２では、モデル学習部１３３、２３３は、更新対象生徒モデルを更新すること、言い換えると、更新対象生徒モデルに対してファインチューニングを行うことで、生徒モデルの再学習を行っているが、実施の形態１及び２は、このような例に限定されない。例えば、モデル学習部１３３、２３３は、生徒モデルを生成した際の学習用データに、再学習用データを追加して、新たなニューラルネットワークを生成することで、生徒モデルを再学習してもよい。ここで生成されるニューラルネットワークを、既に生徒モデルとして使用されている第二のニューラルネットワークと区別するために、第三のニューラルネットワークともいう。この場合にも、モデル学習部１３３、２３３は、学習用データへの重みと、再学習用データへの重みとを変えて、生徒モデルを再学習してもよい。

　なお、以上に記載された実施の形態１及び２では、データ認識装置１１０、２１０がモデル記憶部１１３を備えているが、実施の形態１及び２は、このような例に限定されない。例えば、モデル記憶部１１３は、ネットワーク１０１に接続されている学習装置２３０又は他の装置に備えられていてもよい。

　また、以上に記載された実施の形態２では、学習装置２３０が蓄積部２３４を備えているが、実施の形態２は、このような例に限定されない。例えば、蓄積部２３４は、データ認識装置２１０及び学習装置２３０以外の、ネットワーク１０１に接続されている他の装置に備えられていてもよい。また、記憶部１３２、２３２についても、データ認識装置２１０及び学習装置２３０以外の、ネットワーク１０１に接続されている他の装置に備えられていてもよい。

　さらに、教師モデルとして使用される第一のニューラルネットワークは、生徒モデルとして使用される第二のニューラルネットワークよりも、規模が大きく、かつ、複雑なニューラルネットワークでもよく、第一のニューラルネットワークは、第二のニューラルネットワークと同一のニューラルネットワークであってもよい。

　１００　再学習システム、　１１０　データ認識装置、　１１１　通信部、　１１２　データ取得部、　１１３　モデル記憶部、　１１４　認識部、　１１５　認識結果出力部、　１１６　蓄積判断部、　１１７　蓄積部、　１３０　学習装置、　１３１　通信部、　１３２　記憶部、　１３３　モデル学習部。

Claims

　教師モデルとして使用される第一のニューラルネットワークによる認識結果に、生徒モデルとして使用される第二のニューラルネットワークの認識結果が近づくように学習された前記第二のニューラルネットワークを記憶するモデル記憶部と、
　前記第二のニューラルネットワークを用いて、認識対象を示す認識対象データに対して推論を行うことで、前記認識対象の認識を行う認識部と、
　前記認識の確からしさが中程度であるか否かを判断する判断部と、
　前記認識の確からしさが中程度である場合に、前記認識の確からしさが中程度であると判断された前記認識対象データを、再学習用データとして蓄積する蓄積部と、
　前記再学習用データを用いて、前記教師モデルの認識結果に、前記生徒モデルの認識結果が近づくように、前記生徒モデルを再学習するモデル学習部と、を備えること
　を特徴とする再学習システム。
　前記判断部は、前記認識の確からしさを示す指標が、前記認識の確からしさを示す指標として想定される最大値よりも小さい第一の閾値と、前記認識の確からしさを示す指標として想定される最小値よりも大きく、前記第一の閾値よりも小さい第二の閾値との間にある場合に、前記認識の確からしさが中程度であると判断すること
　を特徴とする請求項１に記載の再学習システム。
　前記判断部は、前記第一の閾値及び前記第二の閾値の少なくとも何れか一方を、前記再学習用データで示される前記認識の確からしさを示す指標の偏りに応じて変えること
　を特徴とする請求項２に記載の再学習システム。
　前記モデル学習部は、前記蓄積部に蓄積されている前記再学習用データの量が、予め定められた量に達した場合に、前記生徒モデルの再学習を行うこと
　を特徴とする請求項１から３の何れか一項に記載の再学習システム。
　前記モデル学習部は、予め定められた期間が経過する毎に、前記生徒モデルの再学習を行うこと
　を特徴とする請求項１から３の何れか一項に記載の再学習システム。
　前記モデル学習部は、予め定められた一連の動作が終了した場合に、前記生徒モデルの再学習を行うこと
　を特徴とする請求項１から３の何れか一項に記載の再学習システム。
　前記モデル学習部は、前記第二のニューラルネットワークに対してファインチューニングを行うことで、前記生徒モデルを再学習すること
　を特徴とする請求項１から６の何れか一項に記載の再学習システム。
　前記第二のニューラルネットワークを学習する際に使用された学習用データを記憶する記憶部をさらに備え、
　前記モデル学習部は、前記学習用データの少なくとも一部及び前記再学習用データを用いて、前記ファインチューニングを行うこと
　を特徴とする請求項７に記載の再学習システム。
　前記モデル学習部は、前記学習用データの少なくとも一部への重みと、前記再学習用データへの重みとを変えて、前記生徒モデルを再学習すること
　を特徴とする請求項８に記載の再学習システム。
　前記第二のニューラルネットワークを学習する際に使用された学習用データを記憶する記憶部をさらに備え、
　前記モデル学習部は、前記学習用データ及び前記再学習用データを用いて、前記生徒モデルとして使用される第三のニューラルネットワークを新たに学習することで、前記生徒モデルを再学習すること
　を特徴とする請求項１から６の何れか一項に記載の再学習システム。
　前記モデル学習部は、前記学習用データへの重みと、前記再学習用データへの重みとを変えて、前記生徒モデルを再学習すること
　を特徴とする請求項１０に記載の再学習システム。
　教師モデルとして使用される第一のニューラルネットワークによる認識結果に、生徒モデルとして使用される第二のニューラルネットワークの認識結果が近づくように学習された前記第二のニューラルネットワークを用いて、認識対象を示す認識対象データに対して推論を行うことで、前記認識対象の認識を行い、
　前記認識の確からしさが中程度であるか否かを判断し、
　前記認識の確からしさが中程度である場合に、前記認識の確からしさが中程度であると判断された前記認識対象データを、再学習用データとして蓄積し、
　前記再学習用データを用いて、前記教師モデルの認識結果に、前記生徒モデルの認識結果が近づくように、前記生徒モデルを再学習すること
　を特徴とする再学習方法。