JP7462206B2

JP7462206B2 - 学習装置、学習方法、及び学習プログラム

Info

Publication number: JP7462206B2
Application number: JP2020014223A
Authority: JP
Inventors: 信人馬目; 修二篠原
Original assignee: University of Tokyo NUC
Current assignee: University of Tokyo NUC
Priority date: 2020-01-30
Filing date: 2020-01-30
Publication date: 2024-04-05
Anticipated expiration: 2040-01-30
Also published as: JP2021120825A

Description

本発明は、学習装置、学習方法、及び学習プログラムに関する。

従来から、画像処理及び音声処理等において、学習ベクトル量子化（Learning Vector Quantization，ＬＶＱ）を使用して情報を符号化することが知られている。ＬＶＱは、入力ベクトルｘをラベルＬ（ｘ）に割り当てるプロトタイプベクトルを学習する教師あり学習モデルであり、例えば、特許文献１に示すように、入力ベクトルｘに対するラベルを出力する分類器として使用可能なのでパターン認識等に活用される。

ＬＶＱを使用した機械学習において、入力層、競合層及び出力層を有するＬＶＱニューラルネットワークが用いられる。入力層は、入力ベクトルｘを格納する。競合層は、各ラベルを代表する特徴ベクトルであるプロトタイプベクトルｍ_iとラベルＬ（ｍ_i）を有し、入力層から得られた入力ベクトルｘと最近傍にあるプロトタイプベクトルを出力する。出力層は、競合層から得られたプロトタイプベクトルのラベルＬを線形に出力する。

非特許文献１に示すように、ＬＶＱニューラルネットワークによる学習アルゴリズムでは、例えば、以下の（１）～（４）の手順で実行される。
（１）学習データの入力特徴量に相当する入力ベクトルｘが入力層に入力される。
（２）競合層において、入力層から得られた入力ベクトルｘと最近傍にあるプロトタイプベクトルのラベルＬが「勝者」に決定される。
（３）入力ベクトルｘのラベルＬ（ｘ）と「勝者」に決定されたプロトタイプベクトルのラベルＬとが同一であった場合は、プロトタイプベクトルを学習率に応じて入力ベクトルに近づける。入力ベクトルｘのラベルＬ（ｘ）と「勝者」に決定されたプロトタイプベクトルのラベルＬとが異なる場合はプロトタイプベクトルを学習率に応じて入力ベクトルから遠ざける。
（４）上記（１）～（３）の処理を繰り返してプロトタイプベクトルを学習する。

特開２００４－１１０１９６号公報

T. Kohonen, "Improved versions of learning vector quantization," in Proceedings of the IEEE International Joint Conference on Neural Networks, pp.545-550, 1990

ＬＶＱ等のように学習率を使用してオンライン機械学習が可能な学習モデルでは、学習率は、予め数式等により設定されたアルゴリズムに基づいて、学習回数が増加するに従って減少するように調整される。しかしながら、学習率は、学習モデルの学習精度に影響を与えるため、学習データ毎に複数の学習率を試して適切な学習率を検証するため、学習効率が低くなるおそれがあった。

本発明は、このような課題を解決すべくなされたものであり、学習率を自律して更新可能な学習装置、学習方法、及び学習プログラムを提供することを目的とする。

本発明に係る学習装置は、入力特徴量が入力された学習モデルによって出力された予測ラベルと入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す共起頻度情報、プロトタイプラベル、及びプロトタイプラベルに対応するプロトタイプ特徴量をそれぞれが含む複数のプロトタイプを記憶する記憶部と、入力特徴量を示す入力特徴量データと、入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを取得する学習データ取得部と、学習モデルを使用して、予測ラベルを取得する予測ラベル取得部と、少なくとも教師ラベルと予測ラベルとの間の一致度に基づいて、共起頻度情報を変更する共起頻度変更部と、プロトタイプ特徴量を更新するときに使用される学習率を、変更された共起頻度情報に基づいて更新する学習率更新部と、学習率に基づいて、プロトタイプ特徴量を更新するプロトタイプ特徴量更新部とを有する。

さらに、本発明に係る学習装置では、共起頻度情報は、予測ラベルが教師ラベルに一致した頻度を示す第１共起頻度と、予測ラベルが教師ラベルに一致しなかった頻度を示す第２共起頻度とを含むことが好ましい。

学習率更新部は、第１共起頻度と第２共起頻度の合計の頻度における第１共起頻度の比率が増加するに従って学習率が低下するように、学習率を更新することが好ましい。

さらに、本発明に係る学習装置では、第１共起頻度は、学習モデルが予測する予測ラベルがプロトタイプラベルに一致し、且つ、予測ラベルが教師ラベルに一致した頻度を示し、第２共起頻度は、学習モデルが予測する予測ラベルがプロトタイプラベルに一致し、且つ、予測ラベルが教師ラベルに一致しなかった頻度を示し、共起頻度情報は、学習モデルが予測する予測ラベルがプロトタイプラベルに一致せず、且つ、予測ラベルが教師ラベルに一致した頻度を示す第３共起頻度と、学習モデルが予測する予測ラベルがプロトタイプラベルに一致せず、且つ、予測ラベルが教師ラベルに一致しなかった頻度を示す第４共起頻度と、を更に含むことが好ましい。

学習率更新部は、第１共起頻度、第２共起頻度、第３共起頻度及び第４共起頻度の合計の頻度における第１共起頻度及び第４共起頻度の合計の比率が増加するに従って学習率が低下するように、学習率を更新することが好ましい。

さらに、本発明に係る学習装置では、学習率更新部は、変更された共起頻度情報に基づいて、入力特徴量と関連付けられた教師ラベルを、入力特徴量の入力に応じて学習モデルが予測ラベルとして出力する確度を示す確信度を演算する確信度演算部と、確信度から、学習モデルが学習するときに使用される学習率を演算する学習率演算部と、を有することが好ましい。

さらに、本発明に係る学習装置では、学習率演算部は、確信度が上昇するに従って学習率が低下するように学習率を演算することが好ましい。

さらに、本発明に係る学習装置では、プロトタイプ特徴量更新部は、複数のプロトタイプの全てに対応する前記学習率を変更することが好ましい。

また、本発明に係る学習方法は、入力特徴量が入力された学習モデルによって出力された予測ラベルと入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す共起頻度情報、プロトタイプラベル、及びプロトタイプラベルに対応するプロトタイプ特徴量をそれぞれが含む複数のプロトタイプを記憶する記憶部を有する学習装置に学習モデルを学習させる学習方法であって、入力特徴量を示す入力特徴量データと、入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを取得し、学習モデルを使用して、予測ラベルを取得し、少なくとも教師ラベルと予測ラベルとの間の一致度に基づいて、共起頻度情報を変更し、プロトタイプ特徴量を更新するときに使用される学習率を、変更された共起頻度情報に基づいて更新し、学習率に基づいて、プロトタイプ特徴量を更新することを含む。

本発明に係る制御プログラムは、入力特徴量が入力された学習モデルによって出力された予測ラベルと入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す共起頻度情報、プロトタイプラベル、及びプロトタイプラベルに対応するプロトタイプ特徴量をそれぞれが含む複数のプロトタイプを記憶する記憶部を有する学習装置に学習モデルを学習させる制御プログラムであって、入力特徴量を示す入力特徴量データと、入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを取得し、学習モデルを使用して、予測ラベルを取得し、少なくとも教師ラベルと予測ラベルとの間の一致度に基づいて、共起頻度情報を変更し、プロトタイプ特徴量を更新するときに使用される学習率を、変更された共起頻度情報に基づいて更新し、学習率に基づいて、プロトタイプ特徴量を更新する処理を学習装置に実行させる。

本発明に係る学習装置、学習方法、及び学習プログラムは、学習率を自律して更新できる。

実施形態に係る学習装置の概要を説明するための説明図である。実施形態に係る学習装置のブロック図である。図２に示す学習モデルの模式図である。図２に示すプロトタイプテーブルを示す図である。図２に示す学習率テーブルを示す図である。図２に示す学習装置による学習処理を示すフローチャートである。図６に示すＳ１０３の処理のより詳細な処理を示すフローチャートである。図６に示すＳ１０４の処理のより詳細な処理を示すフローチャートである。

以下、図面を参照しつつ、本発明の様々な実施形態について説明する。ただし、本発明の技術的範囲はそれらの実施形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。

（実施形態に係る学習装置の概要）
図１は、実施形態に係る学習装置の概要を説明するための説明図である。実施形態に係る学習装置は、例えば、パーソナル・コンピュータ（Personal Computer、ＰＣ）である。実施形態に係る学習装置は、サーバ装置、タブレット端末又はタブレットＰＣ等の電子計算機であってもよい。

学習装置１は、入力特徴量を示す入力特徴量データと、入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを使用して、記憶部に記憶されるプロトタイプ特徴量を更新することで学習モデルを学習させる学習処理を実行する。より詳細には、学習装置１は、取得した学習データから予測ラベルを取得し、教師ラベルと予測ラベルとの一致度に基づいて学習モデルの共起頻度情報を変更する。共起頻度情報は、入力特徴量が入力された学習モデルによって出力された予測ラベルと入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す。学習装置１は、変更した共起頻度情報から学習率を変更し、変更された学習率を用いて学習モデルのプロトタイプ特徴量を更新して学習モデルを学習させる。学習装置１が実行する学習処理は、オンライン機械学習として実行可能である。

以下、学習装置１が、ＬＶＱニューラルネットワークを学習モデルとして使用する学習アルゴリズムを例に、学習モデルを更新する学習処理の概略について説明する。

学習装置１の記憶部は、「りんご」、「みかん」、「ぶどう」及び「なし」のそれぞれに対応する４つのプロトタイプを記憶する。４つのプロトタイプのそれぞれは、プロトタイプラベルＬ（ｍ_i）と、プロトタイプラベルに対応するプロトタイプベクトルｍ_i、及び共起頻度情報（ａ_i、ｂ_i、ｃ_i及びｄ_i）を含む。ここで、添え字「ｉ」は、１～４の数字であり、添え字「１」は「りんご」に対応し、添え字「２」は「みかん」に対応し、添え字「３」は「ぶどう」に対応し、添え字「４」は「なし」に対応する。また、プロトタイプベクトルｍ_iは、プロトタイプ特徴量の一例である。

学習モデル１２０は、入力ベクトルｘが入力されることに応じて予測ラベルＬ（ｍ_j）を出力する。

共起頻度情報は、第１共起頻度ａ_i、第２共起頻度ｂ_i、第３共起頻度ｃ_i及び第４共起頻度ｄ_iを含む。第１共起頻度ａ_iは、学習モデル１２０が予測する予測ラベルがプロトタイプラベルに一致し、且つ、予測ラベルが教師ラベルに一致した回数を示す。第２共起頻度ｂ_iは、学習モデル１２０が予測する予測ラベルがプロトタイプラベルに一致し、且つ、予測ラベルが教師ラベルに一致しなかった回数を示す。第３共起頻度ｃ_iは、学習モデル１２０が予測する予測ラベルがプロトタイプラベルに一致せず、且つ、予測ラベルが教師ラベルに一致した回数を示す。第４共起頻度ｄ_iは、学習モデ１２０ルが予測する予測ラベルがプロトタイプラベルに一致せず、且つ、予測ラベルが教師ラベルに一致しなかった回数を示す。

「りんご」、「みかん」、「ぶどう」及び「なし」に対応する共起頻度情報は、教師ラベルＬ（ｘ）と、プロトタイプラベルＬ(ｍ_i）と、予測ラベルＬ（ｍ_j）との間の一致度に基づいて、「１」が加算される。例えば、教師ラベルＬ（ｘ）、プロトタイプラベルＬ(ｍ_i）及び予測ラベルＬ（ｍ_j）の全てが「りんご」であるとき、「りんご」に対応する第１共起頻度ａ₁に「１」が加算される。また、教師ラベルＬ（ｘ）及びプロトタイプラベルＬ(ｍ_i）が「りんご」であり、予測ラベルＬ（ｍ_j）が「みかん」であるとき、「りんご」に対応する第２共起頻度ｂ₁に「１」が加算される。また、教師ラベルＬ（ｘ）及び予測ラベルＬ（ｍ_j）が「りんご」であり、プロトタイプラベルＬ(ｍ_i）が「みかん」であるとき、「みかん」に対応する第３共起頻度ｃ₂に「１」が加算される。また、教師ラベルＬ（ｘ）及び予測ラベルＬ（ｍ_j）が「りんご」であり、プロトタイプラベルＬ(ｍ_i）が「みかん」であるとき、「みかん」に対応する第４共起頻度ｄ₂に「１」が加算される。

まず、学習装置１は、入力ベクトルｘを示す入力特徴量データと、入力ベクトルｘと関連付けられた教師ラベルＬ（ｘ）を示す教師ラベルデータとを含む学習データを取得する。ここでは、入力ベクトルｘは「りんご」の画像に対応し、教師ラベルＬ（ｘ）は「りんご」である。次いで、学習装置１は、学習モデル１２０を使用して、予測ラベルＬ（ｍ_j）を取得する。ここでは、予測ベクトルＬ（ｍ_j）は、教師ラベルＬ（ｘ）と同一の「りんご」である。

次いで、学習装置１は、教師ラベルＬ（ｘ）、プロトタイプラベルＬ（ｍ_i）及び予測ラベルＬ（ｍ_j）との一致度に基づいて共起頻度情報を変更する。教師ラベルＬ（ｘ）及び予測ベクトルＬ（ｍ_j）は「りんご」であるので、「りんご」に係る第１共起頻度ａ₁は「１」が加算され、第２共起頻度ｂ₁～第４共起頻度ｄ₁は同一値を維持する。

プロトタイプベクトルが「りんご」ではない「みかん」、「ぶどう」及び「なし」に係る共起頻度では、第４共起頻度ｄ₂、ｄ₃及びｄ₄は「１」が加算される。一方、「みかん」、「ぶどう」及び「なし」に係る共起頻度では、第１共起頻度ａ₂、ａ₃及びａ₄、第２共起頻度ｂ₂、ｂ₃及びｂ₄並びに第３共起頻度ｃ₂、ｃ₃及びｃ₄は同一値を維持する。

次いで、学習装置１は、変更された共起頻度に基づいて、確信度Ｒ_iを、「りんご」、「みかん」、「ぶどう」及び「なし」のそれぞれについて式（１）を使用して演算する。確信度Ｒ_iは、入力特徴量と関連付けられた教師ラベルＬ（ｘ）を学習モデル１２０が入力特徴量の入力に応じて予測ラベルＬ（ｍ_j）として出力する確度を示す。式（１）は、第１共起頻度ａ_i及び第２共起頻度ｂ_iを第３共起頻度ｃ_i及び第４共起頻度ｄ_iよりも重み付けして確信度Ｒ_iを演算することを示す。。

次いで、学習装置１は、学習モデルが学習するときに使用される学習率α_iを、「りんご」、「みかん」、「ぶどう」及び「なし」のそれぞれについて式（２）を使用して確信度Ｒ_iから演算する。式（２）は、確信度Ｒ_iが上昇するに従って学習率α_iが低下することを示すので、学習率α_iは、学習が進展して確信度Ｒ_iが上昇するに伴って低下する。

次いで、学習装置１は、演算された学習率に基づいて、「りんご」、「みかん」、「ぶどう」及び「なし」のそれぞれについて式（３）を使用してプロトタイプベクトルｍ_i、を更新する。ここでは、予測ラベルＬ（ｍ_j）に一致する「りんご」のプロトタイプベクトルｍ₁は更新され、予測ラベルＬ（ｍ_j）に一致しない「みかん」、「ぶどう」及び「なし」のプロトタイプベクトルｍ₂～ｍ₄は更新されない。

学習装置１は、確信度Ｒ_iを使用して自律的に学習率α_iを更新するので、学習精度を向上させるために適切な学習率を設定するために学習処理を繰り返す必要がなく、学習効率が向上する。

（実施形態に係る学習装置の構成及び機能）
図２は、学習装置１のブロック図である。

学習装置１は、通信部１１と、記憶部１２と、入力部１３と、出力部１４と、処理部２０とを有する。学習装置１は、入力特徴量を示す入力特徴量データと、入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを使用して、記憶部に記憶されるプロトタイプ特徴量を更新することで学習モデルを学習させる学習処理を実行する。通信部１１、記憶部１２、入力部１３、出力部１４及び処理部２０は、バス１５を介して通信可能に接続される。

通信部１１は、Bluetooth（登録商標）の通信方式に従った近距離無線通信を行い、外部装置との間で端末間無線通信を確立させて、直接無線通信を行う。近距離無線通信の通信方式は、Bluetooth（登録商標）に限定されず、例えば、Bluetooth Low Energy等でもよい。また、通信部１１は、近距離無線通信を行うためのものに限定されず、例えば、赤外線通信等による各種信号を受信するものでもよい。この場合、通信部１１は、外部装置から受信した所定の電波を特定の信号に変調してデータを生成してもよい。また、通信部１１は、ＵＳＢ（Universal Serial Bus）等と接続するためのインタフェース、有線又は無線のＬＡＮ（Local Area Network）の通信インターフェース等を含む、通信インターフェースでもよい。

記憶部１２は、例えば、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）等の半導体メモリ装置、磁気テープ装置、磁気ディスク装置、又は光ディスク装置のうちの少なくとも一つを備える。記憶部１２は、処理部２０での処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、制御プログラム及びデータ等を記憶する。記憶部１２に記憶されるドライバプログラムは、通信部１１を制御する通信デバイスドライバプログラム、入力部１３を制御する入力デバイスドライバプログラム、及び、出力部１４を制御する出力デバイスドライバプログラム等である。記憶部１２に記憶される制御プログラムは、後述する各種処理を実行するためのアプリケーションプログラム等である。記憶部１２に記憶される各種プログラムは、例えばＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて記憶部１２にインストールされてもよい。

記憶部１２は、例えば学習モデル１２０、複数のプロトタイプを示すプロトタイプテーブル１２１、及び学習率テーブル１２２を記憶する。また、記憶部１２は、所定の処理に係るデータを一時的に記憶してもよい。

図３は、学習モデル１２０の模式図である。

学習モデル１２０は、入力層、競合層及び出力層を有し、入力特徴量の一例である入力ベクトルｘが入力されることに応じて予測ラベルを出力する。入力層、競合層及び出力層は、少なくとも１つの人工ニューロン（以下、単に「ニューロン」と称する）が設定される。

入力層は、学習データに含まれる入力特徴量データに対応する入力ベクトルｘが入力される。入力特徴量データは、所定のデータ配列にしたがった複数のデータを含むデータ群である。入力特徴量データが総ピクセル数ｎの画像データであるとき、入力ベクトルｘ｛ｘ₁，ｘ₂，・・・ｘ_n｝は、当該画像データの各ピクセルの色の値等を示すｘ₁，ｘ₂，・・・ｘ_nである。入力ベクトルｘは、どのようなベクトルでもよい。例えば、入力特徴量データが花に関する４種類の属性パラメータ値である場合、入力ベクトルｘ｛ｘ₁，ｘ₂，ｘ₃，ｘ₄｝は、花びらの長さの値ｘ₁、花びらの幅の値ｘ₂、萼片の長さの値ｘ₃、及び萼片の幅の値ｘ₄である。

競合層は、プロトタイプベクトルに対応するニューロンを含む。競合層に含まれるニューロンの数は、予め設定された複数のラベルの数（ｋ）以上である。例えば、複数のラベルのうちのｉ番目のラベルのプロトタイプベクトルは、ｍ_i｛μ₁，μ₂，・・・μ_n｝である。競合層のｋ個のニューロンのそれぞれにおいて、入力層から入力された入力ベクトルｘ｛ｘ₁，ｘ₂，・・・ｘ_n｝とプロトタイプベクトルｍ_i｛μ₁，μ₂，・・・μ_n｝との間の距離が算出される。なお、プロトタイプベクトルｍ_iの次元数は、入力ベクトルｘの次元数と同一であり、プロトタイプベクトルｍ_iにおけるμ₁，μ₂，・・・μ_nの初期値は、どのような値でもよい。

出力層は、競合層の各ニューロンから出力された距離の中で最も短い距離に対応するプロトタイプラベルを、予測ラベルＬ（ｍ_j）として出力する。

図４は、プロトタイプテーブル１２１を示す図である。

プロトタイプテーブル１２１は、プロトタイプラベルＬ（ｍ_i）、プロトタイプベクトルｍ_i、及び共起頻度情報（ａ_i、ｂ_i、ｃ_i及びｄ_i）のそれぞれをプロトタイプ毎に識別子に関連付けて記憶する。識別子「１」に関連付けられるプロトタイプは「りんご」に対応し、識別子「２」に関連付けられるプロトタイプは「みかん」に対応する。また、識別子「３」に関連付けられるプロトタイプは「ぶどう」に対応し、識別子「４」に関連付けられるプロトタイプは「なし」に対応する。なお、プロトタイプテーブル１２１は、４つのプロトタイプを記憶するが、プロトタイプテーブルに記憶されるプロトタイプの数は、複数であればよい。また、プロトタイプが記憶部１２に記憶される態様は、プロトタイプテーブル１２１に限定されない。

図５は、学習率テーブル１２２を示す図である。

学習率テーブル１２２は、学習率α_iをプロトタイプ毎に、学習率テーブル１２２の識別子と同一の識別子に関連付けて記憶する。識別子「１」に関連付けられる学習率α₁は「りんご」に対応する学習率であり、識別子「２」に関連付けられる学習率α₂は「みかん」に対応する学習率である。また、識別子「３」に関連付けられる学習率α₃は「ぶどう」に対応する学習率であり、識別子「４」に関連付けられる学習率α₄は「なし」に対応する学習率である。なお、学習率テーブル１２２は、４つの学習率α_iを記憶するが、学習率テーブルに記憶される学習率α_iの数は、プロトタイプテーブルに記憶されるプロトタイプの数と同一であればよい。

入力部１３は、例えば、キーボード、マウス、又は、タッチパネル等のポインティングデバイスである。ユーザは、入力部１３を用いて、文字、数字及び記号、若しくは、出力部１４の表示画面上の位置等を入力することができる。入力部１３は、ユーザにより操作されると、その操作に対応する信号を発生する。そして、発生した信号は、ユーザの指示として処理部２０に供給される。

出力部１４は、液晶ディスプレイである。なお、出力部１４は、有機ＥＬ（Electro-Luminescence）ディスプレイ等でもよい。出力部１４は、処理部２０から供給された映像データに応じた映像や、画像データに応じた画像等を表示する。

処理部２０は、一又は複数個のプロセッサ及びその周辺回路を備える。処理部２０は、学習装置１の全体的な動作を統括的に制御するものであり、例えば、ＣＰＵ（Central Processing Unit）である。処理部２０は、記憶部１２に記憶されているプログラム及びユーザによる入力部１３の操作に応じて入力された各種指示等に基づいて、各種情報処理を適切な手順で実行し、且つ、通信部１１及び出力部１４の動作を制御する。処理部２０は、記憶部１２に記憶されているオペレーティングシステムプログラム、ドライバプログラム及び制御プログラムに基づいて各種情報処理を実行する。また、処理部２０は、複数のプログラムを並列に実行することができる。

処理部２０は、学習データ取得部２１と、予測ラベル取得部２２と、共起頻度変更部２３と、学習率更新部２４と、プロトタイプ特徴量更新部２５とを有する。学習率更新部２４は、確信度演算部２６と、学習率演算部２７とを有する。これらの各部は、処理部２０が備えるプロセッサで実行されるプログラムにより実現される機能モジュールである。あるいは、これらの各部は、ファームウェアとして学習装置１に実装されてもよい。

（学習装置１による学習処理）
図６は、学習装置１による学習処理を示すフローチャートである。図６に示す学習処理は、予め記憶部１２に記憶されている制御プログラムに基づいて、主に処理部２０により、学習装置１の各要素と協働して実行される。

まず、学習データ取得部２１は、入力特徴量を示す入力特徴量データと、入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを取得する（Ｓ１０１）。具体的には、学習データ取得部２１は、入力ベクトルｘを示す入力特徴量データと、入力ベクトルｘと関連付けられた教師ラベルＬ（ｘ）を示す教師ラベルデータとを含む学習データを取得する。

次いで、予測ラベル取得部２２は、学習モデル１２０を使用して、予測ラベルを取得する（Ｓ１０２）。予測ラベル取得部２２は、学習モデル１２０の入力層に入力ベクトルｘを入力して、学習モデル１２０から出力されるラベルを予測ラベルＬ（ｍ_j）として取得する。

次いで、共起頻度変更部２３は、教師ラベルＬ（ｘ）、予測ラベルＬ（ｍ_j）及びプロトタイプラベルＬ（ｍ_i）の間の一致度に基づいて、共起頻度情報を変更する（Ｓ１０３）。共起頻度変更部２３は、教師ラベルＬ（ｘ）、予測ラベルＬ（ｍ_j）及びプロトタイプラベルＬ（ｍ_i）が一致するか否かを示す情報を共起頻度情報に反映するように共起頻度情報を変更する。

図７は、図６に示すＳ１０３の処理のより詳細な処理を示すフローチャートである。

まず、共起頻度変更部２３は、識別子ｉに関連付けられたプロトタイプラベルＬ（ｍ_i）をプロトタイプテーブル１２１から取得する（Ｓ２０１）。次いで、共起頻度変更部２３は、Ｓ２０１で取得したプロトタイプラベルＬ（ｍ_i）とＳ１０２の処理で取得された予測ラベルＬ（ｍ_j）とが一致するか否かを判定する（Ｓ２０２）。

共起頻度変更部２３は、プロトタイプラベルＬ（ｍ_i）と予測ラベルＬ（ｍ_j）とが一致すると判定する（Ｓ２０２－ＹＥＳ）と、予測ラベルＬ（ｍ_j）とＳ１０１で取得した教師ラベルＬ（ｘ）とが一致するか否かを判定する（Ｓ２０３）。

共起頻度変更部２３は、予測ラベルＬ（ｍ_j）と教師ラベルＬ（ｘ）とが一致すると判定する（Ｓ２０３－ＹＥＳ）と第１共起頻度ａ_iに数値「１」を加算する（Ｓ２０４）。共起頻度変更部２３は、予測ラベルＬ（ｍ_j）と教師ラベルＬ（ｘ）とが一致しないと判定する（Ｓ２０３－ＮＯ）と第２共起頻度ｂ_iに数値「１」を加算する（Ｓ２０５）。

共起頻度変更部２３は、プロトタイプラベルＬ（ｍ_i）と予測ラベルＬ（ｍ_j）とが一致しないと判定する（Ｓ２０２－ＮＯ）と、予測ラベルＬ（ｍ_j）とＳ１０１で取得した教師ラベルＬ（ｘ）とが一致するか否かを判定する（Ｓ２０６）。

共起頻度変更部２３は、予測ラベルＬ（ｍ_j）と教師ラベルＬ（ｘ）とが一致すると判定する（Ｓ２０６－ＹＥＳ）と第３共起頻度ｃ_iに数値「１」を加算する（Ｓ２０７）。共起頻度変更部２３は、予測ラベルＬ（ｍ_j）と教師ラベルＬ（ｘ）とが一致しないと判定する（Ｓ２０６－ＮＯ）と第４共起頻度ｄ_iに数値「１」を加算する（Ｓ２０８）。

Ｓ１０３の処理が終了すると、学習率更新部２４は、Ｓ１０３の処理で変更された共起頻度に基づいて、プロトタイプテーブル１２１に記憶されるプロトタイプ特徴量を更新するときに使用される学習率を更新する（Ｓ１０４）。

図８は、図６に示すＳ１０４の処理のより詳細な処理を示すフローチャートである。

まず、確信度演算部２６は、Ｓ１０３の変更された共起頻度情報に基づいて、確信度Ｒ_iを演算する（Ｓ３０１）。確信度演算部２６は、２つの事象の因果関係を示す式である因果推論モデルを使用して確信度Ｒ_iを演算する。具体的には、確信度演算部２６は、以下の式（１）を使用して、プロトタイプテーブル１２１に記憶される共起頻度毎に確信度Ｒ_iを演算する。

次いで、学習率演算部２７は、Ｓ３０１の処理で演算された確信度Ｒ_iから学習率α_iを演算し（Ｓ３０２）、演算した学習率α_iを学習率テーブル１２２に記憶する。具体的には、学習率演算部２７は、以下の式（２）を使用して、プロトタイプテーブル１２１に記憶される共起頻度情報毎に学習率α_iを演算する。

Ｓ１０４の処理が終了すると、学習率更新部２４は、学習率テーブル１２２において識別子に関連付けられて記憶された全ての学習率α_iを更新したか否かを判定する（Ｓ１０５）。学習率更新部２４によって学習率テーブル１２２において識別子に関連付けられて記憶された全ての学習率α_iを更新したと判定される（Ｓ１０５－ＹＥＳ）まで、Ｓ１０３～Ｓ１０５の処理が繰り返される。Ｓ１０３～Ｓ１０５の処理が繰り返されることで、「りんご」、「みかん」、「ぶどう」及び「なし」のそれぞれに対応する学習率α₁～α₄が順次更新される。

学習率テーブル１２２の全ての学習率α_iを更新したと判定される（Ｓ１０５－ＹＥＳ）と、プロトタイプ特徴量更新部２５は、Ｓ１０４の処理で更新された学習率に基づいて、プロトタイプテーブル１２１に記憶されたプロトタイプ特徴量を更新する（Ｓ１０６）。具体的には、プロトタイプ特徴量更新部２５は、プロトタイプテーブル１２１に記憶されるプロトタイプベクトルｍ_iを、Ｓ１０４の処理で更新された学習率α_iに基づいて、式（３）を使用して更新する。

プロトタイプ特徴量更新部２５がプロトタイプ特徴量を更新することで、学習データを使用した学習モデル１２０の学習処理は終了する。

（実施形態に係る学習装置の作用効果）
学習装置１は、確信度Ｒ_iを使用して自律的に学習率α_iを更新するので、学習精度を向上させるために適切な学習率を設定するために学習処理を繰り返す必要がなく、学習効率が向上する。

また、学習装置１では、学習率α_iは、学習が進展して確信度Ｒ_iが上昇するに伴って低下するので、確信度Ｒ_iが略１００％になると学習率α_iは略０％になり、学習装置１は、学習を停止させることなく、確信度Ｒ_iが高い予測ラベルＬ（ｍ_j）を出力可能になる。

また、学習装置１では、１つの学習データに基づいて、全てのプロトタイプに対応する学習率α_iが更新されるので、学習装置１は、より少ない学習データで確信度Ｒ_iが高い予測ラベルＬ（ｍ_j）を出力可能になる。

（実施形態に係る学習装置の変形例）
学習装置１は、ＬＶＱニューラルネットワークを学習モデルとして使用するが、実施形態に係る学習装置は、学習率を使用してオンライン機械学習が可能な学習モデルを学習モデルとして使用してもよい。また、学習装置１は、学習モデル１２０を記憶部１２に記憶するが、実施形態に係る学習装置は、使用する学習モデルを記憶部に記憶せずにインターネット及びＬＡＮ等の通信網を介して通信可能に接続されたサーバに記憶された学習モデルを使用してもよい。

また、学習装置１は、式（１）を使用して確信度Ｒ_iを演算するが、実施形態に係る学習装置は、少なくとも教師ラベルＬ（ｘ）と予測ラベルＬ（ｍ_j）との間の一致度に基づいて、前記共起頻度を変更すればよい。

例えば、確信度Ｒ_iは、以下の式（４）を使用して演算されてもよい。

式（４）を使用して確信度Ｒ_iを演算するとき、第１共起頻度ａ_iは予測ラベルが前記教師ラベルに一致した回数を示し、第２共起頻度ｂ_iは予測ラベルが前記教師ラベルに一致した回数を示してもよい。

また、確信度Ｒ_iは、以下の式（５）～（７）の何れかを使用して演算されてもよい。

また、学習装置１は、式（２）を使用して学習率α_iを演算するが、実施形態に係る学習装置は、確信度Ｒ_iが上昇するに従って学習率α_iが低下するように前記学習率を演算すればよい。例えば、学習装置１は、第１共起頻度と第２共起頻度の合計の頻度における第１共起頻度の比率が増加するに従って学習率が低下するように、学習率を更新してもよい。また、第１共起頻度、第２共起頻度及び第３共起頻度の合計の頻度における第１共起頻度の比率が増加するに従って学習率が低下するように、学習率を更新してもよい。さらに、第１共起頻度、第２共起頻度、第３共起頻度及び第４共起頻度の合計の頻度における第１共起頻度及び前記第４共起頻度の合計の比率が増加するに従って学習率が低下するように、学習率を更新してもよい。

また、学習装置１は、式（１）及び（２）を使用して共起頻度情報から学習率α_iを演算するが、実施形態に係る学習装置は、共起頻度情報から確信度Ｒ_iを演算することなく学習率α_iを直接演算してもよい。

なお、学習装置１では、第１共起頻度ａ_i、第２共起頻度ｂ_i、第３共起頻度ｃ_i及び第４共起頻度ｄ_iは回数として規定されたが、実施形態に係る学習装置では、それぞれの事象が発生する頻度を示すパラメータと規定されればよい。

１学習装置
２１学習データ取得部
２２予測ラベル取得部
２３共起頻度変更部
２４学習率更新部
２５プロトタイプ特徴量更新部
２６確信度演算部
２７学習率演算部
１２０学習モデル

Claims

入力特徴量が入力された学習モデルによって出力された予測ラベルと前記入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す共起頻度情報、プロトタイプラベル、及び前記プロトタイプラベルに対応するプロトタイプ特徴量をそれぞれが含む複数のプロトタイプを記憶する記憶部と、
前記入力特徴量を示す入力特徴量データと、前記教師ラベルを示す教師ラベルデータとを含む学習データを取得する学習データ取得部と、
前記学習モデルを使用して、前記予測ラベルを取得する予測ラベル取得部と、
少なくとも前記教師ラベルと前記予測ラベルとの間の一致度に基づいて、前記共起頻度情報を変更する共起頻度変更部と、
前記プロトタイプ特徴量を更新するときに使用される学習率を、変更された前記共起頻度情報に基づいて更新する学習率更新部と、
前記学習率に基づいて、前記プロトタイプ特徴量を更新するプロトタイプ特徴量更新部と、
を有することを特徴とする学習装置。
前記共起頻度情報は、
前記予測ラベルが前記教師ラベルに一致した頻度を示す第１共起頻度と、
前記予測ラベルが前記教師ラベルに一致しなかった頻度を示す第２共起頻度と、
を含む、請求項１に記載される学習装置。
前記学習率更新部は、前記第１共起頻度と前記第２共起頻度の合計の頻度における前記第１共起頻度の比率が増加するに従って前記学習率が低下するように、前記学習率を更新する、請求項２に記載される学習装置。
前記第１共起頻度は、前記学習モデルが予測する予測ラベルが前記プロトタイプラベルに一致し、且つ、前記予測ラベルが前記教師ラベルに一致した頻度を示し、
前記第２共起頻度は、前記学習モデルが予測する予測ラベルが前記プロトタイプラベルに一致し、且つ、前記予測ラベルが前記教師ラベルに一致しなかった頻度を示し、
前記共起頻度情報は、
前記学習モデルが予測する予測ラベルが前記プロトタイプラベルに一致せず、且つ、前記予測ラベルが前記教師ラベルに一致した頻度を示す第３共起頻度と、
前記学習モデルが予測する予測ラベルが前記プロトタイプラベルに一致せず、且つ、前記予測ラベルが前記教師ラベルに一致しなかった頻度を示す第４共起頻度と、
を更に含む、請求項２に記載される学習装置。
前記学習率更新部は、前記第１共起頻度、前記第２共起頻度、前記第３共起頻度及び前記第４共起頻度の合計の頻度における前記第１共起頻度及び前記第４共起頻度の合計の比率が増加するに従って前記学習率が低下するように、前記学習率を更新する、請求項４に記載される学習装置。
前記学習率更新部は、
変更された前記共起頻度情報に基づいて、前記入力特徴量と関連付けられた前記教師ラベルを、前記入力特徴量の入力に応じて前記学習モデルが前記予測ラベルとして出力する確度を示す確信度を演算する確信度演算部と、
前記確信度から、前記学習モデルが学習するときに使用される学習率を演算する学習率演算部と、
を有する請求項１～５の何れか一項に記載される学習装置。
前記学習率演算部は、前記確信度が上昇するに従って前記学習率が低下するように前記学習率を演算する、請求項６に記載される学習装置。
前記プロトタイプ特徴量更新部は、前記複数のプロトタイプの全てに対応する前記学習率を変更する、請求項１～５の何れか一項に記載される学習装置。
入力特徴量が入力された学習モデルによって出力された予測ラベルと前記入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す共起頻度情報、プロトタイプラベル、及び前記プロトタイプラベルに対応するプロトタイプ特徴量をそれぞれが含む複数のプロトタイプを記憶する記憶部を有する学習装置に学習モデルを学習させる学習方法であって、
入力特徴量を示す入力特徴量データと、前記入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを取得し、
前記学習モデルを使用して、前記予測ラベルを取得し、
少なくとも前記教師ラベルと前記予測ラベルとの間の一致度に基づいて、前記共起頻度情報を変更し、
前記プロトタイプ特徴量を更新するときに使用される学習率を、変更された前記共起頻度情報に基づいて更新し、
前記学習率に基づいて、前記プロトタイプ特徴量を更新する、
ことを含むことを特徴とする学習方法。
入力特徴量が入力された学習モデルによって出力された予測ラベルと前記入力特徴量に関連付けられた教師ラベルとが一致した頻度を少なくとも示す共起頻度情報、プロトタイプラベル、及び前記プロトタイプラベルに対応するプロトタイプ特徴量をそれぞれが含む複数のプロトタイプを記憶する記憶部を有する学習装置に学習モデルを学習させる制御プログラムであって、
入力特徴量を示す入力特徴量データと、前記入力特徴量と関連付けられた教師ラベルを示す教師ラベルデータとを含む学習データを取得し、
前記学習モデルを使用して、前記予測ラベルを取得し、
少なくとも前記教師ラベルと前記予測ラベルとの間の一致度に基づいて、前記共起頻度情報を変更し、
前記プロトタイプ特徴量を更新するときに使用される学習率を、変更された前記共起頻度情報に基づいて更新し、
前記学習率に基づいて、前記プロトタイプ特徴量を更新する、
処理を前記学習装置に実行させることを特徴とする学習プログラム。