JP7283554B2

JP7283554B2 - 学習装置、学習方法、及び、プログラム

Info

Publication number: JP7283554B2
Application number: JP2021548298A
Authority: JP
Inventors: 周平吉田; 真寺尾
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2019-09-27
Filing date: 2019-09-27
Publication date: 2023-05-30
Anticipated expiration: 2039-09-27
Also published as: JPWO2021059527A1; US20220335712A1; WO2021059527A1

Description

本発明は、画像に含まれる物体を認識する技術に関する。

近年、機械学習を用いた認識技術は、画像認識の分野を中心に極めて高い性能を示すようになっている。機械学習に基づく認識技術の高い精度は、大量の正解付き学習データに支えられている。しかし、データの収集と正解付けにかかるコストは高く、特に多クラス分類の正解付けにかかるコストは、クラス数が増えるごとに増大する。

多クラス分類において、全ての認識対象に対して正解付けを行う代わりに、一部の認識対象のみに対して正解付けをした部分ラベルのデータセットを用いる手法が非特許文献１に提案されている。

Ｃｉｄ－Ｓｕｅｉｒｏ，Ｊ．，Ｇａｒｃｉａ－Ｇａｒｃｉａ，Ｄ．、ａｎｄＳａｎｔｏｓ－Ｒｏｄｏｒｉｇｕｅｚ、Ｒ．， "Ｃｏｎｓｉｓｔｅｎｃｙｏｆｌｏｓｓｅｓｆｏｒｌｅａｒｎｉｎｇｆｒｏｍｗｅａｋｌａｂｅｌｓ"，ＩｎＥＣＭＬ－ＰＫＤＤ，２０１４．

しかし、上記の文献は、複数の部分データセットにより構成される学習データを用いて認識モデルを学習する方法を提示してはいない。

本発明の１つの目的は、複数の部分データセットの集合として構成される学習データを用いる場合に、適切な交差行列を用いて損失を算出し、認識モデルの学習を行うことにある。

上記の課題を解決するため、本発明の一つの観点は、学習用データセットを用いて学習を行う学習装置であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習装置は、
前記学習用データセットを供給するデータセット供給手段と、
供給された学習用データセット中の認識対象データに対する認識結果を出力する認識手段と、
前記学習用データセットに基づいて交差行列を算出する交差行列算出手段と、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出する認識損失算出手段と、
前記認識損失に基づいて前記認識手段のパラメータを更新する更新手段と、
を備える。

本発明の他の観点は、学習用データセットを用いた学習方法であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習方法は、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する。

本発明のさらにほかの観点は、学習用データセットを用いた学習処理のプログラムであって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記プログラムは、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する学習処理をコンピュータに実行させる。

本発明によれば、複数の部分データセットの集合として構成される学習データを用いる場合に、適切な交差行列を用いて損失を算出し、認識モデルの学習を行うことが可能となる。

多クラス分類問題の場合の通常のデータセットとエキスパートデータセットの例を示す。物体検知問題の場合の通常のデータセットとエキスパートデータセットの例を示す。第１実施形態の学習装置のハードウェア構成を示すブロック図である。第１の学習装置の機能構成を示すブロック図である。第１の学習装置による学習処理のフローチャートである。第２の学習装置の機能構成を示すブロック図である。カテゴリー事前分布の推定方法を説明する図である。第２の学習装置による交差行列算出処理のフローチャートである。多クラス分類の実施例に係る学習装置の機能構成を示すブロック図である。物体検知の実施例に係る学習装置の機能構成を示すブロック図である。第２実施形態に係る学習装置の機能構成を示すブロック図である。

以下、図面を参照して、本発明の好適な実施形態について説明する。なお、以下の説明においては、表記の便宜上、文字の上に付く記号を文字の前に付して表記する。例えば、集合Ａの補集合は、文字「Ａ」の前に「－（バー）」を付して、「^－Ａ」と記す。

［エキスパートデータセット］
まず、本発明の実施形態において使用するエキスパートデータセットについて説明する。
［１］多クラス分類問題の場合
まず、多クラス分類問題の場合について説明する。「エキスパートデータセット」とは、多クラス分類のモデルを学習する際に使用できる学習用データセットであり、複数の部分データセットにより構成されるものである。具体的に、エキスパートデータセットは、以下の条件を具備するように構成される。
（Ａ）複数の部分データセットの各々には、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられている。
（Ｂ）認識対象とする全てのカテゴリーが、複数の部分データセットのいずれかに割り当てられている。
（Ｃ）部分データセットに含まれる各データには、当該部分データセットに割り当てられた責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解ラベルが付与されている。

図１は、多クラス分類問題の場合の通常のデータセットと、エキスパートデータセットの例を示す。図１（Ａ）は、学習に使用される通常のデータセットを示す。いま、画像データに基づいて１００クラスの多クラス分類を行う物体認識モデルを学習するものとする。通常の学習用データセットとしては、用意された画像データの各々について、１００クラス、即ち、１００カテゴリーのうちの１つが正解ラベルとして割り当てられる（「正解付け」と呼ぶ。）。よって、通常のデータセットを使用する場合、多クラスＤＢに含まれる各画像データに対して、１００カテゴリーのうちのいずれかを正解付けする作業が必要となるが、これは実際にはかなりの労力を要する。

図１（Ｂ）は、エキスパートデータセットの例を示す。なお、このエキスパートデータセットでも、図１（Ａ）の例と同様に全体で１００クラスの多クラス分類を行うものとする。エキスパートデータセットでは、複数の部分データセットを用意する。図１（Ｂ）の例では、「水生哺乳類」、「人」などの複数の部分データセットが用意される。そして、各部分データセットには、それぞれ責任範囲が設定される。「水生哺乳類」の部分データセットには、５種類の水生哺乳類、「ビーバー」、「イルカ」、「カワウソ」、「アザラシ」、「クジラ」が責任範囲として割り当てられる。「人」の部分データセットには、５種類の人、「赤ん坊」、「男の子」、「女の子」、「男性」、「女性」が責任範囲として割り当てられる。ここで、責任範囲は、認識対象とする全てのカテゴリーが、複数の部分データセットのいずれかに割り当てられるように決定されている。即ち、いずれの部分データセットにも割り当てられていないカテゴリーが存在しないように、１００カテゴリーが複数の部分データセットに割り当てられている。言い換えると、複数の部分データセットにより、１００カテゴリーの認識対象全てが網羅されるように責任範囲が決定されている。これにより、エキスパートデータセットによっても、図１（Ａ）に示す通常のデータセットと同様に、１００クラスの多クラス分類の学習が可能となる。

但し、エキスパートデータセットでは、複数の部分データセットを用いるため、通常のデータセットとは正解データの構造が異なる。具体的に、各部分データセットに含まれる画像データに対しては、その責任範囲に属するカテゴリーのいずれかを示す正解ラベル、又は、その画像データのカテゴリーがその部分データセットの責任範囲に属さないことを示す正解ラベルが用意される。図１（Ｂ）の例では、「水生哺乳類」の部分データセットに含まれる画像データに対しては、「ビーバー」、「イルカ」、「カワウソ」、「アザラシ」、「クジラ」のいずれかを示す正解ラベル、又は、その画像データのカテゴリーがその部分データセットの責任範囲に属さないことを示す「水生哺乳類でない」という正解ラベルが用意される。

このようなエキスパートデータセットを用いると、学習データに対する正解付けの作業負荷が大幅に軽減される。図１（Ａ）に示す通常のデータセットの場合、用意された全ての画像データに対して１００カテゴリーのいずれかを正解ラベルとして付与する必要がある。例えば、学習データとして６万枚の画像データが用意された場合、それら全てに対して１００カテゴリーのいずれかを正解ラベルとして割り当てる必要がある。これに対して、図１（Ｂ）に示すエキスパートデータセットの場合には、６万枚の画像データを例えば２０の集合に分け、２０個の部分データセットを用意する。また、認識対象となる１００カテゴリーを２０の集合に分け、各部分データセットに責任範囲として５カテゴリーを割り当てる。こうすると、図１（Ｂ）に示すように、各部分データセットに属する画像データに対しては、その部分データセットに属する５カテゴリーのいずれかの正解ラベル、又は、その部分データセットの責任範囲に属さないことを示す正解ラベルの合計６個の正解ラベルのいずれかを付与すればよい。即ち、各部分データセットに含まれる３０００枚の画像データに対して、６個の正解ラベルのいずれかを付与すればよい。

次に、上記の通常のデータセット及びエキスパートデータセットのデータ構造について説明する。いま、データ空間Ｘの要素ｘを正解候補集合Ｙの要素である正解カテゴリーｙに分類する多クラス分類問題を考える。
（１）多クラス分類問題における通常のデータセット
通常のデータセットは、データ空間Ｘの要素であるデータｘと、正解候補集合Ｙの要素である正解カテゴリーｙとの組（ｘ，ｙ）の集合Ｄ

である。

（２）多クラス分類問題におけるエキスパートデータセット
各部分データセットには、それが専門とする正解候補集合Ｚが定まっている。但し、正解候補集合Ｚは正解候補集合Ｙの部分集合である。
部分データセットは、データ空間Ｘの要素である（ラベルの付いていない）データｘと、ラベルｚと、部分データセットを表す正解候補集合Ｚの組（ｘ，ｚ，Ｚ）の集合である。ここで、ｚは、正解候補集合Ｚの要素であるか、ｚ＝Ｚの補集合（便宜上、「^－Ｚ」と記す。）である。ｚが正解候補集合Ｚの要素であるとき、データｘはカテゴリーｚに属する。ｚ＝^－Ｚのとき、データｘは正解候補集合Ｚに含まれないいずれかのカテゴリーに属する。
学習時には、複数の部分データセットを集めて、それぞれの部分データセットに対応する各正解候補集合Ｚの要素を集めると、正解候補集合Ｙの要素が尽くされているようにする。

［２］物体検知問題の場合
次に、物体検知問題の場合について説明する。エキスパートデータセットは、物体検知問題にも使用することができる。物体検知問題とは、画像データ中の物体候補（領域提案／デフォルトボックス）が物体か否か、物体であれば何の物体かを分類し、その座標と位置を推定する問題である。なお、物体検知問題は、デフォルトボックス単位で考えれば、そのデフォルトボックスに対する多クラス分類と考えることができる。

図２（Ａ）は、物体検知問題の場合の通常のデータセットの例を示す。この例では、検知対象の物体クラスとして、「バッグ」、「人」、「車いす」が用意される。なお、これらに加えて、物体検知においては、検知対象カテゴリーに属するいずれの物体も存在しないことを示す「背景」クラスが用意される。なお、「背景」は検知対象カテゴリーではないことが前提となる。通常のデータセットでは、学習用データとして使用される全ての画像データに含まれるデフォルトボックスに対して、これら４つのクラスのいずれかを割り当てた正解ラベルが用意される。

図２（Ｂ）は、物体検知問題の場合のエキスパートデータセットの例を示す。物体検知の場合でも、エキスパートデータセットの基本的な概念は前述の多クラス分類の場合と同様であり、エキスパートデータセットは前述の条件（Ａ）～（Ｃ）を具備する。図２（Ｂ）の例では、「バッグ」と「人」を責任範囲とする部分データセットＤＳ１と、「車いす」を責任範囲とする部分データセットＤＳ２が用意されている。この例では、部分データセットＤＳ１については、正解ラベルとして「バッグ」、「人」、「バッグと人でない」、「背景」が用意される。部分データセットＤＳ２については、正解ラベルとして、「車いす」、「車いすでない」、「背景」が用意される。

次に、上記の通常のデータセット及びエキスパートデータセットのデータ構造を説明する。いま、入力画像に含まれる物体の種類とバウンディングボックスを出力する物体検知問題を考える。ここで、入力画像はデータ空間Ｘの要素ｘである。１つの画像ｘに含まれる検知対象物体の数は任意である。正解データは、（検知対象カテゴリー集合Ｙの要素である）カテゴリーｙとバウンディングボックスｂの組（ｙ，ｂ）で表現される。バウンディングボックスの表現方法は、ここでは任意とする。なお、通常、バウンディングボックスは、その中心座標（あるいは左上点座標）と縦横の長さの組で表現される。

（１）物体検知問題における通常のデータセット
通常のデータセットは、画像ｘと、画像ｘに含まれるＫ個の検知対象物体全ての集合

との組

の集合

である。

（２）物体検知問題におけるエキスパートデータセット
各部分データセットには、それが専門とする正解候補集合Ｚが定まっている。但し、正解候補集合Ｚは正解候補集合Ｙの部分集合である。
画像ｘには、Ｋ個の検知対象物体

のうち、カテゴリーｙ_ｊが正解候補集合Ｚに属するもののみが正解として与えられている。

各サンプルは、多クラス分類問題と同様の３つの組

である（但し、ｚ_ｊ∈Ｚ）。
学習時には、複数の部分データセットを集めて、それぞれの部分データセットに対応する正解候補集合Ｚの要素を集めると、正解候補集合Ｙの要素が尽くされているようにする。

［３］エキスパートデータセットの生成について
図１（Ｂ）の例では、学習データとして用意された６万枚の画像データを均等に２０の部分データセットに分けているが、各部分データセットに割り当てる画像データ数は均等である必要はなく、部分データセット毎に異なっていてもかまわない。また、図１（Ｂ）の例では、認識対象の全てのカテゴリー（１００クラス）を２０の部分データセットに責任範囲として均等に分けているが、各部分データセットに責任範囲として割り当てるカテゴリー数は均等である必要はない。即ち、各部分データセット毎に、責任範囲として割り当てられるカテゴリー数が異なっていてもよい。また、ある部分データセットに対して全てのカテゴリー、即ち、上記の例では１００個のカテゴリーが割り当てられていてもよい。

また、上記の説明では、所定数の認識対象を最初に複数の部分データセットに分け、各々に責任範囲を設定してエキスパートデータセットを生成している。このように、認識対象のカテゴリー数が最初から決まっている場合に限らず、認識対象を後から追加するような場合でもエキスパートデータセットを生成することができる。例えば、図２（Ｂ）の例に示すように、最初は「バッグ、人」を責任範囲とする部分データセットＤＳ１と、「車いす」を責任範囲とする部分データセットＤＳ２を含むエキスパートデータセットを用いて学習を行い、物体検知を行っているものとする。この状況で、新たに「荷物カート」、「ベビーカー」などを認識対象に追加するような場合には、それらを責任範囲とする新たな部分データセットを追加すればよい。その場合、既存の部分データセットＤＳ１、ＤＳ２に含まれる画像データに対して「荷物カート」や「ベビーカー」などの正解付けを新たに行う必要はないので、新たな認識対象に対する学習用データを効率的に用意することが可能となる。

［第１実施形態］
次に、エキスパートデータセットを用いた学習装置の実施形態について説明する。
［１］ハードウェア構成
図３は、第１実施形態に係る学習装置のハードウェア構成を示すブロック図である。図示のように、学習装置１００は、インタフェース１０２と、プロセッサ１０３と、メモリ１０４と、記録媒体１０５と、データベース（ＤＢ）１０６と、を備える。

インタフェース１０２は、外部装置との間でデータの入出力を行う。具体的には、学習装置１００の学習に用いられるエキスパートデータセットがインタフェース１０２を通じて入力される。

プロセッサ１０３は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、又はＣＰＵとＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することにより、学習装置１００の全体を制御する。具体的に、プロセッサ１０３は、後述する学習処理を実行する。

メモリ１０４は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などにより構成される。メモリ１０４は、学習装置１００が学習するモデルを記憶する。また、メモリ１０４は、プロセッサ１０３による各種の処理の実行中に作業メモリとしても使用される。

記録媒体１０５は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、学習装置１００に対して着脱可能に構成される。記録媒体１０５は、プロセッサ１０３が実行する各種のプログラムを記録している。学習装置１００が各種の処理を実行する際には、記録媒体１０５に記録されているプログラムがメモリ１０４にロードされ、プロセッサ１０３により実行される。

データベース１０６は、学習に使用されるエキスパートデータセットを記憶する。なお、上記に加えて、学習装置１００は、ユーザが指示や入力を行うためのキーボード、マウスなどの入力機器や表示部を備えていても良い。

（第１の学習装置の機能構成）
図４は、第１実施形態に係る第１の学習装置の機能構成を示すブロック図である。なお、この学習装置１００は、多クラス分類モデルを学習するものとする。学習装置１００は、エキスパートデータセット供給部１１１と、認識部１１２と、認識損失算出部１１３と、更新部１１４と、認識部パラメータ記憶部１１５と、交差行列算出部１１６と、交差行列記憶部１１７と、を備える。

エキスパートデータセット供給部１１１は、前述したエキスパートデータセットの入力データを認識部１１２及び認識損失算出部１１３に供給する。具体的には、エキスパートデータセット供給部１１１は、入力ｘ_ｉと、ラベルｚ_ｉと、正解候補集合Ｚ_ｉとの組｛ｘ_ｉ，ｚ_ｉ，Ｚ_ｉ｝（以下、これを「入力データの組」と呼ぶ。）を認識部１１２及び認識損失算出部１１３に供給する。認識部１１２は、内部にニューラルネットワークなどにより構成される認識モデルを有しており、画像データである入力ｘ_ｉに対する認識処理を行って認識結果｛ｆ（ｘ_ｉ）｝を認識損失算出部１１３に出力する。

一方、交差行列算出部１１６は、エキスパートデータセットの属性値に基づいて、交差行列Ｈを算出し、交差行列記憶部１１７に供給する。なお、交差行列については後に詳しく説明する。交差行列記憶部１１７は、供給された交差行列Ｈを記憶し、認識損失算出部１１３に供給する。

認識損失算出部１１３は、エキスパートデータセット供給部１１１から供給される入力データの組｛ｘ_ｉ，ｚ_ｉ，Ｚ_ｉ｝と、認識部１１２から供給される認識結果｛ｆ（ｘ_ｉ）｝と、交差行列Ｈとを用いて認識損失Ｌを算出し、更新部１１４へ供給する。認識損失Ｌについては後に詳しく説明する。更新部１１４は、認識損失Ｌに基づいて、認識部１１２の認識モデルを構成するパラメータを更新し、更新後のパラメータを認識部パラメータ記憶部１１５に供給する。認識部パラメータ記憶部１１５は、更新部１１４から供給された更新後のパラメータを記憶する。認識部パラメータ記憶部１１５に記憶されたパラメータは、認識部１１２のパラメータを更新するタイミングで読み出され、認識部１１２に設定される。こうして、エキスパートデータセットを学習用データとして用いて、認識部１１２の学習が行われる。

（交差行列）
次に、交差行列について詳しく説明する。通常のデータセットを用いて学習を行う場合、学習用の入力画像データに対して１つの正解ラベルが用意されているため、認識部による認識結果と、その正解ラベルとの損失Ｌを計算し、損失Ｌが小さくなるように認識部のパラメータが更新される。しかしながら、前述のようにエキスパートデータセットは、複数の部分データセットにより構成され、各部分データセットには認識対象の全カテゴリーのうちの一部が責任範囲として割り当てられている。各部分データセットは、責任範囲に属するカテゴリーに対してはそのうちのいずれかを示す正解ラベルを有しているが、責任範囲に属しないカテゴリーについてはその部分データセットの責任範囲に属さないことを示す正解ラベル（「○○でない」というタイプの正解ラベル）しか有していない。このため、通常のデータセットの場合のように、認識部による認識結果と正解ラベルとを単純に比較して損失Ｌを算出することができない。そこで、本実施形態では、交差行列Ｈを導入することにより、エキスパートデータセットの認識結果に対して損失Ｌを算出できるようにする。

通常のデータセットを用いた教師あり学習では、入力データｘ_ｉと正解ラベルｙ_ｉの組（ｘ_ｉ，ｙ_ｉ）の集合｛（ｘ_ｉ，ｙ_ｉ）｝に対して、以下のように損失関数が定義される。

これに対し、エキスパートデータセットにおける部分データセットでは、正解ラベルｙ_ｉの代わりに、正解ラベルｙ_ｉの候補を含む正解候補集合Ｚ_ｉが与えられる。そこで、部分データセットに含まれる正解候補集合Ｚ_ｉと、正解カテゴリーｙとを関連付ける交差行列Ｈを導入する。交差行列Ｈは、正解カテゴリーｙを行添え字に持ち、正解カテゴリーｙ又は「○○でない」というタイプの正解ラベル^－Ｚ_ｉを列添え字に持つ長方形の行列となる。この交差行列Ｈを用いると、入力データの組｛ｘ_ｉ，ｚ_ｉ，Ｚ_ｉ｝に対する損失関数は以下のように計算することができる。

式（８）が示すように、エキスパートデータセットに対する認識損失Ｌは、任意のロス関数を用いて各入力データｘ_ｉの認識結果と全ての正解カテゴリーｙとの損失を算出し、それらを交差行列Ｈが示す重みを用いて重み付け加算して得られるものとなる。よって、交差行列Ｈを適切に生成することにより、エキスパートデータセットを用いた場合でも認識損失Ｌを算出することができる。その結果、エキスパートデータセットを用いた場合でも、通常のデータセットを用いた場合に近い認識精度が得られるように認識部を学習することが可能となる。

次に、交差行列の算出方法について説明する。
（１）多クラス分類問題
まず、多クラス分類問題の場合について説明する。交差行列Ｈを算出するために、行列Ｍ（「遷移行列」とも呼ぶ。）を以下のように定める。

ここで、式（９）の各要素は、エキスパートデータセットに関する以下の属性値である。
・「ｄ」：部分データセットを表す添え字、「Ｎ_Ｄ」：部分データセットの数
・ｃ＝｜Ｙ｜（｜Ｙ｜は集合Ｙの要素数）とすると、行列Ｍは（ｃ＋Ｎ_Ｄ）行、ｃ列の行列となる
・「π_ｄ」：エキスパート事前分布、任意に引いたデータｘが各部分データセットに属する割合を示す
・「ｐ（ｚ｜ｙ，ｄ）」：部分データセットｄにおいて、正解カテゴリーｙ∈Ｙに対してラベルｚがつく確率
ｙ∈Ｚ_ｄのとき、ｚ＝ｙならば「１」、その他は「０」
ｙ∈Ｚ_ｄでないとき、ｚ＝^－Ｚ_ｄならば「１」、その他は「０」
・「ｗ_ｄ（ｙ）＝ｐ（ｙ｜ｄ）／ｑ（ｙ）」：カテゴリー重み
「ｐ（ｙ｜ｄ）」：カテゴリー事前分布、部分データセットｄの中に含まれる正解カテゴリーｙの割合を示す
「ｑ（ｙ）」：基準となるカテゴリー事前分布、任意のパラメータ
なお、エキスパート事前分布は第１の事前分布の一例であり、カテゴリー事前分布は第２の事前分布の一例であり、「ｐ（ｚ｜ｙ，ｄ）」は部分データセットの各々について割り当てられている責任範囲を示す符号の一例である。

上記の行列Ｍが得られると、交差行列Ｈは以下のように求まる。

ここで、
・「Ｉ」はｃ次元の単位行列
・「^→１」はｃ次元の縦ベクトルで全ての要素が「１」であるもの
・「^→ｖ」はｃ次元の任意の縦ベクトル
・「^～Ｍ^＋」は行列Ｍの任意の左逆行列（即ち、^～Ｍ^＋Ｍ＝Ｉを満たす行列）
なお、左逆行列は一般に一つとは限らず無数に存在するが、どれを使ってもよい。

（２）物体検知問題（「背景」がある場合）
次に、物体検知問題の場合について説明する。この場合も、行列Ｍは基本的に上記の多クラス分類問題の場合と同様に（９）式により定められる。但し、物体検知問題の場合は前述のように「背景」のクラスがあるため、多クラス分類問題の場合とは以下の２点が異なる。
・ｃ＝｜Ｙ｜（｜Ｙ｜は集合Ｙの要素数）とすると、行列Ｍは（ｃ＋Ｎ_Ｄ）行、（ｃ＋１）列の行列となる
・「ｐ（ｚ｜ｙ，ｄ）」：部分データセットｄにおいて、正解カテゴリーｙ∈Ｙに対してラベルｚがつく確率
ｙ∈Ｚ_ｄのとき、ｚ＝ｙならば「１」、その他は「０」
ｙ∈Ｚ_ｄでないとき（ｙ＝^－Ｙもこれに該当、「^－Ｙ」は背景を示す）、ｚ＝^－Ｚ_ｄならば「１」、その他は「０」

また、交差行列Ｈは、多クラス分類問題の場合と同様に（１０）式で求められるが、「背景」のクラスがあるため、以下の３点が異なる。
・「Ｉ」はｃ＋１次元の単位行列
・「^→１」はｃ＋１次元の縦ベクトルで全ての要素が「１」であるもの
・「^→ｖ」はｃ＋１次元の任意の縦ベクトル

以上のように、多クラス分類問題、物体検知問題のいずれの場合も、式（９）により行列Ｍを求め、式（１０）により交差行列Ｈを求めれば、式（８）により認識損失Ｌを算出することが可能となる。

（第１の学習装置による学習処理）
図５は、第１の学習装置による学習処理のフローチャートである。この処理は、図３に示すプロセッサ１０３が予め用意されたプログラムを実行し、図４に示す各要素として動作することにより実現される。まず、交差行列算出部１１６は、上述の方法により、エキスパートデータセットの属性値を用いて交差行列Ｈを算出する（ステップＳ１１）。算出された交差行列Ｈは、交差行列記憶部１１７に記憶される。

次に、学習を継続するか否かが判定される（ステップＳ１２）。この判定は、予め決められた終了条件が具備されたか否かに基づいて行われる。終了条件としては、例えば、用意した学習用データを全て使用したか、パラメータの更新回数が所定回数に到達したか、などが挙げられる。

学習を継続すると判定された場合（ステップＳ１２：Ｙｅｓ）、エキスパートデータセット供給部１１１は、入力データの組を認識部１１２に入力する（ステップＳ１３）。認識部１１２は、入力されたデータに基づいて認識処理を行い、認識結果を認識損失算出部１１３に出力する（ステップＳ１４）。

次に、認識損失算出部１１３は、入力データと、認識結果と、交差行列とを用いて、前述の式（８）により認識損失Ｌを算出する（ステップＳ１５）。そして、更新部１１４は、算出された認識損失Ｌが小さくなるように、認識部１１２のパラメータを更新する（ステップＳ１６）。即ち、更新後のパラメータが、認識部パラメータ記憶部１１５に記憶され、認識部１１２に設定される。こうして、ステップＳ１２～Ｓ１６が繰り返され、ステップＳ１２で学習を継続しないと判定された場合、処理は終了する。

（第２の学習装置の機能構成）
次に、第２の学習装置の機能構成について説明する。第１の学習装置では、交差行列を算出するために必要なエキスパートデータセットの属性値が予め与えられていることを前提としている。これに対し、第２の学習装置では、それらの属性値が与えられておらず、学習装置側で生成することが必要となる。具体的には、第２の学習装置は、エキスパートデータセットから、エキスパート事前分布π_ｄ、及び、カテゴリー事前分布ｐ（ｙ｜ｄ）を推定し、推定値を用いて交差行列を算出する。

図６は、第２の学習装置１００ｘの機能構成を示すブロック図である。図４に示す第１の学習装置１００と比較すると理解されるように、第２の学習装置１００ｘは、エキスパート事前分布推定部１１８と、カテゴリー事前分布推定部１１９を有する。これ以外の点は、第２の学習装置１００ｘは第１の学習装置１００と同様である。なお、エキスパート事前分布推定部１１８は第１の推定部の一例であり、カテゴリー事前分布推定部１１９は第２の推定部の一例である。

エキスパートデータセット供給部１１１は、エキスパートデータセットを、エキスパート事前分布推定部１１８、カテゴリー事前分布推定部１１９及び交差行列算出部１１６に供給する。エキスパート事前分布推定部１１８は、エキスパート事前分布π_ｄを推定する。具体的には、エキスパート事前分布推定部１１８は、エキスパートデータセット中の各部分データセットに含まれるサンプル数Ｎ_ｄを計数し、次式によってエキスパート事前分布π_ｄを決定する。

エキスパート事前分布π_ｄは、エキスパートデータセット全体から１つの入力データを引いた場合に、それが部分データセットｄに属する割合である。よって、式（１１）が示すように、ある部分データセットｄのサンプル数を、全ての部分データセットに含まれるサンプル数の合計で除した値として算出することができる。エキスパート事前分布推定部１１８は、算出したエキスパート事前分布π_ｄを交差行列算出部１１６に供給する。

カテゴリー事前分布推定部１１９は、エキスパートデータセットからカテゴリー事前分布ｐ（ｙ｜ｄ）を推定する。図７は、カテゴリー事前分布の推定方法を説明する図である。なお、図７は、図１（Ｂ）に示すエキスパートデータセットの例を前提としている。まず、カテゴリー事前分布推定部１１９は、各部分データセットを用いて教師あり学習を行う。図７の例では、水生哺乳類の部分データセットを用いて、その責任範囲に属する水生哺乳類５種と、「水生哺乳類でない」のクラスとを含む６クラスの分類器を学習する。これにより、水生哺乳類の部分データセット中の入力データを水生哺乳類５種と、それ以外とに分類できる。同様に、人の部分データセットやそれ以外の部分データセットを用いて６クラスの分類器を学習する。

次に、ある分類器により「○○でない」に分類されたデータを、別の部分データセットで学習した分類器に適用して分類を行う。例えば、水生哺乳類の部分データセットで学習した分類器で「水生哺乳類でない」と分類されたデータを、人の部分データセットの分類器で分類すると、そのうちの人５種を新たに見つけることができる。また、水生哺乳類の部分データセットで学習した分類器で「水生哺乳類でない」と分類されたデータを、さらに別の部分データセットの分類器で分類すると、その部分データセットの責任範囲に含まれるカテゴリー５種を新たに見つけることができる。こうして、「水生哺乳類でない」と分類されたデータを他の全ての部分データセットで学習した分類器に適用することにより、水生哺乳類の部分データセットに含まれる全てのデータを全１００クラスのいずれかに分類することができる。こうして、水生哺乳類の部分データセットに含まれる全１００クラスの割合を推定することができる。この処理を全ての部分データセットに対して行えば、カテゴリー事前分布を推定することができる。得られたカテゴリー事前分布ｐ（ｙ｜ｄ）は、交差行列算出部１１６に供給される。

こうして、エキスパート事前分布π_ｄ及びカテゴリー事前分布ｐ（ｙ｜ｄ）が得られると、交差行列算出部１１６は、それらを用いて式（９）により遷移行列Ｍを算出し、さらに式（１０）により交差行列Ｈを算出することができる。

（第２の学習装置による学習処理）
第２の学習装置１００ｘによる学習処理は、基本的に図５に示す第１の学習装置１００による学習処理と同様である。但し、第２の学習装置１００ｘは、ステップＳ１１の交差行列算出処理において、エキスパート事前分布及びカテゴリー事前分布を推定する点が第１の学習装置１００の場合と異なる。

図８は、第２の学習装置１００ｘによる交差行列算出処理（ステップＳ１１）のフローチャートを示す。まず、エキスパートデータセット供給部１１１は、エキスパート事前分布推定部１１８にエキスパートデータセットを入力し（ステップＳ２１）、エキスパート事前分布推定部１１８は、入力されたエキスパートデータセットを用いてエキスパート事前分布を推定する（ステップＳ２２）。次に、エキスパートデータセット供給部１１１は、カテゴリー事前分布推定部１１９にエキスパートデータセットを入力し（ステップＳ２３）、カテゴリー事前分布推定部１１９は、入力されたエキスパートデータセットを用いてカテゴリー事前分布を推定する（ステップＳ２４）。そして、交差行列算出部１１６は、推定されたエキスパート事前分布とカテゴリー事前分布と用いて交差行列を算出する（ステップＳ２５）。その後の処理は、図５に示す第１の学習装置１００の場合と同様であるので、説明を省略する。

（実施例）
次に、上記の学習装置の実施例について説明する。
（１）多クラス分類の実施例
図９は、多クラス分類の実施例に係る学習装置２００の機能構成を示す。学習装置２００は、基本的に図４に示す第１の学習装置１００と同様に構成され、エキスパートデータセット供給部２０１と、認識部２０２と、認識損失算出部２０３と、更新部２０４と、認識部パラメータ記憶部２０５と、交差行列算出部２０６と、交差行列記憶部２０７とを備える。この実施例では、エキスパートデータセットは、カテゴリー｛飛行機，鳥，ドローン｝を責任範囲とする飛行物体の部分データセットを含んでいる。

エキスパートデータセット供給部２０１は、認識部２０２、認識損失算出部２０３及び交差行列算出部２０６に入力データの組を供給する。認識部２０２は、入力画像ｘ_ｉの認識結果を認識損失算出部２０３に出力する。交差行列算出部２０６は、エキスパートデータセットの属性値に基づいて交差行列Ｈを算出し、交差行列記憶部２０７に記憶する。認識損失算出部２０３は、入力データの組と、認識結果と、交差行列とを用いて認識損失Ｌを算出し、更新部２０４へ供給する。本実施例では、認識損失Ｌの算出にはロス関数としてクロスエントロピーが使用される。更新部２０４は、認識損失Ｌに基づいてパラメータを更新し、認識部パラメータ記憶部２０５に記憶する。記憶された更新後のパラメータは、認識部２０２に設定される。こうして、認識部２０２の学習が行われる。

なお、エキスパートデータセットに属性値が含まれていない場合は、前述の第２の学習装置のように、エキスパートデータセットからエキスパート事前分布とカテゴリー事前分布を推定し、交差行列Ｈを算出すればよい。また、学習終了後の推論時には、最新のパラメータに更新された認識部２０２に対して画像データが入力され、認識部２０２は入力された画像データに対する認識結果を出力する。

（２）物体検知の実施例
図１０は、物体検知の実施例に係る学習装置３００の機能構成を示すブロック図である。学習装置３００は、エキスパートデータセット供給部３０１と、特徴抽出部３０２と、バウンディングボックス回帰部３０３と、回帰損失算出部３０４と、検知物体分類部３０５と、分類損失算出部３０６と、更新部３０７と、パラメータ記憶部３０８と、交差行列算出部３０９と、交差行列記憶部３１０と、を備える。

エキスパートデータセット供給部３０１は、入力データの組を特徴抽出部３０２、バウンディングボックス回帰部３０３、及び、検知物体分類部３０５に供給し、エキスパートデータセットを交差行列算出部３０９に供給する。特徴抽出部３０２は、入力画像ｘ_ｉから特徴ベクトルを抽出し、物体候補やデフォルトボックス毎の特徴ベクトルをバウンディングボックス回帰部３０３及び検知物体分類部３０５に供給する。なお、特徴ベクトルの次元数は任意である。

バウンディングボックス回帰部３０３は、デフォルトボックスの位置と、物体候補に対応するバウンディングボックスの位置を算出し、回帰損失算出部３０４に供給する。回帰損失算出部３０４は、デフォルトボックスとバウンディングボックスの位置ずれを示す回帰損失Ｌｒを算出し、更新部３０７へ供給する。検知物体分類部３０５は、物体候補に含まれる物体をクラス分類し、分類結果を分類損失算出部３０６に供給する。

交差行列算出部３０９は、エキスパートデータセットの属性値に基づいて前述の方法で交差行列Ｈを算出し、交差行列記憶部３１０に記憶する。分類損失算出部３０６は、検知物体分類部３０５による分類結果と、交差行列Ｈとを用いて分類損失Ｌｃを算出し、更新部３０７に供給する。

更新部３０７は、回帰損失Ｌｒ及び分類損失Ｌｃに基づいて、特徴抽出部３０２、バウンディングボックス回帰部３０３及び検知物体分類部３０５を構成するネットワークのパラメータを更新し、パラメータ記憶部３０８に記憶する。記憶された更新後のパラメータは、特徴抽出部３０２、バウンディングボックス回帰部３０３及び検知物体分類部３０５に設定される。

なお、エキスパートデータセットに属性値が含まれていない場合は、前述の第２の学習装置のように、エキスパートデータセットからエキスパート事前分布とカテゴリー事前分布を推定し、交差行列Ｈを算出すればよい。また、学習終了後の推論時には、更新された特徴抽出部３０２、バウンディングボックス回帰部３０３及び検知物体分類部３０５に更新後のパラメータが設定され、特徴抽出部３０２に画像データが入力される。入力された画像データは、特徴抽出部３０２、バウンディングボックス回帰部３０３及び検知物体分類部３０５により処理される。そして、バウンディングボックス回帰部３０３が出力した物体の位置と、検知物体分類部３０５が出力した物体の分類結果（検知物体毎のスコア）を用いて非最大値抑制処理（ＮＭＳ：Ｎｏｎ－ＭａｘｉｍｕｍＳｕｐｐｒｅｓｓｉｏｎ）が行われ、最終的に検知物体毎にその種類と位置とが出力される。

［第２実施形態］
次に、本発明の第２実施形態について説明する。図１１は、第２実施形態に係る学習装置４００の機能構成を示すブロック図である。なお、学習装置４００のハードウェア構成は図３に示すものと同様である。図示のように、学習装置４００は、データセット供給部４０１と、認識部４０２と、交差行列算出部４０３と、認識損失算出部４０４と、更新部４０５と、を備える。

学習装置４００は、学習用データセットを用いて学習を行う。ここで、学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、認識対象とする全てのカテゴリーが複数の部分データセットのいずれかに割り当てられている。また、部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されている。

データセット供給部４０１は、上記の学習用データセットを供給する。認識部４０２は、供給された学習用データセット中の認識対象データに対する認識結果を出力する。また、交差行列算出部４０３は、学習用データセットに基づいて交差行列を算出する。認識損失算出部４０４は、認識結果、交差行列、及び、認識対象データに付与されている正解データを用いて認識損失を算出する。そして、更新部４０５は、認識損失に基づいて、認識部のパラメータを更新する。

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）
学習用データセットを用いて学習を行う学習装置であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習装置は、
前記学習用データセットを供給するデータセット供給部と、
供給された学習用データセット中の認識対象データに対する認識結果を出力する認識部と、
前記学習用データセットに基づいて交差行列を算出する交差行列算出部と、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出する認識損失算出部と、
前記認識損失に基づいて前記認識部のパラメータを更新する更新部と、
を備える学習装置。

（付記２）
前記交差行列算出部は、前記学習用データセット中の認識対象データが各部分データセットに属する割合である第１の事前分布と、前記部分データセットに含まれる各カテゴリーの割合である第２の事前分布と、前記部分データセットの各々について割り当てられている前記責任範囲を示す符号と、に基づいて前記交差行列を算出する付記１に記載の学習装置。

（付記３）
前記第１の事前分布を前記学習用データセットから推定する第１の推定部と、
前記第２の事前分布を前記学習用データセットから推定する第２の推定部と、
を備える付記２に記載の学習装置。

（付記４）
前記交差行列算出部は、前記第１の事前分布、前記第２の事前分布及び前記責任範囲を示す符号を用いて遷移行列を算出し、当該遷移行列の逆行列を用いて前記交差行列を算出する付記２又は３に記載の学習装置。

（付記５）
前記認識損失算出部は、前記学習用データセットに含まれる全ての認識対象データに対する認識結果と、前記認識対象とする全てのカテゴリーとの間の損失を、前記交差行列の要素を重みとして重み付け加算して前記認識損失を算出する付記１乃至４のいずれか一項に記載の学習装置。

（付記６）
学習用データセットを用いた学習方法であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習方法は、
前記学習用データセットを供給し、
認識部により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識部のパラメータを更新する学習方法。

（付記７）
学習用データセットを用いた学習処理のプログラムを記録する記録媒体であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記プログラムは、
前記学習用データセットを供給し、
認識部により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識部のパラメータを更新する学習処理をコンピュータに実行させる記録媒体。

以上、実施形態及び実施例を参照して本発明を説明したが、本発明は上記実施形態及び実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

１００、２００、３００、４００学習装置
１１１エキスパートデータセット供給部
１１２認識部
１１３認識損失算出部
１１４更新部
１１５認識部パラメータ記憶部
１１６交差行列算出部
１１７交差行列記憶部
１１８エキスパート事前分布推定部
１１９カテゴリー事前分布推定部

Claims

学習用データセットを用いて学習を行う学習装置であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習装置は、
前記学習用データセットを供給するデータセット供給手段と、
供給された学習用データセット中の認識対象データに対する認識結果を出力する認識手段と、
前記学習用データセットに基づいて交差行列を算出する交差行列算出手段と、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出する認識損失算出手段と、
前記認識損失に基づいて前記認識手段のパラメータを更新する更新手段と、
を備える学習装置。
前記交差行列算出手段は、前記学習用データセット中の認識対象データが各部分データセットに属する割合である第１の事前分布と、前記部分データセットに含まれる各カテゴリーの割合である第２の事前分布と、前記部分データセットの各々について割り当てられている前記責任範囲を示す符号と、に基づいて前記交差行列を算出する請求項１に記載の学習装置。
前記第１の事前分布を前記学習用データセットから推定する第１の推定手段と、
前記第２の事前分布を前記学習用データセットから推定する第２の推定手段と、
を備える請求項２に記載の学習装置。
前記交差行列算出手段は、前記第１の事前分布、前記第２の事前分布及び前記責任範囲を示す符号を用いて遷移行列を算出し、当該遷移行列の逆行列を用いて前記交差行列を算出する請求項２又は３に記載の学習装置。
前記認識損失算出手段は、前記学習用データセットに含まれる全ての認識対象データに対する認識結果と、前記認識対象とする全てのカテゴリーとの間の損失を、前記交差行列の要素を重みとして重み付け加算して前記認識損失を算出する請求項１乃至４のいずれか一項に記載の学習装置。
学習用データセットを用いた学習方法であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習方法は、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する学習方法。
学習用データセットを用いた学習処理のプログラムであって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記プログラムは、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する学習処理をコンピュータに実行させるプログラム。