JP7283554B2 - 学習装置、学習方法、及び、プログラム - Google Patents
学習装置、学習方法、及び、プログラム Download PDFInfo
- Publication number
- JP7283554B2 JP7283554B2 JP2021548298A JP2021548298A JP7283554B2 JP 7283554 B2 JP7283554 B2 JP 7283554B2 JP 2021548298 A JP2021548298 A JP 2021548298A JP 2021548298 A JP2021548298 A JP 2021548298A JP 7283554 B2 JP7283554 B2 JP 7283554B2
- Authority
- JP
- Japan
- Prior art keywords
- data set
- recognition
- learning
- partial
- assigned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 27
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 239000011159 matrix material Substances 0.000 claims description 115
- 238000004364 calculation method Methods 0.000 claims description 46
- 230000007704 transition Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 25
- 241000124008 Mammalia Species 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 238000000605 extraction Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 241000499489 Castor canadensis Species 0.000 description 2
- 241000283153 Cetacea Species 0.000 description 2
- 241001481833 Coryphaena hippurus Species 0.000 description 2
- 241001233242 Lontra Species 0.000 description 2
- 235000011779 Menyanthes trifoliata Nutrition 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 240000001973 Ficus microcarpa Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Description
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習装置は、
前記学習用データセットを供給するデータセット供給手段と、
供給された学習用データセット中の認識対象データに対する認識結果を出力する認識手段と、
前記学習用データセットに基づいて交差行列を算出する交差行列算出手段と、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出する認識損失算出手段と、
前記認識損失に基づいて前記認識手段のパラメータを更新する更新手段と、
を備える。
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習方法は、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する。
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記プログラムは、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する学習処理をコンピュータに実行させる。
まず、本発明の実施形態において使用するエキスパートデータセットについて説明する。
[1]多クラス分類問題の場合
まず、多クラス分類問題の場合について説明する。「エキスパートデータセット」とは、多クラス分類のモデルを学習する際に使用できる学習用データセットであり、複数の部分データセットにより構成されるものである。具体的に、エキスパートデータセットは、以下の条件を具備するように構成される。
(A)複数の部分データセットの各々には、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられている。
(B)認識対象とする全てのカテゴリーが、複数の部分データセットのいずれかに割り当てられている。
(C)部分データセットに含まれる各データには、当該部分データセットに割り当てられた責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解ラベルが付与されている。
(1)多クラス分類問題における通常のデータセット
通常のデータセットは、データ空間Xの要素であるデータxと、正解候補集合Yの要素である正解カテゴリーyとの組(x,y)の集合D
各部分データセットには、それが専門とする正解候補集合Zが定まっている。但し、正解候補集合Zは正解候補集合Yの部分集合である。
部分データセットは、データ空間Xの要素である(ラベルの付いていない)データxと、ラベルzと、部分データセットを表す正解候補集合Zの組(x,z,Z)の集合である。ここで、zは、正解候補集合Zの要素であるか、z=Zの補集合(便宜上、「-Z」と記す。)である。zが正解候補集合Zの要素であるとき、データxはカテゴリーzに属する。z=-Zのとき、データxは正解候補集合Zに含まれないいずれかのカテゴリーに属する。
学習時には、複数の部分データセットを集めて、それぞれの部分データセットに対応する各正解候補集合Zの要素を集めると、正解候補集合Yの要素が尽くされているようにする。
次に、物体検知問題の場合について説明する。エキスパートデータセットは、物体検知問題にも使用することができる。物体検知問題とは、画像データ中の物体候補(領域提案/デフォルトボックス)が物体か否か、物体であれば何の物体かを分類し、その座標と位置を推定する問題である。なお、物体検知問題は、デフォルトボックス単位で考えれば、そのデフォルトボックスに対する多クラス分類と考えることができる。
通常のデータセットは、画像xと、画像xに含まれるK個の検知対象物体全ての集合
各部分データセットには、それが専門とする正解候補集合Zが定まっている。但し、正解候補集合Zは正解候補集合Yの部分集合である。
画像xには、K個の検知対象物体
図1(B)の例では、学習データとして用意された6万枚の画像データを均等に20の部分データセットに分けているが、各部分データセットに割り当てる画像データ数は均等である必要はなく、部分データセット毎に異なっていてもかまわない。また、図1(B)の例では、認識対象の全てのカテゴリー(100クラス)を20の部分データセットに責任範囲として均等に分けているが、各部分データセットに責任範囲として割り当てるカテゴリー数は均等である必要はない。即ち、各部分データセット毎に、責任範囲として割り当てられるカテゴリー数が異なっていてもよい。また、ある部分データセットに対して全てのカテゴリー、即ち、上記の例では100個のカテゴリーが割り当てられていてもよい。
次に、エキスパートデータセットを用いた学習装置の実施形態について説明する。
[1]ハードウェア構成
図3は、第1実施形態に係る学習装置のハードウェア構成を示すブロック図である。図示のように、学習装置100は、インタフェース102と、プロセッサ103と、メモリ104と、記録媒体105と、データベース(DB)106と、を備える。
図4は、第1実施形態に係る第1の学習装置の機能構成を示すブロック図である。なお、この学習装置100は、多クラス分類モデルを学習するものとする。学習装置100は、エキスパートデータセット供給部111と、認識部112と、認識損失算出部113と、更新部114と、認識部パラメータ記憶部115と、交差行列算出部116と、交差行列記憶部117と、を備える。
次に、交差行列について詳しく説明する。通常のデータセットを用いて学習を行う場合、学習用の入力画像データに対して1つの正解ラベルが用意されているため、認識部による認識結果と、その正解ラベルとの損失Lを計算し、損失Lが小さくなるように認識部のパラメータが更新される。しかしながら、前述のようにエキスパートデータセットは、複数の部分データセットにより構成され、各部分データセットには認識対象の全カテゴリーのうちの一部が責任範囲として割り当てられている。各部分データセットは、責任範囲に属するカテゴリーに対してはそのうちのいずれかを示す正解ラベルを有しているが、責任範囲に属しないカテゴリーについてはその部分データセットの責任範囲に属さないことを示す正解ラベル(「○○でない」というタイプの正解ラベル)しか有していない。このため、通常のデータセットの場合のように、認識部による認識結果と正解ラベルとを単純に比較して損失Lを算出することができない。そこで、本実施形態では、交差行列Hを導入することにより、エキスパートデータセットの認識結果に対して損失Lを算出できるようにする。
(1)多クラス分類問題
まず、多クラス分類問題の場合について説明する。交差行列Hを算出するために、行列M(「遷移行列」とも呼ぶ。)を以下のように定める。
・「d」:部分データセットを表す添え字、「ND」:部分データセットの数
・c=|Y|(|Y|は集合Yの要素数)とすると、行列Mは(c+ND)行、c列の行列となる
・「πd」:エキスパート事前分布、任意に引いたデータxが各部分データセットに属する割合を示す
・「p(z|y,d)」:部分データセットdにおいて、正解カテゴリーy∈Yに対してラベルzがつく確率
y∈Zdのとき、z=yならば「1」、その他は「0」
y∈Zdでないとき、z=-Zdならば「1」、その他は「0」
・「wd(y)=p(y|d)/q(y)」:カテゴリー重み
「p(y|d)」:カテゴリー事前分布、部分データセットdの中に含まれる正解カテゴリーyの割合を示す
「q(y)」:基準となるカテゴリー事前分布、任意のパラメータ
なお、エキスパート事前分布は第1の事前分布の一例であり、カテゴリー事前分布は第2の事前分布の一例であり、「p(z|y,d)」は部分データセットの各々について割り当てられている責任範囲を示す符号の一例である。
・「I」はc次元の単位行列
・「→1」はc次元の縦ベクトルで全ての要素が「1」であるもの
・「→v」はc次元の任意の縦ベクトル
・「~M+」は行列Mの任意の左逆行列(即ち、~M+M=Iを満たす行列)
なお、左逆行列は一般に一つとは限らず無数に存在するが、どれを使ってもよい。
次に、物体検知問題の場合について説明する。この場合も、行列Mは基本的に上記の多クラス分類問題の場合と同様に(9)式により定められる。但し、物体検知問題の場合は前述のように「背景」のクラスがあるため、多クラス分類問題の場合とは以下の2点が異なる。
・c=|Y|(|Y|は集合Yの要素数)とすると、行列Mは(c+ND)行、(c+1)列の行列となる
・「p(z|y,d)」:部分データセットdにおいて、正解カテゴリーy∈Yに対してラベルzがつく確率
y∈Zdのとき、z=yならば「1」、その他は「0」
y∈Zdでないとき(y=-Yもこれに該当、「-Y」は背景を示す)、z=-Zdならば「1」、その他は「0」
・「I」はc+1次元の単位行列
・「→1」はc+1次元の縦ベクトルで全ての要素が「1」であるもの
・「→v」はc+1次元の任意の縦ベクトル
図5は、第1の学習装置による学習処理のフローチャートである。この処理は、図3に示すプロセッサ103が予め用意されたプログラムを実行し、図4に示す各要素として動作することにより実現される。まず、交差行列算出部116は、上述の方法により、エキスパートデータセットの属性値を用いて交差行列Hを算出する(ステップS11)。算出された交差行列Hは、交差行列記憶部117に記憶される。
次に、第2の学習装置の機能構成について説明する。第1の学習装置では、交差行列を算出するために必要なエキスパートデータセットの属性値が予め与えられていることを前提としている。これに対し、第2の学習装置では、それらの属性値が与えられておらず、学習装置側で生成することが必要となる。具体的には、第2の学習装置は、エキスパートデータセットから、エキスパート事前分布πd、及び、カテゴリー事前分布p(y|d)を推定し、推定値を用いて交差行列を算出する。
第2の学習装置100xによる学習処理は、基本的に図5に示す第1の学習装置100による学習処理と同様である。但し、第2の学習装置100xは、ステップS11の交差行列算出処理において、エキスパート事前分布及びカテゴリー事前分布を推定する点が第1の学習装置100の場合と異なる。
次に、上記の学習装置の実施例について説明する。
(1)多クラス分類の実施例
図9は、多クラス分類の実施例に係る学習装置200の機能構成を示す。学習装置200は、基本的に図4に示す第1の学習装置100と同様に構成され、エキスパートデータセット供給部201と、認識部202と、認識損失算出部203と、更新部204と、認識部パラメータ記憶部205と、交差行列算出部206と、交差行列記憶部207とを備える。この実施例では、エキスパートデータセットは、カテゴリー{飛行機,鳥,ドローン}を責任範囲とする飛行物体の部分データセットを含んでいる。
図10は、物体検知の実施例に係る学習装置300の機能構成を示すブロック図である。学習装置300は、エキスパートデータセット供給部301と、特徴抽出部302と、バウンディングボックス回帰部303と、回帰損失算出部304と、検知物体分類部305と、分類損失算出部306と、更新部307と、パラメータ記憶部308と、交差行列算出部309と、交差行列記憶部310と、を備える。
次に、本発明の第2実施形態について説明する。図11は、第2実施形態に係る学習装置400の機能構成を示すブロック図である。なお、学習装置400のハードウェア構成は図3に示すものと同様である。図示のように、学習装置400は、データセット供給部401と、認識部402と、交差行列算出部403と、認識損失算出部404と、更新部405と、を備える。
学習用データセットを用いて学習を行う学習装置であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習装置は、
前記学習用データセットを供給するデータセット供給部と、
供給された学習用データセット中の認識対象データに対する認識結果を出力する認識部と、
前記学習用データセットに基づいて交差行列を算出する交差行列算出部と、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出する認識損失算出部と、
前記認識損失に基づいて前記認識部のパラメータを更新する更新部と、
を備える学習装置。
前記交差行列算出部は、前記学習用データセット中の認識対象データが各部分データセットに属する割合である第1の事前分布と、前記部分データセットに含まれる各カテゴリーの割合である第2の事前分布と、前記部分データセットの各々について割り当てられている前記責任範囲を示す符号と、に基づいて前記交差行列を算出する付記1に記載の学習装置。
前記第1の事前分布を前記学習用データセットから推定する第1の推定部と、
前記第2の事前分布を前記学習用データセットから推定する第2の推定部と、
を備える付記2に記載の学習装置。
前記交差行列算出部は、前記第1の事前分布、前記第2の事前分布及び前記責任範囲を示す符号を用いて遷移行列を算出し、当該遷移行列の逆行列を用いて前記交差行列を算出する付記2又は3に記載の学習装置。
前記認識損失算出部は、前記学習用データセットに含まれる全ての認識対象データに対する認識結果と、前記認識対象とする全てのカテゴリーとの間の損失を、前記交差行列の要素を重みとして重み付け加算して前記認識損失を算出する付記1乃至4のいずれか一項に記載の学習装置。
学習用データセットを用いた学習方法であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習方法は、
前記学習用データセットを供給し、
認識部により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識部のパラメータを更新する学習方法。
学習用データセットを用いた学習処理のプログラムを記録する記録媒体であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記プログラムは、
前記学習用データセットを供給し、
認識部により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識部のパラメータを更新する学習処理をコンピュータに実行させる記録媒体。
111 エキスパートデータセット供給部
112 認識部
113 認識損失算出部
114 更新部
115 認識部パラメータ記憶部
116 交差行列算出部
117 交差行列記憶部
118 エキスパート事前分布推定部
119 カテゴリー事前分布推定部
Claims (7)
- 学習用データセットを用いて学習を行う学習装置であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習装置は、
前記学習用データセットを供給するデータセット供給手段と、
供給された学習用データセット中の認識対象データに対する認識結果を出力する認識手段と、
前記学習用データセットに基づいて交差行列を算出する交差行列算出手段と、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出する認識損失算出手段と、
前記認識損失に基づいて前記認識手段のパラメータを更新する更新手段と、
を備える学習装置。 - 前記交差行列算出手段は、前記学習用データセット中の認識対象データが各部分データセットに属する割合である第1の事前分布と、前記部分データセットに含まれる各カテゴリーの割合である第2の事前分布と、前記部分データセットの各々について割り当てられている前記責任範囲を示す符号と、に基づいて前記交差行列を算出する請求項1に記載の学習装置。
- 前記第1の事前分布を前記学習用データセットから推定する第1の推定手段と、
前記第2の事前分布を前記学習用データセットから推定する第2の推定手段と、
を備える請求項2に記載の学習装置。 - 前記交差行列算出手段は、前記第1の事前分布、前記第2の事前分布及び前記責任範囲を示す符号を用いて遷移行列を算出し、当該遷移行列の逆行列を用いて前記交差行列を算出する請求項2又は3に記載の学習装置。
- 前記認識損失算出手段は、前記学習用データセットに含まれる全ての認識対象データに対する認識結果と、前記認識対象とする全てのカテゴリーとの間の損失を、前記交差行列の要素を重みとして重み付け加算して前記認識損失を算出する請求項1乃至4のいずれか一項に記載の学習装置。
- 学習用データセットを用いた学習方法であって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記学習方法は、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する学習方法。 - 学習用データセットを用いた学習処理のプログラムであって、
前記学習用データセットは、認識対象とする全てのカテゴリーの少なくとも一部が責任範囲として割り当てられた複数の部分データセットを含み、
認識対象とする全てのカテゴリーが前記複数の部分データセットのいずれかに割り当てられており、
前記部分データセットに含まれる各認識対象データには、当該部分データセットに割り当てられた前記責任範囲に属するカテゴリーのいずれか、又は、当該認識対象のカテゴリーが当該部分データセットの責任範囲に属さないことを示す正解データが付与されており、
前記プログラムは、
前記学習用データセットを供給し、
認識手段により、供給された学習用データセット中の認識対象データに対する認識結果を出力し、
前記学習用データセットに基づいて交差行列を算出し、
前記認識結果、前記交差行列、及び、前記認識対象データに付与されている正解データを用いて認識損失を算出し、
前記認識損失に基づいて前記認識手段のパラメータを更新する学習処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/038343 WO2021059527A1 (ja) | 2019-09-27 | 2019-09-27 | 学習装置、学習方法、及び、記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021059527A1 JPWO2021059527A1 (ja) | 2021-04-01 |
JPWO2021059527A5 JPWO2021059527A5 (ja) | 2022-05-24 |
JP7283554B2 true JP7283554B2 (ja) | 2023-05-30 |
Family
ID=75166874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021548298A Active JP7283554B2 (ja) | 2019-09-27 | 2019-09-27 | 学習装置、学習方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220335712A1 (ja) |
JP (1) | JP7283554B2 (ja) |
WO (1) | WO2021059527A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3832491A1 (en) * | 2019-12-06 | 2021-06-09 | Idemia Identity & Security France | Methods for processing a plurality of candidate annotations of a given instance of an image, and for learning parameters of a computational model |
CN114677566B (zh) * | 2022-04-08 | 2023-10-17 | 北京百度网讯科技有限公司 | 深度学习模型的训练方法、对象识别方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018200524A (ja) | 2017-05-26 | 2018-12-20 | 日本電信電話株式会社 | 分類装置、分類方法および分類プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10558932B1 (en) * | 2014-04-23 | 2020-02-11 | Google Llc | Multi-machine distributed learning systems |
US20180330275A1 (en) * | 2017-05-09 | 2018-11-15 | Microsoft Technology Licensing, Llc | Resource-efficient machine learning |
US20200193220A1 (en) * | 2018-12-18 | 2020-06-18 | National Sun Yat-Sen University | Method for data imputation and classification and system for data imputation and classification |
-
2019
- 2019-09-27 US US17/641,875 patent/US20220335712A1/en active Pending
- 2019-09-27 JP JP2021548298A patent/JP7283554B2/ja active Active
- 2019-09-27 WO PCT/JP2019/038343 patent/WO2021059527A1/ja active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018200524A (ja) | 2017-05-26 | 2018-12-20 | 日本電信電話株式会社 | 分類装置、分類方法および分類プログラム |
Non-Patent Citations (1)
Title |
---|
ABDOLLAHPOUR, Zeinab et al.,Image Classification Using Ontology Based Improved Visual Words,2015 23rd Iranian Conference on Electrical Engineering,IEEE [online],2015年07月02日,pp.694-698,https://ieeexplore.ieee.org/abstract/document/7146303 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021059527A1 (ja) | 2021-04-01 |
US20220335712A1 (en) | 2022-10-20 |
WO2021059527A1 (ja) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832458B (zh) | 一种字符级的基于嵌套深度网络的文本分类方法 | |
Chen et al. | Semi-supervised learning via regularized boosting working on multiple semi-supervised assumptions | |
Łukasik et al. | Data clustering with grasshopper optimization algorithm | |
CN109993102B (zh) | 相似人脸检索方法、装置及存储介质 | |
Gong et al. | Discrete particle swarm optimization for high-order graph matching | |
CN110443372B (zh) | 一种基于熵最小化的迁移学习方法及系统 | |
Liu et al. | Fuzzy mutual information-based multilabel feature selection with label dependency and streaming labels | |
JP7283554B2 (ja) | 学習装置、学習方法、及び、プログラム | |
CN113361685B (zh) | 一种基于学习者知识状态演化表示的知识追踪方法及系统 | |
CN111581368A (zh) | 一种基于卷积神经网络的面向智能专家推荐的用户画像方法 | |
CN113822419B (zh) | 一种基于结构信息的自监督图表示学习运行方法 | |
Ma et al. | Bagging likelihood-based belief decision trees | |
Alfarisi et al. | Deducing of Optimal Machine Learning Algorithms for Heterogeneity | |
Conte et al. | Interactive online learning for graph matching using active strategies | |
WO2021253938A1 (zh) | 一种神经网络的训练方法、视频识别方法及装置 | |
CN113408418A (zh) | 一种书法字体与文字内容同步识别方法及系统 | |
CN113392868A (zh) | 一种模型训练的方法、相关装置、设备及存储介质 | |
Ahmed et al. | Branchconnect: Image categorization with learned branch connections | |
Janković Babić | A comparison of methods for image classification of cultural heritage using transfer learning for feature extraction | |
CN109614581A (zh) | 基于对偶局部学习的非负矩阵分解聚类方法 | |
Yang et al. | An improved chaotic ACO clustering algorithm | |
Cosovic et al. | Cultural heritage image classification | |
CN115019342A (zh) | 一种基于类关系推理的濒危动物目标检测方法 | |
CN111767825A (zh) | 一种人脸属性不变鲁棒性人脸识别方法及系统 | |
Xu et al. | Deep Learning in Image Classification: An Overview |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220308 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230501 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7283554 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |