JP2022512065A - 画像分類モデルの訓練方法、画像処理方法及び装置 - Google Patents
画像分類モデルの訓練方法、画像処理方法及び装置 Download PDFInfo
- Publication number
- JP2022512065A JP2022512065A JP2021522979A JP2021522979A JP2022512065A JP 2022512065 A JP2022512065 A JP 2022512065A JP 2021522979 A JP2021522979 A JP 2021522979A JP 2021522979 A JP2021522979 A JP 2021522979A JP 2022512065 A JP2022512065 A JP 2022512065A
- Authority
- JP
- Japan
- Prior art keywords
- category
- labeled sample
- image
- data
- labeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 284
- 238000000034 method Methods 0.000 title claims abstract description 167
- 238000012549 training Methods 0.000 title claims abstract description 141
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 50
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 16
- 238000003709 image segmentation Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 30
- 238000002372 labelling Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本願は、2019年11月11日に中国特許局に提出された、出願番号がCN201911097069.Xであり、発明名称が「画像分類モデルの訓練方法、画像処理方法及び装置」である中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本願に組み込まれる。
いずれか1つのカテゴリに対して、該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを示し、該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合及び前記ネガティブサンプルカテゴリ集合に属せず、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定するように構成される。
本願の実施例による画像分類モデルの訓練を示すフローチャートである図1に示すように、該方法は、ステップS101~S104を含み、ここで、
S101において、ラベル付きサンプル画像集合を取得し、ラベル付きサンプル画像集合に複数のラベル付きサンプル画像及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる。
該いずれか1つのカテゴリに対応するラベル付きサンプル画像の数、該いずれか1つのカテゴリに対応するラベル付きサンプル画像がラベル付きサンプル画像集合に占める割合、該いずれか1つのカテゴリに対応するラベル付きサンプル画像の元サンプル画像の数、該いずれか1つのカテゴリに対応するラベル付きサンプル画像の元サンプル画像の数が全てのラベル付きサンプル画像の元サンプル画像の数に占める割合のうちのいずれか1つであってもよい。
各ラベル付きサンプル画像に対して、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、画像分類モデルを用いて該ラベル付きサンプル画像に対して分類を行う場合の損失情報を得るという方式を用いることができる。
は、該ラベル付きサンプル画像がカテゴリjに属する信頼度を表し、cは、該ラベル付きサンプル画像に対応する注釈ラベルを表し、
は、該ラベル付きサンプル画像に対して、カテゴリjに対応する損失重みを表す。
は、下記式(3)を満たす。
(3)
は、所定の頻度閾値を表し、cは、ラベル付きサンプル画像が属するカテゴリを表し、
は、ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを表す。
は、カテゴリjに対応する頻度情報を表す。
は、下記式(4)を満たす。
(4)
該ラベル付きサンプル画像及びターゲットラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を決定する。
は、下記式(5)を満たす。
(5)
は、所定の頻度閾値を表し、
は、ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを表す。
は、カテゴリjに対応する頻度情報を表す。
は、ポジティブサンプルカテゴリ集合を表し、
は、ネガティブサンプルカテゴリ集合を表す。
は、下記式(6)を満たす。
(6)
画像分類モデルは、上記実施例の画像分類モデルの訓練方法で訓練されたものであり、
画像処理タスクは、画像分類、対象検出、キーポイント検出、画像セグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含む。
事前訓練されたデータ分類モデルに基づいて、データ処理タスクを実行することを含み、
データ分類モデルは、上記実施例におけるデータ分類モデルの訓練方法で訓練されたものであり、
データ処理タスクは、データ分類、データセグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含み、
データは、画像データ及びテキストデータのうちのいずれか1つを含む。
第1取得モジュール41は、ラベル付きサンプル画像集合を取得するように構成され、前記ラベル付きサンプル画像集合に複数のラベル付きサンプル画像及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれ、
第1頻度情報決定モジュール42は、前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定するように構成され、
第1損失情報決定モジュール43は、前記複数のラベル付きサンプル画像にそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、画像分類モデルの損失情報を決定するように構成され、
第1訓練モジュール44は、前記損失情報に基づいて、前記画像分類モデルを訓練するように構成され、前記画像分類モデルは、認識されるべき画像のカテゴリを決定するためのものである。
事前訓練された画像分類モデルに基づいて、画像処理タスクを実行するように構成される第1処理モジュールを備え、
前記画像分類モデルは、上記実施例に記載の画像分類モデルの訓練方法で訓練されたものであり、
前記画像処理タスクは、画像分類、対象検出、キーポイント検出、画像セグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含む。
第2取得モジュール51は、ラベル付きサンプルデータ集合を取得するように構成され、前記ラベル付きサンプルデータ集合に複数のラベル付きサンプルデータ及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれ、
第2頻度情報決定モジュール52は、前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定するように構成され、
第2損失情報決定モジュール53は、前記複数のラベル付きサンプルデータにそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、データ分類モデルの損失情報を決定するように構成され、
第2訓練モジュール54は、前記損失情報に基づいて、前記データ分類モデルを訓練するように構成され、前記データ分類モデルは、認識されるべきデータのカテゴリを決定するためのものである。
事前訓練されたデータ分類モデルに基づいて、データ処理タスクを実行するように構成される第2処理モジュールを備え、
前記データ分類モデルは、上記実施例に記載のデータ分類モデルの訓練方法で訓練されたものであり、
前記データ処理タスクは、データ分類、データセグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含み、前記データは、画像データ及びテキストデータのうちのいずれか1つを含む。
ラベル付きサンプル画像集合を取得することであって、前記ラベル付きサンプル画像集合に複数のラベル付きサンプル画像及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、ことと、
前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定することと、
前記複数のラベル付きサンプル画像にそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、画像分類モデルの損失情報を決定することと、
前記損失情報に基づいて、前記画像分類モデルを訓練することであって、前記画像分類モデルは、認識されるべき画像のカテゴリを決定するためのものである、ことと、を実行する。
ラベル付きサンプル画像集合を取得することであって、前記ラベル付きサンプル画像集合に複数のラベル付きサンプル画像及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、ことと、
ラベル付きサンプルデータ集合を取得することであって、前記ラベル付きサンプルデータ集合に複数のラベル付きサンプルデータ及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、ことと、
前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定することと、
前記複数のラベル付きサンプルデータにそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、データ分類モデルの損失情報を決定することと、
前記損失情報に基づいて、前記データ分類モデルを訓練することであって、前記データ分類モデルは、認識されるべきデータのカテゴリを決定するためのものである、ことと、を実行する。
Claims (55)
- 画像分類モデルの訓練方法であって、
ラベル付きサンプル画像集合を取得することであって、前記ラベル付きサンプル画像集合に複数のラベル付きサンプル画像及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、ことと、
前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定することと、前記複数のラベル付きサンプル画像にそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、画像分類モデルの損失情報を決定することと、前記損失情報に基づいて、前記画像分類モデルを訓練することであって、前記画像分類モデルは、認識されるべき画像のカテゴリを決定するためのものである、ことと、を含む、画像分類モデルの訓練方法。 - 前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定することは、
各カテゴリに対して、該カテゴリに属するラベル付きサンプル画像及び各ラベル付きサンプル画像に対応する元サンプル画像に基づいて、該カテゴリに対応する元サンプル画像の数を決定することであって、各元サンプル画像は、1つ又は複数のラベル付きサンプル画像に対応する、ことと、
前記元サンプル画像の数に基づいて、該カテゴリに対応する頻度情報を決定することと、を含むことを特徴とする
請求項1に記載の画像分類モデルの訓練方法。 - 前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定することは、
各カテゴリに対して、前記ラベル付きサンプル画像集合におけるラベル付きサンプル画像の総数及び該カテゴリに属するラベル付きサンプル画像の数に基づいて、該カテゴリに対応する頻度情報を決定すること、又は、該カテゴリに属するラベル付きサンプル画像の数を該カテゴリに対応する頻度情報とすること、を含むことを特徴とする
請求項1に記載の画像分類モデルの訓練方法。 - 前記複数のラベル付きサンプル画像にそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、分類モデルの損失情報を決定することは、
各ラベル付きサンプル画像に対して、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプル画像に対して分類を行う場合の損失情報を得ることを含むことを特徴とする
請求項1~3のうちいずれか一項に記載の画像分類モデルの訓練方法。 - 前記該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプル画像に対して分類を行う場合の損失情報を得ることは、
該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することと、
所定の複数のカテゴリのうちの各カテゴリに対応する損失重みに基づいて、前記分類モデルを用いて該ラベル付きサンプル画像に対して分類を行う場合の損失情報を得ることと、を含むことを特徴とする
請求項4に記載の画像分類モデルの訓練方法。 - 前記該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、
該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを示し、且つ該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定することを含むことを特徴とする
請求項5に記載の画像分類モデルの訓練方法。 - 前記該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、
該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が背景のラベル付きサンプル画像であることを示し、及び/又は、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定することを含むことを特徴とする
請求項5~6のうちいずれか一項に記載の画像分類モデルの訓練方法。 - 前記該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
該ラベル付きサンプル画像の分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することを含み、
ここで、前記ポジティブサンプルカテゴリ集合に、該元サンプル画像に含まれる少なくとも1つのターゲット対象のカテゴリが含まれ、前記ネガティブサンプルカテゴリ集合に、該元サンプル画像に含まれない少なくとも1つのターゲット対象のカテゴリが含まれることを特徴とする
請求項5に記載の画像分類モデルの訓練方法。 - 前記画像分類モデルの訓練方法は、
前記ラベル付きサンプル画像集合から、該ラベル付きサンプル画像と同一の元サンプル画像に対応するターゲットラベル付きサンプル画像を決定し、該ラベル付きサンプル画像及び前記ターゲットラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を決定する方式、
又は、
該ラベル付きサンプル画像に対応する元サンプル画像の第1補助分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を決定する方式であって、前記第1補助分類ラベルは、前記元サンプル画像に含まれるターゲット対象のカテゴリを示すためのものである、方式を用いて、
該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を取得することを更に含むことを特徴とする
請求項8に記載の画像分類モデルの訓練方法。 - 前記画像分類モデルの訓練方法は、
該ラベル付きサンプル画像に対応する元サンプル画像の第2補助分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のネガティブサンプルカテゴリ集合を決定する方式を用いて、該ラベル付きサンプル画像に対応する元サンプル画像のネガティブサンプルカテゴリ集合を取得することを更に含み、
前記第2補助分類ラベルは、前記元サンプル画像に含まれないターゲット対象のカテゴリを示すためのものであることを特徴とする
請求項8~9のうちいずれか一項に記載の画像分類モデルの訓練方法。 - 前記該ラベル付きサンプル画像の分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、
該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを示し、該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合及び前記ネガティブサンプルカテゴリ集合に属せず、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定することを含むことを特徴とする
請求項8~10のうちいずれか一項に記載の画像分類モデルの訓練方法。 - 前記該ラベル付きサンプル画像の分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が背景のラベル付きサンプル画像であることを示し、及び/又は、
該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合又は前記ネガティブサンプルカテゴリ集合に属し、及び/又は、
該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、
該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定することを含むことを特徴とする
請求項8~10のうちいずれか一項に記載の画像分類モデルの訓練方法。 - 画像処理方法であって、
事前訓練された画像分類モデルに基づいて、画像処理タスクを実行することを含み、
前記画像分類モデルは、請求項1~12のうちいずれか一項に記載の画像分類モデルの訓練方法で訓練されたものであり、
前記画像処理タスクは、画像分類、対象検出、キーポイント検出、画像セグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含む、画像処理方法。 - データ分類モデルの訓練方法であって、
ラベル付きサンプルデータ集合を取得することであって、前記ラベル付きサンプルデータ集合に複数のラベル付きサンプルデータ及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、ことと、
前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定することと、
前記複数のラベル付きサンプルデータにそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、データ分類モデルの損失情報を決定することと、
前記損失情報に基づいて、前記データ分類モデルを訓練することであって、前記データ分類モデルは、認識されるべきデータのカテゴリを決定するためのものである、ことと、を含む、データ分類モデルの訓練方法。 - 前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定することは、
各カテゴリに対して、該カテゴリに属するラベル付きサンプルデータ及び各ラベル付きサンプルデータに対応する元サンプルデータに基づいて、該カテゴリに対応する元サンプルデータの数を決定することであって、各元サンプルデータは、1つ又は複数のラベル付きサンプルデータに対応する、ことと、
前記元サンプルデータの数に基づいて、該カテゴリに対応する頻度情報を決定することと、を含むことを特徴とする
請求項14に記載のデータ分類モデルの訓練方法。 - 前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定することは、
各カテゴリに対して、前記ラベル付きサンプルデータ集合におけるラベル付きサンプルデータの総数及び該カテゴリに属するラベル付きサンプルデータの数に基づいて、該カテゴリに対応する頻度情報を決定すること、又は、該カテゴリに属するラベル付きサンプルデータの数を該カテゴリに対応する頻度情報とすること、を含むことを特徴とする
請求項14に記載のデータ分類モデルの訓練方法。 - 前記複数のラベル付きサンプルデータにそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、分類モデルの損失情報を決定することは、
各ラベル付きサンプルデータに対して、該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプルデータに対して分類を行う場合の損失情報を得ることを含むことを特徴とする
請求項14~16のうちいずれか一項に記載のデータ分類モデルの訓練方法。 - 前記該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプルデータに対して分類を行う場合の損失情報を得ることは、
該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することと、
所定の複数のカテゴリのうちの各カテゴリに対応する損失重みに基づいて、前記分類モデルを用いて該ラベル付きサンプルデータに対して分類を行う場合の損失情報を得ることと、を含むことを特徴とする
請求項17に記載のデータ分類モデルの訓練方法。 - 前記該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、
該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが非背景のラベル付きサンプルデータであることを示し、且つ該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定することを含むことを特徴とする
請求項18に記載のデータ分類モデルの訓練方法。 - 前記該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、
該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが背景のラベル付きサンプル画像であることを示し、及び/又は、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定することを含むことを特徴とする
請求項17~19のうちいずれか一項に記載のデータ分類モデルの訓練方法。 - 前記該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
該ラベル付きサンプルデータの分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することを含み、
ここで、前記ポジティブサンプルカテゴリ集合に、該元サンプルデータに含まれる少なくとも1つのターゲット対象のカテゴリが含まれ、前記ネガティブサンプルカテゴリ集合に、該元サンプルデータに含まれない少なくとも1つのターゲット対象のカテゴリが含まれることを特徴とする
請求項18に記載のデータ分類モデルの訓練方法。 - 前記データ分類モデルの訓練方法は、
前記ラベル付きサンプルデータ集合から、該ラベル付きサンプルデータと同一の元サンプルデータに対応するターゲットラベル付きサンプルデータを決定し、該ラベル付きサンプルデータ及び前記ターゲットラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合を決定する方式、
又は、
該ラベル付きサンプルデータに対応する元サンプルデータの第1補助分類ラベルに基づいて、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合を決定する方式であって、前記第1補助分類ラベルは、前記元サンプルデータに含まれるターゲット対象のカテゴリを示すためのものである、方式を用いて、
該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合を取得することを更に含むことを特徴とする
請求項21に記載のデータ分類モデルの訓練方法。 - 前記データ分類モデルの訓練方法は、
該ラベル付きサンプルデータに対応する元サンプルデータの第2補助分類ラベルに基づいて、該ラベル付きサンプルデータに対応する元サンプルデータのネガティブサンプルカテゴリ集合を決定する方式を用いて、該ラベル付きサンプルデータに対応する元サンプルデータのネガティブサンプルカテゴリ集合を取得することを更に含み、
前記第2補助分類ラベルは、前記元サンプルデータに含まれないターゲット対象のカテゴリを示すためのものであることを特徴とする
請求項21~22のうちいずれか一項に記載のデータ分類モデルの訓練方法。 - 前記該ラベル付きサンプルデータの分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、
該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが非背景のラベル付きサンプルデータであることを示し、該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合及び前記ネガティブサンプルカテゴリ集合に属せず、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定することを含むことを特徴とする
請求項21~23のうちいずれか一項に記載のデータ分類モデルの訓練方法。 - 前記該ラベル付きサンプルデータの分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定することは、
いずれか1つのカテゴリに対して、該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが背景のラベル付きサンプルデータであることを示し、及び/又は、
該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合又は前記ネガティブサンプルカテゴリ集合に属し、及び/又は、
該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、
該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定することを含むことを特徴とする
請求項21~24のうちいずれか一項に記載のデータ分類モデルの訓練方法。 - データ処理方法であって、
事前訓練されたデータ分類モデルに基づいて、データ処理タスクを実行することを含み、
前記データ分類モデルは、請求項14~25のうちいずれか一項に記載のデータ分類モデルの訓練方法で訓練されたものであり、
前記データ処理タスクは、データ分類、データセグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含み、
前記データは、画像データ及びテキストデータのうちのいずれか1つを含む、データ処理方法。 - 画像分類モデル訓練装置であって、
ラベル付きサンプル画像集合を取得するように構成される第1取得モジュールであって、前記ラベル付きサンプル画像集合に複数のラベル付きサンプル画像及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、第1取得モジュールと、
前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定するように構成される第1頻度情報決定モジュールと、
前記複数のラベル付きサンプル画像にそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、画像分類モデルの損失情報を決定するように構成される第1損失情報決定モジュールと、
前記損失情報に基づいて、前記画像分類モデルを訓練するように構成される第1訓練モジュールであって、前記画像分類モデルは、認識されるべき画像のカテゴリを決定するためのものである、第1訓練モジュールと、を備える、画像分類モデル訓練装置。 - 前記第1頻度情報決定モジュールは、前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定する場合、
各カテゴリに対して、該カテゴリに属するラベル付きサンプル画像及び各ラベル付きサンプル画像に対応する元サンプル画像に基づいて、該カテゴリに対応する元サンプル画像の数を決定することであって、各元サンプル画像は、1つ又は複数のラベル付きサンプル画像に対応する、ことと、
前記元サンプル画像の数に基づいて、該カテゴリに対応する頻度情報を決定することと、を実行するように構成されることを特徴とする
請求項27に記載の画像分類モデル訓練装置。 - 前記第1頻度情報決定モジュールは、前記ラベル付きサンプル画像及び各前記ラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定する場合、
各カテゴリに対して、前記ラベル付きサンプル画像集合におけるラベル付きサンプル画像の総数及び該カテゴリに属するラベル付きサンプル画像の数に基づいて、該カテゴリに対応する頻度情報を決定し、又は、該カテゴリに属するラベル付きサンプル画像の数を該カテゴリに対応する頻度情報とするように構成されることを特徴とする
請求項27に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、前記複数のラベル付きサンプル画像にそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、分類モデルの損失情報を決定する場合、
各ラベル付きサンプル画像に対して、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプル画像に対して分類を行う場合の損失情報を得るように構成されることを特徴とする
請求項27~29のうちいずれか一項に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプル画像に対して分類を行うときの損失情報を得る場合、
該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定し、
所定の複数のカテゴリのうちの各カテゴリに対応する損失重みに基づいて、前記分類モデルを用いて該ラベル付きサンプル画像に対して分類を行う場合の損失情報を得るように構成されることを特徴とする
請求項30に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、
該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを示し、且つ該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定するように構成されることを特徴とする
請求項31に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が背景のラベル付きサンプル画像であることを示し、及び/又は、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定するように構成されることを特徴とする
請求項31~32のうちいずれか一項に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、該ラベル付きサンプル画像の分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
該ラベル付きサンプル画像の分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定するように構成され、
ここで、前記ポジティブサンプルカテゴリ集合に、該元サンプル画像に含まれる少なくとも1つのターゲット対象のカテゴリが含まれ、前記ネガティブサンプルカテゴリ集合に、該元サンプル画像に含まれない少なくとも1つのターゲット対象のカテゴリが含まれることを特徴とする
請求項31に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、
前記ラベル付きサンプル画像集合から、該ラベル付きサンプル画像と同一の元サンプル画像に対応するターゲットラベル付きサンプル画像を決定し、該ラベル付きサンプル画像及び前記ターゲットラベル付きサンプル画像にそれぞれ対応する分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を決定する方式、
又は、
該ラベル付きサンプル画像に対応する元サンプル画像の第1補助分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を決定する方式であって、前記第1補助分類ラベルは、前記元サンプル画像に含まれるターゲット対象のカテゴリを示すためのものである、方式を用いて、
該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合を取得するように構成されることを特徴とする
請求項34に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、
該ラベル付きサンプル画像に対応する元サンプル画像の第2補助分類ラベルに基づいて、該ラベル付きサンプル画像に対応する元サンプル画像のネガティブサンプルカテゴリ集合を決定する方式を用いて、該ラベル付きサンプル画像に対応する元サンプル画像のネガティブサンプルカテゴリ集合を取得するように構成され、
前記第2補助分類ラベルは、前記元サンプル画像に含まれないターゲット対象のカテゴリを示すためのものであることを特徴とする
請求項34~35のうちいずれか一項に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、該ラベル付きサンプル画像の分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、
該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が非背景のラベル付きサンプル画像であることを示し、該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合及び前記ネガティブサンプルカテゴリ集合に属せず、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定するように構成されることを特徴とする
請求項34~36のうちいずれか一項に記載の画像分類モデル訓練装置。 - 前記第1損失情報決定モジュールは、該ラベル付きサンプル画像の分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプル画像に対応する元サンプル画像のポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプル画像に対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、該ラベル付きサンプル画像の分類ラベルが、該ラベル付きサンプル画像が背景のラベル付きサンプル画像であることを示し、及び/又は、
該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合又は前記ネガティブサンプルカテゴリ集合に属し、及び/又は、
該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、
該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定するように構成されることを特徴とする
請求項34~36のうちいずれか一項に記載の画像分類モデル訓練装置。 - 画像処理装置であって、
事前訓練された画像分類モデルに基づいて、画像処理タスクを実行するように構成される第1処理モジュールを備え、
前記画像分類モデルは、請求項27~38のうちいずれか一項に記載の画像分類モデルの訓練方法で訓練されたものであり、
前記画像処理タスクは、画像分類、対象検出、キーポイント検出、画像セグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含む、画像処理装置。 - データ分類モデル訓練装置であって、
ラベル付きサンプルデータ集合を取得するように構成される第2取得モジュールであって、前記ラベル付きサンプルデータ集合に複数のラベル付きサンプルデータ及び各ラベル付きサンプル画像にそれぞれ対応する分類ラベルが含まれる、第2取得モジュールと、
前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリにそれぞれ対応する頻度情報を決定するように構成される第2頻度情報決定モジュールと、
前記複数のラベル付きサンプルデータにそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、データ分類モデルの損失情報を決定するように構成される第2損失情報決定モジュールと、
前記損失情報に基づいて、前記データ分類モデルを訓練するように構成される第2訓練モジュールであって、前記データ分類モデルは、認識されるべきデータのカテゴリを決定するためのものである、第2訓練モジュールと、を備える、データ分類モデル訓練装置。 - 前記第2頻度情報決定モジュールは、前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定する場合、
各カテゴリに対して、該カテゴリに属するラベル付きサンプルデータ及び各ラベル付きサンプルデータに対応する元サンプルデータに基づいて、該カテゴリに対応する元サンプルデータの数を決定することであって、各元サンプルデータは、1つ又は複数のラベル付きサンプルデータに対応する、ことと、
前記元サンプルデータの数に基づいて、該カテゴリに対応する頻度情報を決定することと、を実行するように構成されることを特徴とする
請求項40に記載のデータ分類モデル訓練装置。 - 前記第2頻度情報決定モジュールは、前記ラベル付きサンプルデータ及び各前記ラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、所定の複数のカテゴリのうちの各カテゴリに対応する頻度情報を決定する場合、
各カテゴリに対して、前記ラベル付きサンプルデータ集合におけるラベル付きサンプルデータの総数及び該カテゴリに属するラベル付きサンプルデータの数に基づいて、該カテゴリに対応する頻度情報を決定し、又は、該カテゴリに属するラベル付きサンプルデータの数を該カテゴリに対応する頻度情報とするように構成されることを特徴とする
請求項40に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、前記複数のラベル付きサンプルデータにそれぞれ対応する分類ラベル及び各カテゴリにそれぞれ対応する前記頻度情報に基づいて、分類モデルの損失情報を決定する場合、
各ラベル付きサンプルデータに対して、該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプルデータに対して分類を行う場合の損失情報を得るように構成されることを特徴とする
請求項40~42のうちいずれか一項に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、分類モデルを用いて該ラベル付きサンプルデータに対して分類を行うときの損失情報を得る場合、
該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定し、
所定の複数のカテゴリのうちの各カテゴリに対応する損失重みに基づいて、前記分類モデルを用いて該ラベル付きサンプルデータに対して分類を行う場合の損失情報を得るように構成されることを特徴とする
請求項42に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、
該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが非背景のラベル付きサンプルデータであることを示し、且つ該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定するように構成されることを特徴とする
請求項44に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、
該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが背景のラベル付きサンプル画像であることを示し、及び/又は、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定するように構成されることを特徴とする
請求項43~45のうちいずれか一項に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、該ラベル付きサンプルデータの分類ラベル及び各カテゴリにそれぞれ対応する頻度情報に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
該ラベル付きサンプルデータの分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定するように構成され、
ここで、前記ポジティブサンプルカテゴリ集合に、該元サンプルデータに含まれる少なくとも1つのターゲット対象のカテゴリが含まれ、前記ネガティブサンプルカテゴリ集合に、該元サンプルデータに含まれない少なくとも1つのターゲット対象のカテゴリが含まれることを特徴とする
請求項44に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、
前記ラベル付きサンプルデータ集合から、該ラベル付きサンプルデータと同一の元サンプルデータに対応するターゲットラベル付きサンプルデータを決定し、該ラベル付きサンプルデータ及び前記ターゲットラベル付きサンプルデータにそれぞれ対応する分類ラベルに基づいて、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合を決定する方式、
又は、
該ラベル付きサンプルデータに対応する元サンプルデータの第1補助分類ラベルに基づいて、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合を決定する方式であって、前記第1補助分類ラベルは、前記元サンプルデータに含まれるターゲット対象のカテゴリを示すためのものである、方式を用いて、
該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合を取得するように構成されることを特徴とする
請求項47に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、
該ラベル付きサンプルデータに対応する元サンプルデータの第2補助分類ラベルに基づいて、該ラベル付きサンプルデータに対応する元サンプルデータのネガティブサンプルカテゴリ集合を決定する方式を用いて、該ラベル付きサンプルデータに対応する元サンプルデータのネガティブサンプルカテゴリ集合を取得するように構成され、
前記第2補助分類ラベルは、前記元サンプルデータに含まれないターゲット対象のカテゴリを示すためのものであることを特徴とする
請求項47~48のうちいずれか一項に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、該ラベル付きサンプルデータの分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、
該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが非背景のラベル付きサンプルデータであることを示し、該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合及び前記ネガティブサンプルカテゴリ集合に属せず、該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値未満であると決定した場合、該いずれか1つのカテゴリに対応する損失重みを第1所定の損失重み値として決定するように構成されることを特徴とする
請求項47~49のうちいずれか一項に記載のデータ分類モデル訓練装置。 - 前記第2損失情報決定モジュールは、該ラベル付きサンプルデータの分類ラベル、各カテゴリにそれぞれ対応する頻度情報、該ラベル付きサンプルデータに対応する元サンプルデータのポジティブサンプルカテゴリ集合及びネガティブサンプルカテゴリ集合に基づいて、該ラベル付きサンプルデータに対して、所定の複数のカテゴリのうちの各カテゴリに対応する損失重みを決定する場合、
いずれか1つのカテゴリに対して、該ラベル付きサンプルデータの分類ラベルが、該ラベル付きサンプルデータが背景のラベル付きサンプルデータであることを示し、及び/又は、
該いずれか1つのカテゴリが前記ポジティブサンプルカテゴリ集合又は前記ネガティブサンプルカテゴリ集合に属し、及び/又は、
該いずれか1つのカテゴリに対応する頻度情報が所定の頻度閾値以上であると決定した場合、
該いずれか1つのカテゴリに対応する損失重みを第2所定の損失重み値として決定するように構成されることを特徴とする
請求項47~51のうちいずれか一項に記載のデータ分類モデル訓練装置。 - データ処理装置であって、
事前訓練されたデータ分類モデルに基づいて、データ処理タスクを実行するように構成される第2処理モジュールを備え、
前記データ分類モデルは、請求項14~25のうちいずれか一項に記載のデータ分類モデルの訓練方法で訓練されたものであり、
前記データ処理タスクは、データ分類、データセグメンテーション、インスタンスセグメンテーションのうちの1つ又は複数を含み、
前記データは、画像データ及びテキストデータのうちのいずれか1つを含む、データ処理装置。 - コンピュータ機器であって、前記コンピュータ機器は、プロセッサと、メモリと、バスと、を備え、前記メモリに、前記プロセッサによる実行可能な機器可読命令が記憶されており、コンピュータ機器が運転される場合、前記プロセッサと前記メモリとは、バスを介して通信し、前記プロセッサが前記機器可読命令を実行して、請求項1~12のうちいずれか一項に記載の画像分類モデルの訓練方法のステップを実行し、又は、請求項13に記載の画像処理方法のステップを実行し、又は、請求項14~25のうちいずれか一項に記載のデータ分類モデルの訓練方法のステップを実行し、又は、請求項26に記載のデータ処理方法のステップを実行する、コンピュータ機器。
- コンピュータ可読記憶媒体であって、該コンピュータ可読記憶媒体に、コンピュータプログラムが記憶されており、該コンピュータプログラムがプロセッサにより実行される場合、前記プロセッサに、請求項1~12のうちいずれか一項に記載の画像分類モデルの訓練方法のステップを実行させ、又は、請求項13に記載の画像処理方法のステップを実行させ、又は、請求項14~25のうちいずれか一項に記載のデータ分類モデルの訓練方法のステップを実行させ、又は、請求項26に記載のデータ処理方法のステップを実行させる、コンピュータ可読記憶媒体。
- コンピュータプログラムであって、該コンピュータプログラムがプロセッサにより実行される場合、前記プロセッサに、請求項1~12のうちいずれか一項に記載の画像分類モデルの訓練方法のステップを実行させ、又は、請求項13に記載の画像処理方法のステップを実行させ、又は、請求項14~25のうちいずれか一項に記載のデータ分類モデルの訓練方法のステップを実行させ、又は、請求項26に記載のデータ処理方法のステップを実行させる、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911097069.X | 2019-11-11 | ||
CN201911097069.XA CN110837869A (zh) | 2019-11-11 | 2019-11-11 | 图像分类模型训练方法、图像处理方法及装置 |
PCT/CN2019/127394 WO2021093096A1 (zh) | 2019-11-11 | 2019-12-23 | 图像分类模型训练方法、图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022512065A true JP2022512065A (ja) | 2022-02-02 |
JP7266674B2 JP7266674B2 (ja) | 2023-04-28 |
Family
ID=69574764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021522979A Active JP7266674B2 (ja) | 2019-11-11 | 2019-12-23 | 画像分類モデルの訓練方法、画像処理方法及び装置 |
Country Status (5)
Country | Link |
---|---|
JP (1) | JP7266674B2 (ja) |
KR (1) | KR20210062687A (ja) |
CN (1) | CN110837869A (ja) |
TW (1) | TWI752455B (ja) |
WO (1) | WO2021093096A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429448B (zh) * | 2020-04-09 | 2023-07-18 | 常州奥创医疗科技有限公司 | 一种基于弱分割信息的生物荧光目标计数方法 |
CN111783635A (zh) * | 2020-06-30 | 2020-10-16 | 北京百度网讯科技有限公司 | 图像标注方法、装置、设备以及存储介质 |
TWI812888B (zh) | 2020-10-14 | 2023-08-21 | 財團法人工業技術研究院 | 影像辨識方法及影像辨識系統 |
CN112418327A (zh) * | 2020-11-25 | 2021-02-26 | Oppo广东移动通信有限公司 | 图像分类模型的训练方法、装置、电子设备以及存储介质 |
CN112651938B (zh) * | 2020-12-24 | 2023-12-19 | 平安科技(深圳)有限公司 | 视盘图像分类模型的训练方法、装置、设备及存储介质 |
TWI771010B (zh) * | 2021-05-20 | 2022-07-11 | 鴻海精密工業股份有限公司 | 缺陷檢測方法、電腦裝置及儲存介質 |
CN113222043B (zh) * | 2021-05-25 | 2024-02-02 | 北京有竹居网络技术有限公司 | 一种图像分类方法、装置、设备及存储介质 |
CN113947571A (zh) * | 2021-09-30 | 2022-01-18 | 北京百度网讯科技有限公司 | 车辆损伤检测模型的训练方法及车辆损伤识别方法 |
CN114331379B (zh) * | 2021-12-31 | 2023-08-15 | 北京百度网讯科技有限公司 | 用于输出待办任务的方法、模型训练方法和装置 |
TWI806500B (zh) * | 2022-03-18 | 2023-06-21 | 廣達電腦股份有限公司 | 影像分類裝置和方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017162456A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 道路シーンのセマンティックセグメンテーションのための制約付きデコンボリューションネットワークのトレーニング |
CN109829399A (zh) * | 2019-01-18 | 2019-05-31 | 武汉大学 | 一种基于深度学习的车载道路场景点云自动分类方法 |
WO2019150813A1 (ja) * | 2018-01-30 | 2019-08-08 | 富士フイルム株式会社 | データ処理装置及び方法、認識装置、学習データ保存装置、機械学習装置並びにプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8655805B2 (en) * | 2010-08-30 | 2014-02-18 | International Business Machines Corporation | Method for classification of objects in a graph data stream |
CN103366013B (zh) * | 2013-07-29 | 2016-03-02 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法及服务器 |
CN106021364B (zh) * | 2016-05-10 | 2017-12-12 | 百度在线网络技术(北京)有限公司 | 图片搜索相关性预测模型的建立、图片搜索方法和装置 |
CN106096538B (zh) * | 2016-06-08 | 2019-08-23 | 中国科学院自动化研究所 | 基于定序神经网络模型的人脸识别方法及装置 |
CN107609461A (zh) * | 2017-07-19 | 2018-01-19 | 阿里巴巴集团控股有限公司 | 模型的训练方法、数据相似度的确定方法、装置及设备 |
CN108229541B (zh) * | 2017-12-11 | 2021-09-28 | 上海海事大学 | 一种基于k最近邻算法的岸桥中拉杆应力数据分类方法 |
CN108229555B (zh) * | 2017-12-29 | 2019-10-25 | 深圳云天励飞技术有限公司 | 样本权重分配方法、模型训练方法、电子设备及存储介质 |
-
2019
- 2019-11-11 CN CN201911097069.XA patent/CN110837869A/zh active Pending
- 2019-12-23 KR KR1020217012461A patent/KR20210062687A/ko not_active Application Discontinuation
- 2019-12-23 JP JP2021522979A patent/JP7266674B2/ja active Active
- 2019-12-23 WO PCT/CN2019/127394 patent/WO2021093096A1/zh active Application Filing
-
2020
- 2020-04-06 TW TW109111415A patent/TWI752455B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017162456A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 道路シーンのセマンティックセグメンテーションのための制約付きデコンボリューションネットワークのトレーニング |
WO2019150813A1 (ja) * | 2018-01-30 | 2019-08-08 | 富士フイルム株式会社 | データ処理装置及び方法、認識装置、学習データ保存装置、機械学習装置並びにプログラム |
CN109829399A (zh) * | 2019-01-18 | 2019-05-31 | 武汉大学 | 一种基于深度学习的车载道路场景点云自动分类方法 |
Non-Patent Citations (2)
Title |
---|
LINHUI LI, ET AL.: "Traffic Scene Segmentation Based on RGB-D Image and Deep Learning", IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, vol. Volume: 19, Issue: 5, JPN6022025034, 10 August 2017 (2017-08-10), ISSN: 0004948246 * |
平松 侑樹,外1名: "Attention moduleを用いた細胞画像のセグメンテーション", 電子情報通信学会技術研究報告 VOL.118 NO.412 [ONLINE], vol. 第118巻, JPN6022025033, 15 January 2019 (2019-01-15), JP, ISSN: 0004948245 * |
Also Published As
Publication number | Publication date |
---|---|
TW202119288A (zh) | 2021-05-16 |
TWI752455B (zh) | 2022-01-11 |
CN110837869A (zh) | 2020-02-25 |
JP7266674B2 (ja) | 2023-04-28 |
WO2021093096A1 (zh) | 2021-05-20 |
KR20210062687A (ko) | 2021-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022512065A (ja) | 画像分類モデルの訓練方法、画像処理方法及び装置 | |
CN105468742B (zh) | 恶意订单识别方法及装置 | |
US10262272B2 (en) | Active machine learning | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
CN112989035B (zh) | 基于文本分类识别用户意图的方法、装置及存储介质 | |
WO2021073390A1 (zh) | 数据筛选方法、装置、设备及计算机可读存储介质 | |
CN108038208B (zh) | 上下文信息识别模型的训练方法、装置和存储介质 | |
CN111027707B (zh) | 模型的优化方法、装置及电子设备 | |
US20210390370A1 (en) | Data processing method and apparatus, storage medium and electronic device | |
CN111831826B (zh) | 跨领域的文本分类模型的训练方法、分类方法以及装置 | |
JP7364709B2 (ja) | 機械学習および自然言語処理を利用したワクチン接種データの抽出および確認 | |
WO2020143301A1 (zh) | 一种训练样本有效性检测方法、计算机设备及计算机非易失性存储介质 | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
CN111275205A (zh) | 虚拟样本的生成方法、终端设备及存储介质 | |
CN112988963A (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
WO2021174814A1 (zh) | 众包任务的答案验证方法、装置、计算机设备及存储介质 | |
CN111813941A (zh) | 结合rpa和ai的文本分类方法、装置、设备及介质 | |
CN113255368B (zh) | 针对文本数据进行情感分析的方法、装置及相关设备 | |
CN113434630B (zh) | 客服服务评估方法、装置、终端设备及介质 | |
CN111767710B (zh) | 印尼语的情感分类方法、装置、设备及介质 | |
CN113590754A (zh) | 应用于社群互动的大数据分析方法及大数据分析服务器 | |
CN113312445A (zh) | 数据处理方法、模型构建方法、分类方法及计算设备 | |
CN110704619B (zh) | 文本分类方法、装置及电子设备 | |
WO2020088338A1 (zh) | 一种建立识别模型的方法及装置 | |
CN111612023A (zh) | 一种分类模型构建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210426 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210426 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220621 |
|
A603 | Late request for extension of time limit during examination |
Free format text: JAPANESE INTERMEDIATE CODE: A603 Effective date: 20221117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20221220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230307 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20230307 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230315 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20230322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7266674 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |