JPWO2022185899A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2022185899A5 JPWO2022185899A5 JP2023503690A JP2023503690A JPWO2022185899A5 JP WO2022185899 A5 JPWO2022185899 A5 JP WO2022185899A5 JP 2023503690 A JP2023503690 A JP 2023503690A JP 2023503690 A JP2023503690 A JP 2023503690A JP WO2022185899 A5 JPWO2022185899 A5 JP WO2022185899A5
- Authority
- JP
- Japan
- Prior art keywords
- inference
- detection model
- images
- learning
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims 42
- 238000000034 method Methods 0.000 claims 14
- 238000011156 evaluation Methods 0.000 claims 9
- 230000010365 information processing Effects 0.000 claims 9
- 230000006870 function Effects 0.000 claims 4
- 238000002372 labelling Methods 0.000 claims 4
- 238000003672 processing method Methods 0.000 claims 2
- 238000004519 manufacturing process Methods 0.000 claims 1
Claims (10)
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定手段と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論手段と、
前記推論手段による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成手段と
を備えていることを特徴とする情報処理装置。 a learning means for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. Threshold value determining means for determining a first threshold value with reference to the comparison result with
Inference means for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results by the inference means, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. An information processing apparatus comprising: a data set generating means for generating a data set.
ことを特徴とする請求項1に記載の情報処理装置。 Claim 1, further comprising pseudo label reference learning means for learning a target image detection model for detecting an object included in the target image using the dataset after the pseudo label has been added. The information processing device described in .
ことを特徴とする請求項2に記載の情報処理装置。 3. The information processing apparatus according to claim 2, wherein the pseudo label reference learning unit performs relearning of the detection model as learning of the target image detection model.
第2のデータセットを用いて第2の検知モデルの学習を行う第2の学習手段と、
第1の評価用データセットに含まれる1又は複数の画像の各々を前記第1の検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する第1の閾値決定手段と、
第2の評価用データセットに含まれる1又は複数の画像の各々を前記第2の検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第2の閾値を決定する第2の閾値決定手段と、
前記第2のデータセットに含まれる1又は複数の画像の各々を前記第1の検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する第1の推論手段と、
前記第1のデータセットに含まれる1又は複数の画像の各々を前記第2の検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する第2の推論手段と、
前記第1の推論手段による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後の第2のデータセットを生成する第1のデータセット生成手段と、
前記第2の推論手段による1又は複数の推論結果のうち、前記第2の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後の第1のデータセットを生成する第2のデータセット生成手段と、
を備えていることを特徴とする情報処理装置。 a first learning means for learning a first detection model using the first data set;
a second learning means for learning a second detection model using the second data set;
One or more inference results obtained by inputting each of the one or more images included in the first evaluation dataset into the first detection model, and one or more inference results attached to each of the one or more images. a first threshold value determining means that determines a first threshold value with reference to a comparison result with one or more correct labels;
One or more inference results obtained by inputting each of the one or more images included in the second evaluation dataset into the second detection model, and one or more inference results attached to each of the one or more images. a second threshold value determining means that determines a second threshold value with reference to a comparison result with one or more correct labels;
A first method for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the first detection model. a means of reasoning,
A second method for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the first data set into the second detection model. a means of reasoning,
Among the one or more inference results by the first inference means, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. a first data set generation means for generating a second data set after labeling;
Among the one or more inference results by the second inference means, an inference result having a reliability equal to or higher than the second threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. a second data set generation means for generating the first data set after labeling;
An information processing device comprising:
対象画像用検知モデルを用いて、前記対象画像に含まれるオブジェクトの検知を行う検知手段と、
を備え、
前記対象画像用検知モデルは、
第1のデータセットを用いて検知モデルの学習を行う学習処理、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定処理、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論処理、
前記推論処理による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成処理、及び
前記疑似ラベル付与後のデータセットを参照して、前記対象画像用検知モデルの学習を行う擬似ラベル参照学習処理
によって学習されたものである
ことを特徴とする情報処理装置。 an acquisition means for acquiring a target image;
a detection means for detecting an object included in the target image using a target image detection model;
Equipped with
The detection model for the target image is
a learning process for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination process that determines a first threshold value with reference to a comparison result with
Inference processing that obtains one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained by the inference process, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. and a pseudo label reference learning process that trains the detection model for the target image by referring to the dataset after the pseudo label has been added. Information processing equipment.
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定工程と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論工程と、
前記推論工程による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成工程と
を含んでいることを特徴とする情報処理方法。 a learning step of learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination step of determining a first threshold value with reference to a comparison result with
an inference step of obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained in the inference step, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. An information processing method comprising: a dataset generation step of generating a dataset.
対象画像用検知モデルを用いて、前記対象画像に含まれるオブジェクトの検知を行うことと、
を含み、
前記対象画像用検知モデルは、
第1のデータセットを用いて検知モデルの学習を行う学習処理、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定処理、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論処理、
前記推論処理による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成処理、及び
前記疑似ラベル付与後のデータセットを参照して、前記対象画像用検知モデルの学習を行う擬似ラベル参照学習処理
によって学習されたものである
ことを特徴とする情報処理方法。 Obtaining a target image;
Detecting an object included in the target image using a target image detection model;
including;
The detection model for the target image is
a learning process for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination process that determines a first threshold value with reference to a comparison result with
Inference processing that obtains one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained by the inference process, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. and a pseudo label reference learning process that trains the detection model for the target image by referring to the dataset after the pseudo label has been added. information processing method.
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定工程と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論工程と、
前記推論工程による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成工程と、
前記疑似ラベル付与後のデータセットを用いて、対象画像に含まれるオブジェクトの検知のための対象画像用検知モデルの学習を行う擬似ラベル参照学習工程と
を含んでいることを特徴とする検知モデルの製造方法。 a learning step of learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination step of determining a first threshold value with reference to a comparison result with
an inference step of obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained in the inference step, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. a dataset generation step of generating a dataset;
a pseudo label reference learning step of learning a target image detection model for detecting an object included in the target image using the dataset after the pseudo label has been added. Production method.
第1のデータセットを用いて検知モデルの学習を行う学習手段と、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して閾値を決定する閾値決定手段と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論手段と、
前記推論手段による1又は複数の推論結果のうち、前記閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成手段と
として機能させるプログラム。 A program for causing a computer to function as an information processing device, the program comprising:
a learning means for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. Threshold determining means for determining a threshold by referring to a comparison result with
Inference means for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results by the inference means, an inference result having a reliability equal to or higher than the threshold value is set as a pseudo label, and the pseudo label is associated with the corresponding image, thereby creating a dataset after pseudo labeling. A program that functions as a dataset generation means.
対象画像を取得する取得手段と、
対象画像用検知モデルを用いて、前記対象画像に含まれるオブジェクトの検知を行う検知手段と、
として機能させ、
前記対象画像用検知モデルは、
第1のデータセットを用いて検知モデルの学習を行う学習処理、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して閾値を決定する閾値決定処理、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論処理、
前記推論処理による1又は複数の推論結果のうち、前記閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成処理、及び
前記疑似ラベル付与後のデータセットを参照して、前記対象画像用検知モデルの学習を行う擬似ラベル参照学習処理
によって学習されたものであるプログラム。 A program for causing a computer to function as an information processing device, the program comprising:
an acquisition means for acquiring a target image;
a detection means for detecting an object included in the target image using a target image detection model;
function as
The detection model for the target image is
a learning process for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold determination process that determines a threshold by referring to the comparison result with
Inference processing that obtains one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained by the inference process, an inference result having a reliability equal to or higher than the threshold value is set as a pseudo label, and the pseudo label is associated with the corresponding image to create a dataset after pseudo labeling. and a pseudo-label reference learning process that learns the detection model for the target image by referring to the dataset to which the pseudo-label has been added.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/008696 WO2022185531A1 (en) | 2021-03-05 | 2021-03-05 | Information processing device, information processing method, manufacturing method for detection model, and program |
PCT/JP2022/005877 WO2022185899A1 (en) | 2021-03-05 | 2022-02-15 | Information processing device, information processing method, method for manufacturing detection model, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022185899A1 JPWO2022185899A1 (en) | 2022-09-09 |
JPWO2022185899A5 true JPWO2022185899A5 (en) | 2023-11-24 |
Family
ID=83154107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023503690A Pending JPWO2022185899A1 (en) | 2021-03-05 | 2022-02-15 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2022185899A1 (en) |
WO (2) | WO2022185531A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116343050B (en) * | 2023-05-26 | 2023-08-01 | 成都理工大学 | Target detection method for remote sensing image noise annotation based on self-adaptive weight |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020225923A1 (en) * | 2019-05-09 | 2020-11-12 | 日本電信電話株式会社 | Analysis device, analysis method, and analysis program |
US11526802B2 (en) * | 2019-06-25 | 2022-12-13 | International Business Machines Corporation | Model training using a teacher-student learning paradigm |
-
2021
- 2021-03-05 WO PCT/JP2021/008696 patent/WO2022185531A1/en active Application Filing
-
2022
- 2022-02-15 JP JP2023503690A patent/JPWO2022185899A1/ja active Pending
- 2022-02-15 WO PCT/JP2022/005877 patent/WO2022185899A1/en active Application Filing
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Robust visual tracking using local sparse appearance model and k-selection | |
JP2018200685A (en) | Forming of data set for fully supervised learning | |
WO2023115761A1 (en) | Event detection method and apparatus based on temporal knowledge graph | |
JPWO2022185899A5 (en) | ||
JPWO2021130888A5 (en) | Learning equipment, learning methods and learning programs | |
EP3945472A3 (en) | Method of and system for online machine learning with dynamic model evaluation and selection | |
CN116204770A (en) | Training method and device for detecting abnormality of bridge health monitoring data | |
Tamir et al. | Understanding from deep learning models in context | |
JPWO2021079460A5 (en) | ||
CN110737812A (en) | search engine user satisfaction evaluation method integrating semi-supervised learning and active learning | |
CN113392743B (en) | Abnormal action detection method, abnormal action detection device, electronic equipment and computer storage medium | |
Li et al. | Myriad: Large multimodal model by applying vision experts for industrial anomaly detection | |
US11224359B2 (en) | Repetitive human activities abnormal motion detection | |
CN113673589A (en) | Label selection self-adaptive increment detection method and system based on frame distance measurement | |
CN113470073A (en) | Animal center tracking method based on deep learning | |
CN117333730B (en) | Product surface abnormality detection method and terminal | |
JPWO2020261362A5 (en) | Learning device, object detection device, learning method, and program | |
US20220245398A1 (en) | Machine annotation of photographic images | |
Vedalankar et al. | LIVE YOGA POSE DETECTION BY USING IMAGE PROCESSING AND DEEP LEARNING | |
Hachaj et al. | Recognition of human body poses and gesture sequences with gesture description language | |
JP7481173B2 (en) | Information processing device, information processing method, and program | |
Singh | Applications and Challenges of Deep Learning in Computer Vision | |
WO2022167299A1 (en) | Machine annotation of photographic images | |
US20240169762A1 (en) | Methods for featureless gaze tracking in ecologically valid conditions | |
WO2020085439A1 (en) | Learning device, learning method, and program for learning |