JPWO2022185899A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2022185899A5
JPWO2022185899A5 JP2023503690A JP2023503690A JPWO2022185899A5 JP WO2022185899 A5 JPWO2022185899 A5 JP WO2022185899A5 JP 2023503690 A JP2023503690 A JP 2023503690A JP 2023503690 A JP2023503690 A JP 2023503690A JP WO2022185899 A5 JPWO2022185899 A5 JP WO2022185899A5
Authority
JP
Japan
Prior art keywords
inference
detection model
images
learning
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023503690A
Other languages
Japanese (ja)
Other versions
JPWO2022185899A1 (en
Filing date
Publication date
Priority claimed from PCT/JP2021/008696 external-priority patent/WO2022185531A1/en
Application filed filed Critical
Publication of JPWO2022185899A1 publication Critical patent/JPWO2022185899A1/ja
Publication of JPWO2022185899A5 publication Critical patent/JPWO2022185899A5/ja
Pending legal-status Critical Current

Links

Claims (10)

第1のデータセットを用いて検知モデルの学習を行う学習手段と、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定手段と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論手段と、
前記推論手段による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成手段と
を備えていることを特徴とする情報処理装置。
a learning means for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. Threshold value determining means for determining a first threshold value with reference to the comparison result with
Inference means for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results by the inference means, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. An information processing apparatus comprising: a data set generating means for generating a data set.
前記疑似ラベル付与後のデータセットを用いて、対象画像に含まれるオブジェクトの検知のための対象画像用検知モデルの学習を行う擬似ラベル参照学習手段を更に備えている
ことを特徴とする請求項1に記載の情報処理装置。
Claim 1, further comprising pseudo label reference learning means for learning a target image detection model for detecting an object included in the target image using the dataset after the pseudo label has been added. The information processing device described in .
前記擬似ラベル参照学習手段は、前記対象画像用検知モデルの学習として、前記検知モデルの再学習を行う
ことを特徴とする請求項2に記載の情報処理装置。
3. The information processing apparatus according to claim 2, wherein the pseudo label reference learning unit performs relearning of the detection model as learning of the target image detection model.
第1のデータセットを用いて第1の検知モデルの学習を行う第1の学習手段と、
第2のデータセットを用いて第2の検知モデルの学習を行う第2の学習手段と、
第1の評価用データセットに含まれる1又は複数の画像の各々を前記第1の検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する第1の閾値決定手段と、
第2の評価用データセットに含まれる1又は複数の画像の各々を前記第2の検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第2の閾値を決定する第2の閾値決定手段と、
前記第2のデータセットに含まれる1又は複数の画像の各々を前記第1の検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する第1の推論手段と、
前記第1のデータセットに含まれる1又は複数の画像の各々を前記第2の検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する第2の推論手段と、
前記第1の推論手段による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後の第2のデータセットを生成する第1のデータセット生成手段と、
前記第2の推論手段による1又は複数の推論結果のうち、前記第2の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後の第1のデータセットを生成する第2のデータセット生成手段と、
を備えていることを特徴とする情報処理装置。
a first learning means for learning a first detection model using the first data set;
a second learning means for learning a second detection model using the second data set;
One or more inference results obtained by inputting each of the one or more images included in the first evaluation dataset into the first detection model, and one or more inference results attached to each of the one or more images. a first threshold value determining means that determines a first threshold value with reference to a comparison result with one or more correct labels;
One or more inference results obtained by inputting each of the one or more images included in the second evaluation dataset into the second detection model, and one or more inference results attached to each of the one or more images. a second threshold value determining means that determines a second threshold value with reference to a comparison result with one or more correct labels;
A first method for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the first detection model. a means of reasoning,
A second method for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the first data set into the second detection model. a means of reasoning,
Among the one or more inference results by the first inference means, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. a first data set generation means for generating a second data set after labeling;
Among the one or more inference results by the second inference means, an inference result having a reliability equal to or higher than the second threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. a second data set generation means for generating the first data set after labeling;
An information processing device comprising:
対象画像を取得する取得手段と、
対象画像用検知モデルを用いて、前記対象画像に含まれるオブジェクトの検知を行う検知手段と、
を備え、
前記対象画像用検知モデルは、
第1のデータセットを用いて検知モデルの学習を行う学習処理、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定処理、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論処理、
前記推論処理による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成処理、及び
前記疑似ラベル付与後のデータセットを参照して、前記対象画像用検知モデルの学習を行う擬似ラベル参照学習処理
によって学習されたものである
ことを特徴とする情報処理装置。
an acquisition means for acquiring a target image;
a detection means for detecting an object included in the target image using a target image detection model;
Equipped with
The detection model for the target image is
a learning process for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination process that determines a first threshold value with reference to a comparison result with
Inference processing that obtains one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained by the inference process, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. and a pseudo label reference learning process that trains the detection model for the target image by referring to the dataset after the pseudo label has been added. Information processing equipment.
第1のデータセットを用いて検知モデルの学習を行う学習工程と、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定工程と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論工程と、
前記推論工程による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成工程と
を含んでいることを特徴とする情報処理方法。
a learning step of learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination step of determining a first threshold value with reference to a comparison result with
an inference step of obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained in the inference step, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. An information processing method comprising: a dataset generation step of generating a dataset.
対象画像を取得することと、
対象画像用検知モデルを用いて、前記対象画像に含まれるオブジェクトの検知を行うことと、
を含み、
前記対象画像用検知モデルは、
第1のデータセットを用いて検知モデルの学習を行う学習処理、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定処理、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論処理、
前記推論処理による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成処理、及び
前記疑似ラベル付与後のデータセットを参照して、前記対象画像用検知モデルの学習を行う擬似ラベル参照学習処理
によって学習されたものである
ことを特徴とする情報処理方法。
Obtaining a target image;
Detecting an object included in the target image using a target image detection model;
including;
The detection model for the target image is
a learning process for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination process that determines a first threshold value with reference to a comparison result with
Inference processing that obtains one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained by the inference process, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. and a pseudo label reference learning process that trains the detection model for the target image by referring to the dataset after the pseudo label has been added. information processing method.
第1のデータセットを用いて検知モデルの学習を行う学習工程と、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して第1の閾値を決定する閾値決定工程と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論工程と、
前記推論工程による1又は複数の推論結果のうち、前記第1の閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成工程と、
前記疑似ラベル付与後のデータセットを用いて、対象画像に含まれるオブジェクトの検知のための対象画像用検知モデルの学習を行う擬似ラベル参照学習工程と
を含んでいることを特徴とする検知モデルの製造方法。
a learning step of learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold value determination step of determining a first threshold value with reference to a comparison result with
an inference step of obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained in the inference step, an inference result having a reliability equal to or higher than the first threshold is set as a pseudo label, and the pseudo label is associated with the corresponding image. a dataset generation step of generating a dataset;
a pseudo label reference learning step of learning a target image detection model for detecting an object included in the target image using the dataset after the pseudo label has been added. Production method.
コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
第1のデータセットを用いて検知モデルの学習を行う学習手段と、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して閾値を決定する閾値決定手段と、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論手段と、
前記推論手段による1又は複数の推論結果のうち、前記閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成手段と
として機能させるプログラム。
A program for causing a computer to function as an information processing device, the program comprising:
a learning means for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. Threshold determining means for determining a threshold by referring to a comparison result with
Inference means for obtaining one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results by the inference means, an inference result having a reliability equal to or higher than the threshold value is set as a pseudo label, and the pseudo label is associated with the corresponding image, thereby creating a dataset after pseudo labeling. A program that functions as a dataset generation means.
コンピュータを情報処理装置として機能させるためのプログラムであって、前記コンピュータを、
対象画像を取得する取得手段と、
対象画像用検知モデルを用いて、前記対象画像に含まれるオブジェクトの検知を行う検知手段と、
として機能させ、
前記対象画像用検知モデルは、
第1のデータセットを用いて検知モデルの学習を行う学習処理、
評価用データセットに含まれる1又は複数の画像の各々を前記検知モデルに入力して得られる1又は複数の推論結果と、当該1又は複数の画像の各々に付された1又は複数の正解ラベルとの比較結果を参照して閾値を決定する閾値決定処理、
第2のデータセットに含まれる1又は複数の画像の各々を前記検知モデルに入力することによって、当該1又は複数の画像の各々についての1又は複数の推論結果を取得する推論処理、
前記推論処理による1又は複数の推論結果のうち、前記閾値以上の信頼度を有する推論結果を疑似ラベルに設定し、当該疑似ラベルを、対応する画像に関連付けることによって、疑似ラベル付与後のデータセットを生成するデータセット生成処理、及び
前記疑似ラベル付与後のデータセットを参照して、前記対象画像用検知モデルの学習を行う擬似ラベル参照学習処理
によって学習されたものであるプログラム。
A program for causing a computer to function as an information processing device, the program comprising:
an acquisition means for acquiring a target image;
a detection means for detecting an object included in the target image using a target image detection model;
function as
The detection model for the target image is
a learning process for learning a detection model using the first data set;
One or more inference results obtained by inputting each of the one or more images included in the evaluation dataset into the detection model, and one or more correct labels attached to each of the one or more images. a threshold determination process that determines a threshold by referring to the comparison result with
Inference processing that obtains one or more inference results for each of the one or more images by inputting each of the one or more images included in the second data set into the detection model;
Among the one or more inference results obtained by the inference process, an inference result having a reliability equal to or higher than the threshold value is set as a pseudo label, and the pseudo label is associated with the corresponding image to create a dataset after pseudo labeling. and a pseudo-label reference learning process that learns the detection model for the target image by referring to the dataset to which the pseudo-label has been added.
JP2023503690A 2021-03-05 2022-02-15 Pending JPWO2022185899A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/008696 WO2022185531A1 (en) 2021-03-05 2021-03-05 Information processing device, information processing method, manufacturing method for detection model, and program
PCT/JP2022/005877 WO2022185899A1 (en) 2021-03-05 2022-02-15 Information processing device, information processing method, method for manufacturing detection model, and program

Publications (2)

Publication Number Publication Date
JPWO2022185899A1 JPWO2022185899A1 (en) 2022-09-09
JPWO2022185899A5 true JPWO2022185899A5 (en) 2023-11-24

Family

ID=83154107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023503690A Pending JPWO2022185899A1 (en) 2021-03-05 2022-02-15

Country Status (2)

Country Link
JP (1) JPWO2022185899A1 (en)
WO (2) WO2022185531A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343050B (en) * 2023-05-26 2023-08-01 成都理工大学 Target detection method for remote sensing image noise annotation based on self-adaptive weight

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020225923A1 (en) * 2019-05-09 2020-11-12 日本電信電話株式会社 Analysis device, analysis method, and analysis program
US11526802B2 (en) * 2019-06-25 2022-12-13 International Business Machines Corporation Model training using a teacher-student learning paradigm

Similar Documents

Publication Publication Date Title
Liu et al. Robust visual tracking using local sparse appearance model and k-selection
JP2018200685A (en) Forming of data set for fully supervised learning
WO2023115761A1 (en) Event detection method and apparatus based on temporal knowledge graph
JPWO2022185899A5 (en)
JPWO2021130888A5 (en) Learning equipment, learning methods and learning programs
EP3945472A3 (en) Method of and system for online machine learning with dynamic model evaluation and selection
CN116204770A (en) Training method and device for detecting abnormality of bridge health monitoring data
Tamir et al. Understanding from deep learning models in context
JPWO2021079460A5 (en)
CN110737812A (en) search engine user satisfaction evaluation method integrating semi-supervised learning and active learning
CN113392743B (en) Abnormal action detection method, abnormal action detection device, electronic equipment and computer storage medium
Li et al. Myriad: Large multimodal model by applying vision experts for industrial anomaly detection
US11224359B2 (en) Repetitive human activities abnormal motion detection
CN113673589A (en) Label selection self-adaptive increment detection method and system based on frame distance measurement
CN113470073A (en) Animal center tracking method based on deep learning
CN117333730B (en) Product surface abnormality detection method and terminal
JPWO2020261362A5 (en) Learning device, object detection device, learning method, and program
US20220245398A1 (en) Machine annotation of photographic images
Vedalankar et al. LIVE YOGA POSE DETECTION BY USING IMAGE PROCESSING AND DEEP LEARNING
Hachaj et al. Recognition of human body poses and gesture sequences with gesture description language
JP7481173B2 (en) Information processing device, information processing method, and program
Singh Applications and Challenges of Deep Learning in Computer Vision
WO2022167299A1 (en) Machine annotation of photographic images
US20240169762A1 (en) Methods for featureless gaze tracking in ecologically valid conditions
WO2020085439A1 (en) Learning device, learning method, and program for learning