JP7422548B2 - Label noise detection program, label noise detection method, and label noise detection device - Google Patents

Label noise detection program, label noise detection method, and label noise detection device Download PDF

Info

Publication number
JP7422548B2
JP7422548B2 JP2020004662A JP2020004662A JP7422548B2 JP 7422548 B2 JP7422548 B2 JP 7422548B2 JP 2020004662 A JP2020004662 A JP 2020004662A JP 2020004662 A JP2020004662 A JP 2020004662A JP 7422548 B2 JP7422548 B2 JP 7422548B2
Authority
JP
Japan
Prior art keywords
label
learning
image
teacher
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020004662A
Other languages
Japanese (ja)
Other versions
JP2021111279A (en
Inventor
佑介 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2020004662A priority Critical patent/JP7422548B2/en
Publication of JP2021111279A publication Critical patent/JP2021111279A/en
Application granted granted Critical
Publication of JP7422548B2 publication Critical patent/JP7422548B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本開示は、ラベルノイズ検出プログラム、ラベルノイズ検出方法及びラベルノイズ検出装置に関する。 The present disclosure relates to a label noise detection program, a label noise detection method, and a label noise detection device.

画像分類の学習で用いられる学習画像には、正解となる教師ラベルが付されている。教師ラベルは、アノテーション作業によって学習画像に付されるが、このとき、学習画像に誤った教師ラベルが付与される場合がある。学習画像に付与された誤った教師ラベルはラベルノイズと呼ばれる。ラベルノイズを含む学習データを用いて学習を行うと、画像分類の学習精度が低下する可能性がある。 The training images used in image classification learning are labeled with correct teacher labels. Teacher labels are attached to learning images through annotation work, but at this time, incorrect teacher labels may be attached to learning images. Erroneous teacher labels given to training images are called label noise. If learning is performed using training data that includes label noise, the learning accuracy of image classification may decrease.

ここで、画像分類の学習に関する装置として、例えば、特許文献1に示す情報処理装置が知られている。特許文献1の情報処理装置は、学習データの特徴量に基づいて、学習データが属するクラスを特定し、特定したクラスとクラスに対する信頼度とに応じた位置に学習データの画像が配置された、学習データの分布図を表示している。 Here, as an apparatus related to image classification learning, for example, an information processing apparatus disclosed in Patent Document 1 is known. The information processing device of Patent Document 1 specifies the class to which the learning data belongs based on the feature amount of the learning data, and arranges an image of the learning data at a position according to the identified class and the reliability of the class. A distribution map of training data is displayed.

特開2018-142097号公報Japanese Patent Application Publication No. 2018-142097

特許文献1の情報処理装置は、信頼度に応じた位置に学習データの画像を配置するものの、ラベルノイズを検出するものではない。 Although the information processing apparatus of Patent Document 1 arranges images of learning data at positions according to reliability, it does not detect label noise.

本開示は、ラベルノイズを効率的に検出することができるラベルノイズ検出プログラム、ラベルノイズ検出方法及びラベルノイズ検出装置を提供することを目的とする。 An object of the present disclosure is to provide a label noise detection program, a label noise detection method, and a label noise detection device that can efficiently detect label noise.

態様の1つに係るラベルノイズ検出プログラムは、画像分類における学習対象の画像となる学習画像と、前記学習画像に対応する教師ラベルと、を含む画像データセットを用いて、前記教師ラベルのノイズを検出するラベルノイズ検出装置において実行されるラベルノイズ検出プログラムであって、前記画像データセットを用いて、学習モデルの学習を行い、学習済みの前記学習モデルを用いて前記学習画像をクラス分類し、クラス分類の結果に基づいて前記学習画像に付される出力ラベル及び尤度を取得し、前記出力ラベル、前記尤度及び前記教師ラベルに基づいて、前記教師ラベルが付け間違いであるか否かを判定し、前記教師ラベルの付け間違いであると判定された前記学習画像を含む前記画像データセットを、ラベルノイズデータセットとして抽出すること、を実行する。 A label noise detection program according to one aspect uses an image data set that includes a learning image that is a learning target image in image classification, and a teacher label corresponding to the learning image, and detects noise in the teacher label. A label noise detection program executed in a label noise detection device for detecting a label noise, the program learning a learning model using the image data set, classifying the learning image into a class using the trained learning model, Obtain an output label and likelihood attached to the learning image based on the result of class classification, and determine whether or not the teacher label is attached incorrectly based on the output label, the likelihood, and the teacher label. and extracting, as a label noise data set, the image data set including the learning image that has been determined to have been incorrectly assigned the teacher label.

態様の1つに係るラベルノイズ検出方法は、画像分類における学習対象の画像となる学習画像と、前記学習画像に対応する教師ラベルと、を含む画像データセットを用いて、前記教師ラベルのノイズを検出するラベルノイズ検出方法であって、前記画像データセットを用いて、学習モデルの学習を行い、学習済みの前記学習モデルを用いて前記学習画像をクラス分類し、クラス分類の結果に基づいて前記学習画像に付される出力ラベル及び尤度を取得し、前記出力ラベル、前記尤度及び前記教師ラベルに基づいて、前記教師ラベルが付け間違いであるか否かを判定し、前記教師ラベルの付け間違いであると判定された前記学習画像を含む前記画像データセットを、ラベルノイズデータセットとして抽出すること、を実行する。 A label noise detection method according to one aspect uses an image data set that includes a learning image that is a learning target image in image classification, and a teacher label corresponding to the learning image, and removes noise in the teacher label. A label noise detection method for detecting label noise, in which a learning model is trained using the image data set, the training image is classified into classes using the trained learning model, and the training image is classified into classes based on the result of the class classification. Obtain the output label and likelihood attached to the learning image, determine whether or not the teacher label is attached incorrectly based on the output label, the likelihood, and the teacher label, and add the teacher label. Extracting the image data set including the learning image determined to be incorrect as a label noise data set.

態様の1つに係るラベルノイズ検出装置は、画像分類における学習対象の画像となる学習画像と、前記学習画像に対応する教師ラベルと、を含む画像データセットを用いて、前記教師ラベルのノイズを検出するラベルノイズ検出装置であって、前記画像データセットを用いて、学習モデルの学習を行い、学習済みの前記学習モデルを用いて前記学習画像をクラス分類し、クラス分類の結果に基づいて前記学習画像に付される出力ラベル及び尤度を取得し、前記出力ラベル、前記尤度及び前記教師ラベルに基づいて、前記教師ラベルが付け間違いであるか否かを判定し、前記教師ラベルの付け間違いであると判定された前記学習画像を含む前記画像データセットを、ラベルノイズデータセットとして抽出すること、を実行する処理部を備える。 A label noise detection device according to one aspect uses an image data set that includes a learning image that is a learning target image in image classification and a teacher label corresponding to the learning image, and detects noise in the teacher label. A label noise detection device for detecting label noise, which uses the image data set to learn a learning model, classifies the learning image using the trained learning model, and classifies the learning image based on the result of the class classification. Obtain the output label and likelihood attached to the learning image, determine whether or not the teacher label is attached incorrectly based on the output label, the likelihood, and the teacher label, and add the teacher label. The image data set including the learning image determined to be incorrect is extracted as a label noise data set.

本開示によれば、ラベルノイズを効率的に検出することができる。 According to the present disclosure, label noise can be detected efficiently.

図1は、実施形態に係るラベルノイズ検出装置の概要を示す図である。FIG. 1 is a diagram showing an overview of a label noise detection device according to an embodiment. 図2は、画像データセットにおいて教師ラベルが付された学習画像の一例を示す図である。FIG. 2 is a diagram illustrating an example of a learning image to which a teacher label is attached in the image data set. 図3は、画像データセットにおいて出力ラベルが付された学習画像の一例を示す図である。FIG. 3 is a diagram illustrating an example of a learning image to which an output label is attached in the image data set. 図4は、ラベルノイズ検出装置のラベルノイズ検出に関する処理の一例を示す図である。FIG. 4 is a diagram illustrating an example of processing related to label noise detection by the label noise detection device. 図5は、画像分類された画像データセットの表示の一例を示す図である。FIG. 5 is a diagram illustrating an example of displaying a classified image data set.

本開示に係る実施形態を、図面を参照しつつ詳細に説明する。以下の説明において、同様の構成要素について同一の符号を付すことがある。さらに、重複する説明は省略することがある。また、本開示に係る実施形態を説明する上で密接に関連しない事項は、説明及び図示を省略することがある。なお、以下の実施形態により本開示が限定されるものではない。また、以下の実施形態には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。 Embodiments according to the present disclosure will be described in detail with reference to the drawings. In the following description, similar components may be denoted by the same reference numerals. Furthermore, duplicate explanations may be omitted. Furthermore, descriptions and illustrations of matters that are not closely related to the description of the embodiments of the present disclosure may be omitted. Note that the present disclosure is not limited to the following embodiments. Furthermore, the following embodiments include those that can be easily imagined by those skilled in the art, those that are substantially the same, and those that are within the so-called equivalent range.

(実施形態)
図1は、実施形態に係るラベルノイズ検出装置の概要を示す図である。ラベルノイズ検出装置1は、画像データセットDに含まれるラベルノイズを検出し、検出したラベルノイズを修正する装置となっている。ラベルノイズ検出装置1は、CNN(Convolutional Neural Network)等の学習モデルを用いた画像分類を実行して、ラベルノイズを検出している。画像分類とは、画像のクラス分類(クラス推論)を実行することで、何れのクラスであるかを判別して、画像が示すクラスを識別するための識別子(ラベル)を付すことで、画像をラベルごとに分類することである。なお、ラベルノイズ検出装置1は、学習モデルを用いた画像分類に特に限定されず、学習モデルを用いた画像分類により物体を検知する物体検知に適用してもよい。ここで、ラベルノイズ検出装置1の説明に先立ち、図2を参照して、画像データセットDについて説明する。
(Embodiment)
FIG. 1 is a diagram showing an overview of a label noise detection device according to an embodiment. The label noise detection device 1 is a device that detects label noise included in the image data set D and corrects the detected label noise. The label noise detection device 1 detects label noise by performing image classification using a learning model such as a CNN (Convolutional Neural Network). Image classification is to classify the image (class inference), determine which class it belongs to, and attach an identifier (label) to identify the class the image represents. It is to classify by label. Note that the label noise detection device 1 is not particularly limited to image classification using a learning model, and may be applied to object detection in which objects are detected by image classification using a learning model. Here, prior to explaining the label noise detection device 1, the image data set D will be explained with reference to FIG.

図2は、画像データセットにおいて教師ラベルが付された学習画像の一例を示す図である。画像データセットDは、画像分類における学習対象の画像となる学習画像Gと、学習画像Gに対応する教師ラベルTとを含んでいる。また、画像データセットDは、教師ラベルTが付された学習画像Gを複数枚含んだものとなっている。教師ラベルTは、学習画像Gに含まれる物体を識別するラベルであり、正しい(正解の)ラベルである。図2に示すように、画像データセットDの一例として、学習画像Gに含まれる物体は、車であり、正しい教師ラベルTは、車である。教師ラベルTは、学習画像Gに対して、人的なアノテーション作業によって付される。教師ラベルTは、誤ったラベルが付される場合がある。学習画像Gに付与された誤った教師ラベルTはラベルノイズとなる。ラベルノイズを含む画像データセットDは、ラベルノイズデータセットDnとなる。図2に示すように、ラベルノイズデータセットDnの一例として、学習画像Gに含まれる物体は、車であり、誤った教師ラベルTは、人である。 FIG. 2 is a diagram illustrating an example of a learning image to which a teacher label is attached in the image data set. The image data set D includes a learning image G, which is an image to be learned in image classification, and a teacher label T corresponding to the learning image G. Further, the image data set D includes a plurality of learning images G to which teacher labels T are attached. The teacher label T is a label that identifies an object included in the learning image G, and is a correct (correct) label. As shown in FIG. 2, as an example of the image data set D, the object included in the learning image G is a car, and the correct teacher label T is a car. The teacher label T is attached to the learning image G by human annotation work. The teacher label T may be assigned an incorrect label. The incorrect teacher label T given to the learning image G becomes label noise. The image data set D including label noise becomes a label noise data set Dn. As shown in FIG. 2, as an example of the label noise data set Dn, the object included in the learning image G is a car, and the incorrect teacher label T is a person.

図1を参照して、ラベルノイズ検出装置1について説明する。ラベルノイズ検出装置1は、入力部3と、出力部4と、制御部(処理部)5と、記憶部6とを備えている。 A label noise detection device 1 will be described with reference to FIG. The label noise detection device 1 includes an input section 3, an output section 4, a control section (processing section) 5, and a storage section 6.

入力部3は、キーボード、マウス等の操作入力デバイスと、マイク等の音声入力デバイスとを含んで構成されている。入力部3は、操作者によって入力操作が行われることで入力信号を生成し、入力信号を制御部5へ向けて出力する。 The input unit 3 includes an operation input device such as a keyboard and a mouse, and an audio input device such as a microphone. The input unit 3 generates an input signal when an input operation is performed by an operator, and outputs the input signal to the control unit 5 .

出力部4は、ディスプレイ等の表示デバイスと、スピーカ等の音声出力デバイスとを含んで構成されている。出力部4は、制御部5において処理された処理結果としての出力信号を受信する。出力部4は、出力信号に基づいて、表示デバイスに表示画面を表示したり、音声出力デバイスから音声を出力したりする。 The output unit 4 includes a display device such as a display, and an audio output device such as a speaker. The output unit 4 receives an output signal as a processing result processed by the control unit 5. The output unit 4 displays a display screen on a display device or outputs audio from an audio output device based on the output signal.

記憶部6は、プログラム及びデータを記憶する。また、記憶部6は、制御部5の処理結果を一時的に記憶する作業領域としても利用してもよい。記憶部6は、半導体記憶デバイス、及び磁気記憶デバイス等の任意の記憶デバイスを含んでよい。また、記憶部6は、複数の種類の記憶デバイスを含んでよい。また、記憶部6は、メモリカード等の可搬の記憶媒体と、記憶媒体の読み取り装置との組み合わせを含んでよい。 The storage unit 6 stores programs and data. Furthermore, the storage unit 6 may also be used as a work area for temporarily storing processing results of the control unit 5. The storage unit 6 may include any storage device such as a semiconductor storage device and a magnetic storage device. Furthermore, the storage unit 6 may include multiple types of storage devices. Furthermore, the storage unit 6 may include a combination of a portable storage medium such as a memory card and a storage medium reading device.

記憶部6は、プログラムとして、ラベルノイズ検出プログラムPを含む。ラベルノイズ検出プログラムPは、ラベルノイズを検出するためのプログラムである。また、記憶部6は、データとして、上記の画像データセットDを含む。画像データセットDは、アノテーション済みのデータであり、一例として、図2に示す画像データセットDとなっている。 The storage unit 6 includes a label noise detection program P as a program. The label noise detection program P is a program for detecting label noise. Furthermore, the storage unit 6 includes the above image data set D as data. The image data set D is annotated data, and is the image data set D shown in FIG. 2 as an example.

制御部5は、ラベルノイズ検出装置1の動作を統括的に制御して各種の機能を実現する。制御部5は、例えば、CPU(Central Processing Unit)等の集積回路を含んでいる。具体的に、制御部5は、記憶部6に記憶されているプログラムに含まれる命令を実行することによって各種機能を実現する。制御部5は、例えば、ラベルノイズ検出プログラムPを実行することにより、画像データセットDに含まれるラベルノイズデータセットDnを検出する。 The control unit 5 comprehensively controls the operation of the label noise detection device 1 to realize various functions. The control unit 5 includes, for example, an integrated circuit such as a CPU (Central Processing Unit). Specifically, the control unit 5 implements various functions by executing instructions included in programs stored in the storage unit 6. The control unit 5 detects the label noise data set Dn included in the image data set D, for example, by executing the label noise detection program P.

次に、図3及び図4を参照して、画像データセットDを用いたラベルノイズ検出装置1のラベルノイズ検出に関する処理について説明する。図3は、画像データセットにおいて出力ラベルが付された学習画像の一例を示す図である。図4は、ラベルノイズ検出装置のラベルノイズ検出に関する処理の一例を示す図である。 Next, with reference to FIGS. 3 and 4, processing related to label noise detection by the label noise detection apparatus 1 using the image data set D will be described. FIG. 3 is a diagram illustrating an example of a learning image to which an output label is attached in the image data set. FIG. 4 is a diagram illustrating an example of processing related to label noise detection by the label noise detection device.

なお、本実施形態のラベルノイズ検出では、教師ラベルTが車である場合を正とし、教師ラベルTが車でない場合を誤として、2クラスに分類する場合を例にして説明する。 In the label noise detection of this embodiment, an example will be described in which classification is performed into two classes, with the case where the teacher label T is a car as correct, and the case where the teacher label T is not a car as an error.

先ず、制御部5は、アノテーション済みの画像データセットDを用いて、学習モデルの学習を実行する(ステップS1)。学習モデルの学習では、浅い学習を実行する。つまり、画像データセットDには、ラベルノイズデータセットDnが含まれていることから、ラベルノイズに過剰にフィッティングしないように、浅い学習を実行する。なお、浅い学習としては、例えば、学習回数が一回である。 First, the control unit 5 executes learning of a learning model using the annotated image data set D (step S1). When training the learning model, shallow learning is performed. That is, since the image data set D includes the label noise data set Dn, shallow learning is performed to avoid excessive fitting to the label noise. Note that the shallow learning is, for example, once.

また、制御部5は、学習モデルの学習において、学習モデルに含まれる損失関数の値が最小となるように学習を行っている。損失関数としては、平均絶対誤差(MAE:Mean Absolute Error)が適用される。 Further, in learning the learning model, the control unit 5 performs learning so that the value of the loss function included in the learning model is minimized. As the loss function, mean absolute error (MAE) is applied.

制御部5は、ステップS1の実行後、ラベルノイズデータセットDnを抽出して選定する(ステップS2)。具体的に、制御部5は、ステップS2において、ステップS1での学習済みの学習モデルを用いて、学習画像Gを画像分類(クラス分類)する。制御部5は、画像分類の結果として、学習画像Gに付される出力ラベルO及び尤度を取得する。ここで、図3を参照して、画像分類によって取得された、出力ラベルOが付された学習画像Gについて説明する。 After executing step S1, the control unit 5 extracts and selects the label noise data set Dn (step S2). Specifically, in step S2, the control unit 5 performs image classification (class classification) on the learning image G using the learning model learned in step S1. The control unit 5 obtains the output label O and likelihood attached to the learning image G as a result of image classification. Here, with reference to FIG. 3, a learning image G to which an output label O is attached, which is obtained by image classification, will be described.

図3に示すように、学習画像Gには、学習済みの学習モデルによる画像分類の結果として付された出力ラベルOと尤度とが対応付けられる。学習画像Gに含まれる物体は、車であり、出力ラベルOは、車である。このため、図3では、学習画像Gに対して正しい出力ラベルOが付されたものとなっている。また、学習画像Gには、出力ラベルOに対する尤度iが対応付けられている。尤度iとは、出力ラベルOのもっともらしさ(確からしさ)の度合いである。 As shown in FIG. 3, the learning image G is associated with an output label O given as a result of image classification using a trained learning model and a likelihood. The object included in the learning image G is a car, and the output label O is a car. Therefore, in FIG. 3, the correct output label O is attached to the learning image G. Further, the learning image G is associated with a likelihood i for the output label O. The likelihood i is the degree of plausibility (likelihood) of the output label O.

制御部5は、画像分類の実行後、画像データセットDの学習画像Gに付されている教師ラベルT(図2参照)と、画像分類によって学習画像Gに付された出力ラベルO(図3参照)とを比較して、ラベルが一致するか否かを判定する。制御部5は、判定の結果、教師ラベルTと出力ラベルOとが一致する場合、ラベルノイズがない、つまりクリーンであると判定する。一方で、制御部5は、判定の結果、教師ラベルTと出力ラベルOとが一致していない場合、ラベルノイズがある、つまり教師ラベルTが付け間違いであると判定する。そして、制御部5は、ラベルノイズがあると判定された画像データセットDを、ラベルノイズデータセットDnとして抽出する。 After executing the image classification, the control unit 5 outputs the teacher label T (see FIG. 2) attached to the learning image G of the image data set D and the output label O (see FIG. 3) attached to the learning image G by image classification. ) to determine whether the labels match. If the result of the determination is that the teacher label T and the output label O match, the control unit 5 determines that there is no label noise, that is, the label is clean. On the other hand, if the result of the determination is that the teacher label T and the output label O do not match, the control unit 5 determines that there is label noise, that is, the teacher label T is incorrectly attached. Then, the control unit 5 extracts the image data set D determined to have label noise as a label noise data set Dn.

制御部5は、抽出したラベルノイズデータセットDnの中から、尤度に基づいて、所定のラベルノイズデータセットDnを選定する。尤度に基づくラベルノイズデータセットDnの選定としては、一例として、しきい値を用いた選定を行っている。制御部5は、ラベルノイズデータセットDnの学習画像Gに付された尤度iが、予め規定した尤度iのしきい値以上であるか否かを判定する。制御部5は、尤度iがしきい値以上となるラベルノイズデータセットDnを選定する。一方で、制御部5は、尤度iがしきい値よりも小さいラベルノイズデータセットDnを選定しない。 The control unit 5 selects a predetermined label noise data set Dn from the extracted label noise data sets Dn based on the likelihood. As an example of selecting the label noise data set Dn based on the likelihood, selection is performed using a threshold value. The control unit 5 determines whether the likelihood i assigned to the learning image G of the label noise data set Dn is greater than or equal to a predefined threshold of the likelihood i. The control unit 5 selects the label noise data set Dn for which the likelihood i is equal to or greater than the threshold value. On the other hand, the control unit 5 does not select the label noise data set Dn whose likelihood i is smaller than the threshold value.

なお、尤度に基づくラベルノイズデータセットDnの選定は、上記の選定に特に限定されない。尤度に基づくラベルノイズデータセットDnの選定としては、他の一例として、尤度の高い順から選定してもよい。制御部5は、ラベルノイズデータセットDnの学習画像Gに付された尤度iの高い順から、所定の数のラベルノイズデータセットDnを選定する。所定の数は、任意であるが、例えば、後述する出力ラベルOの付け替えにおいて、アノテーション作業が可能な数である。 Note that the selection of the label noise data set Dn based on the likelihood is not particularly limited to the above selection. As another example of selecting the label noise data set Dn based on the likelihood, the label noise data set Dn may be selected in descending order of likelihood. The control unit 5 selects a predetermined number of label noise data sets Dn in descending order of the likelihood i assigned to the learning image G of the label noise data sets Dn. The predetermined number is arbitrary, but is a number that allows annotation work, for example, in replacing the output label O, which will be described later.

制御部5は、ステップS2の実行後、選定したラベルノイズデータセットDnの出力ラベルOを付け替える(ステップS3)。具体的に、制御部5は、ステップS2の実行後、出力部4に、選定したラベルノイズデータセットDnの情報を出力する。操作者は、出力されたラベルノイズデータセットDnの情報に基づいて、付け替える正しい出力ラベルOの情報を、入力部3を介して入力する。制御部5は、入力部3から入力された入力情報に基づいて、ラベルノイズデータセットDnの出力ラベルOを付け替える。 After executing step S2, the control unit 5 replaces the output label O of the selected label noise data set Dn (step S3). Specifically, the control unit 5 outputs information on the selected label noise data set Dn to the output unit 4 after executing step S2. The operator inputs information on the correct output label O to be replaced via the input unit 3 based on the information on the output label noise data set Dn. The control unit 5 changes the output label O of the label noise data set Dn based on the input information input from the input unit 3.

制御部5は、ステップS3の実行後、付け替え後のラベルノイズデータセットDnを、新たな画像データセットDとして更新する(ステップS4)。制御部5は、ステップS4を実行することで、付け替え後の出力ラベルOを、教師ラベルTとして設定する。制御部5は、ステップS4の実行後、ラベルノイズの除去が完了したか否かを判定する(ステップS5)。制御部5は、ステップS5における判定として、例えば、ステップS2において、ラベルノイズデータセットDnの抽出がされなかった場合、ラベルノイズの除去が完了したと判定してもよい。また、制御部5は、ステップS5における判定として、例えば、ステップS2において抽出されるラベルノイズデータセットDnの尤度iがしきい値よりも小さい場合、ラベルノイズの除去が完了したと判定してもよい。ラベルノイズの除去が完了したか否かの判定は、特に限定されない。 After executing step S3, the control unit 5 updates the replaced label noise data set Dn as a new image data set D (step S4). The control unit 5 sets the output label O after the replacement as the teacher label T by executing step S4. After executing step S4, the control unit 5 determines whether label noise removal is completed (step S5). As the determination in step S5, the control unit 5 may determine that label noise removal has been completed, for example, when the label noise data set Dn has not been extracted in step S2. Further, as the determination in step S5, for example, when the likelihood i of the label noise data set Dn extracted in step S2 is smaller than the threshold value, the control unit 5 determines that label noise removal has been completed. Good too. The determination as to whether label noise removal is completed is not particularly limited.

制御部5は、ステップS5において、ラベルノイズの除去が完了したと判定する(ステップS5:Yes)と、ラベルノイズ検出に関する処理を終了する。一方で、制御部5は、ステップS5において、ラベルノイズの除去が完了していないと判定する(ステップS5:No)と、再び、ステップS1に進み、更新後の画像データセットDを用いたラベルノイズ検出に関する処理を実行する。このため、制御部5は、ラベルノイズの除去が完了するまで、ステップS1からステップS5を繰り返し実行する。 When the control unit 5 determines in step S5 that label noise removal is completed (step S5: Yes), it ends the processing related to label noise detection. On the other hand, if the control unit 5 determines in step S5 that the removal of label noise is not completed (step S5: No), the control unit 5 proceeds to step S1 again to remove the label using the updated image data set D. Executes processing related to noise detection. Therefore, the control unit 5 repeatedly executes steps S1 to S5 until label noise removal is completed.

ここで、制御部5は、ステップS2において画像分類された画像データセットDを、図5に示すようなヒストグラム分布として出力部4に表示してもよい。図5は、画像分類された画像データセットの表示の一例を示す図である。図5は、その横軸が尤度(クラス尤度)となっており、その縦軸が学習画像Gの枚数となっている。図5の横軸において、尤度は、例えば、0から1の間で、0.1毎に刻まれており、10等分に分けられている。なお、図5の横軸に尤度の分割数及び間隔は、上記に特に限定されない。また、図5では、画像分類された画像データセットDとして、car_クリーンの画像データセットD、Ped_クリーンの画像データセットD、及びPed_ノイズの画像データセットDを含む。car_クリーンの画像データセットDは、教師ラベルTと出力ラベルOとが車で一致した画像データセットDである。Ped_クリーンの画像データセットDは、教師ラベルTと出力ラベルOとが人で一致した画像データセットDである。Ped_ノイズの画像データセットDは、教師ラベルTと出力ラベルOとが人で一致しない画像データセットD(ラベルノイズデータセットDn)である。 Here, the control unit 5 may display the image data set D subjected to image classification in step S2 on the output unit 4 as a histogram distribution as shown in FIG. FIG. 5 is a diagram illustrating an example of displaying a classified image data set. In FIG. 5, the horizontal axis represents the likelihood (class likelihood), and the vertical axis represents the number of learning images G. On the horizontal axis of FIG. 5, the likelihood is, for example, between 0 and 1, in increments of 0.1, and divided into 10 equal parts. Note that the number of divisions and the interval of the likelihood on the horizontal axis in FIG. 5 are not particularly limited to the above. Further, in FIG. 5, the classified image data set D includes an image data set D of car_clean, an image data set D of Ped_clean, and an image data set D of Ped_noise. The image data set D of car_clean is an image data set D in which the teacher label T and the output label O match the car. The Ped_Clean image data set D is an image data set D in which the teacher label T and the output label O match for each person. The image data set D of Ped_noise is an image data set D (label noise data set Dn) in which the teacher label T and the output label O do not match for each person.

制御部5は、ステップS1における学習後の学習モデルにより、ラベルノイズデータセットDnを含む画像データセットDを画像分類する。制御部5は、画像分類の結果に基づき、尤度iに対応付けて学習画像Gの枚数を積算することで、図5に示すようなヒストグラム分布を、出力部4に表示する。図5に示すように、浅い学習を行った学習モデルを用いた画像分類では、ラベルノイズデータセットDn(Ped_ノイズの画像データセットD)の出力ラベルOが高い尤度(例えば、1)で付される。 The control unit 5 performs image classification on the image data set D including the label noise data set Dn using the learning model learned in step S1. The control unit 5 displays a histogram distribution as shown in FIG. 5 on the output unit 4 by integrating the number of learning images G in association with the likelihood i based on the result of image classification. As shown in Figure 5, in image classification using a learning model that performs shallow learning, the output label O of the label noise dataset Dn (image dataset D of Ped_noise) is assigned with a high likelihood (for example, 1). be done.

以上のように、実施形態に係るラベルノイズ検出では、図2に示す教師ラベルTと、図3に示す出力ラベルO及び尤度iとに基づいて、画像データセットDの中から、ラベルノイズデータセットDnを抽出することができる。この実施形態によれば、画像データセットDの中から、ラベルノイズを効率的に検出することができる。 As described above, in the label noise detection according to the embodiment, label noise data is extracted from the image data set D based on the teacher label T shown in FIG. 2 and the output label O and likelihood i shown in FIG. Set Dn can be extracted. According to this embodiment, label noise can be efficiently detected from the image data set D.

また、実施形態に係るラベルノイズ検出では、ラベルノイズデータセットDnの抽出後、学習画像Gに付された尤度iが、予め規定した尤度iのしきい値以上であるか否かを判定し、しきい値以上となる学習画像Gに対応付けられた教師ラベルTを含むラベルノイズデータセットDnを選定する。この実施形態によれば、ラベルノイズデータセットDnの抽出数が多い場合であっても、尤度iの高いラベルノイズデータセットDnを選定することができる。よって、ステップS3における出力ラベルOの付け替え作業を軽減することができる。 In addition, in the label noise detection according to the embodiment, after extracting the label noise data set Dn, it is determined whether the likelihood i assigned to the learning image G is equal to or greater than a predefined threshold of the likelihood i. Then, a label noise data set Dn including the teacher label T associated with the learning image G that is equal to or higher than the threshold value is selected. According to this embodiment, even if the number of extracted label noise data sets Dn is large, a label noise data set Dn with a high likelihood i can be selected. Therefore, the work of replacing the output label O in step S3 can be reduced.

また、実施形態に係るラベルノイズ検出では、ラベルノイズデータセットDnの抽出後、学習画像Gに付された尤度iの高い順から、所定の数となる学習画像Gに対応付けられた教師ラベルTを含むラベルノイズデータセットDnを選定する。この実施形態によれば、ラベルノイズデータセットDnの抽出数が多い場合であっても、尤度iの高い順から所定の数だけラベルノイズデータセットDnを選定することができる。よって、ステップS3における出力ラベルOの付け替え作業を軽減することができる。 In addition, in the label noise detection according to the embodiment, after extracting the label noise data set Dn, teacher labels associated with a predetermined number of learning images G are assigned to the learning images G in descending order of likelihood i. A label noise data set Dn containing T is selected. According to this embodiment, even if a large number of label noise data sets Dn are extracted, a predetermined number of label noise data sets Dn can be selected in descending order of likelihood i. Therefore, the work of replacing the output label O in step S3 can be reduced.

また、実施形態に係るラベルノイズ検出では、選定したラベルノイズデータセットDnの教師ラベルTを、ラベルノイズ検出装置1に入力された入力情報に基づく出力ラベルOに付け替える。この実施形態によれば、付け替え後の出力ラベルOを、正しい教師ラベルTとして更新することができるため、ラベルノイズが浄化された画像データセットDにすることができる。 Further, in the label noise detection according to the embodiment, the teacher label T of the selected label noise data set Dn is replaced with an output label O based on the input information input to the label noise detection device 1. According to this embodiment, since the output label O after replacement can be updated as the correct teacher label T, the image data set D can be obtained from which label noise has been purified.

また、実施形態に係るラベルノイズ検出では、教師ラベルTの出力ラベルOへの付け替え後の学習画像Gを含む画像データセットDを用いて、学習モデルの学習を行うことから、出力ラベルOに付け替えることまでを、繰り返し実行する。この実施形態によれば、繰り返し回数を重ねるごとにラベルノイズを浄化することができるため、ラベルノイズがより浄化された画像データセットDにすることができる。 In addition, in the label noise detection according to the embodiment, since the learning model is trained using the image data set D that includes the learning image G after the teacher label T is replaced with the output label O, the teacher label T is replaced with the output label O. Do the same thing over and over again. According to this embodiment, since label noise can be purified each time the repetition is repeated, it is possible to obtain an image data set D in which label noise is further purified.

また、実施形態に係るラベルノイズ検出では、学習モデルの学習において、学習モデルに含まれる損失関数の値が最小となるように学習を行っており、損失関数は、平均絶対誤差(MAE:Mean Absolute Error)である。この実施形態によれば、損失関数としてMAEを用いることにより、ラベルノイズの浄化を効率よく行うことができる。 Furthermore, in the label noise detection according to the embodiment, the learning model is trained so that the value of the loss function included in the learning model is minimized, and the loss function is a mean absolute error (MAE). Error). According to this embodiment, label noise can be efficiently purified by using MAE as a loss function.

1 ラベルノイズ検出装置
3 入力部
4 出力部
5 制御部
6 記憶部
P ラベルノイズ検出プログラム
D 画像データセット
Dn ラベルノイズデータセット
G 学習画像
T 教師ラベル
O 出力ラベル
i 尤度
1 Label noise detection device 3 Input section 4 Output section 5 Control section 6 Storage section P Label noise detection program D Image dataset Dn Label noise dataset G Learning image T Teacher label O Output label i Likelihood

Claims (6)

画像分類における学習対象の画像となる学習画像と、前記学習画像に対応する教師ラベルと、を含む画像データセットを用いて、前記教師ラベルのノイズを検出するラベルノイズ検出装置において実行されるラベルノイズ検出プログラムであって、
前記画像データセットを用いて、学習モデルの学習を行い、
学習済みの前記学習モデルを用いて前記学習画像をクラス分類し、クラス分類の結果に基づいて前記学習画像に付される出力ラベル及び尤度を取得し、
前記出力ラベル、前記尤度及び前記教師ラベルに基づいて、前記教師ラベルが付け間違いであるか否かを判定し、前記教師ラベルの付け間違いであると判定された前記学習画像を含む前記画像データセットを、ラベルノイズデータセットとして抽出し、
前記ラベルノイズデータセットの抽出後、前記学習画像に付された前記尤度が、予め規定した前記尤度のしきい値以上であるか否かを判定し、前記しきい値以上となる、または前記尤度の高い順から、所定の数となる前記学習画像に対応付けられた前記教師ラベルを含む前記ラベルノイズデータセットを選定すること、を実行するラベルノイズ検出プログラム。
Label noise performed in a label noise detection device that detects noise in the teacher label using an image data set that includes a learning image that is a learning target image in image classification and a teacher label corresponding to the learning image. A detection program,
Learning a learning model using the image dataset,
classifying the learning image using the trained learning model, obtaining an output label and likelihood attached to the learning image based on the result of the class classification,
Based on the output label, the likelihood, and the teacher label, it is determined whether the teacher label is incorrectly attached, and the image data includes the learning image for which it is determined that the teacher label is incorrectly attached. extract the set as a label noise dataset ,
After extracting the label noise data set, it is determined whether the likelihood assigned to the learning image is equal to or greater than a predefined threshold of the likelihood, and becomes equal to or greater than the threshold; A label noise detection program that selects the label noise data set including a predetermined number of the teacher labels associated with the learning images in descending order of likelihood .
選定した前記ラベルノイズデータセットの前記教師ラベルを、前記ラベルノイズ検出装置に入力された入力情報に基づく前記出力ラベルに付け替えることを、さらに実行する請求項に記載のラベルノイズ検出プログラム。 The label noise detection program according to claim 1 , further executing the step of replacing the teacher label of the selected label noise data set with the output label based on input information input to the label noise detection device. 前記教師ラベルの前記出力ラベルへの付け替え後の前記学習画像を含む前記画像データセットを用いて、前記学習モデルの学習を行うことから、前記出力ラベルに付け替えることまでを、繰り返し実行する請求項に記載のラベルノイズ検出プログラム。 2. A process from learning the learning model to replacing the teacher label with the output label is repeatedly performed using the image data set including the learning image after the teacher label is replaced with the output label. Label noise detection program described in . 前記学習モデルの学習において、前記学習モデルに含まれる損失関数の値が最小となるように学習を行っており、前記損失関数は、平均絶対誤差(MAE:Mean Absolute Error)である請求項1からのいずれか1項に記載のラベルノイズ検出プログラム。 In learning the learning model, learning is performed so that the value of a loss function included in the learning model is minimized, and the loss function is a mean absolute error (MAE). 3. The label noise detection program according to any one of 3 . 画像分類における学習対象の画像となる学習画像と、前記学習画像に対応する教師ラベルと、を含む画像データセットを用いて、前記教師ラベルのノイズを検出するラベルノイズ検出方法であって、
前記画像データセットを用いて、学習モデルの学習を行い、
学習済みの前記学習モデルを用いて前記学習画像をクラス分類し、クラス分類の結果に基づいて前記学習画像に付される出力ラベル及び尤度を取得し、
前記出力ラベル、前記尤度及び前記教師ラベルに基づいて、前記教師ラベルが付け間違いであるか否かを判定し、前記教師ラベルの付け間違いであると判定された前記学習画像を含む前記画像データセットを、ラベルノイズデータセットとして抽出し、
前記ラベルノイズデータセットの抽出後、前記学習画像に付された前記尤度が、予め規定した前記尤度のしきい値以上であるか否かを判定し、前記しきい値以上となる、または前記尤度の高い順から、所定の数となる前記学習画像に対応付けられた前記教師ラベルを含む前記ラベルノイズデータセットを選定すること、を実行するラベルノイズ検出方法。
A label noise detection method for detecting noise in the teacher label using an image dataset including a learning image that is a learning target image in image classification and a teacher label corresponding to the learning image, the method comprising:
Learning a learning model using the image dataset,
classifying the learning image using the trained learning model, obtaining an output label and likelihood attached to the learning image based on the result of the class classification,
Based on the output label, the likelihood, and the teacher label, it is determined whether the teacher label is incorrectly attached, and the image data includes the learning image for which it is determined that the teacher label is incorrectly attached. extract the set as a label noise dataset ,
After extracting the label noise data set, it is determined whether the likelihood assigned to the learning image is equal to or greater than a predefined threshold of the likelihood, and becomes equal to or greater than the threshold; A label noise detection method comprising: selecting the label noise data set including a predetermined number of the teacher labels associated with the learning images in descending order of likelihood .
画像分類における学習対象の画像となる学習画像と、前記学習画像に対応する教師ラベルと、を含む画像データセットを用いて、前記教師ラベルのノイズを検出するラベルノイズ検出装置であって、
前記画像データセットを用いて、学習モデルの学習を行い、
学習済みの前記学習モデルを用いて前記学習画像をクラス分類し、クラス分類の結果に基づいて前記学習画像に付される出力ラベル及び尤度を取得し、
前記出力ラベル、前記尤度及び前記教師ラベルに基づいて、前記教師ラベルが付け間違いであるか否かを判定し、前記教師ラベルの付け間違いであると判定された前記学習画像を含む前記画像データセットを、ラベルノイズデータセットとして抽出し、
前記ラベルノイズデータセットの抽出後、前記学習画像に付された前記尤度が、予め規定した前記尤度のしきい値以上であるか否かを判定し、前記しきい値以上となる、または前記尤度の高い順から、所定の数となる前記学習画像に対応付けられた前記教師ラベルを含む前記ラベルノイズデータセットを選定すること、を実行する処理部を備えるラベルノイズ検出装置。
A label noise detection device that detects noise in the teacher label using an image data set that includes a learning image that is a learning target image in image classification and a teacher label corresponding to the learning image,
Learning a learning model using the image dataset,
classifying the learning image using the trained learning model, obtaining an output label and likelihood attached to the learning image based on the result of the class classification,
Based on the output label, the likelihood, and the teacher label, it is determined whether the teacher label is incorrectly attached, and the image data includes the learning image for which it is determined that the teacher label is incorrectly attached. extract the set as a label noise dataset ,
After extracting the label noise data set, it is determined whether the likelihood assigned to the learning image is equal to or greater than a predefined threshold of the likelihood, and becomes equal to or greater than the threshold; A label noise detection device comprising: a processing unit configured to select the label noise data set including the teacher labels associated with a predetermined number of the learning images in descending order of likelihood .
JP2020004662A 2020-01-15 2020-01-15 Label noise detection program, label noise detection method, and label noise detection device Active JP7422548B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020004662A JP7422548B2 (en) 2020-01-15 2020-01-15 Label noise detection program, label noise detection method, and label noise detection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020004662A JP7422548B2 (en) 2020-01-15 2020-01-15 Label noise detection program, label noise detection method, and label noise detection device

Publications (2)

Publication Number Publication Date
JP2021111279A JP2021111279A (en) 2021-08-02
JP7422548B2 true JP7422548B2 (en) 2024-01-26

Family

ID=77060017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020004662A Active JP7422548B2 (en) 2020-01-15 2020-01-15 Label noise detection program, label noise detection method, and label noise detection device

Country Status (1)

Country Link
JP (1) JP7422548B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115810135A (en) 2021-09-14 2023-03-17 日本电气株式会社 Method, electronic device, storage medium, and program product for sample analysis
CN114299349B (en) * 2022-03-04 2022-05-13 南京航空航天大学 Crowdsourcing image learning method based on multi-expert system and knowledge distillation
CN117372819B (en) * 2023-12-07 2024-02-20 神思电子技术股份有限公司 Target detection increment learning method, device and medium for limited model space

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015087903A (en) 2013-10-30 2015-05-07 ソニー株式会社 Apparatus and method for information processing
JP2015129988A (en) 2014-01-06 2015-07-16 日本電気株式会社 Data processor
JP2019101535A (en) 2017-11-29 2019-06-24 コニカミノルタ株式会社 Teacher data preparation device and method thereof and image segmentation device and method thereof
JP2019215698A (en) 2018-06-13 2019-12-19 アズビル株式会社 Image inspection support apparatus and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015087903A (en) 2013-10-30 2015-05-07 ソニー株式会社 Apparatus and method for information processing
JP2015129988A (en) 2014-01-06 2015-07-16 日本電気株式会社 Data processor
JP2019101535A (en) 2017-11-29 2019-06-24 コニカミノルタ株式会社 Teacher data preparation device and method thereof and image segmentation device and method thereof
JP2019215698A (en) 2018-06-13 2019-12-19 アズビル株式会社 Image inspection support apparatus and method

Also Published As

Publication number Publication date
JP2021111279A (en) 2021-08-02

Similar Documents

Publication Publication Date Title
JP7422548B2 (en) Label noise detection program, label noise detection method, and label noise detection device
CN109145766B (en) Model training method and device, recognition method, electronic device and storage medium
EP3478728A1 (en) Method and system for cell annotation with adaptive incremental learning
WO2014174932A1 (en) Image processing device, program, and image processing method
JP6584250B2 (en) Image classification method, classifier configuration method, and image classification apparatus
JPWO2019187594A1 (en) Learning equipment, learning methods and learning programs
CN110705596A (en) White screen detection method and device, electronic equipment and storage medium
CN113222913A (en) Circuit board defect detection positioning method and device and storage medium
CN106372216A (en) Method and device for improving subject finding accuracy
CN114639150A (en) Emotion recognition method and device, computer equipment and storage medium
CN115393625A (en) Semi-supervised training of image segmentation from coarse markers
JP7355111B2 (en) Learning data generation device, learning data generation method, and program
WO2019092868A1 (en) Information processing device, information processing method, and computer-readable recording medium
CN111488400A (en) Data classification method, device and computer readable storage medium
CN105930845A (en) Method of teaching for parts information and device thereof
JP2020107104A (en) Image determination device, image determination method, and image determination program
CN111832550B (en) Data set manufacturing method and device, electronic equipment and storage medium
CN112818984B (en) Title generation method, device, electronic equipment and storage medium
JP6817690B2 (en) Extraction device, extraction method and its program, support device, display control device
CN113610084A (en) Topic auxiliary method, topic auxiliary device and topic auxiliary system
JP2008186150A (en) Template matching device and method
Kim et al. RobustMixGen: Data Augmentation for Enhancing Robustness of Visual-Language Models in the Presence of Distribution Shift
CN112990145B (en) Group-sparse-based age estimation method and electronic equipment
CN113111713B (en) Image detection method and device, electronic equipment and storage medium
WO2021049119A1 (en) Learning device, learning method, and non-transitory computer-readable medium in which learning program has been stored

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230815

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240116

R150 Certificate of patent or registration of utility model

Ref document number: 7422548

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150