JP2020154602A - 能動学習方法及び能動学習装置 - Google Patents

能動学習方法及び能動学習装置 Download PDF

Info

Publication number
JP2020154602A
JP2020154602A JP2019051525A JP2019051525A JP2020154602A JP 2020154602 A JP2020154602 A JP 2020154602A JP 2019051525 A JP2019051525 A JP 2019051525A JP 2019051525 A JP2019051525 A JP 2019051525A JP 2020154602 A JP2020154602 A JP 2020154602A
Authority
JP
Japan
Prior art keywords
image
trained model
teacher
class
supervised
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019051525A
Other languages
English (en)
Other versions
JP7225978B2 (ja
Inventor
厚裕 日比
Atsuhiro Hibi
厚裕 日比
梅村 純
Jun Umemura
純 梅村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP2019051525A priority Critical patent/JP7225978B2/ja
Publication of JP2020154602A publication Critical patent/JP2020154602A/ja
Application granted granted Critical
Publication of JP7225978B2 publication Critical patent/JP7225978B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザの作業負担を軽減し、学習済みモデルの識別精度の向上を図ることができる能動学習方法及び能動学習装置を提供する。【解決手段】能動学習装置1では、複数ある教師無し画像の中から、学習済みモデル17bの学習に寄与する教師無し画像だけを教師無し画像として選定することで、画像内の全ての画素に対してクラス分類を行うマーキング作業を減らすことができる。よって、ユーザの作業負担を軽減し、学習済みモデルの精度向上を図ることができる。【選択図】図1

Description

本発明は、能動学習方法及び能動学習装置に関する。
多くの産業分野において、機械学習手法によって学習された識別器を用いて膨大なデータから経験や知識を抽出し、自動化に繋げる動きが活発化している。特に画像認識分野では、画像内に表示されている代表対象物を識別する「画像分類(classification)」の分野において、深層学習(ディープラーニング)をはじめとするニューラルネットワークをベースとした識別器を用いることで、識別精度の飛躍的な向上が確認されている。
また、近年では、入力画像全体から識別対象物を識別する画像分類の手法を拡張し、入力画像の各画素に何が表示されているかを判定する「画像セグメンテーション(segmentation)」の分野においても、深層学習の適用が広く進んでおり(例えば、非特許文献1参照)、各画素に対して識別対象物の判定を行うことで、入力画像内における識別対象物の種類とその存在位置とを同時に把握することが可能となる。
A 2017 Guide to Semantic Segmentation with Deep Learning、[online]、インターネット(http://blog.qure.ai/notes/semantic-segmentation-deep-learning-review)
ところで、画像セグメンテーションの分野において識別器を学習させる場合には、学習対象である識別対象物が写った画像の各画素に対して識別対象物毎に予め定義されたクラスを付与するマーキング作業を行って、教師有り画像を作成する。このマーキング作業を、大量の画像に対して行うことは、多くの人手と時間を要し、ユーザの作業負担が大きいという問題がある。
また、画像セグメンテーションの分野においても、画像分類の分野と同様、学習が完了した識別器(以下、学習済みモデルとも称する)を用いて評価用画像を推論した際に、画像の各画素で正しいクラスが推論されるように学習済みモデルの更なる識別精度の向上が求められている。
そこで、本発明は、上記問題に鑑みてなされたものであり、ユーザの作業負担を軽減し、学習済みモデルの識別精度の向上を図ることができる能動学習方法及び能動学習装置を提供する。
本発明の能動学習方法は、画像に撮像された識別対象物を識別する識別器の能動学習方法において、各画素に前記識別対象物の種類に対応するクラスを付与した教師有り画像を用い、前記識別器を学習させることで学習済みモデルを取得する取得工程と、前記クラスが付与されていない教師無し画像を、前記学習済みモデルで推論することで、前記教師無し画像の中から前記学習済みモデルの学習に寄与する画像である教師付与対象画像を選定する教師付与対象画像選定工程と、前記教師付与対象画像の画素毎に、それぞれ対応するクラスを付与して新たな教師有り画像を生成する準教師有り画像生成工程と、前記新たな教師有り画像を用いて、前記学習済みモデルを再学習させる学習工程と、を備える。
また、本発明の能動学習装置は、画像に撮像された識別対象物を識別する識別器を用いた能動学習装置において、各画素に前記識別対象物の種類に対応するクラスを付与した教師有り画像を用い、前記識別器を学習させることで学習済みモデルを取得する取得部と、前記クラスが付与されていない教師無し画像を、前記学習済みモデルで推論することで、前記教師無し画像の中から前記学習済みモデルの学習に寄与する画像である教師付与対象画像を選定する教師付与対象画像選定部と、前記教師付与対象画像の画素毎に、それぞれ対応するクラスを付与して新たな教師有り画像を生成する準教師有り画像生成部と、前記新たな教師有り画像を用いて、前記学習済みモデルを再学習させる学習部と、を備える。
本発明によれば、複数ある教師無し画像の中から、学習済みモデルの学習に寄与する画像だけを教師付与対象の画像として選定することで、全ての教師無し画像に対してマーキングを行うことを回避できる。よって、マーキング作業を行う画像数を減らせる分だけ、ユーザの作業負担を軽減し、学習済みモデルの識別精度の向上を図ることができる。
能動学習装置の回路構成を示すブロック図である。 図2Aは、画像の一例を示す概略図であり、図2Bは、図2Aの画像から作成した教師有り画像を示す概略図である。 複数の教師有り画像を使用して学習済みモデルを作成する学習済みモデル作成モードを説明するための概略図である。 学習済みモデルを用いて教師無し画像を推論することで得られる確信度マップを説明するための概略図である。 図5Aは、識別対象物が表示された教師付与対象画像の一例を示した概略図であり、図5Bは、識別対象物を内包する概略領域を示した概略図であり、図5Cは、輪郭抽出処理又は領域抽出処理により抽出された抽出領域を示した概略図である。 能動学習処理手順を示したフローチャートである。
以下図面について、本発明の一実施形態を詳述する。以下の説明において、同様の要素には同一の符号を付し、重複する説明は省略する。
(1)<能動学習装置>
図1は、本実施形態における能動学習装置1の回路構成を示したブロック図である。能動学習装置1は、学習部2と記憶部3と推論部4と演算処理部5とを備えており、演算処理部5には、教師付与対象画像選定部7と概略領域設定部8と輪郭抽出処理部9と準教師有り画像生成部10とが設けられている。
能動学習装置1は、図示しないキーボードやマウス等の操作部を介してユーザによる操作を受け付け、当該操作に応じて記憶部3から各種プログラムを読み出し、後述する学習済みモデル作成モード及び能動学習モードを実行する。
ここで、学習済みモデル作成モードとは、例えば、複数の教師有り画像(後述する)を学習のための画像として使用し、記憶部3に記憶した学習モデルを学習させ、学習済みモデルを作成するモードである。能動学習モードとは、学習済みモデル作成モードにより作成した学習済みモデルに対して、更に能動学習を行わせるモードである。以下、学習済みモデル作成モード及び能動学習モードについて順に説明する。
(1−1)<学習済みモデル作成モード>
能動学習装置1は、例えば、識別対象が撮像された複数の画像を取得し、これら画像を基にそれぞれ教師有り画像を作成して、得られた教師有り画像を記憶部3に記憶している。始めに、この教師有り画像について説明する。
図2Aは、例えば、識別対象物として2種類の異なる物体13a,13bが所定位置に存在する画像12aを示す。能動学習装置1は、図2Aに示すような画像12aを取得すると、図示しない表示装置に当該画像12aを表示させ、表示装置によって、ユーザに対して画像12a内の物体13a,13bを認識させる。これにより、ユーザは、これら物体13a,13bの表示形態に基づいて各物体13a,13bの種類を特定する。
ここで、能動学習装置1では、識別対象物の種類に応じて、識別対象物の種類を識別するためのクラスが定義されている。なお、画像12aにおいて識別対象物がない背景等の領域については、別途のクラスを定義してもよいし、クラスを定義せず学習対象から除外してもよい。ユーザは、識別対象物の種類毎に定義された複数のクラスの中から、画像12a内に写る物体13a,13bに対応したクラスを決定し、能動学習装置1を使用して、画像12a内にある画素1つ1つに、対応するクラスを付与するマーキング作業を行い、画像12a内の識別対象物が写る全ての画素に正解となるクラスを付与した教師有り画像を生成する。
図2Bは、図2Aに示した画像12aから作成された教師有り画像15aの一例を示している。図2Bに示すように、教師有り画像15aでは、画像12aで物体13aが表示された領域ER1内の各画素に、例えば、物体13aの種類を定義したクラス「1」が付与される。また、教師有り画像15aでは、画像12aで物体13bが表示された領域ER2内の各画素に、物体13bの種類を定義したクラス「2」が付与される。なお、教師有り画像15aには、画像12aにて物体13a,13bが表示されてない背景領域ER0内の各画素に、背景であることを定義したクラス「0」を付与してもよい。
なお、このような画像12a内の画素1つ1つに、対応するクラスを付与してゆくマーキング作業は、例えば、表示装置に表示された画像12a内の物体13aなどの輪郭を、ユーザが指定して描画してゆき、描画した輪郭内にある全ての画素に対して、対応する同じクラス「1」などを一括して付与することで行うこともできる。
このようにして画像12aから作成された教師有り画像15aは、記憶部3に記憶される。そして、ユーザは、種々の画像から、各画素に対応するクラスを付与した複数の教師有り画像を作成し、これら複数の教師画像を記憶部3に記憶させる。これにより、記憶部3には、図3に示すように、作成された教師有り画像15a,15b,15c,15d,…が記憶される。
なお、図3において、一例で示した教師有り画像15bは、例えば、物体13aのみが表示された画像を基に作成されたものであり、物体13aが表示された領域ER1内の各画素に、対応するクラス「1」が付与されている。また、教師有り画像15cは、例えば、物体13bのみが表示された画像を基に作成されたものであり、物体13bが表示された領域ER2の各画素に、対応するクラス「2」が付与されている。さらに、教師有り画像15dは、例えば、物体13a,13bとは異なる種類の物体13cのみが表示された画像を基に作成されたものであり、物体13cが表示された領域ER3の各画素に、物体13cに定義したクラス「3」が付与されている。
本実施形態における記憶部3には、学習済みモデル作成モードが開始される前に、未学習の識別器17aが、予め記憶されている。学習部2は、識別器17aと複数の教師有り画像15a,15b,15c,15d,…とを記憶部3から読み出し、図3に示すように、識別器17aに教師有り画像15a,15b,15c,15d,…を入力し、教師有り画像15a,15b,15c,15d,…に含まれる識別対象物となる物体の特徴(教師有り画像内での識別対象物の形状や輝度等の特徴)を、深層学習(ディープラーニング)等の手法により学習させ、学習済みモデルを作成する。
学習部2は、複数の教師有り画像15a,15b,15c,15d,…を用いて、識別対象物の特徴を学習させた学習済みモデルを、記憶部3に記憶させる。これにより、能動学習装置1は学習済みモデル作成モードを終了し、次の能動学習モードへと移行する。
なお、本実施形態においては、未学習の識別器を複数の教師有り画像を使用して学習させることで、初期の学習済みモデルを作成する学習部2を適用した場合について述べたが、本発明はこれに限らず、初期の学習済みモデルを外部から取得する取得部を設け、学習済みモデルを記憶部3に予め記憶しておき、学習済みモデル作成モードを省略するようにしてもよい。
(1−2)<能動学習モード>
次に能動学習モードについて説明する。能動学習モードは、教師無し画像の中から、学習済みモデルが識別対象物の特徴を学習するのに寄与する画像を、当該学習済みモデルの識別能力を反映して選定することができ、選定した画像のマーキングを要請して、教師有り画像に追加することで学習済みモデルの識別能力の向上を図るものである。
これにより、能動学習装置1は、画像内で識別対象物が写る画素全てに対してクラス分類を行うマーキング作業の対象となる画像の数を抑制することができるため、その分、ユーザに対してマーキング作業の負担を軽減させることができる。
能動学習装置1は、能動学習モードが開始されると、学習済みモデル作成モードで学習済みモデルの学習に使用していない画像である教師無し画像と、学習済みモデルとを記憶部3から読み出し、これらを推論部4に出力する。推論部4は、図4に示すように、例えば、教師無し画像12eを学習済みモデル17bに入力し、当該学習済みモデル17bを使用して教師無し画像12eを推論する。
推論部4は、学習済みモデル17bにより教師無し画像12eを推論することで、教師無し画像12eの画素がいずれのクラスであるかを数値で表した確信度(例えば、0〜1に正規化された値)を、教師無し画像12eの画素毎に算出する。
例えば、画像12aに表示された物体13aが学習済みモデル17bで正しく識別できているときには、物体13aが表示された領域内の画素では、学習済みモデル17bの推論結果として、物体13aの種類が定義されたクラス「1」の確信度が高く(例えば、0.9といった1に近い値)算出され、物体13bの種類が定義されたクラス「2」及び背景領域に定義されたクラス「0」の確信度が低く(例えば、0.05といった0に近い値)算出される。
一方、画像12aに表示された物体13aが学習済みモデル17bで識別できていないときには、物体13aが表示された領域内の画素では、学習済みモデル17bの推論結果として、クラス「1」、クラス「2」及びクラス「3」の確信度が略等しく(例えば「0.33」)算出される。
推論部4は、教師無し画像12e内にある全ての画素に対して、このような確信度をクラス毎に求め、入力した画像と同サイズの2次元データ(以下、確信度マップと称する)を表示する。図4では、一例として、クラス「1」に対応するチャネルの確信度マップを15eとし、クラス「3」に対応するチャネルの確信度マップを15eとし、クラス「2」に対応するチャネルの確信度マップを15eとして説明する。
図4では、一例として、学習済みモデル17bにより教師無し画像12eを推論することで、3チャンネルの確信度マップ15e,15e,15eが推論部4から出力された例を示している。例えば、確信度マップ15eは、教師無し画像12e内において物体13aの種類が定義されたクラス「1」に対する確信度の大小を輝度値として正規化し、画像として表示している。また、確信度マップ15eは、教師無し画像12e内において物体13cの種類が定義されたクラス「3」に対する確信度の大小を輝度値として正規化し、画像として表示している。なお、入力された教師無し画像12eには物体13cが含まれないため、確信度は略ゼロとなっている。さらに、確信度マップ15eは、教師無し画像12e内において物体13bの種類が定義されたクラス「2」に対する確信度の大小を輝度値として正規化し、画像として表示している。
推論部4は、このようにして生成した確信度マップ15e,15e,15eを教師付与対象画像選定部7に出力する。なお、学習済みモデル17bとして深層学習モデルを用いる場合、推論部4で1つの画像から生成される確信度マップの生成数(チャンネル数とも称する)は、定義するクラスの数に一致することが望ましい。また、推論部4は、教師無し画像12eの画素毎に、確信度が最も高いクラスがその画素のクラスであると決定し、教師無し画像12eの全ての画素についてクラス分類を行うようにしても良い。
教師付与対象画像選定部7は、推論部4で教師無し画像12eを推論した推論結果である確信度マップ15e,15e,15eを受け取ると、確信度マップ15e,15e,15e間の類似度を基に、教師無し画像12eが学習済みモデル17bの学習に有効な教師無し画像となるか否かを決定する。なお、学習済みモデル17bの学習に有効な教師無し画像とは、現時点での学習済みモデル17bが識別することが困難な画像を指す。
ところで、従来技術として、画像セグメンテーションの分野ではなく画像分類の分野では、例えば、特許第5169831号公報(以下、特許文献2と称する)に示すように、能動学習を行う際、データに1つの正解ラベルを付与する作業(以下、ラベリングとも称する)を限定するために、ラベリング済みのデータと比較して類似度が低いデータを、ラベリングされていないデータから選別する方法が提案されている。すなわち、特許文献2では、ラベリング済みのデータと比較して類似度が低いデータが、学習に有効なデータであるとして選別している。
しかしながら、このように、単にラベリング済みのデータとの類似度を使用する場合は、ラベリング済みデータが少量だと、大半のデータについてラベリング済みデータとの類似度が低くなり、ラベリング対象とするデータを十分に絞ることができない。さらに、特許文献2では、同じ識別対象物が写った画像であっても、背景が異なっている場合や対象物の撮影方向が異なっている場合や、対象物の撮影範囲や画像内に含まれるノイズ等の影響によって、低い類似度が算出されてしまい、選択され易くなる懸念があり、現状の学習済みモデルの識別能力を十分に反映した手法であるとはいえない。
そこで、本実施形態では、推論部4の推論結果である複数の確信度マップを利用し、これら確信度マップの各組み合わせでの類似度を判定し、確信度マップ全ての組み合わせで類似していると判定した教師無し画像を、学習済みモデル17bの学習に有効な教師無し画像(教師付与対象画像)として選定するようにした。これにより、教師無し画像全数ではなく、その内から学習済みモデル17bの学習に有効な画像だけを加えて、学習済みモデル17bの再学習を行うことができるため、少ない労力で精度の向上を図ることが期待できる。即ち、精度向上に寄与する画像を現状の学習済みモデル17bの識別能力を反映して選定することができる。
すなわち、学習済みモデル17bで教師無し画像を推論した場合に、十分な精度で教師無し画像の各画素をそれぞれ識別できているときには、高い精度で識別することができたクラスの確信度マップでは、当該クラスに対応する識別対象物が存在する画素において、高い確信度が生じる。一方で、他クラスの確信度マップでは、(他クラスに対応する識別対象物が存在しないため)同一画素において、低い確信度が得られる。そのため、確信度マップを画像としてみたとき、クラスの異なる確信度マップ相互の類似度は低くなる。つまり、異なる2クラスの確信度マップを組み合わせて比較した場合、全クラスの組み合せの内、類似度が低い組み合せが生じる。
ここで、2つの確信度マップ間の類似度とは、2つの確信度マップの内容が互いにどれだけ似ているのかを示す指標であり、類似度が高いほど2つの確信度マップの内容が互いによく似ていることを示し、一方、類似度が低いほど2つの確信度マップの内容が互いに相違していることを示す。確信度マップ間の類似度の算出手法は、例えば、確信度マップの各画素の輝度値を正規化して、適宜画像化する等したうえで、パターンマッチング処理や、確信度マップ間の相関値、確信度マップ間のコサイン類似度など、公知の各種手法を利用することができる。
一方、学習済みモデル17bで教師無し画像を推論した場合に、学習済みモデル17bの識別能力が不十分で教師無し画像の各画素をそれぞれ識別できていないときには、特定のクラスの確信度マップにだけ高い確信度は得られるといったことはなく、全クラスの確信度マップで、略同等の(比較的低い)確信度が現れるため、互いに似た確信度マップとなる。そのため、異なる2クラスの確信度マップの類似度を測った場合、どの確信度マップの組み合せでも、確信度マップ間の類似度が高くなる。
ここで、学習済みモデル17bで教師無し画像を推論したときに、学習済みモデル17bの識別能力が不十分で各画素をそれぞれ識別できていない場合の、教師無し画像については、学習済みモデル17bにて新たに学習させることで、学習済みモデル17bの識別能力を向上させることに役立つ教師無し画像であると言える。
本実施形態の場合、教師付与対象画像選定部7は、例えば、推論部4から複数の確信度マップを受け取ると、これら複数の確信度マップの内から2つの確信度マップからなる任意の組み合わせを選定し、これら確信度マップ間での類似度をそれぞれ算出する。
ここで、教師付与対象画像選定部7には、2つの確信度マップが類似しているか否かを判定するための類似度の閾値が予め設定されている。なお、この閾値は、学習時の損失関数の推移や、評価データを用いた識別モデルの精度検証に基づいて最適な値を設定することができる。教師付与対象画像選定部7は、閾値に基づいて2つの確信度マップが類似しているか否かを判定する。
具体的には、教師付与対象画像選定部7は、複数の確信度マップにおいて任意に選択した2つの確信度マップ間で算出した類似度のうち、いずれかの組合わせで閾値より低いとき、確信度マップが類似していないと判定し、これら確信度マップを推論結果とした教師無し画像を、学習済みモデル17bの学習に寄与しない教師無し画像とする。
一方、教師付与対象画像選定部7は、複数の確信度マップにおいて任意に選択した2つの確信度マップ間で算出した類似度のうち、全ての組合わせで閾値よりも高いとき、確信度マップが類似していると判定し、これら確信度マップを推論結果とした教師無し画像を、学習済みモデル17bの学習に寄与する画像、即ち、教師付与対象画像として選定する。教師付与対象画像選定部7は、入力した教師無し画像を教師付与対象画像として選定したことを示す選定情報を概略領域設定部8に出力する。
このようにして、能動学習装置1では、複数ある教師無し画像の中から、マーキング作業の対象となる教師付与対象画像を限定できるため、教師無し画像全てに対しマーキング作業を行う必要がなくなり、ユーザによっての作業負荷を低減することができる。
ところで、本実施形態の能動学習装置1によって、教師付与対象画像を限定することができるため、明らかにユーザの負荷の低減を図ることがでるが、更に言えば、その後に行う通常のマーキング作業は、画像の各画素に表示される識別対象物をユーザが認識し、画像内において識別対象物となる物体の存在範囲を精緻に選択する必要があるため、依然としてユーザにとって高い負荷が掛る場合があった。
そこで、本実施形態では、概略領域設定部8及び輪郭抽出処理部9を設け、これら概略領域設定部8及び輪郭抽出処理部9を利用して、教師付与対象画像内から識別対象物の輪郭又は領域を自動的に抽出し、1つの教師付与対象画像に対するユーザのマーキング作業の負担軽減を図っている。ここでは、例えば、図5Aに示すように、識別対象物として物体13dが所定位置に表示された教師付与対象画像12fを一例として、以下、本実施形態における概略領域設定部8及び輪郭抽出処理部9について以下説明する。
この場合、概略領域設定部8は、教師付与対象画像選定部7から選定情報を受け取ると、当該選定情報が示す教師無し画像を教師付与対象画像として記憶部3から読み出す。概略領域設定部8は、例えば、図5Aに示す教師付与対象画像12fを記憶部3から読み出すと、図示しない表示装置に教師付与対象画像12fを表示させる。
概略領域設定部8は、表示装置に表示された教師付与対象画像12fをユーザに視認させ、図示しないキーボードやマウス等の操作部をユーザに操作させて、図5Bに示すように、教師付与対象画像12f内にある物体13dを内包する大まかな領域である概略領域ERを教師付与対象画像12f内に設定する。図5Bでは、円形状の枠線で囲まれた領域を概略領域ERとした例を示しており、ユーザは、教師付与対象画像12f内において、枠線の大きさや形状、位置を変えて概略領域ER内に物体13dが納まるようにする。
なお、本実施形態においては、概略領域ERを円形状とした場合について述べたが、本発明はこれに限らず、教師付与対象画像12f内の識別対象物を概略領域ER内に納めることができれば概略領域ERの形状は、例えば、四角形状や多角形状など任意の形状であってもよい。
概略領域設定部8は、ユーザによって設定された概略領域ERの教師付与対象画像12f内での設定位置(例えば、教師付与対象画像12f内での座標)を認識し、概略領域ERの設定位置を表した教師付与対象画像12fを輪郭抽出処理部9に出力する。
輪郭抽出処理部9は、公知の輪郭抽出や領域抽出等の抽出アルゴリズム(例えば、Watershed、GraphCut、GrabCut等)を用いて、教師付与対象画像12f内のうち概略領域ER内に対してのみ輪郭抽出処理又は領域抽出処理を行い、図5Cに示すように、概略領域ER内の濃淡の違いから概略領域ER内にある物体13dの輪郭又は領域を抽出する。本実施形態では、このように概略領域ER以外の領域に対して抽出処理は行わず、概略領域ERに対してだけ抽出処理を行うことで、教師付与対象画像12f内において概略領域ER以外にあるノイズなどが、識別対象物(物体13d)の輪郭又は領域として抽出されてしまうことを抑制できる。また、物体13dの範囲を精緻に選択してマーキングする必要がなくなり、ユーザの作業量を低減することができる。
輪郭抽出処理部9は、概略領域ER内から抽出された輪郭で囲まれた領域又は領域抽出された領域(以下、抽出領域と称する)ER4を特定した教師付与対象画像12fを準教師有り画像生成部10に出力する。これにより、準教師有り画像生成部10は、教師付与対象画像12fにおいて特定した抽出領域ER4内に位置する全ての画素を特定する。
準教師有り画像生成部10は、識別対象物の種類に応じて予め定義されたクラスの中から、教師付与対象画像12f内に表示された物体13dに対応するクラスをユーザに選択させる。これにより、準教師有り画像生成部10は、ユーザにより選択された所定のクラスを抽出領域ER4内の各画素に一括して付与することが望ましい。
かくして、準教師有り画像生成部10は、教師付与対象画像12f内において物体13dが表示される画素を推測した抽出領域ER4内の画素全てに、物体13dに対応したクラスを付与した、準教師有り画像を生成することができる。以上のように、能動学習装置1では、従来のマーキング作業のように、教師付与対象画像内で識別対象物が存在する画素1つ1つをユーザ自身が精緻に選択してゆく必要がないため、その分、ユーザのマーキング作業の負荷軽減を図ることができる。
そして、準教師有り画像生成部10は、このようにして作成した準教師有り画像を記憶部3及び学習部2に出力する。学習部2は、記憶部3から学習済みモデル17bを読み出し、準教師有り画像生成部10で生成した準教師有り画像を教師有り画像に追加し、学習済みモデル17bに再学習させる。これにより学習済みモデル17bは、物体13dの特徴を学習し、識別能力が向上する。
(2)<能動学習処理手順>
次に、上述した能動学習モードの能動学習処理手順について、図6のフローチャートを用いて説明する。図6に示すように、能動学習装置1は、開始ステップからステップS1に移り、学習済みモデル17bを取得し、次のステップS2に移る。
本実施形態の場合、ステップS1における学習済みモデル17bの取得は、能動学習装置1において、未学習の識別器17aに複数の教師有り画像15a,15b,15c,15d,…を入力し、識別対象物の特徴を未学習の識別器17aに学習させ、学習済みモデル17bを作成する。
ステップS2において、推論部4は、教師無し画像(例えば、図4に示した教師無し画像12e)を学習済みモデル17bで推論し、教師無し画像の画素毎に算出した確信度に基づいてクラス毎に確信度マップ(例えば、図4に示した確信度マップ15e,15e,15e)を生成し、次のステップS3に移る。
ステップS3において、教師付与対象画像選定部7は、確信度マップ全ての組み合わせにおいて確信度マップ間の類似度を算出し、次のステップS4に移る。
ステップS4において、教師付与対象画像選定部7は、確信度マップの各組み合わせでそれぞれ算出した全ての類似度が閾値よりも高いか否か、すなわち、確信度マップの全ての組み合わせで確信度マップ同士が類似しているか否かを判定する。
ここで、否定結果が得られると、このことは、確信度マップの各組み合わせで算出した類似度のいずれかが閾値より低いこと、すなわち、あるクラスの確信度マップでは当該クラスの画素が十分に識別できているため他の確信度マップとは明らかに異なった表示形態となっていること(類似していないこと)を表しており、このとき教師付与対象画像選定部7は次のステップS11に移る。
なお、このように、あるクラスの確信度マップで当該クラスの画素が十分に識別できている教師無し画像は、学習済みモデル17bで既に識別可能な教師無し画像となるため、学習済みモデル17bの学習に寄与しない教師無し画像であると言える。
ステップS11において、推論部4は、記憶部3に記憶されている他の教師無し画像の中から次の教師無し画像を選択し、再びステップS2に移り、ステップS4で肯定結果が得られるまで、上述したステップS2、ステップS3、ステップS4及びステップS11を繰り返す。
これに対して、ステップS4で肯定結果が得られると、このことは、確信度マップの各組み合わせでそれぞれ算出した類似度の全てが閾値よりも高いこと、すなわち、確信度マップのいずれにおいてもクラスが識別できていないため、確信度マップ同士が同じような表示形態になって確信度マップ同士が類似していることを表しており、このとき教師付与対象画像選定部7は次のステップS5に移る。
なお、このように、複数ある確信度マップのいずれにおいてもクラスが識別できていない教師無し画像は、学習済みモデル17bで識別できていない教師無し画像となるため、学習済みモデル17bの学習に寄与する教師無し画像であると言える。
ステップS5において、教師付与対象画像選定部7は、教師無し画像を教師付与対象画像として選定し、次のステップS6に移る。ステップS6において、概略領域設定部8は、例えば教師付与対象画像12fに写った識別対象物である物体13dを表示装置によりユーザに視認させる。次いで、ステップS6において、概略領域設定部8は、教師付与対象画像12fの物体13dを内包する概略領域ERを、ユーザによって教師付与対象画像12f内に設定させ、次のステップS7に移る。
ステップS7において、輪郭抽出処理部9は、教師付与対象画像12fのうち概略領域ERに対してのみ輪郭抽出処理又は領域抽出処理を行い、概略領域ER内の濃淡の違いを基に物体13dと推定される部分の輪郭又は領域を概略領域ER内から抽出し、次のステップS8に移る。
ステップS8において、準教師有り画像生成部10は、教師付与対象画像12fに写る物体13dに対応するクラスをユーザに選択させ、輪郭抽出処理又は領域抽出処理により抽出した抽出領域ER4内の各画素に、ユーザが選択した当該クラスを付与して、準教師有り画像を生成し、次のステップS9に移る。
ステップS9において、学習部2は、ステップS8で生成した準教師有り画像を既存の教師有り画像に追加して学習済みモデル17bに再学習させて、学習済みモデル17bの識別能力を向上させ、次のステップS10に移る。
ステップS10において、学習部2は、ステップS9で識別能力を向上させた学習済みモデル17bの識別精度を評価用画像(学習のための画像とは異なるマーキング済み画像)により評価し、所望する識別精度が得られたか否かを確認する。なお、学習済みモデル17bの識別精度の評価は、例えば、予め用意した評価用画像を学習済みモデル17bで推論し、正しいクラスが識別されているか否かを基に判断される。
ここで、ステップS10において否定結果が得られると、このことは、学習済みモデル17bにおいて未だ所望する識別精度が得られていないこと、すなわち、評価用画像を学習済みモデル17bで推論した結果、識別対象物を識別できていなかったことを表しており、このとき、学習部2は次のステップS11に移り、ステップS4及びステップS10で肯定結果が得られるまで、上述した処理を繰り返す。
これに対して、ステップS10で肯定結果が得られると、このことは、学習済みモデル17bにおいて所望する識別精度が得られたこと、すなわち、評価用画像を学習済みモデル17bで推論した結果、評価用画像内の各画素について識別対象物を識別できたことを表しており、このとき、学習部2は上述した能動学習処理手順を終了する。
(3)<作用及び効果>
以上の構成において、能動学習装置1は、各画素をクラス分類した複数の教師有り画像を用いて学習した学習済みモデル17bを取得し(取得工程)、これを記憶部3に記憶する。そして、能動学習装置1は、この学習済みモデル17bで教師無し画像を推論し、推論結果に基づいて、複数の教師無し画像の中から学習済みモデル17bの学習に寄与する画像を選定し、この画像を教師付与対象画像とする(教師付与対象画像選定工程)。
能動学習装置1は、このようにして選定した教師付与対象画像の画素毎に、それぞれ対応するクラスを付与して準教師有り画像を生成(準教師有り画像生成工程)し、既存の教師有り画像に追加して学習済みモデル17bを再学習させる(学習工程)。
このように、能動学習装置1では、複数ある教師無し画像の中から、学習済みモデル17bの学習に寄与する教師無し画像だけを教師付与対象画像として選定することで、全ての教師無し画像に対してマーキングを行うことを回避できる。よって、ユーザの作業負担を軽減し、学習済みモデルの精度向上を図ることができる。
本実施形態では、上述した教師付与対象画像選定工程では、学習済みモデル17bで教師無し画像を推論し、教師無し画像の各画素のクラスを、クラス毎に教師無し画像と同じサイズの2次元データとした複数の確信度マップを生成するようにした。
そして、その後の教師付与対象画像選定工程において、推論結果として得られた複数の確信度マップの中から抜き出した2つの確信度マップの組み合わせ間の類似度を判定し、全ての組み合わせで類似していると判定した画像を、教師付与対象画像として選定するようにした。
これにより、能動学習装置1では、現状の学習済みモデル17bの識別能力を反映して、教師付与対象画像を選定することができるので、現状の学習済みモデル17bの識別能力向上に有効な教師無し画像に対してだけマーキング作業を行うことができる。よって、現状の学習済みモデル17bの学習に寄与しない教師無し画像への不要なマーキング作業を抑制できる分、マーキング作業の負担軽減を図ることができる。
さらに、本実施形態では、準教師有り画像生成工程において、教師付与対象画像12f内の物体13dを内包する概略領域ERを設定させるようにした。そして、能動学習装置1は、輪郭抽出処理部9によって概略領域ERに対してのみ輪郭抽出処理又は領域抽出処理を行い、概略領域ER以外の領域の輪郭は抽出せずに概略領域ER内の物体13dの輪郭又は領域のみを自動的に抽出するようにした。
また、このようにして抽出した輪郭で囲まれた抽出領域ER4内の各画素に、対応するクラスを付与して準教師有り画像を生成し、準教師有り画像を既存の教師有り画像に追加して、学習済みモデル17bを再学習させるようにした。
このように、能動学習装置1では、概略領域ERに対してだけ輪郭抽出処理又は領域抽出処理を行うことで、教師付与対象画像12f内において概略領域ER以外にあるノイズなどを、識別対象物(物体13d)の輪郭又は領域として抽出してしまうことを抑制することができ、その分、教師付与対象画像12f内から識別対象物の輪郭又は領域を一段と正確に抽出することができる。
また、能動学習装置1では、輪郭抽出処理部9において、公知の輪郭抽出処理又は領域抽出処理を行い、教師付与対象画像12f内から物体13dの輪郭又は領域を自動的に抽出するようにしたことで、識別対象物が存在する領域に含まれる全画素をユーザ自身が自ら精緻に選択してゆく必要がないため、その分、マーキング作業の手間を大幅に省くことができ、ユーザの負荷軽減を図ることができる
(4)<他の実施形態>
なお、上述した各実施形態においては、識別対象物として、鉄鋼製品、人の顔、人物、病理組織、食品検査など、セグメンテーションの分野において学習済みモデルに学習させることが可能な種々の識別対象物を適用することもできる。
また、上述した実施形態においては、教師付与対象画像選定部7によって確信度マップ間の類似度を基に教師付与対象画像を選定し、その後、概略領域設定部8及び輪郭抽出処理部9によって教師付与対象画像内の識別対象物の輪郭又は領域を抽出する能動学習装置1について述べたが、本発明はこれに限らない。
例えば、概略領域設定部8及び輪郭抽出処理部9を有しない能動学習装置とし、教師付与対象画像選定部7によって確信度マップ間の類似度を基に教師付与対象画像を選定した後、従来と同様に、教師無し画像内の識別対象物が存在する画素を精緻にユーザ自身でマーキングさせるようにしてもよい。
また、教師付与対象画像選定部7を有しない能動学習装置とし、推論部4における推論結果からユーザ自身が任意に教師付与対象画像を選択し、概略領域設定部8及び輪郭抽出処理部9によって教師付与対象画像内の識別対象物の輪郭又は領域を抽出させるようにしてもよい。
さらに、上述した実施形態においては、概略領域設定部8により教師付与対象画像12f内に概略領域ERを設定した後に、輪郭抽出処理部9により概略領域ER内に対して輪郭抽出処理又は領域抽出処理を行う能動学習装置1について述べたが、本発明はこれに限らない。例えば、教師付与対象画像12f内に概略領域ERを設定せずに、輪郭抽出処理部9により教師付与対象画像12f全体に輪郭抽出処理又は領域抽出処理を行い、教師付与対象画像12fから識別対象物の輪郭又は領域を直接抽出するようにしてもよい。
なお、本実施形態において、学習済みモデル作成モードで学習済みモデルを学習させる際に用いる教師有り画像15a,15b,15c,15d,…は、概略領域設定部8及び輪郭抽出処理部9を用いて教師無し画像内の識別対象物の輪郭又は領域を抽出し、抽出した輪郭又は領域内に存在する画素に対してユーザによる確認を行うことなく、対応するクラスを自動的に付与して準教師有り画像を生成してもよい。
1 能動学習装置
2 学習部(取得部)
3 記憶部
4 推論部
7 教師付与対象画像選定部
8 概略領域設定部
9 輪郭抽出処理部
10 準教師有り画像生成部

Claims (4)

  1. 画像に撮像された識別対象物を識別する識別器の能動学習方法において、
    各画素に前記識別対象物の種類に対応するクラスを付与した教師有り画像を用い、前記識別器を学習させることで学習済みモデルを取得する取得工程と、
    前記クラスが付与されていない教師無し画像を、前記学習済みモデルで推論することで、前記教師無し画像の中から前記学習済みモデルの学習に寄与する画像である教師付与対象画像を選定する教師付与対象画像選定工程と、
    前記教師付与対象画像の画素毎に、それぞれ対応するクラスを付与して新たな教師有り画像を生成する準教師有り画像生成工程と、
    前記新たな教師有り画像を用いて、前記学習済みモデルを再学習させる学習工程と、
    を備える能動学習方法。
  2. 前記教師付与対象画像選定工程は、
    前記教師無し画像を前記学習済みモデルで推論し、前記教師無し画像の各画素の前記クラスを、前記クラス毎に前記教師無し画像と同サイズの2次元データとした複数の確信度マップを生成し、
    前記複数の確信度マップから抜き出した2つの確信度マップの組み合せ間の類似度を判定し、全ての組み合せで類似していると判定された画像を、前記教師付与対象画像として選定する、請求項1に記載の能動学習方法。
  3. 前記準教師有り画像生成工程は、
    前記教師付与対象画像内の前記識別対象物を内包する領域を設定し、
    前記識別対象物を内包する領域から、前記識別対象物が存在する領域を抽出し、
    抽出した前記識別対象物が存在する領域内の各画素に、対応する前記クラスを付与して新たな教師有り画像とする、請求項1又は2に記載の能動学習方法。
  4. 画像に撮像された識別対象物を識別する識別器を用いた能動学習装置において、
    各画素に前記識別対象物の種類に対応するクラスを付与した教師有り画像を用い、前記識別器を学習させることで学習済みモデルを取得する取得部と、
    前記クラスが付与されていない教師無し画像を、前記学習済みモデルで推論することで、前記教師無し画像の中から前記学習済みモデルの学習に寄与する画像である教師付与対象画像を選定する教師付与対象画像選定部と、
    前記教師付与対象画像の画素毎に、それぞれ対応するクラスを付与して新たな教師有り画像を生成する準教師有り画像生成部と、
    前記新たな教師有り画像を用いて、前記学習済みモデルを再学習させる学習部と、
    を備える能動学習装置。

JP2019051525A 2019-03-19 2019-03-19 能動学習方法及び能動学習装置 Active JP7225978B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019051525A JP7225978B2 (ja) 2019-03-19 2019-03-19 能動学習方法及び能動学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019051525A JP7225978B2 (ja) 2019-03-19 2019-03-19 能動学習方法及び能動学習装置

Publications (2)

Publication Number Publication Date
JP2020154602A true JP2020154602A (ja) 2020-09-24
JP7225978B2 JP7225978B2 (ja) 2023-02-21

Family

ID=72559095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019051525A Active JP7225978B2 (ja) 2019-03-19 2019-03-19 能動学習方法及び能動学習装置

Country Status (1)

Country Link
JP (1) JP7225978B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020197999A (ja) * 2019-06-04 2020-12-10 京セラ株式会社 画像学習プログラム、画像学習方法、及び画像認識装置
WO2024069701A1 (ja) * 2022-09-26 2024-04-04 株式会社日立ハイテク モデル生成方法及び欠陥検査システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143667A (ja) * 1996-11-06 1998-05-29 Nec Corp 自動検査システム及び判定方法
JP2006284543A (ja) * 2005-04-01 2006-10-19 Marantz Electronics Kk 実装回路基板検査方法および実装回路基板検査装置
JP2012174222A (ja) * 2011-02-24 2012-09-10 Olympus Corp 画像認識プログラム、方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143667A (ja) * 1996-11-06 1998-05-29 Nec Corp 自動検査システム及び判定方法
JP2006284543A (ja) * 2005-04-01 2006-10-19 Marantz Electronics Kk 実装回路基板検査方法および実装回路基板検査装置
JP2012174222A (ja) * 2011-02-24 2012-09-10 Olympus Corp 画像認識プログラム、方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
渡邊雅人、他: "能動学習のための教師なしアノテーション対象データ選択方法", 情報処理学会研究報告, vol. Vol.2018-CVIM-213 No.38, JPN6022046684, 21 September 2018 (2018-09-21), JP, pages 1 - 8, ISSN: 0004914717 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020197999A (ja) * 2019-06-04 2020-12-10 京セラ株式会社 画像学習プログラム、画像学習方法、及び画像認識装置
JP7210380B2 (ja) 2019-06-04 2023-01-23 京セラ株式会社 画像学習プログラム、画像学習方法、及び画像認識装置
WO2024069701A1 (ja) * 2022-09-26 2024-04-04 株式会社日立ハイテク モデル生成方法及び欠陥検査システム

Also Published As

Publication number Publication date
JP7225978B2 (ja) 2023-02-21

Similar Documents

Publication Publication Date Title
TWI651662B (zh) 影像標註方法、電子裝置及非暫態電腦可讀取儲存媒體
WO2019238063A1 (zh) 文本检测分析方法、装置及设备
Jia et al. Learning to classify gender from four million images
US20210089827A1 (en) Feature representation device, feature representation method, and program
US20150278710A1 (en) Machine learning apparatus, machine learning method, and non-transitory computer-readable recording medium
CN106447625A (zh) 基于人脸图像序列的属性识别方法及装置
CN105320945A (zh) 图像分类的方法及装置
JP2017111660A (ja) 映像パターン学習装置、方法、及びプログラム
Li et al. Pushing the “Speed Limit”: high-accuracy US traffic sign recognition with convolutional neural networks
JP6756406B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2018026122A5 (ja)
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN108961358B (zh) 一种获得样本图片的方法、装置及电子设备
US20210056464A1 (en) Training apparatus, image recognition apparatus, training method, and program
JP2022553779A (ja) キャビン内の環境の調整方法及び装置
JP2020154602A (ja) 能動学習方法及び能動学習装置
KR20200009599A (ko) 이미지에 작가의 화풍을 적용하여 제공하는 방법, 서버 및 프로그램
CN113591763A (zh) 人脸脸型的分类识别方法、装置、存储介质及计算机设备
EP3623991B1 (en) Learning method, learning device for detecting lanes on the basis of cnn and testing method, testing device using the same
CN115393625A (zh) 从粗略标记进行图像分段的半监督式训练
KR102537943B1 (ko) 이미지 데이터 라벨링 학습 방법 및 그 장치
CN112861633B (zh) 一种基于机器学习的图像识别方法、设备及存储介质
CN113095351A (zh) 借助于初始标记的改善生成经标记的数据的方法
Behera et al. Rotation axis focused attention network (rafa-net) for estimating head pose
JP2016062249A (ja) 識別辞書学習システム、認識辞書学習方法および認識辞書学習プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230123

R151 Written notification of patent or utility model registration

Ref document number: 7225978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151