JP7104252B2 - 学習データセット生成装置および方法 - Google Patents
学習データセット生成装置および方法 Download PDFInfo
- Publication number
- JP7104252B2 JP7104252B2 JP2021572242A JP2021572242A JP7104252B2 JP 7104252 B2 JP7104252 B2 JP 7104252B2 JP 2021572242 A JP2021572242 A JP 2021572242A JP 2021572242 A JP2021572242 A JP 2021572242A JP 7104252 B2 JP7104252 B2 JP 7104252B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- area
- learning
- data set
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
しかしながら、この「物体画像と背景画像との画像特徴量の差異」に基づく手法は、室内人工照明下の定点カメラの入力画像のように、「入力画像の背景が既知かつ一定とみなせるケース」に特化して有効な技術である。
また、この「画像から検知した物体の輪郭情報」に基づく手法は、「学習対象領域に輪郭情報が集中し、それ以外に輪郭情報が少ないケース」に特化して有効な技術である。
そのため、特許文献1の技術では、膨大かつ多種多様な入力画像の事前処理に柔軟にかつ十分に対応できないおそれがある。
前記対象外格納部は、前記学習対象領域を画像領域に含まない対象外画像の群を対象外データセットとして格納する。
前記対象外選択部は、前記入力画像と前記対象外データセットとの間で差異を評価し、前記差異の評価結果に基づいて、前記入力画像に適応する対象外画像を前記対象外データセットから選択する。
前記領域候補抽出部は、前記対象外選択部によって選択された前記対象外画像と前記入力画像との間の差異領域の領域分布に基づいて、前記領域候補を検出する。
図1は、実施例1の学習データセット生成装置100の構成を示す図である。
同図において、学習データセット生成装置100は、補助記憶部110、対象外選択部130、領域候補抽出部140、領域候補継承部150、動体判別部160、代表画像生成部170、対象外生成部180、インタフェース部190、および学習モデル部210を備える。
まず、学習データセット生成装置100が実施する「対象外データセット112Aの準備処理」について説明する。
図2は、対象外データセット112Aの準備処理を示す流れ図である。
図3は、対象外データセット112Aの準備時に実施される対象外画像の抽出過程を示す説明図である。
以下、図2および図3を用いて説明する。
(対象外画像の候補1)不特定に収集される画像群
(対象外画像の候補2)学習用に収集されながら、学習対象領域を含まないと判断された不特定の画像群
(対象外画像の候補3)入力画像に近い入手元(カメラなど)や入手地域において、照明条件や日照条件(季節や撮影時刻)や撮影対象などの撮影条件を不特定に変えて収集した画像群
動体判別部160は、対象外候補格納部111から、これらの画像群を含む対象外画像の候補を取り込む。
上述した一連の動作により、学習データセット生成装置100は、対象外データセット112Aを準備することが可能になる。
続いて、学習データセット生成装置100が実施する「学習対象領域の領域候補の検出」について説明する。
図4および図5は、学習対象領域の領域候補の検出処理を説明する流れ図である。
図6は、学習データセット生成装置100の内部データの流れを示す説明図である。
図7は、学習データセット生成装置100による画像処理の様子を示す説明図である。
なお、図6および図7において、図1と同じ構成については同一の参照符号を付与し、ここでの重複説明を省略する。
以下、図1および図4~図7に基づいて「学習対象領域の領域候補の検出処理」を説明する。
差異の絶対値和が低い場合、入力画像と対象外画像との差異は少なく、局所的で有意な差異と評価される。
差異領域の面積が狭い場合、入力画像と対象外画像との差異領域は狭く、局所的で有意な差異と評価される。
差異の領域形状が特定の形状(人型、建物型、乗物型、電柱型、標識型、図形型、商品型、病巣型など)に近いほど、入力画像と対象外画像との差異は特徴的で有意な差異と評価される。ここでの特定の形状は、学習データセットの目的および用途に応じて適宜に設定される。
差異の領域数が少ないほど、入力画像と対象外画像との差異は集約され、局所的で有意な差異と評価される。
差異の画像領域内での集中度が高いほど、入力画像と対象外画像との差異は集中し、局所的で有意な差異と評価される。
残りの対象外画像がある場合、対象外選択部130はステップS202に動作を戻す。
一方、残りの対象外画像がない場合、対象外選択部130はステップS205に動作を進める。
入力画像に対して有意な差異を示す対象外画像が存在する場合、対象外選択部130はステップS207に動作を移行する。
一方、入力画像に対して有意な差異を示す対象外画像が見つからない場合、対象外選択部130はステップS206に動作を進める。
この動作の後、領域候補継承部150はステップS209に動作を移行する。
処理待ちの入力画像がある場合、対象外選択部130はステップS201に動作を戻して、上述した動作を新たな入力画像に対して繰り返す。
一方、入力画像に対する学習対象領域の領域候補検出が全て完了した場合、対象外選択部130は動作を完了する。
続いて、インタフェース部190の動作について説明する。
図8は、インタフェース部190の動作を説明する流れ図である。
図9は、学習データセット114のデータ構造の一例を示す図である。なお、図9において、図1と同じ構成については同一の参照符号を付与し、ここでの重複説明を省略する。
以下、図1および図8~図9に基づいて「インタフェース部190の動作」を説明する。
処理待ちのセットがある場合、インタフェース部190はステップS301に動作を戻して、上述した動作を繰り返す。
続いて、インタフェース部190が生成する表示画面について説明する。
図10は、表示画面の一例を示す図である。
同図に示す表示画面1001は、クライアント端末200の画面上にタグ付けツールの操作ウィンドウとして表示される。
この表示画面1001は、次のGUI部品によってレイアウト構成される。
セッションは、学習データセット生成の作業単位に相当する。セッションは、作業単位の情報を管理するためのデータフォルダに関連付けられる。このデータフォルダには、作業中または作業済みの入力画像やタグ情報や学習対象領域などの作業情報が格納される。作業者は、セッション選択パート1002を操作してセッションに関連するデータフォルダを新規作成することにより、学習データセット生成の作業(セッション)を新規に開始することができる。また、作業者は、過去のセッションを選択することにより、関連するデータフォルダを開いて学習データセット生成の作業を随時に再開することができる。
学習画像フォルダ選択パート1003は、入力画像の入力元フォルダ(複数選択可)を指定するためのGUI部品である。
対象外データセット登録パート1004は、領域候補の検出に使用する対象外データセット112Aのフォルダを登録するためGUI部品である。
図10に示す操作ウィンドウでは、タグ情報は、例えばクラス分類として管理される。作業者は、タグ情報としてのクラス名をクラス入力欄パート1006に入力してクラス追加パート1005を操作することによって、任意の名前のタグ情報のクラスを新規作成することができる。作成されたタグ情報のクラスはクラス名一覧表パート1007に表示される。作業者は、クラス名一覧表パート1007をメニュー選択することにより、学習対象領域に付与するタグ情報のクラスを選択する。また、作業者は、過去に学習対象領域に付与されたタグ情報のクラスを一括または部分的に修正または削除することもできる。
表示域1009は、処理対象である入力画像を表示する。作業者は表示域1009を選択操作し、マウスホイールや十字キーなどで処理対象の入力画像を切り替えることができる。
表示域1010は、学習対象領域の領域候補を、矩形枠または輪郭強調表示などを入力画像の表示域1009に重畳させた形式で表示する。
作業者は、表示される領域候補をGUI操作することで、学習対象領域としての是非判断や領域訂正の入力操作を行う。このような操作によって、学習対象領域が確定される。
また、表示域1011に対する操作では、一つの入力画像に対して複数の学習対象領域を確定することもできる。また、入力画像の画像全域を学習対象領域に確定することもできる。
なお、上述のステップS208において複数の領域候補が検出された場合、複数の領域候補それぞれに対応する複数の表示域1010が、同時または順次に表示画面1001に表示される。
表示域1011は、登録された対象外データセット112Aの内で、領域候補の検出に使用した対象外画像を強調枠表示する。
作業者がセッション保存パート1012を操作することにより、セッションの作業データは、セッションに関連付けられたデータフォルダに保存される。なお、セッションの保存は、入力画像のタグ付けが完了した時点で自動的に行ってもよい。また、入力画像を切り替えるたびにセッションを自動的に保存してもよい。さらに、各操作の合間にセッションを自動的に保存してもよい。
次に、学習モデル部210について説明する。
以下、実施例1が奏する顕著な効果について説明する。
なお、実施形態では、学習データセット生成装置100を複数のクライアント端末200に接続したシステム構成について説明した。しかしながら、本発明はこの構成に限定されるものではない。例えば、本発明を、単独の装置(コンピュータなど)で実現してもよい。
Claims (8)
- 学習データ用に収集される入力画像の画像領域から、機械学習の学習対象としてタグ付けを行う学習対象領域の領域候補を検出する学習データセット生成装置であって、
前記学習対象領域を画像領域に含まない対象外画像の群を対象外データセットとして格納する対象外格納部と、
前記入力画像と前記対象外データセットとの間で差異を評価し、前記差異の評価結果に基づいて、前記入力画像に適応する対象外画像を前記対象外データセットから選択する対象外選択部と、
前記対象外選択部によって選択された前記対象外画像と前記入力画像との間の差異領域の領域分布に基づいて、前記領域候補を検出する領域候補抽出部と
を備えることを特徴とする学習データセット生成装置。 - 請求項1に記載の学習データセット生成装置であって、
前記対象外画像の選択処理について信頼性を評価し、前記信頼性が低評価の場合、前記入力画像から所定フレーム数以内で検出された前記領域候補に基づいて、前記入力画像の前記領域候補を決定する領域候補継承部を備える
ことを特徴とする学習データセット生成装置。 - 請求項1~2のいずれか一項に記載の学習データセット生成装置であって、
画像の群に対して動体の検知を行い、「動体を含まない画像」の群を選別する動体判別部と、
前記「動体を含まない画像」の群から前記対象外データセットを生成する対象外生成部と
を備えることを特徴とする学習データセット生成装置。 - 請求項3に記載の学習データセット生成装置であって、
前記「動体を含まない画像」の群についてクラスタリングを行うことによって、類似する画像による冗長性を削減した代表画像の群を生成する代表画像生成部を備え、
前記対象外生成部は、前記代表画像の群に基づいて前記対象外データセットを生成する
ことを特徴とする学習データセット生成装置。 - 請求項1~4のいずれか一項に記載の学習データセット生成装置であって、
前記領域候補抽出部によって決定された前記領域候補を情報出力し、前記学習対象領域としての是非判断または領域訂正の情報入力を受け付けることによって、前記入力画像における前記学習対象領域を確定するインタフェース部
を備えたことを特徴とする学習データセット生成装置。 - 請求項5に記載の学習データセット生成装置であって、
前記インタフェース部は、前記領域候補抽出部によって検出された前記領域候補を表示するための表示域と、前記領域候補の検出に使用した前記対象外画像を表示するための表示域とを含む表示画面を生成する
ことを特徴とする学習データセット生成装置。 - 請求項5~6のいずれか一項に記載の学習データセット生成装置であって、
少なくとも前記入力画像について入力する入力層と、機械学習のための中間層と、前記領域候補について出力する出力層とを有する学習モデル部をさらに備え、
前記学習モデル部は、前記インタフェース部において確定する前記学習対象領域を教師データとして、少なくとも前記入力画像の群について機械学習を行う
ことを特徴とする学習データセット生成装置。 - 学習データ用に収集される入力画像の画像領域から、機械学習の学習対象としてタグ付けを行う学習対象領域の領域候補を検出する学習データセット生成方法であって、
前記学習対象領域を画像領域に含まない対象外画像の群を対象外データセットとして格納する対象外格納ステップと、
前記入力画像と前記対象外データセットとの間で差異を評価し、前記差異の評価結果に基づいて、前記入力画像に適応する対象外画像を前記対象外データセットから選択する対象外選択ステップと、
前記対象外選択ステップによって選択された前記対象外画像と前記入力画像との間の差異領域の領域分布に基づいて、前記領域候補を検出する領域候補抽出ステップと
を備えることを特徴とする学習データセット生成方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/002583 WO2021149252A1 (ja) | 2020-01-24 | 2020-01-24 | 学習データセット生成装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021149252A1 JPWO2021149252A1 (ja) | 2021-07-29 |
JP7104252B2 true JP7104252B2 (ja) | 2022-07-20 |
Family
ID=76991841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021572242A Active JP7104252B2 (ja) | 2020-01-24 | 2020-01-24 | 学習データセット生成装置および方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7104252B2 (ja) |
WO (1) | WO2021149252A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023175652A1 (ja) * | 2022-03-14 | 2023-09-21 | 日本電気株式会社 | 動画生成装置、動画生成方法、および動画生成プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005128959A (ja) | 2003-10-27 | 2005-05-19 | Sony Corp | ロボット装置及びその物体学習方法 |
JP2019159787A (ja) | 2018-03-13 | 2019-09-19 | コニカミノルタ株式会社 | 人物検出方法および人物検出プログラム |
-
2020
- 2020-01-24 JP JP2021572242A patent/JP7104252B2/ja active Active
- 2020-01-24 WO PCT/JP2020/002583 patent/WO2021149252A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005128959A (ja) | 2003-10-27 | 2005-05-19 | Sony Corp | ロボット装置及びその物体学習方法 |
JP2019159787A (ja) | 2018-03-13 | 2019-09-19 | コニカミノルタ株式会社 | 人物検出方法および人物検出プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021149252A1 (ja) | 2021-07-29 |
WO2021149252A1 (ja) | 2021-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936911B2 (en) | Logo detection | |
CN108229504B (zh) | 图像解析方法及装置 | |
Li et al. | Automatic pavement crack recognition based on BP neural network | |
CN106462940A (zh) | 图像中通用对象检测 | |
JP2002099918A (ja) | 画像処理方法、画像処理システムおよび記録媒体 | |
JP2019023392A (ja) | 切羽評価支援システム、切羽評価支援方法及び切羽評価支援プログラム | |
CN106228398A (zh) | 基于c4.5决策树算法的特定用户挖掘系统及其方法 | |
CN111008961B (zh) | 一种输电线路设备缺陷检测方法及其系统、设备、介质 | |
CN108229418B (zh) | 人体关键点检测方法和装置、电子设备、存储介质和程序 | |
CN113032868A (zh) | 预制构件管理方法、装置、电子设备及存储介质 | |
CN113033516A (zh) | 对象识别统计方法及装置、电子设备、存储介质 | |
CN107564032A (zh) | 一种基于外观网络的视频跟踪对象分割方法 | |
CN116168351B (zh) | 电力设备巡检方法及装置 | |
CN113515655A (zh) | 一种基于图像分类的故障识别方法及装置 | |
JP7104252B2 (ja) | 学習データセット生成装置および方法 | |
CN114282607A (zh) | 一种基于双筛模型的弥散轨迹分析方法及系统 | |
CN111583417B (zh) | 一种图像语义和场景几何联合约束的室内vr场景构建的方法、装置、电子设备和介质 | |
JP6326622B2 (ja) | 人物検出装置 | |
JP2021111228A (ja) | 学習装置、学習方法、及びプログラム | |
CN108256578B (zh) | 一种灰度图像的识别方法、装置、设备及可读存储介质 | |
CN110032933B (zh) | 一种图像数据的获取方法、装置、终端及存储介质 | |
CN111680572B (zh) | 一种电网运行场景动态判定方法及系统 | |
CN109190585B (zh) | 一种佤族居住区域判别方法 | |
CN114582012A (zh) | 一种骨架人体行为识别方法、装置及设备 | |
CN113569912A (zh) | 车辆识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220601 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220601 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7104252 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |