JP7004125B2 - 画像解析装置、画像解析方法及び画像解析プログラム - Google Patents
画像解析装置、画像解析方法及び画像解析プログラム Download PDFInfo
- Publication number
- JP7004125B2 JP7004125B2 JP2021559415A JP2021559415A JP7004125B2 JP 7004125 B2 JP7004125 B2 JP 7004125B2 JP 2021559415 A JP2021559415 A JP 2021559415A JP 2021559415 A JP2021559415 A JP 2021559415A JP 7004125 B2 JP7004125 B2 JP 7004125B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- input
- attribute information
- similar
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010191 image analysis Methods 0.000 title claims description 29
- 238000003703 image analysis method Methods 0.000 title claims description 4
- 238000001514 detection method Methods 0.000 claims description 36
- 239000000284 extract Substances 0.000 claims description 15
- 238000000605 extraction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 239000000470 constituent Substances 0.000 description 10
- 238000000034 method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 102200094740 rs1085307938 Human genes 0.000 description 4
- 102220065616 rs533231493 Human genes 0.000 description 4
- 102220353539 c.41G>A Human genes 0.000 description 3
- 102220002646 rs104894310 Human genes 0.000 description 3
- 102220126636 rs886044323 Human genes 0.000 description 3
- 101001139126 Homo sapiens Krueppel-like factor 6 Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 102220045929 rs587782499 Human genes 0.000 description 2
- 102220606803 Gap junction beta-1 protein_G21D_mutation Human genes 0.000 description 1
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 102200006539 rs121913529 Human genes 0.000 description 1
- 102220052829 rs727503049 Human genes 0.000 description 1
- 102220067427 rs765472726 Human genes 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Description
本開示は、画像解析装置、画像解析方法及び画像解析プログラムに関する。
従来から、設計図や配置図などの図面画像に示された機械や配置物などの対象物及び/又は対象物を構成する構成要素に対して、その属性を示す属性情報を対応付ける技術が知られている。
例えば、特許文献1には、電柱やマンホールといった構成要素を認識し、認識した構成要素に対して属性を示す属性情報を対応づけることが記載されている。
特許文献1に開示された技術では、図面画像に示された構成要素が、記号など、予め決められた形状で示され、更に、予め決められた形状と属性情報とが一意に対応づけられていることが前提であった。そのため、特許文献1に開示された技術では、丸や四角など汎用的な形状で構成要素が示されている場合に、その形状から構成要素の属性情報を一意に特定することができず、構成要素の属性情報を出力することができないという課題があった。
本開示は、上述のような課題を解決するためになされたものであり、図面画像に示された対象物及び/又は対象物を構成する構成要素が汎用的な形状で示されている場合であっても、対象物及び/又は対象物を構成する構成要素の属性情報を出力できるようにすることを目的とする。
本開示に係る画像解析装置は、入力された入力画像の属性情報を出力する画像解析装置であって、図面画像、当該図面画像の属性を示す属性情報を含む知識データベースから、入力された入力画像に類似する図面画像を検索する類似画像検索部と、前記類似画像検索部で検索された図面画像の特徴点と、前記入力画像の特徴点とを対応付け、当該図面画像の特徴点を対応点として検出する画像対応検出部と、前記画像対応検出部により検出された対応点に対応する属性情報を前記知識データベースから抽出し、前記入力画像の属性情報として出力する属性出力部とを備えることを特徴とするものである。
本開示は、図面画像に示された対象物及び/又は対象物を構成する構成要素が汎用的な形状で示されている場合であっても、対象物及び/又は対象物を構成する構成要素の属性情報を出力できるという効果を奏する。
実施の形態1.
図1は、実施形態1に係る画像解析装置100の構成を示すブロック図である。
画像解析装置100は、図面データに応じた図面画像(入力画像の一例)が入力され、入力された入力画像の属性情報を出力する装置である。具体的には、画像解析装置100は、図面画像に示された対象物の属性情報及び/又は対象物を構成する構成要素の属性情報を出力する装置である。以降、対象物の属性情報及び対象物を構成する構成要素の属性情報をそれぞれ区別して説明する必要のない場合は、単に、図面画像の属性情報と称する。出力される図面画像の属性情報は、対象物及び/又は対象物を構成する構成要素の名称の他、型番、図面画像の作成日、図面画像の更新日、図面画像を作成した担当者の名前、図面画像を作成した案件の名称等を示すテキストを含んでいてもよい。また、出力される図面画像の属性情報は、対象物及び/又は対象物を構成する構成要素の寸法、材質及び/又は重量などを含んでいてもよい。
図1は、実施形態1に係る画像解析装置100の構成を示すブロック図である。
画像解析装置100は、図面データに応じた図面画像(入力画像の一例)が入力され、入力された入力画像の属性情報を出力する装置である。具体的には、画像解析装置100は、図面画像に示された対象物の属性情報及び/又は対象物を構成する構成要素の属性情報を出力する装置である。以降、対象物の属性情報及び対象物を構成する構成要素の属性情報をそれぞれ区別して説明する必要のない場合は、単に、図面画像の属性情報と称する。出力される図面画像の属性情報は、対象物及び/又は対象物を構成する構成要素の名称の他、型番、図面画像の作成日、図面画像の更新日、図面画像を作成した担当者の名前、図面画像を作成した案件の名称等を示すテキストを含んでいてもよい。また、出力される図面画像の属性情報は、対象物及び/又は対象物を構成する構成要素の寸法、材質及び/又は重量などを含んでいてもよい。
画像解析装置100は、類似画像検索部1、画像対応検出部2、属性出力部3、及び、知識データベース4を備える。知識データベース4には、図面画像、及び、図面画像の属性を示す属性情報を含む知識データが記憶されている。なお、知識データベース4は、画像解析装置100に含まれていても良いし、外付けであってもよい。
図2は、外部から入力された図面画像の一例を示す図である。
G1は、外部から入力された図面画像(入力画像の一例)である。図面画像は、機械や配置物などの対象物及び/又は対象物を構成する構成要素の形状、構造、配置などを示す。また、図面画像は、プラント、工場又は店舗を対象物とし、当該対象物における設備、機械などの配置を示してもよい。本実施の形態においては、エレベータの設計図面を図面画像として説明する。また、本実施の形態においては、エレベータを対象物とし、エレベータを構成する昇降路、かご、ガイドレール、制御盤及び/又は梯子装置を構成要素として説明する。また、本実施の形態においては、図面画像に示された対象物及び/又は対象物を構成する全ての構成要素に対して属性情報が対応づけられていないものとするが、対象物及び/又は対象物を構成する一部の構成要素に対して属性情報が対応づけられていてもよい。ここでいう「対応づけ」とは、少なくとも、図面画像に示された対象物及び/又は対象物を構成する構成要素と、属性情報との対応が一意に示されていればよい。具体的には、図面画像に示された対象物及び/又は対象物を構成する構成要素から引き出し線を用いて属性情報を表示する態様であってもよい。
G1は、外部から入力された図面画像(入力画像の一例)である。図面画像は、機械や配置物などの対象物及び/又は対象物を構成する構成要素の形状、構造、配置などを示す。また、図面画像は、プラント、工場又は店舗を対象物とし、当該対象物における設備、機械などの配置を示してもよい。本実施の形態においては、エレベータの設計図面を図面画像として説明する。また、本実施の形態においては、エレベータを対象物とし、エレベータを構成する昇降路、かご、ガイドレール、制御盤及び/又は梯子装置を構成要素として説明する。また、本実施の形態においては、図面画像に示された対象物及び/又は対象物を構成する全ての構成要素に対して属性情報が対応づけられていないものとするが、対象物及び/又は対象物を構成する一部の構成要素に対して属性情報が対応づけられていてもよい。ここでいう「対応づけ」とは、少なくとも、図面画像に示された対象物及び/又は対象物を構成する構成要素と、属性情報との対応が一意に示されていればよい。具体的には、図面画像に示された対象物及び/又は対象物を構成する構成要素から引き出し線を用いて属性情報を表示する態様であってもよい。
図3は、知識データベース4に記憶された図面画像の一例を示す図である。
G2、G3は、知識データベース4に記憶された図面画像である。G21~G24は、図面画像G2に示された構成要素である。また、G31~G34は、図面画像G3に示された構成要素である。ここで、構成要素G21、G31には、属性情報として「昇降路」が対応づけられているものとする。構成要素G22、G32には、属性情報として「かご」が対応づけられているものとする。構成要素G23、G33には、属性情報として「ガイドレール」が対応づけられているものとする。構成要素G24には、属性情報として「制御盤」が対応づけられているものとするである。構成要素G34には、属性情報として「梯子装置」が対応づけられているものとする。本実施の形態では、図面画像中の全ての構成要素に対して属性情報が対応づけられているものとするが、一部の構成要素に対して属性情報が対応づけられていてもよい。なお、知識データベース4には、対象物及び/又は対象物を構成する構成要素を示す画像と、属性情報とが対応付けて記憶されていてもよい。
G2、G3は、知識データベース4に記憶された図面画像である。G21~G24は、図面画像G2に示された構成要素である。また、G31~G34は、図面画像G3に示された構成要素である。ここで、構成要素G21、G31には、属性情報として「昇降路」が対応づけられているものとする。構成要素G22、G32には、属性情報として「かご」が対応づけられているものとする。構成要素G23、G33には、属性情報として「ガイドレール」が対応づけられているものとする。構成要素G24には、属性情報として「制御盤」が対応づけられているものとするである。構成要素G34には、属性情報として「梯子装置」が対応づけられているものとする。本実施の形態では、図面画像中の全ての構成要素に対して属性情報が対応づけられているものとするが、一部の構成要素に対して属性情報が対応づけられていてもよい。なお、知識データベース4には、対象物及び/又は対象物を構成する構成要素を示す画像と、属性情報とが対応付けて記憶されていてもよい。
図4は、類似画像検索部1の構成を示すブロック図である。
類似画像検索部1は、特徴量抽出部11、及び、検索部12を備え、入力された図面画像に類似する図面画像を知識データベース4から検索する。特徴量抽出部11は、HOG(Histograms of Oriented Gradients)や、グラフカーネルアルゴリズムを用いて入力された図面画像G1の特徴量を抽出し、抽出した特徴量を検索部12に出力する。
類似画像検索部1は、特徴量抽出部11、及び、検索部12を備え、入力された図面画像に類似する図面画像を知識データベース4から検索する。特徴量抽出部11は、HOG(Histograms of Oriented Gradients)や、グラフカーネルアルゴリズムを用いて入力された図面画像G1の特徴量を抽出し、抽出した特徴量を検索部12に出力する。
図5は、図面画像の特徴量を抽出する例を説明する図である。
特徴量抽出部11は、図面画像に示された対象物及び/又は対象物を構成する構成要素の各頂点に識別子を付与する。特徴量抽出部11は、例えば、図5に示すように、各頂点の角度、各頂点を結ぶ線分の長さ、太さなどの特徴を示す識別子としての番号を付与してもよい。図5では、各頂点にのみ識別子を付与しているが、線分全ての画素、あるいは間引いた画素に対してノードを生成し、当該ノードに識別子を付与してもよい。なお、多くの画素に識別子を付与した方が、構成要素の特徴を特定する精度を向上させることができるが、後続の処理の負荷が増加するため、ハードウェアのリソースなどに応じて決定されればよい。
特徴量抽出部11は、図面画像に示された対象物及び/又は対象物を構成する構成要素の各頂点に識別子を付与する。特徴量抽出部11は、例えば、図5に示すように、各頂点の角度、各頂点を結ぶ線分の長さ、太さなどの特徴を示す識別子としての番号を付与してもよい。図5では、各頂点にのみ識別子を付与しているが、線分全ての画素、あるいは間引いた画素に対してノードを生成し、当該ノードに識別子を付与してもよい。なお、多くの画素に識別子を付与した方が、構成要素の特徴を特定する精度を向上させることができるが、後続の処理の負荷が増加するため、ハードウェアのリソースなどに応じて決定されればよい。
図4の説明に戻る。検索部12は、図面画像G1から抽出した特徴量と、知識データベース4に記憶された図面画像から抽出した特徴量の類似度を算出する。検索部12は、知識データベース4に記憶された図面画像を類似度でソートし、類似度の高い図面画像から順に画像対応検出部2へと出力する。本実施の形態において、検索部12は、類似度の高い図面画像として、図3における、G2を画像対応検出部2に出力したものとする。なお、知識データベース4に記憶された図面画像から抽出した特徴量は、知識データに予め含まれていてもよいし、特徴量抽出部11で逐次抽出してもよい。
ところで、検索部12は、図面画像G1の特徴量がベクトル化されている場合には、例えば、式(1)のようにコサイン類似度を用いて類似度を求め、類似度の高い図面画像から順に画像対応検出部2へと出力してもよい。
式(1):S=(f×g)/(|f||g|)
Sは類似度、fは図面画像G1から得られた特徴量、gは知識データに含まれた図面画像の特徴量を示す。
式(1):S=(f×g)/(|f||g|)
Sは類似度、fは図面画像G1から得られた特徴量、gは知識データに含まれた図面画像の特徴量を示す。
また、特徴量抽出部11において、グラフカーネルアルゴリズムを用いて特徴量が抽出された場合には、検索部12は、例えば、非特許文献1のような分析推定アルゴリズムを用いて類似度を算出してもよい。非特許文献1:N. Shervashidze et al., “Weisfeiler-Lehman Graph Kernels,”JMLR, vol. 12, pp.2539-2561, 2011.
図6は、画像対応検出部2の構成を示すブロック図である。
画像対応検出部2は、特徴点抽出部21と、対応点マッチング部22とを備え、類似画像検索部1で検索された図面画像の特徴点と、入力された図面画像の特徴点とを対応付け、図面画像の特徴点を対応点として検出する。
画像対応検出部2は、特徴点抽出部21と、対応点マッチング部22とを備え、類似画像検索部1で検索された図面画像の特徴点と、入力された図面画像の特徴点とを対応付け、図面画像の特徴点を対応点として検出する。
特徴点抽出部21は、例えば、HOGのような局所特徴量を用いて、図面画像G1に示された対象物及び/又は対象物を構成する構成要素の特徴点を抽出する。特徴点抽出部21は、対象物及び/又は対象物を構成する構成要素を構成する頂点を特徴点として抽出する。さらに、特徴点抽出部21は、対象物及び/又は対象物を構成する構成要素を構成する分岐点及び/又は端点を特徴点として抽出してもよい。特徴点抽出部21は、抽出した特徴点を示す情報を、対応点マッチング部22に出力する。
図7は、図面画像の特徴点を示す図である。
図7(1)には、図面画像G1の特徴点として、G14A~G14D、G12D、G11Dが示されている。また、図7(2)には、図面画像G2の構成要素G24の特徴点としてG24A~G24Dが示されている。また、図面画像G2の構成要素G22の特徴点としてG22D、構成要素G21の特徴点としてG21Dが示されている。
図7(1)には、図面画像G1の特徴点として、G14A~G14D、G12D、G11Dが示されている。また、図7(2)には、図面画像G2の構成要素G24の特徴点としてG24A~G24Dが示されている。また、図面画像G2の構成要素G22の特徴点としてG22D、構成要素G21の特徴点としてG21Dが示されている。
対応点マッチング部22は、類似画像検索部1で検索された図面画像G2の特徴点と、特徴点抽出部21で抽出した図面画像G1の特徴点の距離を算出し、当該距離が近い図面画像の特徴点を対応点として検出する。また、対応点マッチング部22は、検出した対応点を示す情報を属性出力部3へと出力する。
対応点マッチング部22は、特徴点間の距離を、例えば、式(2)に基づいて算出する。
式(2):d=||f-g||2
dは特徴点間の距離、fは図面画像G1の特徴点の特徴量、gは図面画像G2の特徴点の特徴量を示す。なお、特徴点の特徴量は、特徴量抽出部11で抽出した特徴量を用いてもよい。また、図面画像G2の特徴点の特徴量は、知識データベース4に予め記憶されていてもよい。
式(2):d=||f-g||2
dは特徴点間の距離、fは図面画像G1の特徴点の特徴量、gは図面画像G2の特徴点の特徴量を示す。なお、特徴点の特徴量は、特徴量抽出部11で抽出した特徴量を用いてもよい。また、図面画像G2の特徴点の特徴量は、知識データベース4に予め記憶されていてもよい。
本実施形態において、対応点マッチング部22は、特徴点G14Aの対応点としてG24A、特徴点G14Bの対応点としてG24B、特徴点G14Cの対応点としてG24C、及び、特徴点G14Dの対応点としてG24Dを検出し、検出した対応点G24A、G24B、G24C、G24Dを示す情報を属性出力部3へと出力する。
属性出力部3は、画像対応検出部2で検出された対応点に対応する属性情報を知識データベース4から抽出し、図面画像G1の属性情報として出力する。具体的には、属性出力部3は、画像対応検出部2の対応点マッチング部22から出力された対応点G24A、G24B、G24C、G24Dに対応する対象物及び/又は対象物を構成する構成要素として、図面画像G2の構成要素G24を特定する。また、属性出力部3は、図面画像G2の構成要素G24の属性情報(制御装置)を知識データベース4から抽出する。そして、属性出力部3は、特徴点G14A、G14B、G14C、G14Dで示される図面画像G1の構成要素G14の属性情報として、知識データベース4から抽出した「制御装置」を出力する。
ところで、画像解析装置100は、図示せぬ、知識データ更新部を備えていてもよい。知識データ更新部は、属性出力部3で出力した属性情報と、図面画像の対象物及び/又は対象物を構成する構成要素とを対応づけた知識データを知識データベース4に記憶させてもよい。
図8は、類似画像検索部1の動作を示すフローチャートである。
類似画像検索部1の特徴量抽出部11は、入力された図面画像G1の特徴量を抽出する(ST11)。
類似画像検索部1の特徴量抽出部11は、入力された図面画像G1の特徴量を抽出する(ST11)。
類似画像検索部1の検索部12は、知識データベース4に記憶された図面画像の特徴量を抽出する(ST12)。また、検索部12は、ST11で抽出した図面画像G1の特徴量と、ST12で抽出した図面画像の特徴量に基づいて、類似度を算出する(ST13)。
検索部12は、類似度が算出されていない図面画像が知識データベース4に存在しなくなるまでST12,ST13を繰り返す(ST14)。
検索部12は、知識データベース4に記憶された図面画像を類似度でソートし、類似度の高い図面画像から順に画像対応検出部2へと出力する(ST15)。
図9は、画像対応検出部2の動作を示すフローチャートである。
画像対応検出部2の特徴点抽出部21は、入力された図面画像G1から特徴点を抽出する(ST21)。
画像対応検出部2の特徴点抽出部21は、入力された図面画像G1から特徴点を抽出する(ST21)。
画像対応検出部2の特徴点抽出部21は、類似画像検索部1で検索された図面画像G2の特徴点を抽出する(ST22)。
画像対応検出部2の対応点マッチング部22は、類似画像検索部1で検索された図面画像G2の特徴点と、入力された図面画像G1の特徴点の距離を算出する(ST23)。また、対応点マッチング部22は、距離が近い図面画像G2の特徴点を対応点として検出し、検出した対応点を示す情報を属性出力部3へと出力する(ST24)。
図10は、画像解析装置100を構成するハードウェアの一例を示す図である。
画像入力部101は、外部から画像データを画像解析装置100に入力するインターフェースである。画像入力部101は、例えば、スキャナ、カメラであり、印刷物の印刷画像を読み取り、デジタルの画像データを画像解析装置100に入力する。プロセッサ102は、メモリ103に格納されたプログラムを実行することにより、図1に示す、類似画像検索部1、画像対応検出部2及び属性出力部3という各機能を実現する。メモリ103は、例えば、不揮発性のメモリであり、プロセッサ102に実行される各種プログラムを記憶する。また、プロセッサ102とメモリ103は、例えば、処理回路といった、ハードウェアで実現されてもよい。記憶部104は、プロセッサ102で処理される各種データ(知識データやプログラムなど)を記憶する。表示部105は、例えば、液晶ディスプレイであり、プロセッサ102から出力された属性情報などを表示する。なお、記憶部104及び/又は表示部105は、画像解析装置100に含まれていても良いし、外付けであってもよい。
画像入力部101は、外部から画像データを画像解析装置100に入力するインターフェースである。画像入力部101は、例えば、スキャナ、カメラであり、印刷物の印刷画像を読み取り、デジタルの画像データを画像解析装置100に入力する。プロセッサ102は、メモリ103に格納されたプログラムを実行することにより、図1に示す、類似画像検索部1、画像対応検出部2及び属性出力部3という各機能を実現する。メモリ103は、例えば、不揮発性のメモリであり、プロセッサ102に実行される各種プログラムを記憶する。また、プロセッサ102とメモリ103は、例えば、処理回路といった、ハードウェアで実現されてもよい。記憶部104は、プロセッサ102で処理される各種データ(知識データやプログラムなど)を記憶する。表示部105は、例えば、液晶ディスプレイであり、プロセッサ102から出力された属性情報などを表示する。なお、記憶部104及び/又は表示部105は、画像解析装置100に含まれていても良いし、外付けであってもよい。
以上のように本実施の形態によれば、画像解析装置100は、知識データベース4に記憶された図面画像及び図面画像の属性を示す属性情報に基づいて、新たに入力された入力画像に対して付与する属性情報を出力することができる。従って、これによって、入力画像に示された対象物及び/又は対象物を構成する構成要素に対する属性情報の付与を支援することが可能となる。
実施の形態2.
実施の形態2では、画像解析装置100は、画像解析装置100の処理の負荷を抑制しつつ、図面画像に示された構成要素の属性情報を高精度で出力するために、外部から図面画像だけでなく、図面画像の属性情報に関連したテキストが入力されてもよい。
実施の形態2では、画像解析装置100は、画像解析装置100の処理の負荷を抑制しつつ、図面画像に示された構成要素の属性情報を高精度で出力するために、外部から図面画像だけでなく、図面画像の属性情報に関連したテキストが入力されてもよい。
図11は、実施形態2に係る画像解析装置の構成を示すブロック図である。
画像解析装置100aは、類似画像検索部1aと、画像対応検出部2と、属性出力部3と、知識データベース4とを備える。画像対応検出部2及び属性出力部3は、実施の形態1と同一であるため説明は省略する。
画像解析装置100aは、類似画像検索部1aと、画像対応検出部2と、属性出力部3と、知識データベース4とを備える。画像対応検出部2及び属性出力部3は、実施の形態1と同一であるため説明は省略する。
図12は、実施形態2に係る類似画像検索部の構成を示すブロック図である。
類似画像検索部1aは、特徴量抽出部11、検索部12a、及び、テキスト受付部13を備える。テキスト受付部13は、外部からテキストの入力を受け付け、受け付けたテキストを検索部12aに出力する。ここで、テキスト受付部13は、受け付けたテキストをそのまま検索部12aに出力せずに、周知の形態素解析技術を用いることで、受け付けたテキストが意味を持つ最小限の単位に分解し、分解された単位で、検索部12aに出力してもよい。また、テキスト受付部13は、受け付けたテキストをそのまま検索部12aに出力せずに、シソーラス(類語辞典)から類似の意味を有する単語を抽出して、検索部12aに出力してもよい。これにより、検索部12aは、入力されたテキストそのものの表記だけでなく、様々なバリエーションの表記で検索可能となり、より適切な属性情報に対応づけられた図面画像を検索可能となる。例えば、テキスト受付部13は、外部から入力されたテキストに「昇降機ドア」と記載されている場合、「昇降機」と「ドア」に分解し、「昇降機」、「昇降機」の類義語としての「エレベータ」、「ドア」及び「ドア」の類義語としての「扉」を検索部12aに出力する。
類似画像検索部1aは、特徴量抽出部11、検索部12a、及び、テキスト受付部13を備える。テキスト受付部13は、外部からテキストの入力を受け付け、受け付けたテキストを検索部12aに出力する。ここで、テキスト受付部13は、受け付けたテキストをそのまま検索部12aに出力せずに、周知の形態素解析技術を用いることで、受け付けたテキストが意味を持つ最小限の単位に分解し、分解された単位で、検索部12aに出力してもよい。また、テキスト受付部13は、受け付けたテキストをそのまま検索部12aに出力せずに、シソーラス(類語辞典)から類似の意味を有する単語を抽出して、検索部12aに出力してもよい。これにより、検索部12aは、入力されたテキストそのものの表記だけでなく、様々なバリエーションの表記で検索可能となり、より適切な属性情報に対応づけられた図面画像を検索可能となる。例えば、テキスト受付部13は、外部から入力されたテキストに「昇降機ドア」と記載されている場合、「昇降機」と「ドア」に分解し、「昇降機」、「昇降機」の類義語としての「エレベータ」、「ドア」及び「ドア」の類義語としての「扉」を検索部12aに出力する。
外部から入力されたテキストに「エレベータ」と記載されている場合、検索部12a、テキスト「エレベータ」に関連した属性情報の図面画像であって、入力された図面画像G1に類似した図面画像を知識データベース4から検索する。このように、類似画像検索部1aは、知識データベース4から検索される図面画像を、入力されたテキストを用いて絞り込むことで、画像解析装置100の処理の負荷を抑制しつつ、図面画像に示された構成要素の属性情報を高精度で出力することができる。
その他の変形例
上述した実施例は本開示の実施の一例に過ぎず、以下のような構成を追加/変更した応用例が考えられる。
上述した実施例は本開示の実施の一例に過ぎず、以下のような構成を追加/変更した応用例が考えられる。
上述した実施形態において、類似画像検索部1の検索部12は、知識データベース4に記憶された図面画像を類似度でソートし、類似度の高い図面画像から順に画像対応検出部2へと出力した。しかしながら、検索部12は、これに限らず、類似度が閾値以上の図面画像を画像対応検出部2へと出力してもよい。例えば、類似度の範囲を0から100の数値で表し、数値が大きいほど類似しているものとする。そして、類似と判定するための閾値を予め設定しておく。検索部12は、知識データベース4に記憶された図面画像を類似度の高い順にソートし、予め設定された閾値以上の類似度の図面画像を検索し、検索した図面画像を画像対応検出部2に出力してもよい。そして、画像対応検出部2は、類似画像検索部1から出力された全ての図面画像の特徴点と、入力画像の特徴点の距離を算出し、当該距離が近い図面画像の特徴点を対応点として検出してもよい。
さらに、検索部12は、図面画像G1に示された構成要素の数が多くなるにつれて、閾値が低くなるように設定してもよい。このようにすることで、図面画像G1に示された構成要素に対応する構成要素を含む図面画像が知識データベース4から検索されやすくすることができる。また、検索部12は、閾値に代えて、類似度の高い順に予め設定された数の図面画像を画像対応検出部2に出力してもよい。また、この場合にも、検索部12は、図面画像G1に示された構成要素の数が多くなるにつれて、画像対応検出部2に出力される図面画像の数が多くなるように設定してもよい。このようにすることで、図面画像G1に示された構成要素に対応する構成要素を含む図面画像が知識データベース4から検索されやすくすることができる。
上述した実施形態において、図面画像G1の構成要素G14と同一又は類似の形状を有する構成要素G24の属性情報に基づいて、構成要素G14の属性情報を出力した。しかしながら、これに限らず、画像対応検出部2は、同一又は類似の形状を有する構成要素に限らず、特徴量の距離が近い特徴点を有する構成要素の属性情報を出力すればよい。
1 類似画像検索部,11 特徴量抽出部,12 検索部, 2 画像対応検出部,21 特徴点抽出部,22 対応点マッチング部, 3 属性出力部, 4 知識データベース, 100 画像解析装置, 101 画像入力部,102 プロセッサ,103 メモリ,104 記憶部,105 表示部
Claims (7)
- 入力された入力画像の属性情報を出力する画像解析装置であって、
図面画像、当該図面画像の属性を示す属性情報を含む知識データベースから、入力された入力画像に類似する図面画像を検索する類似画像検索部と、
前記類似画像検索部で検索された図面画像の特徴点と前記入力画像の特徴点とを対応付け、当該図面画像の特徴点を対応点として検出する画像対応検出部と、
前記画像対応検出部により検出された対応点に対応する属性情報を前記知識データベースから抽出し、前記入力画像の属性情報として出力する属性出力部と
を備えることを特徴とする画像解析装置。 - 前記画像対応検出部は、
前記類似画像検索部で検索された図面画像の特徴点と、前記入力画像の特徴点との距離を算出し、当該距離が近い図面画像の特徴点を対応点として検出する
ことを特徴とする請求項1に記載された画像解析装置。 - 前記画像対応検出部は、
前記入力画像に示された対象物及び/又は当該対象物を構成する構成要素の頂点及び/又は分岐点を特徴点とする
ことを特徴とする請求項1又は2に記載された画像解析装置。 - 前記類似画像検索部は、
前記入力画像を構成する頂点の角度及び/又は頂点と頂点とを結ぶ線分の長さに基づいて抽出した特徴量に類似する図面画像を検索する
ことを特徴とする請求項1~3のいずれかに記載された画像解析装置。 - 前記入力画像は当該入力画像の属性情報に関連したテキストと共に入力され、
前記類似画像検索部は、
前記テキストに関連した属性情報の図面画像であって、前記入力画像に類似した図面画像を前記知識データベースから検索する
ことを特徴とする請求項1~4のいずれかに記載された画像解析装置。 - コンピュータを、
図面画像、当該図面画像の属性を示す属性情報を含む知識データベースから、入力された入力画像に類似する図面画像を検索する類似画像検索部と、
前記類似画像検索部で検索された図面画像の特徴点と、前記入力画像の特徴点の距離を算出し、当該距離が近い図面画像の特徴点を対応点として検出する画像対応検出部と、
前記画像対応検出部により検出された対応点に対応する属性情報を前記知識データベースから抽出し、前記入力画像の属性情報として出力する属性出力部と
して機能させるための画像解析プログラム。 - 入力された入力画像の属性情報を出力する画像解析方法であって、
類似画像検索部が、図面画像、当該図面画像の属性を示す属性情報を含む知識データベースから、入力された入力画像に類似する図面画像を検索し、
画像対応検出部が、前記類似画像検索部で検索された図面画像の特徴点と、前記入力画像の特徴点とを対応付け、当該図面画像の特徴点を対応点として検出し、
属性出力部が、前記画像対応検出部により検出された対応点に対応する属性情報を前記知識データベースから抽出し、前記入力画像の属性情報として出力する
ことを特徴とする画像解析方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/004551 WO2021157009A1 (ja) | 2020-02-06 | 2020-02-06 | 画像解析装置、画像解析方法及び画像解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021157009A1 JPWO2021157009A1 (ja) | 2021-08-12 |
JP7004125B2 true JP7004125B2 (ja) | 2022-01-21 |
Family
ID=77199490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021559415A Active JP7004125B2 (ja) | 2020-02-06 | 2020-02-06 | 画像解析装置、画像解析方法及び画像解析プログラム |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220335741A1 (ja) |
JP (1) | JP7004125B2 (ja) |
KR (1) | KR20220112853A (ja) |
CN (1) | CN115004221A (ja) |
DE (1) | DE112020005885T5 (ja) |
TW (1) | TWI794605B (ja) |
WO (1) | WO2021157009A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016021101A (ja) | 2014-07-14 | 2016-02-04 | 株式会社日立製作所 | 設計変更管理支援装置、及び方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH087754B2 (ja) * | 1990-10-26 | 1996-01-29 | 三菱電機株式会社 | 図面検索方式 |
JP2906826B2 (ja) | 1992-05-13 | 1999-06-21 | 三菱電機株式会社 | 設備管理システム |
JP4044971B2 (ja) * | 1994-03-17 | 2008-02-06 | 株式会社日立製作所 | イメージ情報を用いた検索方法 |
JP2008046823A (ja) * | 2006-08-14 | 2008-02-28 | Oki Electric Ind Co Ltd | 画像解釈装置、画像解釈方法、及びプログラム |
CN104408161A (zh) * | 2014-12-08 | 2015-03-11 | 周理 | 基于相似度查询的模具cad图纸查询与管理方法 |
CN110399509A (zh) * | 2019-06-10 | 2019-11-01 | 万翼科技有限公司 | 一种智能识图系统及方法 |
-
2020
- 2020-02-06 KR KR1020227025734A patent/KR20220112853A/ko not_active Application Discontinuation
- 2020-02-06 JP JP2021559415A patent/JP7004125B2/ja active Active
- 2020-02-06 DE DE112020005885.9T patent/DE112020005885T5/de active Pending
- 2020-02-06 WO PCT/JP2020/004551 patent/WO2021157009A1/ja active Application Filing
- 2020-02-06 CN CN202080094621.4A patent/CN115004221A/zh active Pending
- 2020-05-07 TW TW109115180A patent/TWI794605B/zh active
-
2022
- 2022-07-05 US US17/857,802 patent/US20220335741A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016021101A (ja) | 2014-07-14 | 2016-02-04 | 株式会社日立製作所 | 設計変更管理支援装置、及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021157009A1 (ja) | 2021-08-12 |
CN115004221A (zh) | 2022-09-02 |
TW202131223A (zh) | 2021-08-16 |
KR20220112853A (ko) | 2022-08-11 |
TWI794605B (zh) | 2023-03-01 |
US20220335741A1 (en) | 2022-10-20 |
WO2021157009A1 (ja) | 2021-08-12 |
DE112020005885T5 (de) | 2022-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111986178B (zh) | 产品缺陷检测方法、装置、电子设备和存储介质 | |
JP2993673B2 (ja) | 電子ファイル装置 | |
CN113361578B (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
CN111079638A (zh) | 基于卷积神经网络的目标检测模型训练方法、设备和介质 | |
CN111611990B (zh) | 用于识别图像中表格的方法和装置 | |
JP4997892B2 (ja) | 検索システム、検索方法及び検索プログラム | |
EP3916355A1 (en) | Method and apparatus for indoor localization, electronic device, storage medium and computer program | |
CN113780098A (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
CN114495147B (zh) | 识别方法、装置、设备以及存储介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN116205889A (zh) | 偏移检测方法、装置、电子设备及存储介质 | |
CN116844177A (zh) | 一种表格识别方法、装置、设备及存储介质 | |
JP7004125B2 (ja) | 画像解析装置、画像解析方法及び画像解析プログラム | |
CN112784102A (zh) | 视频检索方法、装置和电子设备 | |
KR20120075626A (ko) | 웹 기반 서비스에서의 전자해도 처리 장치 및 방법 | |
CN115439700B (zh) | 一种图像处理方法、装置和机器可读存储介质 | |
CN111177387A (zh) | 用户名单信息处理方法、电子装置及计算机可读存储介质 | |
CN116453222A (zh) | 目标对象姿态确定方法、训练方法、装置以及存储介质 | |
CN111507265B (zh) | 表格关键点检测模型训练方法、装置、设备以及存储介质 | |
CN114972910A (zh) | 图文识别模型的训练方法、装置、电子设备及存储介质 | |
CN114225420A (zh) | 动作数据获取方法、系统、装置、设备和存储介质 | |
CN114241496A (zh) | 用于阅读任务的预训练模型训练方法、装置及其电子设备 | |
CN111583417A (zh) | 一种图像语义和场景几何联合约束的室内vr场景构建的方法、装置、电子设备和介质 | |
CN110704153A (zh) | 界面逻辑解析方法、装置、设备及可读存储介质 | |
US10891332B2 (en) | Instrumentation diagram data generation device, instrumentation diagram search system, and computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211007 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20211007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211213 |