JP5791115B2 - 画像領域分割装置、その方法及びプログラム - Google Patents
画像領域分割装置、その方法及びプログラム Download PDFInfo
- Publication number
- JP5791115B2 JP5791115B2 JP2012150459A JP2012150459A JP5791115B2 JP 5791115 B2 JP5791115 B2 JP 5791115B2 JP 2012150459 A JP2012150459 A JP 2012150459A JP 2012150459 A JP2012150459 A JP 2012150459A JP 5791115 B2 JP5791115 B2 JP 5791115B2
- Authority
- JP
- Japan
- Prior art keywords
- constraint
- image
- data
- rule
- rectangle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
画像マスクツールは、指定された複数の画像データファイルに対して、所定の部分領域を黒色で塗りつぶすなどのマスク処理を施し、変換後のファイルとして出力するアプリケーションプログラム(以下、単にアプリケーション)である。処理対象ファイルの指定、マスクする領域の指定などを対話的に行うアプリケーションも考えられるが、ここでは大量の画像ファイル、多種類の画像内容を扱う最も単純な形態としてバッチツールを想定する。
<画像パターン認識についての従来技術>
〈画像マッチングを使う方法のメリットと課題〉
マスクすべき領域の近傍の画像断片を位置計算のための情報として指定しておき、画像マスクツールの実行時に画像テンプレートマッチングアルゴリズムを使用して、ウィンドウ領域内の相対位置の座標を調整する方法がある。マスク領域の特定に、この画像テンプレートマッチングを応用する方法が容易に創出可能である。
文字領域抽出に制約充足を用いた従来の方法として、非特許文献1に記載の方法がある。当該方法では「文字配置特徴として、文字の近接性、サイズの一致、文字配置の直線性、文字の等間隔配置等が挙げられる。本手法では、これらの特徴の参照を制約充足問題としてとらえ、各特徴を反映した関数を用い」ており、多項式時間では解き難い問題に対して良く用いられる近傍探索法の一般化手法であるシミュレーテッドアニーリング法を用いている。しかしながら、当該文献においては15要素程度のレイアウトを処理する事例に対しても、多くの計算時間を要するとだけ述べられており、その具体的評価は行われていない。本発明の技術分野で実際に扱う規模のレイアウトを対象とした場合、想定するようなツールとして成立しない程度に計算時間が増大することが課題である。
〈サイズ可変に対する容易に創出可能な方法〉
テンプレートマッチングによる方法の課題の1つは、特定したい操作対象のサイズが可変であると、ウィンドウのリサイズに従って矩形領域が変化してしまう場合に対応できないという課題である。
認識させたい領域が、表の内部のセルのように、表示内容が実行時ごとに変わる場合は、水平方向の位置をカラムヘッダのセルの画像断片のマッチングによって得て、その位置を基準として垂直方向の位置をカラムヘッダからの相対位置の座標によって得ることにより、2つの位置を総合して目的とするセルの位置を得る方法が容易に創出可能である。
識別させたいウィンドウが占める領域のサイズやそこに表示される情報の種類や量によって内部レイアウトが変わる場合は、それによって影響を受けないウィンドウ画像内部に存在する特徴的な画像断片の存在有無を基に、マスク対象のウィンドウを識別する方法が容易に創出可能である。しかしながら、本来、異なる個体あるいは異なる種類として認識させたいウィンドウが、たまたま同じ画像断片を含んでいた場合にそれを誤認する可能性がある。これに対しては、複数の異なる画像断片の相対的な位置関係を含めた組み合わせによって指定する方法も容易に創出可能である。
この課題を具体的かつ詳細に分析すると、大きく3つのレベルに分けられる。
従来の技術では、上記で挙げた変化に対しては適用対象アプリケーションのGUIレイアウトの仕様に依存した処理が個々に必要であり、共通化する方法は提供されていないという課題があった。
上記課題に対する望ましいアプローチとしては、設定パラメータやルールベースの処理エンジンを実現することが考えられる。しかし、一般的に言えることとして、このようなアプローチをとろうとすると、設定やルールの形式が多様になる傾向がある。
上記課題に対する望ましいアプローチとしては、特定や識別のためのルールを定義(作成・編集)する場合に、様々な入力画像の様々な相対位置変化に対して、本来意図した結果を得られるように複雑なルール形式を採用することが考えられる。しかし、一般的に言えることとして、このようなアプローチをとろうとすると、ルールの入力方法の習得が必要になるため、使用できるユーザが限定されてしまう課題があった。
本発明は、
画像データを入力とし、予め指定された画像領域分割ルールデータを参照することによって当該画像データを領域分割し、その領域分割した分割矩形データを出力する画像領域分割装置であって、
ユーザの操作に基づきルールエディタによって作成・編集され、又は外部のモジュールによって自動的に生成された画像領域分割ルールデータを蓄積する画像領域分割ルールデータベースと、与えられた制約充足問題に対応する充足解を探索する制約ソルバと、画像領域分割エンジンとを少なくとも備え、
前記画像領域分割エンジンは、
画像領域分割処理の開始命令が、上位装置から自動的に発行されたのを契機に、あるいは上位装置を通してユーザから明示的に指示されたのを契機に処理を開始し、
入力された分割対象画像データを上位装置から受け取り、当該分割対象画像データに対応する画像領域分割ルールデータを画像領域分割ルールデータベースから取り出し、当該画像領域分割ルールデータを制約モデルデータに変換し、当該制約モデルデータを制約充足問題として制約ソルバに渡して充足解の探索を命令し、
制約ソルバの探索終了を待機し、探索終了を契機に制約ソルバから返却された前記制約モデルデータに対応する充足解データを画像領域の分割矩形データに変換し、これを上位装置に返却し、もしくは上位装置を通してユーザに提示する、
ことを特徴とする。
本発明は、
上記画像領域分割処理装置の画像領域分割エンジンにおいて、
分割矩形とレイヤと画像断片とからなる画像領域分割ルールデータを参照し、当該画像領域分割ルールデータを基に制約モデルデータを生成するに際し、
分割矩形同士の相対的な位置関係を指定する目的で、各分割矩形の初期座標値の大小関係を維持する幾何制約データを生成し、
分割矩形同士の位置関係の指定の有効範囲を指定する目的で、各分割矩形の帰属レイヤの関連を基に上記幾何制約データを所定の範囲で選択的に生成し、
分割矩形の推奨位置からのずれ、推奨サイズからのずれのそれぞれについて、その推奨値と有効無効の属性を表すフラグ値を基に、ずれの量を解の評価値に反映させる幾何制約データを選択的に生成し、
分割矩形の入力画像内での位置をテンプレートマッチで決定する目的で、当該分割矩形をテンプレートマッチ対象とするか否かの属性を表すフラグ値とマッチで用いる画像断片を基に、選択的に実際のマッチ処理を行って得られた位置を、当該分割矩形の位置と一致させる幾何制約データを生成する、
ことを特徴とする。
本発明は、前記に加え、
ユーザからの操作に従って画像領域分割ルールデータを作成・編集するルールエディタを具備し、
当該ルールエディタは、
分割ルールデータを作成・編集する目的で図形エディタを模したウィンドウを具備し、
当該ウィンドウ上で分割矩形を図形として可視化表示し、当該図形に対してマウスによる作成・編集の操作の手段を提供し、
図形の選択操作によって当該図形の属性値を表示・変更するパネルを具備し、
図形とそれが帰属するレイヤとの関係を表示・変更するパネルを具備する、
ことを特徴とする。
本発明では、テンプレートマッチングの画像断片や、矩形領域の間の相対位置関係を、画像領域分割ルールデータの形式で画像領域分割エンジンに与えることで、画像領域分割パターンごとにハードコーディングするのではなく、多様な適用画像、多様な利用目的に低コストで対応することで、処理の共通化が可能となる。また、画像領域分割の結果は、マスクしたい領域の特定やマスクパターン種別の判定の両方に共通に利用できる。対応する実施例は以下である。
本実施例では、画像データ以外の付加的な情報、例えば特定のGUI要素の座標位置やサイズ、キャプション文字列などの属性値を必要としないため、画像マスクツールにおける入力画像に対して、時間的に後の時点で、マスクしたい領域やマスクパターンを任意に変えて実行することができる。即ち、対象のGUIレイアウトや目的とするマスクパターンが変化しても、ルールの追加や差し替えによりハードコーディング無しに対応可能となっている。
〈画像領域分割データのシンプルな形式により単純な処理で複雑な分割指定に対応〉
本発明では、画像領域分割データの形式を、分割矩形とその属性とレイヤとからなるシンプルな基本構成とし、その形式上で制約充足問題における幾何制約を記述可能とし、なおかつ画像領域分割エンジンの機能について画像領域分割データを制約モデルデータに変換する単純な処理とすることで、単純なデータ形式と処理実装で複雑な分割のしかたを処理する系を実現し、エンジンの開発コストや保守コストの低減が可能となる。対応する実施例は以下である。
(実施の形態「GUI要素(ボタン)のリサイズ対応」参照)
〈表のカラムとの相対位置関係からセルの位置・サイズを特定〉
(実施の形態「表(テーブル)の構造解析(パーシング)」参照)
〈フォームのラベル同士の相対位置関係から対象ウィンドウかどうかを判定〉
(実施の形態「帳票(フォーム)の構造解析(パーシング)」参照)
〈分割矩形とレイヤの帰属関係により識別パターンを指定〉
(実施の形態「内部要素同士の相対位置関係による識別の処理事例」参照)
以上の実施例では、GUIの画像においては多くの場合、分割すべき領域が水平辺・垂直辺で構成され、制約を及ぼし合う矩形同士は、互いに包含関係か隣接関係にある(交差関係はない)、という特性を効果的に利用することで、複雑な分割パターンを柔軟に処理可能となっている。
・制約関係を等号・不等号や和・差などの組み合わせとし、制約充足ソルバでの計算負荷を抑制するルール形式としている
・評価関数を位置・サイズの目標値と調整結果とのずれ幅の長さの単純な重み付き総和とし、制約充足ソルバでの計算負荷を抑制するルール形式としている
・探索における分岐の要因を、ずれ幅の長さ(絶対値)に対して、実際のずれ量がプラスかマイナスかに限定し、制約充足ソルバでの探索空間を抑制するルール形式としている
・制約範囲をレイヤとの関係指定、有効フラグ指定、画像断片の指定で記述し、必要な個所のみに制約を効かせる形態としている
〈一般ユーザ向けにルール定義形式を簡単化〉
本発明では、画像領域分割を行う幾何制約を、個々の線分長や点座標に関して定義するのではなく、分割矩形を単位とする位置とサイズに関して定義することにより、ユーザが考慮しなければならない制約の種類や数を少なくし、分割のパターンを1種類の図形(矩形)だけで構成される図により表現することが可能となる。対応する実施例は以下である。
本実施例では、画像領域分割データの入力方法として一般の図形エディタを模したルールエディタ機能をユーザに提供し、画像領域分割データ固有の入力方法の習得を不要にすることにより、ユーザビリティを向上し、初心者を含めた幅広いユーザが使用可能となっている。
図1は画像領域分割エンジン(以下、単に「分割エンジン」)を含む本発明の画像領域分割装置の実施の形態の機能構成を示すもので、本発明の画像領域分割装置は、分割エンジン1とともに、作業データ蓄積部2、制約ソルバ3及び上位機能制御部4を含んで構成される。
分割エンジン1の詳細な機能構成を図3に示す。分割エンジン1は、前述した制約モデル生成部11及び充足結果解釈部12とともに、制約モデル生成部11で生成された制約モデルデータを制約ソルバ3に渡し、制約ソルバ3から返却される解探索の実行結果及び/又は制約充足解データを受け取り、充足結果解釈部12へ渡す制約ソルバ制御部13を備えて構成されている。さらに、制約モデル生成部11は、画像マッチング部11aと、矩形間制約生成部11bと、矩形内制約生成部11cと、評価関数制約生成部11dからとなり、また、充足結果解釈部12は、分割成否情報生成部12aと、分割結果データ生成部12bとからなる。
X(f(0))<X(f(1))<…<X(f(2n+1))
の制約条件オブジェクト31bを生成する。ここで、X(i)の初期値はV(i)であり、ソート後のインデックスの順序が保存されるように、下記の疑似コードの要領で制約オブジェクトを生成すれば良い。
for(i=0;i<2n+1;i++){
makeconstraint "X(f(i))<X(f(i+1))"
}
但し、V(f(i))=V(f(i+1))の場合は、上記擬似コードの処理の前に予め変数X(f(i+1))を不等号制約の生成対象から除外し、代わりにX(f(i))=X(f(i+1))の制約条件オブジェクト31bを生成するものとする。
1.最大サイズのフラグが有効であれば、Xmax>X2−X1を生成(s41,s51)
2.最小サイズのフラグが有効であれば、Xmin<X2−X1を生成(s42,s52)
3.推奨サイズのフラグが有効であれば、Xpre=X2−X1−Dxppを生成(s43,s53)
4.推奨位置のフラグが有効であれば、X1=X1p−Dx1p,X2=X2p−Dx2pを生成(s44,s54)
5.当該の分割矩形が画像断片と関連付けられている場合は、X1=X1t,X2=X2tを生成(s49,s59)
について行えば良い。
Dall=Wdx1Σ|Dx1p|+Wdx2Σ|Dx2p|+WdxppΣ|Dxpp|
+Wdy1Σ|Dy1p|+Wdy2Σ|Dy2p|+WdyppΣ|Dypp|
なお、上記において重みWdx1とWdx2,Wdy1とWdy2は通常、同じ値である。また、Wdx1とWdy1は、XY方向について推奨位置の強制力が同じであれば同じ値とすれば良い。さらに、推奨サイズと推奨位置の強制力の比が同じであれば同じ値とすれば良い。以上は評価関数制約生成部11dで行われる。
〈説明上の用語定義と概念の説明〉
上記<画像領域分割エンジンの使用形態>、<「画像領域分割エンジンの内部動作>では本発明を具体的に実行する方法を説明したが、本発明の目的である画像領域の分割がこの方法の上で不足なく十分に達成されることを次に説明する。ポイントは、幾何制約条件をシンプルな種類に限定し、制約モデルデータ上の図形要素を単一に限定することによって、ユーザが求める、多様な画像領域分割の方法を制限することなく、同時に制約充足処理の負荷を効果的に低減する点である。
(X1,Y1)左上,(X1,Y2)左下,
(X2,Y2)右下,(X2,Y1)右上
のように表す。
X1:左辺のX座標上の位置
X2:右辺のX座標上の位置
Y1:上辺のY座標上の位置
Y2:下辺のY座標上の位置
ということがいえる。
X1<X2,Y1<Y2
の関係が常に成り立つものとする。
Xa<Xb
の関係が常に成り立つものとする。
1.矩形のサイズの最大最小.〈サイズ制限制約〉に対応
2.矩形のサイズの推奨値.〈サイズ推奨制約〉に対応
3.矩形の位置の推奨値(初期位置からの移動量).〈位置推奨制約〉に対応
4.矩形の位置の固定値
の調整要素が扱われる。
「4.矩形の位置の固定値」
位置―最大最小指定:
矩形同士の位置関係指定により同等の指定が可能
位置―推奨値指定:
「3.矩形の位置の推奨値」
サイズ―固定値指定:
「1.矩形のサイズの最大最小」で最大=最小の指定が可能
サイズ―最大最小指定:
「1.矩形のサイズの最大最小」
サイズ―推奨値指定:
「2.矩形のサイズの推奨値」
また、各観点、各指定カテゴリには、有効・無効の切り替えの概念があることで、ユーザの指定方法の自由度が高くなる。それぞれについては、以下に示すように漏れなく対応している。
分割矩形と画像断片の対応の有無により指定が可能
位置―最大最小指定の有効無効:
矩形同士の位置関係とレイヤの帰属関係により同等の指定が可能
位置―推奨値指定の有効無効:
位置推奨値フラグにより指定が可能
サイズ―固定値指定の有効無効:
サイズ―最大最小を最大=最小とするか否かで指定が可能
サイズ―最大最小指定の有効無効:
サイズ最大最小フラグにより指定が可能
サイズ―推奨値指定の有効無効:
サイズ推奨値フラグにより指定が可能
幾何制約で一般的に指定可能な方法については、上記を組み合わせて代用可能である。事例を以下に示す。
分割ルールデータ21は、分割矩形情報(オブジェクト)21a、分割レイヤ情報(オブジェクト)21b及び画像断片情報(オブジェクト)21cを要素とする。
・分割矩形は外形(四隅の座標位置)について初期座標を指定する、
・分割矩形は外形(四隅の座標位置)について推奨座標を指定できる、
・各推奨座標については、有効フラグが設けられ有効無効を指定する、
・分割矩形はサイズ(縦と横の寸法値)について長さの最大値、最小値、推奨値を指定できる、
・各長さの最大値、最小値、推奨値については、それぞれ有効フラグが設けられ有効無効を指定する、
という属性値を有し、ユーザが指定する。
・分割矩形情報は1つ以上の分割レイヤ情報と対応づけられる、
・分割矩形情報は0又は1つの画像断片情報と対応づけられる、
という関係を有し、ユーザが指定する。
〈ユーザの操作方法と操作画面〉
ユーザは、複数の分割矩形オブジェクトを対話的図形編集パネル上で生成して配置し、分割エンジン1に出力させたい分割の内容を指定する。このとき、編集パネルの背景に分割対象のキャプチャ画像を表示することで、実際のウィンドウの画像を基に直感的に分割矩形を配置し、指定内容を吟味することができる。ここでの配置情報は、分割矩形の外形初期値、外形推奨値として保持する。また、外形初期値と外形推奨値は後述するように実際上、別々に入力する必要性は低いので、デフォルトで同一の値として扱うことで編集を効率化・簡略化することができる。必要な場合は所定のチェックボックスをオンに設定すると、外形初期値と外形推奨値がそれぞれ異なる色の矩形で表示され、図形的に同時に閲覧できるとともに、それらに対して対話的図形編集を行うことで直感的に値を設定することができる。
分割処理を起動すると、分割エンジン1は分割ルールデータを受け取り、次の処理を行う。
・制約ライブラリ上の制約モデルオブジェクト(制約条件オブジェクトの集合)を生成する。
・上記オブジェクトに対し、分割矩形相互の相対的な位置関係の制約条件オブジェクトを生成・登録する。
・上記オブジェクトに対し、分割矩形自身の推奨される位置の制約条件オブジェクトを生成・登録する。
・上記オブジェクトに対し、分割矩形自身の推奨される最大サイズ、最小サイズ、推奨サイズの制約条件オブジェクトを生成・登録する。
・制約ライブラリ上の制約ソルバオブジェクトを生成する。
・ソルバオブジェクトに対し、制約モデルオブジェクトを登録する。
・ソルバオブジェクトの探索処理を起動し、返却を待機する。
・返却を受け取り、探索の結果として解が得られた場合は、その内容を分割矩形オブジェクトの結果値に反映し、探索結果をtrueにした上で共に返却する。得られなかった場合は、探索結果をfalseにした上で返却する。
〈制約モデルオブジェクト(制約条件オブジェクトの集合)の作成〉
分割エンジン1は、分割矩形をX方向、Y方向の各座標軸方向について、それぞれ独立に処理する。以下ではX方向について記述する。Y方向についても同様の処理が実行される。
同じレイヤに属する複数の分割矩形同士の初期値における相対位置が保存されるように、相互の位置関係制約を付与する。即ち、それぞれの四隅(矩形がN個の場合、合計4×N個の頂点)の座標値の大小関係(座標軸方向の前後関係)が保存されるように不等号制約条件オブジェクトを生成・登録する。具体的には、
Xi<Xj(但し、IXi<IXjのとき)
の関係の各制約変数に与える。
Xi=Xj(但し、IXi=IXjのとき)
の関係の各制約変数に与える。
帰属するレイヤに関係なく、全ての分割矩形はそれぞれの単位でサイズに関する制約を付与する。具体的には、それぞれの長さ(X2−X1)の最大値、最小値が制限されるように不等号制約条件オブジェクトを生成・登録する。具体的には、
Xmax>X2−X1
Xmin<X2−X1
の関係を各制約変数に与える。
帰属するレイヤに関係なく、全ての分割矩形はそれぞれ指定された推奨位置にできるだけ近くなるように、自身の位置推奨制約を付与する。具体的には、
|X1−X1p|=Dx1p
|X2−X2p|=Dx2p
の関係を各制約変数に与える。Dx1p,Dx2pは目的変数である。
帰属するレイヤに関係なく、全ての分割矩形はそれぞれの単位で指定された推奨サイズにできるだけ近くなるように、自身のサイズ推奨制約を付与する。具体的には、
|X2−X1−Xpre|=Dxpp
の関係を各制約変数に与える。Dxppは目的変数である。
後者3つ(サイズ制限、位置推奨、サイズ推奨)の各制約条件は、働かせないように指定することもできる。ユーザが各制約の有効フラグをfalseに指定した場合、上記制約条件モデル生成において該当する制約オブジェクト生成をスキップする。これにより、個々の分割矩形ごとに、サイズ制限を課さない場合、位置推奨を行わない場合、サイズ推奨を行わない場合のそれぞれを指定することができる。
以上より、分割ルールのデータ形式は以下のようになる。
・分割矩形の個数は、1以上システム上限値以下
・分割レイヤの個数は、1以上システム上限値以下
・画像断片の個数は、0以上システム上限値以下
の条件を満たす。
・分割矩形の外形(四隅の座標位置)の推奨座標の有効無効の指定は、上辺と下辺、右辺と左辺をそれぞれ同一の指定とする。即ち、X方向・Y方向の単位で指定する。
・分割矩形のX2座標の初期値はX1座標の初期値にXサイズ初期値を加えた値として換算する。Y2についても同様に換算する。
・分割矩形のX2座標の推奨値はX1座標の推奨値とXサイズ推奨値を加えた値として換算する。Y2についても同様に換算する。
上記の画像領域分割ルールを定義(作成・編集)するための、具体的なユーザの作業は、ルールエディタを起動することで開始できる。これによって、ルール表示・編集のパネルを含むウィンドウが表示される。
前記分割矩形のパラメータ編集ウィンドウとして、具体的には図8に示す、ルールエディタのGUI画面(分割矩形属性編集)が提供される。そこでは、前記で指定した分割矩形の属性の閲覧・変更や、画像断片との関連設定などができる。
前記分割矩形とレイヤとの関係は、具体的には図9のルールエディタのGUI画面(レイヤ編集)に示すウィンドウ内にリスト表示される。レイヤは下部のボタンにより、追加や削除ができる。リスト上のいずれかのレイヤを選択すると、そのレイヤと関連付けられた分割矩形が画面イメージ上、並びに分割矩形テーブル上でハイライト表示される。逆に画面イメージ上もしくは分割矩形テーブル上のいずれかの分割矩形を選択すると、その矩形と関連付けられたレイヤがレイヤリスト上でハイライト表示される。
ルールエディタ上で編集中のルールについて、属性が存在する。これら属性値を編集するウィンドウとして、具体的には図10に示すルールエディタのGUI画面(ルール属性)が提供される。ここでは、ルールを適用するウィンドウを識別するための属性として、タイトル、スタイル、クラスや、当該ウィンドウが属するプロセスのプロセス名(正確には起動プログラムファイルのパス文字列)の値を編集できる。また、ルール適用の際にどれを使用するかをチェックボックスで指定できる。
<GUI要素(ボタン)のリサイズ対応>
〈リサイズするGUI要素を扱う場合のユーザの操作方法と操作画面〉
ここでは図11に示す操作対象事例(ボタンのリサイズ)、即ちGUIの1要素であるボタンコントロールに対して、領域分割により矩形位置の特定を行う事例を考える。画像テンプレートマッチングのアルゴリズムをボタンコントロールの画像に単に適用するだけでは、予め矩形の大きさが固定的に分かっている場合にしか適用できない。
〈表を扱う場合のユーザの操作方法と操作画面〉
ここでは図13に示す操作対象事例(テーブルの構造が含まれるウィンドウ画面)、即ちウィンドウ画面上の表(テーブル)に対して画像領域分割を行い、所定のセル単位で分割矩形を対応付けることによってテーブル内容のパーシングを行う事例を考える。
本発明の技術では、図13−1に示すようにテーブルの四隅の画像断片1301,1302,1303,1304を用いて、まず全体的な位置決めを行うため、サイズや相対位置が実行時に変化しても適切に対応できる。具体的には、四隅の画像断片に外接する分割矩形1305を定義することで、テーブル全体の領域を識別することができる。より厳密には、内側にGUIレイアウトで指定された所定のマージンをとった領域を定義する必要があるが、これには図14に示すようなマージンの定義例を用いることで対応することができる。つまり、図13−4に示すように矩形1317,1318,1319,1320を定義し、さらに分割矩形1305とそれらが共通に帰属するレイヤを定義することで対応することができる。
(テーブルに関する記述と同じ内容を一部再掲)
ここでは図16に示す操作対象事例(フォームの構造が含まれるウィンドウ画面)、即ちウィンドウ画面上の帳票(フォーム)に対して画像領域分割を行い、所定のテキストフィールド単位で分割矩形を対応付けることによってフォーム内容のパーシングを行う事例を考える。
本発明の技術では、図16−1に示すようにフォームを含むウィンドウの四隅の画像断片を用いて、まず全体的な位置決めを行うため、サイズや相対位置が実行時に変化しても、適切に対応できる。具体的には、4隅の画像断片1601,1602,1603,1604に外接する分割矩形を定義し、これにGUIレイアウトで指定された所定のマージンをとった領域がフォーム全体の外接矩形に相当すれば、それを分割矩形1605として定義することで、フォーム全体の領域を識別することができる。
図18は本発明の画像領域分割装置を応用した画像マスクツールの実施の形態、ここでは表示装置5及び入力装置6を具備する一般的なPC(コンピュータ)7環境において実現した形態を示すもので、本画像マスクツールは、コンピュータ7のオペレーティングシステム8上に実装された画像マスク処理ツール100及びマスクルールエディタ200からなり、また、コンピュータ7のハードディスク9上にはマスクルールファイル310、バッチ指示ファイル320、画像ファイル(マスク前)330、実行ログファイル340、画像ファイル(マスク後)350が蓄積され、オペレータ(ユーザ)は複数の画像ファイル330を対象として画像マスクを行う場合に、本画像マスクツールを使用してバッチ指示により一括でマスク処理を行うことができる。
画像マスク処理ツール100の機能構成を図19に示す。画像マスク処理ツール100の内部には、分割エンジン110が含まれ、当該分割エンジン110とツール外部との間のデータ交換のために作業データ蓄積部120が配置され、また、その制御下に制約ソルバ130が組み合わせられている。また、データ入出力制御と内部処理制御のためにバッチ制御部140が配置され、さらにまた、バッチ制御部140とハードディスク9上の各ファイル(マスクルールファイルを除く)とのデータ交換のためにバッチ指示読み込み部151、対象画像読み込み部152、バッチ実行ログ出力部153及びマスク画像生成出力部154が設けられている。なお、分割エンジン110及び制約ソルバ130は機能的にそれぞれ、前述した本発明の画像領域分割装置の分割エンジン1及び制約ソルバ3と同一である。
マスクルールエディタ200の機能構成を図21に示す。マスクルールエディタ200の内部には、ルール表示・編集部210が含まれ、ユーザへの対話的図形エディタを模したGUIを提供する。また、エディタの外部から読み書きするデータを保持するために作業データ蓄積部220が配置され、さらにまた、データ入出力制御と内部処理制御のためにエディタ制御部230が配置されている。
1.矩形を追加・削除(s113)
2.矩形の座標位置を変更(s114)
3.レイヤを追加・削除(s115)
4.矩形のレイヤへの帰属関係を変更(s116)
5.矩形の属性値を変更(s117)
の5種類に大別される。
相対位置関係の課題(その2:内部要素同士の相対位置関係による識別)で挙げたマスクパターンの種別の特定について、実際の処理事例を説明する。図23−1〜−4に示すウィンドウ1〜4に対して、画像マスクツールを適用する場合を想定する。
11:制約モデル生成部、11a:画像マッチング部、11b:矩形間制約生成部、11c:矩形内制約生成部、11d:評価関数制約生成部、12:充足結果解釈部、12a:分割成否情報生成部、12b:分割結果データ生成部、13:制約ソルバ制御部、
21:分割ルールデータ、22:分割対象画像データ、23:分割成否データ、24:分割結果データ、
31:制約モデルデータ、32:制約充足解データ、
100:画像マスク処理ツール、110:分割エンジン、120:作業データ蓄積部、130:制約ソルバ、140:バッチ制御部、151:バッチ指示読み込み部、152:対象画像読み込み部、153:バッチ実行ログ出力部、154:マスク画像生成出力部、
200:マスクルールエディタ、210:ルール表示・編集部、220:作業データ蓄積部、230:エディタ制御部、
310:マスクルールファイル、320:バッチ指示ファイル、330:画像ファイル(マスク前)、340:実行ログファイル、350:画像ファイル(マスク後)、360:画像ファイル(サンプル)。
Claims (8)
- GUIの画像データを入力とし、予め指定された画像領域分割ルールデータを参照することによって当該画像データを領域分割し、その領域分割した分割矩形データを出力する画像領域分割装置であって、
分割矩形とレイヤとを含む画像領域分割ルールデータを蓄積する画像領域分割ルールデータベースと、与えられた制約充足問題に対応する制約充足解を探索する制約ソルバと、画像領域分割エンジンとを少なくとも備え、
前記画像領域分割エンジンは、
入力された前記画像データに対応する画像領域分割ルールデータを画像領域分割ルールデータベースから取り出し、当該画像領域分割ルールデータから前記制約ソルバに入力する制約モデルデータを生成する制約モデル生成部と、
前記制約モデルデータを制約充足問題として前記制約ソルバに渡して制約充足解の探索を命令し、前記制約ソルバから返却された前記制約モデルデータに対応する制約充足解データを受け取る制約ソルバ制御部と、
前記制約充足解データから前記分割矩形データを生成する充足結果解釈部と
を具備し、
前記制約モデル生成部は、
同じ前記レイヤに属する複数の前記分割矩形同士の初期値における相対位置が保存されるように相互の位置関係を付与する矩形間制約条件を生成する矩形間制約生成部を具備し、
前記矩形間制約条件に基づいて、前記制約モデルデータを生成することを特徴とする画像領域分割装置。 - 前記制約モデル生成部は、
前記分割矩形のそれぞれに対し、最大サイズ、最小サイズ、推奨サイズからのずれ、および推奨位置からのずれのそれぞれについて、その有効無効の属性を表すフラグ値を基に、矩形内制約条件を生成する矩形内制約生成部と、
前記矩形内制約条件に基づいて、解全体の最適度を表す目的関数の評価値としての制約変数を含む評価関数制約条件を生成する評価関数制約生成部と
をさらに具備し、
前記矩形間制約条件と、前記矩形内制約条件および前記評価関数制約条件の少なくとも一方とに基づいて、前記制約モデルデータを生成することを特徴とする請求項1に記載の画像領域分割装置。 - 前記画像領域分割ルールデータは、画像断片をさらに含み、
前記制約モデル生成部は、
前記画像データに対して、前記分割矩形をテンプレートマッチ対象とするか否かの属性を表すフラグ値を基に、前記画像断片とのテンプレートマッチング処理を実行し、当該画像断片の座標位置を計算し、当該画像断片と関連付けられた目標位置として記憶する画像マッチング部をさらに具備し、
前記矩形内制約生成部は、
前記画像断片と関連付けられている前記分割矩形に対し、その位置を前記目標位置に固定的に一致させる矩形内制約条件を生成する
ことを特徴とする請求項2に記載の画像領域分割装置。 - 図形エディタを模したウィンドウとともに、図形の選択操作によって当該図形の属性値を表示・変更するパネル及び当該図形とそれが帰属するレイヤとの関係を表示・変更するパネルを具備し、ユーザからの操作に従って前記画像領域分割ルールデータを作成・編集するルールエディタをさらに備え、
前記ルールエディタは、
前記ウィンドウ上で分割矩形を図形として可視化表示し、前記ウィンドウもしくはパネルに対するユーザからの操作に応じて前記画像領域分割ルールデータを編集するルール表示・編集部を少なくとも具備する
ことを特徴とする請求項1乃至3のいずれかに記載の画像領域分割装置。 - 前記ルールエディタは、
前記画像領域分割ルールデータベースに蓄積された画像領域分割ルールデータのうち、ユーザから指定された画像領域分割ルールデータを前記ルール表示・編集部へ送るとともに、前記ルール表示・編集部により編集された画像領域分割ルールデータを前記画像領域分割ルールデータベースに追記更新するエディタ制御部をさらに具備する
ことを特徴とする請求項4に記載の画像領域分割装置。 - GUIの画像データを入力とし、予め指定された画像領域分割ルールデータを参照することによって当該画像データを領域分割し、その領域分割した分割矩形データを出力する画像領域分割方法であって、
分割矩形とレイヤとを含む画像領域分割ルールデータを蓄積する画像領域分割ルールデータベースと、与えられた制約充足問題に対応する制約充足解を探索する制約ソルバと、画像領域分割エンジンとを少なくとも用い、
前記画像領域分割エンジンにより、
入力された前記画像データに対応する画像領域分割ルールデータを画像領域分割ルールデータベースから取り出し、当該画像領域分割ルールデータから前記制約ソルバに入力する制約モデルデータを生成し、
前記制約モデルデータを制約充足問題として前記制約ソルバに渡して制約充足解の探索を命令し、前記制約ソルバから返却された前記制約モデルデータに対応する制約充足解データを受け取り、
前記制約充足解データから前記分割矩形データを生成し、
前記制約モデルの生成では、
同じ前記レイヤに属する複数の前記分割矩形同士の初期値における相対位置が保存されるように相互の位置関係を付与する矩形間制約条件を生成し、
前記矩形間制約条件に基づいて、前記制約モデルデータを生成する、
ことを特徴とする画像領域分割方法。 - 前記制約モデルの生成では、
前記分割矩形のそれぞれに対し、最大サイズ、最小サイズ、推奨サイズからのずれ、および推奨位置からのずれのそれぞれについて、その有効無効の属性を表すフラグ値を基に、矩形内制約条件をさらに生成し、
前記矩形内制約条件に基づいて、解全体の最適度を表す目的関数の評価値としての制約変数を含む評価関数制約条件をさらに生成し、
前記矩形間制約条件と、前記矩形内制約条件および前記評価関数制約条件の少なくとも一方とに基づいて、前記制約モデルデータを生成する、
ことを特徴とする請求項6に記載の画像領域分割方法。 - コンピュータを、請求項1乃至5のいずれかに記載の画像領域分割装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012150459A JP5791115B2 (ja) | 2012-07-04 | 2012-07-04 | 画像領域分割装置、その方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012150459A JP5791115B2 (ja) | 2012-07-04 | 2012-07-04 | 画像領域分割装置、その方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014013490A JP2014013490A (ja) | 2014-01-23 |
JP5791115B2 true JP5791115B2 (ja) | 2015-10-07 |
Family
ID=50109140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012150459A Active JP5791115B2 (ja) | 2012-07-04 | 2012-07-04 | 画像領域分割装置、その方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5791115B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016092605A1 (ja) * | 2014-12-08 | 2016-06-16 | 株式会社日立製作所 | 制約充足解探索装置および制約充足解探索方法 |
US11301109B1 (en) * | 2021-03-05 | 2022-04-12 | Citrix Systems, Inc. | Computing device with new window creation command and related systems and methods |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001118030A (ja) * | 1991-10-28 | 2001-04-27 | Hitachi Ltd | 書式データ編集方法および装置 |
JP3504054B2 (ja) * | 1995-07-17 | 2004-03-08 | 株式会社東芝 | 文書処理装置および文書処理方法 |
JP3598711B2 (ja) * | 1997-02-21 | 2004-12-08 | 三菱電機株式会社 | 文書ファイリング装置 |
JP2001101164A (ja) * | 1999-09-29 | 2001-04-13 | Toshiba Corp | 文書画像処理装置及び文書画像処理方法 |
JP3870672B2 (ja) * | 2000-06-29 | 2007-01-24 | 三菱電機株式会社 | 文書ファイリング装置 |
JP2003288334A (ja) * | 2002-03-28 | 2003-10-10 | Toshiba Corp | 文書処理装置及び文書処理方法 |
-
2012
- 2012-07-04 JP JP2012150459A patent/JP5791115B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014013490A (ja) | 2014-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022206714B2 (en) | System and method for implementing containers which extract and apply semantic page knowledge | |
US7873946B2 (en) | Scalable vector graphics, tree and tab as drag and drop objects | |
US8910064B2 (en) | GUI program creation supporting apparatus, GUI program creation support method, computer-readable recording medium and integrated circuit | |
CN108345456A (zh) | 页面代码生成方法、装置、计算机设备和存储介质 | |
CN113741898B (zh) | 表单生成方法、装置及设备 | |
JP4872529B2 (ja) | リバースエンジニアリング支援方法 | |
CN109583591A (zh) | 用于简化的知识工程的方法与系统 | |
Pimpler | Programming ArcGIS with Python Cookbook | |
US7769773B1 (en) | Relevant rule inspector for hierarchical documents | |
JP5791115B2 (ja) | 画像領域分割装置、その方法及びプログラム | |
CN114896918A (zh) | 针对功能函数模块的实时可视化方法和系统 | |
JP2006276912A (ja) | 文書編集装置、文書編集方法およびプログラム | |
JP5950309B2 (ja) | 画像領域分割装置、その方法及びプログラム | |
JPH09245052A (ja) | 構造化文書処理装置 | |
KR101698422B1 (ko) | Iwod를 사용한 프로세스 맵 설계 장치 및 방법 | |
US20200409672A1 (en) | Constraint based authoring | |
JP3941610B2 (ja) | 情報抽出方法、情報抽出装置および情報抽出プログラム | |
KR101948114B1 (ko) | 컨텐츠 퍼블리싱 장치 및 컨텐츠 퍼블리싱 방법 | |
CN112256573B (zh) | 一种面向simscript语言的仿真程序可视化方法 | |
JP6542958B1 (ja) | コンテンツパブリッシング装置およびコンテンツパブリッシング方法 | |
JP3637771B2 (ja) | 文書編集出力装置 | |
JP4706001B2 (ja) | 設計コンピュータプログラム | |
JP2020197986A (ja) | コンピュータプログラム、サーバ装置、端末装置、プログラム生成方法、及び方法 | |
KR102106098B1 (ko) | 도움말 제공 장치 및 방법 | |
JP2007034806A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20140207 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140306 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140702 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150513 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150729 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150730 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5791115 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |