JP4100746B2 - 画像処理装置及び方法 - Google Patents
画像処理装置及び方法 Download PDFInfo
- Publication number
- JP4100746B2 JP4100746B2 JP00339698A JP339698A JP4100746B2 JP 4100746 B2 JP4100746 B2 JP 4100746B2 JP 00339698 A JP00339698 A JP 00339698A JP 339698 A JP339698 A JP 339698A JP 4100746 B2 JP4100746 B2 JP 4100746B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- region
- block
- attribute
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Character Input (AREA)
- User Interface Of Digital Computer (AREA)
- Editing Of Facsimile Originals (AREA)
Description
【発明の属する技術分野】
本発明は、OCR(光学的文字認識装置)、複写機、ファクシミリ、電子データベース化の処理装置等の電子装置において、特に文書画像より特定の所望領域を抽出するための画像処理装置及び方法に関するものである。
【0002】
【従来の技術】
一般に、文書から所望の領域を抽出するには次の2とおりの方法がある。第1の方法は、入力画像に対してオペレータが所望の抽出すべき領域をその都度指定する。例えば、スキャナで文書画像を読み取り、読み取った画像をディスプレイ上に表示して、オペレータが所望の領域をマウス等を用いて指定する方法である。
【0003】
また、第2の方法は、あらかじめ矩形の位置情報を定めたテンプレートを作成しておき、このテンプレートに定められた矩形領域をそのまま入力画像に当てはめて抽出するものである。この場合、読み取られた文書画像中から、テンプレートで定められた位置及び大きさの矩形領域が抽出されることになり、オペレータが一つ一つ抽出領域を指定するという手間が省けることになる。
【0004】
【発明が解決しようとする課題】
しかしながら、上記の第1の方法では、オペレータが所望の領域をその都度指定しなければならず、大量文書の処理には不向きである。またテンプレートを用いる第2の方法においても、入力画像の抽出すべき所望の領域とテンプレートで設定されている領域との間に、位置や大きさのずれがある場合には、所望領域が欠けて抽出されてしまうという問題がある。
【0005】
本発明は上記の問題に鑑みてなされたものであり、テンプレートを採用しつつ、入力した文書画像中より所望の領域を確実に抽出することが可能な画像処理装置及び方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による画像処理装置は例えば以下の構成を備える。すなわち、
画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持手段と、
前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択手段と、
文書画像を入力する画像入力手段と、
前記画像入力手段で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出された各ブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出手段と、
前記領域抽出手段で抽出されたブロック領域のうち、前記選択手段でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出手段とを備える。
【0007】
また、上記の目的を達成するための本発明の他の態様による画像処理方法は例えば以下の工程を備えている。すなわち、
保持手段が、画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持工程と、
選択手段が、前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択工程と、
画像入力手段が、文書画像を入力する画像入力工程と、
領域抽出手段が、前記画像入力工程で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出された各ブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出工程と、
抽出手段が、前記領域抽出工程で抽出されたブロック領域のうち、前記選択工程でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出工程とを備える。
【0008】
【発明の実施の形態】
以下、添付の図面を参照して本発明の好適な実施形態を説明する。
【0009】
[第1の実施形態]
図1は第1の実施形態による画像処理装置の構成を示すブロック図である。図1において、101は画像原稿に光を照射し、その反射光を読み取り電気信号に変換するスキャナ、102はスキャナ101で得られた電気信号を2値のデジタル電気信号に変換し他の装置構成要素に伝送するためのスキャナインタフェース回路、103はディスプレイのウィンドウ上で所望とする座標を入力するためのポインティングデバイス(本例ではマウスを用いるので、以下マウス103と称する)、104はマウス103からの信号を受け、それを他の装置構成要素に伝送するためのインターフェース回路である。
【0010】
105はCPUであり、装置全体の制御及び領域分割処理等を実行する。106はROMであり、CPU105が実行する制御プログラム、各種処理プログラムやフォントデータなどを格納する。107はRAMであり、文書画像の展開や領域分割処理のための作業領域などとして用いられる。
【0011】
また、108は入力イメージ等を表示するためのディスプレイ、109はディスプレイインターフェース回路である。ディスプレイ108には、RAM107の所定アドレスエリアに格納されているVRAM領域のイメージが表示される。110は、データ等が格納されるハードディスク等の外部記憶装置で、111はそのインタフェースである。そして112は各装置構成要素を接続するバスである。
【0012】
次に、第1の実施形態における処理の流れについて、図2のフローチャートおよび図3のフローチャートに沿って説明する。図2は第1の実施形態におけるテンプレート保存処理の手順を説明するフローチャートである。また、図3は、第1の実施形態における領域抽出処理の手順を説明するフローチャートである。
【0013】
まず、領域抽出に用いるテンプレート保存処理について図2を参照して説明する。ステップS201で保存したい書式をもった図4の如き文書Aをスキャナ101で読み込み、後の領域分割処理のために2値の画像データに変換する。次に、ステップS202において、得られた入力画像に対して、“テキスト”や“表”や“図形”等の属性をもった小領域(以後、領域或はブロックと呼ぶ)ごとに領域設定を行う。なお、ステップS202で用いられる領域分割処理は、当業者に知られた手法を採用すればよい。
【0014】
本例では、図4の文書Aをスキャナで読み取り、読み取った画像をディスプレイ108に表示する。図5は第1の実施形態によるテンプレート保存処理における領域設定操作画面の表示例を示す図である。ディスプレイ108中には、文書Aの画像と共に属性メニュー51も表示される。マウス103を操作して属性メニュー51から所望の属性を選択し、マウス103で矩形領域を示す枠を指定する。このようにして、所望の位置にその属性の枠を描くことで、各矩形領域毎に属性が設定される。なお、マウス103の操作によって描画される矩形枠の線色は、属性メニュー51から所望の属性を指定すると、指定された属性に対応付けられた色に設定される。図5において、矩形枠501の線色は黒であり、当該領域の属性が「テキスト」であることを表している。また、矩形枠502の線色は赤であり、当該領域の属性が「表」であることを表している。更に、矩形枠504の線色は黄であり、当該矩形領域の属性が「図形」であることを表している。
【0015】
図6は、上述した領域指定及び属性設定によって生成されるテンプレートデータのデータ構成を説明する図である。図6(a)に示すように、各領域毎(ブロック毎)に領域データが格納される。領域データは、当該領域の始点X、Y座標、幅、高さ(すなわちマウス103で描画した矩形枠の位置情報)を登録すると共に、「属性」の欄には当該矩形枠に設定された属性に対応する識別番号が設定される。各属性と識別番号は図6(b)に示す通りである。
【0016】
次に、ステップS203で、以上のようにして設定した各ブロックの領域データの集合をテンプレートとして登録保存する。たとえば、図7では既存のテンプレート群の4番目に新規に「文書Aテンプレート」という名称で登録される例を表わしている。
【0017】
図8はテンプレートデータへの「文書Aテンプレート」の登録状態を示す図である。図5で示したように文書Aには矩形枠501〜505で示される領域が設定されているので、文書Aテンプレートには5つのブロックが登録されることになる。なお、ブロック1〜5のどのブロックにどの矩形枠が対応するかは、例えば、矩形枠の指定の順番に従って決定すればよい。
【0018】
以上のようにして登録されたテンプレートを用いて、新たに読み込まれた画像から所望の領域を抽出する処理について図3のフローチャートを参照して説明する。
【0019】
まず、ステップS301で所望の領域を抽出するのに必要なテンプレートを選択する。本例では、図7の如く登録されているテンプレートのテンプレート名をディスプレイ108上に表示し、マウス103を用いて所望のテンプレートをオペレータに選択させる。次に、ステップS302で処理対象の文書をスキャナ101で読み取り、後の領域分割処理のためにこれを2値の画像データに変換する。本例では図5の如く設定された文書テンプレートAを選択し、処理対象の文書として図9に示す文書Bを読み込んだものとして説明を行う。
【0020】
ステップS303では、得られた入力画像に対して、当業者には知られた領域分割処理を行ない、ブロックを抽出するとともに各ブロックの属性を判定する。図10は、文書Bについて領域分割処理を実行した結果例を示す図である。ブロックA〜Eの各ブロックは抽出領域情報として、図6に示した領域情報と同じデータ構造で格納される。すなわち、抽出された各ブロックの位置と属性を表す情報が格納される。
【0021】
次に、ステップS304で、文書Bから抽出されたブロックと、選択したテンプレート(文書Aテンプレート)に保存されているブロックとで、夫々の領域データを比較する。そして、ステップS305において、領域の少なくとも一部が重複するとともに、重複した領域どうしの属性が一致するブロックを抽出する。ステップS305で抽出されたブロックがあれば、そのブロックが所望のブロックと同一のブロックとみなされ、当該ブロックの領域内の画像が出力される(ステップS306)。
【0022】
図11はテンプレートと文書の各ブロックの比較の様子を説明する図である。図11において、文書Aテンプレートに記録されているブロックが点線で、文書Bの画像から抽出されたブロックが2点破線で示されている。文書Bより抽出されたブロックA及びブロックBは、文書Aテンプレートのブロック位置と多少ずれているが、重複する部分が存在している。また、これら領域の属性はともに「テキスト」であるので、これらブロックA、ブロックBはステップS305で抽出される。結局、図10で得られた文書Bの全てのブロックA〜Eの領域データが出力されることとなる。
【0023】
以上説明したように、第1の実施形態によれば、テンプレートにおいて設定されている領域の位置と実際に読み取った文書画像から抽出すべき領域の位置が多少ずれていても、確実に所望領域を抽出することができる。
【0024】
[第2の実施形態]
上述の第1の実施形態では、テンプレートに保存する領域の設定をマウス103を用いてマニュアルにて行っていたが、このようなテンプレート保存のための領域設定処理を、ステップS303で行うような領域分割処理を用いて自動化することも可能である。
【0025】
処理の流れについて図12のフローチャートに従って説明する。図12は第2の実施形態によるテンプレート保存処理の手順を表すフローチャートである。
【0026】
ステップS1201で保存したい書式をもった文書A(図4)をスキャナで読み込み2値の画像データに変換する。得られた入力画像に対してステップS1202で領域分割処理を行い、テキスト領域、図形領域、表領域、タイトル領域等の各種領域(ブロック)を抽出する。この場合の領域分割処理の結果を図13に示す。このように各ブロックが抽出され、ブロック毎に領域分割データとして、各種属性に対応した識別番号および、位置情報が得られる。このときの当該文書に対する領域データの構造は図6に示した構造と同じものとすることができる。そして、ステップS1203では、抽出した各ブロックの領域データを図8に示すように「文書Aテンプレート」として登録保存する。
【0027】
以上のように構成すれば、テンプレートとなる文書をスキャナ101によって読みとらせるだけで、自動的にテンプレートが生成されるので、操作性が向上する。
【0028】
[第3の実施形態]
第2の実施形態では、テンプレート保存処理における領域分割処理によって抽出された全領域をテンプレートとして保存したが、抽出された領域のうちの所望の領域を選択してテンプレートとして保存するようにすることもできる。第3の実施形態では、領域分割処理において抽出したブロックのうちの特定のブロックをマウス103等で指示し、そのブロックの領域分割データのみをテンプレートとして保存する。
【0029】
図14は第3の実施形態におけるテンプレート保存処理の手順を示すフローチャートである。以下、第3の実施形態の処理の流れについて
図14のフローチャートに従って説明する。
【0030】
ステップS1401で、保存したい書式をもった文書A(図4)をスキャナ101で読み込み2値の画像データに変換する。ステップS1402では、得られた入力画像に対して領域分割処理を行い、テキスト領域、タイトル領域、図形領域、表領域等の各種領域(ブロック)を抽出する。この抽出の結果は、第2の実施形態(図13)で説明したとおりである。
【0031】
次に、ステップS1403では、抽出したブロックのうち特定のブロックをマウス103を用いて選択する。図15は、ブロック3及びブロック5が選択された状態を表す図である。図15の例の場合、選択されたブロックは斜線でハッチングされ、それ以外のブロックと区別される。
【0032】
ステップS1404では、ステップS1404で選択されたブロックの領域分割データ(属性と位置情報等)のみをテンプレートとして保存する。本例では、図16に示されるように、ブロック3とブロック5の領域分割データのみが文書Aテンプレートとして保存される。
【0033】
以上のようにして保存された文書Aテンプレートを用いて図9に示した文書Bを処理した場合を説明する。図17は、図15で選択したブロックのみのテンプレートを用いて文書Bから所望の領域を抽出する場合の、テンプレートと文書の各ブロックの比較結果を説明する図である。この例の場合、テンプレートに記録されているブロック(点線)と文書Bのブロック(2点破線)のうち、重複しかつ同一属性であると判定されたブロックCおよびブロックEの領域分割データのみが出力されることになる。
【0034】
以上説明したように、第3の実施形態によれば、自動的に抽出された領域データから所望の領域を選択してテンプレートとすることができる。
【0035】
[第4の実施形態]
上記第3の実施形態では、テンプレートとして保存すべき領域を指定したが、テンプレートとして保存しない領域を指定するようにしてももちろん良い。第4の実施形態では、領域分割処理によって抽出したブロックのうちの所望の領域をマウス等で指示し、指示されたブロック以外のブロックの領域データををテンプレートとして保存する。
【0036】
図18は第4の実施形態によるテンプレート保存処理を説明するフローチャートである。まず、ステップS1801で、保存したい書式をもった文書A(図4)をスキャナ101で読み込み、2値の画像データに変換する。ステップS1802では、得られた入力画像に対して領域分割処理を行い、テキスト領域、タイトル領域、図形領域、表領域等の各種領域(ブロック)を抽出する。この抽出によって、第2の実施形態(図13)で説明したとおりの結果が得られる。
【0037】
次に、ステップS1803では、抽出したブロックのうち、所望のブロックをマウス103を用いて選択する。図15は、ブロック3及びブロック5が選択された状態を表す図である。選択されたブロックは、図15で説明したように、斜線でハッチングされ、それ以外のブロックと区別されるとともに、選択されたブロックの領域データは削除される。なお、上記では選択されたブロックの矩形領域内にハッチングを施しているが、これに限られるものではない。例えば、領域データの削除と共に、当該ブロックの矩形を表す枠線を消去するようにしてもよい。
【0038】
ステップS1804では、ステップS1804で選択されなかったブロックの領域分割データ(属性と位置情報等)のみをテンプレートとして保存する。本例では、図15のように選択した結果、ブロック1、2、4の領域分割データのみが文書Aテンプレートとして保存される。
【0039】
[第5の実施形態]
上記各実施形態では、処理対象の文書を逐一スキャナ101にセットして、読み込ませているが、ADF(オートドキュメントフィーダー)等を用いて大量の文書をスキャナ101で入力した場合のテンプレートによる自動抽出も可能である。図19は第5の実施形態における領域抽出処理の手順を説明するフローチャートである。以下、処理の流れについて図19のフローチャートに従って説明する。なお、ステップS1901、S1903〜S1907の各処理は、第1の実施形態(図3)におけるステップS301〜S306と同様である。
【0040】
ステップS1901で所望の領域を抽出するのに用いる所望のテンプレートを選択する。ステップS1902では入力すべき文書があるか否か、すなわちADF上に文書があるか否かを判断する。入力すべき文書があればステップS1903へ進み、文書をスキャナ101で読み込み、2値の画像データに変換する。一方、ステップS1902で入力すべき文書が無ければ本処理を終了する。
【0041】
次に、得られた入力画像に対しステップS1904で領域分割を行ない、ブロックを抽出する。例えば、ステップS1903において図9の如き文書Bを読み込んだ場合、ステップS1904における領域分割処理によって図10に示すような結果が得られる。
【0042】
ステップS1905では、ステップS1904の領域分割処理によって抽出されたブロックと、ステップS1901で選択したテンプレートに保存されているブロックとで、領域データを比較する。そして、ステップS1906において、領域が重複しかつ同一の属性の領域データを有するブロックを抽出する。ここで抽出されたブロックは、テンプレートに定義されている所望のブロックと同一のブロックであるとみなされ、ブロックの領域分割データが出力される(ステップS1907)。
【0043】
例えば図5に示した文書Aに基づいて得られた文書Aテンプレートを選択し、図9の如き文書Bをスキャナ101で読み込んで処理すると、図11のように領域が重複する(文書Aテンプレートに記録されているブロックを破線で、文書Bより抽出されたブロックを2点鎖線で示した)。そして、夫々領域が重複しているブロックの属性が等しい(図5と図10を参照)ので、図10で得られた文書Bの全てのブロックの領域のデータが出力されることとなる。そして、ステップS1902に戻り、処理を続行する。
【0044】
以上説明した様に、上記各実施形態によればテンプレートによって文書画像から所望の領域を抽出する際の、▲1▼オペレータの介在の削減、▲2▼所望領域抽出の正確性の向上、▲3▼大量文書の自動処理、▲4▼操作性の向上、▲5▼処理全体の時間の短縮等がはかれる効果がある。
【0045】
なお、上記各実施形態では、ブロック領域を矩形領域で設定しているが、円形、楕円形等、閉領域であればどのような形状でもよいであろう。
【0046】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0047】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0048】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0049】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0050】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0051】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0052】
【発明の効果】
以上説明したように本発明によれば、テンプレートを採用しつつ、入力した文書画像中より所望の領域を確実に抽出することが可能となる。
【0053】
【図面の簡単な説明】
【図1】第1の実施形態による画像処理装置の構成を示すブロック図である。
【図2】第1の実施形態におけるテンプレート保存処理の手順を説明するフローチャートである。
【図3】第1の実施形態における領域抽出処理の手順を説明するフローチャートである。
【図4】テンプレートデータ生成のために読み込む文書例(文書A)を示す図である。
【図5】第1の実施形態によるテンプレート保存処理における領域設定操作画面の表示例を示す図である。
【図6】上述した領域指定及び属性設定によって生成されるテンプレートデータのデータ構成を説明する図である。
【図7】テンプレートデータの登録状態を説明する図である。
【図8】テンプレートデータへの「文書Aテンプレート」の登録状態を示す図である。
【図9】処理対象例である文書Bを示す図である。
【図10】図9の文書Bについて領域分割処理を実行した結果例を示す図である。
【図11】テンプレートと文書の各ブロックの比較の様子を説明する図である。
【図12】第2の実施形態によるテンプレート保存処理の手順を表すフローチャートである。
【図13】この場合の領域分割処理の結果を示す図である。
【図14】第3の実施形態におけるテンプレート保存処理の手順を示すフローチャートである。
【図15】第3の実施形態のテンプレート保存処理において、ブロック3及びブロック5が選択された状態を表す図である。
【図16】第3の実施形態における文書Aテンプレートのデータ構成を示す図である。
【図17】図16の文書Aテンプレートを用いて文書Bから所望の領域を抽出する場合の、各ブロックの比較結果を説明する図である。
【図18】第4の実施形態によるテンプレート保存処理を説明するフローチャートである。
【図19】第5の実施形態における領域抽出処理の手順を説明するフローチャートである。
Claims (11)
- 画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持手段と、
前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択手段と、
文書画像を入力する画像入力手段と、
前記画像入力手段で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出された各ブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出手段と、
前記領域抽出手段で抽出されたブロック領域のうち、前記選択手段でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出手段と
を備えることを特徴とする画像処理装置。 - 前記保持手段は、
入力された画像に対して領域及び各領域の属性を設定する設定手段と、
前記設定手段で設定された各領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録手段と
を備えることを特徴とする請求項1に記載の画像処理装置。 - 前記設定手段は、前記入力された画像からブロック領域とその属性を領域分割処理により自動的に抽出することによって、前記テンプレート情報とすべき領域及び各領域の属性の設定を行う
ことを特徴とする請求項2に記載の画像処理装置。 - 前記保持手段は、
入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得手段と、
前記領域獲得手段によって得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択手段と、
前記領域選択手段で選択されたブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録手段と
を備えることを特徴とする請求項1に記載の画像処理装置。 - 前記保持手段は、
入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得手段と、
前記領域獲得手段によって得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択手段と、
前記領域選択手段で選択されたブロック領域以外のブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録手段と
を備えることを特徴とする請求項1に記載の画像処理装置。 - 保持手段が、画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持工程と、
選択手段が、前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択工程と、
画像入力手段が、文書画像を入力する画像入力工程と、
領域抽出手段が、前記画像入力工程で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出された各ブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出工程と、
抽出手段が、前記領域抽出工程で抽出されたブロック領域のうち、前記選択工程でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出工程と
を備えることを特徴とする画像処理方法。 - 前記保持工程は、
設定手段が、入力された画像に対して領域及び各領域の属性を設定する設定工程と、
登録手段が、前記設定工程で設定された各領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録工程と
を備えることを特徴とする請求項6に記載の画像処理方法。 - 前記設定工程では、前記入力された画像からブロック領域とその属性を領域分割処理により自動的に抽出することによって、前記テンプレート情報とすべき領域及び各領域の属性の設定を行う
ことを特徴とする請求項7に記載の画像処理方法。 - 前記保持工程は、
領域獲得手段が、入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得工程と、
領域選択手段が、前記領域獲得工程によって得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択工程と、
前記領域選択工程で選択されたブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録工程と
を備えることを特徴とする請求項6に記載の画像処理方法。 - 前記保持工程は、
領域獲得手段が、入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得工程と、
領域選択手段が、前記領域獲得工程で得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択肯定と、
登録手段が、前記領域選択工程で選択されたブロック領域以外のブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録工程と
を備えることを特徴とする請求項6に記載の画像処理方法。 - コンピュータに、
保持手段が、画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持工程、
選択手段が、前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択工程、
画像入力手段が、文書画像を入力する画像入力工程、
領域抽出手段が、前記画像入力工程で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出された各ブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出工程、
抽出手段が、前記領域抽出工程で抽出されたブロック領域のうち、前記選択工程でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出工程、
を実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00339698A JP4100746B2 (ja) | 1998-01-09 | 1998-01-09 | 画像処理装置及び方法 |
US09/221,840 US6411731B1 (en) | 1998-01-09 | 1998-12-29 | Template-based image recognition and extraction |
EP98310810A EP0929183B1 (en) | 1998-01-09 | 1998-12-31 | Image processing apparatus and method |
DE69838579T DE69838579T2 (de) | 1998-01-09 | 1998-12-31 | Bildverarbeitungsvorrichtung und -verfahren |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00339698A JP4100746B2 (ja) | 1998-01-09 | 1998-01-09 | 画像処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11203491A JPH11203491A (ja) | 1999-07-30 |
JP4100746B2 true JP4100746B2 (ja) | 2008-06-11 |
Family
ID=11556211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00339698A Expired - Fee Related JP4100746B2 (ja) | 1998-01-09 | 1998-01-09 | 画像処理装置及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6411731B1 (ja) |
EP (1) | EP0929183B1 (ja) |
JP (1) | JP4100746B2 (ja) |
DE (1) | DE69838579T2 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3913985B2 (ja) * | 1999-04-14 | 2007-05-09 | 富士通株式会社 | 文書画像中の基本成分に基づく文字列抽出装置および方法 |
JP3756719B2 (ja) | 2000-01-20 | 2006-03-15 | 理想科学工業株式会社 | 文書修飾装置及び画像処理装置 |
CA2310943A1 (en) * | 2000-06-02 | 2001-12-02 | Michael J. Sikorsky | Methods, techniques, software and systems for providing context independent, protocol independent portable or reusable development tools |
JP2002032770A (ja) * | 2000-06-23 | 2002-01-31 | Internatl Business Mach Corp <Ibm> | 文書処理方法、文書処理システムおよび媒体 |
JP5033277B2 (ja) * | 2000-09-12 | 2012-09-26 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体 |
JP2002259991A (ja) * | 2001-02-28 | 2002-09-13 | Sony Corp | 画像処理装置およびその方法 |
FR2831752A1 (fr) * | 2001-10-30 | 2003-05-02 | Laurent Michel | Procede et installation de saisie de fiches a l'aide d'un poste de saisie |
US6840666B2 (en) | 2002-01-23 | 2005-01-11 | Marena Systems Corporation | Methods and systems employing infrared thermography for defect detection and analysis |
US7538815B1 (en) | 2002-01-23 | 2009-05-26 | Marena Systems Corporation | Autofocus system and method using focus measure gradient |
JP3624186B2 (ja) * | 2002-03-15 | 2005-03-02 | Tdk株式会社 | スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置 |
US7538903B2 (en) * | 2002-07-11 | 2009-05-26 | Stone Cheng | Method for scanning by using a virtual frame holder |
US8849031B2 (en) * | 2005-10-20 | 2014-09-30 | Xerox Corporation | Document analysis systems and methods |
CN101173853B (zh) * | 2006-11-01 | 2011-02-02 | 鸿富锦精密工业(深圳)有限公司 | 定位测量装置及方法 |
US7778953B2 (en) * | 2007-02-19 | 2010-08-17 | Kabushiki Kaisha Toshiba | Document management apparatus and document management method |
US10916043B2 (en) * | 2007-11-26 | 2021-02-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for generating a template for arranging at least one object at at least one place |
US20090279127A1 (en) * | 2008-05-08 | 2009-11-12 | Infoprint Solutions Company Llc | Mechanism for data extraction of variable positioned data |
JP2010033360A (ja) * | 2008-07-29 | 2010-02-12 | Canon Inc | 情報処理装置、ジョブ処理方法、記憶媒体及びプログラム |
JP2010044544A (ja) | 2008-08-12 | 2010-02-25 | Canon Inc | 画像処理装置、情報処理装置、情報処理方法、及びプログラム |
JP5300534B2 (ja) * | 2009-03-10 | 2013-09-25 | キヤノン株式会社 | 画像処理装置および画像処理方法及びプログラム |
JP2010211466A (ja) * | 2009-03-10 | 2010-09-24 | Canon Inc | 画像処理装置および画像処理方法及びプログラム |
US20110029914A1 (en) * | 2009-07-30 | 2011-02-03 | Whitby Laura R | Apparatus for generating artistic image template designs |
US8854395B2 (en) * | 2009-07-30 | 2014-10-07 | Intellectual Ventures Fund 83 Llc | Method for producing artistic image template designs |
US20110029635A1 (en) * | 2009-07-30 | 2011-02-03 | Shkurko Eugene I | Image capture device with artistic template design |
US20110029562A1 (en) * | 2009-07-30 | 2011-02-03 | Whitby Laura R | Coordinating user images in an artistic design |
US8422794B2 (en) | 2009-07-30 | 2013-04-16 | Intellectual Ventures Fund 83 Llc | System for matching artistic attributes of secondary image and template to a primary image |
US8849853B2 (en) * | 2009-07-30 | 2014-09-30 | Intellectual Ventures Fund 83 Llc | Method for matching artistic attributes of a template and secondary images to a primary image |
CN102023966B (zh) * | 2009-09-16 | 2014-03-26 | 鸿富锦精密工业(深圳)有限公司 | 用于合约比较的计算机系统及合约比较方法 |
TR200907868A2 (tr) * | 2009-10-16 | 2011-05-23 | Vestel Elektron�K Sanay� Ve T�Caret Anon�M ��Rket�@ | Siyah transparan bölgeler içeren otomatik test metodu |
JP6010744B2 (ja) * | 2012-05-31 | 2016-10-19 | 株式会社Pfu | 文書作成システム、文書作成装置、文書作成方法、及びプログラム |
JP6233142B2 (ja) * | 2014-03-28 | 2017-11-22 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
KR20160027862A (ko) * | 2014-09-02 | 2016-03-10 | 삼성전자주식회사 | 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치 |
JP2016200967A (ja) | 2015-04-09 | 2016-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6113760A (ja) | 1984-06-29 | 1986-01-22 | Dainippon Screen Mfg Co Ltd | 画像走査記録方法 |
JPS62181570A (ja) | 1986-02-05 | 1987-08-08 | Minolta Camera Co Ltd | 画像編集装置 |
US5038392A (en) | 1990-02-12 | 1991-08-06 | International Business Machines Corporation | Method and apparatus for adaptive image processing by recognizing a characterizing indicium in a captured image of a document |
US6002798A (en) * | 1993-01-19 | 1999-12-14 | Canon Kabushiki Kaisha | Method and apparatus for creating, indexing and viewing abstracted documents |
JPH07131641A (ja) * | 1993-11-08 | 1995-05-19 | Canon Inc | 画像処理装置 |
US5987171A (en) | 1994-11-10 | 1999-11-16 | Canon Kabushiki Kaisha | Page analysis system |
US5852676A (en) * | 1995-04-11 | 1998-12-22 | Teraform Inc. | Method and apparatus for locating and identifying fields within a document |
US5774579A (en) * | 1995-08-11 | 1998-06-30 | Canon Kabushiki Kaisha | Block selection system in which overlapping blocks are decomposed |
US5892843A (en) * | 1997-01-21 | 1999-04-06 | Matsushita Electric Industrial Co., Ltd. | Title, caption and photo extraction from scanned document images |
-
1998
- 1998-01-09 JP JP00339698A patent/JP4100746B2/ja not_active Expired - Fee Related
- 1998-12-29 US US09/221,840 patent/US6411731B1/en not_active Expired - Lifetime
- 1998-12-31 DE DE69838579T patent/DE69838579T2/de not_active Expired - Lifetime
- 1998-12-31 EP EP98310810A patent/EP0929183B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0929183B1 (en) | 2007-10-17 |
EP0929183A3 (en) | 2000-05-10 |
DE69838579T2 (de) | 2008-07-24 |
DE69838579D1 (de) | 2007-11-29 |
US6411731B1 (en) | 2002-06-25 |
EP0929183A2 (en) | 1999-07-14 |
JPH11203491A (ja) | 1999-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4100746B2 (ja) | 画像処理装置及び方法 | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US8422796B2 (en) | Image processing device | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
US20130326341A1 (en) | Digital comic editor, method and non-transitorycomputer-readable medium | |
JP6938318B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US20060290964A1 (en) | Image processing system and image processing method, and computer program | |
US8355577B2 (en) | Image processing apparatus and method | |
JPH05189336A (ja) | 文書認識装置および認識処理方法 | |
JPH032979A (ja) | 画像修正方法及び装置 | |
US20050102327A1 (en) | Data file processor, data file processing method and program | |
US8194982B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP4136282B2 (ja) | 画像処理装置及び画像処理方法並びに記憶媒体 | |
JP4756650B2 (ja) | 画像処理装置、読み順設定方法及びプログラム | |
US6996293B1 (en) | Reduced image forming method and apparatus | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP6481204B2 (ja) | 情報処理装置と、その処理方法及びプログラム | |
JP4334987B2 (ja) | 領域指定機能およびデータ切り出し機能を備えたdtp編集装置 | |
JP6795770B2 (ja) | 情報処理装置と、その処理方法及びプログラム | |
JP3412998B2 (ja) | 画像処理装置及びその方法 | |
JPH103516A (ja) | 情報処理方法及び装置 | |
JP2005043995A (ja) | 情報処理装置、文字認識プログラム及び記録媒体 | |
JPH11224308A (ja) | 文字認識装置及びその方法 | |
JP2000312290A (ja) | データ処理方法及び装置及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041210 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20041210 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20041210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080111 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120328 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130328 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140328 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |