JP4100746B2 - 画像処理装置及び方法 - Google Patents

画像処理装置及び方法 Download PDF

Info

Publication number
JP4100746B2
JP4100746B2 JP00339698A JP339698A JP4100746B2 JP 4100746 B2 JP4100746 B2 JP 4100746B2 JP 00339698 A JP00339698 A JP 00339698A JP 339698 A JP339698 A JP 339698A JP 4100746 B2 JP4100746 B2 JP 4100746B2
Authority
JP
Japan
Prior art keywords
area
region
block
attribute
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00339698A
Other languages
English (en)
Other versions
JPH11203491A (ja
Inventor
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP00339698A priority Critical patent/JP4100746B2/ja
Priority to US09/221,840 priority patent/US6411731B1/en
Priority to EP98310810A priority patent/EP0929183B1/en
Priority to DE69838579T priority patent/DE69838579T2/de
Publication of JPH11203491A publication Critical patent/JPH11203491A/ja
Application granted granted Critical
Publication of JP4100746B2 publication Critical patent/JP4100746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、OCR(光学的文字認識装置)、複写機、ファクシミリ、電子データベース化の処理装置等の電子装置において、特に文書画像より特定の所望領域を抽出するための画像処理装置及び方法に関するものである。
【0002】
【従来の技術】
一般に、文書から所望の領域を抽出するには次の2とおりの方法がある。第1の方法は、入力画像に対してオペレータが所望の抽出すべき領域をその都度指定する。例えば、スキャナで文書画像を読み取り、読み取った画像をディスプレイ上に表示して、オペレータが所望の領域をマウス等を用いて指定する方法である。
【0003】
また、第2の方法は、あらかじめ矩形の位置情報を定めたテンプレートを作成しておき、このテンプレートに定められた矩形領域をそのまま入力画像に当てはめて抽出するものである。この場合、読み取られた文書画像中から、テンプレートで定められた位置及び大きさの矩形領域が抽出されることになり、オペレータが一つ一つ抽出領域を指定するという手間が省けることになる。
【0004】
【発明が解決しようとする課題】
しかしながら、上記の第1の方法では、オペレータが所望の領域をその都度指定しなければならず、大量文書の処理には不向きである。またテンプレートを用いる第2の方法においても、入力画像の抽出すべき所望の領域とテンプレートで設定されている領域との間に、位置や大きさのずれがある場合には、所望領域が欠けて抽出されてしまうという問題がある。
【0005】
本発明は上記の問題に鑑みてなされたものであり、テンプレートを採用しつつ、入力した文書画像中より所望の領域を確実に抽出することが可能な画像処理装置及び方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による画像処理装置は例えば以下の構成を備える。すなわち、
画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持手段と、
前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択手段と、
文書画像を入力する画像入力手段と、
前記画像入力手段で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出されたブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出手段と、
前記領域抽出手段で抽出されたブロック領域のうち、前記選択手段でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出手段とを備える。
【0007】
また、上記の目的を達成するための本発明の他の態様による画像処理方法は例えば以下の工程を備えている。すなわち、
保持手段が、画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持工程と、
選択手段が、前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択工程と、
画像入力手段が、文書画像を入力する画像入力工程と、
領域抽出手段が、前記画像入力工程で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出されたブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出工程と、
抽出手段が、前記領域抽出工程で抽出されたブロック領域のうち、前記選択工程でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出工程とを備える。
【0008】
【発明の実施の形態】
以下、添付の図面を参照して本発明の好適な実施形態を説明する。
【0009】
[第1の実施形態]
図1は第1の実施形態による画像処理装置の構成を示すブロック図である。図1において、101は画像原稿に光を照射し、その反射光を読み取り電気信号に変換するスキャナ、102はスキャナ101で得られた電気信号を2値のデジタル電気信号に変換し他の装置構成要素に伝送するためのスキャナインタフェース回路、103はディスプレイのウィンドウ上で所望とする座標を入力するためのポインティングデバイス(本例ではマウスを用いるので、以下マウス103と称する)、104はマウス103からの信号を受け、それを他の装置構成要素に伝送するためのインターフェース回路である。
【0010】
105はCPUであり、装置全体の制御及び領域分割処理等を実行する。106はROMであり、CPU105が実行する制御プログラム、各種処理プログラムやフォントデータなどを格納する。107はRAMであり、文書画像の展開や領域分割処理のための作業領域などとして用いられる。
【0011】
また、108は入力イメージ等を表示するためのディスプレイ、109はディスプレイインターフェース回路である。ディスプレイ108には、RAM107の所定アドレスエリアに格納されているVRAM領域のイメージが表示される。110は、データ等が格納されるハードディスク等の外部記憶装置で、111はそのインタフェースである。そして112は各装置構成要素を接続するバスである。
【0012】
次に、第1の実施形態における処理の流れについて、図2のフローチャートおよび図3のフローチャートに沿って説明する。図2は第1の実施形態におけるテンプレート保存処理の手順を説明するフローチャートである。また、図3は、第1の実施形態における領域抽出処理の手順を説明するフローチャートである。
【0013】
まず、領域抽出に用いるテンプレート保存処理について図2を参照して説明する。ステップS201で保存したい書式をもった図4の如き文書Aをスキャナ101で読み込み、後の領域分割処理のために2値の画像データに変換する。次に、ステップS202において、得られた入力画像に対して、“テキスト”や“表”や“図形”等の属性をもった小領域(以後、領域或はブロックと呼ぶ)ごとに領域設定を行う。なお、ステップS202で用いられる領域分割処理は、当業者に知られた手法を採用すればよい。
【0014】
本例では、図4の文書Aをスキャナで読み取り、読み取った画像をディスプレイ108に表示する。図5は第1の実施形態によるテンプレート保存処理における領域設定操作画面の表示例を示す図である。ディスプレイ108中には、文書Aの画像と共に属性メニュー51も表示される。マウス103を操作して属性メニュー51から所望の属性を選択し、マウス103で矩形領域を示す枠を指定する。このようにして、所望の位置にその属性の枠を描くことで、各矩形領域毎に属性が設定される。なお、マウス103の操作によって描画される矩形枠の線色は、属性メニュー51から所望の属性を指定すると、指定された属性に対応付けられた色に設定される。図5において、矩形枠501の線色は黒であり、当該領域の属性が「テキスト」であることを表している。また、矩形枠502の線色は赤であり、当該領域の属性が「表」であることを表している。更に、矩形枠504の線色は黄であり、当該矩形領域の属性が「図形」であることを表している。
【0015】
図6は、上述した領域指定及び属性設定によって生成されるテンプレートデータのデータ構成を説明する図である。図6(a)に示すように、各領域毎(ブロック毎)に領域データが格納される。領域データは、当該領域の始点X、Y座標、幅、高さ(すなわちマウス103で描画した矩形枠の位置情報)を登録すると共に、「属性」の欄には当該矩形枠に設定された属性に対応する識別番号が設定される。各属性と識別番号は図6(b)に示す通りである。
【0016】
次に、ステップS203で、以上のようにして設定した各ブロックの領域データの集合をテンプレートとして登録保存する。たとえば、図7では既存のテンプレート群の4番目に新規に「文書Aテンプレート」という名称で登録される例を表わしている。
【0017】
図8はテンプレートデータへの「文書Aテンプレート」の登録状態を示す図である。図5で示したように文書Aには矩形枠501〜505で示される領域が設定されているので、文書Aテンプレートには5つのブロックが登録されることになる。なお、ブロック1〜5のどのブロックにどの矩形枠が対応するかは、例えば、矩形枠の指定の順番に従って決定すればよい。
【0018】
以上のようにして登録されたテンプレートを用いて、新たに読み込まれた画像から所望の領域を抽出する処理について図3のフローチャートを参照して説明する。
【0019】
まず、ステップS301で所望の領域を抽出するのに必要なテンプレートを選択する。本例では、図7の如く登録されているテンプレートのテンプレート名をディスプレイ108上に表示し、マウス103を用いて所望のテンプレートをオペレータに選択させる。次に、ステップS302で処理対象の文書をスキャナ101で読み取り、後の領域分割処理のためにこれを2値の画像データに変換する。本例では図5の如く設定された文書テンプレートAを選択し、処理対象の文書として図9に示す文書Bを読み込んだものとして説明を行う。
【0020】
ステップS303では、得られた入力画像に対して、当業者には知られた領域分割処理を行ない、ブロックを抽出するとともに各ブロックの属性を判定する。図10は、文書Bについて領域分割処理を実行した結果例を示す図である。ブロックA〜Eの各ブロックは抽出領域情報として、図6に示した領域情報と同じデータ構造で格納される。すなわち、抽出された各ブロックの位置と属性を表す情報が格納される。
【0021】
次に、ステップS304で、文書Bから抽出されたブロックと、選択したテンプレート(文書Aテンプレート)に保存されているブロックとで、夫々の領域データを比較する。そして、ステップS305において、領域の少なくとも一部が重複するとともに、重複した領域どうしの属性が一致するブロックを抽出する。ステップS305で抽出されたブロックがあれば、そのブロックが所望のブロックと同一のブロックとみなされ、当該ブロックの領域内の画像が出力される(ステップS306)。
【0022】
図11はテンプレートと文書の各ブロックの比較の様子を説明する図である。図11において、文書Aテンプレートに記録されているブロックが点線で、文書Bの画像から抽出されたブロックが2点破線で示されている。文書Bより抽出されたブロックA及びブロックBは、文書Aテンプレートのブロック位置と多少ずれているが、重複する部分が存在している。また、これら領域の属性はともに「テキスト」であるので、これらブロックA、ブロックBはステップS305で抽出される。結局、図10で得られた文書Bの全てのブロックA〜Eの領域データが出力されることとなる。
【0023】
以上説明したように、第1の実施形態によれば、テンプレートにおいて設定されている領域の位置と実際に読み取った文書画像から抽出すべき領域の位置が多少ずれていても、確実に所望領域を抽出することができる。
【0024】
[第2の実施形態]
上述の第1の実施形態では、テンプレートに保存する領域の設定をマウス103を用いてマニュアルにて行っていたが、このようなテンプレート保存のための領域設定処理を、ステップS303で行うような領域分割処理を用いて自動化することも可能である。
【0025】
処理の流れについて図12のフローチャートに従って説明する。図12は第2の実施形態によるテンプレート保存処理の手順を表すフローチャートである。
【0026】
ステップS1201で保存したい書式をもった文書A(図4)をスキャナで読み込み2値の画像データに変換する。得られた入力画像に対してステップS1202で領域分割処理を行い、テキスト領域、図形領域、表領域、タイトル領域等の各種領域(ブロック)を抽出する。この場合の領域分割処理の結果を図13に示す。このように各ブロックが抽出され、ブロック毎に領域分割データとして、各種属性に対応した識別番号および、位置情報が得られる。このときの当該文書に対する領域データの構造は図6に示した構造と同じものとすることができる。そして、ステップS1203では、抽出した各ブロックの領域データを図8に示すように「文書Aテンプレート」として登録保存する。
【0027】
以上のように構成すれば、テンプレートとなる文書をスキャナ101によって読みとらせるだけで、自動的にテンプレートが生成されるので、操作性が向上する。
【0028】
[第3の実施形態]
第2の実施形態では、テンプレート保存処理における領域分割処理によって抽出された全領域をテンプレートとして保存したが、抽出された領域のうちの所望の領域を選択してテンプレートとして保存するようにすることもできる。第3の実施形態では、領域分割処理において抽出したブロックのうちの特定のブロックをマウス103等で指示し、そのブロックの領域分割データのみをテンプレートとして保存する。
【0029】
図14は第3の実施形態におけるテンプレート保存処理の手順を示すフローチャートである。以下、第3の実施形態の処理の流れについて
図14のフローチャートに従って説明する。
【0030】
ステップS1401で、保存したい書式をもった文書A(図4)をスキャナ101で読み込み2値の画像データに変換する。ステップS1402では、得られた入力画像に対して領域分割処理を行い、テキスト領域、タイトル領域、図形領域、表領域等の各種領域(ブロック)を抽出する。この抽出の結果は、第2の実施形態(図13)で説明したとおりである。
【0031】
次に、ステップS1403では、抽出したブロックのうち特定のブロックをマウス103を用いて選択する。図15は、ブロック3及びブロック5が選択された状態を表す図である。図15の例の場合、選択されたブロックは斜線でハッチングされ、それ以外のブロックと区別される。
【0032】
ステップS1404では、ステップS1404で選択されたブロックの領域分割データ(属性と位置情報等)のみをテンプレートとして保存する。本例では、図16に示されるように、ブロック3とブロック5の領域分割データのみが文書Aテンプレートとして保存される。
【0033】
以上のようにして保存された文書Aテンプレートを用いて図9に示した文書Bを処理した場合を説明する。図17は、図15で選択したブロックのみのテンプレートを用いて文書Bから所望の領域を抽出する場合の、テンプレートと文書の各ブロックの比較結果を説明する図である。この例の場合、テンプレートに記録されているブロック(点線)と文書Bのブロック(2点破線)のうち、重複しかつ同一属性であると判定されたブロックCおよびブロックEの領域分割データのみが出力されることになる。
【0034】
以上説明したように、第3の実施形態によれば、自動的に抽出された領域データから所望の領域を選択してテンプレートとすることができる。
【0035】
[第4の実施形態]
上記第3の実施形態では、テンプレートとして保存すべき領域を指定したが、テンプレートとして保存しない領域を指定するようにしてももちろん良い。第4の実施形態では、領域分割処理によって抽出したブロックのうちの所望の領域をマウス等で指示し、指示されたブロック以外のブロックの領域データををテンプレートとして保存する。
【0036】
図18は第4の実施形態によるテンプレート保存処理を説明するフローチャートである。まず、ステップS1801で、保存したい書式をもった文書A(図4)をスキャナ101で読み込み、2値の画像データに変換する。ステップS1802では、得られた入力画像に対して領域分割処理を行い、テキスト領域、タイトル領域、図形領域、表領域等の各種領域(ブロック)を抽出する。この抽出によって、第2の実施形態(図13)で説明したとおりの結果が得られる。
【0037】
次に、ステップS1803では、抽出したブロックのうち、所望のブロックをマウス103を用いて選択する。図15は、ブロック3及びブロック5が選択された状態を表す図である。選択されたブロックは、図15で説明したように、斜線でハッチングされ、それ以外のブロックと区別されるとともに、選択されたブロックの領域データは削除される。なお、上記では選択されたブロックの矩形領域内にハッチングを施しているが、これに限られるものではない。例えば、領域データの削除と共に、当該ブロックの矩形を表す枠線を消去するようにしてもよい。
【0038】
ステップS1804では、ステップS1804で選択されなかったブロックの領域分割データ(属性と位置情報等)のみをテンプレートとして保存する。本例では、図15のように選択した結果、ブロック1、2、4の領域分割データのみが文書Aテンプレートとして保存される。
【0039】
[第5の実施形態]
上記各実施形態では、処理対象の文書を逐一スキャナ101にセットして、読み込ませているが、ADF(オートドキュメントフィーダー)等を用いて大量の文書をスキャナ101で入力した場合のテンプレートによる自動抽出も可能である。図19は第5の実施形態における領域抽出処理の手順を説明するフローチャートである。以下、処理の流れについて図19のフローチャートに従って説明する。なお、ステップS1901、S1903〜S1907の各処理は、第1の実施形態(図3)におけるステップS301〜S306と同様である。
【0040】
ステップS1901で所望の領域を抽出するのに用いる所望のテンプレートを選択する。ステップS1902では入力すべき文書があるか否か、すなわちADF上に文書があるか否かを判断する。入力すべき文書があればステップS1903へ進み、文書をスキャナ101で読み込み、2値の画像データに変換する。一方、ステップS1902で入力すべき文書が無ければ本処理を終了する。
【0041】
次に、得られた入力画像に対しステップS1904で領域分割を行ない、ブロックを抽出する。例えば、ステップS1903において図9の如き文書Bを読み込んだ場合、ステップS1904における領域分割処理によって図10に示すような結果が得られる。
【0042】
ステップS1905では、ステップS1904の領域分割処理によって抽出されたブロックと、ステップS1901で選択したテンプレートに保存されているブロックとで、領域データを比較する。そして、ステップS1906において、領域が重複しかつ同一の属性の領域データを有するブロックを抽出する。ここで抽出されたブロックは、テンプレートに定義されている所望のブロックと同一のブロックであるとみなされ、ブロックの領域分割データが出力される(ステップS1907)。
【0043】
例えば図5に示した文書Aに基づいて得られた文書Aテンプレートを選択し、図9の如き文書Bをスキャナ101で読み込んで処理すると、図11のように領域が重複する(文書Aテンプレートに記録されているブロックを破線で、文書Bより抽出されたブロックを2点鎖線で示した)。そして、夫々領域が重複しているブロックの属性が等しい(図5と図10を参照)ので、図10で得られた文書Bの全てのブロックの領域のデータが出力されることとなる。そして、ステップS1902に戻り、処理を続行する。
【0044】
以上説明した様に、上記各実施形態によればテンプレートによって文書画像から所望の領域を抽出する際の、▲1▼オペレータの介在の削減、▲2▼所望領域抽出の正確性の向上、▲3▼大量文書の自動処理、▲4▼操作性の向上、▲5▼処理全体の時間の短縮等がはかれる効果がある。
【0045】
なお、上記各実施形態では、ブロック領域を矩形領域で設定しているが、円形、楕円形等、閉領域であればどのような形状でもよいであろう。
【0046】
なお、本発明は、複数の機器(例えばホストコンピュータ,インタフェイス機器,リーダ,プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機,ファクシミリ装置など)に適用してもよい。
【0047】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0048】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0049】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク,ハードディスク,光ディスク,光磁気ディスク,CD−ROM,CD−R,磁気テープ,不揮発性のメモリカード,ROMなどを用いることができる。
【0050】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0051】
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0052】
【発明の効果】
以上説明したように本発明によれば、テンプレートを採用しつつ、入力した文書画像中より所望の領域を確実に抽出することが可能となる。
【0053】
【図面の簡単な説明】
【図1】第1の実施形態による画像処理装置の構成を示すブロック図である。
【図2】第1の実施形態におけるテンプレート保存処理の手順を説明するフローチャートである。
【図3】第1の実施形態における領域抽出処理の手順を説明するフローチャートである。
【図4】テンプレートデータ生成のために読み込む文書例(文書A)を示す図である。
【図5】第1の実施形態によるテンプレート保存処理における領域設定操作画面の表示例を示す図である。
【図6】上述した領域指定及び属性設定によって生成されるテンプレートデータのデータ構成を説明する図である。
【図7】テンプレートデータの登録状態を説明する図である。
【図8】テンプレートデータへの「文書Aテンプレート」の登録状態を示す図である。
【図9】処理対象例である文書Bを示す図である。
【図10】図9の文書Bについて領域分割処理を実行した結果例を示す図である。
【図11】テンプレートと文書の各ブロックの比較の様子を説明する図である。
【図12】第2の実施形態によるテンプレート保存処理の手順を表すフローチャートである。
【図13】この場合の領域分割処理の結果を示す図である。
【図14】第3の実施形態におけるテンプレート保存処理の手順を示すフローチャートである。
【図15】第3の実施形態のテンプレート保存処理において、ブロック3及びブロック5が選択された状態を表す図である。
【図16】第3の実施形態における文書Aテンプレートのデータ構成を示す図である。
【図17】図16の文書Aテンプレートを用いて文書Bから所望の領域を抽出する場合の、各ブロックの比較結果を説明する図である。
【図18】第4の実施形態によるテンプレート保存処理を説明するフローチャートである。
【図19】第5の実施形態における領域抽出処理の手順を説明するフローチャートである。

Claims (11)

  1. 画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持手段と、
    前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択手段と、
    文書画像を入力する画像入力手段と、
    前記画像入力手段で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出されたブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出手段と、
    前記領域抽出手段で抽出されたブロック領域のうち、前記選択手段でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出手段と
    を備えることを特徴とする画像処理装置。
  2. 前記保持手段は、
    入力された画像に対して領域及び各領域の属性を設定する設定手段と、
    前記設定手段で設定された領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記設定手段は、前記入力された画像からブロック領域とその属性を領域分割処理により自動的に抽出することによって、前記テンプレート情報とすべき領域及び各領域の属性の設定を行う
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記保持手段は、
    入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得手段と、
    前記領域獲得手段によって得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択手段と、
    前記領域選択手段で選択されたブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  5. 前記保持手段は、
    入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得手段と、
    前記領域獲得手段によって得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択手段と、
    前記領域選択手段で選択されたブロック領域以外のブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  6. 保持手段が、画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持工程と、
    選択手段が、前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択工程と、
    画像入力手段が、文書画像を入力する画像入力工程と、
    領域抽出手段が、前記画像入力工程で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出されたブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出工程と、
    抽出手段が、前記領域抽出工程で抽出されたブロック領域のうち、前記選択工程でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出工程と
    を備えることを特徴とする画像処理方法。
  7. 前記保持工程は、
    設定手段が、入力された画像に対して領域及び各領域の属性を設定する設定工程と、
    登録手段が、前記設定工程で設定された領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録工程と
    を備えることを特徴とする請求項6に記載の画像処理方法。
  8. 前記設定工程では、前記入力された画像からブロック領域とその属性を領域分割処理により自動的に抽出することによって、前記テンプレート情報とすべき領域及び各領域の属性の設定を行う
    ことを特徴とする請求項7に記載の画像処理方法。
  9. 前記保持工程は、
    領域獲得手段が、入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得工程と、
    領域選択手段が、前記領域獲得工程によって得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択工程と、
    前記領域選択工程で選択されたブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録工程と
    を備えることを特徴とする請求項6に記載の画像処理方法。
  10. 前記保持工程は、
    領域獲得手段が、入力された画像に領域分割処理を行うことにより、複数のブロック領域とその属性を獲得する領域獲得工程と、
    領域選択手段が、前記領域獲得工程で得られた複数のブロック領域から、1乃至複数のブロック領域をオペレータに選択させる領域選択肯定と、
    登録手段が、前記領域選択工程で選択されたブロック領域以外のブロック領域の位置と大きさと属性とに関する情報を前記テンプレート情報として登録する登録工程と
    を備えることを特徴とする請求項6に記載の画像処理方法。
  11. コンピュータに、
    保持手段が、画像上の1つまたは複数の領域についての位置と大きさと各領域の属性とに関する情報をテンプレート情報として、複数種類のテンプレート情報を保持する保持工程、
    選択手段が、前記保持手段に保持されている複数種類のテンプレート情報のうちの1つをオペレータに選択させる選択工程、
    画像入力手段が、文書画像を入力する画像入力工程、
    領域抽出手段が、前記画像入力工程で入力された文書画像に領域分割処理を実行することによってブロック領域を抽出するとともに、抽出されたブロック領域の属性が、テキスト属性と表属性と図形属性とを含む複数種類の属性のうちのいずれであるかを判定する領域抽出工程、
    抽出手段が、前記領域抽出工程で抽出されたブロック領域のうち、前記選択工程でオペレータにより選択されたテンプレート情報によって示される領域と少なくとも一部が重なり、その属性が該テンプレート情報の該少なくとも一部が重なった領域に設定されている属性と一致するブロック領域を抽出する抽出工程、
    を実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体。
JP00339698A 1998-01-09 1998-01-09 画像処理装置及び方法 Expired - Fee Related JP4100746B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP00339698A JP4100746B2 (ja) 1998-01-09 1998-01-09 画像処理装置及び方法
US09/221,840 US6411731B1 (en) 1998-01-09 1998-12-29 Template-based image recognition and extraction
EP98310810A EP0929183B1 (en) 1998-01-09 1998-12-31 Image processing apparatus and method
DE69838579T DE69838579T2 (de) 1998-01-09 1998-12-31 Bildverarbeitungsvorrichtung und -verfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00339698A JP4100746B2 (ja) 1998-01-09 1998-01-09 画像処理装置及び方法

Publications (2)

Publication Number Publication Date
JPH11203491A JPH11203491A (ja) 1999-07-30
JP4100746B2 true JP4100746B2 (ja) 2008-06-11

Family

ID=11556211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00339698A Expired - Fee Related JP4100746B2 (ja) 1998-01-09 1998-01-09 画像処理装置及び方法

Country Status (4)

Country Link
US (1) US6411731B1 (ja)
EP (1) EP0929183B1 (ja)
JP (1) JP4100746B2 (ja)
DE (1) DE69838579T2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3913985B2 (ja) * 1999-04-14 2007-05-09 富士通株式会社 文書画像中の基本成分に基づく文字列抽出装置および方法
JP3756719B2 (ja) 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
CA2310943A1 (en) * 2000-06-02 2001-12-02 Michael J. Sikorsky Methods, techniques, software and systems for providing context independent, protocol independent portable or reusable development tools
JP2002032770A (ja) * 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
JP2002259991A (ja) * 2001-02-28 2002-09-13 Sony Corp 画像処理装置およびその方法
FR2831752A1 (fr) * 2001-10-30 2003-05-02 Laurent Michel Procede et installation de saisie de fiches a l'aide d'un poste de saisie
US6840666B2 (en) 2002-01-23 2005-01-11 Marena Systems Corporation Methods and systems employing infrared thermography for defect detection and analysis
US7538815B1 (en) 2002-01-23 2009-05-26 Marena Systems Corporation Autofocus system and method using focus measure gradient
JP3624186B2 (ja) * 2002-03-15 2005-03-02 Tdk株式会社 スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置
US7538903B2 (en) * 2002-07-11 2009-05-26 Stone Cheng Method for scanning by using a virtual frame holder
US8849031B2 (en) * 2005-10-20 2014-09-30 Xerox Corporation Document analysis systems and methods
CN101173853B (zh) * 2006-11-01 2011-02-02 鸿富锦精密工业(深圳)有限公司 定位测量装置及方法
US7778953B2 (en) * 2007-02-19 2010-08-17 Kabushiki Kaisha Toshiba Document management apparatus and document management method
US10916043B2 (en) * 2007-11-26 2021-02-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for generating a template for arranging at least one object at at least one place
US20090279127A1 (en) * 2008-05-08 2009-11-12 Infoprint Solutions Company Llc Mechanism for data extraction of variable positioned data
JP2010033360A (ja) * 2008-07-29 2010-02-12 Canon Inc 情報処理装置、ジョブ処理方法、記憶媒体及びプログラム
JP2010044544A (ja) 2008-08-12 2010-02-25 Canon Inc 画像処理装置、情報処理装置、情報処理方法、及びプログラム
JP5300534B2 (ja) * 2009-03-10 2013-09-25 キヤノン株式会社 画像処理装置および画像処理方法及びプログラム
JP2010211466A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
US20110029914A1 (en) * 2009-07-30 2011-02-03 Whitby Laura R Apparatus for generating artistic image template designs
US8854395B2 (en) * 2009-07-30 2014-10-07 Intellectual Ventures Fund 83 Llc Method for producing artistic image template designs
US20110029635A1 (en) * 2009-07-30 2011-02-03 Shkurko Eugene I Image capture device with artistic template design
US20110029562A1 (en) * 2009-07-30 2011-02-03 Whitby Laura R Coordinating user images in an artistic design
US8422794B2 (en) 2009-07-30 2013-04-16 Intellectual Ventures Fund 83 Llc System for matching artistic attributes of secondary image and template to a primary image
US8849853B2 (en) * 2009-07-30 2014-09-30 Intellectual Ventures Fund 83 Llc Method for matching artistic attributes of a template and secondary images to a primary image
CN102023966B (zh) * 2009-09-16 2014-03-26 鸿富锦精密工业(深圳)有限公司 用于合约比较的计算机系统及合约比较方法
TR200907868A2 (tr) * 2009-10-16 2011-05-23 Vestel Elektron�K Sanay� Ve T�Caret Anon�M ��Rket�@ Siyah transparan bölgeler içeren otomatik test metodu
JP6010744B2 (ja) * 2012-05-31 2016-10-19 株式会社Pfu 文書作成システム、文書作成装置、文書作成方法、及びプログラム
JP6233142B2 (ja) * 2014-03-28 2017-11-22 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
KR20160027862A (ko) * 2014-09-02 2016-03-10 삼성전자주식회사 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치
JP2016200967A (ja) 2015-04-09 2016-12-01 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6113760A (ja) 1984-06-29 1986-01-22 Dainippon Screen Mfg Co Ltd 画像走査記録方法
JPS62181570A (ja) 1986-02-05 1987-08-08 Minolta Camera Co Ltd 画像編集装置
US5038392A (en) 1990-02-12 1991-08-06 International Business Machines Corporation Method and apparatus for adaptive image processing by recognizing a characterizing indicium in a captured image of a document
US6002798A (en) * 1993-01-19 1999-12-14 Canon Kabushiki Kaisha Method and apparatus for creating, indexing and viewing abstracted documents
JPH07131641A (ja) * 1993-11-08 1995-05-19 Canon Inc 画像処理装置
US5987171A (en) 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
US5852676A (en) * 1995-04-11 1998-12-22 Teraform Inc. Method and apparatus for locating and identifying fields within a document
US5774579A (en) * 1995-08-11 1998-06-30 Canon Kabushiki Kaisha Block selection system in which overlapping blocks are decomposed
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images

Also Published As

Publication number Publication date
EP0929183B1 (en) 2007-10-17
EP0929183A3 (en) 2000-05-10
DE69838579T2 (de) 2008-07-24
DE69838579D1 (de) 2007-11-29
US6411731B1 (en) 2002-06-25
EP0929183A2 (en) 1999-07-14
JPH11203491A (ja) 1999-07-30

Similar Documents

Publication Publication Date Title
JP4100746B2 (ja) 画像処理装置及び方法
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US8422796B2 (en) Image processing device
JP4785655B2 (ja) 文書処理装置及び文書処理方法
US20130326341A1 (en) Digital comic editor, method and non-transitorycomputer-readable medium
JP6938318B2 (ja) 情報処理装置、情報処理方法及びプログラム
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
US20060290964A1 (en) Image processing system and image processing method, and computer program
US8355577B2 (en) Image processing apparatus and method
JPH05189336A (ja) 文書認識装置および認識処理方法
JPH032979A (ja) 画像修正方法及び装置
US20050102327A1 (en) Data file processor, data file processing method and program
US8194982B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP4756650B2 (ja) 画像処理装置、読み順設定方法及びプログラム
US6996293B1 (en) Reduced image forming method and apparatus
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP6481204B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP4334987B2 (ja) 領域指定機能およびデータ切り出し機能を備えたdtp編集装置
JP6795770B2 (ja) 情報処理装置と、その処理方法及びプログラム
JP3412998B2 (ja) 画像処理装置及びその方法
JPH103516A (ja) 情報処理方法及び装置
JP2005043995A (ja) 情報処理装置、文字認識プログラム及び記録媒体
JPH11224308A (ja) 文字認識装置及びその方法
JP2000312290A (ja) データ処理方法及び装置及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20041210

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080111

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080318

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees