JPH11203491A - 画像処理装置及び方法 - Google Patents

画像処理装置及び方法

Info

Publication number
JPH11203491A
JPH11203491A JP339698A JP339698A JPH11203491A JP H11203491 A JPH11203491 A JP H11203491A JP 339698 A JP339698 A JP 339698A JP 339698 A JP339698 A JP 339698A JP H11203491 A JPH11203491 A JP H11203491A
Authority
JP
Japan
Prior art keywords
area
attribute
block
template information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP339698A
Other languages
English (en)
Other versions
JP4100746B2 (ja
Inventor
Kazuyuki Saito
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP00339698A priority Critical patent/JP4100746B2/ja
Priority to US09/221,840 priority patent/US6411731B1/en
Priority to DE69838579T priority patent/DE69838579T2/de
Priority to EP98310810A priority patent/EP0929183B1/en
Publication of JPH11203491A publication Critical patent/JPH11203491A/ja
Application granted granted Critical
Publication of JP4100746B2 publication Critical patent/JP4100746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【課題】テンプレートを採用しつつ、入力した文書画像
中より所望の領域を確実に抽出することを可能とする。 【解決手段】画像上の1つまたは複数の領域について、
位置、大きさ及び属性がテンプレート情報として保持さ
れる。ステップS301では、所望のテンプレートを選
択し、ステップS302ではスキャナより文書画像を入
力する。ステップS303では、スキャナより入力され
た文書画像からブロック領域を抽出するとともに、抽出
されたブロック領域の属性を判定する。ステップS30
4、S305では、ステップS303で抽出されたブロ
ック領域のうち、テンプレート情報によって示される領
域と少なくとも一部が重なり、その属性が該テンプレー
ト情報に設定されている属性と一致するブロック領域を
抽出する。ステップS306では、ステップS305で
抽出されたブロック領域が出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、OCR(光学的文
字認識装置)、複写機、ファクシミリ、電子データベー
ス化の処理装置等の電子装置において、特に文書画像よ
り特定の所望領域を抽出するための画像処理装置及び方
法に関するものである。
【0002】
【従来の技術】一般に、文書から所望の領域を抽出する
には次の2とおりの方法がある。第1の方法は、入力画
像に対してオペレータが所望の抽出すべき領域をその都
度指定する。例えば、スキャナで文書画像を読み取り、
読み取った画像をディスプレイ上に表示して、オペレー
タが所望の領域をマウス等を用いて指定する方法であ
る。
【0003】また、第2の方法は、あらかじめ矩形の位
置情報を定めたテンプレートを作成しておき、このテン
プレートに定められた矩形領域をそのまま入力画像に当
てはめて抽出するものである。この場合、読み取られた
文書画像中から、テンプレートで定められた位置及び大
きさの矩形領域が抽出されることになり、オペレータが
一つ一つ抽出領域を指定するという手間が省けることに
なる。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
第1の方法では、オペレータが所望の領域をその都度指
定しなければならず、大量文書の処理には不向きであ
る。またテンプレートを用いる第2の方法においても、
入力画像の抽出すべき所望の領域とテンプレートで設定
されている領域との間に、位置や大きさのずれがある場
合には、所望領域が欠けて抽出されてしまうという問題
がある。
【0005】本発明は上記の問題に鑑みてなされたもの
であり、テンプレートを採用しつつ、入力した文書画像
中より所望の領域を確実に抽出することが可能な画像処
理装置及び方法を提供することを目的とする。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による画像処理装置は例えば以下の
構成を備える。すなわち、画像上の1つまたは複数の領
域について、位置、大きさ及び属性をテンプレート情報
として保持する保持手段と、文書画像を入力する画像入
力手段と、前記画像入力手段で入力された文書画像から
ブロック領域を抽出するとともに、抽出された領域の属
性を判定する領域抽出手段と、前記領域抽出手段で抽出
されたブロック領域のうち、前記テンプレート情報によ
って示される領域と少なくとも一部が重なり、その属性
が該テンプレート情報に設定されている属性と一致する
ブロック領域を抽出する抽出手段とを備える。
【0007】また、上記の目的を達成するための本発明
の他の態様による画像処理方法は例えば以下の工程を備
えている。すなわち、画像上の1つまたは複数の領域に
ついて、位置、大きさ及び属性をテンプレート情報とし
て保持する保持工程と、文書画像を入力する画像入力工
程と、前記画像入力工程で入力された文書画像からブロ
ック領域を抽出するとともに、抽出された領域の属性を
判定する領域抽出工程と、前記領域抽出工程で抽出され
たブロック領域のうち、前記テンプレート情報によって
示される領域と少なくとも一部が重なり、その属性が該
テンプレート情報に設定されている属性と一致するブロ
ック領域を抽出する抽出工程とを備える。
【0008】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な実施形態を説明する。
【0009】[第1の実施形態]図1は第1の実施形態
による画像処理装置の構成を示すブロック図である。図
1において、101は画像原稿に光を照射し、その反射
光を読み取り電気信号に変換するスキャナ、102はス
キャナ101で得られた電気信号を2値のデジタル電気
信号に変換し他の装置構成要素に伝送するためのスキャ
ナインタフェース回路、103はディスプレイのウィン
ドウ上で所望とする座標を入力するためのポインティン
グデバイス(本例ではマウスを用いるので、以下マウス
103と称する)、104はマウス103からの信号を
受け、それを他の装置構成要素に伝送するためのインタ
ーフェース回路である。
【0010】105はCPUであり、装置全体の制御及
び領域分割処理等を実行する。106はROMであり、
CPU105が実行する制御プログラム、各種処理プロ
グラムやフォントデータなどを格納する。107はRA
Mであり、文書画像の展開や領域分割処理のための作業
領域などとして用いられる。
【0011】また、108は入力イメージ等を表示する
ためのディスプレイ、109はディスプレイインターフ
ェース回路である。ディスプレイ108には、RAM1
07の所定アドレスエリアに格納されているVRAM領
域のイメージが表示される。110は、データ等が格納
されるハードディスク等の外部記憶装置で、111はそ
のインタフェースである。そして112は各装置構成要
素を接続するバスである。
【0012】次に、第1の実施形態における処理の流れ
について、図2のフローチャートおよび図3のフローチ
ャートに沿って説明する。図2は第1の実施形態におけ
るテンプレート保存処理の手順を説明するフローチャー
トである。また、図3は、第1の実施形態における領域
抽出処理の手順を説明するフローチャートである。
【0013】まず、領域抽出に用いるテンプレート保存
処理について図2を参照して説明する。ステップS20
1で保存したい書式をもった図4の如き文書Aをスキャ
ナ101で読み込み、後の領域分割処理のために2値の
画像データに変換する。次に、ステップS202におい
て、得られた入力画像に対して、“テキスト”や“表”
や“図形”等の属性をもった小領域(以後、領域或はブ
ロックと呼ぶ)ごとに領域設定を行う。なお、ステップ
S202で用いられる領域分割処理は、当業者に知られ
た手法を採用すればよい。
【0014】本例では、図4の文書Aをスキャナで読み
取り、読み取った画像をディスプレイ108に表示す
る。図5は第1の実施形態によるテンプレート保存処理
における領域設定操作画面の表示例を示す図である。デ
ィスプレイ108中には、文書Aの画像と共に属性メニ
ュー51も表示される。マウス103を操作して属性メ
ニュー51から所望の属性を選択し、マウス103で矩
形領域を示す枠を指定する。このようにして、所望の位
置にその属性の枠を描くことで、各矩形領域毎に属性が
設定される。なお、マウス103の操作によって描画さ
れる矩形枠の線色は、属性メニュー51から所望の属性
を指定すると、指定された属性に対応付けられた色に設
定される。図5において、矩形枠501の線色は黒であ
り、当該領域の属性が「テキスト」であることを表して
いる。また、矩形枠502の線色は赤であり、当該領域
の属性が「表」であることを表している。更に、矩形枠
504の線色は黄であり、当該矩形領域の属性が「図
形」であることを表している。
【0015】図6は、上述した領域指定及び属性設定に
よって生成されるテンプレートデータのデータ構成を説
明する図である。図6(a)に示すように、各領域毎
(ブロック毎)に領域データが格納される。領域データ
は、当該領域の始点X、Y座標、幅、高さ(すなわちマ
ウス103で描画した矩形枠の位置情報)を登録すると
共に、「属性」の欄には当該矩形枠に設定された属性に
対応する識別番号が設定される。各属性と識別番号は図
6(b)に示す通りである。
【0016】次に、ステップS203で、以上のように
して設定した各ブロックの領域データの集合をテンプレ
ートとして登録保存する。たとえば、図7では既存のテ
ンプレート群の4番目に新規に「文書Aテンプレート」
という名称で登録される例を表わしている。
【0017】図8はテンプレートデータへの「文書Aテ
ンプレート」の登録状態を示す図である。図5で示した
ように文書Aには矩形枠501〜505で示される領域
が設定されているので、文書Aテンプレートには5つの
ブロックが登録されることになる。なお、ブロック1〜
5のどのブロックにどの矩形枠が対応するかは、例え
ば、矩形枠の指定の順番に従って決定すればよい。
【0018】以上のようにして登録されたテンプレート
を用いて、新たに読み込まれた画像から所望の領域を抽
出する処理について図3のフローチャートを参照して説
明する。
【0019】まず、ステップS301で所望の領域を抽
出するのに必要なテンプレートを選択する。本例では、
図7の如く登録されているテンプレートのテンプレート
名をディスプレイ108上に表示し、マウス103を用
いて所望のテンプレートをオペレータに選択させる。次
に、ステップS302で処理対象の文書をスキャナ10
1で読み取り、後の領域分割処理のためにこれを2値の
画像データに変換する。本例では図5の如く設定された
文書テンプレートAを選択し、処理対象の文書として図
9に示す文書Bを読み込んだものとして説明を行う。
【0020】ステップS303では、得られた入力画像
に対して、当業者には知られた領域分割処理を行ない、
ブロックを抽出するとともに各ブロックの属性を判定す
る。図10は、文書Bについて領域分割処理を実行した
結果例を示す図である。ブロックA〜Eの各ブロックは
抽出領域情報として、図6に示した領域情報と同じデー
タ構造で格納される。すなわち、抽出された各ブロック
の位置と属性を表す情報が格納される。
【0021】次に、ステップS304で、文書Bから抽
出されたブロックと、選択したテンプレート(文書Aテ
ンプレート)に保存されているブロックとで、夫々の領
域データを比較する。そして、ステップS305におい
て、領域の少なくとも一部が重複するとともに、重複し
た領域どうしの属性が一致するブロックを抽出する。ス
テップS305で抽出されたブロックがあれば、そのブ
ロックが所望のブロックと同一のブロックとみなされ、
当該ブロックの領域内の画像が出力される(ステップS
306)。
【0022】図11はテンプレートと文書の各ブロック
の比較の様子を説明する図である。図11において、文
書Aテンプレートに記録されているブロックが点線で、
文書Bの画像から抽出されたブロックが2点破線で示さ
れている。文書Bより抽出されたブロックA及びブロッ
クBは、文書Aテンプレートのブロック位置と多少ずれ
ているが、重複する部分が存在している。また、これら
領域の属性はともに「テキスト」であるので、これらブ
ロックA、ブロックBはステップS305で抽出され
る。結局、図10で得られた文書Bの全てのブロックA
〜Eの領域データが出力されることとなる。
【0023】以上説明したように、第1の実施形態によ
れば、テンプレートにおいて設定されている領域の位置
と実際に読み取った文書画像から抽出すべき領域の位置
が多少ずれていても、確実に所望領域を抽出することが
できる。
【0024】[第2の実施形態]上述の第1の実施形態
では、テンプレートに保存する領域の設定をマウス10
3を用いてマニュアルにて行っていたが、このようなテ
ンプレート保存のための領域設定処理を、ステップS3
03で行うような領域分割処理を用いて自動化すること
も可能である。
【0025】処理の流れについて図12のフローチャー
トに従って説明する。図12は第2の実施形態によるテ
ンプレート保存処理の手順を表すフローチャートであ
る。
【0026】ステップS1201で保存したい書式をも
った文書A(図4)をスキャナで読み込み2値の画像デ
ータに変換する。得られた入力画像に対してステップS
1202で領域分割処理を行い、テキスト領域、図形領
域、表領域、タイトル領域等の各種領域(ブロック)を
抽出する。この場合の領域分割処理の結果を図13に示
す。このように各ブロックが抽出され、ブロック毎に領
域分割データとして、各種属性に対応した識別番号およ
び、位置情報が得られる。このときの当該文書に対する
領域データの構造は図6に示した構造と同じものとする
ことができる。そして、ステップS1203では、抽出
した各ブロックの領域データを図8に示すように「文書
Aテンプレート」として登録保存する。
【0027】以上のように構成すれば、テンプレートと
なる文書をスキャナ101によって読みとらせるだけ
で、自動的にテンプレートが生成されるので、操作性が
向上する。
【0028】[第3の実施形態]第2の実施形態では、
テンプレート保存処理における領域分割処理によって抽
出された全領域をテンプレートとして保存したが、抽出
された領域のうちの所望の領域を選択してテンプレート
として保存するようにすることもできる。第3の実施形
態では、領域分割処理において抽出したブロックのうち
の特定のブロックをマウス103等で指示し、そのブロ
ックの領域分割データのみをテンプレートとして保存す
る。
【0029】図14は第3の実施形態におけるテンプレ
ート保存処理の手順を示すフローチャートである。以
下、第3の実施形態の処理の流れについて図14のフロ
ーチャートに従って説明する。
【0030】ステップS1401で、保存したい書式を
もった文書A(図4)をスキャナ101で読み込み2値
の画像データに変換する。ステップS1402では、得
られた入力画像に対して領域分割処理を行い、テキスト
領域、タイトル領域、図形領域、表領域等の各種領域
(ブロック)を抽出する。この抽出の結果は、第2の実
施形態(図13)で説明したとおりである。
【0031】次に、ステップS1403では、抽出した
ブロックのうち特定のブロックをマウス103を用いて
選択する。図15は、ブロック3及びブロック5が選択
された状態を表す図である。図15の例の場合、選択さ
れたブロックは斜線でハッチングされ、それ以外のブロ
ックと区別される。
【0032】ステップS1404では、ステップS14
04で選択されたブロックの領域分割データ(属性と位
置情報等)のみをテンプレートとして保存する。本例で
は、図16に示されるように、ブロック3とブロック5
の領域分割データのみが文書Aテンプレートとして保存
される。
【0033】以上のようにして保存された文書Aテンプ
レートを用いて図9に示した文書Bを処理した場合を説
明する。図17は、図15で選択したブロックのみのテ
ンプレートを用いて文書Bから所望の領域を抽出する場
合の、テンプレートと文書の各ブロックの比較結果を説
明する図である。この例の場合、テンプレートに記録さ
れているブロック(点線)と文書Bのブロック(2点破
線)のうち、重複しかつ同一属性であると判定されたブ
ロックCおよびブロックEの領域分割データのみが出力
されることになる。
【0034】以上説明したように、第3の実施形態によ
れば、自動的に抽出された領域データから所望の領域を
選択してテンプレートとすることができる。
【0035】[第4の実施形態]上記第3の実施形態で
は、テンプレートとして保存すべき領域を指定したが、
テンプレートとして保存しない領域を指定するようにし
てももちろん良い。第4の実施形態では、領域分割処理
によって抽出したブロックのうちの所望の領域をマウス
等で指示し、指示されたブロック以外のブロックの領域
データををテンプレートとして保存する。
【0036】図18は第4の実施形態によるテンプレー
ト保存処理を説明するフローチャートである。まず、ス
テップS1801で、保存したい書式をもった文書A
(図4)をスキャナ101で読み込み、2値の画像デー
タに変換する。ステップS1802では、得られた入力
画像に対して領域分割処理を行い、テキスト領域、タイ
トル領域、図形領域、表領域等の各種領域(ブロック)
を抽出する。この抽出によって、第2の実施形態(図1
3)で説明したとおりの結果が得られる。
【0037】次に、ステップS1803では、抽出した
ブロックのうち、所望のブロックをマウス103を用い
て選択する。図15は、ブロック3及びブロック5が選
択された状態を表す図である。選択されたブロックは、
図15で説明したように、斜線でハッチングされ、それ
以外のブロックと区別されるとともに、選択されたブロ
ックの領域データは削除される。なお、上記では選択さ
れたブロックの矩形領域内にハッチングを施している
が、これに限られるものではない。例えば、領域データ
の削除と共に、当該ブロックの矩形を表す枠線を消去す
るようにしてもよい。
【0038】ステップS1804では、ステップS18
04で選択されなかったブロックの領域分割データ(属
性と位置情報等)のみをテンプレートとして保存する。
本例では、図15のように選択した結果、ブロック1、
2、4の領域分割データのみが文書Aテンプレートとし
て保存される。
【0039】[第5の実施形態]上記各実施形態では、
処理対象の文書を逐一スキャナ101にセットして、読
み込ませているが、ADF(オートドキュメントフィー
ダー)等を用いて大量の文書をスキャナ101で入力し
た場合のテンプレートによる自動抽出も可能である。図
19は第5の実施形態における領域抽出処理の手順を説
明するフローチャートである。以下、処理の流れについ
て図19のフローチャートに従って説明する。なお、ス
テップS1901、S1903〜S1907の各処理
は、第1の実施形態(図3)におけるステップS301
〜S306と同様である。
【0040】ステップS1901で所望の領域を抽出す
るのに用いる所望のテンプレートを選択する。ステップ
S1902では入力すべき文書があるか否か、すなわち
ADF上に文書があるか否かを判断する。入力すべき文
書があればステップS1903へ進み、文書をスキャナ
101で読み込み、2値の画像データに変換する。一
方、ステップS1902で入力すべき文書が無ければ本
処理を終了する。
【0041】次に、得られた入力画像に対しステップS
1904で領域分割を行ない、ブロックを抽出する。例
えば、ステップS1903において図9の如き文書Bを
読み込んだ場合、ステップS1904における領域分割
処理によって図10に示すような結果が得られる。
【0042】ステップS1905では、ステップS19
04の領域分割処理によって抽出されたブロックと、ス
テップS1901で選択したテンプレートに保存されて
いるブロックとで、領域データを比較する。そして、ス
テップS1906において、領域が重複しかつ同一の属
性の領域データを有するブロックを抽出する。ここで抽
出されたブロックは、テンプレートに定義されている所
望のブロックと同一のブロックであるとみなされ、ブロ
ックの領域分割データが出力される(ステップS190
7)。
【0043】例えば図5に示した文書Aに基づいて得ら
れた文書Aテンプレートを選択し、図9の如き文書Bを
スキャナ101で読み込んで処理すると、図11のよう
に領域が重複する(文書Aテンプレートに記録されてい
るブロックを破線で、文書Bより抽出されたブロックを
2点鎖線で示した)。そして、夫々領域が重複している
ブロックの属性が等しい(図5と図10を参照)ので、
図10で得られた文書Bの全てのブロックの領域のデー
タが出力されることとなる。そして、ステップS190
2に戻り、処理を続行する。
【0044】以上説明した様に、上記各実施形態によれ
ばテンプレートによって文書画像から所望の領域を抽出
する際の、オペレータの介在の削減、所望領域抽出
の正確性の向上、大量文書の自動処理、操作性の向
上、処理全体の時間の短縮等がはかれる効果がある。
【0045】なお、上記各実施形態では、ブロック領域
を矩形領域で設定しているが、円形、楕円形等、閉領域
であればどのような形状でもよいであろう。
【0046】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0047】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0048】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0049】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0050】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0051】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0052】
【発明の効果】以上説明したように本発明によれば、テ
ンプレートを採用しつつ、入力した文書画像中より所望
の領域を確実に抽出することが可能となる。
【0053】
【図面の簡単な説明】
【図1】第1の実施形態による画像処理装置の構成を示
すブロック図である。
【図2】第1の実施形態におけるテンプレート保存処理
の手順を説明するフローチャートである。
【図3】第1の実施形態における領域抽出処理の手順を
説明するフローチャートである。
【図4】テンプレートデータ生成のために読み込む文書
例(文書A)を示す図である。
【図5】第1の実施形態によるテンプレート保存処理に
おける領域設定操作画面の表示例を示す図である。
【図6】上述した領域指定及び属性設定によって生成さ
れるテンプレートデータのデータ構成を説明する図であ
る。
【図7】テンプレートデータの登録状態を説明する図で
ある。
【図8】テンプレートデータへの「文書Aテンプレー
ト」の登録状態を示す図である。
【図9】処理対象例である文書Bを示す図である。
【図10】図9の文書Bについて領域分割処理を実行し
た結果例を示す図である。
【図11】テンプレートと文書の各ブロックの比較の様
子を説明する図である。
【図12】第2の実施形態によるテンプレート保存処理
の手順を表すフローチャートである。
【図13】この場合の領域分割処理の結果を示す図であ
る。
【図14】第3の実施形態におけるテンプレート保存処
理の手順を示すフローチャートである。
【図15】第3の実施形態のテンプレート保存処理にお
いて、ブロック3及びブロック5が選択された状態を表
す図である。
【図16】第3の実施形態における文書Aテンプレート
のデータ構成を示す図である。
【図17】図16の文書Aテンプレートを用いて文書B
から所望の領域を抽出する場合の、各ブロックの比較結
果を説明する図である。
【図18】第4の実施形態によるテンプレート保存処理
を説明するフローチャートである。
【図19】第5の実施形態における領域抽出処理の手順
を説明するフローチャートである。

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 画像上の1つまたは複数の領域につい
    て、位置、大きさ及び属性をテンプレート情報として保
    持する保持手段と、 文書画像を入力する画像入力手段と、 前記画像入力手段で入力された文書画像からブロック領
    域を抽出するとともに、抽出されたブロック領域の属性
    を判定する領域抽出手段と、 前記領域抽出手段で抽出されたブロック領域のうち、前
    記テンプレート情報によって示される領域と少なくとも
    一部が重なり、その属性が該テンプレート情報に設定さ
    れている属性と一致するブロック領域を抽出する抽出手
    段とを備えることを特徴とする画像処理装置。
  2. 【請求項2】 前記保持手段は複数種類のテンプレート
    情報を保持し、 前記保持手段に保持された複数種類のテンプレート情報
    から、所望のテンプレート情報を選択する選択手段を更
    に備え、 前記抽出手段は前記選択手段で選択されたテンプレート
    情報を用いて前記文書画像よりのブロック領域の抽出を
    行うことを特徴とする請求項1に記載の画像処理装置。
  3. 【請求項3】 前記保持手段は、入力された画像に対し
    て領域及び属性を設定する設定手段と、 前記設定手段で設定された領域の位置及び大きさと属性
    をテンプレート情報として登録する登録手段とを備える
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 【請求項4】 前記設定手段は、前記領域抽出手段によ
    って入力された画像からブロック領域とその属性を抽出
    することによって、テンプレート情報とすべき領域及び
    属性の設定を行うことを特徴とする請求項3に記載の画
    像処理装置。
  5. 【請求項5】 前記保持手段は、 前記領域抽出手段を用いて入力された画像からブロック
    領域とその属性を獲得する領域獲得手段と、 前記領域獲得手段によって得られた矩形領域より所望の
    ブロック領域を選択する領域選択手段と、 前記領域選択手段で選択されたブロック領域とその属性
    をテンプレート情報として登録する登録手段とを備える
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 【請求項6】 前記登録手段は、前記領域選択手段で選
    択されたブロック領域以外のブロック領域とその属性を
    テンプレート情報として登録することを特徴とする請求
    項5に記載の画像処理装置。
  7. 【請求項7】 画像上の1つまたは複数の領域につい
    て、位置、大きさ及び属性をテンプレート情報として保
    持する保持工程と、 文書画像を入力する画像入力工程と、 前記画像入力工程で入力された文書画像からブロック領
    域を抽出するとともに、抽出されたブロック領域の属性
    を判定する領域抽出工程と、 前記領域抽出工程で抽出されたブロック領域のうち、前
    記テンプレート情報によって示される領域と少なくとも
    一部が重なり、その属性が該テンプレート情報に設定さ
    れている属性と一致するブロック領域を抽出する抽出工
    程とを備えることを特徴とする画像処理方法。
  8. 【請求項8】 前記保持工程は複数種類のテンプレート
    情報を保持し、 前記保持工程に保持された複数種類のテンプレート情報
    から、所望のテンプレート情報を選択する選択工程を更
    に備え、 前記抽出工程は前記選択工程で選択されたテンプレート
    情報を用いて前記文書画像よりのブロック領域の抽出を
    行うことを特徴とする請求項7に記載の画像処理方法。
  9. 【請求項9】 前記保持工程は、 入力された画像に対して領域及び属性を設定する設定工
    程と、 前記設定工程で設定された領域の位置及び大きさと属性
    をテンプレート情報として登録する登録工程とを備える
    ことを特徴とする請求項7に記載の画像処理方法。
  10. 【請求項10】 前記設定工程は、前記領域抽出工程に
    より、入力された画像からブロック領域とその属性を抽
    出することによって、テンプレート情報とすべき領域及
    び属性の設定を行うことを特徴とする請求項9に記載の
    画像処理方法。
  11. 【請求項11】 前記保持工程は、 前記領域抽出工程を用いて入力された画像からブロック
    領域とその属性を獲得する領域獲得工程と、 前記領域獲得工程によって得られた矩形領域より所望の
    ブロック領域を選択する領域選択工程と、 前記領域選択工程で選択されたブロック領域とその属性
    をテンプレート情報として登録する登録工程とを備える
    ことを特徴とする請求項7に記載の画像処理方法。
  12. 【請求項12】 前記登録工程は、前記領域選択工程で
    選択されたブロック領域以外のブロック領域とその属性
    をテンプレート情報として登録することを特徴とする請
    求項11に記載の画像処理方法。
  13. 【請求項13】 コンピュータに、入力画像から領域を
    抽出させるための制御プログラムを格納する記憶媒体で
    あって、該制御プログラムが、 画像上の1つまたは複数の領域について、位置、大きさ
    及び属性をテンプレート情報として保持する保持工程の
    コードと、 文書画像を入力する画像入力工程のコードと、 前記画像入力工程で入力された文書画像からブロック領
    域を抽出するとともに、抽出されたブロック領域の属性
    を判定する領域抽出工程のコードと、 前記領域抽出工程で抽出されたブロック領域のうち、前
    記テンプレート情報によって示される領域と少なくとも
    一部が重なり、その属性が該テンプレート情報に設定さ
    れている属性と一致するブロック領域を抽出する抽出工
    程のコードとを備えることを特徴とする記憶媒体。
JP00339698A 1998-01-09 1998-01-09 画像処理装置及び方法 Expired - Fee Related JP4100746B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP00339698A JP4100746B2 (ja) 1998-01-09 1998-01-09 画像処理装置及び方法
US09/221,840 US6411731B1 (en) 1998-01-09 1998-12-29 Template-based image recognition and extraction
DE69838579T DE69838579T2 (de) 1998-01-09 1998-12-31 Bildverarbeitungsvorrichtung und -verfahren
EP98310810A EP0929183B1 (en) 1998-01-09 1998-12-31 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00339698A JP4100746B2 (ja) 1998-01-09 1998-01-09 画像処理装置及び方法

Publications (2)

Publication Number Publication Date
JPH11203491A true JPH11203491A (ja) 1999-07-30
JP4100746B2 JP4100746B2 (ja) 2008-06-11

Family

ID=11556211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00339698A Expired - Fee Related JP4100746B2 (ja) 1998-01-09 1998-01-09 画像処理装置及び方法

Country Status (4)

Country Link
US (1) US6411731B1 (ja)
EP (1) EP0929183B1 (ja)
JP (1) JP4100746B2 (ja)
DE (1) DE69838579T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259991A (ja) * 2001-02-28 2002-09-13 Sony Corp 画像処理装置およびその方法
JP2008204457A (ja) * 2007-02-19 2008-09-04 Toshiba Corp ドキュメント管理装置及びドキュメント管理方法
US8385650B2 (en) 2008-08-12 2013-02-26 Canon Kabushiki Kaisha Image processing apparatus, information processing apparatus, and information processing method
JP2013250730A (ja) * 2012-05-31 2013-12-12 Pfu Ltd 文書作成システム、文書作成装置、文書作成方法、及びプログラム
JP2015192434A (ja) * 2014-03-28 2015-11-02 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
US9692936B2 (en) 2015-04-09 2017-06-27 Canon Kabushiki Kaisha Image processing apparatus and image processing method for clipping, from a second image, an area at a position corresponding to designated position in a first image

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000062243A1 (fr) * 1999-04-14 2000-10-19 Fujitsu Limited Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
JP3756719B2 (ja) 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置
CA2310943A1 (en) * 2000-06-02 2001-12-02 Michael J. Sikorsky Methods, techniques, software and systems for providing context independent, protocol independent portable or reusable development tools
JP2002032770A (ja) * 2000-06-23 2002-01-31 Internatl Business Mach Corp <Ibm> 文書処理方法、文書処理システムおよび媒体
JP5033277B2 (ja) * 2000-09-12 2012-09-26 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
FR2831752A1 (fr) * 2001-10-30 2003-05-02 Laurent Michel Procede et installation de saisie de fiches a l'aide d'un poste de saisie
KR20040103918A (ko) 2002-01-23 2004-12-09 마리나 시스템 코포레이션 결함 검출 및 분석을 위한 적외선 서모그래피
US7538815B1 (en) 2002-01-23 2009-05-26 Marena Systems Corporation Autofocus system and method using focus measure gradient
JP3624186B2 (ja) * 2002-03-15 2005-03-02 Tdk株式会社 スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置
US7538903B2 (en) * 2002-07-11 2009-05-26 Stone Cheng Method for scanning by using a virtual frame holder
US8849031B2 (en) * 2005-10-20 2014-09-30 Xerox Corporation Document analysis systems and methods
CN101173853B (zh) * 2006-11-01 2011-02-02 鸿富锦精密工业(深圳)有限公司 定位测量装置及方法
US10916043B2 (en) * 2007-11-26 2021-02-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for generating a template for arranging at least one object at at least one place
US20090279127A1 (en) * 2008-05-08 2009-11-12 Infoprint Solutions Company Llc Mechanism for data extraction of variable positioned data
JP2010033360A (ja) * 2008-07-29 2010-02-12 Canon Inc 情報処理装置、ジョブ処理方法、記憶媒体及びプログラム
JP5300534B2 (ja) * 2009-03-10 2013-09-25 キヤノン株式会社 画像処理装置および画像処理方法及びプログラム
JP2010211466A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
US8849853B2 (en) * 2009-07-30 2014-09-30 Intellectual Ventures Fund 83 Llc Method for matching artistic attributes of a template and secondary images to a primary image
US8422794B2 (en) 2009-07-30 2013-04-16 Intellectual Ventures Fund 83 Llc System for matching artistic attributes of secondary image and template to a primary image
US20110029914A1 (en) * 2009-07-30 2011-02-03 Whitby Laura R Apparatus for generating artistic image template designs
US20110029635A1 (en) * 2009-07-30 2011-02-03 Shkurko Eugene I Image capture device with artistic template design
US8854395B2 (en) * 2009-07-30 2014-10-07 Intellectual Ventures Fund 83 Llc Method for producing artistic image template designs
US20110029562A1 (en) * 2009-07-30 2011-02-03 Whitby Laura R Coordinating user images in an artistic design
CN102023966B (zh) * 2009-09-16 2014-03-26 鸿富锦精密工业(深圳)有限公司 用于合约比较的计算机系统及合约比较方法
TR200907868A2 (tr) * 2009-10-16 2011-05-23 Vestel Elektron�K Sanay� Ve T�Caret Anon�M ��Rket�@ Siyah transparan bölgeler içeren otomatik test metodu
KR20160027862A (ko) * 2014-09-02 2016-03-10 삼성전자주식회사 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6113760A (ja) 1984-06-29 1986-01-22 Dainippon Screen Mfg Co Ltd 画像走査記録方法
JPS62181570A (ja) 1986-02-05 1987-08-08 Minolta Camera Co Ltd 画像編集装置
US5038392A (en) 1990-02-12 1991-08-06 International Business Machines Corporation Method and apparatus for adaptive image processing by recognizing a characterizing indicium in a captured image of a document
US6002798A (en) * 1993-01-19 1999-12-14 Canon Kabushiki Kaisha Method and apparatus for creating, indexing and viewing abstracted documents
JPH07131641A (ja) * 1993-11-08 1995-05-19 Canon Inc 画像処理装置
US5987171A (en) 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
US5852676A (en) * 1995-04-11 1998-12-22 Teraform Inc. Method and apparatus for locating and identifying fields within a document
US5774579A (en) * 1995-08-11 1998-06-30 Canon Kabushiki Kaisha Block selection system in which overlapping blocks are decomposed
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259991A (ja) * 2001-02-28 2002-09-13 Sony Corp 画像処理装置およびその方法
JP2008204457A (ja) * 2007-02-19 2008-09-04 Toshiba Corp ドキュメント管理装置及びドキュメント管理方法
US8385650B2 (en) 2008-08-12 2013-02-26 Canon Kabushiki Kaisha Image processing apparatus, information processing apparatus, and information processing method
JP2013250730A (ja) * 2012-05-31 2013-12-12 Pfu Ltd 文書作成システム、文書作成装置、文書作成方法、及びプログラム
JP2015192434A (ja) * 2014-03-28 2015-11-02 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
US9692936B2 (en) 2015-04-09 2017-06-27 Canon Kabushiki Kaisha Image processing apparatus and image processing method for clipping, from a second image, an area at a position corresponding to designated position in a first image

Also Published As

Publication number Publication date
DE69838579D1 (de) 2007-11-29
JP4100746B2 (ja) 2008-06-11
EP0929183A2 (en) 1999-07-14
US6411731B1 (en) 2002-06-25
EP0929183B1 (en) 2007-10-17
EP0929183A3 (en) 2000-05-10
DE69838579T2 (de) 2008-07-24

Similar Documents

Publication Publication Date Title
JP4100746B2 (ja) 画像処理装置及び方法
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JPH11306197A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP6938318B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH05189336A (ja) 文書認識装置および認識処理方法
US20050102327A1 (en) Data file processor, data file processing method and program
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP4756650B2 (ja) 画像処理装置、読み順設定方法及びプログラム
US8194982B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP2001094760A (ja) 情報処理装置
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
CN114237468B (zh) 文字图片的翻译方法、装置、电子设备及可读存储介质
JP2018085093A (ja) 情報処理装置、制御方法、プログラム
JP2004348428A (ja) 電子文書における、ヘッダ、フッタの挿入手段
JP6795770B2 (ja) 情報処理装置と、その処理方法及びプログラム
US20220383023A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
JPH11203402A (ja) 画像処理装置及び画像処理方法
JP2000029987A (ja) 画像読取装置の制御方法及び画像読取装置並びに画像読取システム
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2000312290A (ja) データ処理方法及び装置及び記憶媒体
JPH103516A (ja) 情報処理方法及び装置
JPH11224308A (ja) 文字認識装置及びその方法
JPH1185457A (ja) データ処理装置およびデータ処理装置のデータ処理方法およびコンピュータが読み出し可能なプログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20041210

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080111

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080318

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees