JP3728224B2 - 文書処理装置及び方法 - Google Patents

文書処理装置及び方法 Download PDF

Info

Publication number
JP3728224B2
JP3728224B2 JP2001210923A JP2001210923A JP3728224B2 JP 3728224 B2 JP3728224 B2 JP 3728224B2 JP 2001210923 A JP2001210923 A JP 2001210923A JP 2001210923 A JP2001210923 A JP 2001210923A JP 3728224 B2 JP3728224 B2 JP 3728224B2
Authority
JP
Japan
Prior art keywords
element pattern
arc
document processing
image data
imprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001210923A
Other languages
English (en)
Other versions
JP2002109521A (ja
Inventor
知俊 金津
北洋 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001210923A priority Critical patent/JP3728224B2/ja
Priority to KR10-2001-0044390A priority patent/KR100443693B1/ko
Priority to CNB011243988A priority patent/CN1260676C/zh
Publication of JP2002109521A publication Critical patent/JP2002109521A/ja
Application granted granted Critical
Publication of JP3728224B2 publication Critical patent/JP3728224B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Input (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、帳票等の文書を電子的に自動処理するための文書処理装置及び方法に関する。
【0002】
【従来の技術】
金融機関における帳票処理業務の電子化の一環として、印鑑照合の自動化の需要が高まっている。例えば、口座に登録された印影と、各種引き落とし依頼の帳票に押印された印影に対して電子的な照合判定をおこなう技術は、業務の省力、高速化に大きく貢献する。
【0003】
登録印影、ならびに実帳票が光電変換によって電子画像化している状態において、2つの印影を電子的に照合する技術として、互いの画素データを重ねあわせたときの一致率によって判定する、いわゆる印鑑照合技術が存在する。
【0004】
勿論、実際には、登録印影と実帳票の印影とは同じ角度で押印されているとは限らない。このため、角度の差を考慮して、回転を行いつつ照合を行わなければならない。また、人間の押印作業は正確ではないので、押印場所が定められていたとしても、微妙なずれがあったり、濃さの違いがあったりするので、それらを考慮した判定が行われることになる。
【0005】
上記のように照合技術は複雑な処理を含むため、照合にあたっては、実帳票上での印影の位置が正しく照合装置に伝えられていなければならない。さもなければ、精度が減少したり、印影を探索する為に大きな処理時間を必要としたりする。
【0006】
よって、自動印鑑照合を効率的に行うためには、光電変換して読み取った帳票画像から印影位置を特定することが重要になる。従来は、押印はあらかじめ帳票に定められた枠内になされることを前提とし、その範囲内で画素を追跡し、印影と看倣される画素塊を特定することで印影の位置を算出していた。もしくは、帳票自体をドロップアウトカラーで設計し、照合の為に印影のみが浮かび上がるような画像が光電変換の際に採取され、そこから容易に印影位置を算出できるようにしていた。
【0007】
【発明が解決しようとする課題】
しかしながら、実際には帳票は照合を行う金融機関が設計したものとは限らず、ドロップアウトカラーで書かれていることも期待できない。そのような未知形状の帳票を処理しなければならない場合には、印影の位置は全く予想出来ず、画像全体から印影を探して切り出さなければならない状況が生じる。
【0008】
更に、人間が押印するため、実帳票上での押印位置は不確定な場合が多い。例えば、定められた枠からはみ出て押印されたり、失敗して欄外に再押印してあったりする場合がある。しかしながら、このような押印状態であっても、少なくとも目視で照合が可能な状態であれば、その印影は有効として処理する必要がある。このとき、ドロップアウトカラーの帳票以外では、帳票上に書かれた線や文字と印影とが交叉してしまい、印影を探索するのが困難となる。
【0009】
本発明は、上記の問題に鑑みてなされたものであり、印影位置を効率的に特定することを可能とし、印鑑照合の自動化における実用性を向上することを目的とする。
【0010】
【課題を解決するための手段】
上記の目的を達成するための本発明による文書処理装置は以下の構成を備える。すなわち、
領域分割処理により処理対象の画像データから要素パターンを取得する要素パターン取得手段と、
前記要素パターン取得手段で取得した要素パターンについて、サイズが所定のサイズ範囲内で且つ弧のパターン部分を有するか判断する弧形状判断手段と、
前記要素パターン取得手段で取得した要素パターンの中から、前記弧形状判断手段によりサイズが所定のサイズ範囲内で且つ弧のパターン部分を有すると判断された要素パターンを選択抽出する選択手段と、
前記選択手段で選択された要素パターン内の弧のパターン部分に基づいて該弧の中心位置と半径とを算出する算出手段と、
前記算出手段で算出された半径の大きさが所定の範囲内であるか否かに基づいて印影か否か判断する印影判断手段と、
前記印影判断手段で該半径の大きさが前記所定の範囲内であると判断された場合に、前記算出された弧の中心位置と半径とに基づいて、前記処理対象の画像データから印影画像データを取得する印影取得手段とを備える。
【0011】
また、上記の目的を達成するための本発明による文書処理方法は、
領域分割処理により処理対象の画像データから要素パターンを取得する要素パターン取得工程と、
前記要素パターン取得工程で取得した要素パターンについて、サイズが所定のサイズ範囲内で且つ弧のパターン部分を有するか判断する弧形状判断工程と、
前記要素パターン取得工程で取得した要素パターンの中から、前記弧形状判断工程によりサイズが所定のサイズ範囲内で且つ弧のパターン部分を有すると判断された要素パターンを選択抽出する選択工程と、
前記選択工程で選択された要素パターン内の弧のパターン部分に基づいて該弧の中心位置と半径とを算出する算出工程と、
前記算出工程で算出された半径の大きさが所定の範囲内であるか否かに基づいて印影か否か判断する印影判断工程と、
前記印影判断工程で該半径の大きさが前記所定の範囲内であると判断された場合に、前記算出された弧の中心位置と半径とに基づいて、前記処理対象の画像データから印影画像データを取得する印影取得工程とを備える。
【0012】
【発明の実施の形態】
以下、添付の図面を参照して本発明の好適な実施形態を説明する。
【0013】
図1は本実施形態による印鑑照合装置の概観を示す図である。101はコンピュータ装置であり、本実施形態の帳票分類処理プログラムを実行する。コンピュータ装置101にはユーザに処理状況や帳票画像などを表示するためのディスプレイ装置102、およびユーザの操作を受け付けるキーボード、マウス等の入力インタフェース103が付随する。104はスキャナ装置であり、紙の帳票を光学的に読み取り電子化し、画像データをコンピュータ装置101に送る。なお、本実施形態では、スキャナ装置104を用いて帳票を読み込んでいるが、デジタルカメラ等を用いて帳票を電子化して画像データを得てもよい。
【0014】
図2に本発明の一実施形態のブロック図を示す。
【0015】
201はスキャナから帳票を画像データとして入力する入力部、202は画像データを文字、非文字、枠、線などの要素データに変換する領域分割部、203は要素データから印影に類似するデータを選択抽出する印影選択部、204は選択された印影データに対し中心座標を算出する中心算出部、205は画像と印影の中心位置から印鑑照合を行う印鑑照合処理部である。
【0016】
以上の構成を備えた本実施形態の印鑑照合装置の動作について、以下、説明する。
【0017】
図3は本実施形態における印鑑照合処理の概要手順を説明するフローチャートである。ステップS301にて、印影を含む帳票のイメージをスキャナで電子化する。本実施形態では、領域分割処理は2値画像を用いて行い、印鑑照合は2値画像ではなく多値画像上で行うので、入力された帳票イメージを多値画像として保存し、その多値画像から更に2値画像を生成するものとする。
【0018】
次に、ステップS302にて、帳票の2値画像に対して領域分割処理を行う。領域分割により、画像上の各要素が要素データとして抽出される。ここで、領域分割処理とは、紙文書をスキャンした画像から、図6に示すように、文字や記号の位置を抽出する技術のことである。具体的には、2値化された対象画像から黒画素の8連結領域の集合を抽出して、その黒画素集合の内部で白画素の4連結領域の集合を抽出し、これらの抽出した結果に基づいて文字(テキスト)、絵や図、表、枠、線といった文書に特徴的な要素に分離分割する。実現例としては、米国特許第5680478号「Method and apparatus for character recognition (Shin-Ywan Wangら/CanonK.K)」などがある。
【0019】
本実施形態では、枠(表)と判断された領域内部の各欄(各コラム)で、更に領域分割処理を再帰的に行なうことにより、最終的に各枠内に存在する文字要素や非文字要素等を決定する。図7は帳票に対する領域分割処理の結果を示す図である。なお、領域分割の詳しい内容は後で説明する。
【0020】
ステップS303では、領域分割によって得られた要素データから、印影あるいはその一部である可能性のある要素を選択抽出し、選択抽出した要素から印影の中心位置および半径を推定する。なお、この部分の処理の詳しい内容は後で説明する。
【0021】
ステップS304では、入力実帳票の多値画像において、ステップS303で求められた中心位置および半径(半径長さ:Rとする)に基づいて印影部分を求め、登録印鑑の印影画像との照合判定を行う。なお、印影部分の円形画像のみを取り出して、登録印影画像と照合判定を行なってもよいが、印影部分を含む矩形画像を取り出して、登録印影画像と照合判定を行なってもよい。たとえば、求められた中心位置を重心とした一辺が2Rの長さの正方形の画像領域を抽出し、この抽出した画像と登録されている印影画像とを用いて印鑑照合を行う。なお、この照合処理自体には既存のものを用いることができるので、ここではその詳細な説明を省略する。
【0022】
次に、上記ステップS302において実行される領域分割処理について詳細に説明する。図4は本実施形態による領域分割処理を説明するフローチャートである。
【0023】
ステップS401において、画像からすべての黒画素の8連結領域を抽出する。黒画素の8連結領域とは、図8の(a)に示されるように、縦横斜めに接触した黒画素の集合のことである。以降この領域を単に黒領域と呼び、画像を構成する最小要素とし、この黒領域を含む最小の矩形を黒領域矩形(図8の(a)では点線矩形で表している)と呼ぶことにする。
【0024】
ステップS402では、黒領域矩形の高さおよび幅が、予め予想される最大文字高さおよび幅であるところの閾値を超えない黒領域を「文字」と判定する。ステップS403では、黒領域矩形の高さと幅の比率が一定比率以上で縦長または横長のもの、あるいは一定太さの斜め線状をなす黒領域を「線」と判定する。ステップS404では、黒領域矩形の形状が一定大きさ以上かどうかを調べる。条件を満たすならばステップS405へ進む。満たさないときは、その黒領域を「非文字」と判定する。なお、「非文字」は、図、写真、印影またはその一部などを含む集合と考えられる。
【0025】
ステップS405では、矩形をなす黒領域の内部に存在する白画素の4連結領域の集合を抽出する(白画素に4画素連結領域を適用するのは、黒画素と同様の8連結領域を白画素に適用すると、斜め線のところで黒画素の塊の中から飛び出してしまうからである)。白画素の4連結領域とは、図8の(b)に示されるように、縦横のみに接触した白画素の集合のことである。図8の(a)のように、黒画素8連結領域では1領域として切り出されるが、図8の(b)に示されるように白画素4連結領域では2つの領域として切り出される。以降、この領域を白領域と呼び、この白領域を含む最小の矩形を白領域矩形(図8の(b)では点線矩形で表している)と呼ぶことにする。
【0026】
ステップS406では、黒領域矩形内から1つまたは複数の白領域矩形が抽出され、抽出された白領域矩形が重なることなく黒領域内を埋めている場合、この黒領域を「枠」と判定する。そうでない場合は「非文字」とする。例えば、図9(a)及び図9(b)では白領域矩形が重なることなく抽出されているので枠と判断され、図9(c)では白領域矩形が重なって抽出されるので非文字と判断される。
【0027】
ステップS407では、「枠」の内部白領域矩形各々に対し、その矩形の範囲内に対して再び、黒画素の8連結領域を抽出する。ステップS408では、「枠」の内部白領域矩形中で、白領域矩形の境界に接触する一定大きさ以上の黒画素の固まりを、強制的に境界から切断することで、黒領域として抽出する。図12に、枠内の白領域矩形における黒画素の強制切断の例を示す。つまり、ステップS407では、表枠の各セルに相当する白領域矩形から、セル内にある文字や印影などの黒画素の固まりを抽出し、ステップS408では、S407で抽出されなかったセルの境界線に接触している黒画素の固まりを強制的に抽出することにより、白領域矩形内の黒画素の固まりを黒領域として抽出することができる。なお、ステップS408では、図12のように、表内部のひとつの枠領域内にあって、内枠に接触した一定大きさ以上の黒画素の固まりがある場合、強制的に枠から切除して黒領域として抽出する。すなわち、注目する固まりおよび内枠をなす黒領域の画素集合から、該当する白領域の外接矩形の内部に存在する黒画素を集めて黒領域を生成する。
【0028】
以降、ステップS407およびステップS408で抽出された黒領域の集合に対し、ステップS402以降の処理を繰り返す。そして、この再帰的な探索が行われなくなった時点で本処理を終了する。
【0029】
以上の様な処理により、領域分割終了時には、黒領域、白領域から、図10のような、要素の木構造が生成される。各要素は、属性、外接する矩形の左上、右下座標、要素をなす画素塊の輪郭情報を保持する。このうち、輪郭情報は、要素を各y座標で水平にスライスしたときの、連続する黒画素の始点、終点のリストの集合である。要素の持つ情報の例を図11に例示する。
【0030】
次に、上記ステップS303において実行される、領域分割によって得られた要素データから、印影あるいはその一部である可能性のある要素を選択し、印影の中心位置および半径を推定する処理について詳細に説明する。
【0031】
図5は本実施形態による印影要素の抽出処理(図3のステップS303)を説明するフローチャートである。ステップS501では、図10の木構造の要素が印影もしくはその一部に対応する大きさかどうかを予め定めた閾値をもとに判定する。要素が印影もしくはその一部に対応した大きさであると判断すればステップS502に進む。ステップS502では、要素輪郭情報から、各y座標で最左のx座標点をつなぐ点列を求める。ステップS503では、この点列がなめらかに変化する弧であるか否かを判定する。この判定は、具体的には、点列のx座標の変位を微分したものがほぼ単調増加し、かつ点列長が一定以上であるか否かを判定することで行う。ステップS503によって、当該点列が弧であると判定された場合には、ステップS504に進む。
【0032】
本実施形態では、要素輪郭情報から各y座標で最左のx座標の点列を求めてステップS504の処理を行なうので、印影の左半分の一部を含む弧が検出されることになるが、更に要素輪郭情報から各y座標で最右のx座標の点列を求めてステップS504でx座標の変位を微分したものが単調減少し、且つ点列長が一定以上かどうか判定することにより印影の右半分の一部を含む弧を検出することも可能である。また、本実施形態では左半分の一部を含む弧を検出するようにしたが、右半分を含む弧を検出するようにしてもよいし、左半分及び右半分の弧の両方を検出するようにしてもよい。尚、本実施形態では、点列のx座標の変位を微分したものが単調増加(もしくは単調減少)するかどうかで判定することにより、「1方向に反った滑らかな曲線」であるかどうかが分かるので、これを円弧と見なしているが、この判定方法に限らず弧を判定できるものであればよい。
【0033】
ステップS504では、当該点列が表す弧をある円の一部と仮定してその半径と中心位置を算出する。図13は弧の半径と中心の算出を説明する図である。図13の弧ABに対する接線がy軸、接点が原点となるようにx−y座標をとると、y軸に接する円の方程式は、
(x−r)2+y2=r2
であるから、弧ABの半径Rは、
R=(X2+Y2)/2X
として求めることができる。また、中心位置はx軸上にあるので半径から容易に計算される。本実施形態では、取り出した円弧AB上の中点を接点(原点)とし、直線ABに平行で該接点を通る直線がy軸となるように座標変換を行なって前記方程式を適用することにより、円の半径および中心位置を計算する。(なお、前記方程式を適用する際に、座標変換を行なっているので、元の座標系での半径および中心位置を求める際には逆の座標変換を行なって戻せばよい。)
なお、この接点(原点)は円弧上の点であればどの位置でもよく、その接点に接する接線がy軸となるように座標変換を行なって上記方程式を適用するようにして、円の半径および中心位置を求めるようにしてもよい。
【0034】
また、本発明は、抽出した弧から円の半径及び中心位置を求められるものであれば、前記方程式に限らず、その他の計算式を用いて求めても構わない。
【0035】
次に、ステップS505において、ステップS504で算出された半径が一定範囲の長さ(サイズ)であるか否かを判断する。算出された半径が一定範囲長さ以内である場合、この要素をかかる半径および中心位置を持つ印影であると推定する。
【0036】
なお、半径および中心の算出の際、複数の要素から算出した半径と中心が、同じ大きさと位置である(所定の誤差範囲内である)と判断される場合、それらすべての半径と中心位置についての平均値を求めて、予想される印影の半径と中心位置としてもよい。また、同じ要素から輪郭の右側や上側、下側についても同様に弧が検出され、同様に半径および中心が求まるとき、それらすべて半径と中心位置について平均値を求め、それらをその要素から予想される印影の半径と中心位置としてもよい。
【0037】
以上説明したように、本実施形態によれば、帳票の2値画像上の未知なる箇所に存在する印影に対し、その候補となるべき画素の固まりが、領域分割により独立した要素データとしてまず抽出され、それらの中から条件を満たすものを抽出するという形で、画像の全ての中から印影のみを効率的に抽出することができる。特に、ステップ408の処理により、枠にかかる形で存在する印影の部分が要素として抽出されるため、帳票の表部分の枠からはみ出していたり、罫線を跨いで押印された印影をも効率的に抽出することが可能になる。
【0038】
即ち、本実施形態によれば、印鑑照合のために行う印影位置抽出処理で、領域分割技術を用いることにより、場所があらかじめわからない印影や、表の枠や罫線を跨いだ印影を効率的に抽出することが可能になる。
【0039】
<その他の実施形態>
なお、上記の実施形態においては、領域分割で抽出されたすべての要素に対して印影の可能性を試していたが、表のような枠領域が抽出されたとき、その中に存在する要素に対してのみ印影である可能性の判定を行うようにしてもよい。帳票のフォーマットは不明であるが、印影はなんらかの表の中に押印されていることが保証されているような場合、上記の処理を実行することで、より効率的に印影を抽出することが可能になる。
【0040】
この場合でも、印鑑照合のために行う印影位置抽出処理で、領域分割技術を用いることにより場所があらかじめわからない印影や、表の枠や罫線を跨いだ印影を効率的に抽出することが可能になる。
【0041】
また、上記の実施形態では、抽出した印影を用いて印鑑の照合処理を行なうものとしたが、抽出した印影を印鑑の登録処理に用いてもよい。例えば、抽出した印影を、当該読み取った帳票を文字認識処理して得たデータと対応づけて登録保存してもよい。
【0042】
また、上記実施形態では、円形の印鑑を抽出するものとしたが、楕円形の印鑑を抽出するような実施形態としてもよい。その場合、領域分割で抽出された要素で、輪郭が弧状の要素を選択し、弧の形状から楕円の領域を決定する。その際は、ステップS504で用いる計算式を、楕円の方程式から求められる計算式に代えればよい。なお、円形に近い楕円形の印鑑を抽出するのであれば、簡易的に、上記実施形態のように円の方程式に基づく計算式を用いて中心位置および半径を求め、楕円の印鑑を含むような領域を近似的に抽出するようにしてもよい。
【0043】
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0044】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0045】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0046】
【発明の効果】
以上説明したように、本発明によれば、印影位置を効率的に特定することが可能となる。また、印鑑照合や印鑑登録の自動化における実用性が向上する。
【図面の簡単な説明】
【図1】実施形態による印鑑照合装置の概観を示す図である。
【図2】実施形態による印鑑照合装置の機能構成を示すブロック図である。
【図3】実施形態による印鑑照合処理の手順を説明するフローチャートである。
【図4】実施形態による領域分割処理を説明するフローチャートである。
【図5】実施形態による陰影要素の抽出処理を説明するフローチャートである。
【図6】領域分割処理を説明する図である。
【図7】帳票に対する領域分割処理の結果の一例を示す図である。
【図8】(a)は黒画素の8連結領域の例を示す図であり、(b)は白画素の4連結領域の例を示す図である。
【図9】(a)、(b)、(c)は、内部白画素の4連結領域の集合の例を示す図である。
【図10】領域分割結果の要素がなす木構造の例を示す図である。
【図11】領域分割結果の一要素が持つ情報の例を示す図である。
【図12】枠内部白領域の黒画素の強制切断の例を示す図である。
【図13】弧と半径の関係を説明する図である。

Claims (20)

  1. 領域分割処理により処理対象の画像データから要素パターンを取得する要素パターン取得手段と、
    前記要素パターン取得手段で取得した要素パターンについて、サイズが所定のサイズ範囲内で且つ弧のパターン部分を有するか判断する弧形状判断手段と、
    前記要素パターン取得手段で取得した要素パターンの中から、前記弧形状判断手段によりサイズが所定のサイズ範囲内で且つ弧のパターン部分を有すると判断された要素パターンを選択抽出する選択手段と、
    前記選択手段で選択された要素パターン内の弧のパターン部分に基づいて該弧の中心位置と半径とを算出する算出手段と、
    前記算出手段で算出された半径の大きさが所定の範囲内であるか否かに基づいて印影か否か判断する印影判断手段と、
    前記印影判断手段で該半径の大きさが前記所定の範囲内であると判断された場合に、前記算出された弧の中心位置と半径とに基づいて、前記処理対象の画像データから印影画像データを取得する印影取得手段とを備えることを特徴とする文書処理装置。
  2. 文書画像を光学的に読み取り、得られた光電変換信号に基づいて前記処理対象の画像データを取得し、これを前記要素パターン取得手段へ提供する手段を更に備えることを特徴とする請求項1に記載の文書処理装置。
  3. 前記印影取得手段で取得した印影画像データと予め登録されている登録印影の画像データとを照合する照合手段を更に備えることを特徴とする請求項1に記載の文書処理装置。
  4. 前記弧形状判断手段は、前記要素パターンの輪郭から求められる点列の座標値の変位を微分したものがほぼ単調変化する部分を有するか否かに基づいて、当該要素パターンが弧のパターン部分を有するか否か判断することを特徴とする請求項1に記載の文書処理装置。
  5. 前記算出手段は、円の方程式と前記弧のパターン部分上の点とに基づいて、該弧の中心位置と半径とを算出することを特徴とする請求項1に記載の文書処理装置。
  6. 前記要素パターン取得手段は、前記処理対象の画像データから黒画素集合を抽出することにより、前記要素パターンを取得することを特徴とする請求項に記載の文書処理装置。
  7. 前記要素パターン取得手段で取得される前記要素パターンは、枠線もしくは罫線に接触している画素塊を、当該枠線もしくは罫線から切り離すことにより得られた画素塊であることを特徴とする請求項に記載の文書処理装置。
  8. 前記処理対象の画像データは、フォーマットが不明な帳票であることを特徴とする請求項に記載の文書処理装置。
  9. 前記印影取得手段で取得した印影画像データを登録する登録手段を更に備えることを特徴とする請求項1に記載の文書処理装置。
  10. 領域分割処理により処理対象の画像データから要素パターンを取得する要素パターン取得工程と、
    前記要素パターン取得工程で取得した要素パターンについて、サイズが所定のサイズ範囲内で且つ弧のパターン部分を有するか判断する弧形状判断工程と、
    前記要素パターン取得工程で取得した要素パターンの中から、前記弧形状判断工程によりサイズが所定のサイズ範囲内で且つ弧のパターン部分を有すると判断された要素パターンを選択抽出する選択工程と、
    前記選択工程で選択された要素パターン内の弧のパターン部分に基づいて該弧の中心位置と半径とを算出する算出工程と、
    前記算出工程で算出された半径の大きさが所定の範囲内であるか否かに基づいて印影か否か判断する印影判断工程と、
    前記印影判断工程で該半径の大きさが前記所定の範囲内であると判断された場合に、前 記算出された弧の中心位置と半径とに基づいて、前記処理対象の画像データから印影画像データを取得する印影取得工程とを備えることを特徴とする文書処理方法。
  11. 文書画像を光学的に読み取り、得られた光電変換信号に基づいて前記処理対象の画像データを取得し、これを前記要素パターン取得工程へ提供する工程を更に備えることを特徴とする請求項10に記載の文書処理方法。
  12. 前記印影取得工程で取得した印影画像データと予め登録されている登録印影の画像データとを照合する照合工程を更に備えることを特徴とする請求項10に記載の文書処理方法。
  13. 前記弧形状判断工程は、前記要素パターンの輪郭から求められる点列の座標値の変位を微分したものがほぼ単調変化する部分を有するか否かに基づいて、当該要素パターンが弧のパターン部分を有するか否か判断することを特徴とする請求項10に記載の文書処理方法。
  14. 前記算出工程は、円の方程式と前記弧のパターン部分上の点とに基づいて、該弧の中心位置と半径とを算出することを特徴とする請求項10に記載の文書処理方法。
  15. 前記要素パターン取得工程は、前記処理対象の画像データから黒画素集合を抽出することにより、前記要素パターンを取得することを特徴とする請求項10に記載の文書処理方法。
  16. 前記要素パターン取得工程で取得される前記要素パターンは、枠線もしくは罫線に接触している画素塊を、当該枠線もしくは罫線から切り離すことにより得られた画素塊であることを特徴とする請求項10に記載の文書処理方法。
  17. 前記処理対象の画像データは、フォーマットが不明な帳票であることを特徴とする請求項10に記載の文書処理方法。
  18. 前記印影取得工程で取得した印影画像データを登録する登録工程を更に備えることを特徴とする請求項10に記載の文書処理方法。
  19. 請求項10乃至18のいずれかに記載の文書処理方法をコンピュータに実行させるための制御プログラムを格納するコンピュータ可読メモリ。
  20. 請求項10乃至18のいずれかに記載の文書処理方法をコンピュータに実行させるための制御プログラム。
JP2001210923A 2000-07-25 2001-07-11 文書処理装置及び方法 Expired - Fee Related JP3728224B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001210923A JP3728224B2 (ja) 2000-07-25 2001-07-11 文書処理装置及び方法
KR10-2001-0044390A KR100443693B1 (ko) 2000-07-25 2001-07-24 문서처리장치 및 방법
CNB011243988A CN1260676C (zh) 2000-07-25 2001-07-25 单据处理方法和装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-224282 2000-07-25
JP2000224282 2000-07-25
JP2001210923A JP3728224B2 (ja) 2000-07-25 2001-07-11 文書処理装置及び方法

Publications (2)

Publication Number Publication Date
JP2002109521A JP2002109521A (ja) 2002-04-12
JP3728224B2 true JP3728224B2 (ja) 2005-12-21

Family

ID=26596642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001210923A Expired - Fee Related JP3728224B2 (ja) 2000-07-25 2001-07-11 文書処理装置及び方法

Country Status (3)

Country Link
JP (1) JP3728224B2 (ja)
KR (1) KR100443693B1 (ja)
CN (1) CN1260676C (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101080069B1 (ko) 2010-03-17 2011-11-08 대한민국 위조인영 판독방법 및 기록매체
JP5593742B2 (ja) * 2010-03-09 2014-09-24 沖電気工業株式会社 印鑑照合装置、印鑑照合システム、印鑑照合方法およびプログラム
JP2011197787A (ja) * 2010-03-17 2011-10-06 Oki Electric Industry Co Ltd 印鑑照合装置、印鑑照合方法およびプログラム
JP5593966B2 (ja) * 2010-08-27 2014-09-24 沖電気工業株式会社 印鑑照合装置
CN102541480B (zh) * 2010-12-21 2014-12-24 北大方正集团有限公司 打印作业的过滤方法和装置
CN104346613B (zh) * 2013-08-08 2018-06-15 卡西欧计算机株式会社 图像处理装置以及图像处理方法
JP5854097B2 (ja) * 2014-07-30 2016-02-09 沖電気工業株式会社 印影抽出装置、印影抽出システム、印影抽出方法、プログラムおよび印鑑照合装置
CN104468120B (zh) * 2014-11-26 2018-02-23 北京数字认证股份有限公司 一种实现电子签章的方法和系统
CN104463931B (zh) * 2015-01-07 2017-12-22 昆山百润科技有限公司 多人并发签章情形下实现印章重叠检测及处理的方法
CN105631447B (zh) * 2015-12-18 2019-02-15 杭州仁盈科技股份有限公司 一种识别圆形公章中文字的方法
CN107358184A (zh) * 2017-06-30 2017-11-17 中国科学院自动化研究所 文档文字的提取方法及提取装置
CN108830133B (zh) * 2018-04-17 2020-02-21 平安科技(深圳)有限公司 合同影像图片的识别方法、电子装置及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196362A (ja) * 1997-09-17 1999-04-09 Fujitsu Ltd 印影照合装置

Also Published As

Publication number Publication date
KR20020009476A (ko) 2002-02-01
KR100443693B1 (ko) 2004-08-09
JP2002109521A (ja) 2002-04-12
CN1260676C (zh) 2006-06-21
CN1334543A (zh) 2002-02-06

Similar Documents

Publication Publication Date Title
CN110050277A (zh) 用于将手写文本转换成数字墨水的方法和系统
JP3728224B2 (ja) 文書処理装置及び方法
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
EP1017011A2 (en) Block selection of table features
KR19990036622A (ko) 비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체
US20020051574A1 (en) Character recognition method, program and recording medium
JPH09311905A (ja) 行検出方法および文字認識装置
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
CN105930813B (zh) 一种在任意自然场景下检测行文本的方法
JP4804433B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3095470B2 (ja) 文字認識装置
JP4651407B2 (ja) 画像処理装置およびコンピュータプログラムおよび記憶媒体
JPH10187886A (ja) 文字認識装置および文字認識方法
JPH103517A (ja) 文書画像傾き角検出装置
JP2715930B2 (ja) 線分検出方法
KR100317653B1 (ko) 대용량인쇄체문자인식을위한특징추출방법
JP2982221B2 (ja) 文字読み取り装置
JP2011193294A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPS63101983A (ja) 文字列抽出方式

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050922

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050930

R150 Certificate of patent or registration of utility model

Ref document number: 3728224

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091007

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091007

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101007

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101007

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111007

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111007

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121007

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131007

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees