JP3602596B2 - ドキュメントファイリング装置および方法 - Google Patents

ドキュメントファイリング装置および方法 Download PDF

Info

Publication number
JP3602596B2
JP3602596B2 JP03400295A JP3400295A JP3602596B2 JP 3602596 B2 JP3602596 B2 JP 3602596B2 JP 03400295 A JP03400295 A JP 03400295A JP 3400295 A JP3400295 A JP 3400295A JP 3602596 B2 JP3602596 B2 JP 3602596B2
Authority
JP
Japan
Prior art keywords
document
data
line segment
image data
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03400295A
Other languages
English (en)
Other versions
JPH08235341A (ja
Inventor
成佳 下辻
浩明 久保田
三恵子 浅野
修 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03400295A priority Critical patent/JP3602596B2/ja
Priority to US08/592,706 priority patent/US5815704A/en
Publication of JPH08235341A publication Critical patent/JPH08235341A/ja
Application granted granted Critical
Publication of JP3602596B2 publication Critical patent/JP3602596B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/913Multimedia
    • Y10S707/915Image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Processing Or Creating Images (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、帳票等のドキュメントを電子的にファイルングするドキュメントファイリング装置に関する。
【0002】
【従来の技術】
従来、帳票等のドキュメントを電子的にファイルングする装置では、ドキュメント一枚分の画像を取り込み、このファイルに名前をつけて保存する方法や、ドキュメント上に記載された文字、図形情報を画像ではなくコード情報に変換してコードファイルとして保存する方式がとられていた。あるいは、ドキュメント一枚全体の画像を保存するのではなく、部分的に一部の画像を記憶する手法が提案されている。例えば、特開平4−321188号公報では、未記入帳票のフォーマットデータを用いて、帳票の記入された画像のみを記憶する方式が開示されている。
【0003】
また、従来のファイリング装置では、データ検索方法として、決められたキーワードを入力する方式や、ファイリングされている帳票データをディスプレイなどに表示しオペレータに求めるものを探させる方式がとられていた。
【0004】
ところが、ドキュメント一枚分の画像を記憶し管理する方式では、検索のための情報は、オペレータがマニュアル操作で各々の画像に固有の名前を付けるなどの形で与える必要があり、作業が繁雑であった。また、ドキュメント上に記載された文字、図形情報を画像ではなくコード情報に変換する手法では、変換後のコードデータを検索情報として用いることができるが、変換作業の多くをオペレータのマニュアル操作で行う必要があり、その労力は多大である。また、フォーマットデータをあらかじめ登録しておく方式は、各々の未記入帳票を用意しなければならないという問題があり、また、帳票が多種にわたる際には、その未記入帳票の登録作業のコストは多大なものになるという問題があった。
【0005】
また、従来の検索方式では、キーワードだけでは求めるものが検出しにくいといった問題や、ファイリングされている帳票を表示して検索する際には帳票の量が多いと時間がかかるといった問題があった。
【0006】
【発明が解決しようとする課題】
従来のドキュメントファイルング装置では、ドキュメント一枚分の画像に名前を付けて保存するもの、ドキュメントをコード情報に変換して保存するものがあるが、ドキュメントを検索する際に使用する情報を予めオペレータがマニュアル操作でドキュメントに与えておく必要があるので、その作業が繁雑であり、多大な労力を必要とする問題があった。
【0007】
また、未記入帳票のフォーマットデータを用いて記入された画像のみを記憶するものでは、様々な種類の未記入帳票のフォーマットデータを用意しなければならず、未記入帳票の登録作業のコストが多大なものになるという問題があった。
【0008】
また、従来の検索では、キーワードだけでは求めるものが検出しにくいといった問題や、ファイリングされている帳票を表示して検索する際には帳票の量が多いと時間がかかるといった問題があった。
【0009】
本発明は、上記事情を考慮してなされたもので、種々のドキュメントファイルを電子ファイルングするドキュメントファイリング装置において、ドキュメントのファイル装置への登録が容易であり、かつ、ドキュメントの検索を容易にするドキュメントファイリング装置および方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明に係るドキュメントファイリング装置は、ドキュメントを、線分データ、文字データおよび画像データに分解して記憶するファイル手段と、所望のドキュメントを画像データとして入力する画像入力手段と、入力された前記画像データから線分データと文字データを抽出する文字線分抽出手段と、前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントのうち、入力された前記ドキュメントに類似する類似ドキュメントを検索する検索手段と、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合に、検索された前記類似ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求める差異検出手段と、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合、前記類似ドキュメントを識別する第1の識別情報と、求められた前記差異と、前記入力されたドキュメントを識別する第2の識別情報とを対応付けて前記ファイル手段に登録し、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録する登録手段とを具備したことを特徴とする。
また、本発明は、ドキュメントを、線分データ、文字データおよび画像データとしてファイル手段に登録するドキュメントファイリング方法であって、所望のドキュメントを画像データとして入力するステップと、入力された前記画像データから線分データと文字データを抽出するステップと、前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントのうち、入力された前記ドキュメントに類似する類似ドキュメントを検索するステップと、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合に、検索された前記類似ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求めるステップと、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合、前記類似ドキュメントを識別する第1の識別情報と、求められた前記差異と、前記入力されたドキュメントを識別する第2の識別情報とを対応付けて前記ファイル手段に登録し、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録するステップとを有することを特徴とする。
また、本発明に係るドキュメントファイリング装置は、ドキュメントを、線分データ、文字データおよび画像データに分解して記憶するファイル手段と、所望のドキュメントを画像データとして入力する画像入力手段と、入力された前記画像データから線分データと文字データを抽出する文字線分抽出手段と、前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントの全部又は一部を対象としてその夫々につき、当該ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求め、求められた差異のデータ量に基づいて、入力された前記ドキュメントに類似する類似ドキュメントを求める手段と、前記ファイル手段から前記類似ドキュメントが求められた場合、前記類似ドキュメントを識別する第1の識別情報と、求められた前記差異と、前記入力されたドキュメントを識別する第2の識別情報とを対応付けて前記ファイル手段に登録し、前記ファイル手段から前記類似ドキュメントが求められなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録する登録手段とを具備したことを特徴とする。
また、本発明は、ドキュメントを、線分データ、文字データおよび画像データとしてファイル手段に登録するドキュメントファイリング方法であって、所望のドキュメントを画像データとして入力するステップと、入力された前記画像データから線分データと文字データを抽出するステップと、前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントの全部又は一部を対象としてその夫々につき、当該ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求め、求められた差異のデータ量に基づいて、入力された前記ドキュメントに類似する類似ドキュメントを求めるステップと、前記ファイル手段から前記類似ドキュメントが求められた場合、前記類似ドキュメントを識別する第1の識別情報と求められた前記差異と前記入力されたドキュメントを識別する第2の識別情報とを対応付けて前記ファイル手段に登録し、前記ファイル手段から前記類似ドキュメントが求められなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録するステップとを有することを特徴とする。
【0015】
【作用】
本発明では、ドキュメントを、線分データ、文字データおよび画像データとしてファイル手段に登録する際、登録したい所望のドキュメントを画像データとして入力し、入力された画像データから線分データと文字データを抽出し、ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントのうち、入力されたドキュメントに類似する類似ドキュメントを検索し、検索された類似ドキュメントの線分データ、文字データおよび画像データと入力されたドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異と、類似ドキュメントを識別する情報と、入力されたドキュメントを識別する情報を対応付けてファイル手段に登録する。
したがって、本発明によれば、ドキュメントをファイル手段に登録する際に、登録済みのドキュメントとの文字、線分および画像データの差異を記憶させるので、ドキュメントのファイル手段への登録が容易であるとともに、文字、線分あるいは画像データを利用してファイル手段内のドキュメントの検索を容易に行なうことができる。
また、本発明によれば、ドキュメントを差異すなわち差分データとして保存するので、1つのドキュメントを保存するために必要なデータ量を大幅に減少することができる。
【0018】
【実施例】
以下、図面を参照しながら実施例を説明する。
(第1の実施例)
図1に、本実施例に係るドキュメントファイリング装置の機能ブロック図を示す。本実施例では、ドキュメントとして、その一種である帳票を取上げる。
【0019】
本実施例のドキュメントファイリング装置は、帳票を画像データとして取り込む画像入力部1、画像データから線分、文字、画像データを抽出する文字線分抽出部2、登録する帳票と登録済みの帳票の差異を検出するドキュメントデータ差異検出部3、帳票を記憶するファイル記憶部4、登録する帳票に類似する登録済みの帳票を検索する検索部5を備える。
【0020】
図2には、本実施例のドキュメントファイリング装置のハードウェア構成の一例を示す。プロセッサ11、スキャナー13、ファイル装置16、メモリ17を備え、スキャナー13から読み込まれた帳票に対し、メモリ17に格納されたプログラム(線分文字抽出処理、類似帳票検索処理、差異データ抽出処理、処理結果の保存など)をプロセッサ11にて実行して処理を施し、処理結果をファイル装置16に格納するものである。なお、キーボード12とディスプレイ14を用いてファイル装置16に登録されている帳票の検索を行い、結果をプリンター15に出力するようにすることも可能である。
【0021】
図3に、本実施例の帳票保存処理の流れを示す。また、図4に本実施例の処理の概念図を示す。
ステップS1で、例えばイメージ・スキャナーなどを用いて構成された画像入力部1から登録したい帳票を画像データとして取り込む。例えば、図4中の21で示す保存したい帳票(以下、帳票Aと呼ぶ)を画像データとして取り込む。
【0022】
ステップS2で、文字線分抽出部2により入力画像データから線分・文字・画像を抽出する。
ステップS3で、検索部5によりファイル記憶部4から登録したい帳票に類似する類似帳票を検索する。例えば、図4中の22で示す帳票(以下、帳票Bと呼ぶ)が類似帳票として得らる。
【0023】
登録されている場合、ステップS5で、ドキュメントデータ差異検出部3により登録したい帳票と類似帳票の画像データ間の差異を検出し、ステップS6で、この差異のデータを参照対象の帳票を特定する情報(例えば帳票番号)と対応付けてファイル記憶部4に登録し、処理を終了する。例えば、図4中の23で示す差異データが得られ、これを帳票Bの帳票番号とともに登録する。
【0024】
一方、登録されていない場合、ステップS7で、入力画像データから抽出された線分・文字・画像データをファイル記憶部4に登録し、処理を終了する。
なお、本実施例では、保存されている帳票Aは、帳票Bのデータと求めた差異データとを合成することにより再現することができる。
【0025】
以下、本実施例の処理の流れを、図3のフローチャートと、図4の具体例を交えた処理の概念図などを参照しながらさらに詳しく説明する。
[ステップS1]
まず、図4中の21で示す保存したい帳票Aは、画像入力部1により、画像データとして取り込まれる。
【0026】
[ステップS2]
次に、文字線分抽出部2により、入力画像中の文字データと線分データが抽出される。文字や線分として抽出されなかった画像成分は、画像データとする。
【0027】
線分データの抽出では、線分データとしては、長方形を構成する水平、垂直線分、長方形の対角線の斜め線分、また、長方形を構成する線分以外の水平線分が抽出対象とされる。一方、文字データの抽出では、線分以外の黒い領域で長方形を構成する纏まりを求め、これを1つの文字列としてその中の個々の文字の認識処理を行う。この識別処理において文字と同定できたもののみを文字データとして出力する。
【0028】
直線抽出処理は、例えば、電子情報通信学会論文誌、Vol.J77−D−II,No.1,pp.91−100「輪郭線と細線を用いた直線・円弧あてはめによる図面のベクトル化」に示される処理で実行することができる。この処理の流れを図5のフローチャートに示す。まず、入力画像に対して細線化処理を施し(ステップS11)、次に、細線を線分近似する(ステップS12)。また、同時に、入力画像の黒領域の輪郭線を抽出し(ステップS13)、その輪郭の線分近似を行う(ステップS14)。次に、線分近似された細線を追跡し、その追跡された一連の部分群の始点と終点を結ぶ線分が線分近似された輪郭線の間に入っているもので最大の長さを持つものを抽出線分として出力する(ステップS15)。この処理を線分近似された細線すべてに対して行う。次に、この抽出した線分のなかで水平、垂直にちかいものだけを残す(ステップS16)。
【0029】
なお、上記の方式以外にも、水平、垂直方向に黒画素がある値以上多く連なっている部分を水平、垂直線として検出する方法や、輪郭線の平行線ペアを検出し直線をみつける方法など種々の方法を用いることができる。
【0030】
文字抽出処理は、直線と判定されなかった黒画素の領域の中で長方形で囲むことができる領域をもとめこれを文字列の領域と仮定し、例えば、電子情報通信学会の信学技法PRU93−47「動的な仮説生成・検証による日本語印刷文書からの文字の切り出し」に示される文字領域の検出とその認識を繰り返す方式によって、その識別を行う。
【0031】
ここで、文字線分抽出処理を具体例を参照して説明する。文字線分抽出処理の一例を図6のフローチャートに示す。また、図7は、本実施例のドキュメントファイリング装置に格納する帳票の一例であり、線分や文字が記入されている。図7中には、各線分と文字の座標値を示してある。また、図7中には、iで画像データの領域を表している。
【0032】
文字線分抽出処理では、まず、図7に示す文字枠を抽出する(ステップS21)。
次に、この中の文字の識別を行う(ステップS22)。
【0033】
識別できたものについては、座標値、文字コードを出力する(ステップS23,S24)。図8は、文字線分抽出部2により抽出された線分データの一例である。線分データは、帳票の枠に対応する長方形については、その四角の座標、その他の線分については、始点、終点の座標値で表される。
【0034】
一方、識別できなかった領域については、その部分の画像を文字コードの代わりに出力する(ステップS23,S24)。図9は、文字線分抽出部2により抽出された文字データの一例であり、図10は、文字線分抽出部2により抽出された画像データの一例である。
【0035】
[ステップS3]
上記のような文字線分抽出処理が完了した後、検索部5は、ファイル記憶部4から登録したい帳票に類似する類似帳票を検索する。類似する帳票とは、登録したい帳票との差異が少ない帳票である。
【0036】
図3のステップS3の類似帳票を検索する処理では、ファイル記憶部4に登録されている帳票データをディスプレイに表示し、オペレータに指示してもらう方法を用いても良い。また、ファイル手段4にデータを登録する際に保存されている帳票の種類を表す項目にマークを付けておき、このマークが付けられているデータのみを順番に検索し、現在保存しようとしている帳票の対応する位置にその種類を表す文字情報が記載されているかどうか判断し、このような文字が見つかった際には、この帳票を類似帳票とする方法もある。
【0037】
[ステップS4]
ステップS3の検索の結果、ファイル記憶部4内に登録する帳票Aに類似する帳票Bが登録されていた場合、帳票Aと帳票Bの差分を求め、この差分を登録するために、ステップS5に移る。登録されていなかった場合、帳票Aのデータをそのまま登録するため、ステップS7に移る。なお、ファイル記憶部4に他の帳票がまだ保存されていない場合、ステップS3の検索をせずに、ステップS7に移っても良い。
【0038】
[ステップS5]
ステップS3で類似帳票Bが検索されると、ドキュメントデータ差異検出部3は、登録したい帳票Aと類似帳票Bの画像データ間の差異を検出する。
【0039】
まず、帳票Bの図形データで帳票Aに対応するものを探す。この探索により、帳票Aと帳票Bの他のデータの位置合わせを行い、帳票Aが帳票Bに重なるように、図形、文字、画像の座標値を変換する。
【0040】
次に、帳票Aの図形データで帳票Bと重ならないデータを検出する。
文字データについては、座標値が重なるもので、文字コードが一致するもの以外を帳票Bとの差異として出力する。部分画像データについては、座標値が重なるもので、双方の画像の排他的論理和をとり、その黒画素の数を計測する。この値が、しきい値以上のものについては、帳票B内の画像と異なるものと判断する。
【0041】
帳票Aと帳票Bとの位置合わせ方法は、例えば、以下の方式で行うことができる。まず、帳票Aの線分データの座標値の中で、x,y座標値の最大、最小値を求める。
【0042】
図8の例では、
x座標値の最小値 x0
y座標値の最小値 y0
x座標値の最大値 x5
y座標値の最大値 y5
である。
【0043】
次に、帳票Bについても、同様に、その線分データの線分データの座標値の中で、x,y座標値の最大、最小値を求める。次に、帳票Aと座標値の最小値、最大値が帳票Bのものと重なるように帳票Aの線分データを拡大/縮小する。また、文字の記載座標値も同様の変換を施す。これにより、帳票Aと帳票Bの大きさが一致し、四角の座標値を合わせることにより、帳票Aと帳票Bの位置合わせが完了する。
【0044】
図11の2つの帳票Aと帳票Bの差異を検出した例では、帳票内の1つの線分、1つの活字印刷文字、および1箇所の手書き記入の図形の画像がその差として検出される。
【0045】
[ステップS6]
ドキュメントデータ差異検出部3により登録したい帳票Aと類似帳票Bの画像データ間の差異データが得られると、この差異データは、参照対象の帳票Bを特定する情報(例えば帳票番号)と対応付けてファイル記憶部4に登録される。この登録処理は、図示しない登録手段により制御される。
【0046】
図12に、ファイル記憶部4への帳票データの保存方法の一例を示す。帳票Aは、その帳票を識別する名前と自動抽出した文字、線分、画像データが記憶される。帳票Aは、その帳票を識別する名前と差異を求める際に使った帳票Bの名前、および求められた差異データからなる。
【0047】
なお、このようにして保存されている帳票Aは、帳票Bのデータと求めた差異データとを合成することにより再現することができる。
[ステップS7]
一方、ステップS3の検索の結果、ファイル記憶部4内に帳票Aに類似する帳票登録が登録されていなかった場合、線分文字抽出処理を施された帳票Aについて、抽出された文字、図形、画像をその帳票のデータとしてファイル記憶部に登録する。
【0048】
このように、本実施例によれば、帳票データを差分データとして保存することにより、1つの帳票を保存するために必要なデータ量を、すべて帳票1枚分ごとに保存する方法と比べ大幅に減少されている。
【0049】
ところで、本実施例によれば、帳票上の文字を用いて検索する方法や、帳票の枠の似ているものを検索する方法を実現することができる。以下、本実施例により登録された帳票を検索する方法のいくつか示す。検索方法は、大きく分けて3種類ある。1つは、オペレータにキーボードから検索キーを入力させ、このキーを含む帳票をファイル記憶部4から検索する方法である。第2は、ディスプレイに保存済みの帳票の全体または部分を表示し、オペレータに求めるものが表示されているかどうか問い合わせる方法である。第3は、検索したい帳票の類似帳票の画像をスキャナーから取り込み、これに類似するファイル記憶部4内の帳票を自動的に探す方法である。本実施例によれば、上記の3種類とも実現可能である。先の2種類の方法は、従来のファイリング検索方法であるので、ここでは、第3の検索方法の例について述べる。
【0050】
第3の方法では、検索したい帳票の類似サンプル(以下、帳票Cと呼ぶ)を入力してこれを検索キーとするために、まず、画像入力部1から検索に用いられる帳票の画像データが取り込まれ、次に、文字線分抽出部2により帳票Cの入力画像から線分/文字抽出処理が行われる。これは、帳票登録の際に行われる処理と同じである。この処理によって得られた文字/線分情報が検索キーとして用いられる。この検索方式の一例は、検索したい帳票の空白帳票を帳票Cとして用いる方法である。この方式は、与えられた帳票Cの文字データ、線分データを含むファイル記憶部の帳票を検索する処理で実現される。
【0051】
このように本実施例によれば、ドキュメントデータのファイル記憶部への登録が容易で、かつ、その検索も容易に実行することができる。
(第2の実施例)
第1の実施例では、ステップS3の検索部5による類似帳票の検索としては、ファイル記憶部4に登録されている帳票データをディスプレイに表示し、オペレータに指示してもらう方法や、ファイル手段4にデータを登録する際に保存されている帳票の種類を表す項目にマークを付けておき、このマークが付けられているデータのみを順番に検索し、現在保存しようとしている帳票の対応する位置にその種類を表す文字情報が記載されているかどうか判断し、このような文字が見つかった際には、この帳票を類似帳票とするような方法などを用いた。
【0052】
本実施例では、類似帳票の検索として、登録したい帳票と類似帳票の画像データ間の差異を検出し、この差異の最も少ない帳票を参照帳票とするものである。図13に、本実施例に係るドキュメントファイリング装置の機能ブロック図を示す。本実施例のドキュメントファイリング装置は、画像入力部1、文字線分抽出部2、ドキュメントデータ差異検出部33、ファイル記憶部4を備える。本実施例の画像入力部1、文字線分抽出部2、ファイル記憶部4は、第1の実施例の同番号のブロックに相当するものである。本実施例では、第1の実施例の検索部5の処理は、ドキュメントデータ差異検出部33により行われる。
【0053】
以下、本実施例の帳票保存処理の流れを、図14のフローチャートや第1の実施例で用いた図4の概念図を参照しながら説明する。
[ステップS31]
まず、図4中の21で示す保存したい帳票Aは、画像入力部1により、画像データとして取り込まれる。
【0054】
[ステップS32]
次に、文字線分抽出部2により、入力画像中の文字データと線分データが抽出される。文字や線分として抽出されなかった画像成分は、画像データとする。
【0055】
線分データの抽出では、線分データとしては、長方形を構成する水平、垂直線分、長方形の対角線の斜め線分、また、長方形を構成する線分以外の水平線分が抽出対象とされる。一方、文字データの抽出では、線分以外の黒い領域で長方形を構成する纏まりを求め、これを1つの文字列としてその中の個々の文字の認識処理を行う。この識別処理において文字と同定できたもののみを文字データとして出力する。
【0056】
直線抽出処理や文字抽出処理は、第1の実施例にて説明したような方法を用いることができる。
例えば、第1の実施例と同様、図6のフローチャートを参照して説明したような手順により、図7の帳票から図8の線分データ、図9の文字データ、および図10の画像データを得ることができる。
【0057】
[ステップS33]
上記のような文字線分抽出処理が完了した後、ファイル記憶部4に保存済みの帳票データが存在する際には、登録したい帳票Aに最も類似する帳票Bを検索する。本実施例では、前述したように、登録したい帳票とファイル記憶部4に保存済みの各帳票との夫々の間の画像データ間の差異を検出し、この差異の最も少ない帳票を参照帳票とする。
【0058】
ここでの差異を求める処理は、ドキュメントデータ差異検出部33により行われ、その処理内容は、前述したドキュメントデータ差異検出部3によるステップS3の類似帳票検索処理と同様である。
【0059】
ただし、ここでは、ファイル記憶部4に保存されており類似帳票の候補となる複数の帳票データについて夫々差異を検出し、この差異の最も少ない帳票を参照帳票とする。この差異の大小の評価は、差異データのデータ量の比較などにより行えば良い。
【0060】
ファイル記憶部4に保存済みの帳票データすべてを類似帳票の候補としても良いし、最初に画像データだけ比較して候補を絞っておき、次に他のデータを比較するようにしても良い。
【0061】
なお、予め設定したしきい値より小さいデータ量の差異データを得ることができなかった場合は、類似帳票が登録されていないものとしても良い。
[ステップS34]
ステップS33の検索の結果、ファイル記憶部4内に登録する帳票Aに類似する帳票Bが登録されていた場合、ステップS36に移る。登録されていなかった場合、帳票Aのデータをそのまま登録するため、ステップS37に移る。なお、ファイル記憶部4に他の帳票がまだ保存されていない場合、ステップS33の検索をせずに、ステップS37に移っても良い。
【0062】
[ステップS36]
ドキュメントデータ差異検出部33により登録したい帳票Aと類似帳票Bの画像データ間の差異データが得られると、この差異データは、参照対象の帳票Bを特定する情報(例えば帳票番号)と対応付けてファイル記憶部4に登録される。この登録処理は、図示しない登録手段により制御される。例えば、第1の実施例で示した図12のようにして、ファイル記憶部4に帳票データが保存される。
【0063】
なお、このようにして保存されている帳票Aは、帳票Bのデータと求めた差異データとを合成することにより再現することができる。
[ステップS37]
一方、ステップS33の検索の結果、ファイル記憶部4内に帳票Aに類似する帳票登録が登録されていなかった場合、線分文字抽出処理を施された帳票Aについて、抽出された文字、図形、画像をその帳票のデータとしてファイル記憶部4に登録する。
【0064】
このように、本実施例によれば、帳票データを差分データとして保存することにより、1つの帳票を保存するために必要なデータ量を、すべて帳票1枚分ごとに保存する方法と比べ大幅に減少されている。
【0065】
ところで、本実施例によれば、第1の実施例で述べたような帳票上の文字を用いて検索する方法や、帳票の枠の似ているものを検索する方法を実現することができる。もちろん、第1の実施例で第3の検索方法として述べた方法も実現可能である。すなわち、本実施例でも、検索したい帳票の類似サンプル(以下、帳票Cと呼ぶ)を入力してこれを検索キーとするために、まず、画像入力部1から検索に用いられる帳票の画像データが取り込まれ、次に、文字線分抽出部2により帳票Cの入力画像から線分/文字抽出処理が行われる。これは、帳票登録の際に行われる処理と同じである。この処理によって得られた文字/線分情報が検索キーとして用いられる。この検索方式の一例は、検索したい帳票の空白帳票を帳票Cとして用いる方法である。この方式は、与えられた帳票Cの文字データ、線分データを含むファイル記憶部の帳票を検索する処理で実現される。
【0066】
このように本実施例によれば、ドキュメントデータのファイル記憶部への登録が容易で、かつ、その検索を容易に実行することができる。
(第3の実施例)
ここでは、第1の実施例または第2の実施例のように画像入力部1、文字線分抽出部2、ファイル記憶部4を備えたドキュメントファイリング装置において、帳票Cとして空白帳票を読み込ませファイル記憶部4から同種の帳票を検索する例を説明する。なお、画像入力部1、文字線分抽出部2、ファイル記憶部4は、前述したものと同様であるので、ここでの説明は省略する。
【0067】
以下、本実施例の処理の流れを説明する。
図15は、本実施例の処理の一例を示すフローチャートである。
まず、画像入力部1により図16(a)に示すような帳票Cを画像データとして取り込む(ステップS101)。
【0068】
次に、文字線分抽出部2により帳票Cに書かれている線分を抽出し(ステップS102)、図16(b)のように、その線分データから枠を表す長方形を検出する(ステップS103)。次に、各長方形領域の中点(図16(c)中で30で示される黒丸)の座標値を求めるとともに(ステップS104)、図16(d)のように、抽出した長方形を包含する最小の長方形(外接長方形)を求める(ステップS105)。なお、ステップS104で抽出した図16(c)の各々の点30は、図16(a)の帳票Cの各々の枠と1対1に対応している。
【0069】
先の実施例で述べたように、ファイル記憶部4に記憶されている帳票について同様の長方形領域抽出の処理がその登録時になされており、ファイル記憶部4に記憶されている。そこで、各帳票に対して、上記帳票Cに対して行ったのと同様の、帳票内の長方形領域を包含する最小の長方形(外接長方形)と、各長方形の中点の座標値を求める。
【0070】
ここで、このファイル記憶部4内の帳票を帳票Dと呼ぶ。帳票Cと帳票Dが同一であるかどうか調べる処理を図15に示す手順によって行う。
まず、ファイル記憶部4から帳票Dの長方形データを読み込み(ステップS107)、各長方形領域の中点の座標値を求めるとともに(ステップS108)、抽出した長方形を包含する最小の長方形(外接長方形)を求める(ステップS109)。帳票Cと帳票Dの外接長方形の大きさを比べ(ステップS110)、これが大きく異なるものは、同一帳票として扱わない。この場合、ステップS106に戻り、次の帳票Dについて同様の評価を行う。
【0071】
ここで、帳票Cと帳票Dの外接長方形の大きさがほぼ同じ場合(ステップS110)、この外接長方形の位置、大きさを用いて、帳票Dが帳票Cと重なるように帳票Dの座標値を変換する(ステップS111)。この変換では、各長方形の中点の座標値のみを対象とする。
【0072】
次に、帳票Cと帳票Dの各長方形の中点の座標値が同じ、または近いものを検出する(ステップS112)。
この数が全体のt%以上である場合に、帳票Dと帳票Cは同じであると判断し、(ステップS113)、帳票Dを検索結果として出力し、(ステップS114)処理を終了する。
【0073】
一方、この数が全体のt%未満の場合は、帳票Dと帳票Cを同一帳票として扱わない。この場合、ステップS106に戻り、次の帳票Dについて同様の評価を行う。
【0074】
もし、ステップS106にて、参照していない帳票が残っていないときに、検索結果なしとして処理を終了する。
ところで、ファイル記憶部4内の帳票は、いろいろな情報が記入されているため、枠を表す長方形領域を正確に抽出できない場合がある。そのような場合に備え、上記帳票照合処理を以下のように拡張することにより対応することができる。
【0075】
まず、帳票Cの長方形領域からその中点の座標を求めた後に、隣接する長方形を併合してできる長方形をつくりその中点も求める。図17(a),(b)に、その例を示す。この中点データを用いることにより、図18(a)に示す例のように、帳票内の線分が一部切れていて長方形ができていない際には、図17(b)で示した併合長方形の中点が図18(b)に示す帳票から得られた長方形の中点と対応付けが行われ、帳票識別で同じと判断される。
【0076】
また、図19(a)に示すように、本来ない線分が書き込まれたために長方形領域が余分に検出されている場合には、この帳票からの長方形領域の中点を求める際に、図17と同様の併合した長方形を作成し、図19(b)の中点を照合に用いることにより、図17(a)の帳票と類似であると照合することができる。
【0077】
さらに、詳細に帳票の類似を判定するために、帳票に記入されている文字列が同一であるかどうかを調べる方法もある。
また、他の検索方法として、検索したい帳票に類似する帳票を帳票Cとして選択し、この帳票内の文字、線分を抽出し、この帳票の中で検索に用いたい文字、線分データをオペレータに指示させ、指示された文字、線分を含む帳票をファイル記憶部4から検索する方法もある。
【0078】
なお、本実施例で述べた帳票が同一であるかどうかを判定する処理は、第2の実施例において類似帳票を得る際の最も類似するものを判定する処理にも用いることができる。
また、本発明は上述した各実施例に限定されるものではなく、その要旨を逸脱しない範囲で、種々変形して実施することができる。
【0079】
【発明の効果】
本発明によれば、ドキュメントをファイル手段に登録する際に、類似するドキュメントとの文字、線分および画像データの差異を記憶させるので、ドキュメントのファイル手段への登録が容易であるとともに、文字、線分あるいは画像データを利用してファイル手段内のドキュメントの検索を容易に行なうことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係るドキュメントファイリング装置の構成を示すブロック図
【図2】同実施例のドキュメントファイリング装置のハードウェア構成の一例を示す図
【図3】同実施例の処理の流れを示すフローチャート
【図4】本実施例の処理の流れを示す概念図
【図5】直線抽出処理の一例を示すフローチャート
【図6】同実施例の文字線分抽出処理の一例を示すフローチャート
【図7】入力する帳票の一例を示す図
【図8】抽出された線分データの一例を示す図
【図9】抽出された文字データの一例を示す図
【図10】抽出された画像データの一例を示す図
【図11】2つの帳票の差異の検出を説明するための図
【図12】帳票データの保存方法の一例を説明するための図
【図13】本発明の第2の実施例に係るドキュメントファイリング装置の構成を示すブロック図
【図14】同実施例の処理の流れを示すフローチャート
【図15】本発明の第3の実施例の処理の流れを示すフローチャート
【図16】同実施例の処理を説明するための図
【図17】同実施例の処理を説明するための図
【図18】同実施例の処理を説明するための図
【図19】同実施例の処理を説明するための図
【符号の説明】
1…画像入力部、2…文字線分抽出部、3…ドキュメントデータ差異検出部、4…ファイル記憶部、5…検索部、33…ドキュメントデータ差異検出部、11…プロセッサ、12…キーボード、13…スキャナー、14…ディスプレイ、15…プリンター、16…ファイル装置、17…メモリ

Claims (4)

  1. ドキュメントを、線分データ、文字データおよび画像データに分解して記憶するファイル手段と、
    所望のドキュメントを画像データとして入力する画像入力手段と、
    入力された前記画像データから線分データと文字データを抽出する文字線分抽出手段と、
    前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントのうち、入力された前記ドキュメントに類似する類似ドキュメントを検索する検索手段と、
    前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合に、検索された前記類似ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求める差異検出手段と、
    前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合、前記類似ドキュメントを識別する第1の識別情報と、求められた前記差異と前記入力されたドキュメントを識別する第2の識別情報を対応付けて前記ファイル手段に登録し、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録する登録手段とを具備したことを特徴とするドキュメントファイリング装置。
  2. ドキュメントを、線分データ、文字データおよび画像データとしてファイル手段に登録するドキュメントファイリング方法であって、
    所望のドキュメントを画像データとして入力するステップと
    入力された前記画像データから線分データと文字データを抽出するステップと
    前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントのうち、入力された前記ドキュメントに類似する類似ドキュメントを検索するステップと
    前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合に、検索された前記類似ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求めるステップと
    前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていた場合、前記類似ドキュメントを識別する第1の識別情報と求められた前記差異と前記入力されたドキュメントを識別する第2の識別情報を対応付けて前記ファイル手段に登録し、前記検索の結果、前記ファイル手段に前記類似ドキュメントが記憶されていなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録するステップとを有することを特徴とするドキュメントファイリング方法。
  3. ドキュメントを、線分データ、文字データおよび画像データに分解して記憶するファイル手段と、
    所望のドキュメントを画像データとして入力する画像入力手段と、
    入力された前記画像データから線分データと文字データを抽出する文字線分抽出手段と、
    前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントの全部又は一部を対象としてその夫々につき、当該ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求め、求められた差異のデータ量に 基づいて、入力された前記ドキュメントに類似する類似ドキュメントを求める手段と、
    前記ファイル手段から前記類似ドキュメントが求められた場合、前記類似ドキュメントを識別する第1の識別情報と、求められた前記差異と、前記入力されたドキュメントを識別する第2の識別情報とを対応付けて前記ファイル手段に登録し、前記ファイル手段から前記類似ドキュメントが求められなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録する登録手段とを具備したことを特徴とするドキュメントファイリング装置。
  4. ドキュメントを、線分データ、文字データおよび画像データとしてファイル手段に登録するドキュメントファイリング方法であって、
    所望のドキュメントを画像データとして入力するステップと、
    入力された前記画像データから線分データと文字データを抽出するステップと、
    前記ファイル手段に線分データ、文字データおよび画像データがそのまま格納されているドキュメントの全部又は一部を対象としてその夫々につき、当該ドキュメントの線分データ、文字データおよび画像データと入力された前記ドキュメントから抽出された線分データ、文字データおよび画像データとの夫々の差異を求め、求められた差異のデータ量に基づいて、入力された前記ドキュメントに類似する類似ドキュメントを求めるステップと、
    前記ファイル手段から前記類似ドキュメントが求められた場合、前記類似ドキュメントを識別する第1の識別情報と、求められた前記差異と、前記入力されたドキュメントを識別する第1の識別情報とを対応付けて前記ファイル手段に登録し、前記ファイル手段から前記類似ドキュメントが求められなかった場合、前記入力されたドキュメントの線分データ、文字データおよび画像データをそのまま前記第2の識別情報に対応付けて前記ファイル手段に登録するステップとを有することを特徴とするドキュメントファイリング方法。
JP03400295A 1995-02-22 1995-02-22 ドキュメントファイリング装置および方法 Expired - Lifetime JP3602596B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03400295A JP3602596B2 (ja) 1995-02-22 1995-02-22 ドキュメントファイリング装置および方法
US08/592,706 US5815704A (en) 1995-02-22 1996-01-26 Document filing apparatus and method having document registration, comparison and retrieval capabilities

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03400295A JP3602596B2 (ja) 1995-02-22 1995-02-22 ドキュメントファイリング装置および方法

Publications (2)

Publication Number Publication Date
JPH08235341A JPH08235341A (ja) 1996-09-13
JP3602596B2 true JP3602596B2 (ja) 2004-12-15

Family

ID=12402247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03400295A Expired - Lifetime JP3602596B2 (ja) 1995-02-22 1995-02-22 ドキュメントファイリング装置および方法

Country Status (2)

Country Link
US (1) US5815704A (ja)
JP (1) JP3602596B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094962A (ja) * 2005-09-30 2007-04-12 Seiko Epson Corp 画像内に表現された被写体の特定

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187744A (ja) * 1996-12-26 1998-07-21 Toshiba Corp ドキュメント処理装置及びデータ処理装置並びにドキュメント処理方法及びデータ処理方法
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
JP4098880B2 (ja) * 1997-06-06 2008-06-11 松下電器産業株式会社 情報検索装置
JPH11143908A (ja) * 1997-11-14 1999-05-28 Ricoh Co Ltd ファイルシステムおよび該システムに使用するプログラムを記録した記録媒体
JP3836261B2 (ja) * 1998-08-10 2006-10-25 株式会社リコー ファイルシステム
IL125846A0 (en) * 1998-08-19 1999-04-11 Emony Incremental program update
US6826574B1 (en) * 1999-08-27 2004-11-30 Gateway, Inc. Automatic profiler
JP2001306598A (ja) * 2000-04-20 2001-11-02 Fuji Xerox Co Ltd データ入力フォーム検索システム、データ入力フォーム検索方法、及び、コンピュータ読み取り可能な記録媒体
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2003150602A (ja) * 2001-11-15 2003-05-23 Hitachi Ltd 文書情報管理方法および装置
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
CN100501728C (zh) * 2003-01-31 2009-06-17 佳能株式会社 图像处理方法、系统、程序、程序存储介质以及信息处理设备
US7536636B2 (en) * 2004-04-26 2009-05-19 Kodak Graphic Communications Canada Company Systems and methods for comparing documents containing graphic elements
JP4998220B2 (ja) * 2007-11-09 2012-08-15 富士通株式会社 帳票データ抽出プログラム、帳票データ抽出装置および帳票データ抽出方法
US8438558B1 (en) 2009-03-27 2013-05-07 Google Inc. System and method of updating programs and data
JP2012095231A (ja) * 2010-10-28 2012-05-17 Fujitsu Ltd 帳票画像管理システム、帳票画像管理方法、及びプログラム
JP5703898B2 (ja) * 2011-03-30 2015-04-22 富士通株式会社 帳票管理システム、帳票画像管理方法、及びプログラム
US8724931B2 (en) * 2011-05-27 2014-05-13 Ebay Inc. Automated user information provision using images
JP5884597B2 (ja) * 2012-03-29 2016-03-15 富士通株式会社 帳票画像管理システム、帳票画像管理方法、及びプログラム
US9374501B2 (en) * 2014-03-04 2016-06-21 Xerox Corporation Methods and devices for form-independent registration of filled-out content
JP6520279B2 (ja) * 2015-03-24 2019-05-29 富士ゼロックス株式会社 処理装置、画像処理システム、およびプログラム
JP6852359B2 (ja) 2016-11-16 2021-03-31 富士ゼロックス株式会社 画像処理装置及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
US5101448A (en) * 1988-08-24 1992-03-31 Hitachi, Ltd. Method and apparatus for processing a document by utilizing an image
JPH02208780A (ja) * 1989-02-09 1990-08-20 Canon Inc 記憶情報の変更方法
JPH02301873A (ja) * 1989-05-17 1990-12-13 Sanyo Electric Co Ltd イメージ処理装置
JP2890482B2 (ja) * 1989-06-13 1999-05-17 富士ゼロックス株式会社 文書画像再配置ファイリング装置
JPH0423176A (ja) * 1990-05-18 1992-01-27 Hitachi Ltd 図面作成装置
JPH04105178A (ja) * 1990-08-24 1992-04-07 Seiko Epson Corp 文書画像処理装置
JPH04195485A (ja) * 1990-11-28 1992-07-15 Hitachi Ltd 画像情報入力装置
JPH05266095A (ja) * 1992-03-23 1993-10-15 Toshiba Corp 画像検索装置
US5592574A (en) * 1992-04-06 1997-01-07 Ricoh Company Ltd. Method and apparatus for expansion of white space in document images on a digital scanning device
JP3323535B2 (ja) * 1992-05-19 2002-09-09 キヤノン株式会社 画像記憶装置及び画像記憶装置の制御方法
US5590317A (en) * 1992-05-27 1996-12-31 Hitachi, Ltd. Document information compression and retrieval system and document information registration and retrieval method
US5377348A (en) * 1992-06-04 1994-12-27 International Business Machines Corporation System for searching a data base by creating a marking matrix in which two dimensional patterns control the search and selection
JPH063800A (ja) * 1992-06-16 1994-01-14 Dainippon Screen Mfg Co Ltd 画像処理方法
JP3493522B2 (ja) * 1993-10-20 2004-02-03 ミノルタ株式会社 画像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094962A (ja) * 2005-09-30 2007-04-12 Seiko Epson Corp 画像内に表現された被写体の特定

Also Published As

Publication number Publication date
US5815704A (en) 1998-09-29
JPH08235341A (ja) 1996-09-13

Similar Documents

Publication Publication Date Title
JP3602596B2 (ja) ドキュメントファイリング装置および方法
US5416849A (en) Data processing system and method for field extraction of scanned images of document forms
JP3469345B2 (ja) 画像のファイリング装置及びファイリング方法
US5721940A (en) Form identification and processing system using hierarchical form profiles
US20070168382A1 (en) Document analysis system for integration of paper records into a searchable electronic database
JP2713622B2 (ja) 表形式文書読取装置
US20070242882A1 (en) Image processing apparatus for identifying the position of a process target within an image
JPH06301781A (ja) コンピュータによるパターン認識のためのイメージ変換方法及び装置
JP2006330872A (ja) 指紋照合装置、方法およびプログラム
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
JPH08180068A (ja) 電子ファイリング装置
JP3090070B2 (ja) 帳票識別方法及び装置
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
KR20090123523A (ko) 광학 문자 인식 시스템 및 방법
JP2009182530A (ja) 業務処理遂行支援装置
JP2001094711A (ja) ドキュメント画像処理装置及びドキュメント画像処理方法
JPH11282956A (ja) 帳票識別方法、装置および記録媒体
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JP3085508B2 (ja) 電子帳票検索システム
JP2000259847A (ja) 情報検索方法、装置および記録媒体
CN114565750A (zh) 一种纸质试题的处理方法和系统
JP4188344B2 (ja) 指紋照合装置、方法およびプログラム
JP2006330873A (ja) 指紋照合装置、方法およびプログラム
JP3305367B2 (ja) データベースへのデータ入力装置
JP2006323511A (ja) 記号認識方法及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040924

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101001

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111001

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111001

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121001

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121001

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 9

EXPY Cancellation because of completion of term