JP2004166062A - 書類読取装置 - Google Patents

書類読取装置 Download PDF

Info

Publication number
JP2004166062A
JP2004166062A JP2002330906A JP2002330906A JP2004166062A JP 2004166062 A JP2004166062 A JP 2004166062A JP 2002330906 A JP2002330906 A JP 2002330906A JP 2002330906 A JP2002330906 A JP 2002330906A JP 2004166062 A JP2004166062 A JP 2004166062A
Authority
JP
Japan
Prior art keywords
image
unit
document
character
auxiliary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002330906A
Other languages
English (en)
Inventor
Tsukasa Yasue
司 安江
Atsuhiro Imaizumi
敦博 今泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002330906A priority Critical patent/JP2004166062A/ja
Publication of JP2004166062A publication Critical patent/JP2004166062A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Image Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】書類の記載事項を読み取る書類読取装置の利便性を向上する。
【解決手段】領収書110において、手書きで付された補助記載111,112は、領域113,114を各々特定する。書類読取装置は、補助記載111,112に固有の形状・色彩等の特徴情報と画像900とを対比することで、領域113,114を特定する。領収書の様式に応じて補助記載111,112が付加されることで、領収書の様式に関わらず、領収書の金額欄等の処理を柔軟に行うことができる。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、書類の記載事項を読み取る書類読取装置に関する。
【0002】
【従来の技術】
従来、書類の記載事項をスキャナ等で取り込んだ画像データを利用する技術が実用となっている。書類の記載事項は、電子的なデータに変換されることで、記憶・加工・処理の利便が向上する。
【0003】
例えば、領収書に記載された金額等をデータベースにまとめて管理する場合がある。また、図書館や資料室における新聞や刊行物をスキャナで読み取り、情報の保存・取扱いの容易化が図られている。
【0004】
【特許文献1】
特開2001−43074
【特許文献2】
特開平10−275209
【0005】
【発明が解決しようとする課題】
しかし、書類の記載事項のうち、電子化して活用することが望まれるのは一部分に過ぎない場合がある。かかる場合に、電子化の対象となる領域を画像中で指定する作業は煩雑であった。例えば、領収書に記載された金額のデータベースを作成する場合、種々の様式の領収書について金額欄の領域を指示しなければならない。例えば、コンピュータが表示する映像において、マウス等のインタフェースを利用して特定の領域を指定しなければならない。かかる作業が煩雑なものとなっていた。
【0006】
かかる課題は上述の場合に限らず、書類の記載事項を読み取る場合に共通する課題であった。例えば、多様な様式で編集された新聞や刊行物の記載を、個別の記事ごとに整理してデータベース化する場合も同様である。
【0007】
本発明は、上述の課題を解決するためになされたものであり、書類の記載事項を読み取る書類読取装置の利便性の向上を目的とする。
【0008】
【課題を解決するための手段】
上記課題の少なくとも一部を解決するために、本発明では、次の構成を適用した。
本発明の書類読取装置は、書類の記載事項を読み取る書類読取装置であって、前記書類上に付加され、前記読み取り対象となる領域を特定するためのマーキングと共に、前記書類を表す画像の画像データを入力する入力部と、前記画像データに表れ、前記マーキングを他の前記画像と識別可能な特徴を表す特徴情報が記憶された設定部と、前記特徴情報に基づき、前記画像における前記マーキングの位置を特定する特定部と、前記マーキングに基づいて外周が規定される内部領域について、前記記載事項を抽出して出力する出力部とを備えることを要旨とする。
【0009】
このようにすることで、ユーザは、マーキングで特定することで、読み取り対象となる領域を、書類読取装置に容易に指示することができる。
【0010】
書類としては、帳票・領収書・帳簿等の会計書類・取引書類・価格表・刊行物・ポスターその他の種々の書類を適用することができる。
【0011】
マーキングは、書類に手書きされた記載であるものとしてもよい。また、書類表面に被せられるパターンシートであってもよい。ここで、パターンシートは、ドーナツ形状等の厚紙や、楕円形状等の半透光性プラスチックシート等であってもよい。また、マーキングは、書類表面上に被せられた透光性部材に手書きされた記載であるものとしてもよい。例えば、書類表面上に被せられた透光性のプラスチックシートに手書きされた記載であるものとしてもよい。また、マーキングは、書類表面上に付されたテープであってもよい。
【0012】
特徴情報は、マーキングの形状・文字・図形・模様・色彩の少なくとも一部に関する情報を含むものとしてもよい。形状の情報については、線の太さ・曲率等の情報を含むものとしてもよい。色彩については、半透明色や、金属色、可視波長外の色彩を含む。また、特徴情報は、可視波長外の色彩等により表される形状等の情報を含むものとしてもよい。
【0013】
特徴情報は、書類表面に付加された複数のマーキンングに共通するものであってもよいし、各マーキングごとに固有のものや、マーキングの種類に応じたものであってもよい。特徴情報の少なくとも一部は、抽出された記載事項を処理する場合のパラメータとして利用されるものであってもよいし、抽出された記載事項の処理の種類を特定するものであってもよい。
【0014】
抽出された記載事項は、データベースに蓄積されるものとしてもよい。また、抽出された記載事項は、所定の相手方への送付等、所定の情報処理の対象にされるものとしてもよい。例えば、マーキングの一部に、FAX番号を表す文字列など、情報処理の内容を指定するコマンド情報を含むものとしてもよい。
【0015】
本発明の書類読取装置において、前記設定部は、前記内部領域における前記記載事項の属性を表す属性データを、前記特徴情報と対応付けて記憶しており、前記特定部は、前記特徴情報により該属性データを特定し、前記出力部は、該属性データを、前記抽出された記載事項と対応付けて出力するものとしてもよい。
【0016】
このようにすることで、ユーザは、特徴情報で特定することにより、所望の処理内容を、領域ごとに容易に指示することができる。
【0017】
例えば、抽出された記載事項を、マーキングの種類に応じて分類して、データベースに記憶させることができる。また、マーキングの種類に応じた所定の相手方に、抽出された記載事項を送付させることもできる。さらに、データベースへの記憶と所定の相手方への送付とを、マーキングの種類に応じて選択的に行わせることもできる。
【0018】
本発明の書類読取装置において、前記画像は、前記内部領域に文字を含み、該文字に基づいて、該文字を表すコードを特定する文字認識部を備え、前記出力部は、該コードを出力する書類読取装置。
【0019】
このようにすることで、書類表面に記載された所望の文字を容易に文字認識させることができる。例えばユーザは、文章の所望の段落の位置に応じてマーキングを付すことで、その段落に含む文章を文字コードで表したデータを容易に得ることができる。
【0020】
本発明は、書類読取装置としての態様の他、書類読取方法など種々の態様で構成することが可能である。また、これらの方法をコンピュータによって実現するコンピュータプログラム自身またはこれと同視し得る信号として構成してもよい。更に、これらのコンピュータプログラムを記録した記録媒体として構成してもよい。
【0021】
ここで記憶媒体としては、フレキシブルディスクやCD−ROM、光磁気ディスク、ICカード、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置などコンピュータが読取り可能な種々の媒体を利用できる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態について、実施例に基づき以下の順序で説明する。
A.構成 :
B.処理:
C.変形例1;一括処理:
D.変形例2;マーキング:
E.変形例3;資料整理:
【0023】
A.構成
図1は、書類読取システム1000のシステム構成を示す説明図である。書類読取システム1000は、スキャナ101とパーソナルコンピュータ100とからなる。
【0024】
スキャナ101は、書類を撮像する撮像装置である。スキャナ101は、書類等に表された図形や写真等の記載事項を読み取って、これらを表した画像データをパーソナルコンピュータ100に送付する。
【0025】
なお、スキャナ101は、パーソナルコンピュータ100と一体的に構成されていてもよい。また、スキャナ101はパーソナルコンピュータ100と直接接続している場合に限定されることはない。例えば、スキャナ101で生成された画像データをFD(Flexible Disc)等の記録媒体を介してパーソナルコンピュータ100に入力してもよい。さらに、書類を撮像する撮像装置であれば、種々の装置をスキャナ101の代用とすることができる。例えば、デジタルスチルカメラが生成した画像データをパーソナルコンピュータ100に入力するものとしてもよい。
【0026】
図2は、スキャナ101が撮像する画像900を示す説明図である。
実施例で画像データは、領収書を撮像した場合の画像データである。ただし、書類読取システム1000のユーザは、補助記載111,112を領収書110に追加したうえで、スキャナ101に当該領収書110の撮像を行わせる。
【0027】
補助記載111は、領収書上の「金額5000円」なる文字を囲う、四角で黄色の枠である。また、補助記載112は、領収書上の「5000」なる文字を囲う、楕円で赤色の枠である。ここで、補助記載111,112以外の、領収書の地の記載は全て黒色等の無彩色である。パーソナルコンピュータ100は、補助記載111,112の枠の内部領域について情報処理を行う。上記のように、補助記載には複数の種類がある。補助記載の内部領域についての情報処理は、補助記載の種類に応じてなされる。
【0028】
パーソナルコンピュータ100は、書類読取ソフトウェアを備えるコンピュータである。パーソナルコンピュータ100は、スキャナ101が入力する画像データを処理するとともに、処理結果を記録してデータベース化する。
【0029】
図1には、パーソナルコンピュータ100の機能ブロック構成を併せて示した。図示する各機能ブロックは、書類読取ソフトウェアによりソフトウェア的に実現される。もっとも、図示する各機能ブロックの一部又は全部をハードウェア的に構成することも可能である。
【0030】
画像入力部120は、スキャナ101から画像データを入力する。
【0031】
補助記載設定部122は、補助記載の種類ごとに、補助記載の形状と色彩とを記憶している。補助記載設定部122の記憶内容のデータ構成については後で詳述する。
【0032】
補助記載検索部121は、撮像された画像900に含む補助記載を検索する。具体的には、画像中の有彩色の部分の検索を行うとともに、個々の補助記載111,112の特定を行う。補助記載111,112のみが有彩色よりなるためである。ただし、補助記載設定部122に記憶されていない色彩は無視する。
【0033】
抽出部123は、撮像された画像900の切り抜きを行う。前述のように補助記載111,112は、各々、撮像された画像中で枠を構成する。領域抽出部123は、補助記載111,112の枠の内部領域113,114を切り出す。
【0034】
属性特定部124は、補助記載の種類を特定する。具体的には、補助記載111,112の形状・色彩を、補助記載設定部122に記憶された形状・色彩と対比することで、補助記載の種類を特定する。
【0035】
処理部125は、補助記載111,112ごとに、領域抽出部123が抽出した画像と、属性特定部124が特定した種類に基づく処理を行う。
【0036】
文字認識部126は、処理部125の指示に基づいて文字認識処理を行う。例えば、補助記載112に基づいて切り出された、「5000」の文字を含む画像を文字認識処理することで、数データとしての5000を把握する。
【0037】
ユーザ入力部127は、処理部125の指示に基づいてユーザに画像や文字を表示するとともに、ユーザに指示されたコマンドを入力する。例えば、上記の文字認識の結果を訂正するコマンドを入力する。
【0038】
記憶部128は、処理部125の処理結果に基づいて、画像や数値の記憶を行う。記憶部128に記憶されたデータは、パーソナルコンピュータ100のユーザ等によって種々に利用される。
【0039】
図3は、補助記載設定部122が補助記載の形状と色彩とを記憶するデータ構造を示す説明図である。補助記載設定部122は、補助記載の種類と、その形状及び色彩を対応付けて記憶している。
【0040】
図3では、金額欄文字領域について、形状が楕円であり、色彩が黄色であることを記憶し、金額欄画像領域について、形状が四角であり、色彩が赤色であることを記憶している場合を例示した。
【0041】
なお、図3では、補助記載の形状と色彩とについて記憶する場合を例示したが、かかる場合に限定されることはない。補助記載の種類ごとに、当該補助記載の種々の視覚的特徴を記憶するものとしてもよい。例えば、補助記載を構成する色彩と形状と記号と図形と文字と模様と構造との少なくとも1つの情報が記憶されているものとしてもよい。ここで、形状の情報としては、線の太さや、線等の曲率についての情報を記憶するものとしてもよい。また、色彩は、半透明色や、金属色、可視波長外の色彩を含むものとしてもよい。また、特徴情報は、可視波長外の色彩等により表される形状等の情報を含むものとしてもよい。
【0042】
B.処理:
図4は、領収書画像110の処理を示すフローチャートである。また、図5は、領収書画像110の処理を示す説明図である。図4〜5に示す処理により、パーソナルコンピュータ100は、補助記載112が特定する金額欄文字領域114に記載された金額を認識して、これを記録する。
【0043】
ステップSa1では、画像入力部120が画像データの入力を行う。
【0044】
ステップSa2で補助記載検索部121は、補助記載111,112の特定をそれぞれ行う。具体的には、まず、撮像された画像のうちで結彩色の部分を特定する。ただし、補助記載設定部122に記憶されていない色彩については無視する。次に、補助記載設定部122の記憶内容に基づいて有彩色の部分を補助記載111,112に分割する。
【0045】
ステップSa3で属性特定部124は、補助記載設定部122の記憶内容に基づいて補助記載111,112の属性を各々特定する。具体的には、補助記載111の内部領域113が金額欄画像領域であり、補助記載112の内部領域114が金額欄文字領域であることを特定する。補助記載設定部122の記憶内容では、金額欄文字領域は形状が楕円で色彩が黄色と、金額欄画像領域は形状が四角で色彩が赤色とそれぞれ設定されているためである。
【0046】
また、領域抽出部123は、ステップSa3で、補助記載111の内部領域113と、補助記載112の内部領域114とについて、画像データの抽出を行う。具体的には、「金額5000円」の文字を含む画像と、「5000」の文字を含む画像との切り抜きを行う。
【0047】
ステップSa1〜Sa3の処理に基づいて、以下、処理部125が、金額欄文字領域114と金額欄画像領域113との画像の情報処理を行う。
【0048】
ステップSa4で処理部125は、金額欄文字領域114について、文字認識部126に文字認識を行わせる。文字認識部126は、金額欄文字領域113の画像に含まれる「5000」の文字に基づいて、当該文字を表す文字コードを特定する。
【0049】
ステップSa5で処理部125は、ユーザ入力部127からユーザの指示を受け取って、文字認識部126の認識結果の妥当性を判断する。具体的には、領域抽出部123が抽出した金額欄画像領域113の画像と、文字認識部126が認識した文字とをユーザに表示する。これにより、ユーザは、文字認識部126の認識結果が妥当か否かを入力する。
【0050】
文字認識部126の認識結果が妥当でなければ、ステップSa6で、ユーザが金額の数値をユーザ入力部127を介して入力する。ユーザが入力する数値は、金額欄文字領域114の画像が表す真の数値である。
【0051】
ステップSa6では、金額欄文字領域114の画像が表す数値を記憶部128に記憶する。記憶された値は、経営分析等の種々の用途に利用される。
【0052】
以上説明した書類読取システム1000によれば、ユーザは、補助記載で特定することにより、所望の領域を、パーソナルコンピュータ100に容易に指示することができる。また、複数の種類の補助記載を利用することで、領域ごとの柔軟な処理を容易に行わせることができる。
【0053】
なお、実施例では書類として領収書を挙げて説明したが、係る場合に限定されることはない。例えば、帳票・帳簿等の会計書類・取引書類・価格表・刊行物・ポスター等であってもよい。
【0054】
C.変形例1;一括処理:
図6は、複数の領収書が撮像された画像200を示す説明図である。
画像200には、第1の領収書の画像201と、第2の領収書の画像202とを含む。第1及び第2の領収書は様式が異なっている。第1の領収書の画像201には補助記載111a,112aが付加されており、第2の領収書の画像202には補助記載111b,112bが付加されている。
【0055】
図7は、複数の領収書が撮像された画像200の処理を示すフローチャートである。図7に示す処理の各ステップにおいて、実施例における処理(図4)の場合と同様のステップには、図4と同じ符号Sa1〜Sa7を付して示した。
【0056】
まず、ステップSa1〜Sa3の処理で、金額欄文字領域114a,114bと金額欄画像領域113a,113bとが特定され、各領域に含む画像が抽出される。
【0057】
ステップSb1で処理部125は、金額欄文字領域114a及び金額欄画像領域113aのペアと、金額欄文字領域114b及び金額欄画像領域113bとのペアを特定する。領域のペアは、各領域の重心位置相互の距離に基づいて特定される。各金額欄文字領域は、当該距離が最短の金額欄画像領域とペアを組むものと判断される。なお、ペアの特定では、距離以外に、領域どうし又は領域と重心との包含関係など種々の位置関係を利用することができる。また、ペアの特定は、補助記載111a,111b,112a,112bの少なくとも一部の文字・形状・色彩等に基づいて行われてもよい。
【0058】
ステップSa4では、金額欄文字領域114a,114bについて、文字認識部126が文字認識を行う。
【0059】
以下、ステップSa5〜Sa7では、ステップSb1で特定された各ペアに基づいて、第1及び第2の領収書に係る処理が順次行われる。ステップSb2で全てのペアについて処理が完了したことが把握されると、図7の処理は終了する。
【0060】
以上説明した書類読取システムによれば、記載事項を処理させるべき書類が複数ある場合でも、処理の迅速を図ることができる。各書類に付された補助記載に基づいて、それらが特定する各領域が柔軟に処理されるためである。
【0061】
D.変形例2;マーキング:
図8は、パターンシート111c,112cを示す説明図である。パターンシート111c,112cは、四角又は楕円の枠より構成され、内部が中空となっている。
【0062】
パターンシート111c,112cは、各々、領収書110cの所定位置に被せて撮像される。パターンシート111c,112cは、領収書110cの所定位置に被せられることで、内部領域113c,114cを各々特定する。なお、パターンシート111c,112cは、実施例の補助記載111,112と各々同様の形状・色彩を有する。
【0063】
以上説明したパターンシート111c,112cを利用することで、書類自体に記載を追加することなく、容易にマーキングを付すことができる。領域の形状自体は固定されているため、所望のマーキングを容易に行うこともできる。
【0064】
なお、パターンシートは、内部が中空でない、楕円形状等の、半透光性のカラーフィルム等であってもよい。
【0065】
図9は、透過性フィルム300上に書き込まれた補助記載111d,112dを示す説明図である。透過性フィルム300上には、実施例の補助記載111,112と同様の補助記載111d,112dが手書きされる。
【0066】
以上説明した、透過性フィルム300への補助記載111d,112dの書き込みを利用することで、書類自体に記載を追加することなく、容易にマーキングを付すことができる。特定されるべき領域の形状を、補助記載の形状により柔軟に設定することで、所望のマーキングを容易に行うこともできる。
【0067】
なお、マーキングは、上記の例に限定されることはない。例えば、スタンプされた補助記載であってもよい。また、書類表面上に付されたテープであってもよい。
【0068】
E.変形例3;資料整理:
図10は、新聞記事画像400を示す説明図である。新聞記事画像400には、記事410,420,430,440,450,460を含む。また、新聞記事画像400には、補助記載411,412,421,422,431,432,461,462を含む。
【0069】
補助記載411,421,431,461は、それぞれ記事410,420,430,460の領域を特定する。実施例における補助記載111,112と同様である。また、補助記載412,422,432,462は、それぞれ記事410,420,430,460の領域の属性を特定する。
【0070】
ここで、変形例3では、属性特定部124は、文字認識部126を利用して、補助記載412,422,432,462を構成する文字を文字認識させる。文字認識部126は、それぞれ、「画像」、「文字」、「文字」、「FAX 12−3456」なる文字を認識する。属性特定部124は、認識された文字を補助記載設定部122の記憶内容と比較することで、処理部128が行うべき処理内容を特定する。補助記載設定部122は、補助記載の文字と、その補助記載に基づいて処理部128が行うべき処理内容とを対応付けて記憶している。
【0071】
処理部125は、補助記載422,432に基づいて、各々、記事420,430の画像を文字認識部126に文字認識させる。処理部125は、記事420,432を文字コードで表したデータを記憶部128に記憶する。
【0072】
また処理部125は、補助記載412に基づいて、記事410の画像を、そのままの画像データとして記憶部128に記憶する。記事410は写真であるためである。
【0073】
さらに処理部125は、補助記載462に基づいて、補助記載462が特定する電話番号に対し、記事460の画像をFAXする。なお、図10では電話番号「12−3456」が特定される場合について例示している。
【0074】
なお、本実施例では、便宜上、補助記載411,421,431,461と、補助記載411,421,431,461とに分けて図示しつつ説明したが。補助記載411,421,431,461に各々包含される補助記載412,422,432,462は、前者とそれぞれ一体的に取り扱うことができる。
【0075】
また、一体的に取り扱われる補助記載411,421等は、補助記載421の部分に文字を含むものとしたが、かかる場合に限定されることはない。実施例の場合と同様に、処理部125は、補助記載411,421等の色彩・形状等に基づいて処理の種類を決定するものとしてもよい。
【0076】
以上説明した書類読取システムによれば、多様な様式で編集された新聞記事を、記事ごとに容易に情報処理することができる。ユーザが付加する補助記載により、各記事の多種多様な位置・形状に応じた情報処理が柔軟に実現されるためである。
【0077】
以上、実施例に基づき本発明にかかるユーザ入力認識装置を説明してきたが、上述した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得る。
【0078】
【発明の効果】
本発明の書類読取システムによれば、ユーザは、マーキングで特定することにより、所望の領域を、書類読取装置に容易に指示することができる。例えば、新聞や刊行物の記載事項を、記事の配置様式に応じて柔軟・容易に処理させることができる。また、特徴情報で特定することにより、所望の処理内容を、領域ごとに容易に指示することができる。
【図面の簡単な説明】
【図1】書類読取システム1000のシステム構成を示す説明図である。
【図2】スキャナ101が撮像する画像900を示す説明図である。
【図3】補助記載設定部122が補助記載の形状と色彩とを記憶するデータ構造を示す説明図である。
【図4】領収書画像900の処理を示すフローチャートである。
【図5】領収書画像900の処理を示す説明図である。
【図6】複数の領収書が撮像された画像200を示す説明図である。
【図7】複数の領収書が撮像された画像200の処理を示すフローチャートである。
【図8】パターンシート111c,112cを示す説明図である。
【図9】透過性フィルム300上に書き込まれた補助記載111d,112dを示す説明図である。
【図10】新聞記事画像400を示す説明図である。
【符号の説明】
1000…書類読取システム
900…スキャナ101が撮像する画像
100…パーソナルコンピュータ
101…スキャナ
101,102…補助記載
110…領収書画像
111,112…補助記載
113,114…内部領域
120…画像入力部
121…補助記載検索部
122…補助記載設定部
123…領域抽出部
123…抽出部
124…属性特定部
125…処理部
126…文字認識部
127…ユーザ入力部
128…記憶部
111a,112a…補助記載
111b,112b…補助記載
200…複数の領収書が撮像された画像
201…第1の領収書画像
202…第2の領収書画像
113a,113b…金額欄画像領域
114a,114b…金額欄文字領域
110c…領収書
111c,112c…パターンシート
111d,112d…補助記載
113c,114c…内部領域
300…透過性フィルム
400…新聞記事画像
410,420,430,440,450,460…記事
411,421,431,461…補助記載
412,422,432,462…補助記載

Claims (3)

  1. 書類の記載事項を読み取る書類読取装置であって、
    前記書類上に付加され、前記読み取り対象となる領域を特定するためのマーキングと共に、前記書類を表す画像の画像データを入力する入力部と、
    前記画像データに表れ、前記マーキングを他の前記画像と識別可能な特徴を表す特徴情報が記憶された設定部と、
    前記特徴情報に基づき、前記画像における前記マーキングの位置を特定する特定部と、
    前記マーキングに基づいて外周が規定される内部領域について、前記記載事項を抽出して出力する出力部とを備える書類読取装置。
  2. 請求項1記載の書類読取装置であって、
    前記設定部は、前記内部領域における前記記載事項の属性を表す属性データを、前記特徴情報と対応付けて記憶しており、
    前記特定部は、前記特徴情報により該属性データを特定し、
    前記出力部は、該属性データを、前記抽出された記載事項と対応付けて出力する書類読取装置。
  3. 請求項1記載の書類読取装置であって、
    前記画像は、前記内部領域に文字を含み、
    該文字に基づいて、該文字を表すコードを特定する文字認識部を備え、
    前記出力部は、該コードを出力する書類読取装置。
JP2002330906A 2002-11-14 2002-11-14 書類読取装置 Pending JP2004166062A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002330906A JP2004166062A (ja) 2002-11-14 2002-11-14 書類読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002330906A JP2004166062A (ja) 2002-11-14 2002-11-14 書類読取装置

Publications (1)

Publication Number Publication Date
JP2004166062A true JP2004166062A (ja) 2004-06-10

Family

ID=32808456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002330906A Pending JP2004166062A (ja) 2002-11-14 2002-11-14 書類読取装置

Country Status (1)

Country Link
JP (1) JP2004166062A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100433045C (zh) * 2005-10-11 2008-11-12 株式会社理光 表格提取方法和设备
US7756871B2 (en) 2004-10-13 2010-07-13 Hewlett-Packard Development Company, L.P. Article extraction
JP2012151722A (ja) * 2011-01-20 2012-08-09 Murata Mach Ltd 画像処理装置、画像処理システム、画像処理方法、および、プログラム
JP2013020302A (ja) * 2011-07-07 2013-01-31 Takanao Handa 帳票認識システム
US10242410B2 (en) 2014-12-26 2019-03-26 Brother Kogyo Kabushiki Kaisha Storage medium, image processing method and image processing apparatus
JP2019204399A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2019204401A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
CN110545362A (zh) * 2018-05-28 2019-12-06 京瓷办公信息系统株式会社 图像处理装置
US10503993B2 (en) 2016-08-08 2019-12-10 Kyocera Document Solutions Inc. Image processing apparatus

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756871B2 (en) 2004-10-13 2010-07-13 Hewlett-Packard Development Company, L.P. Article extraction
CN100433045C (zh) * 2005-10-11 2008-11-12 株式会社理光 表格提取方法和设备
JP2012151722A (ja) * 2011-01-20 2012-08-09 Murata Mach Ltd 画像処理装置、画像処理システム、画像処理方法、および、プログラム
US9081759B2 (en) 2011-01-20 2015-07-14 Murata Machinery Ltd. Image processing apparatus, image processing system and image processing method
JP2013020302A (ja) * 2011-07-07 2013-01-31 Takanao Handa 帳票認識システム
US10242410B2 (en) 2014-12-26 2019-03-26 Brother Kogyo Kabushiki Kaisha Storage medium, image processing method and image processing apparatus
US10503993B2 (en) 2016-08-08 2019-12-10 Kyocera Document Solutions Inc. Image processing apparatus
JP2019204399A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2019204401A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
CN110545362A (zh) * 2018-05-28 2019-12-06 京瓷办公信息系统株式会社 图像处理装置

Similar Documents

Publication Publication Date Title
US7840092B2 (en) Medium processing method, copying apparatus, and data filing apparatus
US20070076984A1 (en) Electronic document creating apparatus
JP4785655B2 (ja) 文書処理装置及び文書処理方法
KR20030005259A (ko) 정보 처리 방법 및 장치
JP2000278514A (ja) 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2008146605A (ja) 画像処理装置及びその制御方法
JP2004166062A (ja) 書類読取装置
JP2003256475A (ja) 画像データ管理装置およびコンピュータプログラム
JP5844564B2 (ja) 帳票認識システム
JP2007005950A (ja) 画像処理装置及びネットワークシステム
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP5878004B2 (ja) 複数文書認識システム及び複数文書認識方法
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JP4798296B1 (ja) 帳票
JP2004504650A (ja) フォーム認識及びデジタル化画像処理のための方法及びシステム
JP2013161143A (ja) 文字テキスト化システム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP3316326B2 (ja) 画像処理装置
JP2009182530A (ja) 業務処理遂行支援装置
JP3959451B2 (ja) 画像読取システム
JP2001005831A (ja) ファイリング方法及びそれを格納した記録媒体
JPH07152856A (ja) 光学的文字読取装置
JP2004280514A (ja) Pdfファイル及びpdfファイル作成システム
JP2002055985A (ja) 文書属性識別装置及び方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050124

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061121