JP3483919B2 - Slip document information system - Google Patents

Slip document information system

Info

Publication number
JP3483919B2
JP3483919B2 JP26210093A JP26210093A JP3483919B2 JP 3483919 B2 JP3483919 B2 JP 3483919B2 JP 26210093 A JP26210093 A JP 26210093A JP 26210093 A JP26210093 A JP 26210093A JP 3483919 B2 JP3483919 B2 JP 3483919B2
Authority
JP
Japan
Prior art keywords
document
slip
image
area
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26210093A
Other languages
Japanese (ja)
Other versions
JPH07114616A (en
Inventor
好博 嶋
英一 羽田野
勝美 丸川
昌史 古賀
和樹 中島
彰三 門田
清道 栗野
建行 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP26210093A priority Critical patent/JP3483919B2/en
Publication of JPH07114616A publication Critical patent/JPH07114616A/en
Application granted granted Critical
Publication of JP3483919B2 publication Critical patent/JP3483919B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は様式や書式の異なる複数
種類の伝票(例えば、診療報酬請求明細書等)の読み取
り、仕分け、保管、検索などを行なう伝票文書情報シス
テムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a slip document information system for reading, sorting, storing, retrieving a plurality of kinds of slips (for example, medical fee bills) having different formats and formats.

【0002】[0002]

【従来の技術】文書の様式は、記載項目及び項目の順番
を規定するが、その絶対的な位置座標、寸法を規定しな
い。文書の書式は、記載項目及び項目の順番を規定する
だけでなく、その絶対的な位置座標、寸法を規定してい
る。従来の光学的文字認識装置では、文書の書式をフォ
ーマットデータとして予め設定しており、文書の各項目
の絶対的な位置座標、寸法が規定されている紙文書を読
み取ることができた。しかしながら、様式のみが規定さ
れている文書、例えば、法令文書などを読み取ることは
できなかった。
2. Description of the Related Art The format of a document defines the description items and the order of the items, but does not specify the absolute position coordinates and dimensions. The document format not only defines the description items and the order of the items, but also the absolute position coordinates and dimensions thereof. In a conventional optical character recognition device, a document format is preset as format data, and a paper document in which absolute position coordinates and dimensions of each item of the document are defined can be read. However, it was not possible to read a document in which only the form was specified, such as a legal document.

【0003】従来の伝票を読み取る文書情報システム
は、特開昭56−11573号公報(特願昭54−87
338号 昭和54(1979)年7月10日出願、発
明者:香川正幸、出願人:富士通株式会社)に述べられ
ているように、伝票に予め入力すべき項目を指示するマ
ーク記入領域を設け、当該領域に記入されたマークを読
み取ることによつて、伝票上の所定領域を読み取る方式
が提案されている。しかしながら、従来の方式では、マ
ーク記入領域を設けているため当該記入領域の紙面上の
占める面積が多くなり、入力項目を増やすことができな
いという問題があった。また、マーク記入領域を新たに
用意する必要があるため、既存の各種伝票をそのまま読
み取ることができないという問題がある。さらに、様式
が法令等で決められている伝票文書では、従来のように
マーク記入領域を設けることは法令上様式が規定されて
いるため、認められず、マーク記入領域のない当該様式
文書を読み取ることはできないという問題があった。
A conventional document information system for reading slips is disclosed in Japanese Patent Application Laid-Open No. 56-11573 (Japanese Patent Application No. 54-87).
No. 338, filed on July 10, 1979, inventor: Masayuki Kagawa, applicant: Fujitsu Limited), and a mark entry area is provided on the slip to indicate items to be entered in advance. There has been proposed a method of reading a predetermined area on a slip by reading a mark written in the area. However, in the conventional method, since the mark writing area is provided, the area of the writing area on the paper surface increases, and there is a problem that the number of input items cannot be increased. In addition, since it is necessary to newly prepare a mark writing area, there is a problem in that various existing slips cannot be read as they are. Furthermore, in the case of a voucher document whose format is determined by law, etc., it is not allowed to provide a mark entry area as in the past because the format is legally defined, and the format document without the mark entry area is read. There was a problem that I could not do it.

【0004】また、従来の文書画像のファイル方式は、
特開昭59−14070号公報(特願昭57−1234
60号 昭和57(1982)年7月15日出願、発明
者:江尻公一、出願人:株式会社リコー)に述べられて
いるように、中間調画像である写真や2値図形画像であ
る棒グラフを含む文書の領域から特徴パラメータを抽出
し、領域の画像と関連付けて記憶する画像ファイル方式
が提案されている。しかしながら、従来の方式では、写
真と棒グラフの識別を行なうことが述べられているだけ
であり、伝票のように罫線並びに罫線からなる枠と文字
列からなる文書を識別することは述べられていない。ま
た、伝票の文字列を文字認識することや、文書の領域を
守秘の程度によってマスクするファイル方式について考
慮されていない。
Also, the conventional document image file system is
JP-A-59-14070 (Japanese Patent Application No. 57-1234)
No. 60, filed on July 15, 1982, inventor: Koichi Ejiri, applicant: Ricoh Co., Ltd., as described in a halftone image photograph or a binary graphic image bar graph. An image file method has been proposed in which a characteristic parameter is extracted from an area of a document including a text and stored in association with an image of the area. However, in the conventional method, only the identification of the photograph and the bar graph is described, and the document such as the ruled line and the frame composed of the ruled line and the character string is not described. Further, neither the character recognition of the character string of the slip nor the file method of masking the document area according to the degree of confidentiality is considered.

【0005】また、定形的な入力文書に対して文書の種
類を自動的に識別し、すでに格納された文書と同一の分
類コードを与えるファイリング方式が、特開昭61−7
5477号公報(特願昭59−196616号、昭和5
9(1984)年9月21日出願、発明者:中野康明、
藤沢浩道、藤縄雅章、出願人:株式会社日立製作所)に
述べられている。しかしながら、この従来方式では、画
像を格納することが主であり、読み取り領域を設定し文
字認識を行なうことや、当該認識結果のデータを基に記
載内容の妥当性を検定することが考慮されていない。こ
のため、文書の種類に応じて記載内容を読み取りかつ内
容の妥当性を検定することができない。
Further, there is a filing system which automatically identifies the type of a document with respect to a fixed input document and gives the same classification code as that of a document already stored, as disclosed in Japanese Patent Laid-Open No. 61-7.
5477 (Japanese Patent Application No. 59-196616, Showa 5)
Application filed on September 21, 1984, inventor: Yasuaki Nakano,
Hiromichi Fujisawa, Masaaki Fujinawa, applicant: Hitachi, Ltd.). However, this conventional method mainly stores images, and considers setting a reading area for character recognition and verifying the validity of the described content based on the data of the recognition result. Absent. For this reason, it is not possible to read the description content and verify the validity of the content according to the type of document.

【0006】[0006]

【発明が解決しようとする課題】上記各従来技術は、入
力した紙文書そのものに対して整理番号若しくはバーコ
ードを付与することが記載されておらず、蓄積した画像
ファイルから所望の文書画像を表示、印刷することはで
きるが、原本である紙文書そのものを探索することは困
難であり、原本を探す作業は多くの人手が必要な作業で
あった。また、紙文書そのものを仕分けすることが考慮
されておらず、原本の分類、整理、収納に多くの人手を
要していた。
The above-mentioned respective prior arts do not describe that a serial number or a bar code is added to the input paper document itself, and a desired document image is displayed from an accumulated image file. Although it can be printed, it is difficult to search for the original paper document itself, and the work of searching for the original was a work that requires a lot of human hands. In addition, sorting of paper documents themselves was not considered, and a lot of manpower was required for sorting, organizing, and storing the originals.

【0007】また、上記各従来技術では、蓄積した文書
画像を表示、印刷する場合、守秘項目について考慮され
ておらず、例えば、文書にプライベートな内容や、ビジ
ネス上重要な情報が記載されている場合でも検索結果の
画像を画面にそのまま表示するか、若しくは、画像単位
ごとに全面の表示を禁止するかのいずれかであり、文書
の部分領域を守秘レベルに応じて見ることができなかっ
た。
Further, in each of the above-mentioned prior arts, confidentiality items are not taken into consideration when displaying and printing the stored document images, and, for example, private contents and business important information are described in the documents. Even in such a case, the image of the search result is displayed as it is on the screen, or the display of the entire surface is prohibited for each image unit, and the partial area of the document cannot be viewed according to the confidentiality level.

【0008】また、上記各従来技術では、入力した紙文
書はすべて蓄積することが前提であり、内容によって、
取捨選択して蓄積することは考慮されていない。このた
め、大量の文書を蓄積することとなり、小規模のファイ
ルシステムでは記憶装置の容量を超えるという問題があ
った。
Further, in each of the above prior arts, it is premised that all input paper documents are stored, and depending on the contents,
It does not take into consideration selection and accumulation. Therefore, a large amount of documents are accumulated, and there is a problem that the capacity of the storage device is exceeded in a small file system.

【0009】本発明の第1の目的は複数の伝票文書の様
式の種類を識別し、読み取り領域を自動的に設定し文字
認識を行い、記載内容の妥当性を検定することにある。
A first object of the present invention is to identify the types of formats of a plurality of slip documents, automatically set the reading area, perform character recognition, and verify the validity of the described contents.

【0010】本発明の第2の目的は認識結果によって整
理番号若しくはバーコードを紙文書に印刷し、紙文書の
仕分けを行なうことにある。
A second object of the present invention is to sort a paper document by printing a reference number or a bar code on the paper document according to the recognition result.

【0011】本発明の第3の目的は文書画像から守秘内
容の記載された領域を抽出し、守秘領域の画像をマスク
して検索結果の表示、印刷を行なうことにある。
A third object of the present invention is to extract an area in which confidential contents are described from a document image, mask the image of the confidential area, and display and print the search result.

【0012】本発明の第4の目的は文書の記載内容によ
って蓄積の必要性の有無を自動的に判定し、記憶領域を
節約することにある。
A fourth object of the present invention is to automatically determine the necessity of storage according to the contents of a document and save the storage area.

【0013】本発明の第5の目的はネットワークを介し
て認識、仕分け、蓄積を行なう文書情報システムを提供
することにある。
A fifth object of the present invention is to provide a document information system which recognizes, sorts and stores data via a network.

【0014】[0014]

【課題を解決するための手段】上記第1の目的を達成す
るために、文書画像から様式の種類を識別して記載内容
を読み取り、読み取り結果が記載項目ごとに登録してい
る条件を満足するかどうかを判定するようにしたもので
ある。
In order to achieve the first object, the type of style is identified from the document image, the description content is read, and the read result satisfies the condition registered for each entry item. Whether or not it is determined.

【0015】また、上記第2の目的を達成するために
は、認識結果により仕分け機構並びに印刷機構を制御す
るようにしたものである。
In order to achieve the second object, the sorting mechanism and the printing mechanism are controlled according to the recognition result.

【0016】また、上記第3の目的を達成するために
は、文書画像から項目の記載された部分領域を自動的に
抽出し、守秘領域に対してアクセスのためのパスワード
を付与するようにしたものである。
Further, in order to achieve the third object, the partial area in which the item is described is automatically extracted from the document image, and a password for access is given to the confidential area. It is a thing.

【0017】上記第4の目的を達成するためには、記載
内容例えば点数を読み取り、点数が一定値より大きい文
書のみ、その表面画像を蓄積するようにしたものであ
る。
In order to achieve the fourth object, the description content, for example, the score is read, and the surface image is stored only for the document having the score larger than a certain value.

【0018】上記第5の目的を達成するため、ネットワ
ークに画像を圧縮して伝送するとともに、認識結果を伝
送し、そのデータによってネットワークに接続された仕
分けステーション、蓄積ステーションを制御するように
したものである。
In order to achieve the fifth object, the image is compressed and transmitted to the network, the recognition result is transmitted, and the sorting station and the storage station connected to the network are controlled by the data. Is.

【0019】[0019]

【作用】複数種類の伝票に対してその表面画像を入力
し、伝票文書の様式の種類を識別する。そして、様式の
種類に応じて読み取り領域を抽出し、文字認識を行な
う。認識結果のデータを基に記載内容の妥当性を予め設
定している判定条件に従い検定する。さらに、認識結果
によって整理番号を紙文書に打番若しくはバーコードを
印字し、文書の種類に従って紙文書の仕分けを行なう。
また、文書の種類に応じて守秘内容の記載された領域を
抽出し、守秘領域の画像をマスクして表示できるように
する。
Operation: The surface images of a plurality of types of slips are input to identify the type of slip document format. Then, the reading area is extracted according to the type of style and character recognition is performed. Based on the recognition result data, the validity of the described contents is verified according to the preset judgment conditions. Further, a serial number is printed on the paper document or a bar code is printed according to the recognition result, and the paper document is sorted according to the document type.
Further, an area in which the confidentiality content is described is extracted according to the type of document, and the image of the confidentiality area is masked so that it can be displayed.

【0020】[0020]

【実施例】以下、本発明を図面を用いて詳細に説明す
る。図1は本発明の一実施例である伝票情報システムの
構成を説明する図である。
The present invention will be described in detail below with reference to the drawings. FIG. 1 is a diagram for explaining the configuration of a slip information system which is an embodiment of the present invention.

【0021】ネットワーク100には、入力・仕分けス
テーション103、蓄積ステーション101、認識ステ
ーション105、修正ステーション106、検索ステー
ション107が接続されている。入力・仕分けステーシ
ョン103は計算機より構成されている。当該ステーシ
ョン103には入力・仕分け伝票文書の画像入力と伝票
文書の仕分けを行なう入力・仕分け装置104が接続さ
れている。当該装置には、文書を設定するホッパ、仕分
け後の文書を格納するスタッカ及びその制御部があり、
さらに、画像を入力するための光学的撮像素子、照明装
置等の光学系が具備されている。ここでは、入力した画
像をデータ圧縮し、当該ステーション103を介してネ
ットワーク100に画像データを送出する。また、ネッ
トワーク100から認識結果を受け取り、これを仕分け
制御信号として文書の仕分けを行なう。蓄積ステーショ
ン101は計算機から構成され、光ディスクもしくはア
レイディスク等からなる大容量記憶装置102が接続さ
れており、認識結果のデータ並びに入力された画像の蓄
積を行なう。蓄積ステーション101では、認識結果に
基づいて蓄積すべき文書を選別することができる。ま
た、守秘内容の記載されている部分領域に対して、アク
セス情報を付与して当該記憶装置102に蓄積する。認
識ステーション105では、ネットワーク100を介し
て送られてきた画像に対して、伝票文書の種類を求める
シート識別処理を行ない、項目に記載されている文字列
の認識を行なう。修正ステーション106では、認識結
果の修正を画面を用いて対話的に行なう。ここでは、読
み取り領域を拡大して画面に表示し、修正を容易にして
いる。検索ステーション107では、蓄積ステーション
101に蓄積された伝票画像をネットワークを介して検
索することができ、項目に記載されている内容を手掛か
りに所望の伝票を探索し、画面に表示することができ
る。この時、守秘内容の記載されている部分領域に対し
てアクセス情報が付与されており、使用者のアクセスの
レベルにより当該守秘項目をマスクして表示することが
できる。
An input / sorting station 103, a storage station 101, a recognition station 105, a correction station 106, and a search station 107 are connected to the network 100. The input / sorting station 103 is composed of a computer. The station 103 is connected to an input / sorting device 104 for inputting images of sorting / sorting slip documents and sorting of slip documents. The device has a hopper for setting documents, a stacker for storing documents after sorting, and a control unit thereof.
Further, an optical system such as an optical image pickup device for inputting an image and a lighting device is provided. Here, the input image is data-compressed and the image data is sent to the network 100 via the station 103. Further, the recognition result is received from the network 100, and the document is classified by using the recognition result as a classification control signal. The storage station 101 is composed of a computer, and is connected to a mass storage device 102 such as an optical disk or an array disk, and stores the recognition result data and the input image. The storage station 101 can select documents to be stored based on the recognition result. Further, access information is added to the partial area in which the confidentiality content is described, and the partial area is stored in the storage device 102. The recognition station 105 performs sheet identification processing for determining the type of the slip document for the image sent via the network 100, and recognizes the character string described in the item. The correction station 106 interactively corrects the recognition result using a screen. Here, the reading area is enlarged and displayed on the screen to facilitate the correction. The search station 107 can search for the slip image stored in the storage station 101 via the network, and can search for a desired slip based on the content described in the item and display it on the screen. At this time, access information is given to the partial area in which the confidentiality content is described, and the confidentiality item can be masked and displayed depending on the access level of the user.

【0022】図2は伝票文書の処理フローを説明する図
である。伝票文書の一例として、診療報酬請求明細書
(レセプト)の処理フローを示す。レセプトに記載され
た主要項目についてデータを入力し、計算機により資格
記録の確認処理を行なう。本処理フローでは、先ず、ス
テップ200においてレセプトを入力用のホッパーに設
定する。次いで、ステップ201でレセプトの仕分け処
理を行なう。ここでは、レセプトの種類として、外来分
レセプト210と入院分レセプト211にその様式を識
別して仕分けを行なう。ステップ202では、初期情報
を入力する。ここでは、初期情報として、レセプトの処
理を各県単位に行なうための地域属性として、自県と他
県の区別を入力する。また、レセプトの処理を行なう事
務所名、診療区分、整理番号の初期値を登録する。な
お、入院分レセプト211については、整理番号をステ
ップ208で打番する。次いで、ステップ203、ステ
ップ204で読み取りを実行する。ステップ203は、
伝票の一括処理を行なうバッチ読み取り処理であり、認
識結果の正常分ならびに不読(リジェクト)分を別のス
タッカーに格納するとともに、整理番号を印字する。ス
テップ204は、逐次修正読み取りの処理であり、認識
の結果リジェクトされたレセプトに対して、修正画面を
介して対話的に認識結果を修正する。ステップ203で
認識された正常分のデータと、ステップ204で修正さ
れ正常となったデータはフロッピーディスク等に格納す
る。また、ステップ203でリジェクトとなったレセプ
トは、別のスタッカーに格納されることになる。なお、
入院分レセプト並びにステップ203のリジェクト分を
まとめてステップ209でパンチ作業を行なう。レセプ
トに記載の診療内容をもとに、ステップ207に示すよ
うに資格記録確認処理等の機械処理を行う。ここでは、
高額な点数が記載されているレセプトのみを選択してス
テップ205で光ディスクに格納している。ステップ2
07の資格記録の確認処理では、ステップ205で光デ
ィスクに格納されたレセプトの検索206を行ない、所
望のレセプトを画面に表示して資格記録の確認を行な
う。
FIG. 2 is a diagram for explaining the processing flow of the slip document. As an example of the slip document, a processing flow of a medical fee bill (receipt) is shown. Enter the data for the main items described in the receipt and confirm the qualification record with a computer. In this processing flow, first, in step 200, the receipt is set in the hopper for input. Next, in step 201, a receipt sorting process is performed. Here, as the types of receipts, the outpatient receipt 210 and the inpatient receipt 211 are classified according to their styles. In step 202, initial information is input. Here, as the initial information, the distinction between the own prefecture and other prefectures is input as the regional attribute for performing the receipt process for each prefecture. In addition, the initial values of the office name, medical treatment category, and reference number for processing the receipt are registered. For the hospitalized receipt 211, the reference number is assigned in step 208. Next, reading is executed in steps 203 and 204. Step 203 is
This is a batch reading process that performs batch processing of slips, and stores normal and unread (rejected) recognition results in another stacker and prints a reference number. Step 204 is a process of sequential correction reading, in which the recognition result is interactively corrected via the correction screen for the reject rejected as a result of the recognition. The normal data recognized in step 203 and the normal data corrected in step 204 are stored in a floppy disk or the like. Further, the rejected reject in step 203 is stored in another stacker. In addition,
A punching operation is performed in step 209 by collecting the hospitalized portion receipt and the rejected portion in step 203. Machine processing such as qualification record confirmation processing is performed as shown in step 207 based on the medical care contents described in the receipt. here,
Only the receipts in which expensive points are described are selected and stored in the optical disc in step 205. Step two
In the qualification record confirmation processing of 07, the receipt 206 stored in the optical disk is searched 206 in step 205, and a desired receipt is displayed on the screen to confirm the qualification record.

【0023】図3は伝票文書の画像入力、蓄積、検索、
内容点検を行なうシステムの処理フローである。ステッ
プ300で伝票文書の表面画像を入力し、ステップ30
1で伝票の様式の種類を識別するシート識別処理を行な
う。当該シート識別の詳細処理フローは図4にて後述す
る。次いで、ステップ302において、当該様式の種類
に応じて読み取り領域を抽出し、読み取り領域を設定す
る。当該読み取り領域設定ステップ302の詳細処理フ
ローは図9にて後述する。ステップ303では読み取り
領域内において文字認識を行ない、ステップ304で当
該認識結果のデータを基に記載内容の妥当性を検定す
る。当該ステップ303の詳細処理フローは図10にて
後述する。
FIG. 3 shows image input, storage, retrieval of a slip document,
It is a processing flow of the system which inspects the contents. In step 300, the front side image of the slip document is input, and in step 30
In step 1, sheet identification processing is performed to identify the type of slip format. The detailed processing flow of the sheet identification will be described later with reference to FIG. Next, in step 302, a reading area is extracted and set according to the type of the style. The detailed processing flow of the reading area setting step 302 will be described later with reference to FIG. In step 303, character recognition is performed in the reading area, and in step 304, the validity of the described contents is verified based on the data of the recognition result. The detailed processing flow of step 303 will be described later with reference to FIG.

【0024】図4は、ステップ301のシート識別処理
の詳細処理フローを示す図である。ここでは、入力した
画像から枠及び文字行を抽出し、予め標準的な文書から
登録したシート識別用辞書430とのマッチングを行な
う。先ず、ステップ400では入力画像から微小なノイ
ズを除去する。次いで、ステップ401で黒画素の連続
する線分であるランを用い罫線を抽出し、ステップ40
2で当該罫線の傾き角を算出する。ステップ403で画
像を当該傾き角だけ回転させ、回転修正を行なう。そし
て再び、ステップ404で罫線を抽出する。図6は、こ
の一連の処理により画像から水平罫線および垂直罫線を
取り出し、その始点座標、終点座標を算出する過程の説
明図である。伝票画像600に対して、601は水平罫
線602、603、604を抽出した結果である。ま
た、610は垂直罫線611から616を抽出した結果
である。ステップ405では文字のつながりである文字
行を長方形の形で抽出し、その角の座標を求める。文書
の水平並びに垂直方向の位置ずれを修正するため、ステ
ップ406で文書の基準点を求める。ステップ407で
は、水平罫線ならびに垂直罫線から枠の角に相当する交
点の座標を算出する。各罫線は直線式で表現できるた
め、簡単に直線の交点座標を求めることができる。ステ
ップ408では、求めた交点座標に対して、大きさの正
規化を行なう。さらに、ステップ409では、交点を基
に枠を生成する。図7は水平罫線及び垂直罫線から交点
を求め、次いで枠を生成する過程を説明する図である。
水平罫線602〜604、並びに垂直罫線611〜61
6をもとにその交点710〜723を算出する。そし
て、交点を順次辿り枠701、702〜706を生成す
る。図4のステップ410では、枠のマッチングを行な
う。この時、シート識別用辞書430に格納されている
複数個の標準の枠とのマッチングを行なう。当該辞書4
30には、枠位置及び文字行の位置が予め登録されてお
り、その登録のフローは、先ず、ステップ420で標準
の伝票画像を入力し、次いで、ステップ421で入力す
べき枠及び文字行の位置を画面から指定する。ステップ
422では位置並びに回転の補正を行ない、辞書として
登録する。さらに、ステップ411では、文字行マッチ
ングを行なう。この時、シート識別用辞書430に格納
されている複数個の標準の文字行とのマッチングを行な
う。文字行マッチングの詳細は図8において後述する。
上に述べた枠マッチング410と文字行マッチング41
1によって求めた結果に従って、標準の伝票の内、もっ
とも類似している伝票が有するシート種類番号をステッ
プ412で決定する。さらに、ステップ413で、生成
した枠位置ならびに文字行の位置を出力する。また、ス
テップ414でシート種番号を出力する。
FIG. 4 is a diagram showing a detailed processing flow of the sheet identification processing in step 301. Here, a frame and a character line are extracted from the input image, and matching is performed with the sheet identification dictionary 430 registered in advance from a standard document. First, in step 400, minute noise is removed from the input image. Next, in step 401, a ruled line is extracted using a run that is a line segment in which black pixels are continuous, and step 40
In step 2, the tilt angle of the ruled line is calculated. In step 403, the image is rotated by the tilt angle to correct the rotation. Then, again, in step 404, the ruled line is extracted. FIG. 6 is an explanatory diagram of a process of extracting a horizontal ruled line and a vertical ruled line from an image by this series of processes and calculating start point coordinates and end point coordinates thereof. 601 is a result of extracting horizontal ruled lines 602, 603, and 604 from the slip image 600. Further, 610 is the result of extracting the vertical ruled lines 611 to 616. In step 405, a character line, which is a connection of characters, is extracted in the shape of a rectangle, and the coordinates of its corners are obtained. In order to correct the horizontal and vertical misalignment of the document, a reference point of the document is determined in step 406. In step 407, the coordinates of the intersections corresponding to the corners of the frame are calculated from the horizontal ruled lines and the vertical ruled lines. Since each ruled line can be expressed by a straight line type, it is possible to easily obtain the intersection coordinates of the straight line. In step 408, the obtained intersection coordinates are normalized in size. Further, in step 409, a frame is generated based on the intersection. FIG. 7 is a diagram for explaining a process of obtaining an intersection from horizontal and vertical ruled lines and then generating a frame.
Horizontal ruled lines 602-604 and vertical ruled lines 611-61
Based on 6, the intersection points 710 to 723 are calculated. Then, the intersections are sequentially traced to generate frames 701, 702 to 706. In step 410 of FIG. 4, frame matching is performed. At this time, matching with a plurality of standard frames stored in the sheet identification dictionary 430 is performed. The dictionary 4
The position of the frame and the position of the character line are registered in advance in 30, and the registration flow is as follows. First, in step 420, the standard slip image is input, and then in step 421, the frame and character line to be input are displayed. Specify the position from the screen. In step 422, the position and rotation are corrected and registered as a dictionary. Further, in step 411, character line matching is performed. At this time, matching with a plurality of standard character lines stored in the sheet identification dictionary 430 is performed. Details of character line matching will be described later with reference to FIG.
The frame matching 410 and the character line matching 41 described above
In accordance with the result obtained in step 1, the sheet type number of the most similar slip among the standard slips is determined in step 412. Further, in step 413, the generated frame position and character line position are output. Further, in step 414, the sheet type number is output.

【0025】図5は位置ずれ・回転・伸縮を有する認識
座標系を示している。伝票シート500に506で示す
枠罫線が存在している。認識座標系を伸縮の無い認識座
標系(Xr,Yr)511で、伸縮のある認識座標系
(Xm,Ym)512で表現する。これらの座標系は、
センサと光学系からなる観測座標系である。また、フォ
ーマットデータ生成用座標系(Xf,Yf)513はシ
ートの端を基準にした座標系であり、実物の寸法を表す
座標系である。伸縮の無い認識座標系で表現したシート
内の目標点(xr,yr)507は、認識座標系の原点
510とフォーマットデータ生成用座標系の原点509
とのずれ量(dx,dy)と回転角Θにより表現でき
る。
FIG. 5 shows a recognition coordinate system having displacement, rotation and expansion / contraction. The slip sheet 500 has a frame ruled line 506. The recognition coordinate system is represented by a recognition coordinate system (Xr, Yr) 511 without expansion and contraction and a recognition coordinate system (Xm, Ym) 512 with expansion and contraction. These coordinate systems are
It is an observation coordinate system consisting of a sensor and an optical system. Further, the format data generating coordinate system (Xf, Yf) 513 is a coordinate system based on the edge of the sheet, and is a coordinate system representing the dimensions of the actual product. The target point (xr, yr) 507 in the sheet expressed in the recognition coordinate system without expansion and contraction is the origin 510 of the recognition coordinate system and the origin 509 of the format data generation coordinate system.
It can be expressed by the shift amount (dx, dy) and the rotation angle Θ.

【0026】[0026]

【数1】xr=dx+xf・cosΘ+yf・sinΘ yr=dy−xf・sinΘ+yf・cosΘ ここで、(xf,yf)はフォーマットデータ生成用座
標系で表した目標点507の座標である。さらに、伸縮
のある認識座標系で表現したシート内の目標点507
(xm,ym)は、伸縮率mx,myを、
## EQU1 ## xr = dx + xf.cos.THETA. + Yf.sin.THETA. Yr = dy-xf.sin.THETA. + Yf.cos.THETA. Where (xf, yf) are the coordinates of the target point 507 in the format data generation coordinate system. Furthermore, the target point 507 in the sheet expressed by the elastic recognition coordinate system
(Xm, ym) is the expansion / contraction rate mx, my,

【0027】[0027]

【数2】xm=mx・xr ym=my・yr とすると、[Formula 2] xm = mx × xr ym = my · yr Then,

【0028】[0028]

【数3】 xm=m(dx+xf・cosΘ+yf・sinΘ) ym=m(dy−xf・sinΘ+yf・cosΘ) と表すことができる。シート内の読み取りでは、上式に
従って、フォーマットデータを変換して画像にアクセス
し文字認識を行なう。また、位置合わせ用基準点508
の認識座標系の値を伸縮の無い認識座標系(xr0,y
r0)、伸縮のある認識座標系(xm0,ym0)で表
す。また、フォーマットデータ生成用座標系の値を(x
f0,yf0)で表す。位置ずれ量(dx,dy)は、
## EQU00003 ## xm = m (dx + xf.cos.THETA. + Yf.sin.THETA.) Ym = m (dy-xf.sin.THETA. + Yf.cos.THETA.) When reading in a sheet, the format data is converted according to the above equation, the image is accessed, and character recognition is performed. In addition, the reference point for alignment 508
The value of the recognition coordinate system of is the recognition coordinate system (xr0, y
r0) and the recognition coordinate system (xm0, ym0) with expansion and contraction. In addition, the value of the coordinate system for format data generation is (x
f0, yf0). The positional deviation amount (dx, dy) is

【0029】[0029]

【数4】dx=(1/mx)・xm0−xf0・cos
Θ−yf0・sinΘ dy=(1/my)・ym0+xf0・sinΘ−yf
0・cosΘ で表すことができる。回転角Θは罫線の傾きを基に検出
する。次いで、伸縮率mx,myを求めるが、これは、
例えば、一番外の黒線枠の横幅、縦幅を検出し、フォー
マットデータの該当する横幅、縦幅と比較して算出す
る。さらに、位置合わせ用基準点の認識座標系における
位置(xm0,ym0)を求め、フォーマットデータに
予め設定している当該点の位置(xf0,yf0)(フ
ォーマットデータ生成用座標系で表現)と比較して、位
置ずれ量(dx,dy)を求める。シート識別では、伸
縮のある認識座標系において検出した目標点の座標(x
m,ym)をフォーマットデータ生成用座標系(xf,
yf)に変換し、これをシート識別用辞書の書式の座標
データと比較する。
## EQU00004 ## dx = (1 / mx) .xm0-xf0.cos
Θ-yf0 · sin Θ dy = (1 / my) · ym0 + xf0 · sin Θ-yf
It can be represented by 0 · cos Θ. The rotation angle Θ is detected based on the inclination of the ruled line. Next, the expansion / contraction ratios mx and my are calculated.
For example, the width and height of the outermost black line frame are detected and calculated by comparing with the corresponding width and height of the format data. Further, the position (xm0, ym0) of the alignment reference point in the recognition coordinate system is obtained and compared with the position (xf0, yf0) of the point preset in the format data (expressed in the format data generation coordinate system). Then, the positional deviation amount (dx, dy) is obtained. In sheet identification, the coordinates of the target point (x
m, ym) is the coordinate system (xf,
yf), and compares this with the coordinate data in the format of the sheet identification dictionary.

【0030】文字行の相対的な位置関係を表現する方式
を図29に示す。今、注目する文字行2900に対し
て、8方向の位置関係を表現している。方向を東西南北
で表すと、注目する文字行2900の北方向2901に
は文字行2911がある。また、南方向2905には文
字行2915が、東方向2903には文字行2913
が、西方向2907には文字行2917が、それぞれあ
る。さらに、注目する文字行2900の北東方向290
2には文字行2912が、北西方向2908には文字行
2918が、南東方向2904には文字行2914が、
南西方向2906には文字行2916が、それぞれあ
る。このように、注目する文字行に対して、8方向の位
置関係を有する文字行を表現する。
FIG. 29 shows a method of expressing the relative positional relationship of character lines. Now, with respect to the character line 2900 of interest, a positional relationship in eight directions is expressed. If the directions are expressed as north, south, east, and west, there is a character line 2911 in the north direction 2901 of the character line 2900 of interest. In addition, the character line 2915 is in the south direction 2905, and the character line 2913 is in the east direction 2903.
However, there are character lines 2917 in the west direction 2907. Furthermore, the northeast direction 290 of the character line 2900 to be noticed
2, a character line 2912, a northwest direction 2908, a character line 2918, a southeast direction 2904, a character line 2914,
There are character lines 2916 in the southwest direction 2906, respectively. In this way, a character line having a positional relationship in eight directions with respect to the focused character line is expressed.

【0031】図8はステップ411の文字行マッチング
の処理方式を説明する図である。伝票文書の文字行の部
分領域の例を810、811、812に示す。文字行領
域810では、抽出した文字行を801、802、80
3示しているが、これらの相対的な位置関係は上下の南
北関係になっている。いま、注目する文字行を801と
すると、文字行802は文字行801に対して南方向8
20にある。また、文字行802に対して、文字行80
3は、同じく、南方向821にある。一方、文字行領域
811の例では、文字行804、805、806の相対
的な位置関係は左右の東西関係である。文字行804に
対して、文字行805は東方向822にあり、文字行8
05に対して806も又、東方向823にある。さら
に、文字行領域812の例では、斜め方向の位置関係に
あり、文字行807に対して、文字行808は北東方向
824にある。また、文字行808に対して文字行80
9は、同じく、北東方向825にある。ステップ411
の文字行マッチングでは、このような文字行の相対的な
位置関係が予めシート識別用辞書430には登録されて
おり、入力画像から抽出した文字行の相対的な位置関係
と合致するかどうかを判定する。
FIG. 8 is a diagram for explaining the character line matching processing method in step 411. Examples of partial areas of the character lines of the slip document are shown in 810, 811, and 812. In the character line area 810, the extracted character lines 801, 802, 80
As shown in Fig. 3, the relative positional relationship between them is a vertical north-south relationship. Now, assuming that the character line of interest is 801, the character line 802 is 8 in the south direction with respect to the character line 801.
20. In addition, for the character line 802, the character line 80
3 is also in the south direction 821. On the other hand, in the example of the character line area 811, the relative positional relationship between the character lines 804, 805, and 806 is a left-right east-west relationship. The character line 805 is in the east direction 822 with respect to the character line 804, and the character line 8
For 05, 806 is also eastward 823. Further, in the example of the character line area 812, there is a diagonal positional relationship, and the character line 808 is in the northeast direction 824 with respect to the character line 807. In addition, the character line 80
9 is also in the northeast direction 825. Step 411
In the character line matching, the relative positional relationship of such character lines is registered in the sheet identification dictionary 430 in advance, and it is determined whether or not the relative positional relationship of the character lines extracted from the input image matches. judge.

【0032】図9は図3のステップ302で示した読み
取り領域設定処理の詳細処理フローである。先のシート
識別のステップ301で得られたシート種番号をステッ
プ900で入力する。次いで、ステップ901で読み取
り領域ごとの処理に移り、ステップ902でシート種類
ごとに登録されているフォーマットパラメータ910か
ら、該当する読み取りのフォーマットパラメータを読み
込む。ここで、フォーマットパラメートとしては、文字
種、文字数、読み取りフィールドの位置が具備されてい
る。ステップ903では、フオーマットパラメータから
読み込んだ読み取りフィールド位置とステップ406で
求めた基準点位置からの位置ずれ量を基に、読み取り領
域を算出する。
FIG. 9 is a detailed processing flow of the reading area setting processing shown in step 302 of FIG. In step 900, the sheet type number obtained in step 301 of sheet identification is input. Next, in step 901, the process proceeds to each reading area, and in step 902, the corresponding reading format parameter is read from the format parameters 910 registered for each sheet type. Here, the format parameters include the character type, the number of characters, and the position of the reading field. In step 903, the reading area is calculated based on the reading field position read from the format parameter and the position shift amount from the reference point position obtained in step 406.

【0033】図10はステップ303で示した読み取り
領域内文字認識処理の詳細処理フローである。ステップ
1000で読み取りフィールドごとに、ステップ100
1から1004までの処理を行なう。ステップ1001
では読み取り領域内の文字行を抽出する。ステップ10
01では、予め、読み取り領域内に印刷されている不要
文字を除去する。そして、ステップ1003で抽出した
文字行を一文字単位に分離する。ステップ1004で
は、一文字ごとの文字認識を行なう。この文字認識は、
従来技術を用いて容易に実現できる。
FIG. 10 is a detailed processing flow of the character recognition processing in the reading area shown in step 303. For each read field in step 1000, step 100
The processing from 1 to 1004 is performed. Step 1001
Then, the character line in the reading area is extracted. Step 10
In 01, unnecessary characters printed in the reading area are removed in advance. Then, the character line extracted in step 1003 is separated into character units. In step 1004, character recognition is performed for each character. This character recognition is
It can be easily realized using conventional techniques.

【0034】図11は伝票文書を読み取り、当該読み取
り結果をもとに伝票文書を選択して蓄積する伝票文書情
報システムの処理フローを示す図である。ステップ11
00で文書がつきるまで、ステップ1101以下の処理
を繰り返す。ステップ1101で伝票文書の画像入力を
行なう。次いで、ステップ1102で、ステップ301
と同様のシート識別処理を行なう。次いで、ステップ1
103で同じく、読み取り領域を抽出し、ステップ11
04で読み取り領域内において文字認識を行なう。ステ
ップ1105で、認識結果の数値データが予め設定され
た範囲内にあるかどうかを判定し、もし設定された範囲
内にある場合は、ステップ1106で光ディスク等の記
憶装置に当該画像を蓄積する。もし、設定された範囲内
にない場合は、記憶装置に当該画像を蓄積しない。上述
の一連の処理をステップ1100で文書が尽きるまで行
なう。この処理により入力した紙文書はすべて蓄積する
必要はなく、記載内容によって、取捨選択して蓄積する
ことができる。このため、小規模のファイルシステムで
は記憶の容量を節約できるという効果がある。
FIG. 11 is a diagram showing a processing flow of the slip document information system for reading a slip document and selecting and storing the slip document based on the read result. Step 11
The processing from step 1101 onward is repeated until a document is attached at 00. In step 1101, an image of the slip document is input. Then, in step 1102, step 301
A sheet identification process similar to that is performed. Then step 1
Similarly, in step 103, the reading area is extracted, and step 11
At 04, character recognition is performed in the reading area. In step 1105, it is determined whether the numerical data of the recognition result is within a preset range. If it is within the preset range, the image is stored in a storage device such as an optical disk in step 1106. If it is not within the set range, the image is not stored in the storage device. The above-described series of processing is performed in step 1100 until the document is exhausted. It is not necessary to store all the paper documents input by this processing, and it is possible to select and store depending on the description content. Therefore, there is an effect that the storage capacity can be saved in a small-scale file system.

【0035】伝票文書の画像入力、蓄積、検索、内容点
検を行なう文書情報システムにおいては、使用者のアク
セスレベルに応じて守秘領域の画像をマスクして表示す
る。図12は伝票文書画像から守秘領域を登録する処理
フローを示す。ステップ1200で画像を入力し、ステ
ップ1201でシート識別処理301を行なう。そし
て、ステップ1202で守秘領域を抽出する。ここで
は、先のシート識別のステップ1201でシート種と抽
出した領域の位置を出力しており、領域ごとに守秘領域
であるかどうかを判定する。この時、守秘領域であるか
どうかは、予め登録しているシート識別用辞書430を
読み取るものとする。当該辞書430には、枠で示され
た領域ごとに守秘のレベルが具備されている。ステップ
1203で守秘領域の座標を画像データとともに記憶装
置に格納する。
In a document information system for inputting, storing, retrieving, and checking the contents of a slip document, the confidential area image is masked and displayed according to the access level of the user. FIG. 12 shows a processing flow for registering the confidential area from the slip document image. An image is input in step 1200, and sheet identification processing 301 is performed in step 1201. Then, in step 1202, the confidential area is extracted. Here, the sheet type and the position of the area extracted in step 1201 of the previous sheet identification are output, and it is determined for each area whether or not the area is a confidential area. At this time, the sheet identification dictionary 430 registered in advance is read to determine whether the area is a confidential area. The dictionary 430 has a confidentiality level for each area indicated by a frame. In step 1203, the coordinates of the confidential area are stored in the storage device together with the image data.

【0036】図13は伝票画像に対して、使用者のアク
セスレベルにより守秘領域の画像をマスクして表示する
処理のフローである。先ず、ステップ1300で使用者
のパスワードを入力する。そして、ステップ1301で
使用者のアクセスレベルを図16に示す使用者アクセス
レベルテーブル1600を用いて設定する。図16は使
用者アクセステーブルの説明図である。使用者名160
1,パスワード1602に対して、アクセスレベル16
03が格納されており、当該使用者に対応するアクセス
レベルを設定する。次いで、ステップ1302で領域が
つきるまで、ステップ1303,1304の処理を繰り
返す。ステップ1303では、領域ごとに設定されてい
るアクセスレベルを領域アクセステーブル1500から
読み出す。図15は領域アクセステーブルを示す。当該
テーブル1500は、標準の伝票文書に対して、領域に
付与された識別番号1501ごとにアクセスレベル15
02が付与されている。そして、ステップ1304で使
用者のアクセスレベルが領域のアクセスレベルより強い
かどうかの判定を行なう。もし、使用者のアクセスレベ
ルが強い場合は、ステップ1305で当該領域のマスク
を解除する。一方、その反対に、領域のアクセスレベル
の方が使用者のアクセスレベルより強い場合は、ステッ
プ1306で当該領域にマスクを設定する。以上の一連
の処理をステップ1302で領域がつきるまで繰返し行
なう。そして、ステップ1307で伝票画像を表示す
る。ここでは、領域ごとに表示処理を実行し、領域にマ
スクが設定されている部分画像はそのまま表示せず、例
えば、黒画像により塗りつぶした画像を表示する。領域
のマスクが解除されている部分画像はそのまま表示す
る。本実施例では、蓄積した文書画像を表示、印刷する
場合、守秘項目についてアクセスレベルが付与されてお
り、例えば、文書にプライベートな内容や、ビジネス上
重要な情報が記載されている場合に、文書の部分領域を
守秘レベルに応じて見ることができ、機密を保つことが
できるという効果がある。
FIG. 13 is a flow chart of a process of masking and displaying the image of the confidential area according to the access level of the user with respect to the slip image. First, in step 1300, the password of the user is input. Then, in step 1301, the access level of the user is set using the user access level table 1600 shown in FIG. FIG. 16 is an explanatory diagram of the user access table. User name 160
1, access level 16 for password 1602
03 is stored, and the access level corresponding to the user is set. Next, the processing of steps 1303 and 1304 is repeated until the area is formed in step 1302. In step 1303, the access level set for each area is read from the area access table 1500. FIG. 15 shows the area access table. The table 1500 has an access level 15 for the standard slip document for each identification number 1501 assigned to the area.
02 is assigned. Then, in step 1304, it is determined whether the access level of the user is stronger than the access level of the area. If the access level of the user is strong, the masking of the area is released in step 1305. On the contrary, if the access level of the area is stronger than the access level of the user, a mask is set in the area in step 1306. The above series of processing is repeated until a region is formed in step 1302. Then, in step 1307, the slip image is displayed. Here, the display process is executed for each area, and the partial image in which the mask is set in the area is not displayed as it is, but for example, an image filled with a black image is displayed. The partial image in which the mask of the area is released is displayed as it is. In this embodiment, when displaying and printing the stored document images, access levels are given to confidential items. For example, when the document contains private contents or business-important information, There is an effect that the partial area of can be seen according to the confidentiality level and the confidentiality can be maintained.

【0037】図14は伝票文書画像の表示の一例であ
る。表示画面1400において、伝票の各項目に対応し
た領域1401、1402、1403、1404、14
15、1405、1406、1407、1408、14
09が設定される。この時、使用者のアクセスレベルに
応じて、斜線部分1410、1411、1412、14
13、1414において、守秘のためにマスクが設定さ
れており、当該領域は黒く塗りつぶされることになる。
FIG. 14 shows an example of displaying a slip document image. Areas 1401, 1402, 1403, 1404, 14 corresponding to each item of the slip on the display screen 1400
15, 1405, 1406, 1407, 1408, 14
09 is set. At this time, the shaded portions 1410, 1411, 1412, 14 are displayed according to the access level of the user.
In 13 and 1414, a mask is set for confidentiality, and the area is filled with black.

【0038】図17は伝票文書の読み取り結果によって
バーコードを当該文書に印刷する処理フローを示す。ス
テップ1700で文書画像を入力する。入力した画像に
対して、ステップ1701で伝票文書の種類を識別する
シート識別を行ない、ステップ1702で文字認識によ
りシート内の領域の読み取りを行なう。そして、ステッ
プ1703で当該認識結果に従ってバーコードの印字を
紙文書の表面に行なう。
FIG. 17 shows a processing flow for printing a barcode on a slip document according to the result of reading the document. In step 1700, a document image is input. In step 1701, sheet identification for identifying the type of slip document is performed on the input image, and in step 1702, an area in the sheet is read by character recognition. Then, in step 1703, the barcode is printed on the front surface of the paper document according to the recognition result.

【0039】図18はバーコードにより文書を探索する
処理フローを示す。ステップ1800で、探索したい文
書の整理番号を入力すると、ステップ1801で整理番
号に該当するバーコードを設定する。そして、ステップ
1802で文書が尽きるまで、ステップ1803,18
04,1805の処理を繰り返す。先ず、ステップ18
03では、伝票文書の紙送りを実行し、紙表面に印刷さ
れているバーコードをステップ1804で読み取る。次
いで、ステップ1805において、読み取ったバーコー
ドがステップ1801で設定されたバーコードと一致す
るかどうかを判定する。もし、一致すれば、所望の伝票
文書であるとして、ステップ1806で選択スタッカに
格納する。もし、ステップ1805で一致しなければ、
ステップ1807で通常のスタッカに格納し、ステップ
1802で文書がつきるまで処理を繰り返す。本実施例
により原本にバーコードを印刷しているため、蓄積した
画像ファイルから所望の文書画像を表示、印刷するだけ
でなく、原本である紙文書そのものをバーコードを用い
て容易に探索することができるという効果がある。図1
9は伝票文書の種類を識別し仕分けを行なう処理フロー
である。ステップ1900で伝票文書画像を入力し、シ
ート識別用辞書1910によってステップ1901でシ
ート識別を行なう。次いで、ステップ1902でシート
内読み取りを実行する。この時、予め登録しているフォ
ーマットパラメータ1911と文字認識用辞書1912
を用いる。ステップ1903で、シート識別の結果であ
るシートの種類によって伝票文書の仕分けを行なう。本
実施例により、従来人手により行なわれていた伝票文書
の仕分けを自動的に行なえるようになり、人手による作
業量を低減することができる。
FIG. 18 shows a processing flow for searching a document by a bar code. When the reference number of the document to be searched is input in step 1800, a bar code corresponding to the reference number is set in step 1801. Then, in step 1802, steps 1803 and 18 are performed until the document is exhausted.
The processing of 04 and 1805 is repeated. First, step 18
In 03, paper feeding of the slip document is executed, and the bar code printed on the paper surface is read in step 1804. Next, in step 1805, it is determined whether the read barcode matches the barcode set in step 1801. If they match, it is determined that the document is a desired slip document and is stored in the selected stacker in step 1806. If they do not match in step 1805,
In step 1807, the sheets are stored in a normal stacker, and in step 1802, the process is repeated until a document is attached. Since the barcode is printed on the original according to the present embodiment, not only the desired document image is displayed and printed from the accumulated image files, but also the original paper document itself can be easily searched using the barcode. There is an effect that can be. Figure 1
9 is a processing flow for identifying the types of slip documents and sorting. The slip document image is input in step 1900, and the sheet is identified in step 1901 by the sheet identification dictionary 1910. Then, in step 1902, the in-sheet reading is executed. At this time, the previously registered format parameter 1911 and the character recognition dictionary 1912
To use. In step 1903, the slip documents are sorted according to the sheet type that is the result of sheet identification. According to the present embodiment, it becomes possible to automatically sort the slip documents, which was conventionally done manually, and it is possible to reduce the amount of work done manually.

【0040】図20はネットワークに接続された入力・
仕分けステーションと認識ステーションの動作制御を説
明する図である。ネットワーク2000には入力・仕分
けステーション2002と認識ステーション2001が
接続されている。処理の制御は、先ず、認識ステーショ
ン2001から全体システムの起動を入力・仕分けステ
ーション2002に送る。入力・仕分けステーション2
002、この起動指令を受け、ホッパに設定された伝票
文書は入力装置2004のスキャナで画像を入力する。
画像は入力装置2004内にある画像プロセッサにおい
てデータ圧縮され、ネットワーク2000を介して認識
ステーション2001に転送される。転送された画像は
伸張され、シート識別と読み取りを行なう。認識結果
は、ネットワーク2000を介して入力・仕分けステー
ション2002に転送され、仕分け装置2005のスタ
ッカを選択する。上記の処理をホッパの設定されている
伝票文書がなくなり、ホッパが空になるまで行なう。な
お、スタッカが途中で満杯になった場合は、警告音を発
生し、一時停止する。ホッパが空になれば、入力・仕分
けステーション2002から終了指令を認識ステーショ
ン2001に送信し、全体システムの処理が終了する。
FIG. 20 shows input / output connected to the network.
It is a figure explaining operation control of a sorting station and a recognition station. An input / sorting station 2002 and a recognition station 2001 are connected to the network 2000. To control the process, first, the recognition station 2001 sends an activation of the entire system to the input / sorting station 2002. Input / sort station 2
002, the slip document set in the hopper upon receiving this activation command inputs an image with the scanner of the input device 2004.
The image is data-compressed in the image processor in the input device 2004 and transferred to the recognition station 2001 via the network 2000. The transferred image is decompressed and the sheet is identified and read. The recognition result is transferred to the input / sorting station 2002 via the network 2000, and the stacker of the sorting apparatus 2005 is selected. The above process is repeated until there is no slip document for which the hopper is set and the hopper becomes empty. When the stacker becomes full on the way, a warning sound is generated and the stacker is temporarily stopped. When the hopper becomes empty, the input / sorting station 2002 transmits an end command to the recognition station 2001, and the processing of the entire system ends.

【0041】図21は伝票文書の種類を識別し文字認識
を行い認識結果によって整理番号を紙文書に打番して仕
分けを行なう伝票文書処理のフローである。ステップ2
100で伝票文書の画像を入力する。ステップ2101
で伝票の種類を識別するシート識別を実行する。ステッ
プ2102でシート内読み取りを行ない、当該認識結果
によってステップ2103で整理番号を打番する。ステ
ップ2104では伝票の種類、若しくは、記載内容によ
って仕分けを行ない所定のスタッカに格納する。
FIG. 21 is a flow chart of a slip document process in which the types of slip documents are identified, characters are recognized, and a serial number is assigned to a paper document according to the recognition result to perform sorting. Step two
At 100, the image of the slip document is input. Step 2101
The sheet identification for identifying the slip type is executed with. In step 2102, the inside of the sheet is read, and the reference number is assigned in step 2103 according to the recognition result. In step 2104, the documents are sorted according to the type of the slip or the description content and stored in a predetermined stacker.

【0042】図22は整理番号を打番した伝票文書の一
例である。伝票文書2200において、2201で示す
整理番号を打番している。文書の端部の位置を検出して
いるため、当該整理番号は予め設定している座標位置に
打番することができる。また、打番のためのインク色を
指定色に切り換えることができる。
FIG. 22 shows an example of a slip document with a reference number. In the slip document 2200, the reference number 2201 is numbered. Since the position of the edge of the document is detected, the reference number can be numbered at the preset coordinate position. Also, the ink color for the printing number can be switched to the designated color.

【0043】図23は入力・仕分けの構成を示す図であ
る。ホッパ2300に伝票文書2320が設定されてい
る。2304は計算機であり入力・仕分け全体を制御す
るとともに。ネットワーク2321との通信制御を行な
う。ホッパ制御部2310は、ホッバ機構部2315を
制御し、順次、紙をセンサ部2313に送る。センサ制
御部2311は画像信号をディジタル化し計算機230
4に送る。2314は打番機構であり、打番制御部23
12によって計算機2304から送られてきた整理番号
を印字する。仕分け機構部2316,2317,231
8は、計算機2304の指令により、送られてきた伝票
文書を所定のスタッカに格納するよう制御されている。
スタッカ2301、2302、2303には選択された
伝票文書が順次格納されている。各スタッカには文書の
満杯を検知するセンサ2307、2308、2309が
具備されており、満杯検知センサ制御部2306によっ
てスタッカ満杯信号が計算機2304に送られる。23
05は警告音発生部であり、スタッカの満杯が検知され
ると、警告音を発生し、計算機2304は処理を一時停
止する。
FIG. 23 is a diagram showing the structure of input / sorting. A slip document 2320 is set in the hopper 2300. A computer 2304 controls the entire input / sorting process. It controls communication with the network 2321. The hopper control unit 2310 controls the hopper mechanism unit 2315 and sequentially feeds the paper to the sensor unit 2313. The sensor control unit 2311 digitizes the image signal, and the computer 230
Send to 4. 2314 is a hitting number mechanism, and the hitting number control unit 23
The reference number sent from the computer 2304 by 12 is printed. Sorting mechanism unit 2316, 2317, 231
The computer 8 is controlled by the command of the computer 2304 to store the sent slip document in a predetermined stacker.
The selected slip documents are sequentially stored in the stackers 2301, 2302 and 2303. Each stacker is equipped with sensors 2307, 2308, and 2309 that detect the fullness of the document, and the fullness detection sensor control unit 2306 sends a stacker fullness signal to the computer 2304. 23
Reference numeral 05 is a warning sound generation unit, which generates a warning sound when the stacker is full and the computer 2304 suspends the processing.

【0044】図24は伝票文書情報システムの画面の遷
移図の一例である。システム立ち上げ時のメイン画面2
401を図25に示す。メイン画面2500は、選択項
目2501並びに選択項目の入力プロンプト2502を
具備している。入力方法指定画面2402によって、2
種類の入力を切り換えることができ、その一つはスキャ
ナ入力画面2403、もう一つはファイル入力画面24
04で行なう。2405は画像表示画面であり、指定し
た入力方法で画像を入力し、その入力画像を当該画面で
表示確認することができる。当該画面から、メイン画面
2401に戻ることができ、例えば、様式/書式識別画
面2406に遷移する。ここでは、図26に示すよう
に、抽出した枠2601を画面2600に表示すること
ができる。また、画面2602に示すように、抽出した
枠2603と辞書として具備していた枠2604を重ね
あわせて表示することもできる。2408は認識結果画
面であり、文書画像と認識結果を同時に表示し、修正を
行なうことができる。図27は認識結果画面を説明する
図である。伝票文書2700に対して、上部画像表示エ
リア2701と下部画像表示エリア2702を拡大して
表示する。認識結果画面2710において、2711に
上部画像を拡大して表示している。また、2712に下
部画像を拡大して表示している。認識結果は2713の
部分に表示しており、修正を対話的に行なうことができ
る。図28は、認識結果画面の他の実施例を説明する図
である。本実施例では、認識結果画面を2画面として、
第1画面2800には上部画像2801を表示し、認識
結果は2802の部分に表示している。また、第2画面
2803には、下部画像2804を表示しており、同じ
く認識結果を2805に表示し、対話的に修正を行な
う。
FIG. 24 is an example of a screen transition diagram of the slip document information system. Main screen 2 at system startup
401 is shown in FIG. The main screen 2500 includes a selection item 2501 and a selection item input prompt 2502. 2 by the input method designation screen 2402
It is possible to switch the type of input, one of which is the scanner input screen 2403 and the other is the file input screen 24.
Perform at 04. An image display screen 2405 allows an image to be input by a specified input method, and the input image can be displayed and confirmed on the screen. From this screen, it is possible to return to the main screen 2401 and transit to, for example, the style / form identification screen 2406. Here, as shown in FIG. 26, the extracted frame 2601 can be displayed on the screen 2600. Further, as shown in the screen 2602, the extracted frame 2603 and the frame 2604 provided as a dictionary can be displayed in an overlapping manner. Reference numeral 2408 denotes a recognition result screen, on which a document image and a recognition result can be displayed at the same time and correction can be performed. FIG. 27 is a diagram illustrating the recognition result screen. An upper image display area 2701 and a lower image display area 2702 are enlarged and displayed on the slip document 2700. On the recognition result screen 2710, the upper image is enlarged and displayed at 2711. Also, the lower image is enlarged and displayed in 2712. The recognition result is displayed in the portion 2713, and the correction can be performed interactively. FIG. 28 is a diagram illustrating another example of the recognition result screen. In this embodiment, the recognition result screen has two screens,
An upper image 2801 is displayed on the first screen 2800, and the recognition result is displayed in the portion 2802. Further, a lower image 2804 is displayed on the second screen 2803, the recognition result is also displayed on 2805, and the correction is performed interactively.

【0045】図30はステップ304の妥当性検定の詳
細処理フローであり、レセプトを対象とした例である。
ステップ3000で、性別と請求内容の検定を行なう。
性別によって医療行為が異なるものがあり、性別により
検査や手術等の請求内容が該当するかどうかを検定す
る。さらに、ステップ3001では、年齢と請求内容の
検定を行なう。ここでは、年齢により調剤や手術の内容
に制限があり、請求内容が当該年齢において適切である
かの検定を行なう。さらに、ステップ3002では、年
齢と伝票様式の検定を行なう。ここでは、年齢により、
例えば、新生児、乳幼児、老人等により伝票の様式が予
め規定されており、シート識別で求めた伝票の様式が記
載されている年齢と合致するかどうかの検定を行なう。
また、ステップ3003で保険証番号と登録されている
氏名との一致を判定する。さらに、ステップ3004と
3005において、診療実日数及び合計点の検定を行な
う。
FIG. 30 is a detailed processing flow of the adequacy test in step 304, which is an example for the receipt.
At step 3000, the gender and the content of the request are verified.
Some medical procedures differ depending on the sex, and it is verified whether the contents of the request for inspection, surgery, etc. correspond to the sex. Further, in step 3001, the age and the content of the bill are verified. Here, there are restrictions on the content of dispensing and surgery depending on the age, and it is verified whether the content of the claim is appropriate for the age. Further, in step 3002, the age and slip format are verified. Here, by age,
For example, the form of the slip is prescribed in advance by a newborn baby, an infant, an old man, etc., and it is verified whether or not the form of the slip obtained by sheet identification matches the stated age.
In step 3003, it is determined whether the insurance card number matches the registered name. Further, in steps 3004 and 3005, the actual medical treatment days and the total points are verified.

【0046】[0046]

【発明の効果】文書画像から様式の種類を識別して記載
内容を読み取り、読み取り結果が記載項目ごとに登録し
ている条件を満足するかどうかを判定するようにしてお
り、複数の伝票文書を読み取ることができる。また、読
み取り領域を自動的に設定し文字認識を行い、記載内容
の妥当性を検定しており、伝票の記載内容を自動的に点
検することができる。認識結果により仕分け機構並びに
印刷機構を制御するようにしており、認識結果によって
整理番号若しくはバーコードを紙文書に印刷し、紙文書
の仕分けを自動的に行なうことができ、仕分け作業を低
減するという効果がある。守秘領域に対してアクセスの
ためのパスワードを付与するようにしており、守秘領域
の画像をマスクして検索結果の表示、印刷を行なうこと
ができ、システムの信頼性を向上させる効果がある。記
載内容例えば点数を読み取り、点数が一定値より大きい
文書のみ、その表面画像を蓄積するようにしており、記
憶領域を節約できるという効果がある。
As described above, the type of style is identified from the document image, the description content is read, and it is determined whether or not the read result satisfies the condition registered for each entry item. Can be read. Further, the reading area is automatically set, the characters are recognized, the validity of the described contents is verified, and the described contents of the slip can be automatically inspected. According to the recognition result, the sorting mechanism and the printing mechanism are controlled. According to the recognition result, the reference number or the bar code can be printed on the paper document, and the paper document can be sorted automatically, which reduces the sorting work. effective. Since a password for access is given to the confidential area, the image of the confidential area can be masked to display and print the search result, which has the effect of improving the reliability of the system. The description content, for example, the score is read, and the surface image is stored only for the document having the score larger than a certain value, which has an effect of saving the storage area.

【図面の簡単な説明】[Brief description of drawings]

【図1】伝票情報システムの構成を説明する図である。FIG. 1 is a diagram illustrating a configuration of a slip information system.

【図2】伝票文書の処理フローを説明する図である。FIG. 2 is a diagram illustrating a processing flow of a slip document.

【図3】伝票文書の画像入力、蓄積、検索、内容点検を
行なうシステムの処理フローを示す図である。
FIG. 3 is a diagram showing a processing flow of a system for performing image input, storage, search, and content inspection of a slip document.

【図4】シート識別処理の詳細処理フローを示す図であ
る。
FIG. 4 is a diagram showing a detailed processing flow of sheet identification processing.

【図5】位置ずれ・回転・伸縮を有する認識座標系を説
明する図である。
FIG. 5 is a diagram for explaining a recognition coordinate system having displacement, rotation, and expansion / contraction.

【図6】罫線座標を算出する過程の説明図である。FIG. 6 is an explanatory diagram of a process of calculating ruled line coordinates.

【図7】罫線交点算出並びに枠生成の処理過程を説明す
る図である。
FIG. 7 is a diagram illustrating a process of calculating a ruled line intersection and generating a frame.

【図8】文字行マッチングの処理方式を説明する図であ
る。
FIG. 8 is a diagram illustrating a processing method of character line matching.

【図9】読み取り領域設定処理の詳細処理フローの説明
図である。
FIG. 9 is an explanatory diagram of a detailed processing flow of reading area setting processing.

【図10】読み取り領域内文字認識処理の詳細処理フロ
ーの説明図である。
FIG. 10 is an explanatory diagram of a detailed processing flow of character recognition processing in a reading area.

【図11】伝票文書の選択蓄積を行なう伝票文書情報シ
ステムの説明図である。
FIG. 11 is an explanatory diagram of a slip document information system that selectively stores a slip document.

【図12】伝票文書画像から守秘領域を登録する処理フ
ローの説明図である。
FIG. 12 is an explanatory diagram of a processing flow for registering a confidential area from a slip document image.

【図13】使用者のアクセスレベルにより守秘領域の画
像をマスクして表示する処理フローの説明図である。
FIG. 13 is an explanatory diagram of a processing flow in which an image of a confidential area is masked and displayed according to a user access level.

【図14】伝票文書画像の表示の一例を説明する図であ
る。
FIG. 14 is a diagram illustrating an example of displaying a slip document image.

【図15】領域アクセステーブルの説明図である。FIG. 15 is an explanatory diagram of an area access table.

【図16】使用者アクセスレベルテーブルの説明図であ
る。
FIG. 16 is an explanatory diagram of a user access level table.

【図17】認識結果を用いバーコードを文書に印刷する
処理フローの説明図である。
FIG. 17 is an explanatory diagram of a processing flow of printing a barcode on a document using a recognition result.

【図18】バーコードにより文書を探索する処理フロー
の説明図である。
FIG. 18 is an explanatory diagram of a processing flow for searching for a document using a barcode.

【図19】伝票文書の種類を識別し仕分けを行なう処理
フローの説明図である。
FIG. 19 is an explanatory diagram of a processing flow for identifying the types of slip documents and sorting.

【図20】ネットワークに接続されたステーションの動
作制御の説明図である。
FIG. 20 is an explanatory diagram of operation control of a station connected to the network.

【図21】認識結果によって整理番号を打番し仕分けを
行なう伝票文書処理フローの説明図である。
FIG. 21 is an explanatory diagram of a slip document processing flow in which a reference number is assigned and sorting is performed according to a recognition result.

【図22】整理番号を打番した伝票文書の一例を示す図
である。
FIG. 22 is a diagram showing an example of a slip document with a reference number.

【図23】入力・仕分けの構成を示す図である。FIG. 23 is a diagram showing a configuration of input / sorting.

【図24】伝票文書情報システムの画面の遷移図であ
る。
FIG. 24 is a screen transition diagram of the slip document information system.

【図25】メイン画面を示す図である。FIG. 25 is a diagram showing a main screen.

【図26】枠の表示画面を示す図である。FIG. 26 is a diagram showing a frame display screen.

【図27】認識結果画面を説明する図である。FIG. 27 is a diagram illustrating a recognition result screen.

【図28】認識結果画面の他の実施例を説明する図であ
る。
FIG. 28 is a diagram illustrating another example of the recognition result screen.

【図29】文字行の相対的な位置関係を説明する図であ
る。
FIG. 29 is a diagram illustrating a relative positional relationship between character lines.

【図30】妥当性検定の詳細処理フローである。FIG. 30 is a detailed processing flow of a validity test.

【符号の説明】 100…ネットワーク、101…蓄積ステーション、1
05…認識ステーション、103…入力・仕分けステー
ション、301…シート識別処理ステップ、304…妥
当性検定ステップ、410…枠マッチングステップ、4
11…文字行マッチングステップ、910…フォーマッ
トパラメータ、1306…領域のマスク設定、1703
…バーコード印刷ステップ、1804…バーコード読み
取り、2103…整理番号打番、2104…仕分け処
理。
[Explanation of Codes] 100 ... Network, 101 ... Storage Station, 1
05 ... Recognition station, 103 ... Input / sort station, 301 ... Sheet identification processing step, 304 ... Validity verification step, 410 ... Frame matching step, 4
11 ... Character line matching step, 910 ... Format parameter, 1306 ... Area mask setting, 1703
... Bar code printing step, 1804 ... Bar code reading, 2103 ... Serial number numbering, 2104 ... Sort processing.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 古賀 昌史 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 中島 和樹 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 門田 彰三 神奈川県小田原市国府2880番地 株式会 社日立製作所ストレージシステム事業部 内 (72)発明者 栗野 清道 神奈川県小田原市国府2880番地 株式会 社日立製作所ストレージシステム事業部 内 (72)発明者 杉本 建行 神奈川県小田原市国府2880番地 株式会 社日立製作所ストレージシステム事業部 内 (56)参考文献 特開 平4−268685(JP,A) 特開 平2−56086(JP,A) 特開 平5−244150(JP,A) 特開 平3−148785(JP,A) 特開 昭58−78263(JP,A) 特開 昭64−26993(JP,A) 特開 昭61−75477(JP,A) 特開 平5−258099(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 G06F 19/00 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Masafumi Koga 1-280, Higashi Koikeku, Kokubunji, Tokyo Inside Central Research Laboratory, Hitachi, Ltd. (72) Kazuki Nakajima 1-280, Higashi Koikeku, Kokubunji, Tokyo Hitachi, Ltd. Central Research Institute (72) Inventor Shozo Kadota 2880 Kokufu, Odawara, Kanagawa Hitachi Storage Systems Division (72) Inventor Kiyomichi Kurino 2880, Kokufu, Odawara Kanagawa Storage Systems Division (72) Inventor Kenyuki Sugimoto 2880, Kokufu, Odawara, Kanagawa, Ltd. Storage Systems Division, Hitachi, Ltd. (56) References JP-A-4-268685 (JP, A) JP-A-2-56086 (JP, A) JP-A-5-244150 (JP, A) JP-A-3 148785 (JP, A) JP 58-78263 (JP, A) JP 64-26993 (JP, A) JP 61-75477 (JP, A) JP 5-258099 (JP, A) (58) Fields surveyed (Int.Cl. 7 , DB name) G06K 9/00-9/82 G06F 19/00

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】伝票文書を画像として入力し、前記画像の
蓄積、検索、内容点検、及び前記伝票文書の選別を行な
う伝票文書情報システムにおいて、様式の種類を予め辞
書データとして格納する手段と、入力された伝票文書よ
り枠及び文字行を抽出する手段と、前記辞書データと抽
出した枠及び文字行のデータとを照合して前記伝票文書
の様式の種類を識別する手段と、前記様式の種類に応じ
て読み取り領域を抽出する手段と、読み取り領域を設定
し文字認識を行なう手段と、前記文字認識結果のデータ
を基に記載内容の妥当性を検定する手段と、該妥当性検
定結果に基づいて前記伝票文書の選別を行う手段とを有
することを特徴とする伝票文書情報システム。
1. A enter the voucher document as an image, the accumulation of the image search, the contents inspected, and the slip document information system for selection of the document document, means for storing the type of style in advance as a dictionary data A means for extracting a frame and character lines from the input slip document, a means for identifying the format type of the slip document by collating the dictionary data with the extracted frame and character line data, A means for extracting a reading area according to the type, a means for recognizing a character by setting the reading area, a means for testing the validity of the described contents based on the data of the character recognition result, and a means for checking the validity test result. And a means for selecting the slip documents based on the slip document information system.
【請求項2】前記伝票文書中の領域毎のアクセスレベル
を記憶する記憶手段と、 入力されたユーザIDに対応するアクセスレベルを読み
出す手段と、 前記領域毎に読み出したアクセスレベルを前記記憶され
るアクセスレベルと比較する手段と、 前記守秘領域の画像をマスクして表示手段に表示する手
段と、 前記比較結果により前記マスクの解除、及び設定を行な
う手段とを有することを特徴とする請求項1記載の伝票
文書情報システム。
2. A storage unit for storing an access level for each area in the slip document, a unit for reading out an access level corresponding to an input user ID, and the access level read out for each area. 2. A unit for comparing with an access level, a unit for masking the image of the confidential area and displaying it on a display unit, and a unit for releasing and setting the mask according to the comparison result. Described slip document information system.
【請求項3】伝票文書の複数領域を表示領域として設定
する手段と、前記表示領域の画像と前記認識手段の認識
結果を画面に同時に表示する手段と、前記認識結果を画
面を介して修正するときに読み取り領域の画像を拡大表
示する手段とを有し、前記読み取り領域抽出手段は該設
定された複数領域内から該読み取り領域を抽出すること
を特徴とする請求項1乃至2の何れかに記載の伝票文書
情報システム。
3. A means for setting a plurality of areas of a slip document as a display area, a means for simultaneously displaying an image of the display area and a recognition result of the recognition means on a screen, and modifying the recognition result via the screen. 3. A reading area extraction unit that enlarges and displays an image of the reading area, wherein the reading area extracting unit extracts the reading area from the set plurality of areas. Described slip document information system.
【請求項4】前記妥当性を検定する手段は前記文字認識
手段の認識結果の数値データが予め設定された範囲内に
あるかどうかを判定し、前記伝票文書情報システムはさ
らに当該範囲内にあると判定された伝票文書画像を選択
し、前記選択された画像のみを蓄積することを特徴とす
る請求項1乃至3の何れかに記載の伝票文書情報システ
ム。
4. The validity checking means judges whether or not the numerical data of the recognition result of the character recognizing means is within a preset range, and the slip document information system is further within the range. 4. The voucher document information system according to claim 1, wherein a voucher document image determined to be selected is stored, and only the selected image is stored.
【請求項5】上記識別された伝票文書の種類に基づいて
伝票文書の仕分けする手段をさらに有することを特徴と
する請求項1乃至4の何れかに記載の伝票文書情報シス
テム。
5. A voucher document information system according to any one of claims 1 to 4, further comprising means for sorting the documents documents based on the type of the identified documents document.
【請求項6】ネットワークを介して伝票文書の仕分けを
行なう文書情報システムにおいて、伝票文書の表面画像
を入力する入力ステーションと、入力した画像の種類を
識別する認識ステーションと、前記認識ステーションの
識別結果に従って紙文書を区分する仕分けステーション
と、画像を保管する蓄積ステーションを備え、前記認識
ステーションは様式の種類を予め辞書データとして格納
する手段と、入力された明細書文書より枠及び文字行を
抽出する手段と、前記辞書データと抽出した枠及び文字
行のデータとを照合して前記伝票文書の様式の種類を識
別する手段と、前記様式の種類に応じて読み取り領域を
抽出する手段と、読み取り領域を設定し文字認識を行な
う手段と、前記文字認識結果のデータを基に記載内容の
妥当性を検定する手段と、該妥当性検定結果に基づいて
前記伝票文書の選別を行う手段とを有し、前記ネットワ
ークを経由して画像データ、前記種類に関するデータ、
並びに仕分け制御情報を伝送することを特徴とする文書
情報システム。
6. A document information system for sorting slip documents via a network, an input station for inputting a front image of a slip document, a recognition station for identifying a type of the input image, and a recognition result of the recognition station. According to the above, a sorting station for sorting the paper document and a storage station for storing the image are provided, the recognition station stores the type of style as dictionary data in advance, and extracts a frame and a character line from the input specification document. Means, means for identifying the style type of the slip document by collating the dictionary data with the extracted frame and character line data, means for extracting a reading area according to the style type, and a reading area And the means for character recognition and the validity of the described contents is verified based on the character recognition result data. And stage, based on the validity test result
A means for selecting the slip document, image data via the network, data on the type,
And a document information system characterized by transmitting sorting control information.
JP26210093A 1993-10-20 1993-10-20 Slip document information system Expired - Lifetime JP3483919B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26210093A JP3483919B2 (en) 1993-10-20 1993-10-20 Slip document information system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26210093A JP3483919B2 (en) 1993-10-20 1993-10-20 Slip document information system

Publications (2)

Publication Number Publication Date
JPH07114616A JPH07114616A (en) 1995-05-02
JP3483919B2 true JP3483919B2 (en) 2004-01-06

Family

ID=17371041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26210093A Expired - Lifetime JP3483919B2 (en) 1993-10-20 1993-10-20 Slip document information system

Country Status (1)

Country Link
JP (1) JP3483919B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002324236A (en) 2001-04-25 2002-11-08 Hitachi Ltd Method for discriminating document and method for registering document
JP2006085554A (en) * 2004-09-17 2006-03-30 Oki Electric Ind Co Ltd Form classification system, and method for creation and delivery of electronic medium form
JP4803787B2 (en) * 2004-12-28 2011-10-26 キヤノンマーケティングジャパン株式会社 Electronic form system, masking method thereof, program thereof, and storage medium
JP2006318100A (en) * 2005-05-11 2006-11-24 Oki Electric Ind Co Ltd Collation confirmation method, document data integration device and document data integration system
JP4766603B2 (en) * 2005-12-27 2011-09-07 キヤノンマーケティングジャパン株式会社 Form output control device, form output control method, program, and computer-readable storage medium
JP5130081B2 (en) * 2008-02-29 2013-01-30 富士通フロンテック株式会社 Control device and image data display method
JP4847605B1 (en) * 2010-12-06 2011-12-28 社団法人国民健康保険中央会 Screen processing system for foreign electronic receipt and screen display method
JP2014078168A (en) 2012-10-11 2014-05-01 Fuji Xerox Co Ltd Character recognition apparatus and program
JP2017097515A (en) * 2015-11-20 2017-06-01 富士ゼロックス株式会社 Application processing apparatus, application processing system, and program
JP7060931B2 (en) * 2017-08-04 2022-04-27 グローリー株式会社 Form image processing device, form image processing system, form image processing method and program

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5878263A (en) * 1981-11-05 1983-05-11 Toshiba Corp Designating system of read character
JPS6175477A (en) * 1984-09-21 1986-04-17 Hitachi Ltd Filing system
JP2733837B2 (en) * 1987-07-23 1998-03-30 日本電信電話株式会社 Character reader
JPH0256086A (en) * 1988-08-22 1990-02-26 Ricoh Co Ltd Method for postprocessing for character recognition
JPH03148785A (en) * 1989-11-06 1991-06-25 Toshiba Corp Character read-out device
JP2887299B2 (en) * 1990-07-31 1999-04-26 博一 岡野 Intelligent information processing method and apparatus
JP3096481B2 (en) * 1991-02-22 2000-10-10 グローリー工業株式会社 How to determine the type of form
JPH05258099A (en) * 1992-03-16 1993-10-08 Fujitsu Ltd Character recognition processor

Also Published As

Publication number Publication date
JPH07114616A (en) 1995-05-02

Similar Documents

Publication Publication Date Title
US5179649A (en) Method for generating title information entry format and method for filing images in image filing device
EP0011388B1 (en) System and method for processing documents
US5119433A (en) Method and system for locating the amount field on a document
US6567546B1 (en) Data medium handling apparatus medium handling method
US5452379A (en) Image capture and storage techniques in association with optical mark reading
JP3483919B2 (en) Slip document information system
JP4594952B2 (en) Character recognition device and character recognition method
JP7380039B2 (en) Question generation device, question generation method, program for question generation device, and document management system
JPH05120356A (en) Personal information reading storage device
JP3558493B2 (en) Paper alignment device, paper alignment method, and computer-readable recording medium recording paper alignment program
JP3002594B2 (en) Report processing system
JPH09319824A (en) Document recognizing method
JP3256622B2 (en) Video coding equipment
JP4309881B2 (en) ID card recognition apparatus and ID card recognition method
JP2575408B2 (en) Postal address reading device for mail
JPH10171891A (en) Method for discriminating handwritten symbol of voting paper
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JP4736595B2 (en) Teaching material processing apparatus, teaching material processing method, and teaching material processing program
JP3292595B2 (en) Character recognition device
JP3463300B2 (en) Mark sheet and mark sheet direction detecting method and apparatus
JPS626372A (en) Individual discriminating device for rental safe-deposit box facility
JP3015819B2 (en) Automatic verification of seals and automatic verification of seals
KR100422270B1 (en) An automatic optical mark reading method using computer vision system
WO2000062242A1 (en) Method for human-machine interface by documents
JPH05303661A (en) Acquring/displaying device for partial image data

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071017

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081017

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091017

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091017

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101017

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121017

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121017

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131017

Year of fee payment: 10

EXPY Cancellation because of completion of term