JP2004240888A - Documents identification and classification method, documents identification and classification processing system and program - Google Patents

Documents identification and classification method, documents identification and classification processing system and program Download PDF

Info

Publication number
JP2004240888A
JP2004240888A JP2003031629A JP2003031629A JP2004240888A JP 2004240888 A JP2004240888 A JP 2004240888A JP 2003031629 A JP2003031629 A JP 2003031629A JP 2003031629 A JP2003031629 A JP 2003031629A JP 2004240888 A JP2004240888 A JP 2004240888A
Authority
JP
Japan
Prior art keywords
document
classification
storage unit
reading
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003031629A
Other languages
Japanese (ja)
Inventor
Tetsushi Hamai
哲志 濱井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2003031629A priority Critical patent/JP2004240888A/en
Publication of JP2004240888A publication Critical patent/JP2004240888A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To accurately and efficiently identify and classify document types by not disarranging a reading order when identifying and classifying. <P>SOLUTION: An OCR device 1 successively and optically reads written information of documents to be delivered and determines pockets of conveying/discharging destinations of the documents based on classification of identified document types. Written information of a document whose document type cannot be identified in the OCR device 1 is transferred to a control device 2 and displayed on a screen. Based on the written information, an operator identifies a document type thereof for classification and instructs a pocket of the conveying/discharging destination on the display screen. A currently read document is conveyed/discharged to a document separately holding device 3 through a conveying device 4. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、例えば、医療内容明細書及び請求書(適宜、レセプトと表記する)などの書類の記載内容を光学式文字読取装置(OCR:Optical Character Reader、ここでは適宜、「OCR装置」と表記する)で読み取り、その書類の記載情報から書類の種別を識別(適宜、解析ともいう)して、搬送・排出先の収納部を分類するための書類識別分類方法及び書類識別分類処理システム並びにプログラムに関する。
【0002】
【従来の技術】
従来、各種の書類の記載内容(以下、書面記載情報ともいう)をOCR装置で読み取り、その書類の種別を識別して分類する例としては下記の例が知られている。
【0003】
図15は、従来のOCR装置での書類の種別を識別して分類する例を説明するための図である。
(a)書類をOCR装置の自動送り装置(適宜、「ADF装置」と表記する)に配置して、書面記載情報の自動読み取りを開始する(図15(1))。
(b)読み取った書面記載情報を、例えば、ローカルエリアネットワーク(LAN)上のサーバなどにおいて、書類1枚単位で、書類の種別を識別するために、読み取った書面記載情報から、その書類の種別を識別するためのデータを見つけ出す(図15(1))。
(c)次に、例えば、予め登録しておいた文字データ(例えば、「請求書」、「請求内容書」の文字)と比較して、その書類の種別を識別する(図15(2))。
(d)この書類の種別を識別に基づいて、書類ごとに、OCR装置の外部の収納装置(適宜、ポケットと表記する)に区分けして搬送・収納する(図15(3)ポケットA,(4)ポケットB,(5)ポケットC/リジェクトポケット)。
(e)書類の種別を識別するデータが見つけ出せない場合、OCR装置の外部の、識別不能の収納装置に区分けして自動的に搬送・収納する(図15(5)ポケットC/リジェクトポケット)。
(f)この識別不能の収納装置(ポケットC/リジェクトポケット)に収納された書類は、人手で分類を確認して、ポケットA,Bのいずれかを区分けして、収納装置(ポケットA,B)に、先に収納された、書類束の最後に挿入・配置している。
【0004】
このように、従来は、機械的及び人手によって書類の種別を識別して分類される。
【0005】
【特許文献1】
特開平8−272883号公報「帳票処理方法およびシステム」(請求項)
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来例では、種別を識別できない書類を人手で分類を確認し、先に収納された書類束の最後に挿入・配置している。すなわち、OCR装置での書類の種別と人手での識別区分けによる分類の順序が混在してしまう。OCR装置での書類の読み取り順序と収納装置に収納された書類の順序(例えば、月順序や日付け順序)とが前後して、その読み取り連続が違ってしまうとい問題があった。
【0007】
本発明は、上記事情に鑑みてなされたものであり、書類の記載内容を光学式文字読取装置で読み取り、その書類の種別を識別して分類する際の、読み取り順序が異ならないようにでき、結果的に的確かつ効率的な書類の識別分類が可能になる、書類識別分類方法及び書類識別分類処理システム並びにプログラムの提供を目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成する本発明の書類識別分類方法は、光学式文字読取装置を用い、書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納部に搬送・排出するものであり、書類を順次自動的に送り出す工程と、送り出される書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した書類の搬送・排出先の収納部を決定する工程と、書類の搬送・排出先の収納部を決定する際に、書類種別が識別不能の書類の書面記載情報を画面表示し、この画面情報からの書類種別の識別に基づいて分類した書類を搬送・排出する収納部を指示する工程と、決定された収納部又は指示された収納部へ今回読み取った書類を搬送・排出する工程とを有することを特徴とする。
【0009】
この発明の書類識別分類方法では、書類の記載内容を光学式文字読取装置で読み取り、その書類の種別を識別して分類する際に識別不能となった書類のデータ(イメージデータ又は 光学文字認識した文字データ)を、この識別(解析)不能時点で画面表示し、オペレータの分類判断による指示操作で、分類先のポケットに、この書類を排出・搬送している。すなわち、書類の読み取り順序が異ならないようにしている。
【0010】
このようにして、読み取りのために載せ置いた書類の読み取り順序と、分類の搬送・排出順序が一致するようになり、結果的に的確かつ効率的な、書類の識別分類が可能になる。
【0011】
上記目的を達成する本発明の書類識別分類方法は、光学式文字読取装置を用い、書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納部に搬送・排出するものであり、書類を順次自動的に送り出す工程と、送り出される書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した、書類の搬送・排出先の収納部を決定する工程と、決定で書類種別が識別不能の場合に、この書類種別の識別不能の書類の記載事項を再度、自動的に読み取る処理を実施する工程と、再度、実施した自動的な読み取り処理による書類種別の識別に基づいて分類した書類の搬送・排出先の収納部を自動的に指示する工程と、決定された収納部又は指示された収納部へ今回読み取った書類を搬送・排出する工程とを有することを特徴とする。
【0012】
この発明の書類識別分類方法では、書類の記載内容を光学式文字読取装置で読み取り、その書類を識別して分類する際に、識別不能となった書類の記載事項を再度、自動的に読み取る処理を実施している。
【0013】
例えば、書類の種別識別不能時点で画面表示し、オペレータの分類判断(識別判断)による指示操作で、分類先のポケットに書類を排出・搬送していないため、読み取りのために載せ置いた書類の読み取り順序と、分類の搬送・排出順序が一致する。換言すれば、結果的に的確かつ、より効率的な書類種別の識別による分類が可能になる。
【0014】
上記目的を達成する本発明の書類識別分類処理システムは、書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納先に搬送・排出するものであり、書類を順次自動的に送り出す自動送出手段と、自動送出手段が送り出す書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した書類の搬送・排出先の収納部を決定する読取識別分類手段と、読取識別分類手段で書類種別が識別不能の書面記載情報を画面表示する表示手段と、表示手段での書面記載情報に基づいて書類種別を識別した分類による書類を搬送・排出する収納部を指示するための指示手段と、読取識別分類手段で決定された収納部又は指示手段で指示された収納部へ今回読み取った書類を搬送・排出する搬送・排出手段とを備えることを特徴とする。
【0015】
上記目的を達成する本発明の書類識別分類処理システムは、書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納先に搬送・排出するものであり、書類を順次自動的に送り出す自動送出手段と、自動送出手段が送り出す書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した、書類の搬送・排出先の収納部を決定する読取識別分類手段と、読取識別分類手段で書類種別が識別不能となった書類の記載事項を再度、自動的に読み取る処理を実施し、この処理に基づいた分類による搬送・排出先の収納部を自動的に指示するための指示手段と、読取識別分類手段で決定された収納部又は指示手段で指示された収納部へ今回読み取った書類を搬送・排出する搬送・排出手段とを備えることを特徴とする。
【0016】
この発明の書類識別分類処理システムでは、上記した書類識別分類方法と同様に、読み取り順序が異ならないように出来る様になり、結果的に的確かつ効率的な、書類の識別による分類が可能になる。
【0017】
上記目的を達成する本発明のプログラムは、書類を順次自動的に送り出すステップと、送り出す書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した書類の搬送・排出先の収納部を決定するステップと、
書類の搬送・排出先の収納部を決定する際に、書類種別が識別不能の書類の書面記載情報を画面表示し、この画面情報に基づいた書類種別を識別して分類した書類を搬送・排出する収納部を指示するステップと、決定された収納部又は指示された収納部へ今回読み取った書類を搬送・排出するステップとの制御をコンピュータに実行させるものである。
【0018】
また、本発明のプログラムは、書類を順次自動的に送り出すステップと、送り出される書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した、書類の搬送・排出先の収納部を決定するステップと、決定で書類種別が識別不能の場合に、この書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理を実施するステップと、再度、実施した自動的な読み取り処理に基づいて書類種別を識別して分類した書類の搬送・排出先の収納部を自動的に指示するステップと、決定された収納部又は指示された収納部へ今回読み取った書類を搬送・排出するステップとの制御をコンピュータに実行させるものである。
【0019】
この発明のプログラムでは、本発明が、情報記録媒体(パッケージソフトウェアなど)や通信ネットワーク上からのダウンロード/インストールを通じた提供が可能になる。したがって、当該発明を、種々の装置に搭載されるマイクロコンピュータなどで容易に実施できるようになって、その汎用性が向上する。
【0020】
以下は本発明の書類識別分類方法の技術思想における好適な態様である。
【0021】
上記画面表示が、読み取った書面記載情報の一部又は全部である。
【0022】
また、上記書類種別の識別不能の書類の記載事項を再度、自動的に読み取る処理として、複数の文字認識ソフトウェアによる処理を実施する。
【0023】
さらに、上記書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理として、書類の読み取り書面記載情報の全部のデータを取り込んで書類種別を識別する処理を実施する。
【0024】
また、上記書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理として、書類の読み取り書面記載情報の全部のデータ取り込み、このデータ中の文字を予め登録した文字を比較して書類種別を識別する処理を実施する。
【0025】
以下は本発明の書類識別分類処理システムの技術思想における好適な態様である。
【0026】
上記書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理として、(a)複数の文字認識ソフトウェアによる処理を実施し、(b)書類の読み取り書面記載情報の全部のデータを取り込んで書類種別を識別する処理を実施し、(c)書類の読み取り書面記載情報の全部のデータ取り込み、このデータ中の文字を予め登録した文字と比較して書類種別を識別する処理を実施し、かつ、(a)(b)(c)のいずれかを選択的に設定して実施するための手段を備える。
【0027】
また、上記書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理として、(a)複数の文字認識ソフトウェアによる処理を実施し、(b)書類の読み取り書面記載情報の全部のデータを取り込んで書類種別を識別する処理を実施し、(c)書類の読み取り書面記載情報の全部のデータ取り込み、このデータ中の文字を予め登録した文字を比較して書類種別を識別する処理を実施し、かつ、(a)(b)(c)を連続的に処理して、(a)(b)(c)のいずれかで書類種別を識別するための手段を備える。
【0028】
以下は本発明のプログラムの技術思想における好適な態様である。
【0029】
上記、書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理として、(a)複数の文字認識ソフトウェアによる処理を実施するステップと、(b)書類の読み取り書面記載情報の全部のデータを取り込んで書類種別を識別する処理を実施するステップと、(c)書類の読み取り書面記載情報の全部のデータ取り込み、このデータ中の文字を予め登録した文字と比較して書類種別を識別する処理を実施するステップとを有し、かつ、(a)(b)(c)のいずれかを選択的に設定して実施するステップと、又は(a)(b)(c)を連続的に処理して、(a)(b)(c)のいずれかで書類種別を識別するステップとの制御をコンピュータに実行させる。
【0030】
【発明の実施の形態】
以下、図を参照して、この発明の実施形態について説明するが、構成及び信号処理はこの発明が理解できる程度に概略的に示したものである。
【0031】
また、以下、この発明の好適な構成例について説明するが、各構成及び処理形態などは、単なる好適例である。したがって、この発明は以下の実施形態に限定されず、特許請求の範囲を含む本発明の記載内容に基づく様々な形態に適用可能である。
【0032】
(第1実施形態の構成及び要部の個別動作)
図1は本発明における第1実施形態の書類識別分類方法及び書類識別分類処理システム並びにプログラムにかかる概略の外観構成図である。
【0033】
図1を参照すると、この例は、OCR装置1と、このOCR装置1の制御を実行するための制御装置(例えば、小型汎用コンピュータ及びインターフェース接続装置)2と、書類分別収納装置(ソータ)3と、OCR装置1からの書類を書類分別収納装置3に搬送する搬送装置4とを有している。
【0034】
なお、書類の分類数が多い場合、書類分別収納装置(ソータ)3の設置台数を増加して、以下の動作を並列的に行う。
【0035】
また、OCR装置1から搬送装置4は、この構成に限定されない。例えば、OCR装置1での光学式文字読み取りにおける変換文字データを、確認・修正するための修正用端末などを収容したローカルエリアネットワーク(LAN)構成とすることも出来る。
【0036】
次に上記した要部の個々の動作について説明する。
【0037】
図1を参照すると、OCR装置1は、それぞれ書類の書面記載情報を光学系及び光電変換素子を用い、かつ、副走査及び主走査によって読み取り、このイメージデータをアプリケーションソフトウェアで変換した文字データを出力する。
【0038】
制御装置2は、OCR装置1の読み取りに関する設定制御を実行する。例えば、書類の読み取り精度や、読み取り範囲(例えば、書類の紙面サイズ)などを設定する。
【0039】
書類分別収納装置(ソータ)3は、OCR装置1で読み取った書類を予め定めた分類(レセプト、例えば、医療内容明細書及び請求書、医科、歯科、調剤局、療養施設ごと)に従って区分けして、それぞれを搬送・排出するソータ棚(適宜、ポケットと表記する)に排出する。
【0040】
搬送装置4は、OCR装置1で読み取った書類を書類分別収納装置3へ搬送する。
【0041】
図2は、図1の構成におけるプログラムを実行するための制御系の構成例を示すブロック図である。
【0042】
図2を参照すると、この構成例では、I/F回路31と、MPU32(CPUと、ワーキング用のRAM及びROM)と、入出力(I/O)回路33と、表示装置34と、入力操作装置35と、メモリ36と、補助記憶装置37と、ドライバ38とを有し、この各部が制御、アドレス及びデータの転送用のバスラインに接続されている。
【0043】
この制御系の構成例は、以下のように動作する。
【0044】
I/F回路31がデータ転送処理、及び転送データをMPU32が取り込み可能に処理する。MPU32はCPUと、ワーキング用のRAM及びROMからなる既知の処理を実行する。入出力(I/O)回路33は、ここからの各種の処理データをCRTモニタやLCDモニタである表示装置34に出力し、また、各種の情報入力を行うキーボードやマウスなどで実現される入力操作装置35とのデータをやり取りする。
【0045】
また、I/O回路33には、この図2に示す構成が、図1中の制御装置2がOCR装置1の制御を実行する構成では、次の信号(a)(b)が入出力される。
【0046】
(a) 書類搬送収納部40a(点線表示)を、MPU32の制御(図5の処理の流れ参照)で実行し、OCR装置1で読み取った書類を、予め定めた分類(レセプトの、例えば、医療内容明細書及び請求書、医科、歯科、調剤局、療養施設など)に従って区分けして、それぞれのソータ棚(書類分別収納装置3における、図3に示す分類ポケット41のポッケト41a〜41d…参照)に排出するための制御信号の出力。
(b) OCR装置1で読み取る書類の紙厚を判断するための光学検出器40b(点線表示)からの検出信号(透過光量に対応した光電変換レベルの信号)の取り込み。
【0047】
なお、この光学検出器40bの構成は、ここでの第1及び第2実施形態では、適用されない。以下、詳細な説明は省略する。
【0048】
さらに、図2の構成には、MPU32の処理データなどが、メモリ36や補助記憶装置37で保存され、ドライバ38がCD―ROMなどの情報記録媒体からの記憶情報を取り込む。
【0049】
図3は図1中のOCR装置における書類の読み取り搬送、排出状態を説明するための模式図である。
【0050】
図3を参照すると、書類搬送収納部40aには、ADF装置(図示せず)に載せ置かれた書類Pを排出(収納)するための分類ポケット41が設けられている。
【0051】
この分類ポケット41には、次の(a)(b)のポケットが配置されている。
【0052】
(a)正常に読み取られた書類を予め定めた分類(例えば、上記したレセプトの医療内容明細書及び請求書、医科、歯科、調剤局、療養施設などの分類)に従って搬送・排出(適宜、正常分類搬送・排出と表記する)するポケット41a〜41d…。
【0053】
なお、このポケット41a〜41d…には、書類種別の識別が不能な書類を、この時点で画面表示し、オペレータの分類判断によって、排出・搬送(適宜、強制分類搬送・排出と表記する)される。
【0054】
(b)この他に、「正常分類搬送・排出」及び「強制分類搬送・排出」で処理できない書類(例えば、破損、予定されていない書類の混在など)の排出先ポケットや、必要に応じて書類が重なった重送エラー書類用のポケットも設けられるが、この例では、その図示を省略した。
【0055】
分類ポケット41と書類Pの収納部(図示せず)との間には、書類送り出し用の既知の「爪、ローラ」などが配置され、また、収納部(図示せず)から分類ポケット41の間の搬送路にもローラが配置されている。
【0056】
さらに、分類ポケット41と書類Pの収納部(図示せず)との間には、搬送される書類の紙厚を透過光量で検出する光学検出器40b及び光学読取部43が設けられている。
【0057】
(第1実施形態の全体動作)
図4は、第1実施形態の全体動作を図2に示すMPU構成が実行する際の機能ブロック図であり、図5は第1実施形態の全体動作の処理手順を示すフローチャートである。また、図6は、書類種別の識別不能となった書類の搬送・排出先のポケット指示(強制分類搬送・排出)を説明するための画面表示例を示す図であり、図7は、書類の仕分け処理例を説明するための図である。
【0058】
図1から図7を参照すると、まず、OCR装置1のADF装置(図示せず)に書類(レセプト)の束が載せ置かれる。制御装置2がOCR装置1に書類の書面記載情報の読み取りを指示し、OCR装置1が書類を一枚づつ、その読み取りを開始する(図5中のステップS1)。
【0059】
ここでの、書類における書面記載情報の読み取りは、全面ではなく、例えば、書類の最上部などの連続番号を読み取るものである。連続番号は、医科、歯科、調剤局、療養施設と、その請求書、請求内容書などの区別を示す連続番号である。なお、この連続番号は、数字や英文字にかかわらず、一次元又は二次元表示のバーコードなどでも良い。
【0060】
OCR装置1が、読み取った、書類の書面記載情報(イメージデータ又はOCR装置1で光学文字認識した文字データ)を制御装置2に転送する(ステップS2,S3)。なお、OCR装置1が、ここで読み取ったイメージデータを制御装置2に転送する場合は、制御装置2が文字認識による文字データ変換を行う。この文字認識は、専用ソフトウェア解析エンジンによる既知の光学式文字読み取り変換処理である(ステップS4)。
【0061】
制御装置2は、書類種別の正常な識別(例えば、上記したレセプトの医療内容明細書及び請求書、医科、歯科、調剤局、療養施設などの、個々の識別)がされると(ステップS4:Yes),この書類の分類が、今回の書類種別の識別に基づいて書類分別収納装置3における搬送・排出先のポケット(41a〜41dのいずれか)を図2中のMPU32が決定する。
【0062】
MPU32が図2及び図3に示す書類搬送収納部40aに指示し(ステップS5)、書類分別収納装置3における書類搬送収納部40aにおいて、分類ポケット41の指示されたポケット41a〜41dのいずれかに搬送・排出される(ステップS6)。
【0063】
ステップS4で、書類の種別を識別出来なかった場合(No)、制御装置2にOCR装置1から、ここで読み取ったイメージデータ(又は、光学文字認識した文字データ)が転送される(ステップS7)。
【0064】
この場合、文字認識ができなかった書類の転送をオペレータに知らせる報知音を、例えば、図2に示すMPU構成(発音回路やスピーカなどは図示せず)において吹鳴するのが、オペレータへの注意喚起の点で好ましい。
【0065】
制御装置2では、OCR装置1からの図6に示すイメージデータ(又は、光学文字認識した文字データ)の画面43が表示される(ステップS7)。この場合、画面43では、書類のイメージデータ(又は、光学文字認識した文字データ)45中の書類中の最上部などに上記した連続番号46aが画面表示される。
【0066】
そして、連続番号46aが図示しないデータベースエンジンなどで解析されて、この分類内容46b(医科、歯科、調剤局、療養施設と、その請求書、請求内容書など)が画面表示される。
【0067】
この画面表示から分類内容46bをオペレータが目視によって判読できた場合(ステップS8:Yes),オペレータは画面43に表示されている分類対応内容表48を参照する。
【0068】
ここでの分類対応内容表48には、「分類内容:医科・請求書、ポケット41a/歯科・請求書、ポケット41b…」が例示されている。
【0069】
この分類対応内容表48を参照して、オペレータが今回の書類種別が識別不能となった書類の分類先(搬送・排出先のポケット)を決定し、この指示を画面右下の表示部49を通じて行う。例えば、表示画面のクリックで指示する。
【0070】
この指示で、MPU32が図2及び図3に示す書類搬送収納部40aに指示し(ステップS9)、書類分別収納装置3における書類搬送収納部40aにおいて分類ポケット41の指示されたポケット41aに搬送・排出される(ステップS6)。
【0071】
なお、ステップS8で分類内容が把握できないことが考えられる。これは、OCR装置1で通常の分類ができなかったことから、上記した転送による画面43からオペレータが分類内容を把握できないことが多いと考えられる。
【0072】
そこで、ステップS8でオペレータによる書類種別の識別が分類不能(No)の場合、OCR装置1から書類のイメージデータ(又は、光学文字認識した文字データ)45の全部のデータ47(ステップS7では書類の最上部などの連続番号46aのみ)の転送が、制御装置2からオペレータが指示して行われ、OCR装置1から取り込んだ書類の全部のイメージデータ47(又は、光学文字認識した文字データ)が画面表示される(ステップS10,S11)。
【0073】
オペレータは、特に、最上部などの連続番号46a以外のイメージデータ47から、この書類の分類内容をオペレータが目視して把握する。この把握後は、上記同様にして、オペレータの画面指示(図8「OK」表示参照)し、MPU32が図2及び図3に示す書類搬送収納部40aに指示する(ステップS9)。
【0074】
この指示制御で、今回の読み取り書類が、書類分別収納装置3における書類搬送収納部40aにおいて分類ポケット41中の指示されたポケット41aに搬送・排出される(ステップS6)。
【0075】
このような書類の分類が行われると、図7(a)に示す書類1〜16の読み取り分類A,Bにおいて、書類種別の識別不能が生じた書類4,10,13は、その読み取り分類A,Bにおいて、図7中の(b)(c)のように、それぞれ読み取り順序が異なることなく、書類分別収納装置3のポケットに搬送・排出(仕分け)される。
【0076】
(第1実施形態の利点)
このように、この第1実施形態では、書類の記載内容を光学式文字読取装置で読み取り、その書類種別を識別して分類する際の、読み取り順序が異ならないように出来る。この結果、的確な分類が可能になる。
【0077】
(第2実施形態の構成及び各部の個別動作)
図8は第2実施形態の概略構成を示す外観構成図である。
【0078】
図8を参照すると、この第2実施形態の構成例は、図1の構成(OCR装置1、制御装置2、書類分別収納装置3、搬送装置4)に、サーバ5を追加して設け、これらを伝送路に接続したローカルエリアネットワーク(LAN)構成としてある。
【0079】
次に上記した各部の個々の動作について説明する。
【0080】
図1の構成(OCR装置1から搬送装置4まで)は、第1実施形態と基本的に同様(サーバ5の制御動作に対応した動作のみが異なる)の動作である。
【0081】
サーバ5は、第2実施形態に対応して次の(a)(b)(c)の制御を実行する。
【0082】
(a)読み取り時の文字認識による分類ができない場合(書類種別の識別不能時)、今回の文字認識を行った文字識別用ソフトウェアと異なる文字識別用ソフトウェア(例えば、製作会社が相違)をOCR装置1に転送する。換言すれば、複数種の文字識別用ソフトウェアを搭載し、OCR装置1の制御系と連動して、文字データに変換可能な文字識別用ソフトウェアを適用して、前回の書類種別の識別を可能にする。この説明を、適宜、(a)「他の文字認識ソフトウェアで実行」と表記する。
【0083】
(b)OCR装置1での読み取り書類のイメージが一部、例えば、第1実施形態において、書類の「請求書」「医療機関名」などの際に、その読み取りで識別不能の場合、書類全面の書面記載情報を読み取ったイメージデータを転送するためのプログラムを搭載し、このプログラムをサーバ5に転送する。この説明を、適宜、(b)「全文字データ取り込み」と表記する。
【0084】
(c)OCR装置1での読み取り書類のイメージが一部、例えば、第1実施形態において、書類の「請求書」「医療機関名」などの際に、その読み取りで書類種別の識別不能の場合、書類全面の書面記載情報を読み取ったイメージデータを文字データに変換して転送するためのプログラムを搭載し、このプログラムをサーバ5が転送する。
【0085】
さらに、このプログラムを実行したOCR装置1での文字データをサーバ5が取り込み、文字データ中の「単語」をそれぞれに、予めサーバ5に登録しておいた単語(これは上記したレセプトの医療内容明細書及び請求書、医科、歯科、調剤局、療養施設などに対応する)と整合(マッチング)させて、その書類種別を識別した分類(ポケット41a〜41dの分類)を行う。この説明を、適宜、(c)「単語マッチング」と表記する。
【0086】
(第2実施形態の全体動作)
図9は第2実施形態の全体動作をMPU構成が実行する際の機能ブロック図であり、図10は、第2実施形態の動作における処理手順を示すフローチャートである。
【0087】
図8から図10を参照すると、まず、OCR装置1のADF装置(図示せず)に書類(レセプト)の束が載せ置かれる。制御装置2がOCR装置1に書類の書面記載情報の読み取りを指示し、OCR装置1が書類を一枚づつ、その読み取りを開始する(図10中のステップS21)。
【0088】
ここでの、書類における書面記載情報の読み取りは、全面ではなく、例えば、書類の最上部などの上記した連続番号を読み取るものである。
【0089】
OCR装置1が、読み取った書面記載情報(OCR装置1で光学文字認識した文字データ)を制御装置2に転送する(ステップS22,S23)。OCR装置1が、ここで読み取ったイメージデータを制御装置2に転送する場合は、制御装置2が文字認識による文字データを生成する。文字認識は、ソフトウェア解析エンジンによる既知の光学式文字読み取り変換処理である(ステップS24)。
【0090】
制御装置2は、正常に書類種別が識別されると(ステップS24:Yes),この書類が、今回の書類識別に基づいた分類、すなわち、書類分別収納装置3における搬送・排出先のポケット(41a〜41dのいずれか)が、図2中のMPU32で決定される。MPU32が図2及び図3に示す書類搬送収納部40aに指示し(ステップS25)、書類分別収納装置3における書類搬送収納部40aにおいて、分類ポケット41中の指示されたポケット41a〜41dのいずれかに搬送・排出される(ステップS26)。
【0091】
これまでのステップS21〜S26までは第1実施形態(図5)の処理と同じである。
【0092】
ステップS24で、書類種別を識別が出来なかった場合(No)、制御装置2にOCR装置1から、ここで読み取ったイメージデータ(又は、文字データ)が転送される(ステップS27)。
【0093】
このステップS27での選択的な振り分けは、例えば、予め図2の表示装置34及び入力操作装置35を通じて設定した(a)「他の文字認識ソフトウェアで実行」、(b)「全文字データ取り込み」、(c)「単語マッチング」中のいずれかを実行するものである(本発明における「選択的な設定」に対応する)。
【0094】
(a)「他の文字認識ソフトウェアで実行」は、読み取り時の書類種別の識別による分類ができない場合(ステップS24:No),今回の文字認識による書類種別の識別を行った文字識別用ソフトウェアと異なる文字識別用ソフトウェア(例えば、製作会社が相違)をOCR装置1に転送する(ステップS28)。換言すれば、複数種の文字識別用ソフトウェアを搭載し、OCR装置1の制御系と連動して、文字データに変換可能な文字識別用ソフトウェアを適用して、前回の書類種別の識別不能を、その識別が可能となるようにする(ステップS29)。
【0095】
(b)「全文字データ取り込み」は、OCR装置1での読み取り書類のイメージが一部、例えば、第1実施形態において、書類の「請求書」「医療機関名」などの際に、その読み取りで書類種別が識別不能の場合、書類全面の書面記載情報を読み取ったイメージデータを転送するためのプログラムを搭載し、このプログラムをサーバ5に転送する(ステップS30)。このプログラムで前回の書類種別の識別を出来るようにする(ステップS31)。
【0096】
(c)「単語マッチング」は、OCR装置1での読み取り書類のイメージが一部、例えば、第1実施形態において、書類の「請求書」「医療機関名」などの際に、その読み取りで書類種別の識別が不能の場合、書類全面の書面記載情報を読み取ったイメージデータを文字データに変換して転送するためのプログラムを搭載し、このプログラムをサーバ5が転送する。さらに、このプログラムを実行したOCR装置1での文字データをサーバ5が取り込む(ステップS32)。
【0097】
文字データ中の「単語」をそれぞれ、予めサーバ5に登録しておいた単語(これは上記したレセプトの医療内容明細書及び請求書、医科、歯科、調剤局、療養施設などに対応する)と整合(マッチング)させて書類種別の識別を行い、その分類(ポケット41a〜41dの分類)を行う(ステップS33)。このマッチングで前回の書類種別の識別不能を、その識別が可能となるようにする(ステップS34)。
【0098】
これらの、いずれかの処理で書類種別の識別が可能となった場合は、上記したように、MPU32が図2及び図3に示す書類搬送収納部40aに指示し(ステップS25)、書類分別収納装置3における書類搬送収納部40aにおいて分類ポケット41の指示されたポケット41a〜41dのいずれかに書類が搬送・排出される(ステップS26)。
【0099】
図11は、第2実施形態の動作における他の処理手順を示すフローチャートである。
【0100】
図11を参照すると、上記した図10の処理手順では、(a)「他の文字認識ソフトウェアで実行」から(c)「単語マッチング」までのいずれかを「選択的な設定」で実行している。
【0101】
これに対して、この第2実施形態では、(a)「他の文字認識ソフトウェアで実行」から(c)「単語マッチング」までを「書類種別が識別できるまで実行」している(本発明における連続的に処理に対応する)。
【0102】
このため、図10と同様にステップS24で、書類種別が識別不能(No)の場合は、まず、(a)「他の文字認識ソフトウェアで実行」を処理する(ステップS41,S42)。
【0103】
ここで書類種別が識別不能の場合は、自動的に(b)「全文字データ取り込み」を処理する(ステップS43,S44)。さらに、ここで書類種別が識別不能の場合は、自動的に(c)「単語マッチング」を処理する(ステップS45,S46,S47)。このように、連続的に処理して、いずれかの処理で、書類種別を識別できるようにする。
【0104】
なお、最後のステップS47で処理不能の場合は、処理開始にリターンし、又は1回の処理が終了する。
【0105】
また、いずれかの処理、又は最後までの処理で、書類種別が認識できた場合は、上記した図10の処理例と同様に、MPU32が図2及び図3に示す書類搬送収納部40aに指示し(ステップS25)、書類分別収納装置3における書類搬送収納部40aにおいて分類ポケット41中の指示されたポケット41a〜41dへ書類が搬送・排出される(ステップS26)。
【0106】
(第2実施形態の利点)
このように、この第2実施形態では、第1実施形態と同様に、読み取りのために載せ置いた書類の読み取り順序と、分類の搬送・排出順序が一致するようになる。この際、書類種別の識別が不能となった書類の記載事項を再度、自動的に読み取る処理を実施(「(a)他の文字認識ソフトウェアで実行」から「(c)単語マッチング」まで)している。
【0107】
換言すれば、第1実施形態のように、書類種別を識別不能時点での、画面表示及びオペレータの分類判断による人為的な指示操作を不要にしている。結果的に的確かつ、より効率的な分類が可能になる。
【0108】
(変形例)
以下、図1及び図8の構成の変形例について説明する。
【0109】
以下の、変形例1〜3でも第1及び第2実施形態と同様の、読み取りのために載せ置いた書類の読み取り順序と、分類の搬送・排出順序を一致させる処理の実施が可能である。
【0110】
図12は変形例1の構成例を示す通信ネットワーク図である。
【0111】
図12を参照すれば、この変形例1は、修正部1Aaと読取部1Baとを分離して配置したものである。例えば、修正部1Aaと読取部1Baとを同一ビル内の別階にそれぞれ設置する。
【0112】
このため、修正部1Aaには、例えば、100BASE 規格LAN伝送(IEEE802)のためのスイッチ52が設けられ、さらに、読取部1Baにもスイッチ50が設けられている。このスイッチ50,52の間が100BASE 規格LAN伝送路51で接続されている。
【0113】
また、この例の修正部1Aaには、修正W/S3a,3b…とともに、ここでの業務管理用のプリンタ53、管理W/S54及び磁気テープ(MT)装置55が設けられている。なお、これらは、特に、設けなくとも本発明は実施できるものである。
【0114】
この変形例1では、例えば、集線装置(ハブ)に接続された他のLAN上のサーバによるプロシージャ(例えば、RPC:Remote Procedure Call)によって、第1実施形態と同様の処理が実行される。
【0115】
この変形例1では、修正部1Aaと読取部1Baとを分離(例えば、同一ビルの別階)して配置できる利点がある。この他の動作上の利点は、第1及び第2実施形態と同じである。
【0116】
図13は変形例2の構成を示す通信ネットワーク図である。
【0117】
図13を参照すれば、この変形例2では、修正部1Abと読取部1Bbとを遠隔地に分離している。ルータ60、通信回線網61、ルータ62を通じて第1実施形態と同様の処理が実行される。
【0118】
この変形例2では、修正部1Abと読取部1Bbとを遠隔地に分離(例えば、地方と都市部)して配置できる利点がある。この他の、動作上の利点は変形例1と同じである。
【0119】
図14は変形例3の構成例を示す通信ネットワーク図である。
【0120】
図14を参照すれば、この変形例3では、図1に示す構成に、ホスト装置70やサーバ71を通じて光ジュークボックス72が接続され、大容量の読み取り書類データが管理される。さらに、ルータ73が設けられている。例えば、市町村レセプト処理システム76, 77…に通信回線網75を通じて接続されている。市町村レセプト処理システム76,77…は、それぞれルータ80、サーバ81、処理端末82,84及び小型のOCR装置83などを備えた構成である。
【0121】
【発明の効果】
以上の説明で明らかなように、本発明の書類識別分類方法及び書類識別分類処理システム並びにプログラムによれば、書類の記載内容を光学式文字読取装置で読み取り、その書類種別を識別して分類する際の、読み取り順序が異ならないようにでき、結果的に的確かつ確実な書類種別の識別による分類が可能になるという効果を奏する。
【図面の簡単な説明】
【図1】本発明における第1実施形態の書類識別分類方法及び書類識別分類処理システム並びにプログラムにかかる概略を示す外観構成図である。
【図2】図1の構成におけるプログラムを実行するための制御系の構成例を示すブロック図である。
【図3】図1中のOCR装置における書類の読み取り状態を説明するための模式図である。
【図4】第1実施形態の全体動作をMPU構成が実行する際の機能ブロック図である。
【図5】第1実施形態の全体動作の処理手順を示すフローチャートである。
【図6】第1実施形態にあって書類の搬送・排出先のポケット指示を説明するための図である。
【図7】第1実施形態にあって書類の仕分け処理例を説明するための図である。
【図8】第2実施形態の概略構成を示す外観構成図である。
【図9】第2実施形態の全体動作をMPU構成が実行する際の機能ブロック図である。
【図10】第2実施形態の動作における処理手順を示すフローチャートである。
【図11】第2実施形態の動作における他の処理手順を示すフローチャートである。
【図12】第1及び第2実施形態における変形例の構成例を示す通信ネットワーク図である。
【図13】実施形態における他の変形例の構成例を示す通信ネットワーク図である。
【図14】実施形態におけるさらに他の変形例の構成例を示す通信ネットワーク図である。
【図15】従来例における書類の搬送・排出先のポケット指示を説明するための図である。
【符号の説明】
1…OCR装置
2…制御装置
3…書類分別収納装置(ソータ)
4…搬送装置
32…MPU
33…入出力(I/O)回路
34…表示装置
35…入力操作装置
40…書類搬送収納部
40a…書類搬送収納部
41…分類ポケット
41a〜41d…ポケット
43…光学読取部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention describes, for example, the contents of documents such as medical specifications and invoices (appropriately referred to as “recept”) as an optical character reader (OCR: Optical Character Reader, here appropriately referred to as “OCR device”). ) To identify the type of the document from the written information of the document (also referred to as analysis as appropriate), and a document identification and classification method, a document identification and classification processing system, and a program for classifying the storage unit of the transport / discharge destination. About.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, the following examples are known as examples in which the content of description of various documents (hereinafter, also referred to as document description information) is read by an OCR device and the type of the document is identified and classified.
[0003]
FIG. 15 is a diagram for explaining an example of identifying and classifying a document type in a conventional OCR device.
(A) The document is placed on an automatic feeder of the OCR device (referred to as "ADF device" as appropriate), and automatic reading of the written information is started (FIG. 15 (1)).
(B) The read document description information is read from the read document description information in order to identify the type of the document in units of one document, for example, in a server on a local area network (LAN). Is found out (FIG. 15 (1)).
(C) Next, for example, the type of the document is identified by comparing it with character data registered in advance (for example, characters of “invoice” and “invoice”) (FIG. 15 (2) ).
(D) Based on the identification of the type of the document, the document is sorted and transported and stored for each document in a storage device (denoted as a pocket as appropriate) outside the OCR device (FIG. 15 (3) pocket A, ( 4) Pocket B, (5) Pocket C / Reject pocket).
(E) If data for identifying the type of document cannot be found, the data is automatically transported and stored in a non-identifiable storage device outside the OCR device (FIG. 15 (5) pocket C / reject pocket).
(F) Documents stored in the indistinguishable storage device (pocket C / reject pocket) are manually classified and classified into one of pockets A and B, and stored in the storage device (pockets A and B). ), It is inserted and arranged at the end of the bundle of documents stored earlier.
[0004]
As described above, conventionally, the types of documents are identified and classified manually and manually.
[0005]
[Patent Document 1]
Japanese Patent Application Laid-Open No. 8-272883, "Form processing method and system" (Claim)
[0006]
[Problems to be solved by the invention]
However, in the above-described conventional example, the classification of a document whose type cannot be identified is manually confirmed, and the document is inserted and arranged at the end of the previously stored document bundle. That is, the type of document in the OCR device and the order of classification by manual classification are mixed. There has been a problem that the reading order of the documents in the OCR device and the order of the documents stored in the storage device (for example, a month order or a date order) change, and the reading continuation is different.
[0007]
The present invention has been made in view of the above circumstances, it is possible to read the written content of the document with an optical character reading device, to identify the type of the document, when sorting, so that the reading order is not different, As a result, an object of the present invention is to provide a document identification / classification method, a document identification / classification processing system, and a program, which enable accurate and efficient identification and classification of documents.
[0008]
[Means for Solving the Problems]
The document identification and classification method of the present invention that achieves the above object uses an optical character reader, sequentially reads the written information of the document, identifies the document type, and conveys and discharges the classified document to a predetermined storage unit. The process of automatically sending out documents in sequence and the process of optically reading the written information of the documents to be sent out, identifying the document type, and storing the documents to be transported and discharged according to the predetermined classification. In the step of deciding a copy and in determining the storage section of the transport / discharge destination of the document, the document description information of the document whose document type cannot be identified is displayed on a screen, and based on the identification of the document type from this screen information. The method includes a step of instructing a storage unit to transport and discharge the classified documents, and a step of transporting and discharging the currently read document to the determined storage unit or the specified storage unit.
[0009]
According to the document identification and classification method of the present invention, the contents of the document are read by an optical character reader, and the data of the document that cannot be identified when the type of the document is identified and classified (image data or optical character recognition). The character data) is displayed on the screen when the identification (analysis) is impossible, and the document is discharged and conveyed to the sorting destination pocket by an instruction operation based on the sorting judgment of the operator. That is, the reading order of the documents is not changed.
[0010]
In this way, the reading order of the documents placed for reading and the order of transport and discharge of the classifications match, and as a result, accurate and efficient identification and classification of the documents becomes possible.
[0011]
The document identification and classification method of the present invention that achieves the above object uses an optical character reader, sequentially reads the written information of the document, identifies the document type, and conveys and discharges the classified document to a predetermined storage unit. The process of automatically sending out the documents sequentially, and the optically reading the written information of the documents to be sent out sequentially to identify the type of the document, and the destination of the document to be transported and discharged according to the predetermined classification. A step of deciding the storage unit, a step of automatically re-reading the description items of the unidentifiable document of the document type when the document type cannot be identified by the determination, and a step of automatically re-executing Automatically instructing the storage unit of the transport / discharge destination of the documents classified based on the identification of the document type by the appropriate reading process, and transporting / reading the currently read document to the determined storage unit or the specified storage unit. Exhaustion Characterized by a step of.
[0012]
According to the document identification / classification method of the present invention, the content of a document is read by an optical character reader, and when the document is identified and classified, the information items of the unidentifiable document are automatically read again. Has been implemented.
[0013]
For example, when the type of a document cannot be identified, it is displayed on the screen, and the operator does not discharge or convey the document to the sorting destination pocket by the instruction operation based on the classification determination (identification determination). The reading order is the same as the transport / discharge order of the classification. In other words, as a result, accurate and more efficient classification by identification of document types becomes possible.
[0014]
The document identification and classification processing system of the present invention that achieves the above object sequentially reads the written information of the document, identifies the document type, and transports and discharges the classified document to a predetermined storage destination. The automatic sending means for automatically sending out the document automatically, and the document description information of the document sent out by the automatic sending means is optically read in order to identify the type of the document, and the storing / receiving section of the document transfer / discharge destination corresponding to the predetermined classification is provided. The reading identification / classification means to be determined, the display means for displaying on the screen the written information whose document type cannot be identified by the reading identification / classification means, and the transport of the document by the classification in which the document type is identified based on the written information on the display means. Instruction means for instructing the storage unit to be discharged, and conveyance for discharging / discharging the currently read document to the storage unit determined by the read identification and classification means or the storage unit designated by the instruction means. Characterized in that it comprises left and means.
[0015]
The document identification and classification processing system of the present invention that achieves the above object sequentially reads the written information of the document, identifies the document type, and transports and discharges the classified document to a predetermined storage destination. An automatic sending means for automatically sending out the document sequentially, and a storage unit for a document carrying / discharging destination corresponding to a predetermined classification by identifying the document type by optically reading the document description information of the document sent out by the automatic sending means. And automatically performs the process of automatically reading the items described in the document whose document type has become indistinguishable by the read identification and classification means, and determines the transport / discharge destination based on the classification based on this process. Instruction means for automatically instructing the storage unit, and transport / discharge means for transporting / discharging the currently read document to the storage unit determined by the read identification / classification means or the storage unit designated by the instruction means. Characterized in that it comprises.
[0016]
In the document identification / classification processing system according to the present invention, similarly to the above-described document identification / classification method, the reading order can be prevented from being different, and as a result, accurate and efficient classification by document identification becomes possible. .
[0017]
In order to achieve the above object, the program according to the present invention includes a step of automatically sending out a document sequentially, a step of sequentially reading optically the written information of the document to be sent, identifying a document type, and transporting a document corresponding to a predetermined classification. A step of determining a storage section to be discharged;
When deciding the storage section to which the document is transported and discharged, the document description information of the document whose document type is unidentifiable is displayed on the screen, and the document type is identified based on this screen information, and the classified document is transported and discharged. This causes the computer to execute the control of the step of instructing the storage unit to be executed and the step of transporting and discharging the currently read document to the determined storage unit or the specified storage unit.
[0018]
Further, the program of the present invention includes a step of automatically sending out a document sequentially, a step of sequentially reading optically the written information of the document to be sent, identifying the type of the document, and carrying the document in accordance with a predetermined classification. A step of deciding a storage section of a discharge destination, and, if the document type is unidentifiable by the determination, a step of automatically re-reading the items described in the document whose document type is unidentifiable; and Automatically instructing the storage unit of the transport / discharge destination of the classified and identified document type based on the automatic reading process performed, and reading the storage unit to the determined storage unit or the specified storage unit this time. The control of the steps of transporting and discharging the document is performed by a computer.
[0019]
According to the program of the present invention, the present invention can be provided through download / installation from an information recording medium (eg, package software) or a communication network. Therefore, the present invention can be easily implemented by microcomputers mounted on various devices, and the versatility is improved.
[0020]
The following is a preferred embodiment of the technical concept of the document identification and classification method of the present invention.
[0021]
The screen display is a part or all of the read written information.
[0022]
Further, as a process of automatically reading the items described in the document of the above-mentioned document type that cannot be identified again, a process by a plurality of character recognition software is performed.
[0023]
Further, as a process of automatically reading the items described in the document whose document type is unidentifiable again, a process of retrieving all data of the written document reading information and identifying the document type is performed.
[0024]
In addition, as a process for automatically reading the items of the document whose document type is indistinguishable again, all the data of the written document reading information is taken in, the characters in this data are compared with the characters registered in advance, and the document is compared. Perform the process of identifying the type.
[0025]
The following is a preferred embodiment of the technical concept of the document identification and classification processing system of the present invention.
[0026]
As a process for automatically re-reading the description items of a document whose document type cannot be identified, (a) a process using a plurality of character recognition software is performed, and (b) all data of the read document written information is taken in. And (c) taking in all the data of the written and written information of the document, comparing the characters in the data with the characters registered in advance, and performing the process of identifying the document type. Further, there is provided means for selectively setting any one of (a), (b), and (c) for execution.
[0027]
In addition, as a process for automatically reading the items described in the document whose document type is unidentifiable again, (a) a process using a plurality of character recognition software is performed, and (b) all data of the read document written information is read. (C) Importing all data of the written and written information of the document, and comparing the characters in the data with the characters registered in advance to identify the document type. And a means for continuously processing (a), (b) and (c) to identify a document type in any of (a), (b) and (c).
[0028]
The following is a preferred embodiment of the technical concept of the program of the present invention.
[0029]
(A) performing a process using a plurality of character recognition software as a process for automatically re-reading the description items of a document whose document type is indistinguishable; (C) taking in all the data of the written and written information of the document and comparing the characters in the data with the characters registered in advance to identify the document type; And (a), (b), and (c) are selectively set and executed, or (a), (b), and (c) are continuously performed. Processing is performed to cause the computer to execute a control of identifying a document type in any one of (a), (b), and (c).
[0030]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings, but the configuration and signal processing are schematically shown to the extent that the present invention can be understood.
[0031]
Hereinafter, a preferred configuration example of the present invention will be described. However, each configuration and processing mode are merely preferred examples. Therefore, the present invention is not limited to the following embodiments, but is applicable to various forms based on the description of the present invention including the claims.
[0032]
(Configuration of First Embodiment and Individual Operation of Main Part)
FIG. 1 is a schematic external configuration diagram of a document identification and classification method, a document identification and classification processing system, and a program according to a first embodiment of the present invention.
[0033]
Referring to FIG. 1, this example shows an OCR device 1, a control device (for example, a small general-purpose computer and an interface connection device) 2 for executing control of the OCR device 1, and a document sorting / storing device (sorter) 3. And a transport device 4 for transporting the document from the OCR device 1 to the document sorting and storage device 3.
[0034]
When the number of classified documents is large, the number of installed document sorting / storing apparatuses (sorters) 3 is increased, and the following operations are performed in parallel.
[0035]
Further, the OCR device 1 to the transport device 4 are not limited to this configuration. For example, a local area network (LAN) accommodating a correction terminal or the like for confirming and correcting converted character data in the optical character reading in the OCR device 1 can be used.
[0036]
Next, individual operations of the above-described main parts will be described.
[0037]
Referring to FIG. 1, an OCR apparatus 1 reads written information of a document by using an optical system and a photoelectric conversion element by sub-scanning and main scanning, and outputs character data obtained by converting the image data by application software. I do.
[0038]
The control device 2 executes setting control regarding reading of the OCR device 1. For example, the reading accuracy of the document, the reading range (for example, the paper size of the document) and the like are set.
[0039]
The document sorting / storing device (sorter) 3 sorts documents read by the OCR device 1 according to a predetermined classification (for example, a medical statement and a bill, a medical department, a dentistry, a dispensing bureau, and a medical facility). Are discharged to a sorter shelf (which is appropriately described as a pocket) for transport and discharge.
[0040]
The transport device 4 transports the document read by the OCR device 1 to the document separation and storage device 3.
[0041]
FIG. 2 is a block diagram showing a configuration example of a control system for executing a program in the configuration of FIG.
[0042]
Referring to FIG. 2, in this configuration example, an I / F circuit 31, an MPU 32 (CPU, working RAM and ROM), an input / output (I / O) circuit 33, a display device 34, an input operation It has a device 35, a memory 36, an auxiliary storage device 37, and a driver 38, each of which is connected to a bus line for control, address and data transfer.
[0043]
The configuration example of this control system operates as follows.
[0044]
The I / F circuit 31 performs a data transfer process, and processes the transfer data so that the MPU 32 can capture the data. The MPU 32 executes a known process including a CPU, a working RAM and a ROM. The input / output (I / O) circuit 33 outputs various kinds of processing data from the input / output (I / O) circuit 33 to a display device 34 which is a CRT monitor or an LCD monitor. Data is exchanged with the operation device 35.
[0045]
In the configuration shown in FIG. 2 and the configuration in which the control device 2 in FIG. 1 executes control of the OCR device 1, the following signals (a) and (b) are input and output to the I / O circuit 33. You.
[0046]
(A) The document transport / storage unit 40a (indicated by a dotted line) is executed under the control of the MPU 32 (see the processing flow of FIG. 5), and the document read by the OCR device 1 is classified in a predetermined classification (for example, medical Each sorter shelf (see the pockets 41a to 41d of the classification pocket 41 shown in FIG. 3 in the document sorting and storing apparatus 3) is divided according to the contents specification and bill, medical department, dentistry, dispensing bureau, medical facilities, etc.). Output of control signal for discharging to.
(B) Capture of a detection signal (a signal of a photoelectric conversion level corresponding to the amount of transmitted light) from an optical detector 40b (indicated by a dotted line) for determining the thickness of a document to be read by the OCR device 1.
[0047]
The configuration of the optical detector 40b is not applied in the first and second embodiments. Hereinafter, detailed description is omitted.
[0048]
Further, in the configuration of FIG. 2, the processing data of the MPU 32 and the like are stored in the memory 36 and the auxiliary storage device 37, and the driver 38 takes in the storage information from an information recording medium such as a CD-ROM.
[0049]
FIG. 3 is a schematic diagram for explaining the reading, conveying, and discharging states of a document in the OCR apparatus in FIG.
[0050]
Referring to FIG. 3, a classification pocket 41 for discharging (storing) a document P placed on an ADF device (not shown) is provided in the document transport storage unit 40a.
[0051]
In the classification pocket 41, the following pockets (a) and (b) are arranged.
[0052]
(A) Transport / discharge of a normally read document in accordance with a predetermined classification (for example, classification of the medical description and bill of the above-mentioned claim, medical department, dentistry, dispensing bureau, medical facilities, etc.) Pockets 41a to 41d...
[0053]
In the pockets 41a to 41d, documents whose document types cannot be identified are displayed on the screen at this time, and discharged / transported (denoted as compulsory classified transport / discharge as appropriate) according to the classification judgment of the operator. You.
[0054]
(B) In addition to this, a discharge pocket for documents that cannot be processed by “normal classification transport / discharge” and “compulsory classification transport / discharge” (for example, damaged, unplanned mixture of documents, etc.), and if necessary, Although a pocket for a double feed error document in which documents are overlapped is also provided, it is not shown in this example.
[0055]
A known “claw, roller” or the like for sending out a document is disposed between the sorting pocket 41 and a storage portion (not shown) of the document P. Rollers are also arranged in the transport path between them.
[0056]
Further, an optical detector 40b and an optical reading unit 43 for detecting the thickness of the conveyed document by the amount of transmitted light are provided between the classification pocket 41 and a storage unit (not shown) for the document P.
[0057]
(Overall operation of the first embodiment)
FIG. 4 is a functional block diagram when the whole operation of the first embodiment is executed by the MPU configuration shown in FIG. 2, and FIG. 5 is a flowchart showing a processing procedure of the whole operation of the first embodiment. FIG. 6 is a diagram showing an example of a screen display for explaining a pocket instruction (forced classification transport / discharge) of a transport / discharge destination of a document whose document type cannot be identified. FIG. It is a figure for explaining an example of a sorting process.
[0058]
Referring to FIGS. 1 to 7, first, a bundle of documents (recept) is placed on an ADF device (not shown) of the OCR device 1. The control device 2 instructs the OCR device 1 to read the written information of the document, and the OCR device 1 starts reading the documents one by one (step S1 in FIG. 5).
[0059]
Here, the reading of the written information in the document is to read not the entire surface but, for example, a serial number such as the top of the document. The serial number is a serial number indicating a medical department, a dentistry, a dispensing bureau, a medical care facility, and a bill, a bill, etc. The serial number may be a one-dimensional or two-dimensional bar code or the like irrespective of numbers or English characters.
[0060]
The OCR device 1 transfers the written information of the document (image data or character data optically recognized by the OCR device 1) to the control device 2 (steps S2 and S3). When the OCR device 1 transfers the image data read here to the control device 2, the control device 2 performs character data conversion by character recognition. This character recognition is a known optical character reading conversion process by a dedicated software analysis engine (step S4).
[0061]
When the control device 2 performs normal identification of the document type (for example, individual identification of the medical description and bill of the above-mentioned claim, medical department, dentistry, dispensing bureau, medical facility, etc.) (step S4: Yes), the MPU 32 in FIG. 2 determines the transport destination / discharge destination pocket (one of 41a to 41d) in the document sorting and storing apparatus 3 based on the classification of the document this time.
[0062]
The MPU 32 instructs the document transport storage unit 40a shown in FIGS. 2 and 3 (step S5), and in the document transport storage unit 40a of the document sorting and storage device 3, the classified pocket 41 is placed in one of the designated pockets 41a to 41d. It is conveyed and discharged (step S6).
[0063]
If the type of document cannot be identified in step S4 (No), the image data read here (or the character data with optical character recognition) is transferred from the OCR device 1 to the control device 2 (step S7). .
[0064]
In this case, a notification sound for notifying the operator of the transfer of a document for which character recognition could not be performed is sounded, for example, in the MPU configuration (sounding circuit and speaker are not shown) shown in FIG. It is preferred in terms of.
[0065]
The control device 2 displays a screen 43 of the image data (or the character data obtained by optical character recognition) shown in FIG. 6 from the OCR device 1 (step S7). In this case, on the screen 43, the above-described serial number 46a is displayed on the top of the image in the image data (or the character data of which the optical character has been recognized) 45 of the document.
[0066]
Then, the serial number 46a is analyzed by a database engine (not shown) or the like, and the classification contents 46b (medical departments, dentistry, dispensing bureaus, medical facilities, bills, bills, etc.) are displayed on the screen.
[0067]
When the operator can visually read the classification contents 46b from this screen display (step S8: Yes), the operator refers to the classification correspondence contents table 48 displayed on the screen 43.
[0068]
The classification correspondence table 48 exemplifies “classification contents: medical / invoice, pocket 41a / dentist / invoice, pocket 41b...”.
[0069]
Referring to the classification correspondence table 48, the operator determines the classification destination (conveyance / discharge destination pocket) of the document whose document type cannot be identified this time, and sends this instruction through the display unit 49 at the lower right of the screen. Do. For example, the instruction is given by clicking on the display screen.
[0070]
With this instruction, the MPU 32 instructs the document transport / storage section 40a shown in FIGS. 2 and 3 (step S9), and transports the document to the designated pocket 41a of the classification pocket 41 in the document transport / storage section 40a of the document sorting / receiving apparatus 3. It is discharged (step S6).
[0071]
It is possible that the classification contents cannot be grasped in step S8. It is considered that this is because the OCR device 1 was unable to perform normal classification, and thus the operator often could not grasp the classification contents from the screen 43 obtained by the above transfer.
[0072]
Therefore, if the identification of the document type by the operator cannot be classified (No) in step S8, all the data 47 of the image data (or the character data recognized by the optical character) 45 of the document from the OCR device 1 (in step S7, the document The transfer of only the serial number 46a at the top or the like is performed under the instruction of the operator from the control device 2, and the entire image data 47 (or the character data of which the optical character is recognized) of the document taken in from the OCR device 1 is displayed on the screen. It is displayed (steps S10, S11).
[0073]
In particular, the operator visually recognizes the contents of the classification of the document from the image data 47 other than the serial number 46a such as the uppermost part. After this determination, the operator gives a screen instruction (see "OK" display in FIG. 8) in the same manner as described above, and the MPU 32 instructs the document transport storage section 40a shown in FIGS. 2 and 3 (step S9).
[0074]
With this instruction control, the current read document is transported and discharged to the designated pocket 41a in the classification pocket 41 in the document transport storage unit 40a of the document sorting and storing apparatus 3 (step S6).
[0075]
When such document classification is performed, documents 4, 10, and 13 in which the document type cannot be identified in the read classifications A and B of documents 1 to 16 shown in FIG. , B, they are conveyed / discharged (sorted) to the pockets of the document sorting / storing device 3 without different reading orders as shown in (b) and (c) of FIG.
[0076]
(Advantages of the first embodiment)
As described above, in the first embodiment, the reading order when reading the written contents of the document with the optical character reader and identifying and classifying the document type can be prevented from being different. As a result, accurate classification becomes possible.
[0077]
(Configuration of Second Embodiment and Individual Operation of Each Unit)
FIG. 8 is an external configuration diagram showing a schematic configuration of the second embodiment.
[0078]
Referring to FIG. 8, the configuration example of the second embodiment is configured such that a server 5 is additionally provided in the configuration of FIG. 1 (OCR device 1, control device 2, document sorting and storage device 3, transport device 4). Are connected to a transmission path in a local area network (LAN) configuration.
[0079]
Next, individual operations of the above-described units will be described.
[0080]
The configuration in FIG. 1 (from the OCR device 1 to the transport device 4) is basically the same as that of the first embodiment (only the operation corresponding to the control operation of the server 5 is different).
[0081]
The server 5 executes the following controls (a), (b), and (c) according to the second embodiment.
[0082]
(A) When classification by character recognition at the time of reading cannot be performed (when the type of document cannot be identified), character recognition software different from the character recognition software that has performed the current character recognition (for example, the manufacturing company is different) is used in the OCR apparatus. Transfer to 1. In other words, a plurality of types of character identification software are installed, and in cooperation with the control system of the OCR device 1, character identification software that can be converted into character data is applied to enable identification of the previous document type. I do. This description is appropriately described as (a) “executed by other character recognition software”.
[0083]
(B) If the image of the document read by the OCR device 1 is partly, for example, in the first embodiment, when the document cannot be identified by reading the document such as “invoice” or “medical institution name”, the entire document is read. And a program for transferring image data obtained by reading the written information of the document. This description will be appropriately described as (b) “Importing all character data”.
[0084]
(C) When the image of the document read by the OCR device 1 is partially, for example, in the first embodiment, when the document is "invoice" or "medical institution name", the document type cannot be identified by reading the document. A program for converting the image data obtained by reading the written information on the entire surface of the document into character data and transferring the character data is installed, and the server 5 transfers the program.
[0085]
Further, the server 5 captures the character data in the OCR device 1 that has executed this program, and each word in the character data is registered in the server 5 in advance (this is the medical content of the above-described receipt). (Corresponding to the specification and the bill, the medical department, the dentistry, the dispensing bureau, the medical facilities, etc.), and the classification (the classification of the pockets 41a to 41d) for identifying the document type is performed. This description is appropriately described as (c) “word matching”.
[0086]
(Overall operation of the second embodiment)
FIG. 9 is a functional block diagram when the overall operation of the second embodiment is executed by the MPU configuration, and FIG. 10 is a flowchart showing a processing procedure in the operation of the second embodiment.
[0087]
8 to 10, first, a bundle of documents (recept) is placed on an ADF device (not shown) of the OCR device 1. The control device 2 instructs the OCR device 1 to read the written information of the document, and the OCR device 1 starts reading the documents one by one (step S21 in FIG. 10).
[0088]
Here, the reading of the written information on the document is not for reading the entire surface, but for reading the above-mentioned serial number, for example, at the top of the document.
[0089]
The OCR device 1 transfers the read document description information (character data optically recognized by the OCR device 1) to the control device 2 (steps S22 and S23). When the OCR device 1 transfers the image data read here to the control device 2, the control device 2 generates character data by character recognition. Character recognition is a known optical character reading conversion process by a software analysis engine (step S24).
[0090]
If the document type is normally identified (step S24: Yes), the control device 2 classifies the document based on the current document identification, that is, the transport / discharge destination pocket (41a) in the document sorting and storing device 3. To 41d) is determined by the MPU 32 in FIG. The MPU 32 instructs the document transport storage section 40a shown in FIGS. 2 and 3 (step S25), and any one of the designated pockets 41a to 41d in the classification pocket 41 in the document transport storage section 40a of the document sorting and storage apparatus 3. (Step S26).
[0091]
Steps S21 to S26 so far are the same as the processing of the first embodiment (FIG. 5).
[0092]
If the document type cannot be identified in step S24 (No), the image data (or character data) read here is transferred from the OCR device 1 to the control device 2 (step S27).
[0093]
The selective sorting in step S27 is performed, for example, by (a) “executing with other character recognition software” and (b) “capturing all character data” set in advance through the display device 34 and the input operation device 35 in FIG. , (C) executes any one of “word matching” (corresponding to “selective setting” in the present invention).
[0094]
(A) If “execute by other character recognition software” cannot be classified by the identification of the document type at the time of reading (step S24: No), the character identification software that has identified the document type by the current character recognition Transfer different character identification software (for example, different production company) to the OCR device 1 (step S28). In other words, a plurality of types of character identification software are installed, and in cooperation with the control system of the OCR device 1, character identification software that can be converted into character data is applied to determine the previous document type inability to be identified. The identification is made possible (step S29).
[0095]
(B) “Import all character data” means that a part of the image of the document read by the OCR device 1 is read, for example, in the first embodiment when the document is “billed” or “medical institution name”. If the document type is not identifiable, a program for transferring image data obtained by reading the written description information of the entire document is installed, and this program is transferred to the server 5 (step S30). With this program, the previous document type can be identified (step S31).
[0096]
(C) "Word matching" means that a part of the image of the document read by the OCR device 1, for example, in the first embodiment, when the document "billing" or "medical institution name" is read, the document is read. If the type cannot be identified, a program for converting the image data obtained by reading the written information on the entire surface of the document into character data and transferring the character data is installed, and the server 5 transfers the program. Further, the server 5 fetches the character data in the OCR device 1 that has executed the program (step S32).
[0097]
"Words" in the character data are words registered in advance in the server 5 (this corresponds to the medical description and bill of the above-mentioned claim, medical department, dentistry, dispensing bureau, medical facilities, etc.) and The document type is identified by matching, and the classification (classification of the pockets 41a to 41d) is performed (step S33). This matching makes it possible to identify the previous document type that cannot be identified (step S34).
[0098]
If the document type can be identified by any of these processes, as described above, the MPU 32 instructs the document transport / storage unit 40a shown in FIGS. 2 and 3 (step S25), and separates and stores the document. The document is transported / discharged to one of the designated pockets 41a to 41d of the classification pocket 41 in the document transport storage section 40a of the apparatus 3 (step S26).
[0099]
FIG. 11 is a flowchart illustrating another processing procedure in the operation of the second embodiment.
[0100]
Referring to FIG. 11, in the processing procedure of FIG. 10 described above, one of (a) “execute by other character recognition software” to (c) “word matching” is executed by “selective setting”. I have.
[0101]
On the other hand, in the second embodiment, (a) “execute with other character recognition software” to (c) “word matching” are “executed until the document type can be identified” (the present invention). Corresponding to the process continuously).
[0102]
Therefore, if the document type cannot be identified (No) in step S24 as in FIG. 10, first, (a) "execute with other character recognition software" is processed (steps S41 and S42).
[0103]
If the document type is not identifiable, (b) "all character data import" is automatically processed (steps S43 and S44). If the document type cannot be identified, (c) "word matching" is automatically processed (steps S45, S46, S47). As described above, the processing is continuously performed, and the document type can be identified in any one of the processing.
[0104]
If the process cannot be performed in the last step S47, the process returns to the start of the process or one process ends.
[0105]
If the document type is recognized in any of the processes or the processes up to the end, the MPU 32 instructs the document transport storage unit 40a shown in FIGS. Then (step S25), the document is transported / discharged to the designated pockets 41a to 41d in the classification pocket 41 in the document transport / storage section 40a of the document sorting / receiving apparatus 3 (step S26).
[0106]
(Advantages of the second embodiment)
As described above, in the second embodiment, as in the first embodiment, the reading order of the documents placed for reading matches the transport / discharge order of the classification. At this time, the process automatically reads the items of the document for which the document type cannot be identified again (from “(a) Execute with other character recognition software” to “(c) Word matching”). ing.
[0107]
In other words, as in the first embodiment, when the document type cannot be identified, an artificial instruction operation based on the screen display and the classification judgment of the operator is not required. As a result, accurate and more efficient classification becomes possible.
[0108]
(Modification)
Hereinafter, modified examples of the configurations in FIGS. 1 and 8 will be described.
[0109]
In the following Modifications 1 to 3, it is possible to perform the same processing as in the first and second embodiments for matching the reading order of the documents placed for reading with the order of transport and discharge of the classification.
[0110]
FIG. 12 is a communication network diagram illustrating a configuration example of the first modification.
[0111]
Referring to FIG. 12, in the first modification, the correction unit 1Aa and the reading unit 1Ba are separately arranged. For example, the correction unit 1Aa and the reading unit 1Ba are respectively installed on different floors in the same building.
[0112]
For this reason, a switch 52 for, for example, 100BASE LAN transmission (IEEE802) is provided in the correction unit 1Aa, and a switch 50 is also provided in the reading unit 1Ba. The switches 50 and 52 are connected by a 100BASE LAN transmission line 51.
[0113]
The correction unit 1Aa of this example is provided with a printer 53 for business management, a management W / S 54, and a magnetic tape (MT) device 55 in addition to the correction W / Ss 3a, 3b,. In addition, these can implement this invention, without providing especially.
[0114]
In the first modification, for example, the same processing as that of the first embodiment is executed by a procedure (for example, RPC: Remote Procedure Call) by a server on another LAN connected to a line concentrator (hub).
[0115]
The first modification has an advantage that the correction unit 1Aa and the reading unit 1Ba can be arranged separately (for example, on different floors of the same building). Other operational advantages are the same as in the first and second embodiments.
[0116]
FIG. 13 is a communication network diagram showing the configuration of the second modification.
[0117]
Referring to FIG. 13, in the second modification, the correction unit 1Ab and the reading unit 1Bb are separated at a remote place. The same processing as in the first embodiment is executed through the router 60, the communication network 61, and the router 62.
[0118]
The second modification has an advantage that the correction unit 1Ab and the reading unit 1Bb can be separately arranged (for example, in a local area and an urban area) at remote locations. The other operational advantages are the same as those of the first modification.
[0119]
FIG. 14 is a communication network diagram illustrating a configuration example of the third modification.
[0120]
Referring to FIG. 14, in the third modification, an optical jukebox 72 is connected to the configuration shown in FIG. 1 through a host device 70 or a server 71, and a large amount of read document data is managed. Further, a router 73 is provided. For example, it is connected to a municipal receipt processing system 76, 77,. Each of the municipal receipt processing systems 76, 77,... Includes a router 80, a server 81, processing terminals 82, 84, a small OCR device 83, and the like.
[0121]
【The invention's effect】
As apparent from the above description, according to the document identification / classification method, the document identification / classification processing system and the program of the present invention, the contents described in the document are read by the optical character reader, and the document type is identified and classified. In this case, the reading order can be prevented from being different, and as a result, there is an effect that the classification by the accurate and reliable identification of the document type becomes possible.
[Brief description of the drawings]
FIG. 1 is an external configuration diagram schematically illustrating a document identification and classification method, a document identification and classification processing system, and a program according to a first embodiment of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of a control system for executing a program in the configuration of FIG. 1;
FIG. 3 is a schematic diagram for explaining a reading state of a document in the OCR device in FIG. 1;
FIG. 4 is a functional block diagram when the overall operation of the first embodiment is executed by the MPU configuration.
FIG. 5 is a flowchart illustrating a processing procedure of an overall operation according to the first embodiment.
FIG. 6 is a diagram for explaining a pocket instruction of a destination for conveying and discharging a document in the first embodiment.
FIG. 7 is a diagram illustrating an example of a document sorting process in the first embodiment.
FIG. 8 is an external configuration diagram illustrating a schematic configuration of a second embodiment.
FIG. 9 is a functional block diagram when the overall operation of the second embodiment is executed by the MPU configuration.
FIG. 10 is a flowchart showing a processing procedure in the operation of the second embodiment.
FIG. 11 is a flowchart illustrating another processing procedure in the operation of the second embodiment.
FIG. 12 is a communication network diagram illustrating a configuration example of a modified example in the first and second embodiments.
FIG. 13 is a communication network diagram illustrating a configuration example of another modification example of the embodiment.
FIG. 14 is a communication network diagram showing a configuration example of still another modified example in the embodiment.
FIG. 15 is a view for explaining a pocket instruction of a document transport / discharge destination in a conventional example.
[Explanation of symbols]
1. OCR device
2 ... Control device
3. Document sorting storage device (sorter)
4: Transport device
32 ... MPU
33 ... input / output (I / O) circuit
34 Display device
35 ... Input operation device
40: Document transport storage section
40a: Document transport storage section
41… Classification pocket
41a-41d ... pocket
43 ... Optical reading unit

Claims (6)

光学式文字読取装置を用い、書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納部に搬送・排出する書類識別分類方法において、
前記書類を順次自動的に送り出す工程と、
前記送り出される前記書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した前記書類の搬送・排出先の収納部を決定する工程と、
前記書類の搬送・排出先の収納部を決定する際に、書類種別が識別不能の書類の書面記載情報を画面表示し、この画面情報からの書類種別のを識別に基づいて分類した書類を搬送・排出する収納部を指示する工程と、
前記決定された収納部又は指示された収納部へ今回読み取った前記書類を搬送・排出する工程と、
を有することを特徴とする書類識別分類方法。
In the document identification and classification method of using an optical character reader, sequentially reading the written information of the document, identifying and classifying the document type, and transporting / discharging the document to a predetermined storage unit,
Automatically sending out the documents sequentially;
A step of optically reading the written description information of the document to be sent out, identifying the document type, and determining a storage unit of the transport / discharge destination of the document corresponding to a predetermined classification,
When determining the storage section of the transport / discharge destination of the document, the document description information of the document whose document type cannot be identified is displayed on a screen, and the document classified from the screen information based on the identification of the document type is transported. A process of instructing a storage unit to be discharged;
Transporting and discharging the document read this time to the determined storage unit or the specified storage unit;
And a document identification and classification method.
光学式文字読取装置を用い、書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納部に搬送・排出する書類識別分類方法において、
前記書類を順次自動的に送り出す工程と、
前記送り出される前記書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した、前記書類の搬送・排出先の収納部を決定する工程と、
前記決定で書類種別が識別不能の場合に、この書類種別の識別不能の書類の記載事項を再度、自動的に読み取る処理を実施する工程と、
前記再度、実施した自動的な読み取り処理による書類種別の識別に基づいて分類した前記書類の搬送・排出先の収納部を自動的に指示する工程と、
前記決定された収納部又は指示された収納部へ今回読み取った前記書類を搬送・排出する工程と、
を有することを特徴とする書類識別分類方法。
In the document identification and classification method of using an optical character reader, sequentially reading the written information of the document, identifying and classifying the document type, and transporting / discharging the document to a predetermined storage unit,
Automatically sending out the documents sequentially;
A step of determining the storage unit of the transport / discharge destination of the document, corresponding to a predetermined classification, by sequentially optically reading the written description information of the sent document and identifying the document type,
If the document type is indistinguishable in the determination, a step of automatically re-reading the description items of the indistinguishable document of this document type,
A step of automatically instructing a storage unit of a transport / discharge destination of the document classified based on the identification of the document type by the automatic reading process performed again,
Transporting and discharging the document read this time to the determined storage unit or the specified storage unit;
And a document identification and classification method.
書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納先に搬送・排出する書類識別分類処理システムにおいて、
前記書類を順次自動的に送り出す自動送出手段と、
前記自動送出手段が送り出す前記書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した前記書類の搬送・排出先の収納部を決定する読取識別分類手段と、
前記読取識別分類手段で書類種別が識別不能の書面記載情報を画面表示する表示手段と、
前記表示手段での書面記載情報に基づいて書類種別を識別した分類による書類を搬送・排出する収納部を指示するための指示手段と、
前記読取識別分類手段で決定された収納部又は前記指示手段で指示された収納部へ今回読み取った前記書類を搬送・排出する搬送・排出手段と、
を備えることを特徴とする書類識別分類処理システム。
In a document identification and classification processing system for sequentially reading the written information of documents, identifying and classifying the document type, and transporting and discharging the documents to a predetermined storage destination,
Automatic sending means for automatically sending the documents sequentially,
Reading identification and classification means for sequentially and optically reading the written information of the document sent out by the automatic sending means to identify the type of the document, and determining a storage portion of the transport / discharge destination of the document corresponding to a predetermined classification; and ,
Display means for displaying on the screen the document description information whose document type is unidentifiable by the read identification and classification means,
Instructing means for instructing a storage unit for transporting / discharging a document according to a classification in which a document type is identified based on the written information in the display means,
Conveyance / discharge means for conveying / discharging the document read this time to the storage unit determined by the read identification and classification means or the storage unit instructed by the instruction means,
A document identification and classification processing system comprising:
書類の書面記載情報を順次読み取って書類種別を識別して分類した書類を予め定めた収納先に搬送・排出する書類識別分類処理システムにおいて、
前記書類を順次自動的に送り出す自動送出手段と、
前記自動送出手段が送り出す前記書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した、前記書類の搬送・排出先の収納部を決定する読取識別分類手段と、
前記読取識別分類手段で書類種別が識別不能となった前記書類の記載事項を再度、自動的に読み取る処理を実施し、この処理に基づいた分類による搬送・排出先の収納部を自動的に指示するための指示手段と、
前記読取識別分類手段で決定された収納部又は前記指示手段で指示された収納部へ今回読み取った前記書類を搬送・排出する搬送・排出手段と、
を備えることを特徴とする書類識別分類処理システム。
In a document identification and classification processing system for sequentially reading the written information of documents, identifying and classifying the document type, and transporting and discharging the documents to a predetermined storage destination,
Automatic sending means for automatically sending the documents sequentially,
Reading identification and classification means for sequentially and optically reading the written information of the document sent out by the automatic sending means to identify the type of the document, and determining the storage section of the transport / discharge destination of the document corresponding to a predetermined classification When,
The reading identification / classification means automatically performs the process of automatically reading the items described in the document whose document type has become indistinguishable, and automatically instructs the storage unit of the transport / discharge destination based on the classification based on this process. Instruction means for performing
Conveyance / discharge means for conveying / discharging the document read this time to the storage unit determined by the read identification and classification means or the storage unit instructed by the instruction means,
A document identification and classification processing system comprising:
書類を順次自動的に送り出すステップと、
前記送り出す前記書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した前記書類の搬送・排出先の収納部を決定するステップと、
前記書類の搬送・排出先の収納部を決定する際に、書類種別が識別不能の書類の書面記載情報を画面表示し、この画面情報に基づいた書類種別を識別して分類した書類を搬送・排出する収納部を指示するステップと、
前記決定された収納部又は指示された収納部へ今回読み取った前記書類を搬送・排出するステップと、
の制御をコンピュータに実行させるためのプログラム。
Automatically sending out the documents sequentially;
A step of optically reading the written description information of the document to be sent out, identifying the document type, and determining a storage unit of a transport / discharge destination of the document corresponding to a predetermined classification;
When determining the storage unit of the transport / discharge destination of the document, the document description information of the document whose document type cannot be identified is displayed on a screen, and the document classified based on the document type based on the screen information is identified. Indicating a storage unit to be discharged;
Conveying and discharging the document read this time to the determined storage unit or the specified storage unit,
A program that causes a computer to execute control of the computer.
書類を順次自動的に送り出すステップと、
前記送り出される前記書類の書面記載情報を順次光学的に読み取って書類種別を識別し、予め定めた分類に対応した、前記書類の搬送・排出先の収納部を決定するステップと、
前記決定で書類種別が識別不能の場合に、この書類種別が識別不能の書類の記載事項を再度、自動的に読み取る処理を実施するステップと、
前記再度、実施した自動的な読み取り処理に基づいて書類種別を識別して分類した前記書類の搬送・排出先の収納部を自動的に指示するステップと、
前記決定された収納部又は指示された収納部へ今回読み取った前記書類を搬送・排出するステップと、
の制御をコンピュータに実行させるためのプログラム。
Automatically sending out the documents sequentially;
A step of determining the storage unit of the transport / discharge destination of the document, corresponding to a predetermined classification, by sequentially optically reading the written description information of the document to be sent and identifying the document type,
When the document type is indistinguishable in the determination, a step of automatically re-reading the description items of the document in which the document type is indistinguishable,
Automatically instructing the storage unit of the transport / discharge destination of the document identified and classified based on the document type based on the automatic reading process performed again;
Conveying and discharging the document read this time to the determined storage unit or the specified storage unit,
A program that causes a computer to execute control of the computer.
JP2003031629A 2003-02-07 2003-02-07 Documents identification and classification method, documents identification and classification processing system and program Pending JP2004240888A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003031629A JP2004240888A (en) 2003-02-07 2003-02-07 Documents identification and classification method, documents identification and classification processing system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003031629A JP2004240888A (en) 2003-02-07 2003-02-07 Documents identification and classification method, documents identification and classification processing system and program

Publications (1)

Publication Number Publication Date
JP2004240888A true JP2004240888A (en) 2004-08-26

Family

ID=32958150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003031629A Pending JP2004240888A (en) 2003-02-07 2003-02-07 Documents identification and classification method, documents identification and classification processing system and program

Country Status (1)

Country Link
JP (1) JP2004240888A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014099114A (en) * 2012-11-15 2014-05-29 Fujitsu Ltd Determination program, determination method, and determination device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014099114A (en) * 2012-11-15 2014-05-29 Fujitsu Ltd Determination program, determination method, and determination device

Similar Documents

Publication Publication Date Title
US8121344B2 (en) System and method for routing imaged documents
EP0596724A1 (en) Digital scanning technique
EP0938066A2 (en) Address recognizing method and mail processing apparatus
EP1045348A2 (en) Financial document processing system and method of operating a financial document processing system during exception recovery
US20140293367A1 (en) Electronic document processing method and device
JP2010221094A (en) System for collecting data of postal matter misclassification, method for collecting data of postal matter misclassification, and control program thereof
JP2004240888A (en) Documents identification and classification method, documents identification and classification processing system and program
US20130251235A1 (en) System for high speed processing of currency notes and slot tickets
JP2007075760A (en) Sorting apparatus, paper sheets processing system and sorting method
JP2004090235A (en) Method for managing print record and method for recognizing print condition
JP3596238B2 (en) Document sorting device
JP5911701B2 (en) Video coding system, image display priority determination program, and parcel processing apparatus
EP1953703A1 (en) A method for monitoring preparation of items to be mailed
JP4244657B2 (en) Document conveying and reading processing method, system thereof, and program
JP4211422B2 (en) Document transport method, system and program
JP3715459B2 (en) Mail processing apparatus and mail processing method
JP2001113233A (en) Mail sorter, mail sorting system, and mail sorting method
JP2905011B2 (en) Mail handling equipment
JP2010072769A (en) Slip processing system, slip processing device and slip processing method
JP4737861B2 (en) Delivery processing equipment
JP2006244238A (en) Identification code confirming device
JP2005148905A (en) Form processing system
JPH1099791A (en) Method for processing removal of items for delivery
JP3778878B2 (en) Ticketing system, ticketing method, program and recording medium
JP4238564B2 (en) Character recognition device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081216