JP2008083760A - Business form reader - Google Patents

Business form reader Download PDF

Info

Publication number
JP2008083760A
JP2008083760A JP2006259996A JP2006259996A JP2008083760A JP 2008083760 A JP2008083760 A JP 2008083760A JP 2006259996 A JP2006259996 A JP 2006259996A JP 2006259996 A JP2006259996 A JP 2006259996A JP 2008083760 A JP2008083760 A JP 2008083760A
Authority
JP
Japan
Prior art keywords
feature information
input
area
image data
business form
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006259996A
Other languages
Japanese (ja)
Other versions
JP4702244B2 (en
Inventor
Katsuhiko Aoki
勝彦 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2006259996A priority Critical patent/JP4702244B2/en
Publication of JP2008083760A publication Critical patent/JP2008083760A/en
Application granted granted Critical
Publication of JP4702244B2 publication Critical patent/JP4702244B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To appropriately discriminate a business form based on feature information and to correctly read character information recorded on the business form by invalidating an area which includes a large amount of feature information in the image data of input business form, and discriminating the business form by collating the feature information with that registered in advance. <P>SOLUTION: A business form reader 10 has; an image input means for inputting image data of a business form; a feature information extraction means to extract feature information from the image data; and a business form discrimination means for discriminating the business form by collating the feature information extracted by the feature information extraction means against the feature information registered in advance. When there exists an area including a large amount of the feature information in the image data, the feature information extraction means invalidates the feature information on this area. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、帳票読取装置に関するものである。   The present invention relates to a form reading apparatus.

従来、銀行、郵便局、信用金庫、消費者金融会社等の金融機関においては、住所変更等の顧客情報の更新や、振込等の金融取引を営業店の窓口やカウンタで依頼すると、必要事項が記載された依頼伝票等の帳票に記載された事項をデータ管理サーバ等のコンピュータに入力する。この場合、帳票に記録された情報を人手によらず自動的にコンピュータに入力するために、帳票に記録された文字情報を読み取るためのOCR(Optical Character Reader)機能を備えた帳票読取装置が使用されている。   Traditionally, financial institutions such as banks, post offices, credit unions, consumer finance companies, etc. have required information when updating customer information such as address changes and requesting financial transactions such as bank transfers at sales counters and counters. Items described in a form such as a written request slip are input to a computer such as a data management server. In this case, a form reading device having an OCR (Optical Character Reader) function for reading the character information recorded in the form is used to automatically input the information recorded in the form into the computer without manual intervention. Has been.

しかし、金融機関の営業店で取り扱う業務は多種多様なので、窓口やカウンタで受け付ける帳票も多種多様なものとなる。そこで、各種の帳票の画像データをOCR機能を備えた帳票読取装置によってあらかじめ取得し、当該帳票の罫線の特徴を罫線情報として登録しておき、窓口やカウンタで受け付けた帳票に記録された文字情報を読み取る際には、当該帳票の罫線情報をあらかじめ登録された罫線情報と照合して当該帳票の種類を識別するようになっている(例えば、非特許文献1参照。)。前記帳票読取装置は、このようにして当該帳票の種類を識別した後に、当該帳票に記載されている氏名、金額、口座番号等の帳票データを読み取ってコンピュータに送信する。
「沖テクニカルレビュー」沖電気工業株式会社発行、2002年7月、第191号、Vol.69、No.3、p.98−101(「Image/OCRコンポーネント」)
However, since the operations handled by the financial institution's branch are diverse, the forms accepted at the counter and counter are also diverse. Therefore, the image data of various forms is acquired in advance by a form reading device having an OCR function, the characteristics of the ruled lines of the form are registered as ruled line information, and the character information recorded in the form received at the window or counter Is read out, the ruled line information of the form is checked against previously registered ruled line information to identify the type of the form (for example, see Non-Patent Document 1). After identifying the type of the form in this way, the form reading device reads form data such as name, amount, and account number described in the form and transmits it to the computer.
“Oki Technical Review” published by Oki Electric Industry Co., Ltd., July 2002, No.191, Vol. 69, no. 3, p. 98-101 ("Image / OCR component")

しかしながら、前記従来の帳票読取装置においては、罫線の特徴に基づいて帳票を識別するようになっているので、罫線同士の間隔が狭かったり、罫線が複雑に込み入っていたりすると、罫線の特徴を適切に識別することができないことがあった。例えば、前記従来の帳票読取装置では、黒画素が一定以上連続していると罫線として認識するようになっているので、黒ベタ領域に白抜き文字が印刷されている部分や、暗証番号を隠すための部分等においても罫線があるものと認識してしまう。すなわち、罫線同士の間隔が狭かったり、罫線が複雑に込み入っていたりする部分の情報をすべて読み取ってしまうと、帳票の識別結果に影響を及ぼし、帳票を誤認識してしまうことがある。   However, in the conventional form reading device, the form is identified based on the characteristic of the ruled line. Therefore, if the interval between the ruled lines is narrow or the ruled line is complicated, the characteristic of the ruled line is appropriately determined. Could not be identified. For example, in the conventional form reading device, if black pixels are continuous for a certain amount or more, they are recognized as ruled lines, so that the portion where white characters are printed in the black solid area or the password is hidden. It will be recognized that there is a ruled line in the portion for the purpose. That is, if all the information of a part where the interval between ruled lines is narrow or the ruled lines are complicated is read, the identification result of the form may be affected and the form may be erroneously recognized.

もっとも、前記従来の帳票読取装置においても、ノイズを除去することによって誤認識を防止するようになっている。すなわち、帳票を登録する時点において、ノイズを除去して登録するようになっている。しかし、この場合、罫線自体をノイズとして除去してしまうことがあり、帳票を適切に識別することができなくなってしまうことがある。   However, in the conventional form reading device, erroneous recognition is prevented by removing noise. That is, at the time of registering the form, the registration is performed with noise removed. However, in this case, the ruled line itself may be removed as noise, and the form may not be properly identified.

本発明は、前記従来の帳票読取装置の問題点を解決して、入力された帳票の画像データに特徴情報が多量に含まれる領域が存在すると、該領域を無効にし、特徴情報をあらかじめ登録されている特徴情報と照合して帳票を識別するようにして、特徴情報に基づいて帳票を適切に識別することができ、帳票に記録された文字情報を正確に読み取ることができる帳票読取装置を提供することを目的とする。   The present invention solves the problems of the conventional form reading device, and if there is an area containing a large amount of feature information in the image data of the input form, the area is invalidated and the feature information is registered in advance. Provides a form reader that can identify forms based on feature information, and can accurately identify forms based on feature information and accurately read text information recorded on forms. The purpose is to do.

そのために、本発明の帳票読取装置においては、帳票の画像データを入力する画像入力手段と、前記画像データから特徴情報を抽出する特徴情報抽出手段と、該特徴情報抽出手段が抽出した特徴情報を、あらかじめ登録されている特徴情報と照合して前記帳票を識別する帳票識別手段とを有する帳票読取装置であって、前記特徴情報抽出手段は、前記画像データに特徴情報が多量に含まれる領域が存在すると該領域の特徴情報を無効とする。   Therefore, in the form reading apparatus of the present invention, image input means for inputting image data of the form, feature information extraction means for extracting feature information from the image data, and feature information extracted by the feature information extraction means. A form reader having form identification means for identifying the form by collating with pre-registered feature information, wherein the feature information extraction means has an area in which a large amount of feature information is included in the image data. If it exists, the feature information of the area is invalidated.

本発明の他の帳票読取装置においては、さらに、前記帳票識別手段は、前記領域外の特徴情報を、あらかじめ登録されている特徴情報と照合する。   In another form reading apparatus according to the present invention, the form identifying means collates the feature information outside the area with the feature information registered in advance.

本発明の更に他の帳票読取装置においては、さらに、前記特徴情報は罫線情報であり、前記領域は閾(しきい)値以上の密度で罫線が存在する領域である。   In still another form reading apparatus of the present invention, the feature information is ruled line information, and the region is a region where ruled lines exist at a density equal to or higher than a threshold value.

本発明の更に他の帳票読取装置においては、さらに、前記領域は、黒ベタ領域に白抜き文字が印刷されている領域又は暗証番号を隠すための領域を含む。   In still another form reading apparatus according to the present invention, the area further includes an area where white characters are printed in a black solid area or an area for hiding a password.

本発明の更に他の帳票読取装置においては、さらに、あらかじめ登録されている特徴情報を格納する登録済特徴情報記憶手段を更に有する。   Still another form reading apparatus according to the present invention further includes registered feature information storage means for storing pre-registered feature information.

本発明によれば、帳票読取装置においては、入力された帳票の画像データに特徴情報が多量に含まれる領域が存在すると、該領域を無効にし、特徴情報をあらかじめ登録されている特徴情報と照合して帳票を識別するようになっている。これにより、特徴情報に基づいて帳票を適切に識別することができ、帳票に記録された文字情報を正確に読み取ることができる。   According to the present invention, in the form reading device, if there is a region containing a large amount of feature information in the image data of the input form, the region is invalidated and the feature information is collated with pre-registered feature information. The form is identified. As a result, the form can be appropriately identified based on the feature information, and the character information recorded on the form can be read accurately.

以下、本発明の実施の形態について図面を参照しながら詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は本発明の実施の形態における帳票読取装置の構成を示すブロック図である。   FIG. 1 is a block diagram showing a configuration of a form reading apparatus according to an embodiment of the present invention.

図において、10は銀行、郵便局、信用金庫、消費者金融会社等の金融機関の本店、支店等の営業店、前記金融機関の帳票取扱センタ、データエントリセンタ等に配設された帳票読取装置である。該帳票読取装置10は、金融機関において、顧客が口座の新規開設、キャッシュカードの暗証番号の届出、住所変更等の届出や更新を窓口やカウンタで依頼すると、必要事項が記載された依頼伝票等の識別対象帳票としての入力帳票11の画像データを取得し、該画像データに基づいて、前記入力帳票11に記載された事項をエントリデータとして入力するためのコンピュータシステムである。   In the figure, reference numeral 10 denotes a form reading device disposed in a bank, post office, credit union, a head office of a financial institution such as a consumer financial company, a branch office or the like, a form handling center of the financial institution, a data entry center, or the like. It is. The form reading device 10 is a request slip or the like in which necessary items are described when a customer requests a bank account or counter for notification or renewal of a new account, notification of a cash card PIN, change of address, etc. at a financial institution. This is a computer system for acquiring image data of an input form 11 as an identification target form and inputting items described in the input form 11 as entry data based on the image data.

そして、前記帳票読取装置10は、CPU、MPU等の演算手段、磁気ディスク、半導体メモリ等の記憶手段、キーボード、マウス、押しボタン、タッチパネル等の入力手段、CRT、液晶ディスプレイ、LED(Light Emitting Diode)ディスプレイ等の表示手段、通信インターフェイス等を備えるコンピュータである。なお、前記帳票読取装置10は、例えば、パーソナルコンピュータであるが、サーバ、ワークステーション等いかなる種類のコンピュータであってもよい。また、前記帳票読取装置10は、単一にコンピュータから成る装置であってもよいし、複数台のコンピュータを相互に接続した分散型サーバのような装置であってもよい。   The form reading device 10 includes CPU, MPU and other arithmetic means, magnetic disk, storage means such as semiconductor memory, keyboard, mouse, push button, touch panel and other input means, CRT, liquid crystal display, LED (Light Emitting Diode). ) A computer having display means such as a display, a communication interface, and the like. The form reading device 10 is a personal computer, for example, but may be any type of computer such as a server or a workstation. Further, the form reading device 10 may be a single device or a device such as a distributed server in which a plurality of computers are connected to each other.

本実施の形態における帳票読取装置10は、機能の観点から、前記入力帳票11の画像を画像データとして入力する画像入力手段としての画像入力処理部12、入力された画像データを格納する入力画像データ記憶手段としての入力画像メモリ13、前記画像データから特徴情報を抽出する特徴情報抽出手段としての特徴情報抽出部14、抽出された特徴情報を格納する特徴情報記憶手段としての特徴情報格納メモリ15、前記入力帳票11を識別する帳票識別手段としての帳票識別処理部16、あらかじめ登録された各種の帳票の特徴情報を格納する登録済特徴情報記憶手段としての帳票識別情報格納メモリ21、前記帳票読取装置10全体の動作を制御する制御部22、前記帳票読取装置10を操作するオペレータによる入力操作を受け付ける入力部23、及び、前記オペレータに対して情報を表示する表示部24を有する。なお、前記画像入力処理部12、入力画像メモリ13、特徴情報抽出部14、特徴情報格納メモリ15、帳票識別処理部16、帳票識別情報格納メモリ21、制御部22、入力部23及び表示部24は、データバス、システムバス、LAN(Local Area Network)、イントラネット等の通信回線網を介して、相互に通信可能に接続されている。   The form reading apparatus 10 according to the present embodiment has an image input processing unit 12 as image input means for inputting an image of the input form 11 as image data, and input image data for storing input image data, from the viewpoint of function. An input image memory 13 as storage means, a feature information extraction section 14 as feature information extraction means for extracting feature information from the image data, a feature information storage memory 15 as feature information storage means for storing the extracted feature information, Form identification processing unit 16 as form identification means for identifying the input form 11, form identification information storage memory 21 as registered feature information storage means for storing characteristic information of various registered forms, and the form reading device 10 receives an input operation by an operator who operates the form reading device 10 and a control unit 22 that controls the operation of the entire document It takes the input unit 23, and a display unit 24 for displaying information to the operator. The image input processing unit 12, the input image memory 13, the feature information extraction unit 14, the feature information storage memory 15, the form identification processing unit 16, the form identification information storage memory 21, the control unit 22, the input unit 23, and the display unit 24. Are connected to each other via a communication line network such as a data bus, a system bus, a LAN (Local Area Network), and an intranet.

ここで、前記画像入力処理部12は、フラットヘッドスキャナ、シートフィードスキャナ、ドラムスキャナ、非接触型スタンドスキャナ等であるが、いかなる種類のスキャナであってもよい。また、前記画像入力処理部12は、カラー画像の読み取りが可能なカラースキャナであることが望ましいが、モノクロスキャナであってもよい。本実施の形態において、前記画像入力処理部12は、帳票読取装置10に入力すべき事項、すなわち、エントリデータが記載された入力帳票11に光を照射する蛍光灯から成る光源、及び、前記入力帳票11の表面からの反射光を受光するCCD(Charge Coupled Device:電荷結合素子)等から成るライン型イメージセンサのようなイメージセンサを備える。   Here, the image input processing unit 12 is a flat head scanner, a sheet feed scanner, a drum scanner, a non-contact type stand scanner, or the like, but may be any kind of scanner. The image input processing unit 12 is preferably a color scanner capable of reading a color image, but may be a monochrome scanner. In the present embodiment, the image input processing unit 12 includes items to be input to the form reading device 10, that is, a light source composed of a fluorescent lamp that irradiates light to the input form 11 on which entry data is described, and the input An image sensor such as a line type image sensor including a CCD (Charge Coupled Device) that receives reflected light from the surface of the form 11 is provided.

さらに、前記画像入力処理部12は、ホッパ、搬送経路、スタッカ等を有し、複数枚の入力帳票11を順次読み取ることができるものであることが望ましい。この場合、前記ホッパは複数枚の入力帳票11を積み重ねた状態で収納する。また、前記搬送経路は、ベルト、ローラ等の搬送装置を備えて画像入力処理部12内に形成され、前記ホッパ内に積み重ねられた複数枚の入力帳票11が紙送り装置によって一番上又は一番下から順次送り込まれると、送り込まれた入力帳票11を前記イメージセンサに搬送する。さらに、前記搬送経路は、前記イメージセンサにおいて画像データが取得された入力帳票11を搬送してスタッカに排出するようになっている。   Furthermore, it is desirable that the image input processing unit 12 has a hopper, a conveyance path, a stacker, and the like and can sequentially read a plurality of input forms 11. In this case, the hopper stores a plurality of input forms 11 in a stacked state. The transport path is provided with a transport device such as a belt and a roller, is formed in the image input processing unit 12, and a plurality of input forms 11 stacked in the hopper are placed on the top or the top by a paper feed device. When sequentially sent from the bottom, the fed input form 11 is conveyed to the image sensor. Further, the transport path transports the input form 11 for which image data has been acquired by the image sensor and discharges it to the stacker.

また、前記搬送経路における画像読取部の下流側には印字ヘッドを備える印字部が配設され、前記入力帳票11の隅や裏面の余白部分の通番記載欄に通番を印字するようになっていることが望ましい。該通番は、それぞれの入力帳票11がどのような順番で画像入力処理部12によって読取処理が行われたかを確認するものであり、読取処理が行われた順番を示す番号である。   In addition, a printing unit including a print head is disposed on the downstream side of the image reading unit in the conveyance path, and a serial number is printed in a serial number description column at a corner or a back side margin of the input form 11. It is desirable. The serial number is a number indicating the order in which the reading processing is performed by the image input processing unit 12 in the order in which the input forms 11 are read.

そして、前記入力帳票11は、業務毎に相違するフォーマットを備え、各業務に対応した必要事項が記載される帳票である。ここで、前記業務は、顧客が窓口やカウンタで依頼した届出や更新に対応して金融機関が行う業務であるが、顧客の依頼に対応するもの以外に金融機関が行う業務を含むものであってもよい。そして、前記入力帳票11は、業務毎に仕分けられ、オペレータが入力部23を操作して指定した業務に対応する入力帳票11の画像データが画像入力処理部12によって取得される。   The input form 11 is a form having a format different for each business and describing necessary items corresponding to each business. Here, the business is a business performed by a financial institution in response to a notification or renewal requested by a customer at a window or counter, but includes a business performed by a financial institution in addition to a business corresponding to a customer's request. May be. The input form 11 is sorted for each business, and the image data of the input form 11 corresponding to the business designated by the operator operating the input unit 23 is acquired by the image input processing unit 12.

また、前記特徴情報抽出部14は、入力画像メモリ13に格納されている画像データから入力帳票11がどのような種類のものであるかを識別するための特徴情報を抽出する。該特徴情報は、例えば、入力帳票11に印刷された罫線の形状、長さ、本数、構成等から成る情報としての罫線情報である。そして、特徴情報抽出部14が抽出した入力帳票11の特徴情報は、前記特徴情報格納メモリ15に格納される。   Further, the feature information extraction unit 14 extracts feature information for identifying what kind of the input form 11 is from the image data stored in the input image memory 13. The feature information is, for example, ruled line information as information including the shape, length, number, configuration, and the like of ruled lines printed on the input form 11. The feature information of the input form 11 extracted by the feature information extraction unit 14 is stored in the feature information storage memory 15.

さらに、前記帳票識別処理部16は、前記特徴情報格納メモリ15に格納された入力帳票11の特徴情報を、帳票識別情報格納メモリ21に格納されている各種の帳票の特徴情報と照合することによって、前記入力帳票11を識別する。前記帳票識別情報格納メモリ21には、業務毎に相違するフォーマットを備える各種の帳票の特徴情報があらかじめ登録されて格納されている。したがって、帳票識別情報格納メモリ21に格納されている特徴情報と照合することによって、前記入力帳票11の種類を特定し、どのようなフォーマットを備えるものであるかを判別することができる。   Further, the form identification processing unit 16 collates the feature information of the input form 11 stored in the feature information storage memory 15 with the feature information of various forms stored in the form identification information storage memory 21. The input form 11 is identified. In the form identification information storage memory 21, feature information of various forms having different formats for each business is registered and stored in advance. Therefore, by comparing with the feature information stored in the form identification information storage memory 21, the type of the input form 11 can be specified, and what format is provided can be determined.

また、前記入力部23は、帳票読取装置10を操作するオペレータによる入力操作を受け付けるものであり、キーボード、マウス、押しボタン、タッチパネル等の入力手段が該当する。さらに、前記表示部24は、前記オペレータに各種の情報を表示するものであり、CRT、液晶ディスプレイ、LEDディスプレイ等の表示手段が該当する。   The input unit 23 receives an input operation by an operator who operates the form reading apparatus 10, and corresponds to input means such as a keyboard, a mouse, a push button, and a touch panel. Further, the display unit 24 displays various types of information to the operator, and corresponds to display means such as a CRT, a liquid crystal display, and an LED display.

次に、前記構成の帳票読取装置10の動作について説明する。ここでは、入力帳票11を識別する動作について説明する。   Next, the operation of the form reading apparatus 10 configured as described above will be described. Here, an operation for identifying the input form 11 will be described.

図2は本発明の実施の形態における入力帳票の第1の例を示す図、図3は本発明の実施の形態における入力帳票の第2の例を示す図、図4は本発明の実施の形態における入力帳票の第2の例の画像データを示す図、図5は本発明の実施の形態における入力帳票の第2の例の画像データにおいて特徴情報を無効にする範囲を示す図、図6は本発明の実施の形態における帳票読取装置の動作を示すフローチャートである。   FIG. 2 is a diagram showing a first example of an input form in the embodiment of the present invention, FIG. 3 is a diagram showing a second example of the input form in the embodiment of the present invention, and FIG. 4 is a diagram showing an embodiment of the present invention. FIG. 5 is a diagram showing image data of the second example of the input form in the form, FIG. 5 is a diagram showing a range in which the feature information is invalidated in the image data of the second example of the input form in the embodiment of the present invention, FIG. These are the flowcharts which show operation | movement of the form reading apparatus in embodiment of this invention.

まず、オペレータが入力部23を操作して、入力帳票11に記載された事項をエントリデータとして帳票読取装置10に入力するための動作を開始させると、該帳票読取装置10は、画像入力処理を実行する。該画像入力処理においては、制御部22が画像入力処理部12を制御して、該画像入力処理部12に入力帳票11を読み取らせる。そして、前記画像入力処理部12が取得した入力帳票11の画像データは、入力画像メモリ13に格納される。   First, when the operator operates the input unit 23 to start an operation for inputting items described in the input form 11 as entry data to the form reading apparatus 10, the form reading apparatus 10 performs image input processing. Execute. In the image input process, the control unit 22 controls the image input processing unit 12 to cause the image input processing unit 12 to read the input form 11. Then, the image data of the input form 11 acquired by the image input processing unit 12 is stored in the input image memory 13.

ここで、前記入力帳票11は、例えば、図2に示されるようになっている。この場合、入力帳票11は、顧客が口座の新規開設等を依頼するために使用する種類の帳票であり、黒ベタ領域に白抜き文字が印刷されている領域11a−1や、暗証番号を隠すための領域11a−2等を有する。前記画像入力処理部12は、黒画素が一定以上連続していると罫線として認識するようになっているので、前記領域11a−1及び2を罫線が多量に含まれる領域であるものと認識してしまう。   Here, the input form 11 is, for example, as shown in FIG. In this case, the input form 11 is a type of form used by a customer to request opening a new account, etc., and the area 11a-1 in which white characters are printed in the black solid area and the secret number are hidden. Region 11a-2 for the purpose. The image input processing unit 12 recognizes the regions 11a-1 and 2 as regions containing a large amount of ruled lines because black pixels are continuous for a certain level or more as ruled lines. End up.

また、図3には入力帳票11の他の例が示されている。図3に示される入力帳票11は、所定の閾値以上の密度で罫線が存在する領域11bを有する。前記閾値は、所定の範囲内に所定本数が含まれる状態に該当する密度であり、例えば、入力帳票11がA4版のサイズを有するものである場合、1〔cm〕角の範囲内に3本の罫線が含まれる状態に該当する密度である。なお、前記閾値は、あらかじめ設定されるものであるが、適宜変更することができる。   FIG. 3 shows another example of the input form 11. The input form 11 shown in FIG. 3 has a region 11b where ruled lines exist at a density equal to or higher than a predetermined threshold. The threshold is a density corresponding to a state in which a predetermined number is included in a predetermined range. For example, when the input form 11 has an A4 size, three thresholds in a 1 cm square range. This is a density corresponding to a state in which a ruled line is included. The threshold value is set in advance, but can be changed as appropriate.

前記画像入力処理部12が、それ自体の構成が、例えば、非接触型スタンドスキャナのように、比較的解像度の低いものであったり、周囲の光や影の影響を受けやすいような環境下におかれたものであったりする場合には、前記領域11bにおいて、隣接する罫線同士が潰(つぶ)れてつながってしまうので、入力帳票11の画像データが図4に示されるようなものとなってしまう可能性がある。すなわち、閾値以上の密度で罫線が存在する領域11bが、黒ベタ領域のようになってしまう可能性がある。   The image input processing unit 12 itself has a configuration with a relatively low resolution, such as a non-contact type stand scanner, or in an environment that is easily affected by ambient light and shadows. In the case of being placed, adjacent ruled lines are crushed and connected in the region 11b, so that the image data of the input form 11 is as shown in FIG. There is a possibility that. That is, there is a possibility that the region 11b where the ruled line exists at a density equal to or higher than the threshold becomes a black solid region.

次に、帳票読取装置10は、特徴情報抽出処理を実行する。該特徴情報抽出処理においては、特徴情報抽出部14が、前記入力画像メモリ13に格納された入力帳票11の画像データから特徴情報を抽出して特徴情報格納メモリ15に格納する。ここでは、前記特徴情報が罫線の形状、長さ、本数、構成等から成る罫線情報であるものとして説明する。この場合、前記特徴情報抽出部14は、閾値以上の密度で罫線が存在する領域11bを含む図5に示されるような範囲11c内に存在する特徴情報としての罫線情報を無効にする。したがって、前記特徴情報抽出部14は、入力帳票11の画像データから、範囲11c外に存在する罫線についての罫線情報のみを特徴情報として抽出する。   Next, the form reading device 10 executes feature information extraction processing. In the feature information extraction process, the feature information extraction unit 14 extracts feature information from the image data of the input form 11 stored in the input image memory 13 and stores it in the feature information storage memory 15. Here, description will be made assuming that the feature information is ruled line information including the shape, length, number, and configuration of ruled lines. In this case, the feature information extraction unit 14 invalidates ruled line information as feature information existing in a range 11c as shown in FIG. 5 including a region 11b where ruled lines exist at a density equal to or higher than a threshold. Therefore, the feature information extraction unit 14 extracts only ruled line information about ruled lines existing outside the range 11c from the image data of the input form 11 as feature information.

次に、帳票読取装置10は、帳票識別処理を実行する。該帳票識別処理においては、帳票識別処理部16が、帳票識別情報格納メモリ21に格納されているあらかじめ登録された各種の帳票の特徴情報を順に取り出し、入力画像メモリ13に格納された入力帳票11の画像データから特徴情報抽出部14が抽出した特徴情報と照合する。そして、一致率が所定の閾値以上となった帳票の特徴情報を特定する情報(例えば、ID等)を表示部24に表示する。これにより、前記入力帳票11が識別され、その種類を、帳票識別情報格納メモリ21に格納されているあらかじめ登録された帳票の特徴情報を特定する情報として把握することができる。   Next, the form reading device 10 executes form identification processing. In the form identification process, the form identification processing unit 16 sequentially extracts feature information of various forms registered in advance in the form identification information storage memory 21 and inputs the input form 11 stored in the input image memory 13. And feature information extracted by the feature information extraction unit 14 from the image data. And information (for example, ID etc.) which specifies the feature information of the form whose coincidence rate is equal to or higher than a predetermined threshold is displayed on the display unit 24. As a result, the input form 11 is identified, and the type thereof can be grasped as information for specifying the characteristic information of the pre-registered form stored in the form identification information storage memory 21.

次に、フローチャートについて説明する。
ステップS1 画像入力処理を行う。
ステップS2 特徴情報抽出処理を行う。
ステップS3 帳票識別処理を行い、処理を終了する。
Next, a flowchart will be described.
Step S1: An image input process is performed.
Step S2: Feature information extraction processing is performed.
Step S3 A form identification process is performed and the process is terminated.

このように、本実施の形態において、帳票読取装置10は、罫線同士の間隔が狭かったり、複雑に込み入っていたりする領域における特徴情報を無効とし、他の領域における特徴情報に基づいて、入力帳票11を識別する。そのため、特徴情報に基づいて入力帳票11を適切に識別することができる。したがって、前記入力帳票11に記録された文字情報を正確に読み取ることができる。   As described above, in the present embodiment, the form reading device 10 invalidates the feature information in the area where the intervals between the ruled lines are narrow or complicated, and based on the feature information in the other area, 11 is identified. Therefore, the input form 11 can be appropriately identified based on the feature information. Therefore, the character information recorded on the input form 11 can be read accurately.

また、画像入力処理部12の種類や入力帳票11の画像データを取得する環境によらず、安定した入力帳票11の識別結果を得ることができる。   In addition, a stable identification result of the input form 11 can be obtained regardless of the type of the image input processing unit 12 and the environment in which the image data of the input form 11 is acquired.

なお、本発明は前記実施の形態に限定されるものではなく、本発明の趣旨に基づいて種々変形させることが可能であり、それらを本発明の範囲から排除するものではない。   In addition, this invention is not limited to the said embodiment, It can change variously based on the meaning of this invention, and does not exclude them from the scope of the present invention.

本発明の実施の形態における帳票読取装置の構成を示すブロック図である。It is a block diagram which shows the structure of the form reading apparatus in embodiment of this invention. 本発明の実施の形態における入力帳票の第1の例を示す図である。It is a figure which shows the 1st example of the input form in embodiment of this invention. 本発明の実施の形態における入力帳票の第2の例を示す図である。It is a figure which shows the 2nd example of the input form in embodiment of this invention. 本発明の実施の形態における入力帳票の第2の例の画像データを示す図である。It is a figure which shows the image data of the 2nd example of the input form in embodiment of this invention. 本発明の実施の形態における入力帳票の第2の例の画像データにおいて特徴情報を無効にする範囲を示す図である。It is a figure which shows the range which invalidates characteristic information in the image data of the 2nd example of the input form in embodiment of this invention. 本発明の実施の形態における帳票読取装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the form reading apparatus in embodiment of this invention.

符号の説明Explanation of symbols

10 帳票読取装置
11a−1、11a−2、11b 領域
12 画像入力処理部
14 特徴情報抽出部
16 帳票識別処理部
21 帳票識別情報格納メモリ
DESCRIPTION OF SYMBOLS 10 Form reader 11a-1, 11a-2, 11b Area | region 12 Image input process part 14 Feature information extraction part 16 Form identification process part 21 Form identification information storage memory

Claims (5)

(a)帳票の画像データを入力する画像入力手段と、
(b)前記画像データから特徴情報を抽出する特徴情報抽出手段と、
(c)該特徴情報抽出手段が抽出した特徴情報を、あらかじめ登録されている特徴情報と照合して前記帳票を識別する帳票識別手段とを有する帳票読取装置であって、
(d)前記特徴情報抽出手段は、前記画像データに特徴情報が多量に含まれる領域が存在すると該領域の特徴情報を無効とすることを特徴とする帳票読取装置。
(A) image input means for inputting image data of a form;
(B) feature information extracting means for extracting feature information from the image data;
(C) A form reading device having form identification means for identifying the form by comparing feature information extracted by the feature information extraction means with previously registered feature information,
(D) The form reading device, wherein the feature information extraction unit invalidates the feature information of the area when there is an area containing a large amount of feature information in the image data.
前記帳票識別手段は、前記領域外の特徴情報を、あらかじめ登録されている特徴情報と照合する請求項1に記載の帳票読取装置。 The form reading device according to claim 1, wherein the form identifying unit collates feature information outside the area with feature information registered in advance. 前記特徴情報は罫線情報であり、前記領域は閾値以上の密度で罫線が存在する領域である請求項1又は2に記載の帳票読取装置。 The form reading apparatus according to claim 1, wherein the feature information is ruled line information, and the area is an area where ruled lines exist at a density equal to or higher than a threshold value. 前記領域は、黒ベタ領域に白抜き文字が印刷されている領域又は暗証番号を隠すための領域を含む請求項3に記載の帳票読取装置。 The form reading apparatus according to claim 3, wherein the area includes an area where white characters are printed in a black solid area or an area for hiding a password. あらかじめ登録されている特徴情報を格納する登録済特徴情報記憶手段を更に有する請求項1に記載の帳票読取装置。 The form reading device according to claim 1, further comprising registered feature information storage means for storing pre-registered feature information.
JP2006259996A 2006-09-26 2006-09-26 Form reader Active JP4702244B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006259996A JP4702244B2 (en) 2006-09-26 2006-09-26 Form reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006259996A JP4702244B2 (en) 2006-09-26 2006-09-26 Form reader

Publications (2)

Publication Number Publication Date
JP2008083760A true JP2008083760A (en) 2008-04-10
JP4702244B2 JP4702244B2 (en) 2011-06-15

Family

ID=39354624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006259996A Active JP4702244B2 (en) 2006-09-26 2006-09-26 Form reader

Country Status (1)

Country Link
JP (1) JP4702244B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334183A (en) * 1997-05-30 1998-12-18 Fujitsu Ltd Black-and-whilte inverted area discriminating device and table recognition device using the same
JP2002133426A (en) * 2000-08-15 2002-05-10 Fujitsu Ltd Ruled line extracting device for extracting ruled line from multiple image

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334183A (en) * 1997-05-30 1998-12-18 Fujitsu Ltd Black-and-whilte inverted area discriminating device and table recognition device using the same
JP2002133426A (en) * 2000-08-15 2002-05-10 Fujitsu Ltd Ruled line extracting device for extracting ruled line from multiple image

Also Published As

Publication number Publication date
JP4702244B2 (en) 2011-06-15

Similar Documents

Publication Publication Date Title
US7644043B2 (en) Check processing apparatus, program, electronic payment system, and check processing method
US8510221B2 (en) Intelligent ATM check image deposit engine
US9836665B2 (en) Management system, list production device, method, computer readable recording medium, data structure, and printed label
JP2000251012A (en) Method and system for document processing
JPWO2009040922A1 (en) Paper sheet processing equipment
US10733435B1 (en) Document fraud detection
JP5385349B2 (en) Receipt definition data creation device and program thereof
JP2003323553A (en) Method and system for document processing
JP5566971B2 (en) Information processing program, information processing apparatus, and character recognition method
US8218851B1 (en) Identifying stored documents by evaluating image attributes
JP4702244B2 (en) Form reader
JP2019071006A (en) Transaction device, system, method, and program
JP2011003069A (en) Forged card detection system, forged card detection method, forged card detection program, and program recording medium
JP2009110472A (en) Business form reader
KR100956108B1 (en) The system of operating a electronic form
JP2005346512A (en) Financial institution paperwork distribution system
JP2003263607A (en) Slip processing method and system
CN218446808U (en) Intelligent government affair service terminal
WO2023171132A1 (en) Information processing system
JP2018116321A (en) Automatic transaction device, card reader, and method thereof
KR20090002012A (en) Device and program for verifying scaning image data and program recording medium and private paper
JP6695638B2 (en) Image processing program, image processing apparatus, and image processing method
JP2018140538A (en) Document cutting device, document cutting method and program
JP2007226329A (en) Business form data entry system
US20150086089A1 (en) Personal security system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110221

R150 Certificate of patent or registration of utility model

Ref document number: 4702244

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140318

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140318

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350