JP2007011656A - Character recognition system and character recognition method - Google Patents

Character recognition system and character recognition method Download PDF

Info

Publication number
JP2007011656A
JP2007011656A JP2005191162A JP2005191162A JP2007011656A JP 2007011656 A JP2007011656 A JP 2007011656A JP 2005191162 A JP2005191162 A JP 2005191162A JP 2005191162 A JP2005191162 A JP 2005191162A JP 2007011656 A JP2007011656 A JP 2007011656A
Authority
JP
Japan
Prior art keywords
character
field
recognition
correction
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005191162A
Other languages
Japanese (ja)
Other versions
JP4809637B2 (en
Inventor
Yoshifumi Abe
佳史 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP2005191162A priority Critical patent/JP4809637B2/en
Publication of JP2007011656A publication Critical patent/JP2007011656A/en
Application granted granted Critical
Publication of JP4809637B2 publication Critical patent/JP4809637B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a character recognition system capable of performing efficient correction. <P>SOLUTION: The character recognition system is provided with a document format file 110 for assigning a regulation number in each field when a document is provided with a field for entering credit judgment information and a field for entering incidental information and a recognized result file 130 for storing recognized result data obtained by character recognition according to the regulation number; where first recognition for recognizing characters written in the field specified by the regulation number, e.g. essential character information to be used for a credit, is performed, and when the recognized result data passes the credit judgment, second recognition for recognizing characters written in the other field specified by the regulation number, e.g. incidental information such as a company's address, is performed. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、帳票に記載された文字を光学的文字読取機能を用いて認識する光学文字読取装置における文字認識システム及び文字認識方法に係り、特に、帳票に複数の記入フィールドが存在し、特定の記入フィールドに記載された内容に応じて効率的に文字認識又は修正を行うことができる文字認識システム及び文字認識方法に関する。   The present invention relates to a character recognition system and a character recognition method in an optical character reader that recognizes characters written in a form using an optical character reading function, and in particular, there are a plurality of entry fields in a form, The present invention relates to a character recognition system and a character recognition method capable of efficiently performing character recognition or correction according to the contents described in an entry field.

一般に光学文字読取(OCR)システムは、スキャナの高速化や認識技術の高度化により、帳票の読み取り時間/読取り率が向上しているものの、不読や誤読はいまだにゼロとすることができず、このため不読や誤読文字を修正する時間がOCRシステムでのボトルネックとなっている。   In general, the optical character reading (OCR) system has improved the reading time / reading rate of the form due to the speeding up of the scanner and the advancement of the recognition technology, but unread and misreading still cannot be made zero. For this reason, the time to correct unread and misread characters is a bottleneck in the OCR system.

従来技術においては前記ボトルネックを低減させるために、帳票フォーマットと呼ぶ帳票の構造や複数の読取りフィールドの記載文字種などの属性を予め記憶させておき、各読取りフィールドの記載文字種などの属性に応じた文字認識を行うことによって、不読や誤読を低減する技術が下記特許文献により提案されている。
特開2002−150219号公報
In the prior art, in order to reduce the bottleneck, attributes such as form structure called form format and description character types of a plurality of reading fields are stored in advance, and according to attributes such as the description character type of each reading field. The following patent document proposes a technique for reducing unread or misread by performing character recognition.
JP 2002-150219 A

前記従来技術は、予め定めた複数の読取りフィールドの記載文字種、例えば数字や漢字等の文字種の属性に応じた文字認識を行うことができるものの、やはり不読や誤読をゼロとすることができず、このため不読や誤読がOCRシステムでのボトルネックとなり、事務処理効率を向上することができないと言う不具合があった。また前記認識した文字を修正端末のオペレータが行う際、オペレータの熟練度を考慮せずに文字修正が行われていたため文字修正の効率が良くないという不具合もあった。   Although the prior art can perform character recognition in accordance with the attributes of the character types described in a plurality of predetermined reading fields, for example, character types such as numbers and kanji, it still cannot eliminate unread or misreads. For this reason, there has been a problem that non-reading or misreading becomes a bottleneck in the OCR system, and the efficiency of office processing cannot be improved. In addition, when the operator of the correction terminal performs the recognized character, the character correction is performed without considering the skill level of the operator.

本発明の目的は、前述の従来技術による不具合を解決することであり、読み取り対象である帳票の記載内容に着目して事務処理効率を向上することができる文字認識システム及び文字認識方法を提供することである。   An object of the present invention is to solve the problems caused by the above-described conventional technology, and provide a character recognition system and a character recognition method capable of improving the paperwork efficiency by paying attention to the description content of a form to be read. That is.

具体的に説明すると、本願発明は、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取システムにおいて、前記規則番号により指定されたフィールドに記載された文字の認識を行う第1の認識を行い、該認識した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された文字の認識を行う第2の認識を行うことを第1の特徴とし、この文字認識システムにおいて、前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、前記第1の文字認識を行う際、前記与信審査情報を記入するフィールドに記載された文字の認識を行い、前記第2の文字認識を行う際、前記付随情報を記入するフィールドに記載された文字の認識を行うことを第2の特徴とする。   Specifically, the present invention comprises a form format file with a rule number assigned to each field, and a recognition result file that stores recognition result data that has undergone character recognition corresponding to the rule number, and a plurality of In an optical character reading system for recognizing characters described in a form comprising a feed using an optical character reading function, first recognition for recognizing characters described in the field specified by the rule number is performed. When the recognized recognition result data passes a predetermined examination, the first feature is to perform second recognition for recognizing characters described in other fields by the rule number. In the system, when the form includes a field for entering credit examination information and a field for entering accompanying information, the first character recognition The character written in the field for entering the credit review information is recognized, and the character written in the field for entering the accompanying information is recognized when performing the second character recognition. The second feature.

また本発明は、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取システムにおいて、前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正を行い、該修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正を行うことを第1の特徴とし、この文字認識システムにおいて、前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、前記第1の文字修正を行う際、前記与信審査情報を記入するフィールドに記載された認識文字の修正を行い、前記第2の文字修正を行う際、前記付随情報を記入するフィールドに記載された認識文字の修正を行うことを第2の特徴とする。   The present invention also includes a form format file in which a rule number is assigned to each field, and a recognition result file that stores recognition result data that has been subjected to character recognition in correspondence with the rule number, and includes a plurality of feeds. In the optical character reading system that performs character recognition using the optical character reading function, the first correction for correcting the recognized character described in the field specified by the rule number is performed. In the character recognition system, the first feature is to perform a second correction for correcting a recognized character described in another field by the rule number when the recognized result data passed a predetermined examination. When the form includes a field for entering credit examination information and a field for entering accompanying information, when performing the first character correction Correcting the recognized character described in the field for entering the credit review information, and correcting the recognized character described in the field for entering the accompanying information when performing the second character correction; It is characterized by.

また本発明は、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識システムにおいて、前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納し、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送することを第3の特徴とし、この文字認識システムにおいて、前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備え、前記転送を行うとき、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを第4の特徴とする。   Further, the present invention provides a form format file with rule numbers for each field, a recognition result file for storing recognition result data for character recognition corresponding to the rule numbers, and a plurality of corrections for recognized characters. In a character recognition system of an optical character reader that performs character recognition using an optical character reading function, a character specified in a field specified by the rule number is provided. Storing the recognized character recognition result data in the recognition result file in correspondence with the rule number, and reading the stored recognition result data from the recognition result file and transferring it to the correction terminal specified by the rule number. In this character recognition system, the form includes a field for entering only numbers and character information including kanji. And when the transfer is performed, the character recognition data in the field in which only numbers are entered and the character recognition data in the field in which character information including Chinese characters is transferred to different correction terminals. It is characterized by.

更に本発明は、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法において、前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを設け、前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正工程と、該第1の修正工程により修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正工程を含むことを第5の特徴とし、この文字認識方法において、前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、光学文字読取装置が、前記第1の修正工程により前記与信審査情報を記入するフィールドに記載された文字の修正を行い、前記第2の修正工程により前記付随情報を記入するフィールドに記載された文字の修正を行うことを第6の特徴とする。   Furthermore, the present invention provides a character recognition method for an optical character reader for recognizing characters described in a form composed of a plurality of feeds using an optical character reading function. A form format file with a number and a recognition result file for storing recognition result data subjected to character recognition corresponding to the rule number are provided, and correction of the recognized characters described in the field specified by the rule number A first correction step for performing the correction, and when the recognition result data corrected in the first correction step passes a predetermined examination, a second correction for correcting the recognized character described in the other field by the rule number. A fifth feature is that a correction step is included. In this character recognition method, the form fills in a field for entering credit examination information and accompanying information. The optical character reader corrects the character written in the field for entering the credit examination information in the first correction step, and enters the accompanying information in the second correction step. A sixth feature is that the characters written in the field are corrected.

また本発明は、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法において、前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを設け、前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納する工程と、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送する工程とを行う第7の特徴とし、この文字認識方法において、前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備えるとき、前記転送工程において、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを第8の特徴とする。   According to another aspect of the present invention, there is provided a character recognition method for an optical character reader that performs character recognition on a form composed of a plurality of feeds using an optical character reading function. A numbered form format file, a recognition result file for storing recognition result data for character recognition corresponding to the rule number, and a plurality of correction terminals for correcting the recognized character, and the rule number Storing the recognition result data of the characters described in the field designated by the field in the recognition result file corresponding to the rule number, and reading the stored recognition result data from the recognition result file to specify the rule number. And transferring the data to the corrected terminal. In this character recognition method, the form fills in only numbers. When a field and a field for entering character information including kanji are provided, the character recognition data in the field for entering only numbers and the character recognition data in the field for inputting character information including kanji are differently modified in the transfer step. The eighth feature is that the data is transferred to the terminal.

このように、本発明によれば、効率的な修正を行うために帳票のデータを分類する規則を定義し、帳票のフォーマット情報と共に、フィールドにその規則を符号化した情報を記憶し、それらを用いて認識文字情報を指定し、指定された情報を元にデータを入出力し、キー入力や修正画面の表示を行う修正手段を用いることにより、OCRなどから入力済みのデータを効率的に修正することができる。   As described above, according to the present invention, a rule for classifying form data for efficient correction is defined, information on the form encoded in the field is stored together with the format information of the form, and these are stored. Use this to specify recognition character information, input and output data based on the specified information, and use correction means to enter keys and display a correction screen, thereby efficiently correcting data already input from OCR, etc. can do.

以下、本発明による文字認識システム及び文字認識方法の一実施形態を図面を参照して詳細に説明する。図1は、本実施形態による文字認識システムの機能構成動作を示す図、図2は本実施形態による機器構成を示す図、図3は本実施形態に好適な帳票例を示す図、図4は本実施形態による帳票の帳票フォーマットを示す図、図5は本実施形態による帳票の文字認識結果を制御する制御パラメタを示す図、図6はクレジットカードの申込書の業務フローを説明するための図、図7は本実施形態に好適な各フィールドの集合を区別する規則の例を示す図である。
<原理説明>
Hereinafter, an embodiment of a character recognition system and a character recognition method according to the present invention will be described in detail with reference to the drawings. 1 is a diagram illustrating the functional configuration of the character recognition system according to the present embodiment, FIG. 2 is a diagram illustrating the device configuration according to the present embodiment, FIG. 3 is a diagram illustrating a form example suitable for the present embodiment, and FIG. FIG. 5 is a diagram showing a form format of a form according to the present embodiment, FIG. 5 is a diagram showing control parameters for controlling the character recognition result of the form according to the present embodiment, and FIG. 6 is a diagram for explaining a business flow of a credit card application form. FIG. 7 is a diagram showing an example of a rule for distinguishing a set of fields suitable for the present embodiment.
<Principle explanation>

まず、本発明の原理について説明する。一般に光学文字認識を行う対象である帳票としては各種のものが考えられるが、帳票に記載される内容としては、例えば、各種サークル/施設等の入会申込書やクレジットカードの申込書等では、必須な本人確認情報や与信審査のために必要な必須情報が記載されるフィールドと、顧客サービス向上のためのマーケティングやセグメント化を行うための付随情報が記載されるフィールドが存在し、更に、同じ文字情報と言っても数字等の簡易に修正が可能な文字種と漢字等の熟練を要するオペレータが修正する方が好ましい文字種とが存在する。   First, the principle of the present invention will be described. In general, there are various forms that can be used for optical character recognition. However, the contents to be included in the forms are essential for applications such as membership applications for various circles / facilities, credit card applications, etc. There are fields that contain essential information required for credit verification and credit review, and fields that contain accompanying information for marketing and segmentation to improve customer service. Even if it is information, there are character types that can be easily corrected such as numbers, and character types that are more preferably corrected by skilled operators such as kanji.

これを説明すると、本発明の対象となる対象帳票30は、図3に示す如く、施設の入会申込書の場合、例えば、氏名記入欄/生年月日欄/住所欄/勤め先の会社名/電話番号が個人確認情報並びに与信情報である必須情報の記入欄と、会社の住所/電話番号等の付随情報記入欄とに大別される。また、同時に当該対象帳票30は、郵便番号や電話番号等の数字等の簡易に修正が可能な文字種と、氏名や住所と言った漢字等の熟練を要するオペレータが修正する方が好ましい文字種が存在する。   Explaining this, as shown in FIG. 3, the target form 30 that is the subject of the present invention is, for example, a name entry field / birth date field / address field / working company name / telephone in the case of a facility membership application form. The number is roughly divided into a field for filling in essential information whose personal confirmation information and credit information and a field for entering accompanying information such as a company address / phone number. At the same time, the target form 30 has character types that can be easily corrected such as numbers such as postal codes and telephone numbers, and character types that are preferably corrected by skilled operators such as names and addresses. To do.

発明者は、前述の文字情報を読み取ったシステムが、前記氏名等の必須情報を審査し、この審査をパスした場合に他の付随情報を認識する必要が生じる特性に着目し、前記規則番号により指定された与信審査情報を記入するフィールドに記載された文字の修正を行う第1の修正を行い、該修正した認識結果データが所定の与信審査に合格したとき、前記規則番号により他の付随情報を記入するフィールドに記載された認識文字の修正を行う第2の修正を行う発明と、更に文字修正を行う際にはオペレータの能力差があることに着目し、前記規則番号により指定された数字及び漢字フィールドに記載された認識文字の修正を、前記規則番号により指定された修正端末に転送して効率的に文字修正を行う発明を成したものである。
<構成の説明>
The inventor examines essential information such as the name, etc., when the system that reads the above-mentioned character information, and pays attention to the characteristic that it is necessary to recognize other accompanying information when passing this examination, When the first correction for correcting the characters described in the field for entering the designated credit examination information is performed, and the corrected recognition result data passes a predetermined credit examination, other associated information is obtained by the rule number. Focusing on the fact that there is a difference in the ability of the operator when performing the second correction for correcting the recognized character described in the field for entering the character, and the number specified by the rule number And the correction of the recognized character written in the kanji field is transferred to the correction terminal designated by the rule number, and the invention for efficiently correcting the character is achieved.
<Description of configuration>

次に本実施形態による文字認識システム及び方法を図面を参照して説明する。本実施形態による文字認識システムが適用される機器構成は、図2に示す如く、帳票に記載された文字を光学的に読み取って認識する光学文字読取装置(OCR)25と、該OCR25を制御する帳票読取り端末20と、該帳票読取り端末20によって認識不能な不読文字や誤読文字を修正するための修正端末21及び22と、前記帳票読取り端末20によって読み取りが行われ、且つ修正端末21等により不読又は誤読文字を修正した認識結果データを格納する共有ディスク27と、該共有ディスク27に格納した認識結果データのうち、例えば氏名等の必須情報を入力して与信を行うための与信審査端末28と、前記帳票読取り端末20/修正端末21/修正端末22/共有ディスク27/与信審査端末28とを接続するネットワーク26とから構成される。   Next, a character recognition system and method according to the present embodiment will be described with reference to the drawings. The device configuration to which the character recognition system according to the present embodiment is applied, as shown in FIG. 2, controls an optical character reader (OCR) 25 that optically reads and recognizes characters written in a form, and controls the OCR 25. A form reading terminal 20, correction terminals 21 and 22 for correcting unread characters and misread characters unrecognizable by the form reading terminal 20, reading by the form reading terminal 20, and correction by the correction terminal 21 A shared disk 27 for storing recognition result data in which unread or misread characters are corrected, and a credit examination terminal for performing credit by inputting essential information such as a name among the recognition result data stored in the shared disk 27 28 and network 2 connecting the form reading terminal 20 / correction terminal 21 / correction terminal 22 / shared disk 27 / credit examination terminal 28 Composed of a.

この文字認識システムが適用される機器構成は、帳票読取り端末20が、OCR25が光学的に帳票から読み取った文字情報を認識してネットワーク26を介して共有ディスク27に一旦格納し、修正端末21等のオペレータが前記共有ディスク27に格納した認識結果データ(文字情報)並びにイメージデータを参照して誤読又は不読文字の修正を行った認識結果データを共有ディスク27に格納する様に構成されている。また前記与信審査端末28は、前記読み取った認識結果データの内、与信に必要な文字情報のみを参照して資格等の与信を行うものであるが、詳細動作については後述する。   In the device configuration to which this character recognition system is applied, the form reading terminal 20 recognizes the character information optically read from the form by the OCR 25, temporarily stores it in the shared disk 27 via the network 26, and the correction terminal 21 or the like. The recognition result data (character information) stored in the shared disk 27 and the recognition result data corrected by misreading or unreading characters with reference to the image data are stored in the shared disk 27. . Further, the credit examination terminal 28 refers to only character information necessary for credit among the read recognition result data, and performs credit such as qualification. The detailed operation will be described later.

さて、本実施形態による文字認識システムの機能は、図1に示す如く、認識結果ファイル名等を含む制御パラメータを格納する制御パラメータファイル100と、読み取り対象である帳票のフォーマットを格納する帳票フォーマットファイル110と、前記制御パラメータファイル100及び帳票フォーマットファイル110を参照して帳票読み取りを制御し、認識結果ファイルを認識結果ファイル130(図2の共有ディスク27に相当)に格納する帳票読取りプログラム120と、該帳票読取りプログラム120が読み取った認識結果ファイルの修正を行う認識結果修正プログラム140とから構成され、これら構成機能は前記帳票読取り端末20に含まれる。尚、図1中の各構成を結んでいる線は、それぞれの構成が関係あることを示し、数値などで指定がない表示は1対1の関係であり、1...*の表示は1対多の関係を示す。また前記制御パラメータ及び帳票フォーマットは、予めフォーマット作成者が、帳票読取りプログラムや認識結果修正プログラムが規定する所定の方法で作成するものであって、具体的には、テキストエディタなどを用いてCSVやXMLなどの所定の形式で作成されるものである。   As shown in FIG. 1, the function of the character recognition system according to the present embodiment includes a control parameter file 100 for storing control parameters including a recognition result file name and a form format file for storing a format of a form to be read. 110, a form reading program 120 that controls the reading of the form with reference to the control parameter file 100 and the form format file 110, and stores the recognition result file in the recognition result file 130 (corresponding to the shared disk 27 in FIG. 2); The form reading program 120 includes a recognition result correction program 140 that corrects the recognition result file read by the form reading program 120, and these constituent functions are included in the form reading terminal 20. In addition, the line which connects each structure in FIG. 1 shows that each structure is related, the display which is not designated with a numerical value etc. has a one-to-one relationship, and the display of 1 ... * is 1. Show a many-to-many relationship. The control parameters and the form format are created in advance by a format creator by a predetermined method prescribed by the form reading program or the recognition result correction program. Specifically, the control parameter and the form format are created using a text editor or the like. It is created in a predetermined format such as XML.

前記OCR25の読み取り対象となる対象帳票は、前述の図3に示した如く記載形式であり、この対象帳票の帳票フォーマット40は、図4に示す如く、項番/この項番の名称/この項番に記載される文字の属性/前記必須情報か付随情報かを識別するための規則番号/記載される最大の文字数/該項番の位置(座標)/項番の意味の複数項目から構成され、本例では、項番1が、この項目の名称が「氏名1」/その文字属性が「カタカナ」/規則番号が「1」(必須情報)/文字数が「30」文字/位置が「0350,1850,0050,0120」/意味が「氏名:フリガナ」であり、規則番号「1」が優先処理項目、規則番号「2」が準優先項目として設定している。尚、当該規則番号は、前述した必須か否か等に限られるものではなく、例えばオペレータの能力差等の要因から効率的な修正を行うことができる規則(数字等の単純な修正と漢字等の比較的修正が困難な修正)であっても良い。   The target form to be read by the OCR 25 has a description format as shown in FIG. 3, and the form format 40 of the target form has an item number / name of this item number / this item as shown in FIG. Character number described in number / Rule number for identifying whether it is essential information or accompanying information / Maximum number of characters described / Position (position) of item number / Meaning of item number In this example, item number 1 is the name of this item “name 1” / its character attribute is “katakana” / rule number is “1” (essential information) / number of characters is “30” characters / position is “0350”. , 1850, 0050, 0120 ”/ meaning“ name: reading ”, rule number“ 1 ”is set as a priority processing item, and rule number“ 2 ”is set as a semi-priority item. Note that the rule number is not limited to the above-described necessity or not, but is a rule that allows efficient correction (for example, simple correction of numbers, kanji, etc.) due to factors such as operator ability differences. Correction that is relatively difficult to correct).

前記規則番号は、読み取られる帳票の記載内容に応じて設定されるものであり、例えば帳票がクレジットカードの申込書の場合、この規則番号は、図7の規則71に示す如く、与信に必要なデータに対して「1」、与信完了後に修正を行うデータに対して「2」、全てのデータに対して「0」を設定することや、データエントリ会社の場合、生年月日やクレジット番号等の数字のみの文字情報のフィールドとして「3」、氏名/住所等の漢字を含む文字情報のフィールドとして「4」を設定する。   The rule number is set according to the description content of the form to be read. For example, when the form is a credit card application, this rule number is necessary for credit as shown in rule 71 of FIG. Set “1” for data, “2” for data to be corrected after credit completion, “0” for all data, or date of birth, credit number, etc. for data entry companies “3” is set as a field for character information of only numbers, and “4” is set as a field for character information including Chinese characters such as name / address.

前記帳票フォーマットファイル110は、図1に示す如く、前述した対象帳票フォーマット40の帳票長さ/幅/修正画面情報を格納した帳票フォーマット111と、各フィールドの位置情報/文字数等を格納したフィールド112と、該フィールド112毎の規則番号を格納したフィールド規則113と、該フィールドの画面内の位置情報を格納したフィールド修正画面114と、認識文字のチェック方式を格納したフィールドチェック情報115とから構成される。この制御パラメータファイル100に格納される制御パラメータは、図5に示す如く、帳票フォーマット例/修正する規則番号/認識結果ファイル名を格納した与信に必要なデータ修正を行うための制御パラメータ51と、同構成を格納した与信完了後データ修正を行うための制御パラメータ52が格納されている。   As shown in FIG. 1, the form format file 110 includes a form format 111 storing the form length / width / modified screen information of the target form format 40 described above, and a field 112 storing position information / number of characters of each field. A field rule 113 that stores a rule number for each field 112, a field correction screen 114 that stores position information in the screen of the field, and field check information 115 that stores a check method for a recognized character. The The control parameters stored in the control parameter file 100 include, as shown in FIG. 5, a control parameter 51 for performing data correction necessary for credit storing a form format example / rule number to be corrected / recognition result file name, Stored is a control parameter 52 for correcting data after completion of credit storing the same configuration.

前記帳票読取りプログラム120は、図1に示す如く、辞書を参照して文字認識を行う文字認識部122と、フィールド情報を参照して指定されたフィールドデータを制御するデータ入出力部123と、メニュー画面や修正画面を制御するための画面管理部124とから構成され、帳票読取り部121が、文字認識部122を用いてデータ入出力部123によって指定されたフィールド内の文字情報を認識する様に動作するものである。   As shown in FIG. 1, the form reading program 120 includes a character recognition unit 122 that performs character recognition with reference to a dictionary, a data input / output unit 123 that controls field data designated with reference to field information, and a menu. The screen management unit 124 controls the screen and the correction screen, and the form reading unit 121 recognizes the character information in the field designated by the data input / output unit 123 using the character recognition unit 122. It works.

前記認識結果修正プログラム140は、指定された制御パラメータ名や規則番号に従って認識結果ファイル130に格納された文字認識結果を修正する認識結果修正部141と、フィールド情報を参照して指定されたフィールドデータを制御するデータ入出力部142と、メニュー画面や修正画面を制御するための画面管理部143とから構成される。
<動作説明>
The recognition result correction program 140 includes a recognition result correction unit 141 that corrects a character recognition result stored in the recognition result file 130 according to a specified control parameter name and rule number, and field data specified by referring to field information. The data input / output unit 142 controls the screen and the screen management unit 143 for controlling the menu screen and the correction screen.
<Description of operation>

さて、この様に構成された文字認識システムは、図7の規則71を適用した帳票がクレジットカードの申込書の場合、図6に示す如く、規則番号1の文字情報である氏名等の必須情報の修正を行い(ステップ60)、この修正を行った氏名等の必須情報を用いてクレジットカードに入会可能か否かの与信を実施し(ステップ61)、次いで前記与信の審査結果がOKか否かの判定(ステップ62)を行い、該ステップ62により与信結果がNOのときには与信NG処理を行い、前記ステップ62により与信がOKと判定されたときには、カード発行や関連書類の顧客―の発送処理(ステップ64)を行った後に、前述の会社住所等の付随情報の修正処理を行う様に動作する。   Now, in the character recognition system configured as described above, when the form to which the rule 71 of FIG. 7 is applied is a credit card application form, as shown in FIG. (Step 60), using the essential information such as the name of the person who made the correction, a credit as to whether or not it is possible to join a credit card is implemented (step 61), and then whether or not the credit examination result is OK If the credit result is NO in step 62, the credit NG process is performed. If the credit is determined to be OK in step 62, the card issuance and the related document customer shipping process are performed. After performing (Step 64), the operation is performed to correct the accompanying information such as the company address described above.

前記処理手順は、例えばデータエントリ会社の場合、規則番号1を漢字等の熟練を要する文字情報とし、規則番号2を数字等の修正が容易な文字情報とし、熟練者が漢字等の文字情報の修正を行った後に新人が数字の文字情報の修正を行うように変更しても良い。   For example, in the case of a data entry company, the processing procedure is as follows: rule number 1 is character information that requires skill such as kanji, rule number 2 is character information that can be easily corrected such as numbers, and the skilled person has character information such as kanji. You may change so that a new face may correct the character information of a number after correcting.

また本処理手順は、例えばデータエントリ会社において、規則番号1により指定されたフィールドから認識した認識文字を熟練者が操作する修正端末に送信し、規則番号2により指定されたフィールドから認識した認識文字を非熟練者が操作する修正端末に送信し、両者に平行して文字修正業務を分担することによって、効率的な文字修正を行うことができる。   Further, this processing procedure, for example, transmits a recognized character recognized from a field designated by rule number 1 to a correction terminal operated by a skilled worker at a data entry company, and recognized character recognized from a field designated by rule number 2. Is transmitted to a correction terminal operated by an unskilled person, and the character correction work is shared in parallel with both of them, whereby efficient character correction can be performed.

この様に本発明は、帳票内のフィールドをそれらの規則に応じて分類て、必要な部分のみを先に処理して、事務処理を効率化するとともに、顧客へのレスポンスのスピードを向上することができる。   In this way, the present invention classifies the fields in the form according to those rules, processes only the necessary parts first, improves the efficiency of paperwork, and improves the speed of response to customers. Can do.

本発明の一実施形態による文字認識システムの機能構成動作を示す図。The figure which shows the function structure operation | movement of the character recognition system by one Embodiment of this invention. 本実施形態による機器構成を示す図。The figure which shows the apparatus structure by this embodiment. 本実施形態に好適な帳票例を示す図。The figure which shows the example of a form suitable for this embodiment. 本実施形態による帳票の帳票フォーマットを示す図。The figure which shows the form format of the form by this embodiment. 本実施形態による帳票の文字認識結果を制御する制御パラメータを示す図。The figure which shows the control parameter which controls the character recognition result of the form by this embodiment. クレジットカードの申込書の業務フローを説明するための図。The figure for demonstrating the work flow of an application form of a credit card. 本実施形態に好適な各フィールドの集合を区別する規則の例を示す図。The figure which shows the example of the rule which distinguishes the collection of each field suitable for this embodiment.

符号の説明Explanation of symbols

20:帳票読取り端末、21〜22:修正端末、26:ネットワーク、27:共有ディスク、28:与信審査端末、30:対象帳票、40:帳票フォーマット、51〜52:制御パラメータ、71〜72:規則、100:制御パラメータファイル、110:帳票フォーマットファイル、111:帳票フォーマット、112:フィールド、113:フィールド規則、114:フィールド修正画面、115:フィールドチェック情報、120:プログラム、121:帳票読取り部、122:文字認識部、123:データ入出力部、124:画面管理部、130:認識結果ファイル、140:認識結果修正プログラム、141:認識結果修正部、142:データ入出力部、143:画面管理部。
20: form reading terminal, 21-22: correction terminal, 26: network, 27: shared disk, 28: credit examination terminal, 30: target form, 40: form format, 51-52: control parameter, 71-72: rule , 100: control parameter file, 110: form format file, 111: form format, 112: field, 113: field rule, 114: field modification screen, 115: field check information, 120: program, 121: form reading unit, 122 : Character recognition unit, 123: data input / output unit, 124: screen management unit, 130: recognition result file, 140: recognition result correction program, 141: recognition result correction unit, 142: data input / output unit, 143: screen management unit .

Claims (8)

前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取システムであって、
前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正を行い、該修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正を行うことを特徴とする文字認識システム。
Characters described in a form composed of a plurality of feeds, each comprising a form format file with a rule number for each field and a recognition result file storing character recognition result data corresponding to the rule number An optical character reading system that performs character recognition using an optical character reading function,
When the first correction is performed to correct the recognized character described in the field specified by the rule number, and the corrected recognition result data passes a predetermined examination, it is described in the other field by the rule number. A character recognition system that performs a second correction for correcting the recognized character.
前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、前記第1の文字修正を行う際、前記与信審査情報を記入するフィールドに記載された認識文字の修正を行い、前記第2の文字修正を行う際、前記付随情報を記入するフィールドに記載された認識文字の修正を行うことを特徴とする請求項1記載の文字認識システム。   When the form includes a field for entering credit examination information and a field for entering accompanying information, the correction of the recognized character described in the field for entering the credit examination information when performing the first character correction The character recognition system according to claim 1, wherein when the second character correction is performed, the recognition character described in the field for entering the accompanying information is corrected. 前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識システムであって、
前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納し、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送することを特徴とする文字認識システム。
A form format file with a rule number for each field, a recognition result file for storing recognition result data corresponding to character recognition in correspondence with the rule number, and a plurality of correction terminals for correcting recognized characters A character recognition system of an optical character reader that performs character recognition using an optical character reading function for characters described in a form composed of a plurality of feeds,
Character recognition result data described in the field specified by the rule number is stored in the recognition result file corresponding to the rule number, and the stored recognition result data is read from the recognition result file and specified by the rule number. The character recognition system is characterized in that it is transferred to a modified terminal.
前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備え、前記転送を行うとき、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを特徴とする請求項3記載の文字認識システム。   The form includes a field for entering only numbers and a field for entering character information including kanji. When performing the transfer, the character recognition data of the field for entering only numbers and the character information including kanji are entered. 4. The character recognition system according to claim 3, wherein the character recognition data in the field is transferred to a different correction terminal. 複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法であって、
前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを設け、
前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正工程と、該第1の修正工程により修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正工程を含むことを特徴とする文字認識方法。
A character recognition method for an optical character reader for recognizing characters by using an optical character reading function for characters described in a form composed of a plurality of feeds,
The optical character reader is provided with a form format file with a rule number for each field, and a recognition result file for storing recognition result data for character recognition corresponding to the rule number,
A first correction step of correcting the recognition character described in the field designated by the rule number, and when the recognition result data corrected by the first correction step passes a predetermined examination, the rule number A character recognition method comprising a second correction step of correcting a recognized character described in another field.
前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、光学文字読取装置が、前記第1の修正工程により前記与信審査情報を記入するフィールドに記載された文字の修正を行い、前記第2の修正工程により前記付随情報を記入するフィールドに記載された文字の修正を行うことを特徴とする請求項5記載の文字認識方法。   When the form includes a field for entering credit examination information and a field for entering accompanying information, the character written in the field for entering the credit examination information by the optical character reader by the first correction step. 6. The character recognition method according to claim 5, wherein the character described in the field in which the accompanying information is entered is corrected in the second correction step. 複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法であって、
前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを設け、
前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納する工程と、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送する工程とを行う特徴とする文字認識方法。
A character recognition method for an optical character reader for recognizing characters by using an optical character reading function for characters described in a form composed of a plurality of feeds,
In the optical character reader, a form format file with a rule number assigned to each field, a recognition result file for storing recognition result data corresponding to character recognition corresponding to the rule number, and correction of the recognized character Multiple correction terminals to perform,
Storing the recognition result data of the characters described in the field designated by the rule number in the recognition result file corresponding to the rule number; and reading the stored recognition result data from the recognition result file to the rule number And a step of transferring to a correction terminal specified by the character recognition method.
前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備えるとき、前記転送工程において、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを特徴とする請求項7記載の文字認識方法。
When the form includes a field for entering only numbers and a field for entering character information including Chinese characters, the character recognition data of the field for entering only numbers and the character information including Chinese characters are input in the transfer step. 8. The character recognition method according to claim 7, wherein the character recognition data in the field is transferred to a different correction terminal.
JP2005191162A 2005-06-30 2005-06-30 Character recognition system and character recognition method Active JP4809637B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005191162A JP4809637B2 (en) 2005-06-30 2005-06-30 Character recognition system and character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005191162A JP4809637B2 (en) 2005-06-30 2005-06-30 Character recognition system and character recognition method

Publications (2)

Publication Number Publication Date
JP2007011656A true JP2007011656A (en) 2007-01-18
JP4809637B2 JP4809637B2 (en) 2011-11-09

Family

ID=37750076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005191162A Active JP4809637B2 (en) 2005-06-30 2005-06-30 Character recognition system and character recognition method

Country Status (1)

Country Link
JP (1) JP4809637B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011022718A (en) * 2009-07-14 2011-02-03 Toshiba Corp Information processing system and information processing method
JP2019029971A (en) * 2017-08-03 2019-02-21 キヤノン株式会社 Image processing apparatus, control method of the same, program, and image processing system
JP2020181365A (en) * 2019-04-25 2020-11-05 株式会社ミック Business form preparation system
US11227154B2 (en) 2018-05-25 2022-01-18 Fukuoka Financial Group, Inc. Ledger recognition system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS635468A (en) * 1986-06-25 1988-01-11 Hitachi Ltd Slip processing system
JPH08129606A (en) * 1994-11-01 1996-05-21 Fujitsu Ltd Optical character reader
JP2001297305A (en) * 2000-04-14 2001-10-26 Oki Software Kk Centralized ocr exchange processing system
JP2003058813A (en) * 2001-08-09 2003-02-28 Jis:Kk Data entry system
JP2005038205A (en) * 2003-07-15 2005-02-10 Credit Saison Co Ltd Credit guarantee acceptance/refusal examination system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS635468A (en) * 1986-06-25 1988-01-11 Hitachi Ltd Slip processing system
JPH08129606A (en) * 1994-11-01 1996-05-21 Fujitsu Ltd Optical character reader
JP2001297305A (en) * 2000-04-14 2001-10-26 Oki Software Kk Centralized ocr exchange processing system
JP2003058813A (en) * 2001-08-09 2003-02-28 Jis:Kk Data entry system
JP2005038205A (en) * 2003-07-15 2005-02-10 Credit Saison Co Ltd Credit guarantee acceptance/refusal examination system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011022718A (en) * 2009-07-14 2011-02-03 Toshiba Corp Information processing system and information processing method
JP2019029971A (en) * 2017-08-03 2019-02-21 キヤノン株式会社 Image processing apparatus, control method of the same, program, and image processing system
JP6993808B2 (en) 2017-08-03 2022-01-14 キヤノン株式会社 Image processing equipment, its control method, and programs
US11227154B2 (en) 2018-05-25 2022-01-18 Fukuoka Financial Group, Inc. Ledger recognition system
JP2020181365A (en) * 2019-04-25 2020-11-05 株式会社ミック Business form preparation system

Also Published As

Publication number Publication date
JP4809637B2 (en) 2011-11-09

Similar Documents

Publication Publication Date Title
JP4829920B2 (en) Form automatic embedding method and apparatus, graphical user interface apparatus
JP4077909B2 (en) Form processing device
US9349046B2 (en) Smart optical input/output (I/O) extension for context-dependent workflows
EP1111539A2 (en) Form handling system
US10528807B2 (en) System and method for processing and identifying content in form documents
JPH06502508A (en) Improved automatic data reading
JP4809637B2 (en) Character recognition system and character recognition method
US10922537B2 (en) System and method for processing and identifying content in form documents
JP5113238B2 (en) FAXOCR equipment and FAXOCR program
KR101516684B1 (en) A service method for transforming document using optical character recognition
US20100023517A1 (en) Method and system for extracting data-points from a data file
JPH11282612A (en) Information input method and system
CN113947510A (en) Real estate electronic license management system based on file format self-adaptation
JP4516376B2 (en) Form processing system
TWM553835U (en) Automatic intelligent accounting system
CN101727572A (en) Method for ensuring image integrity by using file characteristics
JP4887867B2 (en) Character reader
JP2008090536A (en) Form processing system and method
JP4748013B2 (en) Character recognition device, character recognition system, and character recognition method
JP2007334735A (en) Device for verifying consistency between paper document and electronic data, method, and computer program thereof
Fernando Intelligent Document Processing: A Guide For Building RPA Solutions
CN114820211B (en) Method, device, computer equipment and storage medium for checking and verifying quality of claim data
US20240303628A1 (en) Systems and methods for enrollment and identity management using mobile imaging
JP2011022718A (en) Information processing system and information processing method
JP2010226387A (en) Slip image filing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080627

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110819

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140826

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4809637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250