JP5715219B2 - Form processing system, server, program, and form processing method - Google Patents

Form processing system, server, program, and form processing method Download PDF

Info

Publication number
JP5715219B2
JP5715219B2 JP2013235583A JP2013235583A JP5715219B2 JP 5715219 B2 JP5715219 B2 JP 5715219B2 JP 2013235583 A JP2013235583 A JP 2013235583A JP 2013235583 A JP2013235583 A JP 2013235583A JP 5715219 B2 JP5715219 B2 JP 5715219B2
Authority
JP
Japan
Prior art keywords
operator
characters
data
character
character data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013235583A
Other languages
Japanese (ja)
Other versions
JP2014063507A (en
Inventor
裕詞 上地
裕詞 上地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2013235583A priority Critical patent/JP5715219B2/en
Publication of JP2014063507A publication Critical patent/JP2014063507A/en
Application granted granted Critical
Publication of JP5715219B2 publication Critical patent/JP5715219B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、金融機関に設置され、口座開設依頼書などの帳票の処理を行うオペレータの端末に帳票のイメージデータや文字データを送信する帳票処理システム、サーバ、プログラムおよび帳票処理方法に関する。   The present invention relates to a form processing system, a server, a program, and a form processing method that are installed in a financial institution and transmit form image data and character data to an operator's terminal that processes forms such as an account opening request form.

従来の帳票処理システムは、顧客の帳票のスキャン作業により得られたイメージデータやOCR(Optical Character Recognition)処理によって得られる文字データ等の帳票のデータをサーバ装置が管理し、サーバ装置からオペレータ端末に帳票のデータを送信することで、オペレータに対して帳票の内容の確認や、内容訂正等の処理を行わせるようにしている。   In a conventional form processing system, a server apparatus manages form data such as image data obtained by scanning a form of a customer and character data obtained by OCR (Optical Character Recognition) processing, from the server apparatus to an operator terminal. By transmitting the form data, the operator can confirm the contents of the form and correct the contents.

このとき印鑑照合や入力内容の不備を修正する等の高度な確認を要する作業の対象となる帳票のデータをスキル(習熟度)レベルの高いオペレータが操作するオペレータ端末に送信している(例えば、特許文献1参照)。   At this time, the form data to be subjected to work requiring high level confirmation such as seal verification and correction of input contents is transmitted to an operator terminal operated by an operator with a high skill level (for example, Patent Document 1).

特開2006−146830号公報(段落「0033」−段落「0034」、図1)JP 2006-146830 A (paragraph “0033” -paragraph “0034”, FIG. 1)

しかしながら、上述した従来の技術においては、帳票に記載された文字そのものは考慮されていない。すなわち、OCR処理により得られる文字データには、もとのイメージデータで記載された文字から誤認識されてしまった文字を含むことが有る。そして誤認識され易い類似文字を多く含む帳票は類似文字が少ない帳票に比べ、確認作業においてオペレータの注意がより重要となり、処理の難易度が高くなる。ところが、従来の方法では類似文字の多少の程度は作業の難易度と無関係とし考慮されていなかったため、習熟度レベルの低いオペレータにも習熟度レベルが高いオペレータにも無作為に類似文字の多い(難易度の高い)帳票、類似文字の少ない(難易度の低い)帳票のデータを送信して確認作業をさせていた。この場合、習熟度レベルの高いオペレータが、前記難易度の高い帳票のデータを担当すれば問題は少ないが、習熟度レベルの低いオペレータが、前記難易度の高い帳票を担当した場合、不慣れのため、誤認識されてしまった類似文字の修正をし損なうという人為的ミスの発生の可能性が高くなるという問題がある。   However, in the conventional technology described above, the characters themselves described in the form are not considered. That is, the character data obtained by the OCR process may include characters that have been erroneously recognized from the characters described in the original image data. In addition, a form including many similar characters that are easily misrecognized is more important for the operator in the confirmation operation than a form having few similar characters, and the degree of processing becomes high. However, in the conventional method, since some degree of similar characters is not considered as being irrelevant to the difficulty of work, there are many similar characters at random for both low-level and high-level operators ( The data of a form (high difficulty) and a form with few similar characters (low difficulty) were sent for confirmation. In this case, there is little problem if an operator with a high level of proficiency is responsible for the data of the form with high difficulty, but it is unfamiliar when an operator with a low proficiency level is in charge of the form with high degree of difficulty. However, there is a problem that the possibility of an artificial error of failing to correct similar characters that have been misrecognized increases.

本発明は、上記の問題点を解決するための手段を提供することを目的とする。   An object of the present invention is to provide means for solving the above problems.

本発明は、上記課題を解決するために、帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータが文字データの修正もしくは確認する作業を行う帳票処理システムであって、あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせることを特徴とする。 To solve the above problems, the present invention compares a form image data with character data obtained by character recognition of the image data, and a form processing system in which an operator performs an operation of correcting or confirming character data. In this case, a character having a similar shape is defined in advance as a similar character, and whether the number of the similar characters among the characters included in the character data of the form is large or small with respect to the character recognition result of the form. Based on the information shown and information on the proficiency level of the operator's work, an operator with a high proficiency level is in charge of a form with a lot of similar characters, and an operator with a low proficiency level is in charge of a form with few similar characters As described above, the operator in charge of the form is determined, and the character data of the form is corrected or confirmed.

これにより、本発明は、類似文字の数の情報に応じてオペレータ選定を行い、帳票の処理をさせることができるので、類似文字を誤って処理してしまうという人為的ミスの発生を低減させることができるという効果が得られる。   As a result, the present invention can select operators according to information on the number of similar characters and process the form, thereby reducing the occurrence of human error such as processing similar characters by mistake. The effect of being able to be obtained.

実施例1の帳票処理システムの構成を示すブロック図1 is a block diagram showing the configuration of a form processing system according to a first embodiment. 類似文字の一例を示す表Table showing examples of similar characters 帳票データテーブルの構成を示す説明図Explanatory drawing showing the structure of the form data table オペレータテーブルの構成を示す説明図Explanatory drawing showing the configuration of the operator table 帳票のスキャン処理を示すフローチャートFlow chart showing form scan processing 帳票内容確認処理の手順を示すフローチャートFlow chart showing the procedure of the form content confirmation process 帳票データテーブルから帳票データを抽出するまでの流れを示す説明図Explanatory drawing which shows the flow until it extracts form data from a form data table

以下に、図面を参照して本発明による帳票処理システム、サーバ、プログラムおよび帳票処理方法の実施例について説明する。   Embodiments of a form processing system, server, program, and form processing method according to the present invention will be described below with reference to the drawings.

図1は第1の実施例における帳票処理システムの構成を示すブロック図である。   FIG. 1 is a block diagram showing the configuration of a form processing system in the first embodiment.

1は帳票読取装置であり、金融機関等の営業店もしくは事務センタ等に設置されるものであり、通信回線9を介して他の装置と相互に通信可能に接続されている。   Reference numeral 1 denotes a form reading apparatus which is installed in a branch office such as a financial institution or an office center, and is connected to another apparatus through a communication line 9 so as to be able to communicate with each other.

2は表示部であり、CRT、液晶ディスプレイ等の表示手段である。   Reference numeral 2 denotes a display unit, which is a display means such as a CRT or a liquid crystal display.

3は入力部であり、キーボード、マウス等の入力手段である。   Reference numeral 3 denotes an input unit, which is an input means such as a keyboard and a mouse.

5は制御部であり、CPU等の演算および制御手段等で構成されたものであり、記憶部6に格納された制御プログラムに基づいて帳票読取装置1全体の動作を制御する。   Reference numeral 5 denotes a control unit, which is configured by arithmetic and control means such as a CPU, and controls the overall operation of the form reading apparatus 1 based on a control program stored in the storage unit 6.

また、制御部5は後述するスキャナ装置7に対して帳票のイメージデータの読取りを指示すると共にそのスキャナ装置7が読取ったイメージデータを取得する機能を有しており、その機能は記憶部6に格納したスキャナ装置7に動作指示を行うためのプログラムによって実現される。   The control unit 5 has a function of instructing a scanner device 7 to be described later to read the image data of the form and acquiring the image data read by the scanner device 7. The function is stored in the storage unit 6. This is realized by a program for instructing the stored scanner device 7 to operate.

また、制御部5は帳票のイメージデータを識別するシーケンス番号を採番する採番手段、帳票のイメージデータから帳票に記載された文字をOCR認識(光学式文字認識)により認識し、その認識した内容をもとに帳票上の記載文字を示す文字データに変換する文字認識手段、文字データに含まれる文字の内、別の文字と誤認識される可能性の高い文字(類似文字という)の割合(類似文字率という)を算出する類似文字率算出手段を備えている。   Further, the controller 5 is a numbering means for assigning a sequence number for identifying the image data of the form, and recognizes the characters described in the form from the image data of the form by OCR recognition (optical character recognition). Character recognition means for converting to character data indicating the characters written on the form based on the content. Proportion of characters (referred to as similar characters) that are likely to be misrecognized as other characters among the characters included in the character data. Similar character rate calculating means for calculating (similar character rate) is provided.

なお、類似文字率は、類似文字率「%」=類似文字の文字数÷全文字数×100による式で算出される。   Note that the similar character ratio is calculated by the following formula: similar character ratio “%” = number of similar characters ÷ total number of characters × 100.

6は記憶部であり、帳票読取装置1全体の動作を制御する制御プログラムやスキャナ装置7に動作指示を行うためのプログラム等を格納する他、スキャナ装置7で読取った帳票の枚数、読取ったそれぞれの帳票のイメージデータ等を記憶する。   Reference numeral 6 denotes a storage unit that stores a control program for controlling the overall operation of the form reading device 1 and a program for instructing the scanner device 7 to operate, as well as the number of forms read by the scanner device 7 and the respective numbers read. The image data of the form is stored.

また記憶部6は、誤認識される可能性の高い類似文字をテーブルとして、例えば図2のように格納している。   The storage unit 6 stores similar characters that are likely to be erroneously recognized as a table, for example, as shown in FIG.

ここで、類似文字のテーブルに含まれる文字の一例を図2の類似文字の一例を示す表を用いて説明する。   Here, an example of characters included in the similar character table will be described with reference to a table showing an example of similar characters in FIG.

図2に示すように誤認識の可能性が高い組合せの文字例として、数字同士では「1」と「7」、「0」と「6」と「9」等、アルファベット同士では「E」と「F」、「O」と「Q」、「a」と「d」、「c」と「e」等、記号同士では「“」と「‘」等、ひらがな同士では「き」と「さ」、「め」と「ぬ」等、カタカナ同士では「エ」と「コ」、「ク」と「リ」等、漢字同士では「因」と「困」、「侍」と「待」等が挙げられる。   As shown in FIG. 2, examples of combinations of characters with a high possibility of erroneous recognition include “1” and “7” between numbers, “0” and “6” and “9”, and “E” between alphabets. “F”, “O” and “Q”, “a” and “d”, “c” and “e”, etc. “s” and “'” between symbols, “ki” and “sa” between hiragana ”,“ Me ”and“ Nu ”, etc.“ Ka ”and“ K ”,“ Ku ”and“ Li ”, etc. between katakana,“ Cause ”and“ Trouble ”,“ 侍 ”and“ Wai ”etc. Is mentioned.

また、数字とアルファベットの組合せでは「1」と「i」、「0」と「Q」、「8」と「B」等、数字と記号の組合せでは「1」と「!」等、アルファベットと記号の組合せでは「I」と「!」、「O」と「。」等、ひらがなとカタカナの組合せでは「い」と「ハ」、「り」と「リ」等、カタカナと漢字の組合せでは「ロ」と「口」等が挙げられる。   Also, in the combination of numbers and alphabets, “1” and “i”, “0” and “Q”, “8” and “B”, etc., and in the combination of numbers and symbols, “1” and “!”, Etc. Symbol combinations “I” and “!”, “O” and “.”, Etc., hiragana and katakana combinations “I” and “ha”, “ri” and “li”, etc., and katakana and kanji combinations "Ro" and "mouth" are examples.

7はスキャナ装置であり、CCD(Charge Coupled Device)カメラ等で構成され、帳票のイメージデータを読取る機能を有する。   Reference numeral 7 denotes a scanner device, which includes a CCD (Charge Coupled Device) camera and the like, and has a function of reading image data of a form.

このスキャナ装置7は図示しない帳票吸入部に載置された帳票を図示しない帳票分離搬送手段により1枚ずつ分離して搬送し、その帳票のイメージデータを読取ることができるようになっている。すなわち、帳票吸入部に載置された複数の帳票を連続して読取ることができるようになっている。   The scanner device 7 is configured to separate and convey a form placed on a form suction unit (not shown) one by one by a form separation / conveying means (not shown) and read image data of the form. In other words, a plurality of forms placed on the form suction unit can be read continuously.

尚、スキャナはOCR一体型のものでもよい。   The scanner may be an OCR integrated type.

スキャナ装置7で読取る帳票は、例えば、口座開設依頼書の他に各種届けを申し込む諸届け帳票、投資信託購入募集申込書等の投信帳票、および外貨預金申込書等である。尚、所定の形式を有するものはもとより、非定型の帳票でもよい。   The forms read by the scanner device 7 include, for example, various delivery forms for applying for various deliveries, investment trust forms such as investment trust purchase application forms, and foreign currency deposit application forms in addition to the account opening request form. It should be noted that not only those having a predetermined format but also non-standard forms may be used.

8は帳票DB(データベース)サーバであり、図示しない通信手段を備えており、通信回線9を介して帳票読取装置1等の他の装置と相互に通信可能に接続されている。   A form DB (database) server 8 includes communication means (not shown), and is connected to other apparatuses such as the form reading apparatus 1 through the communication line 9 so as to be able to communicate with each other.

8aはサーバ制御部であり、サーバ記憶部8bに格納された帳票DBサーバ8を制御する制御プログラムに従って、帳票DBサーバ8の各部を制御して各種処理を遂行する。   A server control unit 8a performs various processes by controlling each unit of the form DB server 8 according to a control program for controlling the form DB server 8 stored in the server storage unit 8b.

サーバ記憶部8bは、帳票DBサーバ8を制御する制御プログラムを格納すると共に、帳票読取装置1から受信したイメージデータ及び文字データの情報を管理する帳票データテーブルや、後述するオペレータの業務に対する習熟度としてのオペレータランクを管理するオペレータテーブル等を記憶している。   The server storage unit 8b stores a control program for controlling the form DB server 8, and manages a form data table for managing information on image data and character data received from the form reading device 1, and a proficiency level of an operator's work to be described later As an operator table for managing the operator rank.

ここで、図3は帳票データテーブルの構成を示す説明図である。   Here, FIG. 3 is an explanatory diagram showing the structure of the form data table.

帳票データテーブルは、図3に示すように、シーケンス番号、帳票画像、認識結果データ、類似文字率、入力データの項目からなる。   As shown in FIG. 3, the form data table includes items of sequence number, form image, recognition result data, similar character rate, and input data.

シーケンス番号は、上記帳票読取装置1の制御部5が採番した番号である。   The sequence number is a number assigned by the control unit 5 of the form reading apparatus 1.

帳票画像は、帳票のイメージデータである。   A form image is image data of a form.

認識結果データは、上記帳票読取装置1の制御部5が光学式文字認識によって画像データから変換した文字データである。   The recognition result data is character data converted from image data by the optical character recognition by the control unit 5 of the form reading apparatus 1.

類似文字率は、上記帳票読取装置1の制御部5が前記類似文字率算出手段によって算出される文字データの全文字数に対する類似文字の割合である。   The similar character rate is a ratio of the similar characters to the total number of characters of the character data calculated by the control unit 5 of the form reading apparatus 1 by the similar character rate calculating means.

入力データは、認識結果データに対して、オペレータが後述のオペレータ端末で誤認識の文字を訂正入力した文字データである。   The input data is character data obtained by correcting an erroneously recognized character by an operator using an operator terminal described later with respect to the recognition result data.

ここで、図4はオペレータテーブルの構成を示す説明図である。   Here, FIG. 4 is an explanatory diagram showing the configuration of the operator table.

オペレータテーブルは、図4に示すように、オペレータIDとオペレータランクの項目からなり、オペレータIDはオペレータ端末10を操作するオペレータを特定する識別子である。   As shown in FIG. 4, the operator table includes items of an operator ID and an operator rank, and the operator ID is an identifier that identifies an operator who operates the operator terminal 10.

オペレータランクは、オペレータの業務に対する習熟度であり、A〜Cの3段階としてAを経験豊富なオペレータ、Bを一般的なオペレータ、Cを経験の浅いオペレータと分類する。   The operator rank is the level of proficiency with respect to the operator's work, and A is classified as an experienced operator, B is a general operator, and C is an inexperienced operator.

なお、オペレータランクは、経験年数で定めるようにしてもよく、またそれまでのオペレータの実績に基づいて定めるようにしてもよい。   The operator rank may be determined based on the years of experience, or may be determined based on the performance of the operator up to that point.

10はオペレータ端末であり、通信回線9を介して帳票読取装置1、帳票DBサーバ8と通信可能に接続される。   An operator terminal 10 is communicably connected to the form reading device 1 and the form DB server 8 via the communication line 9.

11は端末表示部であり、CRT、液晶ディスプレイ等の表示手段である。   Reference numeral 11 denotes a terminal display unit, which is a display means such as a CRT or a liquid crystal display.

12は端末入力部であり、キーボード、マウス等の入力手段である。   A terminal input unit 12 is an input means such as a keyboard and a mouse.

13は端末記憶部であり、磁気ディスク、半導体メモリ等の記憶手段である。この端末記憶部13にはオペレータ端末10全体の動作を制御する制御プログラム(ソフトウェア)を記憶する。   Reference numeral 13 denotes a terminal storage unit, which is a storage means such as a magnetic disk or a semiconductor memory. The terminal storage unit 13 stores a control program (software) for controlling the operation of the operator terminal 10 as a whole.

14は端末制御部であり、CPU等の演算および制御手段等で構成されたものであり、端末記憶部13に格納された制御プログラム(ソフトウェア)に基づいて各部の動作を制御する。   Reference numeral 14 denotes a terminal control unit, which is configured by arithmetic and control means such as a CPU, and controls the operation of each unit based on a control program (software) stored in the terminal storage unit 13.

このように帳票処理システムは帳票読取装置1、帳票DBサーバ8、通信回線9およびオペレータ端末10等で構成されている。   As described above, the form processing system includes the form reading apparatus 1, the form DB server 8, the communication line 9, the operator terminal 10, and the like.

また、本実施例では1台の帳票DBサーバ8に対して複数のオペレータ端末10が通信可能に接続されているものとする。   In this embodiment, it is assumed that a plurality of operator terminals 10 are communicably connected to one form DB server 8.

上述した構成の作用について、図5に示す帳票のスキャン処理を示すフローチャートを用い、Sで示すステップに従って説明する。   The operation of the above-described configuration will be described according to the steps indicated by S using the flowchart showing the form scanning process shown in FIG.

係員は、顧客から預かった帳票を画像読取装置1のスキャナ装置7の帳票吸入部に載置し、入力部3によってイメージデータ読取りのための入力を行う。   The clerk places the form deposited from the customer on the form inhalation unit of the scanner device 7 of the image reading apparatus 1 and performs input for reading image data by the input unit 3.

S1、画像読取装置1の制御部5は、イメージデータ読取りのための入力がなされたことを認識すると、図示しない帳票吸入部に載置された帳票を搬送してスキャナ装置7によってイメージデータを読取ってそのイメージデータを記憶部6に記憶する。   S1, when the control unit 5 of the image reading apparatus 1 recognizes that an input for reading image data has been made, the control unit 5 conveys the form placed on the form inhaling part (not shown) and reads the image data by the scanner unit 7. The image data is stored in the storage unit 6.

S2、制御部5は、帳票から読取ったイメージデータを文字認識手段により文字データに変換し、その文字データを記憶部6に記憶する。   S <b> 2, the control unit 5 converts the image data read from the form into character data by the character recognition means, and stores the character data in the storage unit 6.

S3、制御部5は、記憶部6に格納している類似文字のテーブルを参照し、イメージデータから変換した文字データに含まれている類似文字の数を計数する。   S3, the control unit 5 refers to a table of similar characters stored in the storage unit 6 and counts the number of similar characters included in the character data converted from the image data.

S4、制御部5は、文字データに含まれる全文字数を計数し、その全文字数と上記ステップS3で計数した類似文字の数を用い、前記類似文字率算出手段によって類似文字率を算出し、その類似文字率を記憶部6に記憶する。   S4, the control unit 5 counts the total number of characters included in the character data, uses the total number of characters and the number of similar characters counted in step S3, calculates the similar character rate by the similar character rate calculation means, The similar character rate is stored in the storage unit 6.

S5、制御部5は、シーケンス番号を採番すると共に、記憶したイメージデータ、文字データ、類似文字率を読み出し、そのシーケンス番号、イメージデータ、文字データ、類似文字率を関連づけて構成した帳票データを通信回線9を介して帳票DBサーバ8に送信する。   S5, the control unit 5 assigns the sequence number, reads out the stored image data, character data, and the similar character rate, and forms the form data configured by associating the sequence number, the image data, the character data, and the similar character rate. The data is transmitted to the form DB server 8 via the communication line 9.

S6、帳票DBサーバ8は、受信した帳票データを格納すると共に、その帳票データの内容をもとに帳票データテーブルを更新し、帳票のスキャン処理を終了する。   S6, the form DB server 8 stores the received form data, updates the form data table based on the contents of the form data, and ends the form scanning process.

次に、オペレータに帳票の記載内容を確認させる帳票内容確認処理について、図6に示す帳票内容確認処理の手順を示すフローチャートを用い、SAで示すステップに従って説明する。   Next, a form content confirmation process for allowing the operator to confirm the description contents of the form will be described according to the steps indicated by SA using the flowchart showing the procedure of the form content confirmation process shown in FIG.

ここでは、オペレータが帳票の記載内容確認のために、オペレータ端末10の端末入力部12によって確認データを要求する入力操作を行ったものとする。   Here, it is assumed that the operator performs an input operation for requesting confirmation data by the terminal input unit 12 of the operator terminal 10 in order to confirm the description content of the form.

SA1、オペレータ端末10の端末制御部14は、オペレータの端末入力部12による確認データを要求する入力操作がなされたことを認識すると、端末記憶部13に記憶しているオペレータIDを読み出し、そのオペレータIDを付したデータ要求電文を通信回線9を介して帳票DBサーバ8に送信する。   SA1, when the terminal control unit 14 of the operator terminal 10 recognizes that an input operation for requesting confirmation data by the operator's terminal input unit 12 has been performed, reads the operator ID stored in the terminal storage unit 13, and the operator A data request message with an ID is transmitted to the form DB server 8 via the communication line 9.

SA2、帳票DBサーバ8のサーバ制御部8aは、受信したデータ要求電文のオペレータIDをもとに、サーバ記憶部8bに格納しているオペレータテーブルを参照して該当するオペレータランクを特定する。   SA2, the server control unit 8a of the form DB server 8 refers to the operator table stored in the server storage unit 8b based on the operator ID of the received data request message, and identifies the corresponding operator rank.

SA3、サーバ制御部8aは、帳票データテーブルから入力データが未入力であり、かつ上記で特定したオペレータランクに従ってオペレータ端末10に送信対象のイメージデータ及び文字データを含む帳票データを抽出する。   In step SA3, the server control unit 8a extracts form data including image data and character data to be transmitted to the operator terminal 10 according to the operator rank specified above, in which no input data is input from the form data table.

ここで、図7は帳票データテーブルから帳票データを抽出するまでの流れを示す説明図であり、(a)はシーケンス番号順に帳票データを並べた状態、(b)は類似文字率順に帳票データを並べた状態を示す。   Here, FIG. 7 is an explanatory diagram showing the flow until the form data is extracted from the form data table. (A) is a state in which the form data is arranged in the sequence number order, and (b) is the form data in the order of the similar character ratio. Indicates the state of arrangement.

サーバ制御部8aは、帳票データテーブルの帳票データを図7(a)に示すシーケンス番号順から、図7(b)に示す類似文字率順に並べ替える。   The server control unit 8a rearranges the form data in the form data table from the sequence number order shown in FIG. 7A to the similar character rate order shown in FIG. 7B.

そして、上記ステップSA2で特定したオペレータランクがAの場合には、類似文字率が最も大きい帳票データを帳票データテーブルから抽出する。つまり図7(b)に示す類似文字順においては、最も大きい類似文字率17%であるシーケンス番号3の帳票データを抽出する。   If the operator rank specified in step SA2 is A, the form data having the largest similar character rate is extracted from the form data table. That is, in the similar character order shown in FIG. 7B, the form data of sequence number 3 having the largest similar character rate of 17% is extracted.

また、オペレータランクがBの場合には、帳票データテーブルにおいて、類似文字率順に帳票データを並べたときの順番が真ん中の帳票データを抽出、つまり図7(b)に示す類似文字順における、順番が真ん中のシーケンス番号5の帳票データを抽出する。   When the operator rank is B, in the form data table, the form data in the middle when the form data is arranged in the order of similar character ratio is extracted, that is, the order in the similar character order shown in FIG. The form data of sequence number 5 in the middle is extracted.

さらに、オペレータランクがCの場合には、類似文字率が最も小さい帳票データを抽出、つまり図7(b)に示す類似文字順においては、最も小さい類似文字率1%であるシーケンス番号4の帳票データを抽出する。   Further, when the operator rank is C, the form data with the smallest similar character rate is extracted, that is, the form with the sequence number 4 having the smallest similar character rate of 1% in the similar character order shown in FIG. Extract data.

なお、帳票データテーブルから抽出できる帳票データが1つしかない場合は、その残った帳票データを抽出することは言うまでも無い。   Needless to say, if there is only one form data that can be extracted from the form data table, the remaining form data is extracted.

SA4、サーバ制御部8aは、抽出した帳票データからイメージデータと文字データ、シーケンス番号を読み出し、読み出したイメージデータと文字データ、シーケンス番号を関連づけて確認データとし、その確認データを通信回線9を介してオペレータ端末10に送信する。   SA4, the server control unit 8a reads the image data, the character data, and the sequence number from the extracted form data, associates the read image data with the character data, and the sequence number as confirmation data, and uses the confirmation data via the communication line 9. To the operator terminal 10.

SA5、オペレータ端末10の端末制御部14は、受信した確認データのシーケンス番号を端末記憶部13に記憶し、また確認データのイメージデータと文字データとを端末表示部11に表示すると共に、イメージデータによって顧客が帳票に記載した内容を確認させ、文字データ中の誤認識された文字や記載内容の確認及びその訂正を促す確認指示画面を表示する。   SA5, the terminal control unit 14 of the operator terminal 10 stores the sequence number of the received confirmation data in the terminal storage unit 13 and displays the image data and character data of the confirmation data on the terminal display unit 11 as well as the image data. The user confirms the contents described in the form by the above, and displays a confirmation instruction screen for confirming the misrecognized characters and the description contents in the character data and prompting the correction.

これにより、オペレータはイメージデータと文字データとを比較することで、帳票上の記載内容をもとに文字データの確認を行うと共に、文字データ中に誤認識の文字があれば、その訂正入力を行う。   As a result, the operator compares the image data with the character data, confirms the character data based on the description on the form, and if there is a misrecognized character in the character data, corrects the input. Do.

SA6、端末制御部14は記憶したシーケンス番号を読み出し、訂正入力がなされた文字データを入力データとし、その入力データにシーケンス番号を付して通信回線9を介し、帳票DBサーバ8に送信する。   SA 6, the terminal control unit 14 reads the stored sequence number, uses the character data that has been corrected and input as input data, attaches the sequence number to the input data, and transmits it to the form DB server 8 via the communication line 9.

SA7、帳票DBサーバ8のサーバ制御部8aは、受信したシーケンス番号をもとに、記憶している帳票データを読み出してその帳票データに受信した入力データを加え、帳票データテーブルの内容を更新し、帳票内容確認処理を終了する。   SA7, the server control unit 8a of the form DB server 8 reads the stored form data based on the received sequence number, adds the received input data to the form data, and updates the contents of the form data table. The form content confirmation process is terminated.

これにより、本発明は、習熟度が高いオペレータには類似文字が多い帳票の処理をさせ、習熟度が低いオペレータには類似文字が少ない帳票の処理をさせることができるので、類似文字を誤って処理してしまうという人為的ミスの発生を低減させることができるという効果が得られる。   Thus, the present invention allows an operator with a high level of proficiency to process a form with many similar characters and an operator with a low proficiency level to process a form with few similar characters. It is possible to reduce the occurrence of human error in processing.

以上説明したように、本実施例では、文字認識手段によって帳票のイメージデータから変換した文字データをオペレータが確認及び訂正を行う場合に、文字データに含まれる類似文字の割合を算出してその類似文字率を帳票データに含めて記憶しておき、オペレータ端末にイメージデータ及び文字データを送信する際に、オペレータのスキルレベルから熟練したオペレータに対しては、類似文字率の割合が高い帳票データのイメージデータ及び文字データを送信し、経験の浅いオペレータに類似文字率の割合が小さい帳票データのイメージデータ及び文字データを送信するため、イメージデータから文字データに変換した際に誤認識されてしまった類似文字の訂正抜け等の人為的ミスの可能性を低減させることができる。   As described above, in this embodiment, when the operator confirms and corrects the character data converted from the image data of the form by the character recognition unit, the ratio of similar characters included in the character data is calculated and the similarity is calculated. The character rate is included in the form data and stored, and when sending image data and character data to the operator terminal, the form data with a high rate of similar character rate is given to operators who are skilled from the skill level of the operator. Image data and character data were sent, and image data and character data of form data with a small percentage of similar character ratio were sent to an inexperienced operator, so it was misrecognized when converted from image data to character data The possibility of human error such as missing correction of similar characters can be reduced.

1 帳票読取装置
2 表示部
3 入力部
5 制御部
6 記憶部
7 スキャナ装置
8 帳票DBサーバ
8a サーバ制御部
8b サーバ記憶部
9 通信回線
10 オペレータ端末
11 端末表示部
12 端末入力部
13 端末記憶部
14 端末制御部
DESCRIPTION OF SYMBOLS 1 Form reading apparatus 2 Display part 3 Input part 5 Control part 6 Storage part 7 Scanner apparatus 8 Form DB server 8a Server control part 8b Server storage part 9 Communication line 10 Operator terminal 11 Terminal display part 12 Terminal input part 13 Terminal storage part 14 Terminal control unit

Claims (7)

帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータが文字データの修正もしくは確認する作業を行う帳票処理システムであって、
あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせることを特徴とする帳票処理システム。
A form processing system in which the operator compares the image data of the form with the character data obtained by character recognition of the image data, and the operator performs the work of correcting or confirming the character data,
Characters having similar shapes are defined in advance as similar characters, and information indicating whether there are more or less similar characters among the characters included in the character data of the form with respect to the character recognition result of the form Based on the proficiency level information of the work, an operator with a high proficiency level is responsible for a form with a lot of the similar characters, and an operator with a low proficiency level is in charge of a form with the few similar characters, A form processing system characterized in that an operator in charge of the form is determined to perform an operation of correcting or confirming character data of the form.
あらかじめ、前記オペレータの作業の習熟度レベルを、複数の段階のランクに分類し、記憶部に記憶することを特徴とした請求項の帳票処理システム。 Previously, the proficiency level of the work of the operators to classify the ranks of the plurality of stages, the form processing system of Claim 1 it has been characterized to be stored in the storage unit. 前記類似文字が多いか少ないかの判定を、前記帳票の文字データに含まれる文字のうち前記類似文字の割合に応じて行うことを特徴とした請求項の帳票処理システム。 3. The form processing system according to claim 2 , wherein the determination of whether the number of similar characters is large or small is made according to a ratio of the similar characters among characters included in the character data of the form. 前記文字データは、カナ、アルファベット、数字を含むことを特徴とした請求項1乃至請求項のいずれかの帳票処理システム。 The character data is either of the form processing system of claims 1 to 3 characterized in that it comprises kana, alphabet, numbers. 帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータに文字データの修正もしくは確認する作業を行わせるサーバであって、
あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせることを特徴とするサーバ。
A server that compares the image data of the form with the character data obtained by character recognition of the image data, and allows the operator to correct or confirm the character data.
Characters having similar shapes are defined in advance as similar characters, and information indicating whether there are more or less similar characters among the characters included in the character data of the form with respect to the character recognition result of the form Based on the proficiency level information of the work, an operator with a high proficiency level is responsible for a form with a lot of the similar characters, and an operator with a low proficiency level is in charge of a form with the few similar characters, A server characterized in that an operator in charge of the form is determined and an operation for correcting or confirming character data of the form is performed.
帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータに文字データの修正もしくは確認する作業を行わせる手順をコンピュータに実行させるためのプログラムであって、
あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせる手順をコンピュータに実行させることを特徴とするプログラム。
Comparing image data of a form with character data obtained by character recognition of the image data, a program for causing a computer to execute a procedure for correcting or confirming character data,
Characters having similar shapes are defined in advance as similar characters, and information indicating whether there are more or less similar characters among the characters included in the character data of the form with respect to the character recognition result of the form Based on the proficiency level information of the work, an operator with a high proficiency level is responsible for a form with a lot of the similar characters, and an operator with a low proficiency level is in charge of a form with the few similar characters, A program for causing a computer to execute a procedure for determining an operator in charge of the form and performing an operation of correcting or confirming character data of the form.
帳票のイメージデータとそのイメージデータを文字認識して取得した文字データとを比較して、オペレータに文字データの修正もしくは確認する作業を行わせるステップを有する帳票処理システムの帳票処理方法であって、
帳票処理システムが、あらかじめ、形状が似ている文字を類似文字として定義しておき、帳票の文字認識結果に対して、その帳票の文字データに含まれる文字のうち前記類似文字が多いか少ないかを示す情報とオペレータの作業の習熟度レベルの情報とに基づき、習熟度レベルが高いオペレータは、前記類似文字が多い帳票を担当し、習熟度レベルが低いオペレータは、前記類似文字が少ない帳票を担当するように、前記帳票の担当オペレータを定めて前記帳票の文字データの修正もしくは確認する作業を行わせるステップを有することを特徴とする帳票処理方法。
Comparing image data of a form with character data obtained by character recognition of the image data, a form processing method for a form processing system having a step for allowing an operator to perform correction or confirmation of character data,
The form processing system defines in advance the characters that are similar in shape as similar characters, and whether there are more or less similar characters among the characters included in the character data of the form for the character recognition result of the form Based on the information indicating the level of proficiency and the level of proficiency of the operator's work, an operator with a high proficiency level is responsible for a form with a lot of similar characters, and an operator with a low proficiency level has a form with few similar characters. A form processing method comprising: a step of determining an operator in charge of the form so as to be in charge and performing an operation of correcting or confirming character data of the form.
JP2013235583A 2013-11-14 2013-11-14 Form processing system, server, program, and form processing method Active JP5715219B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013235583A JP5715219B2 (en) 2013-11-14 2013-11-14 Form processing system, server, program, and form processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013235583A JP5715219B2 (en) 2013-11-14 2013-11-14 Form processing system, server, program, and form processing method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010029546A Division JP5415988B2 (en) 2010-02-12 2010-02-12 Form processing system

Publications (2)

Publication Number Publication Date
JP2014063507A JP2014063507A (en) 2014-04-10
JP5715219B2 true JP5715219B2 (en) 2015-05-07

Family

ID=50618621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013235583A Active JP5715219B2 (en) 2013-11-14 2013-11-14 Form processing system, server, program, and form processing method

Country Status (1)

Country Link
JP (1) JP5715219B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6874729B2 (en) * 2018-04-02 2021-05-19 日本電気株式会社 Image processing equipment, image processing methods and programs
JP7400543B2 (en) 2020-02-28 2023-12-19 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP7459635B2 (en) 2020-04-17 2024-04-02 富士フイルムビジネスイノベーション株式会社 Information processing device and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3014123U (en) * 1995-01-30 1995-08-01 住友電気工業株式会社 Character recognition device
JP3162606B2 (en) * 1995-07-25 2001-05-08 沖電気工業株式会社 Data recognition system with distribution function
JPH11203399A (en) * 1998-01-09 1999-07-30 Oki Electric Ind Co Ltd Optical reading system
JP4263928B2 (en) * 2003-03-05 2009-05-13 株式会社リコー Character recognition device, character recognition method, character recognition program, and recording medium

Also Published As

Publication number Publication date
JP2014063507A (en) 2014-04-10

Similar Documents

Publication Publication Date Title
JP5415988B2 (en) Form processing system
US10489672B2 (en) Video capture in data capture scenario
JP6050843B2 (en) Information processing apparatus, method, and program
US20210248689A1 (en) Management of a media archive representing personal modular memories
US20130251211A1 (en) Automated processing of documents
US8577826B2 (en) Automated document separation
JP5715219B2 (en) Form processing system, server, program, and form processing method
JP2006031299A (en) Character recognition method, correction history processing method for character data and system
US10097724B2 (en) System, control method, and recording medium
US11887390B2 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US11875587B2 (en) Information processing system, information processing method, and non-transitory recording medium
JP2006190093A (en) Ocr exchange centralized processing system
JP2010200125A (en) Image processing apparatus
JP2007011656A (en) Character recognition system and character recognition method
JP5251652B2 (en) Form image filing system
JP2021068306A (en) Information processing device and program
JP2006293810A (en) Business form data coding device, business form data coding system, and business form data coding method
JP2021018520A (en) Information processor, information processing method, and program
CN111985519B (en) Text similarity quantification method, equipment and system
JP6264785B2 (en) Display method, display program, and display device
JP5779671B2 (en) Form processing system, entry terminal, form data processing method and program
EP4095718A1 (en) Method and system for handling input data
JP7351633B2 (en) Document processing support system
JP6571825B1 (en) FAX number acquisition method, computer and program
JP2011164803A (en) Business form processing system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150312

R150 Certificate of patent or registration of utility model

Ref document number: 5715219

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150