JP2017156922A - Document recognition control system - Google Patents

Document recognition control system Download PDF

Info

Publication number
JP2017156922A
JP2017156922A JP2016038727A JP2016038727A JP2017156922A JP 2017156922 A JP2017156922 A JP 2017156922A JP 2016038727 A JP2016038727 A JP 2016038727A JP 2016038727 A JP2016038727 A JP 2016038727A JP 2017156922 A JP2017156922 A JP 2017156922A
Authority
JP
Japan
Prior art keywords
document
information
data
recognition
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016038727A
Other languages
Japanese (ja)
Inventor
正秋 松尾
Masaaki Matsuo
正秋 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Business Equipment Int Co Ltd
Business Equipment International Co Ltd
Original Assignee
Business Equipment Int Co Ltd
Business Equipment International Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Business Equipment Int Co Ltd, Business Equipment International Co Ltd filed Critical Business Equipment Int Co Ltd
Priority to JP2016038727A priority Critical patent/JP2017156922A/en
Publication of JP2017156922A publication Critical patent/JP2017156922A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To realize a document recognition control system that converts information on wrong recognition parts to data upon reading documents to disclose the information thereof as the data, and points the wrong recognition parts out to operators.SOLUTION: A document recognition control system (1) comprises: document reading means (2); control means (3) that inputs a reading signal to convert information on a document (S) to data; and display means (4) that displays the information on the document (S). The control means (3) comprises: judgement means (6) that judges a content of the information on the document (S) thanks to the reading signal; recognition part-purpose first storage means (7) that, upon judging the content of the information on the document (S), converts information on recognition parts to data, and stores the information thereon as the data; wrong recognition part-purpose second storage means (8) that, upon judging the content of the information on the document (S), converts information on a wrong recognition part to data, and stores the information thereon as the data; and wrong recognition part point-out means (9) that points the information on the wrong recognition part out to display means (4) to display the information.SELECTED DRAWING: Figure 1

Description

この発明は書類の認識制御システムに係り、特に書類を光学的に読み取る際に正確に認識できなかった箇所である誤認識箇所の情報をデータ化して開示する書類の認識制御システムに関するものである。   BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document recognition control system, and more particularly to a document recognition control system that discloses information on misrecognized portions, which are portions that could not be accurately recognized when optically reading a document, as data.

現在、光学文字認識装置(「OCR装置」ともいう。)や光学式マーク読み取り装置(「OMR装置」ともいう。)が使用されており、これらの装置によって印字書類や手書き書類からなる書類の情報をデータ化している。   At present, optical character recognition devices (also referred to as “OCR devices”) and optical mark reading devices (also referred to as “OMR devices”) are used, and information about documents including printed documents and handwritten documents is used by these devices. Is converted into data.

そして、後述する特許文献1においては、記入文字が記入枠に重なることによるOCR装置の誤認識をより正確に補正する技術を開示している。   And in patent document 1 mentioned later, the technique which correct | amends more correctly the misrecognition of the OCR apparatus by an entry character overlapping an entry frame is disclosed.

特開2015−97067号公報Japanese Patent Laying-Open No. 2015-97067

ところで、従来のOCR装置においては、印字書類や手書き書類からなる書類を光学的に読み取ってデータ化する際に、正常に読み取り処理ができた箇所である認識箇所と読み取れなかった箇所である誤認識箇所とを一様に開示していた。
このため、現状においては、印字書類や手書き書類からなる書類を正確に作成する必要があるため、書類の作成に必要以上に時間と労力とが費やされることとなってしまい、前記OCR装置の使い勝手が悪く、実用上不利であるという不都合がある。
また、前記OCR装置における光学的な読み取り処理の際の認識精度を向上させる技術を開発する必要があるとともに、上記の特許文献1のように、前記OCR装置の誤認識をより正確に補正する技術を開発する必要があった。
この結果、前記OCR装置の認識精度の向上、及び、OCR装置の誤認識をより正確に補正するなどの技術の開発に伴って、OCR装置が高価格となってしまい、経済的に不利となり、市場に広く浸透できず、汎用性が少ないという不都合がある。
By the way, in the conventional OCR apparatus, when optically reading a document composed of a printed document or a handwritten document and converting it into data, a recognition portion that is a portion that has been successfully read and a portion that cannot be read are erroneously recognized. The part was disclosed uniformly.
For this reason, in the present situation, it is necessary to accurately create a document composed of a printed document or a handwritten document, so that more time and labor are consumed than necessary to create the document, and the usability of the OCR device is increased. However, it is disadvantageous in that it is disadvantageous for practical use.
In addition, it is necessary to develop a technique for improving the recognition accuracy at the time of optical reading processing in the OCR apparatus, and a technique for correcting the erroneous recognition of the OCR apparatus more accurately as in Patent Document 1 described above. There was a need to develop.
As a result, with the improvement of the recognition accuracy of the OCR device and the development of technology such as correcting the erroneous recognition of the OCR device more accurately, the OCR device becomes expensive and economically disadvantageous, There is an inconvenience that it cannot penetrate the market widely and its versatility is low.

この発明の目的は、印字書類や手書き書類からなる書類を読み取る際に読み取れない箇所である誤認識箇所の情報をデータ化して開示し、操作者に誤認識箇所を指摘する書類の認識制御システムを実現することにある。   SUMMARY OF THE INVENTION An object of the present invention is to provide a document recognition control system that discloses information on misrecognized portions, which are portions that cannot be read when reading a document composed of a printed document or a handwritten document, as data, and points the misrecognized portion to the operator. It is to be realized.

そこで、この発明は、上述不都合を除去するために、印字書類や手書き書類からなる書類を光学的に読み取り、読み取った情報をデータ化すべく制御する書類の認識制御システムにおいて、前記書類を読み取る書類読み取り手段と、この書類読み取り手段からの読み取り信号を入力して前記書類の情報をデータ化する制御手段と、この制御手段から出力される制御信号によって前記書類の情報を表示する表示手段とを備え、前記制御手段は、前記書類読み取り手段からの読み取り信号によって前記書類の情報の内容を判断する判断手段と、この判断手段によって前記書類の情報の内容を判断した際に、認識箇所の情報をデータ化して記憶する認識箇所用の第1記憶手段と、前記判断手段によって前記書類の情報の内容を判断した際に、誤認識箇所の情報をデータ化して記憶する誤認識箇所用の第2記憶手段と、この誤認識箇所用の第2記憶手段に記憶させた誤認識箇所の情報を前記表示手段に指摘して開示する誤認識箇所指摘手段と、を備えることを特徴とする。   Therefore, in order to eliminate the inconvenience described above, the present invention provides a document recognition control system for optically reading a document consisting of a printed document or a handwritten document and controlling the read information as data. Means, a control means for inputting the reading signal from the document reading means to convert the information of the document into data, and a display means for displaying the information of the document by a control signal output from the control means, The control means determines the information content of the document based on a reading signal from the document reading means, and converts the information of the recognized portion into data when the determination means determines the content of the document information. The first storage means for the recognition location to be stored and the content of the information of the document is judged by the judgment means. A second storage means for misrecognized locations that stores the information of the location as data, and an error that indicates and discloses the information of the misrecognized locations stored in the second storage means for the misrecognized locations to the display means. A recognition location indicating means.

この発明によれば、印字書類や手書き書類からなる書類を光学的に読み取る際に、書類の認識制御システムによって、読み取れない箇所である誤認識箇所の情報をデータ化して操作者に指摘することにより、操作者は誤認識箇所を明確に把握することができる。
このため、読み取り処理後に誤認識箇所が指摘されることとなり、誤認識箇所を容易に把握して訂正することができ、書類を正確に作成する場合と比較して、時間と労力とを軽減させることができる。
また、従来のように技術の開発がなされていない、OCR装置を使用しても、読み取り処理後に誤認識箇所を容易に訂正できることにより、安価なOCR装置を使用することが可能である。
According to this invention, when optically reading a document consisting of a printed document or a handwritten document, the document recognition control system converts the information on the misrecognized portion, which is a portion that cannot be read, into data and indicates it to the operator. The operator can clearly grasp the misrecognized portion.
For this reason, misrecognized parts are pointed out after the reading process, and the misrecognized parts can be easily grasped and corrected, which reduces time and labor compared to the case of accurately creating documents. be able to.
Even if an OCR device that has not been developed as in the prior art is used, it is possible to use an inexpensive OCR device by easily correcting a misrecognized portion after the reading process.

図1は書類の認識制御システムの工程図である。(実施例1)FIG. 1 is a process diagram of a document recognition control system. Example 1 図2は書類の認識制御システムの概略ブロック図である。(実施例1)FIG. 2 is a schematic block diagram of a document recognition control system. Example 1 図3は書類の認識制御システムによる書類の一例を示し、(a)は読み取り前の書類の概略図、(b)は読み取り後に表示手段に開示される書類の概略図である。(実施例1)3A and 3B show an example of a document by the document recognition control system. FIG. 3A is a schematic diagram of the document before reading, and FIG. 3B is a schematic diagram of the document disclosed on the display means after reading. Example 1 図4は書類の認識制御システムの概略ブロック図である。(実施例2)FIG. 4 is a schematic block diagram of the document recognition control system. (Example 2) 図5は書類の認識制御システムによる書類の一例を示し、(a)は読み取り前の定型化された印字書類からなる書類の概略図、(b)は読み取り前に手書きを加えた書類の概略図、(c)は読み取り後に表示手段に開示される書類の概略図である。(実施例2)FIG. 5 shows an example of a document by the document recognition control system, (a) is a schematic diagram of a document which is a stylized print document before reading, and (b) is a schematic diagram of a document to which handwriting is added before reading. (C) is the schematic of the document disclosed by a display means after reading. (Example 2)

以下図面に基づいてこの発明の実施例を詳細に説明する。   Embodiments of the present invention will be described below in detail with reference to the drawings.

図1〜図3はこの発明の実施例1を示すものである。
図2において、1は書類の認識制御システムである。
この書類の認識制御システム1は、印字書類や手書き書類からなる書類Sを光学的に読み取り、読み取った情報をデータ化すべく制御する。
1 to 3 show Embodiment 1 of the present invention.
In FIG. 2, reference numeral 1 denotes a document recognition control system.
The document recognition control system 1 optically reads a document S, which is a printed document or a handwritten document, and performs control to convert the read information into data.

このとき、前記書類の認識制御システム1は、前記書類Sを読み取る書類読み取り手段2と、この書類読み取り手段2からの読み取り信号を入力して前記書類Sの情報をデータ化する制御手段3と、この制御手段3から出力される制御信号によって前記書類Sの情報を表示する表示手段4とを備えている。
そして、前記書類読み取り手段2は、公知技術であるOCR装置やOMR装置の書類読み取り機能が使用されており、詳細な説明は省略する。
前記制御手段3は、上記した書類読み取り手段2を動作させるためのプログラムを記憶し、パーソナルコンピュータからなる。
前記表示手段4は、ディスプレイからなる。
なお、前記書類の認識制御システム1は、前記表示手段4に前記書類Sの情報が表示された際に、表示された文字を訂正・加入する文字入力機能を備えている。
また、前記書類の認識制御システム1は、前記表示手段4に表示させた前記書類Sの情報を印字するプリンタからなる印刷手段5を備えている。
更に、前記制御手段3は、前記書類読み取り手段2からの読み取り信号によって前記書類Sの情報の内容を判断する判断手段6と、この判断手段6によって前記書類Sの情報の内容を判断した際に、認識箇所の情報をデータ化して記憶する認識箇所用の第1記憶手段7と、前記判断手段6によって前記書類Sの情報の内容を判断した際に、誤認識箇所の情報をデータ化して記憶する誤認識箇所用の第2記憶手段8と、この誤認識箇所用の第2記憶手段8に記憶させた誤認識箇所の情報を前記表示手段4に指摘して開示する誤認識箇所指摘手段9と、を備える構成を有する。
詳述すれば、前記制御手段3の判断手段6は、基本となる判断用文字情報を予め記憶し、前記書類読み取り手段2からの読み取り信号によって、前記書類Sの情報の内容である文字データを判断用文字情報に照会し、情報の認識状態を判断している。
また、前記制御手段3の認識箇所用の第1記憶手段7は、前記判断手段6によって前記書類Sの情報の内容である文字データを判断した際に、前記書類読み取り手段2の読み取り作業が正確に行われ、認識できた箇所、つまり認識箇所の情報をデータ化して記憶している。
前記制御手段3の誤認識箇所用の第2記憶手段8は、前記判断手段6によって前記書類Sの情報の内容である文字データを判断した際に、前記書類読み取り手段2の読み取り作業が不備となり、認識できなかった箇所、つまり誤認識箇所の情報をデータ化して記憶している。
そして、前記制御手段3の誤認識箇所指摘手段9は、前記表示手段4に前記認識箇所用の第1記憶手段7に記憶させた認識箇所の情報と前記誤認識箇所用の第2記憶手段8に記憶させた誤認識箇所の情報とを開示する際に、誤認識箇所用の第2記憶手段8の誤認識箇所の情報を指摘して開示する。
なお、前記表示手段4に「誤認識箇所の情報を指摘して開示する」方策としては、図3(b)に示す如き、誤認識箇所の情報の内容である文字データを太文字にて開示する方策、あるいは、色付けする方策などが考えられる。
At this time, the document recognition control system 1 includes a document reading unit 2 that reads the document S, a control unit 3 that inputs a read signal from the document reading unit 2 and converts the information of the document S into data, Display means 4 for displaying the information of the document S in accordance with a control signal output from the control means 3.
The document reading means 2 uses a document reading function of an OCR device or OMR device, which is a known technique, and detailed description thereof is omitted.
The control means 3 stores a program for operating the document reading means 2 and is composed of a personal computer.
The display means 4 comprises a display.
The document recognition control system 1 has a character input function for correcting and joining the displayed characters when the information of the document S is displayed on the display means 4.
The document recognition control system 1 includes a printing unit 5 including a printer for printing the information of the document S displayed on the display unit 4.
Further, the control unit 3 determines the content of the information on the document S based on the read signal from the document reading unit 2, and the determination unit 6 determines the content of the information on the document S. First recognition means 7 for the recognition location that stores the information of the recognition location as data, and when the content of the information of the document S is determined by the determination device 6, the information of the erroneous recognition location is converted into data and stored. The second storage means 8 for the erroneously recognized location and the erroneously recognized location indicating means 9 for indicating the information of the erroneously recognized location stored in the second storage means 8 for the erroneously recognized location to the display means 4 and disclosing it. And a configuration comprising:
More specifically, the determination unit 6 of the control unit 3 stores basic determination character information in advance, and character data that is the content of the information on the document S is read by a read signal from the document reading unit 2. The character information for judgment is referred to, and the recognition state of the information is judged.
In addition, the first storage means 7 for the recognition location of the control means 3 can accurately read the document reading means 2 when the determination means 6 determines the character data that is the content of the information on the document S. The information of the recognized part, that is, the recognized part is converted into data and stored.
The second storage means 8 for the erroneously recognized portion of the control means 3 becomes incomplete in the reading operation of the document reading means 2 when the determining means 6 determines the character data that is the content of the information on the document S. The information of the part that could not be recognized, that is, the misrecognized part is stored as data.
Then, the misrecognized location indication means 9 of the control means 3 includes the information on the recognized location stored in the first storage means 7 for the recognized location and the second storage means 8 for the erroneously recognized location. When the information on the misrecognized portion stored in the above is disclosed, the information on the misrecognized portion in the second storage means 8 for the misrecognized portion is pointed out and disclosed.
In addition, as a measure of “pointing out and disclosing information on misrecognized portions” on the display means 4, as shown in FIG. 3B, character data that is the content of information on misrecognized portions is disclosed in bold characters. Measures to color or colorize.

また、前記制御手段3は、前記判断手段6によって前記書類Sの情報の内容である文字データを判断した際に、誤認識箇所の誤認識度合いが大きくなるに連れて、前記誤認識箇所指摘手段9による前記表示手段4に開示する誤認識情報の表示状態を高める誤認識度合い調整手段10を備える構成を有する。
つまり、前記判断手段6によって、図3(a)に示す如く、既に完成される書類フォーマット(印字用記録媒体)からなる前記書類Sの情報の内容である文字データを判断した際に、誤認識箇所に誤認識度合いを表示、つまり、ランク付けを行うものである。
例えば、以下のように3段階にランク付けを行う。
(第1ランク)
:文字データにおいて、最も誤認識状態が甚だしく、全く認識できないもの。
(第2ランク)
:文字データにおいて、誤認識は発生しているが、5〜7割程度の確率で該当する文字を判断用文字情報から開示できるもの。
(第3ランク)
:文字データにおいて、誤認識は発生しているが、3割程度の確率で該当する文字を判断用文字情報から開示できるもの。
そして、各ランクに応じて、太文字や色付けを行い、目視にて各ランクを判別可能とする。
In addition, when the control unit 3 determines the character data that is the content of the information of the document S by the determination unit 6, the misrecognition point indication unit increases as the misrecognition degree of the erroneous recognition unit increases. 9 includes a misrecognition degree adjusting unit 10 that enhances the display state of misrecognition information disclosed in the display unit 4 according to 9.
That is, when the judging means 6 judges the character data which is the content of the information of the document S having the already completed document format (printing recording medium) as shown in FIG. The degree of misrecognition is displayed at a location, that is, ranking is performed.
For example, ranking is performed in three stages as follows.
(1st rank)
: Character data that has the most misrecognized state and cannot be recognized at all.
(2nd rank)
: In character data, misrecognition occurs, but the corresponding character can be disclosed from the character information for determination with a probability of about 50 to 70%.
(3rd rank)
: In character data, misrecognition occurs, but the corresponding character can be disclosed from the character information for determination with a probability of about 30%.
And according to each rank, a bold character or coloring is performed, and each rank can be discriminated visually.

つまり、前記書類の認識制御システム1は、図1に示す如く、以下の各工程を備えている。
A:<書類の読み取り工程>
B:<制御手段の内容判断工程>
C:<制御手段の第1記憶工程>
D:<制御手段の第2記憶工程>
E:<表示工程>
F:<訂正工程>
That is, the document recognition control system 1 includes the following steps as shown in FIG.
A: <Document reading process>
B: <Content judging process of control means>
C: <First storage step of control means>
D: <Second storage step of control means>
E: <Display process>
F: <Correction process>

次に、図1に沿って、前記書類の認識制御システム1の処理工程を説明する。   Next, processing steps of the document recognition control system 1 will be described with reference to FIG.

A:<書類の読み取り工程>
この<書類の読み取り工程>においては、前記書類読み取り手段2によって、印字書類や手書き書類からなる前記書類Sを光学的に読み取る。
B:<制御手段の内容判断工程>
この<制御手段の内容判断工程>においては、前記制御手段3の判断手段6によって、この判断手段6に予め記憶させた判断用文字情報と前記書類読み取り手段2からの読み取り信号による前記書類Sの情報の内容である文字データとを照会し、情報の認識状態を判断する。
C:<制御手段の第1記憶工程>
この<制御手段の第1記憶工程>においては、前記判断手段6によって前記書類Sの情報の内容である文字データを判断した際に、前記書類読み取り手段2の読み取り作業が正確に行われ、認識できた箇所、つまり認識箇所の情報をデータ化して前記制御手段3の認識箇所用の第1記憶手段7に記憶する。
D:<制御手段の第2記憶工程>
この<制御手段の第2記憶工程>においては、前記判断手段6によって前記書類Sの情報の内容である文字データを判断した際に、前記書類読み取り手段2の読み取り作業が不備となり、認識できなかった箇所、つまり誤認識箇所の情報をデータ化して前記制御手段3の誤認識箇所用の第2記憶手段8に記憶する。
E:<表示工程>
この<表示工程>においては、前記表示手段4に前記認識箇所用の第1記憶手段7に記憶させた認識箇所の情報と前記誤認識箇所用の第2記憶手段8に記憶させた誤認識箇所の情報とを開示する。
このとき、前記制御手段3の誤認識箇所指摘手段9によって、誤認識箇所用の第2記憶手段8の誤認識箇所の情報を指摘して開示する。
なお、図3(a)に示す如く、既に完成される書類フォーマット(印字用記録媒体)からなる前記書類Sの情報の内容である文字データが「C」であった場合に、この文字データ「C」が前記制御手段3の誤認識箇所用の第2記憶手段8によって誤認識箇所と判断された際には、前記表示手段4に文字データ「C」に最も近似する文字データを開示する場合、図3(b)に示す如く、ランク付けを考慮して太文字にて例えば「G」とした前記書類Sを開示する。
このとき、この<表示工程>においては、文字データをランク付けに応じて太文字にて開示する方策以外にも、色付けする方策などが考えられる。
F:<訂正工程>
この<訂正工程>においては、前記表示手段4に開示される誤認識箇所を、前記書類の認識制御システム1の文字入力機能によって訂正する。
A: <Document reading process>
In this <document reading step>, the document reading means 2 optically reads the document S composed of a printed document or a handwritten document.
B: <Content judging process of control means>
In this <content determination process of the control means>, the determination means 6 of the control means 3 determines the document S based on the determination character information stored in advance in the determination means 6 and the read signal from the document reading means 2. The character data that is the content of the information is inquired to determine the information recognition state.
C: <First storage step of control means>
In this <first storage step of the control means>, when the judgment means 6 judges the character data that is the content of the information on the document S, the reading work of the document reading means 2 is accurately performed and recognized. The information on the completed location, that is, the recognized location is converted into data and stored in the first storage means 7 for the recognized location of the control means 3.
D: <Second storage step of control means>
In this <second storage step of the control means>, when the character data that is the content of the information on the document S is determined by the determination means 6, the reading operation of the document reading means 2 is incomplete and cannot be recognized. The information of the detected location, that is, the erroneously recognized location is converted into data and stored in the second storage means 8 for the erroneously recognized location of the control means 3.
E: <Display process>
In this <display step>, information on the recognition location stored in the first storage means 7 for the recognition location on the display means 4 and the erroneous recognition location stored in the second storage means 8 for the erroneous recognition location. Information.
At this time, the misrecognized location indication means 9 of the control means 3 points out and discloses the information of the misrecognized location in the second storage means 8 for the misrecognized location.
As shown in FIG. 3A, when the character data which is the content of the information of the document S having the already completed document format (printing recording medium) is “C”, the character data “ When the second storage means 8 for erroneous recognition locations of the control means 3 determines that “C” is an erroneous recognition location, the character data closest to the character data “C” is disclosed to the display means 4 As shown in FIG. 3B, the document S, for example, “G” is disclosed in bold letters in consideration of ranking.
At this time, in this <display step>, in addition to a measure for disclosing character data in bold characters according to the ranking, a measure for coloring may be considered.
F: <Correction process>
In this <correction step>, the erroneous recognition location disclosed in the display means 4 is corrected by the character input function of the document recognition control system 1.

これにより、この実施例1によれば、印字書類や手書き書類からなる前記書類Sを光学的に読み取る際に、前記書類の認識制御システム1によって、読み取れない箇所である誤認識箇所の情報をデータ化して操作者に指摘することにより、操作者は誤認識箇所を明確に把握することができる。
このため、読み取り処理後に誤認識箇所が指摘されることとなり、誤認識箇所を容易に把握して訂正することができ、前記書類Sを正確に作成する場合と比較して、時間と労力とを軽減させることができる。
また、従来のように技術の開発がなされていない、OCR装置を使用しても、読み取り処理後に誤認識箇所を容易に訂正できることにより、安価なOCR装置を使用することが可能である。
Thus, according to the first embodiment, when the document S, which is a printed document or a handwritten document, is optically read, the document recognition control system 1 stores information on a misrecognized portion that cannot be read as data. By making it to the operator and making it point out, the operator can clearly grasp the erroneously recognized part.
For this reason, a misrecognized portion is pointed out after the reading process, and the misrecognized portion can be easily grasped and corrected. Compared with the case where the document S is accurately created, time and labor are saved. It can be reduced.
Even if an OCR device that has not been developed as in the prior art is used, it is possible to use an inexpensive OCR device by easily correcting a misrecognized portion after the reading process.

また、前記制御手段3に誤認識情報の表示状態を高める前記誤認識度合い調整手段10を備えることにより、例えば前記書類Sの誤認識箇所の誤認識度合いに応じて、前記誤認識度合い調整手段10によって、前記表示手段4に開示される際の前記書類Sの情報の内容である文字データにおける誤認識箇所のランク付けを行うことができ、太文字や色付けによる各ランクによって目視にて判別可能となる。
このため、前記書類Sの誤認識箇所のランク付けによって、前記書類Sの情報の内容確認作業における労力や時間の削減に寄与し得る。
Further, by providing the control means 3 with the misrecognition degree adjusting means 10 for increasing the display state of misrecognition information, the misrecognition degree adjusting means 10 according to the misrecognition degree of the misrecognized portion of the document S, for example. By means of this, it is possible to rank misrecognized portions in the character data that is the content of the information of the document S when it is disclosed to the display means 4, and it can be visually discriminated by each rank by bold characters or coloring. Become.
For this reason, ranking of misrecognized portions of the document S can contribute to reduction of labor and time in the content confirmation work of the information of the document S.

図4及び図5はこの発明の実施例2を示すものである。
この実施例2において、上述実施例1のものと同一機能を果たす箇所には、同一符号を付して説明する。
4 and 5 show Embodiment 2 of the present invention.
In the second embodiment, portions having the same functions as those in the first embodiment will be described with the same reference numerals.

この第2実施例の特徴とするところは、書類の認識制御システム11の制御手段12に印字書類データ記憶手段13を備え、この印字書類データ記憶手段13に予め記憶させた印字データを誤認識箇所に参考表示する構成とした点にある。   The feature of this second embodiment is that the control means 12 of the document recognition control system 11 is provided with a print document data storage means 13, and the print data stored in advance in the print document data storage means 13 is erroneously recognized. The point is that it is configured to be displayed for reference.

すなわち、前記書類の認識制御システム11は、図4に示す如く、上述実施例1と同様に、前記書類読み取り手段2と、前記制御手段12と、前記表示手段4とを備えている。
また、前記書類の認識制御システム11は、前記印刷手段5を備えている。
更に、前記制御手段12は、前記判断手段6と、前記認識箇所用の第1記憶手段7と、前記誤認識箇所用の第2記憶手段8と、前記誤認識箇所指摘手段9と、を備えている。
このとき、前記制御手段12は、図4に示す如く、定型化された印字書類を書類SSとした際に、この書類SSの情報を予め記憶する前記印字書類データ記憶手段13を備えている。
そして、前記制御手段12は、前記判断手段6によって前記書類SSの情報の内容を判断した際に、誤認識箇所を前記印字書類データ記憶手段13に予め記憶させた印字データに照会し、前記印字書類データ記憶手段13に予め記憶させた印字データを誤認識箇所に参考表示する構成を有する。
That is, as shown in FIG. 4, the document recognition control system 11 includes the document reading means 2, the control means 12, and the display means 4 as in the first embodiment.
The document recognition control system 11 includes the printing unit 5.
Further, the control means 12 includes the determination means 6, a first storage means 7 for the recognition location, a second storage means 8 for the erroneous recognition location, and the erroneous recognition location indication means 9. ing.
At this time, as shown in FIG. 4, the control means 12 includes the print document data storage means 13 for preliminarily storing information on the document SS when the stylized print document is used as the document SS.
When the control means 12 determines the content of the information of the document SS by the determination means 6, the control means 12 inquires the print data stored in the print document data storage means 13 in advance for the misrecognized location, and The print data stored in advance in the document data storage means 13 is configured to be displayed as a reference at a misrecognized location.

さすれば、読み取り前には、図5(a)に示す如く、定型化された印字書類からなる前記書類SSを前記印字書類データ記憶手段13に予め記憶させる。
そして、図5(b)に示す如く、前記書類SSの必要箇所に手書きを行う。
その後、前記書類読み取り手段2によって読み取った前記書類SSを前記表示手段4に開示すると、図5(c)に示す如く、手書きを加えた部分である必要箇所が誤認識箇所となり、この誤認識箇所を前記印字書類データ記憶手段13に予め記憶させた印字データに照会し、前記印字書類データ記憶手段13に予め記憶させた印字データを誤認識箇所に参考表示する。
つまり、図5(b)に示す如く、例えば前記書類SSの第1行目において数字の「4」、及び、第2行目において数字の「6」、第3行目において数字の「3」、第4行目において数字の「2」、第5行目において数字の「8」を筆記用具で手書きで消した場合は、図5(c)に示す如く、照会後に黒色や色付けを行った太文字で「4」や「6」、「3」、「2」、「8」と参考表示される。
In other words, before the reading, as shown in FIG. 5A, the document SS composed of the standardized print document is stored in the print document data storage means 13 in advance.
Then, as shown in FIG. 5 (b), handwriting is performed on the necessary part of the document SS.
After that, when the document SS read by the document reading means 2 is disclosed to the display means 4, as shown in FIG. 5 (c), a necessary portion which is a handwritten portion becomes an erroneously recognized portion. Is inquired of the print data stored in advance in the print document data storage means 13, and the print data stored in advance in the print document data storage means 13 is displayed as a reference at a misrecognized location.
That is, as shown in FIG. 5B, for example, the number “4” in the first line of the document SS, the number “6” in the second line, and the number “3” in the third line. When the number “2” in the fourth line and the number “8” in the fifth line are erased by handwriting with a writing tool, as shown in FIG. For reference, “4”, “6”, “3”, “2”, and “8” are displayed in bold.

これにより、この実施例2によれば、定型化された印字書類からなる前記書類SSを光学的に読み取る際に、手書きを加えた部分である必要箇所が誤認識箇所となり、前記書類の認識制御システム11によって、読み取れない箇所である誤認識箇所の情報を参考表示して操作者に指摘することにより、操作者は誤認識箇所を明確に把握することができる。
このため、読み取り処理後に必要箇所が誤認識箇所として参考表示されることとなり、誤認識箇所を容易に把握することができ、前記書類SSを作成する際の時間と労力とを軽減させることができる。
また、誤認識箇所を、黒色や色付けを行った太文字などで表示すれば、定型化された印字書類からなる前記書類SSの重要箇所としてデータ化することが可能となり、例えば各種の報告書のような大量の書類SSのデータ保管を容易に行うことができる。
更に、従来のように技術の開発がなされていない、OCR装置を使用しても、読み取り処理後に誤認識箇所を容易に把握できることにより、安価なOCR装置を使用することが可能である。
Thus, according to the second embodiment, when optically reading the document SS made up of a stylized print document, a necessary portion that is a handwritten portion becomes a misrecognized portion, and the document recognition control is performed. The system 11 makes it possible for the operator to clearly grasp the misrecognized part by displaying the information of the misrecognized part, which is a part that cannot be read, as a reference display and pointing out to the operator.
For this reason, a necessary location is displayed as a misrecognized location after the reading process, the misrecognized location can be easily grasped, and the time and labor when creating the document SS can be reduced. .
In addition, if the misrecognized portion is displayed in black or colored bold characters, it can be converted into data as an important portion of the document SS made up of a stylized printed document, for example, various reports Data storage of such a large amount of documents SS can be easily performed.
Furthermore, even if an OCR device that has not been developed as in the prior art is used, it is possible to use an inexpensive OCR device by easily grasping a misrecognized portion after the reading process.

また、この実施例2の前記書類の認識制御システム11に、上述実施例1にて説明した前記制御手段12に誤認識情報の表示状態を高める前記誤認識度合い調整手段14を付加し、前記書類SSの所定箇所を手書きによって故意に認識できなくした際に、前記書類SSの情報の内容である文字データにおける誤認識箇所のランク付けを行う構成とすることも可能である。
つまり、前記書類SSを、図5(a)に示す如く、その他の手書き書類、例えば定型化された印字書類である、既に完成される書類フォーマット(手書き用記録媒体)からなる構成とした場合、前記判断手段6によって前記書類SSの情報の内容である文字データを判断した際に、誤認識箇所に誤認識度合い、つまり、ランク付けを行うものである。
このとき、図5(a)に示す如く、既に完成される書類フォーマット(手書き用記録媒体)を作成した際に、この書類フォーマットに記載される文字を、図5(b)に示す如く、筆記用具で手書きにて消し、この消した箇所を誤認識箇所として処理する。
そして、上述実施例1と同様に、以下のように3段階にランク付けを行う。
(第1ランク)
:文字データにおいて、最も誤認識状態が甚だしく、全く認識できないもの。
(第2ランク)
:文字データにおいて、誤認識は発生しているが、5〜7割程度の確率で該当する文字を判断用文字情報から開示できるもの。
(第3ランク)
:文字データにおいて、誤認識は発生しているが、3割程度の確率で該当する文字を判断用文字情報から開示できるもの。
そして、各ランクに応じて、太文字や色付けを行い、目視にて各ランクを判別可能とする。
さすれば、前記制御手段3に誤認識情報の表示状態を高める前記誤認識度合い調整手段14を備えることにより、例えば既に完成される書類フォーマット(手書き用記録媒体)からなる前記書類SSの所定箇所を手書きによって故意に認識できなくした場合に、故意の度合いに応じて誤認識箇所の誤認識度合いも大きくなるため、前記誤認識度合い調整手段10によって、前記表示手段4に開示される際の前記書類SSの情報の内容である文字データにおける誤認識箇所のランク付けを行うことができ、太文字や色付けによる各ランクによって目視にて判別可能となる。
このため、前記書類SSの確認のための重要順位に応じてランク付けでき、前記書類SSの情報の内容を確認する際の順位付けも可能となり、書類SSの情報の内容確認作業における労力や時間の削減に寄与し得る。
In addition, the document recognition control system 11 according to the second embodiment is added with the misrecognition degree adjusting means 14 for enhancing the display state of the misrecognition information to the control means 12 described in the first embodiment. It is also possible to have a configuration in which erroneous recognition locations in the character data that is the contents of the information of the document SS are ranked when a predetermined location of the SS cannot be intentionally recognized by handwriting.
In other words, as shown in FIG. 5 (a), when the document SS is configured with another handwritten document, for example, a stylized print document, and a document format (handwritten recording medium) that has already been completed, When the character data which is the content of the information of the document SS is determined by the determination means 6, the degree of erroneous recognition, that is, ranking is performed on the erroneous recognition portion.
At this time, as shown in FIG. 5 (a), when a completed document format (recording medium for handwriting) is created, the characters described in this document format are written as shown in FIG. 5 (b). Erase by hand with a tool, and process this erased location as a misrecognized location.
Then, as in the first embodiment, ranking is performed in three stages as follows.
(1st rank)
: Character data that has the most misrecognized state and cannot be recognized at all.
(2nd rank)
: In character data, misrecognition occurs, but the corresponding character can be disclosed from the character information for determination with a probability of about 50 to 70%.
(3rd rank)
: In character data, misrecognition occurs, but the corresponding character can be disclosed from the character information for determination with a probability of about 30%.
And according to each rank, a bold character or coloring is performed, and each rank can be discriminated visually.
Then, by providing the control means 3 with the misrecognition degree adjusting means 14 for increasing the display state of misrecognition information, for example, a predetermined part of the document SS having a document format (recording medium for handwriting) that has already been completed. Since the misrecognition degree of the misrecognized portion increases according to the deliberate degree, the misrecognition degree adjusting unit 10 causes the misrecognition degree to be disclosed to the display unit 4 It is possible to rank misrecognized portions in the character data that is the content of the information of the document SS, and it is possible to visually discriminate by each rank by bold characters or coloring.
For this reason, it is possible to rank according to the priority order for confirming the document SS, and it is also possible to rank when confirming the content of the information of the document SS. It can contribute to the reduction.

なお、この発明は上述実施例1及び2に限定されるものではなく、種々の応用改変が可能である。   The present invention is not limited to the first and second embodiments described above, and various application modifications can be made.

例えば、この発明の実施例1においては、書類の認識制御システムの表示手段によって、文字データ「C」に最も近似する文字データである、ランク付けを考慮して太文字にて例えば「G」とした書類を開示したが、書類の認識制御システムにピックアップ機能を付加する特別構成とすることも可能である。
すなわち、この発明の実施例1においては、図3(a)及び図3(b)から明らかなように、前記表示手段に書類が開示される場合、両者とも同等の大きさで表示されているが、このピックアップ機能は、書類の誤認識箇所の誤認識度合いに応じて、表示される文字の大きさも変化させるものである。
さすれば、書類の誤認識箇所が、誤認識度合いに応じて大きさ、かつ、太さ、あるいは色にてランク付けされて表示されることとなるため、前記書類の情報の内容を確認する際の順位付けも可能となり、書類の情報の内容確認作業における労力や時間の削減に寄与し得る。
このとき、上述したピックアップ機能による表示動作においては、常時、書類の誤認識箇所の誤認識度合いに応じて、表示される文字の大きさを変化させる方策や、カーソルが指摘した際にのみ表示される文字の大きさを変化させる方策などからなるピックアップ表示拡大機能が考えられる。
For example, in the first embodiment of the present invention, the display means of the document recognition control system is character data that is the closest to the character data “C”, for example, “G” in bold characters in consideration of ranking. Although the document has been disclosed, a special configuration in which a pickup function is added to the document recognition control system is also possible.
That is, in the first embodiment of the present invention, as is apparent from FIGS. 3A and 3B, when documents are disclosed on the display means, both are displayed in the same size. However, this pick-up function also changes the size of the displayed character according to the degree of misrecognition of the misrecognized portion of the document.
Then, the misrecognized portions of the document are displayed in a size, thickness, or color according to the degree of misrecognition, so the content of the information on the document is confirmed. Ranking can be made, and it can contribute to the reduction of labor and time in the work of checking the contents of document information.
At this time, in the display operation by the pickup function described above, it is always displayed only when the cursor points out a measure for changing the size of the displayed character according to the degree of misrecognition of the misrecognized portion of the document. A function for enlarging the pickup display, which includes measures to change the size of the characters to be displayed, can be considered.

1 書類の認識制御システム
2 書類読み取り手段
3 制御手段
4 表示手段
5 印刷手段
6 判断手段
7 認識箇所用の第1記憶手段
8 誤認識箇所用の第2記憶手段
9 誤認識箇所指摘手段
S 書類
DESCRIPTION OF SYMBOLS 1 Document recognition control system 2 Document reading means 3 Control means 4 Display means 5 Printing means 6 Judgment means 7 1st memory means for recognition location 8 Second storage means for erroneous recognition location 9 Error recognition location indication means S Document

Claims (3)

印字書類や手書き書類からなる書類を光学的に読み取り、読み取った情報をデータ化すべく制御する書類の認識制御システムにおいて、前記書類を読み取る書類読み取り手段と、この書類読み取り手段からの読み取り信号を入力して前記書類の情報をデータ化する制御手段と、この制御手段から出力される制御信号によって前記書類の情報を表示する表示手段とを備え、前記制御手段は、前記書類読み取り手段からの読み取り信号によって前記書類の情報の内容を判断する判断手段と、この判断手段によって前記書類の情報の内容を判断した際に、認識箇所の情報をデータ化して記憶する認識箇所用の第1記憶手段と、前記判断手段によって前記書類の情報の内容を判断した際に、誤認識箇所の情報をデータ化して記憶する誤認識箇所用の第2記憶手段と、この誤認識箇所用の第2記憶手段に記憶させた誤認識箇所の情報を前記表示手段に指摘して開示する誤認識箇所指摘手段と、を備えることを特徴とする書類の認識制御システム。   In a document recognition control system for optically reading a document consisting of a printed document or a handwritten document and controlling the read information to be converted into data, a document reading means for reading the document and a reading signal from the document reading means are input. Control means for converting the information of the document into data, and display means for displaying the information of the document by a control signal output from the control means. The control means is based on a reading signal from the document reading means. Determining means for determining the content of the information of the document, and when the content of the information of the document is determined by the determining means, the first storage means for the recognition location that stores the information of the recognition location as data; When the content of the information of the document is judged by the judging means, the information for the misrecognized part is stored as data of the misrecognized part as data. Document recognition comprising: storage means; and misrecognition location indicating means for indicating and disclosing information on misrecognition locations stored in the second storage means for this erroneous recognition location to the display means Control system. 前記制御手段は、前記判断手段によって前記書類の情報の内容を判断した際に、誤認識箇所の誤認識度合いが大きくなるに連れて、前記誤認識箇所指摘手段による前記表示手段に開示する誤認識情報の表示状態を高める誤認識度合い調整手段を備えることを特徴とする請求項1に記載の書類の認識制御システム。   When the control means determines the content of the document information by the determination means, the misrecognition disclosed to the display means by the misrecognition location indication means as the misrecognition location misrecognition degree increases. The document recognition control system according to claim 1, further comprising a misrecognition degree adjusting unit for increasing a display state of information. 前記制御手段は、定型化された印字書類を前記書類とした際に、この書類の情報を予め記憶する印字書類データ記憶手段を備え、前記判断手段によって前記書類の情報の内容を判断した際に、誤認識箇所を前記印字書類データ記憶手段に予め記憶させた印字データに照会し、前記印字書類データ記憶手段に予め記憶させた印字データを誤認識箇所に参考表示することを特徴とする請求項1に記載の書類の認識制御システム。   The control means includes a print document data storage means for preliminarily storing information on the document when the stylized print document is used as the document, and when the content of the document information is determined by the determination means. The print data stored in advance in the print document data storage means is referred to the print data stored in the print document data storage means, and the print data stored in the print document data storage means is displayed as a reference in the error recognition position. The document recognition control system according to 1.
JP2016038727A 2016-03-01 2016-03-01 Document recognition control system Pending JP2017156922A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016038727A JP2017156922A (en) 2016-03-01 2016-03-01 Document recognition control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016038727A JP2017156922A (en) 2016-03-01 2016-03-01 Document recognition control system

Publications (1)

Publication Number Publication Date
JP2017156922A true JP2017156922A (en) 2017-09-07

Family

ID=59810118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016038727A Pending JP2017156922A (en) 2016-03-01 2016-03-01 Document recognition control system

Country Status (1)

Country Link
JP (1) JP2017156922A (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08153163A (en) * 1994-11-29 1996-06-11 Sharp Corp Image processor
JP2001101178A (en) * 1999-09-30 2001-04-13 Casio Comput Co Ltd Data processor and its program recording medium
JP2005018678A (en) * 2003-06-30 2005-01-20 Casio Comput Co Ltd Form data input processing device, form data input processing method, and program
JP2012073769A (en) * 2010-09-28 2012-04-12 Kawai Musical Instr Mfg Co Ltd Musical score recognition device and computer program
JP2014137791A (en) * 2013-01-18 2014-07-28 Fujitsu Ltd Display program, display device and display method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08153163A (en) * 1994-11-29 1996-06-11 Sharp Corp Image processor
JP2001101178A (en) * 1999-09-30 2001-04-13 Casio Comput Co Ltd Data processor and its program recording medium
JP2005018678A (en) * 2003-06-30 2005-01-20 Casio Comput Co Ltd Form data input processing device, form data input processing method, and program
JP2012073769A (en) * 2010-09-28 2012-04-12 Kawai Musical Instr Mfg Co Ltd Musical score recognition device and computer program
JP2014137791A (en) * 2013-01-18 2014-07-28 Fujitsu Ltd Display program, display device and display method

Similar Documents

Publication Publication Date Title
US10810352B2 (en) Integrated document editor
JP4873138B2 (en) Information processing apparatus and program
JP2008276766A (en) Form automatic filling method and device
JP4078009B2 (en) CHARACTERISTIC RECORDING AREA DETECTION DEVICE FOR FORM, CHARACTER RECORDING AREA DETECTION METHOD FOR FORM, STORAGE MEDIUM, AND FORM FORMAT CREATION DEVICE
US8989497B2 (en) Handwritten character input device, remote device, and electronic information terminal
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
US20070201768A1 (en) Method And System For Acquiring Data From Machine-Readable Documents
US20160127571A1 (en) Image Reading Device and Image Reading Method
JP4578837B2 (en) Handwritten information input device, handwritten information input method, program
US20220357844A1 (en) Integrated document editor
JP2017156922A (en) Document recognition control system
JP4543741B2 (en) Graph creating apparatus, program, and recording medium
JP4710707B2 (en) Additional recording information processing method, additional recording information processing apparatus, and program
CN111767011A (en) Password printing method, tracing method and system based on black and white printing file
JP2020149166A (en) Scoring device and scoring program
CA3075627A1 (en) Integrated document editor
JP4566247B2 (en) Scoring system and program
CN106959940A (en) A kind of document format for being easy to document automation typing and conversion and recognition methods
JP2004118795A (en) Calculation system, calculation program, and calculation form
JP3310063B2 (en) Document processing device
JP3648270B2 (en) Form reading device and accounting form reading device
JP2994932B2 (en) Handwritten character recognition device
JPH0452885A (en) Character reader
JPH04293185A (en) Filing device
JPH09259225A (en) Character recognizing and converting method and character data processor

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20170510

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180518

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20180518

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190416

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191112