JP6075158B2 - Character input support program and character input support device - Google Patents

Character input support program and character input support device Download PDF

Info

Publication number
JP6075158B2
JP6075158B2 JP2013071012A JP2013071012A JP6075158B2 JP 6075158 B2 JP6075158 B2 JP 6075158B2 JP 2013071012 A JP2013071012 A JP 2013071012A JP 2013071012 A JP2013071012 A JP 2013071012A JP 6075158 B2 JP6075158 B2 JP 6075158B2
Authority
JP
Japan
Prior art keywords
character
input
character string
correction
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013071012A
Other languages
Japanese (ja)
Other versions
JP2014194694A (en
Inventor
勲 真柄
勲 真柄
誉史 瀬川
誉史 瀬川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013071012A priority Critical patent/JP6075158B2/en
Publication of JP2014194694A publication Critical patent/JP2014194694A/en
Application granted granted Critical
Publication of JP6075158B2 publication Critical patent/JP6075158B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、文字入力支援プログラムおよび文字入力支援装置に関する。   The present invention relates to a character input support program and a character input support device.

近年、画像に含まれる文字を自動認識する技術が発展している。このような文字認識処理は、例えば、伝票など文字を含む書面をスキャナなどで光学的に読み取り、読み取られた書面の画像を記憶されたパターンと照合することで文字を認識する。   In recent years, techniques for automatically recognizing characters included in images have been developed. In such character recognition processing, for example, a document including characters such as a slip is optically read by a scanner or the like, and a character is recognized by collating an image of the read document with a stored pattern.

また、文字認識に関連する技術としては、例えば、自動文字認識による第一修正文字データに含まれる修正有無と、自動文字認識による第二修正文字データに含まれる修正有無との組み合わせにより、文字毎の信頼性レベルを判定する技術が提案されている。   In addition, as a technique related to character recognition, for example, a combination of the presence or absence of correction included in the first corrected character data by automatic character recognition and the presence or absence of correction included in the second corrected character data by automatic character recognition, A technique for determining the reliability level of the system has been proposed.

特開2006−99213号公報JP 2006-99213 A

ところで、書面から認識された文字列と、オペレータによって書面を見ながら入力された文字列とを比較し、一致しない文字がある場合に誤入力の発生を警告することで、オペレータの入力操作を支援することが可能となる。しかしながら、このような入力支援では、単に文字同士が一致しない位置をオペレータに通知できるのみであった。   By the way, the character string recognized from the document is compared with the character string input while looking at the document by the operator. It becomes possible to do. However, such input support can only notify the operator of the position where the characters do not match.

1つの側面では、本発明は、オペレータの利便性が向上した文字入力支援プログラムおよび文字入力支援装置を提供することを目的とする。   In one aspect, an object of the present invention is to provide a character input support program and a character input support device with improved operator convenience.

1つの案では、文字入力支援プログラムが提供される。コンピュータは、この文字入力支援プログラムに従って次のような処理を実行する。コンピュータは、画像から認識された第1の文字列と、第1の文字列に含まれる各文字についての認識の正確さを示す確度と、入力操作に応じて入力された第2の文字列とを取得する。また、第1の文字列に含まれる各文字と第2の文字列に含まれる各文字とを先頭から一対一で比較して、比較した文字同士が異なり、かつ対応する確度が第1の閾値以上である第1の文字を第1の文字列から抽出する。さらに、第1の文字に隣接し、かつ対応する確度が第2の閾値未満である第2の文字を第1の文字列から抽出する。そして、第1の文字および第2の文字に対応する第2の文字列の文字ペアを誤入力と判定する。   In one proposal, a character input support program is provided. The computer executes the following processing according to the character input support program. The computer includes a first character string recognized from the image, an accuracy indicating the accuracy of recognition for each character included in the first character string, and a second character string input according to the input operation. To get. Further, each character included in the first character string and each character included in the second character string are compared on a one-to-one basis from the top, the compared characters are different, and the corresponding accuracy is the first threshold value. The first character as described above is extracted from the first character string. Furthermore, a second character that is adjacent to the first character and has a corresponding accuracy less than the second threshold is extracted from the first character string. And the character pair of the 2nd character string corresponding to a 1st character and a 2nd character is determined as an incorrect input.

また、1つの案では、上記文字入力支援プログラムによって実現される処理と同様の処理を実行する文字入力支援装置が提供される。   Further, in one proposal, a character input support device is provided that executes processing similar to the processing realized by the character input support program.

1態様によれば、オペレータの利便性が向上する。   According to one aspect, the convenience for the operator is improved.

第1の実施の形態の文字入力支援装置の構成例および処理例を示す図である。It is a figure which shows the structural example and processing example of the character input assistance apparatus of 1st Embodiment. 第2の実施の形態の伝票入力システムの構成例を示す図である。It is a figure which shows the structural example of the slip input system of 2nd Embodiment. 伝票入力装置のハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of a slip input device. 入力画面の例を示す図である。It is a figure which shows the example of an input screen. 修正候補表示の例を示す図である。It is a figure which shows the example of a correction candidate display. 伝票入力システムの機能例を示すブロック図である。It is a block diagram which shows the function example of a slip input system. 認識率テーブルの例を示す図である。It is a figure which shows the example of a recognition rate table. 認証文字データおよび入力文字データの例を示す図である。It is a figure which shows the example of authentication character data and input character data. 認識率算出テーブルの例を示す図である。It is a figure which shows the example of a recognition rate calculation table. 1つの修正候補が判定される例を示す図である。It is a figure which shows the example in which one correction candidate is determined. 2つの修正候補が判定される例を示す図である。It is a figure which shows the example in which two correction candidates are determined. 修正候補が判定されない例を示す図である。It is a figure which shows the example in which a correction candidate is not determined. 文字入力を支援する処理の例を示すフローチャートである。It is a flowchart which shows the example of the process which supports character input. 文字入力を支援する処理の例を示すフローチャート(続き)である。It is a flowchart (continuation) which shows the example of the process which supports character input. 修正候補を判定する処理の例を示すフローチャートである。It is a flowchart which shows the example of the process which determines a correction candidate.

以下、本実施の形態を図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態の文字入力支援装置の構成例および処理例を示す図である。
Hereinafter, the present embodiment will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating a configuration example and a processing example of the character input support device according to the first embodiment.

文字入力支援装置10は、ユーザによる文字の入力操作を支援する装置である。文字入力支援装置10は、取得部11および判定部12を有する。
取得部11は、画像1から認識された文字列2(第1の文字列)と、この文字列2に含まれる各文字についての認識の正確さを示す確度と、入力操作に応じて入力された文字列3(第2の文字列)とを取得する。画像1は、例えば、スキャナ等の機器によって書類を読み取ることで得られたものである。また、文字列3は、例えば、この書面を見ながらオペレータの操作によって入力されたものである。
The character input support device 10 is a device that supports a user's character input operation. The character input support device 10 includes an acquisition unit 11 and a determination unit 12.
The acquisition unit 11 is input in accordance with the character string 2 (first character string) recognized from the image 1, the accuracy indicating the recognition accuracy of each character included in the character string 2, and the input operation. Character string 3 (second character string) is acquired. The image 1 is obtained by reading a document with a device such as a scanner, for example. The character string 3 is input by an operator's operation while viewing this document, for example.

判定部12は、文字列2に含まれる各文字と文字列3に含まれる各文字とを先頭から一対一で比較する。そして、判定部12は、比較した文字同士が異なり、かつ対応する確度が第1の閾値以上である第1の文字を、文字列2から抽出する。   The determination unit 12 compares each character included in the character string 2 with each character included in the character string 3 on a one-to-one basis from the top. Then, the determination unit 12 extracts, from the character string 2, the first character whose compared characters are different and the corresponding accuracy is equal to or higher than the first threshold value.

さらに、判定部12は、抽出された第1の文字に隣接し、かつ対応する確度が第2の閾値未満である第2の文字を、文字列2から抽出する。なお、第1の閾値と第2の閾値は、同じ値であってもよい。   Further, the determination unit 12 extracts, from the character string 2, a second character that is adjacent to the extracted first character and has a corresponding accuracy that is less than the second threshold. Note that the first threshold value and the second threshold value may be the same value.

そして、判定部12は、第1の文字および第2の文字にそれぞれ対応する文字列3の文字ペアを、誤入力と判定する。
ここで、例として、画像1には文字列“123”が含まれており、文字認識により文字列2として“123”が認識され、入力操作に応じて文字列3として“132”が入力されたとする。また、第1の閾値および第2の閾値を“80”とする。
Then, the determination unit 12 determines that the character pair of the character string 3 corresponding to each of the first character and the second character is an erroneous input.
Here, as an example, the image 1 includes the character string “123”, “123” is recognized as the character string 2 by character recognition, and “132” is input as the character string 3 according to the input operation. Suppose. Further, the first threshold value and the second threshold value are set to “80”.

この場合、まず、取得部11により、文字列2として“123”が取得され、文字列3として“132”が取得される。また、確度として文字列2の先頭から“85”,“90”,“50”が取得される。   In this case, first, the acquisition unit 11 acquires “123” as the character string 2 and “132” as the character string 3. Further, “85”, “90”, and “50” are acquired from the top of the character string 2 as the accuracy.

判定部12は、文字列2および文字列3の各文字を比較する。すると、文字列3と一致しない文字として“2”および“3”が文字列2から抽出される。抽出された文字“2”に対応する確度は“90”であり、抽出された文字“3”に対応する確度は“50”である。そのため、判定部12は、文字列2から、対応する確度が閾値以上である“2”を第1の文字として抽出する。   The determination unit 12 compares each character of the character string 2 and the character string 3. Then, “2” and “3” are extracted from the character string 2 as characters that do not match the character string 3. The accuracy corresponding to the extracted character “2” is “90”, and the accuracy corresponding to the extracted character “3” is “50”. Therefore, the determination unit 12 extracts “2” whose corresponding accuracy is greater than or equal to the threshold value from the character string 2 as the first character.

次に、判定部12は、第1の文字“2”に隣接し、かつ対応する確度が閾値未満である第2の文字を、文字列2から抽出する。第1の文字“2”に隣接する文字は、“1”および“3”である。また、文字列2において、文字“1”に対応する確度は“85”であり、文字“3”に対応する確度は“50”である。そのため、文字列2から、対応する確度が閾値未満である“3”が第2の文字として抽出される。   Next, the determination unit 12 extracts from the character string 2 a second character that is adjacent to the first character “2” and whose corresponding accuracy is less than the threshold. The characters adjacent to the first character “2” are “1” and “3”. In the character string 2, the accuracy corresponding to the character “1” is “85”, and the accuracy corresponding to the character “3” is “50”. Therefore, “3” having a corresponding accuracy less than the threshold is extracted from the character string 2 as the second character.

判定部12は、文字列2から抽出された第1の文字“2”および第2の文字“3”にそれぞれ対応する文字列3の文字ペアを特定する。文字列3の文字のうち、第1の文字“2”と同じ位置の文字は“3”であり、第2の文字“3”と同じ位置の文字は“2”である。このため、文字ペアとして“32”が特定される。判定部12は、文字列3における文字ペア“32”を、誤入力が発生していると判定する。具体的には、文字ペア“32”は、本来“23”であったものが順序が入れ替わって入力されたものと判定される。   The determination unit 12 specifies a character pair of the character string 3 that respectively corresponds to the first character “2” and the second character “3” extracted from the character string 2. Of the characters in the character string 3, the character at the same position as the first character “2” is “3”, and the character at the same position as the second character “3” is “2”. For this reason, “32” is specified as the character pair. The determination unit 12 determines that an erroneous input has occurred in the character pair “32” in the character string 3. Specifically, it is determined that the character pair “32” is originally “23” but is input with the order changed.

ここで、店舗の窓口のオペレータのようにキー入力操作に慣れているオペレータの誤入力としては、入力順が入れ替わってしまう誤入力の発生確率が高い。入力順が間違っている場合、入力された文字列のうち隣接する2つの文字のペアについて、入力が間違っていることになる。   Here, as an erroneous input of an operator who is accustomed to the key input operation, such as an operator at a store window, there is a high probability of an erroneous input in which the input order is changed. If the input order is incorrect, the input is incorrect for two adjacent character pairs in the input character string.

上記処理により抽出された第2の文字“3”の位置については、認識の確度が所定の閾値未満であることから、誤入力されたのか、あるいは文字認識において誤認識されたのか、あるいは正しく入力されたのかを判定することが難しい。しかしながら、隣接する第1の文字“2”の位置については、認識の確度が所定の閾値以上で、かつ文字列2,3の間で文字が不一致であることから、誤入力された可能性が高い。前述のように、入力順が入れ替わるという誤入力の発生確率が高いことを鑑みると、文字列3においては、誤入力の確率が高い第1の文字“2”に対応する文字“3”と、第1の文字“2”に隣接し、かつ正確な判定が不可能な状態にある第2の文字“3”に対応する文字“2”とが、入れ替わって入力された可能性が高いと考えることができる。   Regarding the position of the second character “3” extracted by the above processing, because the recognition accuracy is less than a predetermined threshold value, it has been erroneously input, has been erroneously recognized in character recognition, or is correctly input. It is difficult to judge whether it was done. However, the position of the adjacent first character “2” may be erroneously input because the recognition accuracy is equal to or higher than a predetermined threshold value and the characters do not match between the character strings 2 and 3. high. As described above, in view of the high probability of erroneous input that the input order is switched, in the character string 3, the character “3” corresponding to the first character “2” having the high probability of erroneous input; The character “2” corresponding to the second character “3” that is adjacent to the first character “2” and in a state where accurate determination cannot be performed is considered to be highly likely to have been input after being replaced. be able to.

これに対して、文字列2において、第1の文字“2”に隣接する文字“1”については、認識の確度が所定の閾値以上であり、かつ文字の比較結果が一致している。このことから、文字列2の文字“1”に対応する文字列3の文字“1”については、正しく入力された可能性が高いと考えられる。   On the other hand, in the character string 2, for the character “1” adjacent to the first character “2”, the recognition accuracy is equal to or higher than a predetermined threshold value, and the character comparison results match. From this, it is considered that there is a high possibility that the character “1” of the character string 3 corresponding to the character “1” of the character string 2 is correctly input.

以上の理由から、判定部12は、文字列3の文字のうち、第1の文字“2”および第2の文字“3”に対応する文字ペア“32”を、誤入力と判定する。これにより、文字入力支援装置10は、単に文字列2,3の各文字の一致判定に基づくのではなく、統計的な誤入力の発生状況を考慮して、誤入力を判定することが可能になる。従って、オペレータの利便性を高めることができる。   For the above reason, the determination unit 12 determines that the character pair “32” corresponding to the first character “2” and the second character “3” among the characters of the character string 3 is an erroneous input. As a result, the character input support device 10 can determine an erroneous input in consideration of a statistical erroneous input occurrence status, not simply based on a match determination of each character of the character strings 2 and 3. Become. Therefore, convenience for the operator can be enhanced.

例えば、オペレータは、上記の第2の文字が文字列3における対応する文字と一致していたとしても、第1の文字に対応する文字列3の文字だけでなく、第2の文字に対応する文字列3の文字についても誤入力であると判断できる。従って、オペレータは、文字列2,3の各文字の一致判定だけでは認識できない誤入力を、即座に認識できるようになる。   For example, even if the second character matches the corresponding character in the character string 3, the operator corresponds not only to the character in the character string 3 corresponding to the first character but also to the second character. It can be determined that the character of the character string 3 is also an erroneous input. Therefore, the operator can immediately recognize an erroneous input that cannot be recognized only by the matching determination of each character in the character strings 2 and 3.

また、前述のように、上記の第2の文字“3”については、認識の確度が所定の閾値未満であることから、誤入力等の正確な判定が困難である。しかしながら、このような文字についても、上記処理により、隣接する文字についての一致判定結果および認識の確度を用いた新たな判定基準によって、誤入力が発生しているかを判定することが可能となる。   Further, as described above, since the accuracy of recognition of the second character “3” is less than a predetermined threshold, it is difficult to accurately determine an erroneous input or the like. However, even for such characters, it is possible to determine whether or not an erroneous input has occurred by the above processing based on the new determination criterion using the matching determination result and the recognition accuracy for adjacent characters.

そして、判定部12は、文字列3において、第2の文字“2”に対応する“3”および、第3の文字“3”に対応する“2”のペアが誤入力の候補と判定する。
ここで、書面から認識された文字列と、オペレータによって書面を見ながら入力された文字列とを比較し、一致しない文字がある場合に誤入力の発生を警告する入力支援では、単に文字同士が一致しない位置をオペレータに通知できるのみであった。
Then, the determination unit 12 determines that a pair of “3” corresponding to the second character “2” and “2” corresponding to the third character “3” in the character string 3 is a candidate for erroneous input. .
Here, the character string recognized from the document is compared with the character string entered while looking at the document by the operator. It was only possible to notify the operator of the mismatched position.

上記の処理によれば、第2の文字および第3の文字に対応する第2の文字列のペアを誤入力の候補と判定できる。よって、入力操作するオペレータの利便性が向上する。
[第2の実施の形態]
次に、第1の実施の形態の文字入力支援装置を、顧客が記入した伝票を見ながらオペレータが文字を入力する伝票入力システムに適用した例について説明する。伝票入力システムは、第1の実施の形態の文字入力支援装置と同様に、誤入力の候補を判定し、誤入力の候補と判定されたペアについて、修正候補をオペレータに提示する。
According to the above processing, the second character string pair corresponding to the second character and the third character can be determined as an erroneous input candidate. Therefore, the convenience of the operator who performs the input operation is improved.
[Second Embodiment]
Next, an example will be described in which the character input support device according to the first embodiment is applied to a slip input system in which an operator inputs characters while looking at a slip entered by a customer. Similar to the character input support device of the first embodiment, the slip input system determines an erroneous input candidate and presents correction candidates to the operator for the pair determined as an erroneous input candidate.

図2は、第2の実施の形態の伝票入力システムの構成例を示す図である。伝票入力システム5は、複数のスキャナ20、複数の伝票入力装置100および認識率DBサーバ200を有する。スキャナ20は、各伝票入力装置100に1台ずつ接続されている。また、認識率DBサーバ200は、ネットワーク30を介して各伝票入力装置100と接続されている。   FIG. 2 is a diagram illustrating a configuration example of a slip input system according to the second embodiment. The slip input system 5 includes a plurality of scanners 20, a plurality of slip input devices 100, and a recognition rate DB server 200. One scanner 20 is connected to each slip input device 100. The recognition rate DB server 200 is connected to each slip input device 100 via the network 30.

スキャナ20は、顧客が手書きで記入した伝票を光学的に読み取り画像データを生成する。スキャナ20は、OCR(Optical Character Reader)機能を有する。すなわち、スキャナ20は、読み取った画像をあらかじめ記憶されたパターンと照合することで、画像に含まれる文字を認識する。以下、このような文字認識を「OCR認識」と記載し、OCR認識された文字による文字列を認識文字列と記載する。スキャナ20は、生成した画像データを、OCR認識された文字のデータを含む文書データに変換する。文書データには、例えば、入力項目毎に、認識文字列の文字コードが含まれる。また、スキャナ20は、変換された文書データを伝票入力装置100に送信する。   The scanner 20 optically reads a slip handwritten by a customer and generates image data. The scanner 20 has an OCR (Optical Character Reader) function. That is, the scanner 20 recognizes characters included in the image by collating the read image with a previously stored pattern. Hereinafter, such character recognition is referred to as “OCR recognition”, and a character string formed by OCR recognized characters is referred to as a recognized character string. The scanner 20 converts the generated image data into document data including character data recognized by OCR. The document data includes, for example, a character code of a recognized character string for each input item. In addition, the scanner 20 transmits the converted document data to the slip input device 100.

認識率DBサーバ200は、OCR認識が可能な文字の種別毎の認識率に関する情報を格納するDBサーバである。認識率とは、OCR認識による文字認識の精度を示す数値である。本実施の形態において、認識率は、OCR認識された文字それぞれについての認識の確かさを示す確度を判定するためのパラメータとして用いられる。   The recognition rate DB server 200 is a DB server that stores information regarding the recognition rate for each type of character that can be OCR recognized. The recognition rate is a numerical value indicating the accuracy of character recognition by OCR recognition. In the present embodiment, the recognition rate is used as a parameter for determining the accuracy indicating the certainty of recognition for each character that has been OCR recognized.

認識率DBサーバ200は、文字の種別毎の認識率を算出するための情報(例えば、OCR認識した回数、OCR認識の正解数など)を、各伝票入力装置100から定期的に(例えば、営業終了時)集計する。認識率DBサーバ200は、認識率を算出するための情報の集計結果に基づいて、文字の種別毎に認識率を算出する。認識率DBサーバ200は、算出された認識率を示す情報を伝票入力装置100へ定期的(例えば、毎営業開始時)に送信する。   The recognition rate DB server 200 periodically receives information (for example, the number of times of OCR recognition, the number of correct answers of OCR recognition, etc.) for calculating the recognition rate for each character type from each slip input device 100 (for example, sales). At the end). The recognition rate DB server 200 calculates a recognition rate for each character type based on the result of collecting information for calculating the recognition rate. The recognition rate DB server 200 transmits information indicating the calculated recognition rate to the slip input device 100 periodically (for example, at the start of every business).

なお、認識率DBサーバ200は、バックアップのためのDBサーバを含め、複数備えられてもよい。この場合、各文字の種別の認識率に関する情報が一致するように制御する。   A plurality of recognition rate DB servers 200 including a backup DB server may be provided. In this case, control is performed so that the information regarding the recognition rate of each character type matches.

伝票入力装置100は、オペレータが伝票に記入された文字を入力するためのコンピュータである。また、伝票入力装置100は、オペレータによる文字の入力作業を支援する機能を備える。   The slip input device 100 is a computer for an operator to input characters entered on a slip. In addition, the slip input device 100 has a function of assisting an operator in inputting characters.

伝票入力装置100は、スキャナ20から受信した文書データに基づいて、オペレータが伝票に記入された文字を入力するための入力画面を生成し、生成した入力画面をディスプレイに表示する。伝票入力装置100は、オペレータにより入力画面に入力された文字列を入力文字データとして取得する。   The slip input device 100 generates an input screen for an operator to input characters entered in the slip based on the document data received from the scanner 20, and displays the generated input screen on a display. The slip input device 100 acquires a character string input on the input screen by the operator as input character data.

また、伝票入力装置100は、OCR認識が可能な文字の種別毎に、認識率を示す情報を認識率DBサーバ200から受信する。また、伝票入力装置100は、OCR認識による認識文字列の各文字に、受信した認識率を対応付けることで認識文字データを生成する。   Further, the slip input device 100 receives information indicating the recognition rate from the recognition rate DB server 200 for each type of character that can be OCR recognized. In addition, the slip input apparatus 100 generates recognized character data by associating each character of the recognized character string by OCR recognition with the received recognition rate.

さらに、伝票入力装置100は、取得された入力文字データと、生成された認識文字データとを入力項目毎に比較して、オペレータが誤入力した可能性のある入力項目を特定する。伝票入力装置100は、特定された入力項目について、例えば、色を変更して表示させる。この場合、伝票入力装置100は、特定された入力項目に入力されている文字列を、フォントの種別や大きさを変更することにより強調してもよい。   Further, the slip input device 100 compares the acquired input character data and the generated recognized character data for each input item, and specifies an input item that may be erroneously input by the operator. The slip input device 100 displays the specified input item with, for example, a color changed. In this case, the slip input apparatus 100 may emphasize the character string input to the specified input item by changing the type or size of the font.

伝票入力装置100は、誤入力された可能性のある入力項目について、取得された入力文字データと、生成された認識文字データとに基づいて、修正候補を判定する。伝票入力装置100は、判定された修正候補をディスプレイに提示する。その後、オペレータが修正候補を選択することで、誤入力された可能性のある入力項目に対応する入力文字データが修正される。   The slip input apparatus 100 determines a correction candidate for an input item that may have been erroneously input, based on the acquired input character data and the generated recognized character data. The slip input apparatus 100 presents the determined correction candidates on the display. Thereafter, when the operator selects a correction candidate, the input character data corresponding to the input item that may have been erroneously input is corrected.

伝票入力装置100は、認識率を算出するための情報を文字の種別毎に集計する。また、伝票入力装置100は、集計した情報を定期的(例えば、毎営業終了時)に認識率DBサーバ200に送信する。   The slip input apparatus 100 aggregates information for calculating the recognition rate for each character type. In addition, the slip input device 100 transmits the collected information to the recognition rate DB server 200 periodically (for example, at the end of every business).

なお、OCR認識機能は、スキャナ20ではなく、伝票入力装置100が有してもよい。この場合、スキャナ20は、顧客が記入した伝票の画像データを伝票入力装置100に送信する。そして、伝票入力装置100は、受信した画像データに基づいて、認識文字データを生成する。   Note that the OCR recognition function may be included in the slip input device 100 instead of the scanner 20. In this case, the scanner 20 transmits the image data of the slip entered by the customer to the slip input device 100. Then, the slip input device 100 generates recognized character data based on the received image data.

図3は、伝票入力装置のハードウェア構成例を示す図である。伝票入力装置100は、プロセッサ101、RAM(Random Access Memory)102、HDD(Hard Disk Drive)103、画像信号処理部104、入力信号処理部105、ディスクドライブ106、通信インタフェース107および機器接続部108を有する。上記ユニットは、伝票入力装置100内でバス109に接続されている。認識率DBサーバ200も、伝票入力装置100と同様のハードウェアを用いて実現できる。   FIG. 3 is a diagram illustrating a hardware configuration example of the slip input apparatus. The slip input device 100 includes a processor 101, a RAM (Random Access Memory) 102, an HDD (Hard Disk Drive) 103, an image signal processing unit 104, an input signal processing unit 105, a disk drive 106, a communication interface 107, and a device connection unit 108. Have. The unit is connected to the bus 109 in the slip input device 100. The recognition rate DB server 200 can also be realized using the same hardware as the slip input device 100.

プロセッサ101は、プログラムの命令を実行する演算器を含むプロセッサである。プロセッサ101は、HDD103に記憶されているプログラムやデータの少なくとも一部をRAM102にロードしてプログラムを実行する。なお、プロセッサ101は複数のプロセッサコアを備えてもよい。また、伝票入力装置100は、複数のプロセッサを備えてもよい。また、伝票入力装置100は、複数のプロセッサまたは複数のプロセッサコアを用いて並列処理を行ってもよい。また、2以上のプロセッサの集合、FPGA(Field-Programmable Gate Array)やASIC(Application Specific Integrated Circuit)などの専用回路、2以上の専用回路の集合、プロセッサと専用回路の組み合わせなどを「プロセッサ」と呼んでもよい。   The processor 101 is a processor including an arithmetic unit that executes program instructions. The processor 101 loads at least a part of the program and data stored in the HDD 103 into the RAM 102 and executes the program. The processor 101 may include a plurality of processor cores. The slip input device 100 may include a plurality of processors. The slip input apparatus 100 may perform parallel processing using a plurality of processors or a plurality of processor cores. In addition, a set of two or more processors, a dedicated circuit such as a field-programmable gate array (FPGA) or an application specific integrated circuit (ASIC), a set of two or more dedicated circuits, or a combination of a processor and a dedicated circuit is referred to as a “processor”. You may call it.

RAM102は、プロセッサ101が実行するプログラムやプログラムから参照されるデータを一時的に記憶する揮発性メモリである。なお、伝票入力装置100は、RAM以外の種類のメモリを備えてもよく、複数個の揮発性メモリを備えてもよい。   The RAM 102 is a volatile memory that temporarily stores programs executed by the processor 101 and data referred to by the programs. Note that the slip input device 100 may include a type of memory other than the RAM, or may include a plurality of volatile memories.

HDD103は、OS(Operating System)やファームウェアやアプリケーションソフトウェア等のソフトウェアのプログラムおよびデータを記憶する不揮発性の記憶装置である。なお、伝票入力装置100は、フラッシュメモリ等の他の種類の記憶装置を備えてもよく、複数個の不揮発性の記憶装置を備えてもよい。   The HDD 103 is a non-volatile storage device that stores software programs and data such as an OS (Operating System), firmware, and application software. Note that the slip input device 100 may include other types of storage devices such as a flash memory, and may include a plurality of nonvolatile storage devices.

画像信号処理部104は、プロセッサ101からの命令に従って、伝票入力装置100に接続されたディスプレイ21に画像を出力する。ディスプレイ21としては、CRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイ等を用いることができる。   The image signal processing unit 104 outputs an image to the display 21 connected to the slip input device 100 in accordance with an instruction from the processor 101. As the display 21, a CRT (Cathode Ray Tube) display, a liquid crystal display, or the like can be used.

入力信号処理部105は、伝票入力装置100に接続された入力デバイス22から入力信号を取得し、プロセッサ101に通知する。入力デバイス22としては、マウスやタッチパネル等のポインティングデバイス、キーボードやテンキー等を用いることができる。   The input signal processing unit 105 acquires an input signal from the input device 22 connected to the slip input device 100 and notifies the processor 101 of the input signal. As the input device 22, a pointing device such as a mouse or a touch panel, a keyboard, a numeric keypad, or the like can be used.

ディスクドライブ106は、記録媒体23に記録されたプログラムやデータを読み取る駆動装置である。記録媒体23として、例えば、フレキシブルディスク(FD:Flexible Disk)やHDD等の磁気ディスク、CD(Compact Disc)やDVD(Digital Versatile Disc)等の光ディスク、光磁気ディスク(MO:Magneto-Optical disk)を使用できる。ディスクドライブ106は、プロセッサ101からの命令に従って、記録媒体23から読み取ったプログラムやデータをRAM102またはHDD103に格納する。   The disk drive 106 is a drive device that reads programs and data recorded on the recording medium 23. Examples of the recording medium 23 include a magnetic disk such as a flexible disk (FD) and an HDD, an optical disk such as a CD (Compact Disc) and a DVD (Digital Versatile Disc), and a magneto-optical disk (MO). Can be used. The disk drive 106 stores the program and data read from the recording medium 23 in the RAM 102 or the HDD 103 in accordance with an instruction from the processor 101.

通信インタフェース107は、ネットワーク30等のネットワークを介して他の情報処理装置(例えば、認識率DBサーバ200等)と通信を行う。
機器接続部108は、伝票入力装置100に周辺機器(例えば、スキャナ20)を接続するための通信インタフェースである。
The communication interface 107 communicates with other information processing apparatuses (for example, the recognition rate DB server 200) via a network such as the network 30.
The device connection unit 108 is a communication interface for connecting a peripheral device (for example, the scanner 20) to the slip input device 100.

なお、伝票入力装置100はディスクドライブ106を備えていなくてもよく、専ら他の情報処理装置からアクセスされる場合には、画像信号処理部104や入力信号処理部105を備えていなくてもよい。また、ディスプレイ21や入力デバイス22は、伝票入力装置100の筐体と一体に形成されていてもよい。   The slip input device 100 may not include the disk drive 106, and may not include the image signal processing unit 104 or the input signal processing unit 105 when accessed exclusively from another information processing device. . The display 21 and the input device 22 may be formed integrally with the case of the slip input device 100.

なお、認識率DBサーバ200も、伝票入力装置100と同様のハードウェアを用いて実現できる。
図4は、入力画面の例を示す図である。入力画面21aは、伝票入力装置100の処理によってディスプレイ21に表示される入力画面である。入力画面21aは、複数の入力項目およびキー割当表示21bを有する。入力項目は、オペレータが入力すべき項目である。例えば、入力画面21aには、銀行名、支店名、科目(口座番号)、金額、受取人および依頼人の入力項目がある。各入力項目は入力欄および入力イメージを有する。
The recognition rate DB server 200 can also be realized using the same hardware as the slip input device 100.
FIG. 4 is a diagram illustrating an example of the input screen. The input screen 21 a is an input screen displayed on the display 21 by the process of the slip input device 100. The input screen 21a has a plurality of input items and a key assignment display 21b. The input item is an item to be input by the operator. For example, the input screen 21a includes input items for a bank name, a branch name, a subject (account number), an amount, a payee, and a client. Each input item has an input field and an input image.

入力画面21aには、入力項目毎に入力欄が設けられている。入力欄は、オペレータによって入力された文字が表示される領域である。例えば、オペレータが入力項目を選択すると、選択された入力項目の入力欄にカーソルが表示される。この状態でオペレータが文字を入力すると、入力された文字が入力欄に表示される。図4の入力画面21aにおいては、金額の入力欄にカーソルが表示されており、この入力欄にユーザが文字を入力可能になっている。   The input screen 21a has an input field for each input item. The input column is an area where characters input by the operator are displayed. For example, when the operator selects an input item, a cursor is displayed in the input field of the selected input item. When the operator inputs characters in this state, the input characters are displayed in the input field. On the input screen 21a of FIG. 4, a cursor is displayed in the amount input field, and the user can input characters in this input field.

各入力欄の上側には、スキャナ20によってOCR認識された文字列が表示される。この文字列の表示は、例えば、OCR認識された文字列と入力した文字列とをオペレータが対比できるようにするためのものである。   A character string that has been OCR recognized by the scanner 20 is displayed above each input field. The display of the character string is for enabling the operator to compare the character string recognized by OCR and the input character string, for example.

キー割当表示21bは、テンキーに割当てられる入力文字が表示される。テンキーに割当てられる文字は、例えば、カーソルが表示されている入力欄により変わる。
図5は、修正候補表示の例を示す図である。修正画面21cは、誤入力された可能性のある入力項目について、修正候補を表示する画面である。修正画面21cは、例えば、図4の入力画面21aの上に重ねて表示される。後述するように、修正画面21cには、順番が入れ替わって入力された可能性のある文字のペアが表示される。修正画面21cは、誤入力項目21c−1および操作項目21c−2を有する。
The key assignment display 21b displays input characters assigned to the numeric keypad. The character assigned to the numeric keypad varies depending on, for example, the input field where the cursor is displayed.
FIG. 5 is a diagram illustrating an example of correction candidate display. The correction screen 21c is a screen that displays correction candidates for input items that may have been erroneously input. The correction screen 21c is displayed, for example, over the input screen 21a in FIG. As will be described later, the correction screen 21c displays a pair of characters that may have been input in a reversed order. The correction screen 21c has an erroneous input item 21c-1 and an operation item 21c-2.

誤入力項目21c−1には、誤入力された可能性のある入力項目が表示される。誤入力項目21c−1は、入力欄を有する。入力欄には、誤入力された可能性のある文字列が表示される。入力欄は、操作項目21c−2から再入力が選択されるまでは、入力不可能な状態である。また、入力欄の上側には、スキャナ20によってOCR認識された文字列が表示される。   In the erroneous input item 21c-1, input items that may have been erroneously input are displayed. The erroneous input item 21c-1 has an input field. A character string that may have been input incorrectly is displayed in the input field. The input field is in a state where input is impossible until re-input is selected from the operation item 21c-2. In addition, a character string that has been OCR recognized by the scanner 20 is displayed above the input field.

操作項目21c−2は、「候補#1」、「候補#2」、「再入力」および「次へ」の項目を有する。「候補#1」および「候補#2」の項目には、誤入力項目21c−1の入力欄における、修正候補が表示される。修正候補は、1つの入力項目について、1つまたは2つである。修正候補が1つの場合は「候補#1」のみが表示され、修正候補が2つの場合は「候補#1」および「候補#2」が表示される。   The operation item 21c-2 includes items “candidate # 1”, “candidate # 2”, “re-input”, and “next”. In the “candidate # 1” and “candidate # 2” items, correction candidates in the input field of the erroneous input item 21c-1 are displayed. There are one or two correction candidates for one input item. When there is one correction candidate, only “candidate # 1” is displayed, and when there are two correction candidates, “candidate # 1” and “candidate # 2” are displayed.

図5の例では、「候補#1」には修正候補として文字列“10”が表示されている。これは、入力された文字列の上から6桁目および7桁目の文字列“01”を、前後を入れ替えて文字列“10”に修正するための候補を示す。また、「候補#2」には修正候補として文字列“51”が表示されている。これは、入力された文字列の上から7桁目および8桁目の文字列“15”を、前後を入れ替えて文字列“51”に修正するための候補を示す。   In the example of FIG. 5, the character string “10” is displayed as a candidate for “candidate # 1”. This indicates a candidate for correcting the character string “01” in the sixth and seventh digits from the top of the input character string to the character string “10” by replacing the front and rear. In “candidate # 2”, the character string “51” is displayed as a correction candidate. This indicates a candidate for correcting the character string “15” in the 7th and 8th digits from the top of the input character string to the character string “51” by replacing the front and back.

「再入力」の項目は、誤入力項目21c−1の文字列を先頭の文字から再入力することを示す。「再入力」が選択されることで、誤入力項目21c−1の入力欄が入力可能な状態になる。   The item “re-input” indicates that the character string of the erroneous input item 21c-1 is re-input from the first character. By selecting “re-input”, the input field of the erroneous input item 21c-1 can be input.

「次へ」の項目は、誤入力項目21c−1における文字の修正を確定させ、次の誤入力項目を表示させることを示す。
各選択項目の左端に、対応するキーが表示される。例えば、修正画面21cでは、オペレータがキー“1”を押下すると、「候補#1」が修正候補として選択され、オペレータがキー“2”を押下すると、「候補#2」が修正候補として選択される。同様に、オペレータがキー“0”を押下すると、誤入力項目21c−1の入力欄において文字列の先頭から再入力することが選択される。さらに、オペレータがキー“+”を押下すると、次の誤入力項目が表示される。
The item “next” indicates that the correction of the character in the erroneous input item 21c-1 is confirmed and the next erroneous input item is displayed.
A corresponding key is displayed at the left end of each selection item. For example, in the correction screen 21c, when the operator presses the key “1”, “candidate # 1” is selected as a correction candidate, and when the operator presses the key “2”, “candidate # 2” is selected as a correction candidate. The Similarly, when the operator depresses the key “0”, it is selected to re-input from the beginning of the character string in the input field of the erroneous input item 21c-1. Further, when the operator depresses the key “+”, the next erroneous input item is displayed.

「候補#1」または「候補#2」のいずれかがオペレータにより選択されると、伝票入力装置100は、選択された修正候補に対応する誤入力項目21c−1の入力欄の文字を、選択された修正候補に修正する。例えば、図5において、キー“1”の入力により「候補#1」が選択されると、誤入力項目21c−1の入力欄の文字列“1235001520”は、上から6桁目と7桁目とが入れ替えられて、“1235010520”に修正される。   When either “candidate # 1” or “candidate # 2” is selected by the operator, the slip input apparatus 100 selects a character in the input field of the erroneous input item 21c-1 corresponding to the selected correction candidate. Modify the correction candidates. For example, in FIG. 5, when “candidate # 1” is selected by inputting the key “1”, the character string “1235001520” in the input field of the erroneous input item 21c-1 is the sixth and seventh digits from the top. Are replaced with “1235010520”.

修正画面21cへの修正は、誤入力項目21c−1の入力欄に対応する入力画面21aの入力項目の入力欄にも反映される。これにより、オペレータは、誤入力項目21c−1の入力欄の文字列について、修正候補を選択することで、誤入力項目21c−1の入力欄の文字列全てを再入力せずに修正できる。   The correction to the correction screen 21c is also reflected in the input field of the input item of the input screen 21a corresponding to the input field of the erroneous input item 21c-1. Thereby, the operator can correct the character string in the input field of the erroneous input item 21c-1 without re-inputting all the character strings in the input field of the erroneous input item 21c-1.

また、修正箇所が修正候補の範囲に制限されるので、文字列全てを再入力する場合と比較して修正入力の誤りが発生しにくくなる。また、文字列全ての再入力が可能な状態から、入力の入れ替わりが発生した箇所のみを選択して修正する場合と比較して、修正操作の回数が減り、修正に要する時間が短縮される。   In addition, since the correction location is limited to the range of correction candidates, it is less likely to cause an error in correction input than when all the character strings are re-input. In addition, the number of correction operations is reduced and the time required for correction is reduced as compared with the case where only the portion where the input is changed is selected and corrected from the state where all the character strings can be re-input.

また、表示された修正候補がいずれも不適切と判断した場合、オペレータは、「再入力」を選択することで、誤入力項目21c−1の入力欄において文字列の先頭から再入力できる。また、オペレータは、誤入力項目21c−1の入力欄の文字列が誤入力でないと判断した場合、「次へ」を選択することで、誤入力項目21c−1の入力欄の文字列を修正しないようにする。入力欄の文字列が誤入力でない場合には、例えば、OCR認識に誤りがあった場合が挙げられる。   If any of the displayed correction candidates is determined to be inappropriate, the operator can re-input from the beginning of the character string in the input field of the erroneous input item 21c-1 by selecting “re-input”. When the operator determines that the character string in the input field of the erroneous input item 21c-1 is not an erroneous input, the operator corrects the character string in the input field of the erroneous input item 21c-1 by selecting “Next”. Do not. When the character string in the input column is not an erroneous input, for example, there is a case where there is an error in OCR recognition.

なお、図5では、入力画面21aとは別ウィンドウとして修正画面21cが表示される例を示した。ただし、これに限らず、例えば、入力画面21aにおいて、カーソルが表示されている入力欄の下に、修正画面21cにおける操作項目21c−2が表示されてもよい。   FIG. 5 shows an example in which the correction screen 21c is displayed as a separate window from the input screen 21a. However, the present invention is not limited thereto. For example, the operation item 21c-2 on the correction screen 21c may be displayed below the input field where the cursor is displayed on the input screen 21a.

また、伝票入力装置100は、操作項目21c−2の各項目をキー入力により選択できるようにした。これにより、例えば、オペレータは、入力項目の入力および修正を、伝票の文字を入力する際と同様にキー入力により行えるため、修正の作業効率が上がる。   In addition, the slip input apparatus 100 can select each item of the operation item 21c-2 by key input. As a result, for example, the operator can input and correct input items by key input in the same manner as when entering letters of a slip, so that the work efficiency of correction increases.

図6は、伝票入力システムの機能例を示すブロック図である。認識率DBサーバ200は、認識率情報記憶部210および認識率判定部220を有する。
認識率情報記憶部210は、OCR認識可能な文字の種別毎に、認識率に関連する情報を対応付けた認識率テーブルを記憶する。認識率に関連する情報には、文字の種別毎の認識率や、その認識率を算出するための情報が含まれる。
FIG. 6 is a block diagram illustrating an example of functions of the slip input system. The recognition rate DB server 200 includes a recognition rate information storage unit 210 and a recognition rate determination unit 220.
The recognition rate information storage unit 210 stores a recognition rate table in which information related to the recognition rate is associated with each type of character capable of OCR recognition. The information related to the recognition rate includes a recognition rate for each character type and information for calculating the recognition rate.

認識率判定部220は、OCR認識可能な文字の種別毎に、認識率に関連する情報を各伝票入力装置100から受信し、認識率判定部220は、受信した認識率に関連する情報を、OCR認識可能な文字の種別毎に集計する。認識率判定部220は、集計した認識率に関連する情報に基づいて、OCR認識可能な文字の種別毎に認識率を算出する。そして、認識率判定部220は、集計された認識率に関連する情報および算出された認識率によって認識率テーブルを更新する。認識率判定部220は、更新された認識率テーブルの内容を各伝票入力装置100に配信する。   The recognition rate determination unit 220 receives information related to the recognition rate from each slip input device 100 for each type of OCR-recognizable character, and the recognition rate determination unit 220 receives information related to the received recognition rate. Aggregate for each type of OCR recognizable character. The recognition rate determination unit 220 calculates a recognition rate for each type of character that can be OCR-recognized, based on information related to the aggregated recognition rates. Then, the recognition rate determination unit 220 updates the recognition rate table with the information related to the aggregated recognition rates and the calculated recognition rate. The recognition rate determination unit 220 distributes the contents of the updated recognition rate table to each slip input device 100.

伝票入力装置100は、認識文字データ記憶部110、入力文字データ記憶部120、認識率情報入出力部130、認識文字データ取得部140、入力文字データ取得部150および修正候補判定部160を有する。   The slip input device 100 includes a recognized character data storage unit 110, an input character data storage unit 120, a recognition rate information input / output unit 130, a recognized character data acquisition unit 140, an input character data acquisition unit 150, and a correction candidate determination unit 160.

認識文字データ記憶部110は、OCR認識が可能な文字の種別毎に認識率を対応付けた認識率テーブルを記憶する。また、認識文字データ記憶部110は、認識文字列の文字毎に認識率を対応付けた認識文字データを記憶する。   The recognized character data storage unit 110 stores a recognition rate table in which a recognition rate is associated with each type of character capable of OCR recognition. The recognized character data storage unit 110 stores recognized character data in which a recognition rate is associated with each character of the recognized character string.

入力文字データ記憶部120は、入力画面21aの各入力欄からオペレータにより入力された入力文字データを記憶する。
認識率情報入出力部130は、OCR認識が可能な文字の種別毎の認識率を示す情報を、定期的(例えば、毎営業開始時)に認識率DBサーバ200から受信し、認識率テーブルを更新する。また、認識率情報入出力部130は、OCR認識が可能な文字毎に、認識率を算出するための情報を集計し、集計した情報を定期的(例えば、毎営業終了時)に認識率DBサーバ200へ送信する。
The input character data storage unit 120 stores input character data input by an operator from each input field of the input screen 21a.
The recognition rate information input / output unit 130 receives information indicating the recognition rate for each type of character capable of OCR recognition from the recognition rate DB server 200 periodically (for example, at the start of every business), and stores the recognition rate table. Update. In addition, the recognition rate information input / output unit 130 aggregates information for calculating the recognition rate for each character that can be recognized by OCR, and the aggregated information is regularly recognized (for example, at the end of each business). Send to server 200.

認識文字データ取得部140は、スキャナ20から文書データを受信する。文書データには、OCR認識された文字列(認識文字列)の文字コードが含まれる。文書データに含まれる文字列の文字コードには、入力画面21aにおける、いずれかの入力項目を示す情報が対応付けられている。認識文字データ取得部140は、受信した文書データに基づいて入力画面21aを生成する。認識文字データ取得部140は、生成した入力画面21aをディスプレイ21に表示する。   The recognized character data acquisition unit 140 receives document data from the scanner 20. The document data includes a character code of a character string (recognized character string) recognized by OCR. Information indicating any input item on the input screen 21a is associated with the character code of the character string included in the document data. The recognized character data acquisition unit 140 generates the input screen 21a based on the received document data. The recognized character data acquisition unit 140 displays the generated input screen 21 a on the display 21.

また、認識文字データ取得部140は、更新された認識率テーブルに格納された認識率を、認識文字列に含まれる各文字に対応付けることで、認識文字データを生成する。認識文字データ取得部140は、生成した認識文字データを認識文字データ記憶部110に記憶する。   The recognized character data acquisition unit 140 generates recognized character data by associating the recognition rate stored in the updated recognition rate table with each character included in the recognized character string. The recognized character data acquisition unit 140 stores the generated recognized character data in the recognized character data storage unit 110.

入力文字データ取得部150は、入力画面21aにおける各入力欄にオペレータにより入力された文字列の文字コードを、入力文字データとして取得する。入力文字データ取得部150は、取得した入力文字データを入力文字データ記憶部120に記憶する。また、入力文字データ取得部150は、オペレータが選択した修正候補に基づいて、入力画面21aの入力欄の表示を更新する。そして、入力文字データ取得部150は、更新された入力欄に対応する入力文字データを更新する。   The input character data acquisition unit 150 acquires the character code of the character string input by the operator in each input field on the input screen 21a as input character data. The input character data acquisition unit 150 stores the acquired input character data in the input character data storage unit 120. Further, the input character data acquisition unit 150 updates the display of the input field on the input screen 21a based on the correction candidate selected by the operator. Then, the input character data acquisition unit 150 updates the input character data corresponding to the updated input field.

修正候補判定部160は、入力画面21aの入力項目毎に、対応する入力文字データおよび認識文字データを比較して、オペレータが誤入力した可能性がある入力項目を特定する。なお、修正候補判定部160は、入力画面21aについて、誤入力された可能性があると特定された入力項目を強調して表示してもよい。強調して表示させる方法は、例えば、入力欄の色を変更するなどがある。   The correction candidate determination unit 160 compares the corresponding input character data and the recognized character data for each input item on the input screen 21a, and specifies an input item that may be erroneously input by the operator. It should be noted that the correction candidate determination unit 160 may display the input screen 21a with emphasis on the input item identified as having the possibility of being erroneously input. As a method of highlighting, for example, the color of the input field is changed.

修正候補判定部160は、誤入力された可能性のある入力項目について、対応する入力文字データおよび認識文字データに基づいて、修正候補の有無を判定する。
修正候補判定部160は、誤入力された可能性があると特定された入力項目を修正画面21cに表示する。また、修正候補判定部160は、修正候補がある場合、修正候補を修正画面21cに表示する。さらに、修正候補判定部160は、誤入力された可能性のある入力項目について、修正画面21cを通じてオペレータの修正を受け付ける。
The correction candidate determination unit 160 determines the presence / absence of a correction candidate based on the corresponding input character data and recognized character data for an input item that may be erroneously input.
The correction candidate determination unit 160 displays on the correction screen 21c an input item that is specified as having a possibility of being erroneously input. Moreover, the correction candidate determination part 160 displays a correction candidate on the correction screen 21c, when there exists a correction candidate. Furthermore, the correction candidate determination unit 160 accepts an operator's correction through the correction screen 21c for an input item that may have been erroneously input.

次に、図7〜9を用いて、伝票入力システム5が用いるテーブルについて説明する。
図7は、認識率テーブルの例を示す図である。認識率テーブル111は、OCR認識が可能な文字毎に認識率を対応付けた情報が格納されたテーブルである。認識率テーブル111は、認識文字データ記憶部110に記憶される。認識率テーブル111は、認識率DBサーバ200から受信した認識率に基づいて、毎営業開始時に更新される。
Next, tables used by the slip input system 5 will be described with reference to FIGS.
FIG. 7 is a diagram illustrating an example of a recognition rate table. The recognition rate table 111 is a table that stores information in which a recognition rate is associated with each character capable of OCR recognition. The recognition rate table 111 is stored in the recognized character data storage unit 110. The recognition rate table 111 is updated at the start of every business based on the recognition rate received from the recognition rate DB server 200.

認識率テーブル111は、文字および認識率の項目を有する。文字の項目には、OCR認識が可能な文字の種別を示す情報が設定される。認識率の項目には、文字の種別の認識率を示す情報が設定される。   The recognition rate table 111 has items of characters and recognition rates. In the character item, information indicating a character type capable of OCR recognition is set. Information indicating the recognition rate of the character type is set in the item of recognition rate.

図8は、認証文字データおよび入力文字データの例を示す図である。認識文字データ112は、認識文字列に含まれる文字毎に認識率を対応付けたデータである。認識文字データ112は、認識文字データ記憶部110に記憶される。   FIG. 8 is a diagram illustrating an example of authentication character data and input character data. The recognized character data 112 is data in which a recognition rate is associated with each character included in the recognized character string. The recognized character data 112 is stored in the recognized character data storage unit 110.

認識文字データ112は、入力項目、認識率および文字の項目を有する。入力項目の項目には、入力画面21aにおいて、オペレータに入力される入力項目を識別するための情報が設定される。認識率の項目には、OCR認識された文字に対応する認識率を示す情報が設定される。認識率は、修正候補判定部160が修正候補を判定する際に用いられる。文字の項目には、スキャナ20によりOCR認識された文字が設定される。以下、左端に位置する文字から右端に位置する文字までを順に並べたものを文字列と記載する。例えば、認識文字データ112の文字列は、“123”となる。   The recognized character data 112 has items of an input item, a recognition rate, and a character. In the input item field, information for identifying an input item input by the operator is set on the input screen 21a. In the item of recognition rate, information indicating the recognition rate corresponding to the characters recognized by OCR is set. The recognition rate is used when the correction candidate determination unit 160 determines correction candidates. In the character item, a character that has been OCR recognized by the scanner 20 is set. Hereinafter, a character string in which characters from the left end to the right end are arranged in order is referred to as a character string. For example, the character string of the recognized character data 112 is “123”.

入力文字データ121は、入力画面21aの各入力欄からオペレータにより入力された文字列である。入力文字データ121は、入力画面21aの入力欄毎に入力文字データ記憶部120に記憶される。入力文字データ121は、文字の項目を有する。文字の項目には、オペレータにより入力された文字が設定される。以下、右端に位置する文字から左端に位置する文字までを順に並べたものを文字列と記載する。例えば、入力文字データ121の文字列は、“133”となる。   The input character data 121 is a character string input by the operator from each input field of the input screen 21a. The input character data 121 is stored in the input character data storage unit 120 for each input field of the input screen 21a. The input character data 121 has a character item. In the character item, a character input by the operator is set. Hereinafter, a character string arranged in order from the character located at the right end to the character located at the left end is referred to as a character string. For example, the character string of the input character data 121 is “133”.

入力項目の項目が一致する認識文字データ112および入力文字データ121の文字列が、修正候補判定部160により比較される。不一致である文字が1以上存在する場合、入力文字データ121に対応する入力項目は、誤入力された可能性があると修正候補判定部160に判定される。   The correction candidate determination unit 160 compares the character strings of the recognized character data 112 and the input character data 121 that match the input item items. When one or more characters that do not match exist, the correction candidate determination unit 160 determines that there is a possibility that the input item corresponding to the input character data 121 has been erroneously input.

例えば、図8において、認識文字データ112と入力文字データ121は、認識文字データ112の左から2つめの文字が“2”であるのに対して、入力文字データ121の左から2つめの文字が“3”であるため異なる。そのため、入力文字データ121に対応する入力項目“金額”は、誤入力された可能性があると修正候補判定部160に判定される。   For example, in FIG. 8, the recognized character data 112 and the input character data 121 are the second character from the left of the input character data 121 while the second character from the left of the recognized character data 112 is “2”. Is different because it is “3”. Therefore, the correction candidate determination unit 160 determines that the input item “amount” corresponding to the input character data 121 may be input incorrectly.

図9は、認識率算出テーブルの例を示す図である。認識率算出テーブル211は、OCR認識が可能な文字の種別毎に、認識率に関連する情報を対応付けた情報を格納するテーブルである。認識率算出テーブル211は、認識率DBサーバ200の認識率情報記憶部210に記憶されている。認識率算出テーブル211は、毎営業終了時に認識率DBサーバ200により更新される。   FIG. 9 is a diagram illustrating an example of a recognition rate calculation table. The recognition rate calculation table 211 is a table that stores information in which information related to the recognition rate is associated with each type of character capable of OCR recognition. The recognition rate calculation table 211 is stored in the recognition rate information storage unit 210 of the recognition rate DB server 200. The recognition rate calculation table 211 is updated by the recognition rate DB server 200 at the end of every business.

認識率算出テーブル211は、文字、認識回数、正解数および認識率の項目を有する。
文字の項目には、OCR認識が可能な文字の種別が設定される。
認識回数の項目には、対応する種別の文字について各スキャナ20によりOCR認識された回数が設定される。
The recognition rate calculation table 211 has items of characters, the number of times of recognition, the number of correct answers, and a recognition rate.
In the character item, a character type capable of OCR recognition is set.
The number of times of OCR recognition by each scanner 20 for the corresponding type of character is set in the item of the number of recognition times.

正解数の項目には、認識回数のうち正解だったOCR認識の回数が設定される。具体的には、認識率DBサーバ200は、OCR認識した回数に対する、OCR認識の正解数の割合により認識率を算出する。正解か否かは、例えば、オペレータが入力を確定させたときに、入力項目が一致する認識文字データおよび確定された入力文字データの文字列を比較し、一致した文字が、OCR認識が正解であると判定される。   In the correct answer item, the number of times of OCR recognition that is correct among the number of recognition times is set. Specifically, the recognition rate DB server 200 calculates the recognition rate based on the ratio of the correct number of OCR recognitions to the number of times of OCR recognition. For example, when the operator confirms the input, whether or not the answer is correct is compared with the character string of the recognized character data that matches the input item and the character string of the confirmed input character data. It is determined that there is.

次に、図10〜12を用いて、伝票入力装置100が修正候補を判定する処理について説明する。図10〜12に用いられる。認識文字データ112a〜112cおよび入力文字データ121a〜121cにおいて、入力項目の記載を省略する。   Next, the slip input device 100 will be described with reference to FIGS. Used in FIGS. In the recognized character data 112a to 112c and the input character data 121a to 121c, description of input items is omitted.

図10は、1つの修正候補が判定される例を示す図である。
店舗の窓口のオペレータのようにキー入力操作に慣れているオペレータの誤入力として、入力順が入れ替わってしまう間違いが多いことが統計的に明らかになっている。これは、キー入力の速度が速すぎるために生じる誤入力と考えられている。
FIG. 10 is a diagram illustrating an example in which one correction candidate is determined.
It is statistically clear that there are many mistakes that the input order is changed as an erroneous input of an operator who is accustomed to the key input operation like an operator at a store window. This is considered to be an erroneous input that occurs because the speed of key input is too high.

入力順が間違っている場合、入力された文字列のうち隣接する2つの文字のペアについて、入力が間違っていることになる。そこで、修正候補判定部160は、このような文字ペアを入力文字列から探索する。   If the input order is incorrect, the input is incorrect for two adjacent character pairs in the input character string. Therefore, the correction candidate determination unit 160 searches for such a character pair from the input character string.

図10において、認識文字データ112aの文字列は“1235146”とし、入力文字データ121aの文字列は“1235164”とする。すなわち、OCR認識により文字列“1235146”が認識され、オペレータにより文字列“1235164”が入力されたものとする。また、認識文字データ112aの文字列の各文字に対応する認識率は、上位から“95”、“90”、“85”、“85”、“95”、“90”、“60”とする。   In FIG. 10, the character string of the recognized character data 112a is “123146”, and the character string of the input character data 121a is “123164”. That is, it is assumed that the character string “1235146” is recognized by OCR recognition and the character string “1235164” is input by the operator. The recognition rate corresponding to each character of the character string of the recognized character data 112a is “95”, “90”, “85”, “85”, “95”, “90”, “60” from the top. .

この場合、まず、修正候補判定部160は、認識文字データ112aおよび入力文字データ121aの文字列を比較する。この場合、認識文字データ112aにおいて、下位から2桁目の“4”および最下位の“6”が、入力文字データ121aと不一致である。そのため、修正候補判定部160は、入力文字データ121aに対応する入力項目に誤入力された可能性があると判定する。   In this case, first, the correction candidate determination unit 160 compares the character strings of the recognized character data 112a and the input character data 121a. In this case, in the recognized character data 112a, “4” in the second digit from the lower order and “6” in the lowest order do not match the input character data 121a. Therefore, the correction candidate determination unit 160 determines that there is a possibility that an input item corresponding to the input character data 121a is erroneously input.

次に、修正候補判定部160は、認識文字データ112aについて、不一致と判定された文字から、対応する認識率が閾値以上である文字を選択する。図10において、下位から2桁目の“4”に対応する認識率が“90”であり、最下位の“6”に対応する認識率が“60”である。このため、閾値が“90”とすると、修正候補判定部160は、対応する認識率が“90”以上である“4”を選択する。選択された“4”については認識の確かさが一定レベル以上であることから、下位から2桁目については誤入力された可能性が高いと考えられる。   Next, the correction candidate determination unit 160 selects, for the recognized character data 112a, a character whose corresponding recognition rate is equal to or greater than a threshold value from characters determined to be inconsistent. In FIG. 10, the recognition rate corresponding to “4” in the second digit from the lower order is “90”, and the recognition rate corresponding to the lowest order “6” is “60”. Therefore, when the threshold value is “90”, the correction candidate determination unit 160 selects “4” whose corresponding recognition rate is “90” or more. Regarding the selected “4”, since the certainty of recognition is more than a certain level, it is considered that there is a high possibility that the second digit from the lower order is erroneously input.

次に、修正候補判定部160は、認識文字データ112aについて、選択された文字に隣接する文字に対応する認識率が閾値未満である文字を選択する。図10において、下位から2桁目の“4”に隣接する文字は、下位から3桁目の“1”および最下位の“6”である。また、“1”に対応する認識率が“95”であり、“6”に対応する認識率が“60”である。このため、修正候補判定部160は、対応する認識率が“90”未満である“6”のみを選択する。   Next, the correction candidate determination unit 160 selects, for the recognized character data 112a, a character whose recognition rate corresponding to a character adjacent to the selected character is less than a threshold value. In FIG. 10, the characters adjacent to “4” in the second digit from the lower order are “1” in the third digit from the lower order and “6” in the lowest order. The recognition rate corresponding to “1” is “95”, and the recognition rate corresponding to “6” is “60”. For this reason, the correction candidate determination unit 160 selects only “6” whose corresponding recognition rate is less than “90”.

選択された“6”の位置については、認識の確かさが一定レベルに達していないことから、オペレータによって誤入力されたのか、あるいはOCR認識において誤認識されたのか、あるいは正しく入力されたのかを判定することが難しい。しかしながら、隣接する位置、すなわち下位から2桁目については誤入力された可能性が高い。前述のように、入力順が入れ替わるという誤入力の発生確率が高いことを鑑みると、誤入力の確率が高い下位から2桁目と、これに隣接し、かつ正確な判定が不可能な状態にある最下位とが、入れ替わって入力された可能性が高いと考えることができる。   For the selected position “6”, since the certainty of recognition has not reached a certain level, whether it is erroneously input by the operator, erroneously recognized in OCR recognition, or correctly input. It is difficult to judge. However, there is a high possibility that an adjacent position, that is, the second digit from the lower order, is erroneously input. As described above, in view of the high probability of erroneous input that the order of input is switched, the second digit from the lower order where the probability of erroneous input is high, is adjacent to this, and accurate determination is impossible. It can be considered that there is a high possibility that a certain lowest order has been switched and input.

これに対して、下位から3桁目については、認識の確かさが一定レベル以上であり、かつ文字の比較結果が一致していることから、正しく入力された可能性が高いと考えられる。   On the other hand, for the third digit from the bottom, the certainty of recognition is above a certain level, and the character comparison results match, so it is highly probable that they were correctly input.

以上の理由から、修正候補判定部160は、認識文字データ112aの文字列から特定された下位から2桁目および最下位の文字のペアに対応する入力文字データ121aの文字“6”および“4”を、入力順が入れ替わっている文字のペアと特定する。修正候補判定部160は、特定された文字のペアの位置を入れ替えた“46”を修正候補と判定する。修正候補と判定された“46”は、修正画面21cに「候補#1」として表示される。   For the above reasons, the correction candidate determination unit 160 determines the characters “6” and “4” of the input character data 121a corresponding to the pair of the second and lowermost characters specified from the character string of the recognized character data 112a. "Is identified as a pair of characters whose input order is switched. The correction candidate determination unit 160 determines that “46” in which the positions of the identified character pairs are exchanged is a correction candidate. “46” determined as a correction candidate is displayed as “candidate # 1” on the correction screen 21c.

これにより、オペレータは、認識文字データ112aに対応する文字列“1235146”を先頭から再入力せずに、1つのキーの打鍵により修正候補を選択することで誤入力を修正できるため、誤入力の修正を効率化できる。   As a result, the operator can correct the erroneous input by selecting the correction candidate by pressing one key without re-inputting the character string “1235146” corresponding to the recognized character data 112a from the top. Correction can be made more efficient.

なお、上記手順によって入力順が入れ替わっている文字のペアを判定する処理では、認識の確かさが一定レベルに達していない文字の位置について、誤入力が生じていることを新たに判断できるという効果も得られる。   In addition, in the process of determining a pair of characters whose input order has been switched by the above procedure, it is possible to newly determine that an erroneous input has occurred at a character position where the certainty of recognition has not reached a certain level. Can also be obtained.

なお、伝票入力装置100において、認識率が高い文字を判定するための閾値と、認識率が低い文字を判定するための閾値とを同じ値(90%)を用いるが、これらの閾値には別の値が用いられてもよい。   In the slip input device 100, the same threshold value (90%) is used for a threshold value for determining a character with a high recognition rate and a threshold value for determining a character with a low recognition rate. The value of may be used.

図11は、2つの修正候補が判定される例を示す図である。図11において、認識文字データ112bの文字列は“1235046”とし、入力文字データ121bの文字列は“1235064”とする。また、認識文字データ112bの文字列に対応する認識率は、上位から“95”、“90”、“85”、“85”、“80”、“90”、“60”とする。   FIG. 11 is a diagram illustrating an example in which two correction candidates are determined. In FIG. 11, the character string of the recognized character data 112b is “12335046”, and the character string of the input character data 121b is “12335064”. The recognition rate corresponding to the character string of the recognized character data 112b is “95”, “90”, “85”, “85”, “80”, “90”, “60” from the top.

この場合、まず、修正候補判定部160は、認識文字データ112bおよび入力文字データ121bの各文字を比較し、認識文字データ112bについて、不一致と判定された文字から、対応する認識率が閾値以上である文字を選択する。この場合、図10の説明と同様に、閾値が“90”とすると、修正候補判定部160は、対応する認識率が“90”以上である“4”を選択する。   In this case, first, the correction candidate determination unit 160 compares each character of the recognized character data 112b and the input character data 121b, and the recognition rate corresponding to the recognized character data 112b from the characters determined to be inconsistent is equal to or greater than a threshold value. Select a character. In this case, as in the description of FIG. 10, when the threshold value is “90”, the correction candidate determination unit 160 selects “4” whose corresponding recognition rate is “90” or more.

次に、修正候補判定部160は、認識文字データ112bについて、選択された文字に隣接する文字に対応する認識率が閾値未満である文字を選択する。図11において、“4”に隣接する文字は、“0”および“6”である。また、“0”に対応する認識率が“80”であり、“6”に対応する認識率が“60”である。このため、修正候補判定部160は、対応する認識率が“90”未満である“0”および“6”を選択する。すなわち、この場合には、下位から2桁目と3桁目、および下位から1桁目と2桁目のそれぞれについて、入力順の入れ替わりが発生している可能性があると判定される。   Next, the correction candidate determination unit 160 selects a character whose recognition rate corresponding to the character adjacent to the selected character is less than the threshold for the recognized character data 112b. In FIG. 11, the characters adjacent to “4” are “0” and “6”. The recognition rate corresponding to “0” is “80”, and the recognition rate corresponding to “6” is “60”. Therefore, the correction candidate determination unit 160 selects “0” and “6” whose corresponding recognition rates are less than “90”. That is, in this case, it is determined that there is a possibility that the input order is changed for the second and third digits from the lower order, and for the first and second digits from the lower order.

次に、修正候補判定部160は、選択された認識率が閾値以上である文字“4”、および、選択された認識率が閾値未満である文字“0”の文字のペアとして特定する。同様に、修正候補判定部160は、選択された認識率が閾値以上である文字“4”および、選択された認識率が閾値未満である文字“6”の文字のペアとして特定する。そして、修正候補判定部160は、特定されたペアに対応する入力文字データ121bの文字“0”および“6”のペアと“6”および“4”のペアとを、誤入力のあった文字のペアと特定する。   Next, the correction candidate determination unit 160 identifies the character pair “4” with the selected recognition rate being equal to or greater than the threshold and the character pair “0” with the selected recognition rate being less than the threshold. Similarly, the correction candidate determination unit 160 specifies a character pair of a character “4” whose selected recognition rate is greater than or equal to a threshold and a character “6” whose selected recognition rate is less than the threshold. Then, the correction candidate determination unit 160 converts the character “0” and “6” pair and the “6” and “4” pair of the input character data 121b corresponding to the specified pair into the characters that are erroneously input. Identify the pair.

そして、修正候補判定部160は、特定されたペアの位置を入れ替えた“60”および“46”を修正候補と判定する。修正候補と判定された“60”は、修正画面21cに候補#1として表示され、修正候補と判定された“46”は、修正画面21cに候補#2として表示される。   Then, the correction candidate determination unit 160 determines “60” and “46” in which the positions of the identified pairs are exchanged as correction candidates. “60” determined as a correction candidate is displayed as a candidate # 1 on the correction screen 21c, and “46” determined as a correction candidate is displayed as a candidate # 2 on the correction screen 21c.

このように、認識率が高い文字に隣接する文字の認識率がいずれも閾値未満の場合、修正候補が2つになる。この場合、オペレータは、候補#1または候補#2のいずれかを選択することができる。図11の説明においては、オペレータは、候補#2を選択することで、誤入力を修正することができる。また、このように修正候補が2つの場合でも、オペレータは1つのキーの打鍵により修正候補を選択することで誤入力を修正することができる。   Thus, when the recognition rates of characters adjacent to a character with a high recognition rate are both less than the threshold, there are two correction candidates. In this case, the operator can select either candidate # 1 or candidate # 2. In the description of FIG. 11, the operator can correct an erroneous input by selecting candidate # 2. Further, even when there are two correction candidates as described above, the operator can correct an erroneous input by selecting a correction candidate by pressing one key.

図12は、修正候補が判定されない例を示す図である。図12において、認識文字データ112cの文字列は“1235146”とし、入力文字データ121cの文字列は“1035164”とする。また、認識文字データ112cの文字列に対応する認識率は、左から“95”、“90”、“85”、“85”、“95”、“90”、“60”とする。   FIG. 12 is a diagram illustrating an example in which correction candidates are not determined. In FIG. 12, the character string of the recognized character data 112 c is “1235146”, and the character string of the input character data 121 c is “1035164”. Also, the recognition rate corresponding to the character string of the recognized character data 112c is “95”, “90”, “85”, “85”, “95”, “90”, “60” from the left.

この場合、まず、修正候補判定部160は、認識文字データ112cおよび入力文字データ121cの各文字を比較し、認識文字データ112cについて、不一致と判定された文字から、対応する認識率が閾値以上である文字を選択する。この場合、閾値が“90”とすると、修正候補判定部160は、対応する認識率が“90”以上である“0”および“4”を選択する。   In this case, first, the correction candidate determination unit 160 compares each character of the recognized character data 112c and the input character data 121c, and the recognition rate corresponding to the recognized character data 112c from the characters determined to be inconsistent is equal to or greater than a threshold value. Select a character. In this case, when the threshold value is “90”, the correction candidate determination unit 160 selects “0” and “4” whose corresponding recognition rate is “90” or more.

ここで、上記手順により、認識率が閾値以上で、かつ比較結果により不一致と判定された文字が複数検知され、検知されたそれぞれの文字について入力順が入れ替わっていると考えられる文字ペアが見つかった場合には、検知されたそれぞれの文字について修正画面21cを用いた修正を行う方法が考えられる。しかしながら、前述のようにオペレータのキー入力は速いため、この方法により修正を行うより、誤入力された可能性のある文字列全体を先頭から再入力する方が早くなる可能性が高い。   Here, according to the above procedure, a plurality of characters whose recognition rate is equal to or higher than the threshold and which are determined to be inconsistent by the comparison result are detected, and a character pair that is considered that the input order is switched for each detected character is found. In this case, a method of correcting each detected character using the correction screen 21c can be considered. However, since the operator's key input is fast as described above, it is more likely that it will be faster to re-enter the entire character string that may have been erroneously input than from the beginning rather than performing correction by this method.

そこで、修正候補判定部160は、誤入力された可能性があると判定された文字において、対応する認識率が閾値以上である文字が2つ以上である場合、修正候補を提示しない。この場合、オペレータは、認識文字データ112cの文字列を先頭から再入力する。これにより、誤入力と判定された入力項目の修正に要する時間を短縮し、修正作業を効率化できる。   Accordingly, the correction candidate determination unit 160 does not present a correction candidate when there are two or more characters having a corresponding recognition rate equal to or higher than a threshold in characters determined to have been erroneously input. In this case, the operator re-inputs the character string of the recognized character data 112c from the top. As a result, the time required for correcting the input item determined to be erroneous input can be shortened, and the correction work can be made efficient.

次に、図13〜15を用いて、伝票に記載の文字がオペレータにより入力される際の処理をフローチャートを用いて説明する。
図13は、文字入力を支援する処理の例を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。
Next, with reference to FIGS. 13 to 15, processing when characters described in the slip are input by the operator will be described with reference to flowcharts.
FIG. 13 is a flowchart illustrating an example of processing for supporting character input. In the following, the process illustrated in FIG. 13 will be described in order of step number.

(ステップS11)オペレータが伝票をスキャナ20にセットすると、スキャナ20は、伝票をOCR認識し、文書データを生成する。スキャナ20は、生成した文書データを伝票入力装置100に送信する。   (Step S11) When the operator sets a slip on the scanner 20, the scanner 20 recognizes the slip by OCR and generates document data. The scanner 20 transmits the generated document data to the slip input device 100.

(ステップS12)認識文字データ取得部140は、スキャナ20から文書データを受信する。認識文字データ取得部140は、受信した文書データに基づいて入力画面21aを生成する。例えば、認識文字データ取得部140は、文書データから、入力画面21aのひな形に各入力項目に対応する文字コードを選択し、対応する文字を表示させることで、入力画面21aを生成する。入力画面21aのひな形は、例えば、あらかじめ認識文字データ記憶部110などの記憶領域に記憶されている。そして、認識文字データ取得部140は、生成した入力画面21aをディスプレイ21に表示する。   (Step S <b> 12) The recognized character data acquisition unit 140 receives document data from the scanner 20. The recognized character data acquisition unit 140 generates the input screen 21a based on the received document data. For example, the recognized character data acquisition unit 140 selects the character code corresponding to each input item on the template of the input screen 21a from the document data, and displays the corresponding character to generate the input screen 21a. The model of the input screen 21a is stored in advance in a storage area such as the recognized character data storage unit 110, for example. Then, the recognized character data acquisition unit 140 displays the generated input screen 21 a on the display 21.

(ステップS13)認識文字データ取得部140は、認識率テーブル111に格納された認識率を、受信した文書データに含まれる認識文字列に含まれる各文字に対応付けることで、認識文字データ112を生成する。具体的には、認識文字データ取得部140は、受信した文書データに含まれる認識文字列に含まれる文字毎に、その文字の種別に対応する認識率を認識率テーブル111から検索し、検索された認識率をその文字に対応付ける。   (Step S13) The recognized character data acquisition unit 140 generates recognized character data 112 by associating the recognition rate stored in the recognition rate table 111 with each character included in the recognized character string included in the received document data. To do. Specifically, the recognized character data acquisition unit 140 searches the recognition rate table 111 for the recognition rate corresponding to the character type for each character included in the recognized character string included in the received document data. Match the recognition rate to that character.

(ステップS14)オペレータは、伝票に記載された文字を、入力画面21a上の対応する入力欄に入力する。入力文字データ取得部150は、入力画面21aにおける入力欄毎に、オペレータにより入力された文字列を入力文字データ121として取得する。そして、処理をステップS21へ進める。   (Step S14) The operator inputs the characters described in the slip into the corresponding input field on the input screen 21a. The input character data acquisition unit 150 acquires, as input character data 121, a character string input by the operator for each input field on the input screen 21a. Then, the process proceeds to step S21.

図14は、文字入力を支援する処理の例を示すフローチャート(続き)である。以下、図14に示す処理をステップ番号に沿って説明する。
(ステップS21)修正候補判定部160は、入力項目を1つ選択する。
FIG. 14 is a flowchart (continued) illustrating an example of processing for supporting character input. In the following, the process illustrated in FIG. 14 will be described in order of step number.
(Step S21) The correction candidate determination unit 160 selects one input item.

(ステップS22)修正候補判定部160は、選択された入力項目に対応する入力文字データ121を入力文字データ記憶部120から取得する。修正候補判定部160は、選択された入力項に対応する認識文字データ112を認識文字データ記憶部110から取得する。修正候補判定部160は、取得した入力文字データ121および認識文字データ112の文字列を比較する。   (Step S22) The correction candidate determination unit 160 acquires the input character data 121 corresponding to the selected input item from the input character data storage unit 120. The correction candidate determination unit 160 acquires the recognized character data 112 corresponding to the selected input item from the recognized character data storage unit 110. The correction candidate determination unit 160 compares the acquired character strings of the input character data 121 and the recognized character data 112.

(ステップS23)修正候補判定部160は、入力文字データ121および認識文字データ112の文字列の比較結果が不一致か判定する。比較結果が不一致の場合、処理をステップS24へ進める。比較結果が一致の場合、処理をステップS29へ進める。   (Step S23) The correction candidate determination unit 160 determines whether the character string comparison results of the input character data 121 and the recognized character data 112 do not match. If the comparison results do not match, the process proceeds to step S24. If the comparison results match, the process proceeds to step S29.

(ステップS24)修正候補判定部160は、入力画面21aについて、選択された入力項目を強調して表示する。
(ステップS25)修正候補判定部160は、入力文字データ121の対応する文字と不一致であった認識文字データ112の各文字から、認識率が閾値以上である文字を取得する。
(Step S24) The correction candidate determination unit 160 highlights and displays the selected input item on the input screen 21a.
(Step S25) The correction candidate determination unit 160 acquires a character whose recognition rate is equal to or greater than a threshold value from each character of the recognized character data 112 that does not match the corresponding character of the input character data 121.

(ステップS26)修正候補判定部160は、ステップS25で取得された文字数が1であるか判定する。取得された文字数が1である場合、処理をステップS27へ進める。取得された文字数が1以外である場合、処理をステップS28へ進める。   (Step S26) The correction candidate determination unit 160 determines whether or not the number of characters acquired in step S25 is one. If the acquired number of characters is 1, the process proceeds to step S27. If the acquired number of characters is other than 1, the process proceeds to step S28.

(ステップS27)修正候補判定部160は、ステップS25で取得された、認識率が閾値以上の文字について、修正候補の有無を判定する。詳細は、図15で説明する。
(ステップS28)修正候補判定部160は、修正画面21cを表示する。このとき、修正画面21cの操作項目21c−2には、「候補#1」、「候補#2」および「再入力」が表示されない。また、表示された修正画面21cにおいては、誤入力項目21c−1の入力欄の先頭位置にカーソルが表示された状態になっている。この状態から、オペレータは、キー操作を行うことで、誤入力項目21c−1の入力欄に先頭から文字列を再入力する。そして、オペレータは、修正画面21cの操作項目21c−2から「次へ」の項目を選択(キー“+”を押下)し、次の誤入力項目を表示させる。
(Step S27) The correction candidate determination unit 160 determines whether or not there is a correction candidate for the character acquired in step S25 and having a recognition rate equal to or higher than a threshold value. Details will be described with reference to FIG.
(Step S28) The correction candidate determination unit 160 displays the correction screen 21c. At this time, “candidate # 1”, “candidate # 2”, and “re-input” are not displayed in the operation item 21c-2 of the correction screen 21c. Moreover, in the displayed correction screen 21c, the cursor is displayed at the head position of the input field of the erroneous input item 21c-1. From this state, the operator re-inputs the character string from the top into the input field of the erroneous input item 21c-1 by performing a key operation. Then, the operator selects the “next” item (presses the key “+”) from the operation item 21c-2 on the correction screen 21c, and displays the next erroneous input item.

(ステップS29)修正候補判定部160は、入力画面21aにおける全入力項目を選択済みか判定する。全入力項目を選択済みの場合、処理を終了する。未選択の入力項目が存在する場合、処理をステップS21へ進める。   (Step S29) The correction candidate determination unit 160 determines whether all input items on the input screen 21a have been selected. If all input items have been selected, the process ends. If there is an unselected input item, the process proceeds to step S21.

なお、図14の処理は、入力画面21aの全入力項目に入力された後に行われるが、他の例として、オペレータにより1つの入力欄に入力されるたびに(例えば、他の入力欄にカーソルが移動したときに)、ステップS22〜S28の処理を実行してもよい。   14 is performed after all the input items on the input screen 21a are input. As another example, every time an operator inputs an input field (for example, the cursor is moved to another input field). May move), the processing of steps S22 to S28 may be executed.

図15は、修正候補を判定する処理の例を示すフローチャートである。以下、図15に示す処理をステップ番号に沿って説明する。
(ステップS31)修正候補判定部160は、図14のステップS25で取得した文字と隣接する文字から、認識率が閾値(90%)未満の文字を取得する。
FIG. 15 is a flowchart illustrating an example of processing for determining a correction candidate. In the following, the process illustrated in FIG. 15 will be described in order of step number.
(Step S31) The correction candidate determination unit 160 acquires characters whose recognition rate is less than the threshold (90%) from the characters adjacent to the characters acquired in step S25 of FIG.

(ステップS32)修正候補判定部160は、ステップS31で取得された文字数が1か判定する。ステップS31で取得された文字数が1である場合、処理をステップS33へ進める。ステップS31で取得された文字数が1以外である場合、処理をステップS34へ進める。   (Step S32) The correction candidate determination unit 160 determines whether the number of characters acquired in step S31 is one. If the number of characters acquired in step S31 is 1, the process proceeds to step S33. If the number of characters acquired in step S31 is other than 1, the process proceeds to step S34.

(ステップS33)修正候補判定部160は、図10に示した手順により、1つの修正候補を取得する。
(ステップS34)修正候補判定部160は、ステップS31で取得された文字数が2か判定する。ステップS31で取得された文字数が2である場合、処理をステップS35へ進める。ステップS31で取得された文字数が2以外(すなわち0)である場合、処理をステップS38へ進める。
(Step S33) The correction candidate determination unit 160 acquires one correction candidate according to the procedure shown in FIG.
(Step S34) The correction candidate determination unit 160 determines whether the number of characters acquired in step S31 is two. If the number of characters acquired in step S31 is 2, the process proceeds to step S35. If the number of characters acquired in step S31 is other than 2 (that is, 0), the process proceeds to step S38.

(ステップS35)修正候補判定部160は、図11に示した手順により、2つの修正候補を取得する。
(ステップS36)修正候補判定部160は、修正画面21cに修正候補を表示する。このとき、修正候補判定部160は、ステップS33を実行した場合、修正画面21cの操作項目21c−2には、「候補#1」を表示させるが「候補#2」を表示させない。また、修正候補判定部160は、ステップS35を実行した場合、修正画面21cの操作項目21c−2には、「候補#1」および「候補#2」を表示させる。
(Step S35) The correction candidate determination unit 160 acquires two correction candidates according to the procedure shown in FIG.
(Step S36) The correction candidate determination unit 160 displays the correction candidates on the correction screen 21c. At this time, when executing step S33, the correction candidate determination unit 160 displays “candidate # 1” but does not display “candidate # 2” in the operation item 21c-2 of the correction screen 21c. Moreover, the correction candidate determination part 160 displays "candidate # 1" and "candidate # 2" in the operation item 21c-2 of the correction screen 21c, when step S35 is performed.

そして、修正候補判定部160は、オペレータにより操作項目21c−2についての選択入力が行われるのを待つ。「候補#1」または「候補#2」が選択された(キー“1”またはキー“2”が押下された)場合、処理をステップS37へ進める。「再入力」が選択された(キー“0”が押下された)場合、処理をステップS38へ進める。   Then, the correction candidate determination unit 160 waits for the operator to make a selection input for the operation item 21c-2. If “candidate # 1” or “candidate # 2” is selected (key “1” or key “2” is pressed), the process proceeds to step S37. If “re-input” is selected (key “0” is pressed), the process proceeds to step S38.

(ステップS37)修正候補判定部160は、オペレータが選択した修正候補に基づいて、誤入力候補の入力欄を修正する。そして、修正候補判定部160は、誤入力項目21c−1の入力欄への修正を、入力画面21aにおいて、対応する入力項目の入力欄にも反映させる。そして、オペレータは、修正画面21cの操作項目21c−2から「次へ」の項目を選択(キー“+”を押下)し、次の誤入力項目を表示させる。これにより、入力欄に反映された修正が確定される。   (Step S37) The correction candidate determination unit 160 corrects the input field of the erroneous input candidate based on the correction candidate selected by the operator. Then, the correction candidate determination unit 160 reflects the correction to the input field of the erroneous input item 21c-1 in the input field of the corresponding input item on the input screen 21a. Then, the operator selects the “next” item (presses the key “+”) from the operation item 21c-2 on the correction screen 21c, and displays the next erroneous input item. Thereby, the correction reflected in the input field is confirmed.

(ステップS38)オペレータは、誤入力項目21c−1の入力欄に先頭から文字列を再入力する。そして、オペレータは、修正画面21cの操作項目21c−2から「次へ」の項目を選択(キー“+”を押下)し、次の誤入力項目を表示させる。これにより、入力欄に反映された修正が確定される。   (Step S38) The operator re-enters the character string from the beginning in the input field of the erroneous input item 21c-1. Then, the operator selects the “next” item (presses the key “+”) from the operation item 21c-2 on the correction screen 21c, and displays the next erroneous input item. Thereby, the correction reflected in the input field is confirmed.

第2の実施の形態の伝票入力装置100によれば、修正候補判定部160は、認識文字データ112および入力文字データ121の文字列を比較する。次に、認識文字データ112において、不一致である文字列から認識率が閾値以上である文字を取得し、取得した文字に隣接する文字から認識率が閾値未満である文字を取得する。そして、修正候補判定部160は、取得された閾値以上である文字と、その文字に隣接し認識率が閾値未満である文字とのペアに対応する入力文字データ121の文字のペアを取得する。   According to the slip input device 100 of the second embodiment, the correction candidate determination unit 160 compares the character strings of the recognized character data 112 and the input character data 121. Next, in the recognized character data 112, a character having a recognition rate equal to or greater than a threshold is acquired from a character string that does not match, and a character having a recognition rate less than the threshold is acquired from a character adjacent to the acquired character. Then, the correction candidate determination unit 160 acquires a character pair of the input character data 121 corresponding to a pair of a character that is greater than or equal to the acquired threshold and a character that is adjacent to the character and has a recognition rate that is less than the threshold.

このように取得された文字列のペアは、オペレータにより入れ替えて入力された可能性が高いことから、取得されたペアに含まれる文字の位置を入れ替えたペアを誤入力における修正候補と判定できる。そして、修正候補判定部160は、修正候補と判定された文字列を修正画面21cにより提示する。   Since there is a high possibility that the character string pairs acquired in this way have been replaced and input by the operator, a pair in which the positions of the characters included in the acquired pairs are replaced can be determined as a correction candidate for erroneous input. Then, the correction candidate determination unit 160 presents the character string determined as the correction candidate on the correction screen 21c.

これにより、オペレータは、誤入力の可能性がある入力項目について、修正候補を考慮して、誤入力か否か判断できるため、誤入力か否かの判断がより迅速にできる。
また、修正候補判定部160は、提示された修正候補からオペレータにより選択されると、誤入力された入力項目を選択された修正候補の内容に修正する。ここで、誤入力を含む文字列全体の中から、誤入力された文字のみを選択して修正すると、再度桁間違えなどの誤入力がされる可能性が生じる。そのため、一般的にオペレータは、入力文字データ121の文字列に誤入力があった場合、入力文字データ121に対応する入力欄に文字列を先頭から再入力することになる。すなわち、入力文字データ121の文字列のうち1文字だけ誤入力したときでも、7文字分、再入力することになる。これに対して、上記の処理により、提示された修正候補からオペレータが選択することで修正可能となるため、全て再入力するよりも入力する文字数が少なくて済み、誤入力の修正作業が効率化される。また、再入力時の誤入力の確率も抑制できるため、誤入力の修正の精度が上がる。
As a result, the operator can determine whether or not there is an erroneous input for an input item that may be erroneously input in consideration of the correction candidate, so that the determination as to whether or not there is an erroneous input can be made more quickly.
Further, the correction candidate determination unit 160, when selected by the operator from the presented correction candidates, corrects an input item that is erroneously input to the content of the selected correction candidate. Here, if only the erroneously input character is selected and corrected from the entire character string including the erroneous input, there is a possibility that an erroneous input such as a wrong digit will be made again. Therefore, in general, when there is an erroneous input in the character string of the input character data 121, the operator re-enters the character string from the top in the input field corresponding to the input character data 121. That is, even if only one character is erroneously input in the character string of the input character data 121, it is re-input for seven characters. On the other hand, the above processing makes it possible for the operator to make corrections by selecting from the proposed correction candidates, so that fewer characters need to be input than re-inputting all of them, making it easier to correct incorrect input. Is done. In addition, since the probability of erroneous input at the time of re-input can be suppressed, the accuracy of correction of erroneous input is increased.

なお、伝票入力システム5においては、修正候補を提示する代わりに、入力欄に表示された文字列のうち誤入力の候補と判定された文字のみ修正可能にするように、入力画面21aまたは修正画面21cが制御されてもよい。これにより、オペレータは、誤入力の候補となる文字以外の文字について、桁違いなどの誤入力を抑制できる。よって、誤入力の修正の精度が上がる。   In the slip input system 5, instead of presenting correction candidates, the input screen 21a or the correction screen is set so that only characters determined to be erroneous input candidates among the character strings displayed in the input field can be corrected. 21c may be controlled. Thereby, the operator can suppress erroneous input such as a digit difference for characters other than the characters that are candidates for erroneous input. Therefore, the accuracy of correcting erroneous input is improved.

また、上記のように修正候補のペアを提示する処理は、基本的に、1つのキーの操作により1つの文字が入力されるような文字列に適用される。例えば、修正候補を提示する処理は、数字が入力される入力項目に適用されることが望ましい。また、例えば、アルファベットが入力される入力項目に適用することも可能である。逆に、例えば、漢字を含む文字列が入力される入力項目については、図14の処理において、ステップS21〜S23の処理が実行された後、ステップS23で「YES」と判定された場合には無条件にステップS28の処理が実行されればよい。   The process of presenting a pair of correction candidates as described above is basically applied to a character string in which one character is input by operating one key. For example, it is desirable that the process of presenting correction candidates be applied to input items in which numbers are input. For example, the present invention can be applied to an input item in which alphabets are input. On the other hand, for example, for an input item to which a character string including Kanji characters is input, when the process of steps S21 to S23 is executed in the process of FIG. 14, the determination is “YES” in step S23. The process of step S28 should just be performed unconditionally.

また、上記の伝票入力システム5では、OCR認識の正確さを表す確度の例として認識率を用いた。しかしながら、例えば、OCR認識の正確さを表す確度として、OCR認識の処理中に使用されたパラメータを用いることもできる。例えば、スキャナ20によって読み取られた画像を文字のパターンと照合することで文字認識が行われる場合には、認識された文字についてのパターンとの一致度を、OCR認識の確度として用いてもよい。   In the slip input system 5, the recognition rate is used as an example of the accuracy representing the accuracy of OCR recognition. However, for example, a parameter used during the OCR recognition process can be used as the accuracy representing the accuracy of the OCR recognition. For example, when character recognition is performed by collating an image read by the scanner 20 with a character pattern, the degree of coincidence with the pattern for the recognized character may be used as the accuracy of OCR recognition.

OCR認識の確度としてOCR認識の処理中に使用されたパラメータが用いられる場合、伝票入力装置100は、このパラメータをスキャナ20から取得する。また、スキャナ20ではなく伝票入力装置100がOCR認識を行う場合には、上記パラメータを伝票入力装置100自身が出力することができる。   When the parameter used during the OCR recognition process is used as the OCR recognition accuracy, the slip input apparatus 100 acquires the parameter from the scanner 20. In addition, when the slip input device 100, not the scanner 20, performs OCR recognition, the slip input device 100 itself can output the parameters.

また、例えば、OCR認識の処理中に使用されたパラメータを前述の認識率によって補正した値を、OCR認識の確度として用いることもできる。
なお、前述のように、第1の実施の形態の文字入力支援装置10の処理は、文字入力支援装置10にプログラムを実行させることで実現できる。また、第2の実施の形態の伝票入力装置100および認識率DBサーバ200の処理は、各装置にプログラムを実行させることで実現できる。このようなプログラムは、コンピュータ読み取り可能な記録媒体(例えば、記録媒体23)に記録しておくことができる。記録媒体としては、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどを使用できる。磁気ディスクには、FDおよびHDDが含まれる。光ディスクには、CD、CD−R(Recordable)/RW(Rewritable)、DVDおよびDVD−R/RWが含まれる。
Further, for example, a value obtained by correcting the parameter used during the OCR recognition process by the above-described recognition rate can be used as the accuracy of the OCR recognition.
As described above, the processing of the character input support device 10 according to the first embodiment can be realized by causing the character input support device 10 to execute a program. The processing of the slip input device 100 and the recognition rate DB server 200 according to the second embodiment can be realized by causing each device to execute a program. Such a program can be recorded on a computer-readable recording medium (for example, the recording medium 23). As the recording medium, for example, a magnetic disk, an optical disk, a magneto-optical disk, a semiconductor memory, or the like can be used. Magnetic disks include FD and HDD. Optical discs include CD, CD-R (Recordable) / RW (Rewritable), DVD, and DVD-R / RW.

プログラムを流通させる場合、例えば、当該プログラムを記録した可搬記録媒体が提供される。また、プログラムを他のコンピュータの記憶装置に格納しておき、ネットワーク30経由でプログラムを配布することもできる。コンピュータは、例えば、可搬記録媒体に記録されたプログラムまたは他のコンピュータから受信したプログラムを、記憶装置(例えば、HDD103)に格納し、当該記憶装置からプログラムを読み込んで実行する。ただし、可搬記録媒体から読み込んだプログラムを直接実行してもよく、他のコンピュータからネットワーク30を介して受信したプログラムを直接実行してもよい。また、上記の情報処理の少なくとも一部を、DSP(Digital Signal Processing)、ASIC、PLD(Programmable Logic Device)等の電子回路で実現することも可能である。   When distributing the program, for example, a portable recording medium in which the program is recorded is provided. It is also possible to store the program in a storage device of another computer and distribute the program via the network 30. The computer stores, for example, a program recorded on a portable recording medium or a program received from another computer in a storage device (for example, HDD 103), and reads and executes the program from the storage device. However, a program read from a portable recording medium may be directly executed, or a program received from another computer via the network 30 may be directly executed. Further, at least a part of the information processing described above can be realized by an electronic circuit such as a DSP (Digital Signal Processing), an ASIC, or a PLD (Programmable Logic Device).

1 画像
2,3 文字列
10 文字入力支援装置
11 取得部
12 判定部
1 image 2, 3 character string 10 character input support device 11 acquisition unit 12 determination unit

Claims (7)

コンピュータに、
画像から認識された第1の文字列と、前記第1の文字列に含まれる各文字についての認識の正確さを示す確度と、入力操作に応じて入力された第2の文字列とを取得し、
前記第1の文字列に含まれる各文字と前記第2の文字列に含まれる各文字とを先頭から一対一で比較して、比較した文字同士が異なり、かつ対応する前記確度が第1の閾値以上である第1の文字を前記第1の文字列から抽出し、
前記第1の文字に隣接し、かつ対応する前記確度が第2の閾値未満である第2の文字を前記第1の文字列から抽出し、
前記第1の文字および前記第2の文字に対応する前記第2の文字列の文字ペアを誤入力と判定する、
処理を実行させることを特徴とする文字入力支援プログラム。
On the computer,
The first character string recognized from the image, the accuracy indicating the recognition accuracy of each character included in the first character string, and the second character string input in response to the input operation are acquired. And
Each character included in the first character string and each character included in the second character string are compared on a one-to-one basis from the beginning, the compared characters are different, and the corresponding accuracy is the first Extracting a first character that is greater than or equal to a threshold from the first character string;
Extracting, from the first character string, a second character that is adjacent to the first character and the corresponding accuracy is less than a second threshold;
Determining a character pair of the second character string corresponding to the first character and the second character as an erroneous input;
A character input support program characterized by causing processing to be executed.
前記コンピュータに、
前記第2の文字列についての修正入力を受け付けるための入力画面を表示させ、前記入力画面において、前記第2の文字列のうち、修正可能な領域を前記文字ペアの領域に制限する、
処理をさらに実行させることを特徴とする請求項1記載の文字入力支援プログラム。
In the computer,
Displaying an input screen for accepting a correction input for the second character string, and limiting a correctable region of the second character string to the region of the character pair in the input screen;
The character input support program according to claim 1, further comprising executing processing.
前記入力画面を表示させる処理では、
前記文字ペアに含まれる文字の順序を入れ替え、入れ替え後の前記文字ペアを修正候補として前記入力画面に表示させ、
修正確定の入力操作に応じて、前記文字ペアに含まれる文字の順序が入れ替えられた前記第2の文字列の入力を確定する、
ことを特徴とする請求項2記載の文字入力支援プログラム。
In the process of displaying the input screen,
Replacing the order of the characters included in the character pair, displaying the character pair after the replacement as a correction candidate on the input screen,
Confirming the input of the second character string in which the order of the characters included in the character pair is changed in accordance with the input operation of the correction confirmation;
The character input support program according to claim 2, wherein:
前記第2の文字の抽出において、前記第1の文字に隣接し、かつ対応する前記確度が第2の閾値未満である文字が前記第1の文字の両側から抽出された場合、前記入力画面を表示させる処理では、
前記第2の文字列に含まれる文字のうち、抽出された一方の文字および前記第1の文字に対応する第1の文字ペアと、抽出された他方の文字および前記第1の文字に対応する第2の文字ペアとを、それぞれ文字の順序の入れ替えを行った状態で修正候補として前記入力画面に表示させ、
表示された前記各修正候補のいずれかを選択する入力操作に応じて、前記第1の文字ペアまたは第2の文字ペアに含まれる文字の順序が入れ替えられた前記第2の文字列の入力を確定する、
ことを特徴とする請求項2記載の文字入力支援プログラム。
In the extraction of the second character, when a character that is adjacent to the first character and the corresponding accuracy is less than a second threshold is extracted from both sides of the first character, the input screen is displayed. In the process to display
Of the characters included in the second character string, one extracted character and the first character pair corresponding to the first character, and the other extracted character and the first character The second character pair is displayed on the input screen as a correction candidate in a state where the order of the characters is changed,
In response to an input operation for selecting one of the displayed correction candidates, input of the second character string in which the order of characters included in the first character pair or the second character pair is changed is performed. Determine,
The character input support program according to claim 2, wherein:
前記第1の文字の抽出において、比較した文字同士が異なり、かつ対応する前記確度が第1の閾値以上である文字が前記第1の文字列から複数抽出された場合、前記入力画面を表示させる処理では、前記入力画面において、前記第2の文字列全体を修正可能な領域とすることを特徴とする請求項2乃至4のいずれか1項に記載の文字入力支援プログラム。   In the extraction of the first character, the input screen is displayed when the compared characters are different from each other and a plurality of characters whose corresponding accuracy is the first threshold value or more are extracted from the first character string. 5. The character input support program according to claim 2, wherein in the processing, the entire second character string is set as an area that can be corrected on the input screen. 6. 前記コンピュータに、
前記第2の文字列に含まれる文字の順序を入れ替え、入れ替え後の前記文字ペアを修正候補として画面に表示させる、
処理をさらに実行させることを特徴とする請求項1記載の文字入力支援プログラム。
In the computer,
The order of the characters included in the second character string is changed, and the changed character pair is displayed on the screen as a correction candidate.
The character input support program according to claim 1, further comprising executing processing.
画像から認識された第1の文字列と、前記第1の文字列に含まれる各文字についての認識の正確さを示す確度と、入力操作に応じて入力された第2の文字列とを取得する取得部と、
前記第1の文字列に含まれる各文字と前記第2の文字列に含まれる各文字とを先頭から一対一で比較して、比較した文字同士が異なり、かつ対応する前記確度が第1の閾値以上である第1の文字を前記第1の文字列から抽出し、前記第1の文字に隣接し、かつ対応する前記確度が第2の閾値未満である第2の文字を前記第1の文字列から抽出し、前記第1の文字および前記第2の文字に対応する前記第2の文字列の文字ペアを誤入力と判定する判定部と、
を有することを特徴とする文字入力支援装置。
The first character string recognized from the image, the accuracy indicating the recognition accuracy of each character included in the first character string, and the second character string input in response to the input operation are acquired. An acquisition unit to
Each character included in the first character string and each character included in the second character string are compared on a one-to-one basis from the beginning, the compared characters are different, and the corresponding accuracy is the first A first character that is equal to or greater than a threshold is extracted from the first character string, and a second character that is adjacent to the first character and has a corresponding accuracy that is less than a second threshold is the first character. A determination unit that extracts from the character string and determines that the character pair of the second character string corresponding to the first character and the second character is an erroneous input;
A character input support device comprising:
JP2013071012A 2013-03-29 2013-03-29 Character input support program and character input support device Expired - Fee Related JP6075158B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013071012A JP6075158B2 (en) 2013-03-29 2013-03-29 Character input support program and character input support device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013071012A JP6075158B2 (en) 2013-03-29 2013-03-29 Character input support program and character input support device

Publications (2)

Publication Number Publication Date
JP2014194694A JP2014194694A (en) 2014-10-09
JP6075158B2 true JP6075158B2 (en) 2017-02-08

Family

ID=51839893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013071012A Expired - Fee Related JP6075158B2 (en) 2013-03-29 2013-03-29 Character input support program and character input support device

Country Status (1)

Country Link
JP (1) JP6075158B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7387363B2 (en) * 2019-09-30 2023-11-28 キヤノン株式会社 Data input support device, data input support method and program
JP7415433B2 (en) * 2019-10-24 2024-01-17 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP2023004111A (en) * 2021-06-25 2023-01-17 ローレルバンクマシン株式会社 Information processing apparatus and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3416975B2 (en) * 1993-02-02 2003-06-16 松下電器産業株式会社 Character recognition device and method of correcting recognized characters
JPH06274679A (en) * 1993-03-19 1994-09-30 Nec Eng Ltd Character reader
JPH06301809A (en) * 1993-04-19 1994-10-28 Mitsubishi Electric Corp Character information processor
JP2005352652A (en) * 2004-06-09 2005-12-22 Oki Electric Ind Co Ltd Document information input terminal
JP2006163656A (en) * 2004-12-06 2006-06-22 Sharp Corp Character recognition system

Also Published As

Publication number Publication date
JP2014194694A (en) 2014-10-09

Similar Documents

Publication Publication Date Title
US11853347B2 (en) Product auditing in point-of-sale images
RU2613734C1 (en) Video capture in data input scenario
WO2019024692A1 (en) Speech input method and device, computer equipment and storage medium
JP6575132B2 (en) Information processing apparatus and information processing program
JP6527410B2 (en) Character recognition device, character recognition method, and program
JP6119952B2 (en) Image processing apparatus and image processing program
US11438467B2 (en) Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters
CN104166474A (en) Information processing apparatus and character recognition method
WO2019194051A1 (en) Image processing device, image processing method, and storage medium storing program
JP2018507450A (en) Automatic schema inconsistency detection
JP6075158B2 (en) Character input support program and character input support device
US20170309113A1 (en) Vending machine recognition apparatus, vending machine recognition method, and recording medium
US11887390B2 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
JP7110723B2 (en) Data conversion device, image processing device and program
CN110569501A (en) user account generation method, device, medium and computer equipment
EP3428893A1 (en) Electronic signature pad, settlement system, and method of controlling an electronic signature pad
US20130330005A1 (en) Electronic device and character recognition method for recognizing sequential code
JP2020087112A (en) Document processing apparatus and document processing method
JP6131765B2 (en) Information processing apparatus and information processing program
JP5243228B2 (en) Character recognition device and method for generating confirmation screen of character recognition device
JP6003677B2 (en) Image processing apparatus and image processing program
JP2021064123A (en) Data input support system, data input support method, and program
JP6682827B2 (en) Information processing apparatus and information processing program
JP2019139551A (en) Character recognition device
JP5644247B2 (en) Character recognition device, character recognition method, and character recognition program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161226

R150 Certificate of patent or registration of utility model

Ref document number: 6075158

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees