JP6575158B2 - Information processing apparatus and information processing program - Google Patents

Information processing apparatus and information processing program Download PDF

Info

Publication number
JP6575158B2
JP6575158B2 JP2015118466A JP2015118466A JP6575158B2 JP 6575158 B2 JP6575158 B2 JP 6575158B2 JP 2015118466 A JP2015118466 A JP 2015118466A JP 2015118466 A JP2015118466 A JP 2015118466A JP 6575158 B2 JP6575158 B2 JP 6575158B2
Authority
JP
Japan
Prior art keywords
recognition
module
result
recognition result
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015118466A
Other languages
Japanese (ja)
Other versions
JP2017004311A (en
Inventor
久保田 聡
聡 久保田
木村 俊一
俊一 木村
瑛一 田中
瑛一 田中
越 裕
裕 越
秀宣 岡
秀宣 岡
晋 武藤
晋 武藤
公隆 田中
公隆 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015118466A priority Critical patent/JP6575158B2/en
Publication of JP2017004311A publication Critical patent/JP2017004311A/en
Application granted granted Critical
Publication of JP6575158B2 publication Critical patent/JP6575158B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus and an information processing program.

特許文献1には、文字列の表記及び表記規則を利用して文字認識機能の誤りを修正することを課題とし、数字文字列の画像を入力する画像入力部と、文字画像を切り出す文字画像切り出し部と、文字コードを与える文字認識部と、認識結果を格納する認識結果格納部と、読み取るべき数字文字列の表記規則の分析を行う表記分析部と、数字文字列データベースに格納された数字文字列データをアクセスする数字文字列データアクセス部と、数字文字列データを格納した数字文字列データベースと、認識結果とデータベースに格納された数字文字列データとを照らし合わせる数字文字列照合部と、照らし合わせた数字文字列で最適な数字文字列を選択する数字文字列データ選択部と、認識誤りを修正し、認識結果の属性を変更する認識結果修正・属性変更部と、処理結果を出力する処理結果出力部を有して構成されることが開示されている。   Japanese Patent Laid-Open Publication No. 2003-259542 has an object to correct an error in a character recognition function by using a character string notation and a notation rule, and an image input unit that inputs a numeric character string image, and a character image cutout that cuts out a character image. A character recognition unit that gives a character code, a recognition result storage unit that stores a recognition result, a notation analysis unit that analyzes a notation rule of a numeric character string to be read, and a numeric character stored in a numeric character string database A numeric character string data access unit that accesses the column data, a numeric character string database that stores the numeric character string data, a numeric character string collation unit that compares the recognition result with the numeric character string data stored in the database, and Numeric character string data selection section that selects the optimal numeric character string from the combined numeric character strings, and recognition result correction that corrects recognition errors and changes the attributes of recognition results An attribute change unit, be configured with a processing result output unit that outputs the processing results is disclosed.

特許文献2には、演算式に含まれる数字の修正作業をより効率的に行うことを可能とした光学的文字読取装置を提供することを課題とし、スキャナによって取り込まれた帳票のイメージ画像は、パーソナルコンピュータの文字認識部に引き渡され、文字認識部によって文字認識が施されて認識データが出力され、認識結果チェック・修正部は、この認識データの演算チェックを行う際、まず、すべての演算チェックを一通り実施し、次に、演算エラーが検出されたすべての演算式内のフィールドを候補として、例えば帳票上の左上から右下に向かってフィールド間の移動が行われるように、効率的な順序で修正作業を進めていくことが開示されている。   In Patent Document 2, an object is to provide an optical character reader that can more efficiently perform a correction operation of a number included in an arithmetic expression, and an image image of a form captured by a scanner is: It is handed over to the character recognition unit of the personal computer, character recognition is performed by the character recognition unit, and the recognition data is output. When the recognition result check / correction unit performs an operation check on this recognition data, Next, the fields in all the arithmetic expressions in which arithmetic errors are detected are considered as candidates, and for example, efficient movement is performed so that the fields are moved from the upper left to the lower right on the form. It is disclosed that the correction work proceeds in order.

特許文献3には、読取用シートに記録されたキーコードをOCRにより入力する場合に、誤読による誤った入力を低減させて、結果的に正常なキーコードを入力する読取率の向上を図ることを課題とし、読取用シートの複数箇所にキーコードを印刷し、OCRにより各キーコードを認識処理し、各キーコードに対応する各認識結果を使用して正常なキーコードの読取データを確定するコンピュータシステムを備えた文字読取システムであり、コンピュータシステムは、例えば各キーコードに付加されたチェックディジットに基づいて、各キーコードの認識結果の正誤を判定し、さらに、正常な認識結果を照合し、一致の場合にはいずれかの認識結果を正常なキーコードとして確定し、照合結果が不一致の場合には、各キーコードの中で予め優先順位を設定し、優先順位の高い認識結果を正常なキーコードとして確定することが開示されている。   In Patent Document 3, when a key code recorded on a reading sheet is input by OCR, erroneous input due to misreading is reduced, and as a result, a reading rate for inputting a normal key code is improved. The key code is printed at a plurality of locations on the reading sheet, each key code is recognized by OCR, and the read data of the normal key code is determined using each recognition result corresponding to each key code. A character reading system provided with a computer system. The computer system, for example, determines whether the recognition result of each key code is correct or not based on a check digit added to each key code, and further verifies the normal recognition result. If there is a match, confirm one of the recognition results as a normal key code. Set the priority, to ascertain a high recognition result priority as a normal key code is disclosed.

特開平07−114622号公報Japanese Patent Application Laid-Open No. 07-114622 特開2002−056354号公報JP 2002-056354 A 特開平11−096285号公報Japanese Patent Laid-Open No. 11-096285

本発明は、認識対象が誤り訂正符号付きであって、誤りが検出されると常に認識結果を人手で修正する場合に比べて、人手で修正する回数を減少させるようにした情報処理装置及び情報処理プログラムを提供することを目的としている。 The present invention relates to an information processing apparatus and information in which an object to be recognized is attached with an error correction code and the number of times of manual correction is reduced compared to the case where the recognition result is always manually corrected when an error is detected. The purpose is to provide a processing program.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤り検出を行う検出手段と、前記検出手段によって誤りが検出され、予め定められた条件を満たす場合は、複数の前記認識結果のうち、前記検出手段の対象となった認識結果とは異なる認識結果に変換する変換手段と、前記変換手段によって変換された認識結果に対して、前記検出手段による検出を行わせるように制御する第1の制御手段と、前記変換手段における予め定められた条件を満たさなかった場合は、前記認識対象の認識結果を人手で修正させるように制御する第2の制御手段を具備することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of claim 1 relates to one recognition result among a plurality of recognition results for a recognition target with an error correction code , on condition that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold. When an error is detected by the detection unit using an error correction code and an error is detected by the detection unit and a predetermined condition is satisfied, among the plurality of recognition results, the detection unit Conversion means for converting to a recognition result different from the target recognition result; first control means for controlling the detection result converted by the conversion means to perform detection by the detection means; A second control unit for controlling the recognition result of the recognition target to be manually corrected when a predetermined condition in the conversion unit is not satisfied; It is an information processing apparatus according to symptoms.

請求項2の発明は、前記予め定められた条件は、前記変換手段による変換対象の認識結果の認識確度が予め定められた認識確度より高い若しくは以上であること、前記変換手段による変換の回数が予め定められた回数より少ない若しくは以下であること、又は、これらの組み合わせであることを特徴とする請求項1に記載の情報処理装置である。   According to a second aspect of the present invention, the predetermined condition is that the recognition accuracy of the recognition result of the conversion target by the conversion unit is higher or higher than the predetermined recognition accuracy, and the number of conversions by the conversion unit is The information processing apparatus according to claim 1, wherein the information processing apparatus is less than or less than a predetermined number of times or a combination thereof.

請求項3の発明は、前記検出手段、前記変換手段、前記第1の制御手段による処理を複数回繰り返した後に、前記第2の制御手段による制御が行われるようにすることを特徴とする請求項1又は2に記載の情報処理装置である。   The invention of claim 3 is characterized in that the control by the second control means is performed after the processing by the detection means, the conversion means, and the first control means is repeated a plurality of times. Item 3. The information processing device according to Item 1 or 2.

請求項4の発明は、誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤りを訂正する訂正手段と、前記訂正手段によって誤りが訂正された場合は、該訂正された認識結果に関する情報に基づいて、前記認識対象の認識結果を人手で修正させるように制御する制御手段を具備することを特徴とする情報処理装置である。 The invention according to claim 4 relates to one recognition result among a plurality of recognition results for a recognition target with an error correction code on condition that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold. A correction unit that corrects an error of the recognition result using an error correction code; and when the error is corrected by the correction unit, the recognition result of the recognition target is determined based on information on the corrected recognition result. An information processing apparatus comprising control means for performing control so as to be corrected manually.

請求項5の発明は、前記制御手段は、前記訂正された認識結果の認識確度で降順に順位付けをし、該認識結果の順位が予め定められた順位より低い若しくは以下であること、前記訂正された認識結果の認識確度が予め定められた認識確度より低い若しくは以下であること、又は、これらの組み合わせを満たす場合に、前記認識対象の認識結果を人手で修正させるように制御することを特徴とする請求項4に記載の情報処理装置である。   The invention according to claim 5 is characterized in that the control means ranks in descending order according to the recognition accuracy of the corrected recognition result, and the rank of the recognition result is lower or lower than a predetermined rank, the correction When the recognition accuracy of the recognized recognition result is lower or lower than a predetermined recognition accuracy, or when a combination thereof is satisfied, the recognition result of the recognition target is controlled to be manually corrected. The information processing apparatus according to claim 4.

請求項6の発明は、コンピュータを、誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤り検出を行う検出手段と、前記検出手段によって誤りが検出され、予め定められた条件を満たす場合は、複数の前記認識結果のうち、前記検出手段の対象となった認識結果とは異なる認識結果に変換する変換手段と、前記変換手段によって変換された認識結果に対して、前記検出手段による検出を行わせるように制御する第1の制御手段と、前記変換手段における予め定められた条件を満たさなかった場合は、前記認識対象の認識結果を人手で修正させるように制御する第2の制御手段として機能させるための情報処理プログラムである。 According to the invention of claim 6, the computer is provided with one of a plurality of recognition results for a recognition target with an error correction code on condition that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold . A detection unit that performs error detection of the recognition result using an error correction code for the recognition result, and when an error is detected by the detection unit and satisfies a predetermined condition, among the plurality of recognition results, A conversion unit that converts a recognition result that is different from a recognition result that is a target of the detection unit, and a first control that controls the recognition result converted by the conversion unit to be detected by the detection unit. And a second control means for controlling the recognition result of the recognition target to be manually corrected when a predetermined condition in the conversion means is not satisfied An information processing program to function with.

請求項7の発明は、コンピュータを、誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤りを訂正する訂正手段と、前記訂正手段によって誤りが訂正された場合は、該訂正された認識結果に関する情報に基づいて、前記認識対象の認識結果を人手で修正させるように制御する制御手段として機能させるための情報処理プログラムである。 According to the seventh aspect of the present invention, there is provided a computer comprising: one of a plurality of recognition results for a recognition target with an error correction code , provided that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold . A correction unit that corrects an error in the recognition result using an error correction code for the recognition result, and when the error is corrected by the correction unit, based on information on the corrected recognition result, the recognition target It is an information processing program for functioning as a control means for controlling the recognition result to be corrected manually.

請求項1の情報処理装置によれば、認識対象が誤り訂正符号付きであって、誤りが検出されると常に認識結果を人手で修正する場合に比べて、人手で修正する回数を減少させることができる。 According to the information processing apparatus of claim 1, the number of times of manual correction is reduced as compared with the case where the recognition target has an error correction code and an error is detected and the recognition result is always corrected manually. Can do.

請求項2の情報処理装置によれば、予め定められた条件として、変換手段による変換対象の認識結果の認識確度が予め定められた認識確度より高い若しくは以上であること、変換手段による変換の回数が予め定められた回数より少ない若しくは以下であること、又は、これらの組み合わせとすることができる。   According to the information processing apparatus of claim 2, the predetermined condition is that the recognition accuracy of the recognition result of the conversion target by the conversion unit is higher or higher than the predetermined recognition accuracy, and the number of conversions by the conversion unit. Is less than or less than a predetermined number of times, or a combination thereof.

請求項3の情報処理装置によれば、検出手段、変換手段、第1の制御手段による処理を複数回繰り返した後に、第2の制御手段による制御が行われるようにすることができる。   According to the information processing apparatus of the third aspect, the control by the second control unit can be performed after the processing by the detection unit, the conversion unit, and the first control unit is repeated a plurality of times.

請求項4の情報処理装置によれば、認識対象が誤り訂正符号付きであって、誤りが訂正されると常に認識結果を人手で確認又は修正する場合に比べて、人手で確認又は修正する回数を減少させることができる。   According to the information processing apparatus of claim 4, the number of times that the recognition target is attached with an error correction code, and that when the error is corrected, the recognition result is manually checked or corrected compared with the case where the recognition result is manually checked or corrected. Can be reduced.

請求項5の情報処理装置によれば、訂正された認識結果の認識確度で降順に順位付けをし、その認識結果の順位が予め定められた順位より低い若しくは以下であること、訂正された認識結果の認識確度が予め定められた認識確度より低い若しくは以下であること、又は、これらの組み合わせを満たす場合に、認識対象の認識結果を人手で修正させるように制御することができる。   According to the information processing apparatus of claim 5, ranking is performed in descending order according to the recognition accuracy of the corrected recognition result, and the recognition result is lower than or lower than a predetermined order, corrected recognition When the recognition accuracy of the result is lower or lower than a predetermined recognition accuracy, or when these combinations are satisfied, the recognition result of the recognition target can be controlled to be manually corrected.

請求項6の情報処理プログラムによれば、認識対象が誤り訂正符号付きであって、誤りが検出されると常に認識結果を人手で修正する場合に比べて、人手で修正する回数を減少させることができる。 According to the information processing program of claim 6, when the recognition target has an error correction code and the error is detected, the number of times of manual correction is reduced compared to the case where the recognition result is always corrected manually. Can do.

請求項7の情報処理プログラムによれば、認識対象が誤り訂正符号付きであって、誤りが訂正されると常に認識結果を人手で確認又は修正する場合に比べて、人手で確認又は修正する回数を減少させることができる。   According to the information processing program of claim 7, the number of times that the recognition target is attached with an error correction code, and that when the error is corrected, the recognition result is always manually checked or corrected compared to the case where the recognition result is manually checked or corrected. Can be reduced.

第1の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 1st Embodiment. 本実施の形態を利用したシステム構成例を示す説明図である。It is explanatory drawing which shows the system configuration example using this Embodiment. 第1の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 1st Embodiment. 第2の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 2nd Embodiment. 第2の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 2nd Embodiment. 第3の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 3rd Embodiment. 第3の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 3rd Embodiment. 第4の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 4th Embodiment. 第4の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 4th Embodiment. 本実施の形態を利用する形態例を示す説明図である。It is explanatory drawing which shows the example of a form using this Embodiment. 従来技術の形態例を示す説明図である。It is explanatory drawing which shows the example of a form of a prior art. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

まず、本実施の形態を説明する前に、その前提又は本実施の形態を利用する情報処理装置について、図10、図11を用いて説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
図10は、本実施の形態を利用する形態例を示す説明図である。図10の例に示すように、証書番号等の各種番号が記入された番号記入欄1010等を有する帳票内の文字列を、データ処理装置1020でデータ入力1018する業務がある。
この入力を行うのに、すべて人手で入力(いわゆるキー入力)することの他に、文字認識技術を利用することが行われている。ただし、現在の文字認識技術は、常に100%の認識率を保証できるものではなく、認識誤りが含まれている場合がある。
また、証書番号等はデータの正確性を保つために何らかの誤り検出文字(誤り検出符号)が含まれている場合がある。これら誤り検出文字付き数字列を文字認識して、誤りが検出されなければ認識結果をデータ入力し、誤りが検出されれば人手で認識結果を修正してデータ入力を行う運用がなされている。
図11は、この運用を行うための従来技術の形態例を示す説明図である。
情報処理装置1100は、文字認識モジュール1110、誤り検出モジュール1120、人手修正モジュール1130を有している。
文字認識モジュール1110は、誤り検出モジュール1120と接続されており、帳票画像(数字列画像)1108を受け付ける。文字認識モジュール1110は、帳票画像(数字列画像)1108内の文字列を認識する。
誤り検出モジュール1120は、文字認識モジュール1110、人手修正モジュール1130と接続されている。誤り検出モジュール1120は、文字認識モジュール1110による処理結果である認識結果内の誤り検出文字を利用して、誤り検出無1122、誤り検出有1124のいずれであるかを判断する。誤り検出無1122であると判断された場合は、データ出力1128として、文字認識モジュール1110の認識結果をそのまま出力する。
人手修正モジュール1130は、誤り検出モジュール1120と接続されている。人手修正モジュール1130は、誤り検出モジュール1120によって誤り検出有1124であると判断された場合は、帳票画像(数字列画像)1108と認識結果を入力者に確認させ、人手によって修正させるようにしている。そして、人手修正モジュール1130で修正された結果をデータ出力1138とする。
文字認識モジュール1110の精度が低い場合、人手によるデータ入力工数が多くなる。
First, before describing the present embodiment, the premise or an information processing apparatus using the present embodiment will be described with reference to FIGS. This description is intended to facilitate understanding of the present embodiment.
FIG. 10 is an explanatory diagram showing a form example using the present embodiment. As shown in the example of FIG. 10, there is a task of inputting 1018 a character string in a form having a number entry column 1010 in which various numbers such as a certificate number are entered by a data processing device 1020.
In order to perform this input, a character recognition technique is used in addition to manual input (so-called key input). However, current character recognition technology cannot always guarantee a 100% recognition rate, and may include recognition errors.
In addition, the certificate number or the like may include some error detection character (error detection code) in order to maintain data accuracy. When a character string is recognized for these number strings with error detection characters, if no error is detected, the recognition result is input as data, and if an error is detected, the recognition result is manually corrected and the data is input.
FIG. 11 is an explanatory diagram showing an example of a conventional technique for performing this operation.
The information processing apparatus 1100 includes a character recognition module 1110, an error detection module 1120, and a manual correction module 1130.
The character recognition module 1110 is connected to the error detection module 1120 and receives a form image (numerical string image) 1108. The character recognition module 1110 recognizes a character string in the form image (number string image) 1108.
The error detection module 1120 is connected to the character recognition module 1110 and the manual correction module 1130. The error detection module 1120 uses the error detection character in the recognition result, which is the processing result of the character recognition module 1110, to determine whether there is no error detection 1122 or error detection 1124. If it is determined that there is no error detection 1122, the recognition result of the character recognition module 1110 is output as it is as the data output 1128.
The manual correction module 1130 is connected to the error detection module 1120. If the error detection module 1120 determines that the error is detected to be 1124, the manual correction module 1130 causes the input person to check the form image (numerical string image) 1108 and the recognition result, and corrects it manually. . The result corrected by the manual correction module 1130 is used as a data output 1138.
When the accuracy of the character recognition module 1110 is low, man-hours for inputting data are increased.

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<<第1の実施の形態>>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、すべての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
<< First Embodiment >>
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. This means that control is performed so as to be stored in the apparatus. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point. When there are a plurality of “predetermined values”, the values may be different from each other, or two or more values (of course, including all values) may be the same. In addition, the description having the meaning of “do B when it is A” is used in the meaning of “determine whether or not it is A and do B when it is judged as A”. However, the case where it is not necessary to determine whether or not A is excluded.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc. The case where it implement | achieves by etc. is also included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

第1の実施の形態である情報処理装置100は、認識対象108を認識するものであって、図1の例に示すように、文字認識モジュール110、誤り検出モジュール120、認識結果変換モジュール130、人手修正モジュール140を有している。
なお、認識対象108は、文字画像であってもよいし、文字を構成する線のストローク情報(いわゆるオンライン文字認識の認識対象)であってもよい。文字は、誤り検出符号を付加できる文字であればよい。もちろんのことながら、文字には、数字を含み、認識対象608として数字列であってもよい。また、英字を含めてもよいし、認識対象108として英字列であってもよい。もちろんのことながら、認識対象108として英数字列であってもよい。
また、認識対象108は、手書き文字であってもよいし、印刷された文字であってもよい。認識対象108は、誤り検出符号付きの文字列である。なお、ここでの文字列は、データとしての1文字以上の文字と誤り検出符号が含まれており、2文字以上である。また、例えば、文字列が複数のブロックによって構成されているような場合に、ブロック毎に誤り検出符号が含まれていてもよい。その場合、認識対象108内に誤り検出符号は複数含まれることになる。なお、誤り検出符号は、認識対象108内の予め定められた位置(例えば、文字列の右端の文字等)にある。誤り検出符号は、データの正確性を保つためのものであればよく、例えば、チェックディジット(C/D)等を用いればよい。また、誤り訂正符号を誤り検出符号として用いるようにしてもよい(つまり、ここでは誤り検出符号は、誤り訂正符号を含む概念である)。
例えば、帳票画像が認識対象108として入力される。また、その帳票の中の数字列欄(例えば証書番号など)の画像が入力されるようにしてもよい。特に欄が切り取られている必要はない。
The information processing apparatus 100 according to the first embodiment recognizes the recognition target 108, and as illustrated in the example of FIG. 1, a character recognition module 110, an error detection module 120, a recognition result conversion module 130, A manual correction module 140 is provided.
The recognition target 108 may be a character image or stroke information of a line constituting the character (so-called online character recognition recognition target). The character may be any character to which an error detection code can be added. Of course, the characters may include numbers, and the recognition target 608 may be a number string. In addition, English characters may be included, and the recognition target 108 may be an English character string. Of course, the recognition target 108 may be an alphanumeric string.
The recognition target 108 may be a handwritten character or a printed character. The recognition target 108 is a character string with an error detection code. The character string here includes one or more characters as data and an error detection code, and is two or more characters. For example, when a character string is composed of a plurality of blocks, an error detection code may be included for each block. In that case, a plurality of error detection codes are included in the recognition target 108. The error detection code is at a predetermined position (for example, the rightmost character of the character string) in the recognition target 108. The error detection code may be used for maintaining the accuracy of data, and for example, a check digit (C / D) or the like may be used. Further, an error correction code may be used as the error detection code (that is, the error detection code is a concept including an error correction code here).
For example, a form image is input as the recognition target 108. In addition, an image of a numeric string column (for example, a certificate number) in the form may be input. There is no particular need to cut the column.

文字認識モジュール110は、誤り検出モジュール120、認識結果変換モジュール130と接続されており、認識対象108を受け付ける。文字認識モジュール110は、認識対象108を文字認識する。ここでの文字認識技術は、従来の文字認識技術を利用すればよい。ただし、文字認識モジュール110は、認識結果として、それぞれの文字に対して複数の認識結果(テキストデータ)を出力し得るものである。そして、その認識結果(テキストデータ)のそれぞれに認識確度も出力する。ここで、認識結果(テキストデータ)の認識確度の値が高いほど、認識対象108に対応する正解のテキストデータである確率が高いことを示しているものとする。   The character recognition module 110 is connected to the error detection module 120 and the recognition result conversion module 130 and receives the recognition target 108. The character recognition module 110 recognizes the recognition target 108 as characters. The character recognition technique here may use a conventional character recognition technique. However, the character recognition module 110 can output a plurality of recognition results (text data) for each character as a recognition result. The recognition accuracy is also output to each of the recognition results (text data). Here, it is assumed that the higher the recognition accuracy value of the recognition result (text data) is, the higher the probability is that it is correct text data corresponding to the recognition target 108.

誤り検出モジュール120は、文字認識モジュール110、認識結果変換モジュール130と接続されている。誤り検出モジュール120は、文字認識モジュール110による処理結果である誤り検出符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り検出符号を用いて、その認識結果の誤り検出を行う。誤り検出は、既存の方法を用いる。具体的には、文字認識モジュール110による認識結果のうち、誤り検出符号とそれ以外の認識結果を比較することで誤り検出を行う。誤りを検出しなかった場合(OK122)は、その認識結果をデータ出力128とする。誤りを検出した場合(NG129)、認識結果変換モジュール130に処理を行わせる。なお、誤り検出において、認識結果の文字列内のどの文字に誤りがあることまで検出できる場合は、認識結果変換モジュール130に誤りを検出した文字を通知する。
なお、誤り検出モジュール120が誤り検出を行うための条件として、誤り検出符号の認識確度が予め定められた閾値より高い又は以上であることとしてもよい。つまり、誤り検出モジュール120は、誤り検出符号の認識確度が予め定められた閾値より高い若しくは以上である場合に、誤り検出を行うようにしてもよい。
また、誤り検出モジュール120が対象とする最初の文字列は、文字認識モジュール110によって認識された各文字の認識確度が最も高い文字列である。2回目以降の誤り検出モジュール120が対象とする文字列は、認識結果変換モジュール130によっていずれかの文字が変換された文字列である。
The error detection module 120 is connected to the character recognition module 110 and the recognition result conversion module 130. The error detection module 120 uses the error detection code for one recognition result among a plurality of recognition results for a recognition target with an error detection code, which is a processing result of the character recognition module 110, and performs error detection of the recognition result. . An existing method is used for error detection. Specifically, error detection is performed by comparing the error detection code and other recognition results among the recognition results by the character recognition module 110. If no error is detected (OK 122), the recognition result is used as the data output 128. When an error is detected (NG129), the recognition result conversion module 130 is caused to perform processing. In the error detection, if any character in the character string of the recognition result can be detected up to an error, the character that has detected the error is notified to the recognition result conversion module 130.
As a condition for the error detection module 120 to perform error detection, the recognition accuracy of the error detection code may be higher or higher than a predetermined threshold value. That is, the error detection module 120 may perform error detection when the recognition accuracy of the error detection code is higher or higher than a predetermined threshold.
The first character string targeted by the error detection module 120 is the character string having the highest recognition accuracy of each character recognized by the character recognition module 110. The character string targeted by the second or later error detection module 120 is a character string obtained by converting any character by the recognition result conversion module 130.

認識結果変換モジュール130は、文字認識モジュール110、誤り検出モジュール120、人手修正モジュール140と接続されている。認識結果変換モジュール130は、誤り検出モジュール120によって誤りが検出され、予め定められた条件を満たす場合は、複数の認識結果のうち、誤り検出モジュール120の対象となった認識結果とは異なる認識結果に変換する。そして、変換した認識結果に対して、誤り検出モジュール120による検出を行わせるように制御する。
具体的には、まず、変換対象となる文字を抽出する。ここで、誤り検出モジュール120が認識結果の文字列内のどの文字に誤りがあることまで検出した場合は、その文字を変換対象の文字とすればよい。また、誤り検出モジュール120が認識結果に誤りがあることまでは検出したが、その認識結果の文字列内のどの文字に誤りがあることまでは検出できていない場合は、その認識結果内の各文字の認識確度が最も低い文字(誤認識されている可能性が最も高い文字)を変換対象の文字とすればよい。
そして、予め定められた条件は、(1)認識結果変換モジュール130による変換対象の認識結果の認識確度が予め定められた認識確度より高い若しくは以上であること、(2)認識結果変換モジュール130による変換の回数が予め定められた回数より少ない若しくは以下であること、又は、(3)これらの組み合わせである。変換対象の認識結果の認識確度が予め定められた認識確度以下又は未満である場合は、変換しても誤っている可能性が、現在の認識結果の文字(誤り検出の対象とした文字)よりも高いからである。認識結果変換モジュール130による変換の回数が予め定められた回数より多い又は以上である場合は、変換しても誤っている可能性が、現在の認識結果の文字(誤り検出の対象とした文字)よりも高いからである。なお、これらの組み合わせとは、条件(1)かつ条件(2)とする条件(条件(1)と条件(2)との論理積)である。
これらの条件を満たす場合、認識結果変換モジュール130は、その変換対象の文字について、その文字の複数の認識結果のうち、誤り検出モジュール120の対象となった認識結果とは異なる認識結果に変換し、認識結果として再度誤り検出モジュール120に処理させる。より具体的に説明すると、最初の誤り検出の対象(文字認識モジュール110による認識結果そのもの)は、変換対象である文字(1文字)に対する複数の認識結果のうち、認識確度が最も高い認識結果Aである。この認識結果Aの文字に誤りが検出されたので、変換対象の文字の認識確度が次に高い認識結果Bに変換する。つまり、現在の変換対象である認識結果Aの認識確度の次に高い認識確度を有している認識結果Bに、認識結果Aを変換する。
そして、誤り検出モジュール120は、認識結果Aが認識結果Bとなった文字列について、再度誤り検出を行う。ここで誤り検出モジュール120と認識結果変換モジュール130での誤り検出処理と認識結果変換処理は、変換対象である認識文字の認識確度が予め定められた閾値未満若しくは以下になるまで、又は、予め定められた回数になるまで、繰り返し行われる。変換対象認識文字の認識確度が予め定められた閾値未満若しくは以下の場合、又は、繰り返しが予め定められた回数より多く若しくは以上行われた場合は、その時点で認識結果を人手修正モジュール140に出力する。
The recognition result conversion module 130 is connected to the character recognition module 110, the error detection module 120, and the manual correction module 140. When an error is detected by the error detection module 120 and a predetermined condition is satisfied, the recognition result conversion module 130 recognizes a recognition result different from the recognition result targeted by the error detection module 120 among the plurality of recognition results. Convert to Then, control is performed to cause the error detection module 120 to detect the converted recognition result.
Specifically, first, characters to be converted are extracted. Here, when the error detection module 120 detects up to which character in the character string of the recognition result has an error, the character may be the character to be converted. Further, if the error detection module 120 detects that there is an error in the recognition result, but has not been able to detect which character in the character string of the recognition result has an error, each error in the recognition result The character with the lowest character recognition accuracy (the character most likely to be misrecognized) may be the character to be converted.
The predetermined condition is that (1) the recognition accuracy of the recognition result to be converted by the recognition result conversion module 130 is higher or higher than the predetermined recognition accuracy, and (2) the recognition result conversion module 130 The number of conversions is less than or less than a predetermined number, or (3) a combination thereof. If the recognition accuracy of the recognition result to be converted is less than or less than a predetermined recognition accuracy, it is possible that the conversion result may be incorrect from the character of the current recognition result (the character targeted for error detection). Because it is expensive. If the number of conversions by the recognition result conversion module 130 is greater than or equal to a predetermined number, the character of the current recognition result (character that is the target of error detection) may be erroneous even after conversion. Because it is higher. In addition, these combinations are the conditions (logical product of the conditions (1) and (2)) which are the conditions (1) and (2).
When these conditions are satisfied, the recognition result conversion module 130 converts the character to be converted into a recognition result different from the recognition result targeted by the error detection module 120 among the plurality of recognition results of the character. Then, the error detection module 120 is processed again as a recognition result. More specifically, the first error detection target (the recognition result itself by the character recognition module 110) is the recognition result A having the highest recognition accuracy among a plurality of recognition results for the character to be converted (one character). It is. Since an error is detected in the character of the recognition result A, the character is converted into the recognition result B having the next highest recognition accuracy. That is, the recognition result A is converted into the recognition result B having the next higher recognition accuracy than the recognition accuracy of the recognition result A that is the current conversion target.
Then, the error detection module 120 performs error detection again for the character string whose recognition result A is the recognition result B. Here, the error detection processing and the recognition result conversion processing in the error detection module 120 and the recognition result conversion module 130 are performed until the recognition accuracy of the recognized character to be converted is less than or less than a predetermined threshold or predetermined. It is repeated until the number of times reached. If the recognition accuracy of the character to be converted is less than or less than a predetermined threshold value, or if the repetition is performed more or more than a predetermined number of times, the recognition result is output to the manual correction module 140 at that time To do.

なお、認識結果Bの認識確度が予め定められた閾値より高い若しくは以上であることを条件として、認識結果Aを認識結果Bに変換し、誤り検出モジュール120に再度の処理を行わせるようにしてもよい。そして、この条件を満たさない場合(変換しなかった場合)、誤り検出モジュール120に再度の処理を行わせるのではなく、人手修正モジュール140に処理を行わせるようにしてもよい。つまり、認識結果A及び認識結果Bの認識確度が予め定められた閾値より高い若しくは以上であることを条件として、認識結果Aを認識結果Bに変換するようにしてもよい。変換しようとする文字(認識結果B)も、予め定められた閾値より高い若しくは以上であることが変換する文字として望ましいからである。   The recognition result A is converted to the recognition result B on the condition that the recognition accuracy of the recognition result B is higher than or equal to a predetermined threshold value, and the error detection module 120 performs the process again. Also good. If this condition is not satisfied (when conversion is not performed), the error correction module 120 may be caused to perform processing instead of the error detection module 120 to perform processing again. That is, the recognition result A may be converted into the recognition result B on condition that the recognition accuracy of the recognition result A and the recognition result B is higher or higher than a predetermined threshold. This is because the character to be converted (recognition result B) is preferably higher than or higher than a predetermined threshold as a character to be converted.

人手修正モジュール140は、認識結果変換モジュール130と接続されている。人手修正モジュール140は、認識結果変換モジュール130における予め定められた条件を満たさなかった場合は、認識対象108の認識結果を人手で修正させるように制御する。具体的には、認識結果変換モジュール130によって変換処理が行われなかった場合に、人手によるデータ入力を行うように、データ表示、人手によって入力されたデータの受け取りを行う。そして、その修正結果をデータ出力148とする。なお、ここでの修正には、認識結果の一部を変更することの他に、新規の入力を含めてもよい。
具体的には、人手修正モジュール140は、(1)1回目の認識結果変換モジュール130における予め定められた条件を満たさなかった場合(つまり、誤り検出モジュール120の誤り検出が1回の場合)、(2)認識結果変換モジュール130によって変換された認識結果に対して、誤り検出モジュール120が誤り検出を行い(つまり、1つの認識対象108に対して複数回の誤り検出を行い)、認識結果変換モジュール130における予め定められた条件を満たさないで、変換できなかった場合は、人手による入力を行うようにする。
なお、入力者は1人であってもよいし、2人以上の複数人であってもよい。
The manual correction module 140 is connected to the recognition result conversion module 130. When the predetermined condition in the recognition result conversion module 130 is not satisfied, the manual correction module 140 performs control so that the recognition result of the recognition target 108 is manually corrected. Specifically, when the conversion process is not performed by the recognition result conversion module 130, the data is displayed and the data input manually is received so that the data is manually input. The correction result is used as a data output 148. The correction here may include a new input in addition to changing a part of the recognition result.
Specifically, the manual correction module 140 (1) when a predetermined condition in the first recognition result conversion module 130 is not satisfied (that is, when the error detection of the error detection module 120 is one time), (2) The error detection module 120 performs error detection on the recognition result converted by the recognition result conversion module 130 (that is, performs error detection a plurality of times for one recognition target 108), and converts the recognition result. If conversion cannot be performed without satisfying the predetermined condition in the module 130, manual input is performed.
Note that there may be one input person or two or more input persons.

誤り検出モジュール120、認識結果変換モジュール130による処理を複数回繰り返した後に、人手修正モジュール140による制御が行われるようにしてもよい。具体的には、認識結果変換モジュール130によって処理が行われる場合(誤り検出モジュール120によって誤りが検出された場合)は、誤り検出モジュール120、認識結果変換モジュール130による処理を繰り返すようにしてもよい。   The control by the manual correction module 140 may be performed after the processes by the error detection module 120 and the recognition result conversion module 130 are repeated a plurality of times. Specifically, when processing is performed by the recognition result conversion module 130 (when an error is detected by the error detection module 120), the processing by the error detection module 120 and the recognition result conversion module 130 may be repeated. .

図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)に示す例では、スタンドアローンとして実現する場合の例を示している。
認識対象入力装置210は、文字認識装置220と接続されている。認識対象入力装置210は、認識対象108が文字画像である場合は、スキャナ等である。認識対象108がストローク情報である場合は、ペンの動きを検出する装置(電子ペン、ペンの軌跡を検知するタブレット等)である。
文字認識装置220は、情報処理装置100を有しており、認識対象入力装置210、データ処理装置230と接続されている。文字認識装置220は、情報処理装置100を含んでおり、認識対象入力装置210からの認識対象に対して文字認識装置としての処理を行う。
データ処理装置230は、文字認識装置220と接続されている。データ処理装置230は、文字認識装置220による認識結果を処理する。例えば、帳票処理装置であったり、認識結果を記憶する記憶装置であったりしてもよい。
FIG. 2 is an explanatory diagram showing a system configuration example using the present embodiment.
In the example shown in FIG. 2A, an example in the case of realizing as a stand-alone is shown.
The recognition target input device 210 is connected to the character recognition device 220. The recognition target input device 210 is a scanner or the like when the recognition target 108 is a character image. When the recognition target 108 is stroke information, the device is a device that detects the movement of the pen (such as an electronic pen or a tablet that detects the pen trajectory).
The character recognition device 220 includes the information processing device 100 and is connected to the recognition target input device 210 and the data processing device 230. The character recognition device 220 includes the information processing device 100, and performs processing as a character recognition device on the recognition target from the recognition target input device 210.
The data processing device 230 is connected to the character recognition device 220. The data processing device 230 processes the recognition result by the character recognition device 220. For example, it may be a form processing device or a storage device that stores recognition results.

図2(b)に示す例では、他の装置と通信回線を介して、処理を行う場合の例を示している。
認識対象入力装置210A、認識対象入力装置210B、文字認識装置220、データ処理装置230A、データ処理装置230B、入力用端末240A、入力用端末240Bは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。
この例では、人手修正モジュール140の制御によって、入力用端末240に指示が出され、入力者242が修正作業を行う。例えば、認識対象108の画像とその認識結果を入力用端末240の表示装置に表示し、入力者242に認識結果を修正させるようにしてもよい。
In the example illustrated in FIG. 2B, an example in which processing is performed via another apparatus and a communication line is illustrated.
The recognition target input device 210A, the recognition target input device 210B, the character recognition device 220, the data processing device 230A, the data processing device 230B, the input terminal 240A, and the input terminal 240B are connected to each other via a communication line 290. The communication line 290 may be wireless, wired, or a combination thereof, and may be, for example, the Internet or an intranet as a communication infrastructure.
In this example, under the control of the manual correction module 140, an instruction is given to the input terminal 240, and the input person 242 performs correction work. For example, the image of the recognition target 108 and the recognition result may be displayed on the display device of the input terminal 240 so that the input person 242 corrects the recognition result.

図3は、第1の実施の形態による処理例を示すフローチャートである。この例は、変換対象の認識結果の認識確度が予め定められた認識確度以上である場合に変換を行う例である。
ステップS302では、文字認識モジュール110は、認識対象108を受け付ける。
ステップS304では、文字認識モジュール110は、認識対象108を認識する。文字認識モジュール110は、ステップS302で受け付けた誤り検出符号付きの認識対象108を認識して、認識結果として複数の認識候補文字とその認識確度を出力する。
ステップS306では、誤り検出モジュール120は、文字認識モジュール110から出力された認識結果(又はステップS312での変換結果)に対して、誤り検出処理を行う。
FIG. 3 is a flowchart illustrating a processing example according to the first exemplary embodiment. In this example, the conversion is performed when the recognition accuracy of the recognition result to be converted is equal to or higher than a predetermined recognition accuracy.
In step S302, the character recognition module 110 receives the recognition target 108.
In step S304, the character recognition module 110 recognizes the recognition target 108. The character recognition module 110 recognizes the recognition target 108 with the error detection code received in step S302, and outputs a plurality of recognition candidate characters and their recognition accuracy as recognition results.
In step S306, the error detection module 120 performs error detection processing on the recognition result (or the conversion result in step S312) output from the character recognition module 110.

ステップS308では、誤り検出モジュール120は、誤り検出があったか否かを判断し、誤りがあった場合はステップS310へ進み、それ以外の場合は処理を終了する(ステップS399)。つまり、誤り検出モジュール120で誤りの検出がなかった場合(OK122)は、認識結果をデータ出力128としてそのまま出力する。誤りの検出があった場合(NG129)には、ステップS310に処理を移し、誤り検出通知を認識結果変換モジュール130に出力する。
ステップS310では、認識結果変換モジュール130は、変換対象の認識確度が閾値以上であるか否かを判断し、閾値以上である場合はステップS312へ進み、それ以外の場合はステップS314へ進む。つまり、認識結果変換モジュール130は、未変換の認識結果の中で一番低い認識確度である文字(前述の変換対象の文字であって、誤っている可能性がある文字)が予め定められた閾値以上か否かを判定する。閾値以上の場合は、ステップS312に処理を移す。閾値未満の場合は、ステップS314に処理を移す。
In step S308, the error detection module 120 determines whether or not an error has been detected. If there is an error, the process proceeds to step S310, and otherwise the process ends (step S399). That is, if no error is detected by the error detection module 120 (OK 122), the recognition result is output as it is as the data output 128. If an error is detected (NG 129), the process proceeds to step S310, and an error detection notification is output to the recognition result conversion module 130.
In step S310, the recognition result conversion module 130 determines whether or not the recognition accuracy of the conversion target is greater than or equal to a threshold value. If it is greater than or equal to the threshold value, the process proceeds to step S312; otherwise, the process proceeds to step S314. That is, the recognition result conversion module 130 has previously determined a character having the lowest recognition accuracy among unconverted recognition results (characters that are the above-described conversion target characters and may be erroneous). It is determined whether or not the threshold value is exceeded. If it is equal to or greater than the threshold, the process proceeds to step S312. If it is less than the threshold, the process proceeds to step S314.

ステップS312では、認識結果変換モジュール130は、認識結果を変換する。認識結果変換モジュール130は、認識結果の中で一番低い認識確度の文字をそれ以外の複数の認識候補文字の中で次に認識確度の高いものに変換する。そして、処理をステップS306に移して、ステップS306(誤り検出処理)からステップS312(認識結果変換)の処理を繰り返す。
ステップS314では、人手修正モジュール140は、人手で認識結果の修正を行う。つまり、人手修正モジュール140は、変換対象である認識文字の認識確度が閾値未満の場合に、認識結果(又は変換結果)に対して、人手でデータ修正を行う。
In step S312, the recognition result conversion module 130 converts the recognition result. The recognition result conversion module 130 converts the character with the lowest recognition accuracy among the recognition results into the character with the next highest recognition accuracy among the other recognition candidate characters. Then, the process proceeds to step S306, and the process from step S306 (error detection process) to step S312 (recognition result conversion) is repeated.
In step S314, the manual correction module 140 corrects the recognition result manually. That is, the manual correction module 140 manually corrects data for the recognition result (or conversion result) when the recognition accuracy of the recognized character to be converted is less than the threshold.

<<第2の実施の形態>>
図4は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
情報処理装置400は、文字認識モジュール110、誤り検出モジュール120、認識結果変換モジュール130、人手修正モジュール140、結果統合モジュール450を有している。なお、前述の実施の形態と同種の部位には同一符号を付し重複した説明を省略する(以下、同様)。第1の実施の形態に結果統合モジュール450を付加したものである。
文字認識モジュール110は、誤り検出モジュール120、認識結果変換モジュール130と接続されており、認識対象108を受け付け、誤り検出モジュール120に認識結果412を、認識結果変換モジュール130に認識確度414を渡す。例えば、帳票画像が認識対象108として入力される。また、その帳票の中の数字列欄(例えば証書番号など)の画像が入力されるようにしてもよい。特に欄が切り取られている必要はないが、図4に示す例のように入力される例を示している。
<< Second Embodiment >>
FIG. 4 is a conceptual module configuration diagram of a configuration example according to the second embodiment.
The information processing apparatus 400 includes a character recognition module 110, an error detection module 120, a recognition result conversion module 130, a manual correction module 140, and a result integration module 450. In addition, the same code | symbol is attached | subjected to the site | part of the same kind as the above-mentioned embodiment, and the overlapping description is abbreviate | omitted (hereinafter the same). The result integration module 450 is added to the first embodiment.
The character recognition module 110 is connected to the error detection module 120 and the recognition result conversion module 130, receives the recognition target 108, and passes the recognition result 412 to the error detection module 120 and the recognition accuracy 414 to the recognition result conversion module 130. For example, a form image is input as the recognition target 108. In addition, an image of a numeric string column (for example, a certificate number) in the form may be input. In particular, the column need not be cut off, but an example of input as in the example shown in FIG. 4 is shown.

誤り検出モジュール120は、文字認識モジュール110、認識結果変換モジュール130、結果統合モジュール450と接続されており、文字認識モジュール110から認識結果412を、認識結果変換モジュール130から変換結果432を受け取り、結果統合モジュール450に認識結果426を渡す。
認識結果変換モジュール130は、文字認識モジュール110、誤り検出モジュール120、人手修正モジュール140と接続されており、文字認識モジュール110から認識確度414を受け取り、誤り検出モジュール120に変換結果432を、人手修正モジュール140に変換結果434を渡す。
人手修正モジュール140は、認識結果変換モジュール130、結果統合モジュール450と接続されており、認識結果変換モジュール130から変換結果434を受け取り、結果統合モジュール450に人手入力結果442を渡す。
結果統合モジュール450は、誤り検出モジュール120、人手修正モジュール140と接続されており、誤り検出モジュール120から認識結果426を、人手修正モジュール140から人手入力結果442を受け取り、出力データ458を出力する。結果統合モジュール450は、認識結果426、変換された認識結果(変換結果432)、人手修正モジュール140の結果(人手入力結果442)を統合する。ここでの統合とは、認識対象108に認識結果(テキストデータ)を対応させることであり、認識結果426又は人手入力結果442のいずれか一方を選択する場合も含む。結果統合モジュール450の出力が、情報処理装置400の出力データ458となる。本出力データ458は、データ入力の内容(認識対象108の認識結果)となる。
The error detection module 120 is connected to the character recognition module 110, the recognition result conversion module 130, and the result integration module 450. The error detection module 120 receives the recognition result 412 from the character recognition module 110 and the conversion result 432 from the recognition result conversion module 130. The recognition result 426 is passed to the integration module 450.
The recognition result conversion module 130 is connected to the character recognition module 110, the error detection module 120, and the manual correction module 140. The recognition result conversion module 130 receives the recognition accuracy 414 from the character recognition module 110, and converts the conversion result 432 into the error detection module 120. The conversion result 434 is passed to the module 140.
The manual correction module 140 is connected to the recognition result conversion module 130 and the result integration module 450, receives the conversion result 434 from the recognition result conversion module 130, and passes the manual input result 442 to the result integration module 450.
The result integration module 450 is connected to the error detection module 120 and the manual correction module 140. The result integration module 450 receives the recognition result 426 from the error detection module 120 and the manual input result 442 from the manual correction module 140, and outputs output data 458. The result integration module 450 integrates the recognition result 426, the converted recognition result (conversion result 432), and the result of the manual correction module 140 (manual input result 442). The integration here is to associate the recognition result (text data) with the recognition target 108, and includes the case where either the recognition result 426 or the manual input result 442 is selected. The output of the result integration module 450 becomes output data 458 of the information processing apparatus 400. This output data 458 becomes the contents of data input (recognition result of the recognition target 108).

図5は、第2の実施の形態による処理例を示すフローチャートである。ステップS502からステップS514までの処理は、図3の例に示したフローチャートにおけるステップS302からステップS314までの処理と同等である。
ステップS502では、文字認識モジュール110は、認識対象108を受け付ける。
ステップS504では、文字認識モジュール110は、認識対象108を認識する。
ステップS506では、誤り検出モジュール120は、認識(変換)結果の誤り検出処理を行う。
ステップS508では、誤り検出モジュール120は、誤り検出があったか否かを判断し、あった場合はステップS510へ進み、それ以外の場合はステップS516へ進む。
ステップS510では、誤り検出モジュール120は、変換対象認識確度が閾値以上であるか否かを判断し、閾値以上である場合はステップS512へ進み、それ以外の場合はステップS514へ進む。
ステップS512では、認識結果変換モジュール130は、認識結果を変換する。
ステップS514では、認識結果変換モジュール130は、人手で結果修正を行う。
ステップS516では、結果統合モジュール450は、結果を統合する。つまり、認識結果426、変換された変換結果、又は人手修正モジュール140で修正された修正結果(人手入力結果442)を統合して、処理を終了する(ステップS599)。
FIG. 5 is a flowchart illustrating a processing example according to the second exemplary embodiment. The processing from step S502 to step S514 is equivalent to the processing from step S302 to step S314 in the flowchart shown in the example of FIG.
In step S502, the character recognition module 110 receives the recognition target 108.
In step S504, the character recognition module 110 recognizes the recognition target 108.
In step S506, the error detection module 120 performs an error detection process on the recognition (conversion) result.
In step S508, the error detection module 120 determines whether or not an error has been detected. If there is an error, the process proceeds to step S510. Otherwise, the process proceeds to step S516.
In step S510, the error detection module 120 determines whether or not the conversion target recognition accuracy is equal to or higher than the threshold value. If the conversion target recognition accuracy is equal to or higher than the threshold value, the process proceeds to step S512, and otherwise the process proceeds to step S514.
In step S512, the recognition result conversion module 130 converts the recognition result.
In step S514, the recognition result conversion module 130 manually corrects the result.
In step S516, the result integration module 450 integrates the results. That is, the recognition result 426, the converted conversion result, or the correction result (manual input result 442) corrected by the manual correction module 140 is integrated, and the process ends (step S599).

<<第3の実施の形態>>
図6は、第3の実施の形態の構成例についての概念的なモジュール構成図である。
情報処理装置600は、文字認識モジュール610、誤り訂正モジュール620、訂正結果判定モジュール630、人手修正モジュール640を有している。
文字認識モジュール610は、誤り訂正モジュール620、訂正結果判定モジュール630と接続されており、認識対象608を受け付ける。文字認識モジュール610は、第1の実施の形態の文字認識モジュール110と同等のものである。また、認識対象608も第1の実施の形態の認識対象108と同等のものであり、誤り検出符号のかわりに誤り訂正符号が含まれている。
<< Third Embodiment >>
FIG. 6 is a conceptual module configuration diagram of an exemplary configuration according to the third embodiment.
The information processing apparatus 600 includes a character recognition module 610, an error correction module 620, a correction result determination module 630, and a manual correction module 640.
The character recognition module 610 is connected to the error correction module 620 and the correction result determination module 630 and receives the recognition target 608. The character recognition module 610 is equivalent to the character recognition module 110 of the first embodiment. The recognition target 608 is also equivalent to the recognition target 108 of the first embodiment, and includes an error correction code instead of the error detection code.

誤り訂正モジュール620は、文字認識モジュール610、訂正結果判定モジュール630と接続されている。誤り訂正モジュール620は、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、その認識結果の誤りを訂正する。誤り訂正は、既存の方法を用いる。誤り訂正符号(ECC : Error Correcting Code)は、データの正確性を保つためのものであればよく、例えば、元の文字列を2進表記したものに生成行列を掛けて誤り訂正符号(ECC)を付加したものであってもよい。この場合、その誤り訂正符号(ECC)の10進表記が誤り訂正符号となる。そして、誤り訂正処理は、例えば、認識結果を2進符号化してパリティ検査行列を掛けるといった方法で行われる。ただし、この方法に限るわけではなく、誤り訂正とその位置が特定できる既存の誤り訂正処理を用いることができる。誤り訂正結果を訂正結果判定モジュール630に出力する。
なお、誤り訂正モジュール620が誤り訂正を行うための条件として、誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件としてもよい。
誤り訂正モジュール620による処理結果として、誤りを検出しなかった場合、誤りを検出し訂正を行った場合がある。誤りを訂正した場合は、認識結果の文字列内のどの文字をどのように訂正したかについての情報も訂正結果判定モジュール630に渡す。
The error correction module 620 is connected to the character recognition module 610 and the correction result determination module 630. The error correction module 620 corrects an error of the recognition result by using the error correction code for one recognition result among a plurality of recognition results for the recognition target with the error correction code. An existing method is used for error correction. An error correcting code (ECC) may be used for maintaining the accuracy of data. For example, an error correcting code (ECC) is obtained by multiplying a binary representation of an original character string by a generator matrix. May be added. In this case, the decimal notation of the error correction code (ECC) is the error correction code. The error correction process is performed, for example, by a method in which the recognition result is binary-coded and multiplied by a parity check matrix. However, the present invention is not limited to this method, and an existing error correction process that can specify the error correction and its position can be used. The error correction result is output to the correction result determination module 630.
In addition, as a condition for the error correction module 620 to perform error correction, it may be a condition that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold.
As a result of processing by the error correction module 620, when no error is detected, an error may be detected and corrected. When the error is corrected, information on how to correct which character in the character string of the recognition result is also passed to the correction result determination module 630.

訂正結果判定モジュール630は、文字認識モジュール610、誤り訂正モジュール620、人手修正モジュール640と接続されている。訂正結果判定モジュール630は、誤り訂正モジュール620によって誤りが訂正された場合は、その訂正された認識結果に関する情報に基づいて、認識対象608の認識結果を人手で修正させるように制御する。
具体的には、誤り訂正モジュール620で誤りを検出しなかった場合(OK632)は、文字認識モジュール610による認識結果をデータ出力638とする。
そして、誤り訂正モジュール620が誤りを訂正した場合、訂正結果判定モジュール630は、(1)誤り訂正モジュール620によって訂正された認識結果の認識確度で降順に順位付けをし、その認識結果の順位が予め定められた順位より低い(予め定められた順位と比べて下位側にあること)若しくは以下(予め定められた順位と同じ、又はその順位と比べて下位側にあること)であること、(2)訂正された認識結果の認識確度が予め定められた認識確度より低い若しくは以下であること、又は、(3)これらの組み合わせ、を満たす場合(NG634)に、認識対象の認識結果を人手で修正させるように制御するようにしてもよい。なお、これらの組み合わせとは、条件(1)かつ条件(2)とする条件(条件(1)と条件(2)との論理積)である。誤り訂正した文字が誤認識である確率が高い場合は、人手で修正させることとなる。これら以外の場合(誤り訂正した文字が誤認識でない確率が高い場合、OK632)は、誤り訂正した結果をデータ出力638とする。
具体的には、訂正結果判定モジュール630は、誤り訂正された位置の認識文字の認識確度に基づいて、訂正結果をそのまま出力するかどうかの判定を行う。より具体的には、訂正文字の認識確度が複数の認識候補文字の中で予め定められた閾値よりも高い場合、又は候補順位がある閾値より高い場合は、訂正が信頼できるものとして訂正結果をデータ出力638とする。そうでない場合(前述の条件(1)〜(3)を満たす場合)は、誤り訂正モジュール620による誤り訂正が信頼できないとして、人手修正モジュール640に人手入力を行うようにリジェクト通知(NG634)を出力する。
The correction result determination module 630 is connected to the character recognition module 610, the error correction module 620, and the manual correction module 640. When the error is corrected by the error correction module 620, the correction result determination module 630 performs control so that the recognition result of the recognition target 608 is manually corrected based on the information regarding the corrected recognition result.
Specifically, if no error is detected by the error correction module 620 (OK 632), the recognition result by the character recognition module 610 is set as the data output 638.
When the error correction module 620 corrects the error, the correction result determination module 630 ranks in descending order according to the recognition accuracy of the recognition result corrected by the error correction module 620, and the rank of the recognition result is It is lower than a predetermined rank (being lower than a predetermined rank) or below (same as a predetermined rank or lower than that rank) ( 2) When the recognition accuracy of the corrected recognition result is lower than or lower than the predetermined recognition accuracy, or (3) a combination thereof is satisfied (NG634), the recognition result of the recognition target is manually set. You may make it control so that it may correct. In addition, these combinations are the conditions (logical product of the condition (1) and the condition (2)) that are the condition (1) and the condition (2). If there is a high probability that an error-corrected character is erroneously recognized, it will be corrected manually. In other cases (when there is a high probability that the error-corrected character is not erroneously recognized, OK 632), the error-corrected result is used as the data output 638.
Specifically, the correction result determination module 630 determines whether or not to output the correction result as it is based on the recognition accuracy of the recognized character at the position where the error is corrected. More specifically, if the recognition accuracy of the corrected character is higher than a predetermined threshold value among a plurality of recognition candidate characters, or if the candidate rank is higher than a certain threshold value, the correction result is assumed to be reliable. Data output 638 is assumed. Otherwise (when the above conditions (1) to (3) are satisfied), it is determined that the error correction by the error correction module 620 is not reliable, and a rejection notification (NG 634) is output so that manual input is performed to the manual correction module 640. To do.

人手修正モジュール640は、訂正結果判定モジュール630と接続されている。人手修正モジュール640は、認識対象608の認識結果を人手で修正させる。具体的には、訂正が信頼できないとしてリジェクト通知(NG634)があった場合に、人手によるデータ入力を行うように、データ表示、人手によって入力されたデータの受け取りを行う。なお、ここでの修正には、認識結果の一部を変更することの他に、新規の入力を含めてもよい。また、入力者は1人であってもよいし、2人以上の複数人であってもよい。   The manual correction module 640 is connected to the correction result determination module 630. The manual correction module 640 manually corrects the recognition result of the recognition target 608. Specifically, when there is a rejection notification (NG 634) that the correction is unreliable, the data is displayed and the data input manually is received so that the data is manually input. The correction here may include a new input in addition to changing a part of the recognition result. Further, the number of input users may be one, or two or more.

図7は、第3の実施の形態による処理例を示すフローチャートである。この例は、変換対象の認識結果の認識確度が予め定められた認識確度以上である場合に人手入力を行う例である。
ステップS702では、文字認識モジュール610は、認識対象608を受け付ける。
ステップS704では、文字認識モジュール610は、認識対象608を認識する。文字認識モジュール610は、ステップS702で受け付けた誤り訂正符号付きの認識対象608を認識して、認識結果として複数の認識候補文字とその認識確度を出力する。
FIG. 7 is a flowchart illustrating a processing example according to the third exemplary embodiment. This example is an example in which manual input is performed when the recognition accuracy of the recognition result to be converted is equal to or higher than a predetermined recognition accuracy.
In step S <b> 702, the character recognition module 610 receives the recognition target 608.
In step S704, the character recognition module 610 recognizes the recognition target 608. The character recognition module 610 recognizes the recognition target 608 with the error correction code received in step S702, and outputs a plurality of recognition candidate characters and their recognition accuracy as a recognition result.

ステップS706では、誤り訂正モジュール620は、認識結果の誤り訂正処理を行う。
ステップS708では、訂正結果判定モジュール630は、訂正文字の認識確度が閾値以上であるか否かを判断し、閾値以上である場合は処理を終了し(ステップS799)、それ以外の場合はステップS710へ進む。訂正結果判定モジュール630で訂正文字の認識確度が複数の認識候補文字の中で所定閾値よりも高い場合は(又は候補順位がある閾値より高い場合は)、訂正が信頼できるものとして(OK632)、訂正結果(誤り訂正しない場合を含む)を出力する。そうでない場合は、訂正が信頼できないとして(NG634)、人手入力を行うように人手修正モジュール640にリジェクト通知を出力する。
ステップS710では、人手修正モジュール640は、人手で結果修正を行う。つまり、人手修正モジュール640は、誤り訂正モジュール620での訂正結果に対して、人手でデータ修正を行う。
In step S706, the error correction module 620 performs error correction processing on the recognition result.
In step S708, the correction result determination module 630 determines whether or not the recognition accuracy of the corrected character is greater than or equal to a threshold value. If it is greater than or equal to the threshold value, the process ends (step S799). Otherwise, step S710 is performed. Proceed to In the correction result determination module 630, when the recognition accuracy of the corrected character is higher than a predetermined threshold value among the plurality of recognition candidate characters (or when the candidate rank is higher than a certain threshold value), the correction is assumed to be reliable (OK 632). Outputs the correction result (including the case of no error correction). Otherwise, it is determined that the correction is not reliable (NG 634), and a rejection notification is output to the manual correction module 640 so as to perform manual input.
In step S710, the manual correction module 640 manually corrects the result. That is, the manual correction module 640 manually corrects data for the correction result obtained by the error correction module 620.

<<第4の実施の形態>>
図8は、第4の実施の形態の構成例についての概念的なモジュール構成図である。
情報処理装置800は、文字認識モジュール610、誤り訂正モジュール620、訂正結果判定モジュール630、人手修正モジュール640、結果統合モジュール850を有している。第3の実施の形態に結果統合モジュール850を付加したものである。
文字認識モジュール610は、誤り訂正モジュール620、訂正結果判定モジュール630と接続されており、認識対象608を受け付け、誤り訂正モジュール620に認識結果812を、訂正結果判定モジュール630に認識確度814を渡す。例えば、帳票画像が認識対象608として入力される。また、その帳票の中の数字列欄(例えば証書番号など)の画像が入力されるようにしてもよい。特に欄が切り取られている必要はないが、図8に示す例のように入力される例を示している。
<< Fourth Embodiment >>
FIG. 8 is a conceptual module configuration diagram of a configuration example according to the fourth embodiment.
The information processing apparatus 800 includes a character recognition module 610, an error correction module 620, a correction result determination module 630, a manual correction module 640, and a result integration module 850. The result integration module 850 is added to the third embodiment.
The character recognition module 610 is connected to the error correction module 620 and the correction result determination module 630, receives the recognition target 608, and passes the recognition result 812 to the error correction module 620 and the recognition accuracy 814 to the correction result determination module 630. For example, a form image is input as the recognition target 608. In addition, an image of a numeric string column (for example, a certificate number) in the form may be input. Although the column need not be cut out in particular, an example of input as shown in the example shown in FIG. 8 is shown.

誤り訂正モジュール620は、文字認識モジュール610、訂正結果判定モジュール630と接続されており、文字認識モジュール610から認識結果812を受け取り、訂正結果判定モジュール630に訂正結果822を渡す。
訂正結果判定モジュール630は、文字認識モジュール610、誤り訂正モジュール620、人手修正モジュール640、結果統合モジュール850と接続されており、文字認識モジュール610から認識確度814を、誤り訂正モジュール620から訂正結果822を受け取り、結果統合モジュール850に訂正結果836を渡す。
人手修正モジュール640は、訂正結果判定モジュール630、結果統合モジュール850と接続されており、認識対象608を受け付け、結果統合モジュール850に人手入力結果842を渡す。
結果統合モジュール850は、訂正結果判定モジュール630、人手修正モジュール640と接続されており、訂正結果判定モジュール630から訂正結果836を、人手修正モジュール640から人手入力結果842を受け取り、出力データ858を出力する。結果統合モジュール850は、誤り訂正された認識結果(訂正結果836(誤りがなかった場合の認識結果812を含む))、人手修正モジュール640の結果(人手入力結果842)を統合する。ここでの統合とは、認識対象608に認識結果(テキストデータ)を対応させることであり、訂正結果836又は人手入力結果842のいずれか一方を選択する場合も含む。結果統合モジュール850の出力が、情報処理装置800の出力データ858となる。本出力データ858は、データ入力の内容(認識対象608の認識結果)となる。
The error correction module 620 is connected to the character recognition module 610 and the correction result determination module 630, receives the recognition result 812 from the character recognition module 610, and passes the correction result 822 to the correction result determination module 630.
The correction result determination module 630 is connected to the character recognition module 610, the error correction module 620, the manual correction module 640, and the result integration module 850, and the recognition accuracy 814 from the character recognition module 610 and the correction result 822 from the error correction module 620. And the correction result 836 is passed to the result integration module 850.
The manual correction module 640 is connected to the correction result determination module 630 and the result integration module 850, receives the recognition target 608, and passes the manual input result 842 to the result integration module 850.
The result integration module 850 is connected to the correction result determination module 630 and the manual correction module 640, receives the correction result 836 from the correction result determination module 630, receives the manual input result 842 from the manual correction module 640, and outputs output data 858. To do. The result integration module 850 integrates the error-corrected recognition result (correction result 836 (including the recognition result 812 when there is no error)) and the result of the manual correction module 640 (manual input result 842). The integration here is to associate the recognition result (text data) with the recognition target 608, and includes the case where either the correction result 836 or the manual input result 842 is selected. The output of the result integration module 850 becomes output data 858 of the information processing apparatus 800. The main output data 858 is data input content (recognition result of the recognition target 608).

図9は、第4の実施の形態による処理例を示すフローチャートである。ステップS902からステップS910までの処理は、図7の例に示したフローチャートにおけるステップS702からステップS710までの処理と同等である。
ステップS902では、文字認識モジュール610は、認識対象608を受け付ける。
ステップS904では、文字認識モジュール610は、認識対象608を認識する。
ステップS906では、誤り訂正モジュール620は、認識結果の誤り訂正処理を行う。
ステップS908では、訂正結果判定モジュール630は、訂正文字の認識確度が閾値以上であるか否かを判断し、閾値以上である場合はステップS912へ進み、それ以外の場合はステップS910へ進む。
ステップS910では、人手修正モジュール640は、人手で結果修正を行う。
ステップS912では、結果統合モジュール850は、結果を統合する。つまり、訂正結果836又は人手修正モジュール140で修正された修正結果(人手入力結果842)を統合して、処理を終了する(ステップS899)。
FIG. 9 is a flowchart illustrating a processing example according to the fourth exemplary embodiment. The processing from step S902 to step S910 is equivalent to the processing from step S702 to step S710 in the flowchart shown in the example of FIG.
In step S902, the character recognition module 610 receives the recognition target 608.
In step S904, the character recognition module 610 recognizes the recognition target 608.
In step S906, the error correction module 620 performs error correction processing on the recognition result.
In step S908, the correction result determination module 630 determines whether or not the recognition accuracy of the corrected character is greater than or equal to a threshold value. If it is greater than or equal to the threshold value, the process proceeds to step S912. Otherwise, the process proceeds to step S910.
In step S910, the manual correction module 640 manually corrects the result.
In step S912, the result integration module 850 integrates the results. That is, the correction result 836 or the correction result (manual input result 842) corrected by the manual correction module 140 is integrated, and the process ends (step S899).

図12を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図12に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1217と、プリンタ等のデータ出力部1218を備えたハードウェア構成例を示している。   A hardware configuration example of the information processing apparatus according to the present embodiment will be described with reference to FIG. The configuration shown in FIG. 12 is configured by a personal computer (PC), for example, and shows a hardware configuration example including a data reading unit 1217 such as a scanner and a data output unit 1218 such as a printer.

CPU(Central Processing Unit)1201は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール110、誤り検出モジュール120、認識結果変換モジュール130、人手修正モジュール140、結果統合モジュール450、文字認識モジュール610、誤り訂正モジュール620、訂正結果判定モジュール630、人手修正モジュール640、結果統合モジュール850等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   A CPU (Central Processing Unit) 1201 includes various modules described in the above-described embodiments, that is, a character recognition module 110, an error detection module 120, a recognition result conversion module 130, a manual correction module 140, a result integration module 450, a character This is a control unit that executes processing according to a computer program that describes the execution sequence of each module such as the recognition module 610, the error correction module 620, the correction result determination module 630, the manual correction module 640, and the result integration module 850.

ROM(Read Only Memory)1202は、CPU1201が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1203は、CPU1201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1204により相互に接続されている。   A ROM (Read Only Memory) 1202 stores programs used by the CPU 1201, calculation parameters, and the like. A RAM (Random Access Memory) 1203 stores programs used in the execution of the CPU 1201, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 1204 configured by a CPU bus or the like.

ホストバス1204は、ブリッジ1205を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1206に接続されている。   The host bus 1204 is connected to an external bus 1206 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 1205.

キーボード1208、マウス等のポインティングデバイス1209は、操作者により操作される入力デバイスである。ディスプレイ1210は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。   A keyboard 1208 and a pointing device 1209 such as a mouse are input devices operated by an operator. The display 1210 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information.

HDD(Hard Disk Drive)1211は、ハードディスク(フラッシュメモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU1201によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、認識対象108、認識結果412、認識確度414、誤り検出無422、誤り検出有424、認識結果426、変換結果432、変換結果434、人手入力結果442、出力データ458、認識対象608、認識結果812、認識確度814、訂正結果822、訂正文字がOK832、訂正文字がNG834、訂正結果836、人手入力結果842、出力データ858等が格納される。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。   An HDD (Hard Disk Drive) 1211 includes a hard disk (may be a flash memory or the like), drives the hard disk, and records or reproduces a program executed by the CPU 1201 and information. The hard disk includes a recognition target 108, a recognition result 412, a recognition accuracy 414, no error detection 422, an error detection 424, a recognition result 426, a conversion result 432, a conversion result 434, a manual input result 442, output data 458, and a recognition target 608. , Recognition result 812, recognition accuracy 814, correction result 822, correction character OK832, correction character NG834, correction result 836, manual input result 842, output data 858, and the like are stored. Further, various other data, various computer programs, and the like are stored.

ドライブ1212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1213に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1207、外部バス1206、ブリッジ1205、及びホストバス1204を介して接続されているRAM1203に供給する。リムーバブル記録媒体1213も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 1212 reads data or a program recorded in a removable recording medium 1213 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out to the interface 1207 and the external bus 1206. , The bridge 1205, and the RAM 1203 connected via the host bus 1204. The removable recording medium 1213 can also be used as a data recording area similar to a hard disk.

接続ポート1214は、外部接続機器1215を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1214は、インタフェース1207、及び外部バス1206、ブリッジ1205、ホストバス1204等を介してCPU1201等に接続されている。通信部1216は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1217は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1218は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 1214 is a port for connecting the external connection device 1215 and has a connection unit such as USB, IEEE1394. The connection port 1214 is connected to the CPU 1201 and the like via the interface 1207, the external bus 1206, the bridge 1205, the host bus 1204, and the like. The communication unit 1216 is connected to a communication line and executes data communication processing with the outside. The data reading unit 1217 is a scanner, for example, and executes document reading processing. The data output unit 1218 is a printer, for example, and executes document data output processing.

なお、図12に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図12に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図12に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   Note that the hardware configuration of the information processing apparatus illustrated in FIG. 12 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 12, and the modules described in the present embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 12 may be connected to each other via communication lines so as to cooperate with each other. In particular, in addition to personal computers, portable information communication devices (including mobile phones, smartphones, mobile devices, wearable computers, etc.), information appliances, robots, copiers, fax machines, scanners, printers, multifunction devices (scanners, printers, An image processing apparatus having two or more functions such as a copying machine and a fax machine) may be incorporated.

前述の実施の形態においては、認識対象を数字列とした例を示したが、誤り検出符号又は誤り訂正符号が付されているものであれば、数字のみに限らず他の文字種(例えば、英字等)、又はこれらの組み合わせ(例えば、英数字列等)を認識対象としてもよい。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
In the above-described embodiment, an example in which a recognition target is a numeric string has been described. However, as long as an error detection code or an error correction code is attached, not only numbers but other character types (for example, alphabetic characters) Etc.) or a combination thereof (for example, an alphanumeric string or the like) may be the recognition target.
Further, in the description of the above-described embodiment, “more than”, “less than”, “greater than”, and “less than (less than)” in a comparison with a predetermined value contradicts the combination. As long as the above does not occur, “larger”, “smaller (less than)”, “more than”, and “less than” may be used.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray (registered trademark) Disc), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, or a wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

100…情報処理装置
110…文字認識モジュール
120…誤り検出モジュール
130…認識結果変換モジュール
140…人手修正モジュール
210…認識対象入力装置
220…文字認識装置
230…データ処理装置
240…入力用端末
290…通信回線
400…情報処理装置
450…結果統合モジュール
600…情報処理装置
610…文字認識モジュール
620…誤り訂正モジュール
630…訂正結果判定モジュール
640…人手修正モジュール
800…情報処理装置
850…結果統合モジュール
DESCRIPTION OF SYMBOLS 100 ... Information processing apparatus 110 ... Character recognition module 120 ... Error detection module 130 ... Recognition result conversion module 140 ... Manual correction module 210 ... Recognition target input device 220 ... Character recognition device 230 ... Data processing device 240 ... Input terminal 290 ... Communication Line 400 ... Information processing device 450 ... Result integration module 600 ... Information processing device 610 ... Character recognition module 620 ... Error correction module 630 ... Correction result determination module 640 ... Manual correction module 800 ... Information processing device 850 ... Result integration module

Claims (7)

誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤り検出を行う検出手段と、
前記検出手段によって誤りが検出され、予め定められた条件を満たす場合は、複数の前記認識結果のうち、前記検出手段の対象となった認識結果とは異なる認識結果に変換する変換手段と、
前記変換手段によって変換された認識結果に対して、前記検出手段による検出を行わせるように制御する第1の制御手段と、
前記変換手段における予め定められた条件を満たさなかった場合は、前記認識対象の認識結果を人手で修正させるように制御する第2の制御手段
を具備することを特徴とする情報処理装置。
With the proviso that recognition accuracy of the error correction code is preliminarily higher than the determined threshold or higher, by using an error correction code for one of the recognition results of the plurality of recognition results for the recognition target with error correction code, Detecting means for detecting an error in the recognition result;
When an error is detected by the detection unit and a predetermined condition is satisfied, a conversion unit that converts a recognition result that is different from the recognition result that is the target of the detection unit among the plurality of recognition results;
First control means for controlling the recognition result converted by the conversion means to perform detection by the detection means;
An information processing apparatus comprising: a second control unit configured to perform control so that the recognition result of the recognition target is manually corrected when a predetermined condition in the conversion unit is not satisfied.
前記予め定められた条件は、前記変換手段による変換対象の認識結果の認識確度が予め定められた認識確度より高い若しくは以上であること、前記変換手段による変換の回数が予め定められた回数より少ない若しくは以下であること、又は、これらの組み合わせである
ことを特徴とする請求項1に記載の情報処理装置。
The predetermined condition is that the recognition accuracy of the recognition result of the conversion target by the conversion unit is higher or higher than the predetermined recognition accuracy, and the number of conversions by the conversion unit is less than the predetermined number of times. The information processing apparatus according to claim 1, wherein the information processing apparatus is the following or a combination thereof.
前記検出手段、前記変換手段、前記第1の制御手段による処理を複数回繰り返した後に、前記第2の制御手段による制御が行われるようにする
ことを特徴とする請求項1又は2に記載の情報処理装置。
3. The control by the second control unit is performed after the processing by the detection unit, the conversion unit, and the first control unit is repeated a plurality of times. 4. Information processing device.
誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤りを訂正する訂正手段と、
前記訂正手段によって誤りが訂正された場合は、該訂正された認識結果に関する情報に基づいて、前記認識対象の認識結果を人手で修正させるように制御する制御手段
を具備することを特徴とする情報処理装置。
Using the error correction code for one recognition result of a plurality of recognition results for a recognition target with an error correction code , on condition that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold , Correction means for correcting an error in the recognition result;
Control means for controlling so that the recognition result of the recognition target is manually corrected based on the information related to the corrected recognition result when an error is corrected by the correction means. Processing equipment.
前記制御手段は、前記訂正された認識結果の認識確度で降順に順位付けをし、該認識結果の順位が予め定められた順位より低い若しくは以下であること、前記訂正された認識結果の認識確度が予め定められた認識確度より低い若しくは以下であること、又は、これらの組み合わせを満たす場合に、前記認識対象の認識結果を人手で修正させるように制御する
ことを特徴とする請求項4に記載の情報処理装置。
The control means ranks in descending order according to the recognition accuracy of the corrected recognition result, and the recognition result rank is lower or lower than a predetermined rank, and the recognition accuracy of the corrected recognition result 5. The control is performed so that the recognition result of the recognition target is manually corrected when the recognition accuracy is lower than or less than a predetermined recognition accuracy, or a combination thereof is satisfied. Information processing device.
コンピュータを、
誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤り検出を行う検出手段と、
前記検出手段によって誤りが検出され、予め定められた条件を満たす場合は、複数の前記認識結果のうち、前記検出手段の対象となった認識結果とは異なる認識結果に変換する変換手段と、
前記変換手段によって変換された認識結果に対して、前記検出手段による検出を行わせるように制御する第1の制御手段と、
前記変換手段における予め定められた条件を満たさなかった場合は、前記認識対象の認識結果を人手で修正させるように制御する第2の制御手段
として機能させるための情報処理プログラム。
Computer
With the proviso that recognition accuracy of the error correction code is preliminarily higher than the determined threshold or higher, by using an error correction code for one of the recognition results of the plurality of recognition results for the recognition target with error correction code, Detecting means for detecting an error in the recognition result;
When an error is detected by the detection unit and a predetermined condition is satisfied, a conversion unit that converts a recognition result that is different from the recognition result that is the target of the detection unit among the plurality of recognition results;
First control means for controlling the recognition result converted by the conversion means to perform detection by the detection means;
An information processing program for functioning as a second control unit that performs control so that the recognition result of the recognition target is manually corrected when a predetermined condition in the conversion unit is not satisfied.
コンピュータを、
誤り訂正符号の認識確度が予め定められた閾値より高い又は以上であることを条件として、誤り訂正符号付きの認識対象に対する複数の認識結果のうちの1つの認識結果について誤り訂正符号を用いて、該認識結果の誤りを訂正する訂正手段と、
前記訂正手段によって誤りが訂正された場合は、該訂正された認識結果に関する情報に基づいて、前記認識対象の認識結果を人手で修正させるように制御する制御手段
として機能させるための情報処理プログラム。
Computer
Using the error correction code for one recognition result of a plurality of recognition results for a recognition target with an error correction code , on condition that the recognition accuracy of the error correction code is higher or higher than a predetermined threshold , Correction means for correcting an error in the recognition result;
An information processing program for functioning as a control unit that controls to manually correct a recognition result of the recognition target based on information on the corrected recognition result when an error is corrected by the correction unit.
JP2015118466A 2015-06-11 2015-06-11 Information processing apparatus and information processing program Expired - Fee Related JP6575158B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015118466A JP6575158B2 (en) 2015-06-11 2015-06-11 Information processing apparatus and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015118466A JP6575158B2 (en) 2015-06-11 2015-06-11 Information processing apparatus and information processing program

Publications (2)

Publication Number Publication Date
JP2017004311A JP2017004311A (en) 2017-01-05
JP6575158B2 true JP6575158B2 (en) 2019-09-18

Family

ID=57754266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015118466A Expired - Fee Related JP6575158B2 (en) 2015-06-11 2015-06-11 Information processing apparatus and information processing program

Country Status (1)

Country Link
JP (1) JP6575158B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093968A (en) * 2010-10-27 2012-05-17 Panasonic Corp Character recognition apparatus and character recognition method, recognition character correction apparatus and recognition character correction method and program

Also Published As

Publication number Publication date
JP2017004311A (en) 2017-01-05

Similar Documents

Publication Publication Date Title
JP6575132B2 (en) Information processing apparatus and information processing program
JP6119952B2 (en) Image processing apparatus and image processing program
US11438467B2 (en) Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
JP6575158B2 (en) Information processing apparatus and information processing program
US20210019554A1 (en) Information processing device and information processing method
JP6131765B2 (en) Information processing apparatus and information processing program
JP6260350B2 (en) Image processing apparatus and image processing program
JP5888222B2 (en) Information processing apparatus and information processing program
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP2011008584A (en) Apparatus and program for processing information
JP5195011B2 (en) Code reader and program
JP6511942B2 (en) INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM
JP6801741B2 (en) Information processing equipment and information processing programs
US9582740B2 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
JP5949248B2 (en) Information processing apparatus and information processing program
JP5821648B2 (en) Information processing apparatus and information processing program
US20220198190A1 (en) Information processing apparatus and non-transitory computer readable medium
US20230334243A1 (en) Document Processing Method And Information Processing Device
JP2018185601A (en) Information processing apparatus and information processing program
JP2008108153A (en) Information processing system and information processing program
JP2017102526A (en) Information processing device and information processing program
JP6003677B2 (en) Image processing apparatus and image processing program
JP5935324B2 (en) Information processing apparatus and information processing program
JP2016009235A (en) Information processing apparatus and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190805

R150 Certificate of patent or registration of utility model

Ref document number: 6575158

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees