JP2008108153A - Information processing system and information processing program - Google Patents
Information processing system and information processing program Download PDFInfo
- Publication number
- JP2008108153A JP2008108153A JP2006291926A JP2006291926A JP2008108153A JP 2008108153 A JP2008108153 A JP 2008108153A JP 2006291926 A JP2006291926 A JP 2006291926A JP 2006291926 A JP2006291926 A JP 2006291926A JP 2008108153 A JP2008108153 A JP 2008108153A
- Authority
- JP
- Japan
- Prior art keywords
- input
- input value
- character recognition
- correction
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明は、情報処理システムおよび情報処理プログラムに関する。 The present invention relates to an information processing system and an information processing program.
紙文書は、情報の伝達や記録を行うための媒体として優れたものであるが、これを保存するためには書庫などのスペースが必要になる。また、情報を紙文書に記録して保存している場合、後にその紙文書に記録された情報が必要になったときには、書庫などに収納されている多くの紙文書の中から目的とする情報が記録された紙文書を探し出さなければならない。 Paper documents are excellent media for transmitting and recording information, but a space such as a library is required to store them. In addition, when information is recorded and stored in a paper document, if the information recorded in the paper document is needed later, the target information can be selected from many paper documents stored in the archive. I have to find a paper document in which I was recorded.
そこで、紙文書を電子化して保存することが行われるようになってきている。具体的には、スキャナなどによって紙文書の各ページに対応する画像を読み取り、その画像に対応する画像データを紙文書毎にファイル化してハードディスクなどの記憶装置に記憶させることが行われるようになってきている。そして、文書画像データに対して、文字認識処理を行い、テキストコードとしての文書として取り扱えるようになっている。 Therefore, digitization and storage of paper documents has been performed. Specifically, an image corresponding to each page of a paper document is read by a scanner or the like, and image data corresponding to the image is filed for each paper document and stored in a storage device such as a hard disk. It is coming. Then, character recognition processing is performed on the document image data so that it can be handled as a document as a text code.
これに関連する技術として、例えば、特許文献1には、自動説明機や自動発表機などに利用され、光学文字読取装置で認識された文字等の認識結果を表示するための認識結果表示方式に関して、認識結果を出力しながら、認識結果中のキーワードに対応して画像を表示するので、図や表などを本文の流れに沿ってディスプレイで見ることができて、原稿の内容を把握し易くし、その内容を相手に効率よく伝えることができる技術が開示されている。
As a technique related to this, for example,
また、帳票類等の紙文書に対しては、文字認識による誤認識を低下させることが特に望まれている。例えば、文字認識結果をオペレータが目視して、誤認識文字が発生するとその都度修正入力を行い、正しい結果に直すようにしている。これに関連する技術として、例えば、特許文献2には、多くの人が手書きした帳票を高い認識率でかつ高速に処理することを課題とし、OCRシステムのコンピュータは、標準的な文字パターンが文字コードに対応して格納された標準文字パターン辞書ファイルと、帳票の記入者を特定するキー情報にして、文字認識時に不読とされた文字イメージと補正した際の文字コードとを記憶した補正データ履歴保存ファイルと、キー情報に対応付けて、文字認識時に誤読とされた文字イメージと修正した際の文字コードとを記憶した修正データ履歴保存ファイルと、標準文字パターン辞書ファイルを参照してイメージデータの中から手書き文字を文字認識し、認識結果の不読あるいは誤読については、キー情報に基づき補正データ履歴保存ファイルあるいは修正データ履歴保存ファイルを参照して補正あるいは修正するイメージデータ文字認識部とを備える技術が開示されている。
本発明は、このような背景技術の状況の中でなされたもので、紙文書の画像から文字コードへ変換するにあたって正確であり効率的な文字コード変換が困難であることを課題として、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な変換および修正の操作性、利便性を向上させるようにした情報処理システムおよび情報処理プログラムを提供することを目的としている。 The present invention has been made in the background of the background art as described above, and has been input as an object that accurate and efficient character code conversion is difficult when converting an image of a paper document into a character code. Using the character recognition result obtained by character recognition from the image of the paper document and the input result of the paper document by the operator, when converting the image of the paper document to the character code, the operability of accurate conversion and correction An object of the present invention is to provide an information processing system and an information processing program that improve convenience.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
本願請求項1に記載の発明は、同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
を具備することを特徴とする情報処理システムである。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention according to
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different from each other by the comparison by the comparison means, a correction means for correcting based on the contents stored in the storage means is provided. Information processing system.
本願請求項2に記載の発明は、前記記憶手段は、前記比較手段による比較によって、第1の入力値と第2の入力値とが同等である場合は、第1の入力値または第2の入力値を記憶し、
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項1に記載の情報処理システムである。
In the invention according to claim 2 of the present application, when the first input value and the second input value are equal to each other by the comparison by the comparison means, the storage means Memorize the input value,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing system according to
本願請求項3に記載の発明は、前記修正手段は、前記記憶手段に記憶されている同等の文書内における過去の修正に基づいて修正する
ことを特徴とする請求項1に記載の情報処理システムである。
The invention according to claim 3 of the present application is characterized in that the correction means corrects based on past corrections in an equivalent document stored in the storage means. It is.
本願請求項4に記載の発明は、前記文字認識処理は、文字認識結果と該文字認識処理による確信度をも出力し、
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項1に記載の情報処理システムである。
In the invention according to claim 4, the character recognition process outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing system according to
本願請求項5に記載の発明は、画像を入力する画像入力手段と、
前記画像入力手段によって入力された画像を文字認識する文字認識処理手段と、
前記画像内の文字を操作者の操作によって入力する文字入力手段と、
同等項目に対する前記文字入力手段による第1の入力値と前記文字認識処理手段による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に基づいて修正する第1の修正手段と、
前記第1の修正手段による修正の結果を操作者の操作によって修正する第2の修正手段
を具備することを特徴とする情報処理システムである。
The invention according to claim 5 is an image input means for inputting an image;
Character recognition processing means for recognizing characters of the image input by the image input means;
A character input means for inputting characters in the image by an operation of an operator;
Comparing means for comparing the first input value by the character input means for the equivalent item with the second input value by the character recognition processing means;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison means, a first correction means for correcting based on the storage means;
An information processing system comprising: second correction means for correcting a result of correction by the first correction means by an operation of an operator.
本願請求項6に記載の発明は、コンピュータを、
同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
として機能させることを特徴とする情報処理プログラムである。
The invention according to claim 6 of the present application provides a computer,
A comparison means for comparing a first input value obtained by an operator's operation on an equivalent item with a second input value obtained by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison unit, the comparison unit functions as a correction unit that corrects the content based on the contents stored in the storage unit. An information processing program.
本願請求項7に記載の発明は、前記記憶手段は、前記比較手段による比較によって、第1の入力値と第2の入力値とが同等である場合は、第1の入力値または第2の入力値を記憶し、
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項6に記載の情報処理プログラムである。
In the invention according to claim 7 of the present application, when the first input value and the second input value are equal to each other by the comparison by the comparison unit, the storage means Memorize the input value,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing program according to claim 6, wherein the information is corrected by a corrected value corresponding to the second input value.
本願請求項8に記載の発明は、前記修正手段は、前記記憶手段に記憶されている同等の文書内における過去の修正に基づいて修正する
ことを特徴とする請求項6に記載の情報処理プログラムである。
The invention according to claim 8 is the information processing program according to claim 6, wherein the correction means corrects based on past corrections in an equivalent document stored in the storage means. It is.
本願請求項9に記載の発明は、前記文字認識処理は、文字認識結果と該文字認識処理による確信度をも出力し、
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項6に記載の情報処理プログラムである。
In the invention according to claim 9 of the present application, the character recognition process also outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing program according to claim 6, wherein the correcting unit corrects according to a certainty factor stored in the storage unit.
請求項1の情報処理システムによれば、本構成を有していない場合に比較して、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な文字コード変換ができ、修正の操作性、利便性を向上させることができる。
According to the information processing system of
請求項2の情報処理システムによれば、本構成を有していない場合に比較して、より広範囲に過去の結果を利用することができ、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。 According to the information processing system of claim 2, it is possible to use past results in a wider range, more accurate character code conversion, and operability of correction as compared with the case where this configuration is not provided. Convenience can be further improved.
請求項3の情報処理システムによれば、本構成を有していない場合に比較して、同じ誤認識結果に対する修正を利用できる確率が高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。 According to the information processing system of claim 3, the probability that the correction for the same erroneous recognition result can be used is higher than in the case where the present configuration is not provided, and more accurate character code conversion can be performed. And convenience can be further improved.
請求項4の情報処理システムによれば、本構成を有していない場合に比較して、過去の文字認識結果のうち同じ誤認識結果に対する修正を利用できる確率がさらに高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。 According to the information processing system of claim 4, the probability that the correction for the same erroneous recognition result among the past character recognition results can be used is higher than in the case where the present configuration is not provided, and more accurate characters are obtained. Code conversion can be performed, and the operability and convenience of correction can be further improved.
請求項5の情報処理システムによれば、本構成を有していない場合に比較して、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な文字コード変換ができ、修正の操作性、利便性を向上させることができる。 According to the information processing system of claim 5, compared with the case where the present configuration is not provided, the character recognition result obtained by character recognition from the input paper document image and the input result of the paper document by the operator When converting the image of the paper document into a character code using the above, accurate character code conversion can be performed, and the operability and convenience of correction can be improved.
請求項6の情報処理プログラムによれば、本構成を有していない場合に比較して、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な文字コード変換ができ、修正の操作性、利便性を向上させることができる。 According to the information processing program of claim 6, compared with the case where the present configuration is not provided, the character recognition result obtained by character recognition from the input paper document image and the input result of the paper document by the operator When converting the image of the paper document into a character code using the above, accurate character code conversion can be performed, and the operability and convenience of correction can be improved.
請求項7の情報処理プログラムによれば、本構成を有していない場合に比較して、より広範囲に過去の結果を利用することができ、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。 According to the information processing program of the seventh aspect, compared with the case where the present configuration is not provided, past results can be used in a wider range, more accurate character code conversion can be performed, and correction operability can be achieved. Convenience can be further improved.
請求項8の情報処理プログラムによれば、本構成を有していない場合に比較して、同じ誤認識結果に対する修正を利用できる確率が高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。 According to the information processing program of claim 8, there is a higher probability that the correction for the same erroneous recognition result can be used compared to the case where the present configuration is not provided, and more accurate character code conversion can be performed. And convenience can be further improved.
請求項9の情報処理プログラムによれば、本構成を有していない場合に比較して、過去の文字認識結果のうち同じ誤認識結果に対する修正を利用できる確率がさらに高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。 According to the information processing program of claim 9, the probability that the correction for the same erroneous recognition result among the past character recognition results can be used is further increased as compared to the case where the present configuration is not provided, and more accurate characters are obtained. Code conversion can be performed, and the operability and convenience of correction can be further improved.
以下、図面に基づき本発明の好適な一実施の形態を説明する。
図1は、本発明の一実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
以下、文字認識対象の文字画像が含まれている画像として、帳票を主に例示して説明する。
なお、操作者の操作による入力値、文字認識処理による入力値は、文字コードであり、その文字コードには数字コード、文字列のコード列を含む。日本語の文字コードに限らず、英語、中国語、ハングル語の文字コードであってもよい。
Hereinafter, a preferred embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a conceptual module configuration diagram of an embodiment of the present invention.
The module generally refers to a component such as software or hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a program, a system, and a method. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Hereinafter, “connection” includes not only physical connection but also logical connection.
The system includes a configuration in which a plurality of computers, hardware, devices, and the like are connected via a network and the like, and includes a case where the system is realized by one computer, hardware, devices, and the like.
Hereinafter, a form will be mainly exemplified and described as an image including a character image to be recognized.
The input value by the operator's operation and the input value by the character recognition process are character codes, and the character code includes a numeric code and a character string code string. Not only Japanese character codes but also English, Chinese, and Korean character codes may be used.
本実施の形態は、図1に示すように、画像入力モジュール110、領域分割モジュール120、文字認識モジュール130、オペレータ入力モジュール140、比較モジュール150、修正モジュール160、学習DB(データベース)170を有している。
画像入力モジュール110は、図1に示すように、領域分割モジュール120と接続されており、帳票画像を入力する。より具体的には、スキャナによって紙文書である帳票を画像として入力する。
領域分割モジュール120は、図1に示すように、画像入力モジュール110、文字認識モジュール130と接続されており、画像入力モジュール110によって入力された画像からその画像を構成している領域を分割する。その領域分割の結果を、文字認識モジュール130へ渡す。
領域の分割は、画像から空白等で区切られた領域を分割することによって行われる。この領域分割の処理は、例えば、画像入力モジュール110による入力画像を二値化処理し、白画素の領域が一定の長さ(あるいは面積)以上あるところによって区切る。そのように区切ると、黒画素の領域(例えば、矩形)を分割することができる。さらに、その黒画素の領域の画像としての特徴(例えば、面積、縦または横の大きさ、形状、黒画素塊の存在位置等)を分割し、文字領域、図形領域、表領域、写真領域等の種別を判別することができる。もちろん他の既存の方法で領域を分割してもよい。
As shown in FIG. 1, the present embodiment includes an
As shown in FIG. 1, the
As shown in FIG. 1, the
The division of the area is performed by dividing an area divided by a blank or the like from the image. In this region division processing, for example, an input image by the
文字認識モジュール130は、図1に示すように、領域分割モジュール120、比較モジュール150と接続されており、領域分割モジュール120によって領域分割された画像のうち文字画像の領域に対して文字認識を行い、その認識結果を比較モジュール150へ渡す。文字認識モジュール130は、文字領域、表領域に対して文字認識処理を行うことによりテキストデータである文字列を生成する。ただし、この文字認識結果には、誤認識の結果等が含まれている可能性がある。また、文字認識結果についての確からしさを表す確信度を算出し、個々の認識結果に付加するようにしてもよい。なお、確信度とは、文字認識処理の結果として得られた文字コードの信頼度を示す値として算出される値であり、例えば、特許第2991779号公報に記載の文字の信頼度値を適用することができる。
また、画像入力モジュール110によって入力された帳票画像が文字のみである場合または予め文字が記載されている領域が設定されており、その設定に従って文字認識ができる等の場合には、領域分割モジュール120による処理を行わずに、直接、画像入力モジュール110によって入力された画像に対して文字認識処理を行うようにしてもよい。
As shown in FIG. 1, the
In addition, when the form image input by the
オペレータ入力モジュール140は、図1に示すように、比較モジュール150と接続されており、文字認識モジュール130によって文字認識が行われた帳票と同等の帳票の内容をオペレータ(操作者、利用者、または管理者等を含む)が例えばキーボードを用いて入力する。なお、同等には、少なくとも同一の場合を含む。
比較モジュール150は、図1に示すように、文字認識モジュール130、オペレータ入力モジュール140、修正モジュール160、学習DB170と接続されており、同等の帳票内の同等項目に対するオペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とを比較する。
つまり、文字認識モジュール130とオペレータ入力モジュール140によって、同等の帳票の同等項目の内容が、文字認識とオペレータによる入力という2種類の異なる方法によって入力されることになる。この場合、本来ならば、両者から入力された文字コードは一致するはずである。しかし、現在の文字認識技術では認識結果を100%保証することは困難であり、誤認識結果が混在することになる。一方、オペレータによる入力も誤入力ということがありえる。ただし、2種類の異なる方法によって入力しているので、両方とも間違えるという確率は低いといえる。したがって、片方が正しい文字コードである可能性が高い。また、両方とも間違えたとしても、同じように間違える確率は更に低いと考えられる。したがって、文字認識による誤認識またはオペレータによる誤入力があった場合、その2種類の方法によって入力された文字コードは一致しないはずである。
比較モジュール150は、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とを比較して、異なる場合は、間違いが発生したとして修正のきっかけとする。
As shown in FIG. 1, the
As shown in FIG. 1, the
That is, the contents of the equivalent items of the equivalent form are input by the
The
修正モジュール160は、図1に示すように、比較モジュール150、学習DB170と接続されており、比較モジュール150による比較によって、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とが異なる場合は、その入力値を学習DB170に記憶されている内容に基づいて修正する。つまり、オペレータ入力モジュール140による誤入力、文字認識モジュール130による誤認識は、同等文字に対して繰り返して行われることが多い。修正モジュール160は、過去の修正結果を参照することによって、修正する。
また、修正モジュール160は、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とが異なる場合は、その文字認識モジュール130による入力値に基づいて学習DB170に記憶されている文字認識モジュール130による入力値を検索し、検索された文字認識モジュール130による入力値に対応する修正後の値によって修正するようにしてもよい。つまり、文字認識モジュール130による文字認識は再現性がよいが、オペレータ入力モジュール140による入力はオペレータによるので一定しないという傾向がある。そこで、過去の修正結果を検索するにあたって、文字認識モジュール130による文字認識結果を優先して検索するようにしてもよい。
また、修正モジュール160は、直前の結果を最優先に利用するために、学習DB170に記憶されている同等の帳票内における過去の修正に基づいて修正するようにしてもよい。
As shown in FIG. 1, the
In addition, when the input value from the
Further, the
また、修正モジュール160は、前述した修正の後に、オペレータによって最終的な確認、第2の修正が行われるようにしてもよい。つまり、前記修正モジュール160による修正結果を表示し、オペレータの修正に関する操作を受け付け、該操作に応じて修正するようにしてもよい。その場合、オペレータによる修正結果を、学習DB170に記憶する。
学習DB170は、図1に示すように、比較モジュール150、修正モジュール160と接続されており、過去のオペレータ入力モジュール140による入力値、そのオペレータ入力モジュール140による入力値に対応する同等項目に対する過去の文字認識モジュール130による入力値、および同等項目に対する修正モジュール160による修正後の値を対応づけて記憶するデータベースである。さらに、学習DB170は、比較モジュール150による比較によって、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とが同等である場合は、オペレータ入力モジュール140による入力値または文字認識モジュール130による入力値を記憶するようにしてもよい。つまり、文字認識モジュール130による文字認識は再現性がよいので、文字認識結果とオペレータ入力モジュール140による入力結果が一致した場合も有効に利用できる学習データとなる。オペレータ入力モジュール140では誤入力となった場合に、過去に同じ文字に対しては誤入力にならなかった場合(文字認識モジュール130の文字認識結果とオペレータ入力モジュール140による入力結果が一致した場合)があれば、その場合を利用して修正しようとするものである。なお、学習DB170はデータベースとして実現できるほか、記憶手段として機能するものであればよい。
Further, the
As shown in FIG. 1, the learning
図2を用いて、本実施の形態を実現する場合のシステム例全体の構成を説明する。
全体の構成は、スキャンサーバー210とクライアントPC220とが通信回線230によって接続されている。スキャンサーバー210は、画像入力装置(スキャナ)の機能を有しており、通信回線230を介して、他の装置からの指示を受けて画像入力装置を動作させ、または画像入力装置によって入力された画像データを他の装置へ送信することができる機能を少なくとも有しているものである。
例えば、スキャンサーバー210内に図1で示した本実施の形態の構成が内蔵されており、クライアントPC220からオペレータの入力が行われ、その入力結果が通信回線230を介してスキャンサーバー210内のオペレータ入力モジュール140に入力されるようにしてもよい。また、スキャンサーバー210内には画像入力モジュール110、領域分割モジュール120、文字認識モジュール130が内蔵されており、クライアントPC220内にはオペレータ入力モジュール140、比較モジュール150、修正モジュール160、学習DB170が内蔵されていてもよい。
なお、スキャンサーバー210、クライアントPC220、通信回線230はそれぞれ複数あってもよい。
With reference to FIG. 2, the configuration of the entire system example in the case of realizing the present embodiment will be described.
As a whole configuration, the
For example, the configuration of the present embodiment shown in FIG. 1 is built in the
There may be a plurality of
図3を用いて、領域分割モジュール120、文字認識モジュール130による処理結果を取り扱うためのデータ構造の例を説明する。
領域分割・文字認識結果テーブル300は、図3に示すように、ID欄302、左上座標欄304、右下座標欄306、種別欄308、タイトル欄310、属性値欄312、確信度欄314を有している。ID欄302から種別欄308までは、領域分割モジュール120による処理結果を記憶し、タイトル欄310、属性値欄312、確信度欄314は、文字認識モジュール130による処理結果を記憶する。
An example of a data structure for handling the processing results obtained by the
As shown in FIG. 3, the area division / character recognition result table 300 includes an
ID欄302には、その帳票画像内で抽出された領域を一意に識別できる符号(識別子)が記憶される。この領域は帳票内の項目に該当する。
左上座標欄304、右下座標欄306には、領域分割モジュール120によって分割された領域の帳票画像内における位置が記憶される。例えば、分割領域が矩形の場合、画像の縦をX軸、横をY軸とした平面空間とし、その画像内における抽出領域の左上角の座標を左上座標欄304に記憶し、右下角の座標を右下座標欄306に記憶することによって、画像内における抽出領域の位置を特定できる。
種別欄308には、その分割画像の種別(文字領域、図形領域、表領域、写真領域等)が記憶される。文字領域、表領域が、文字認識モジュール130以降の処理対象となる。
The
In the upper left coordinate
The
タイトル欄310には、左上座標欄304と右下座標欄306によって特定できる領域内に対する文字認識モジュール130による文字認識結果の中から項目のタイトル(題、題名、表題、見出し等、またサブタイトルを含む)として抽出された文字列が記憶される。例えば、タイトルとして「支払先」、「勘定科目」、「摘要」、「金額」、「合計」等がある。また、処理としては、例えば、予め定められた帳票の項目のタイトルを記憶しているテーブル(表、記憶手段)を用意し、そのテーブル内のタイトルと文字認識モジュール130による文字認識結果とのマッチングをとるようにしてもよい。マッチングの際に、数文字(1文字を含む)異なる場合は、異なる文字が文字の形態として類似しているものか否かを判断してタイトルとして認めるようにしてもよい。
The
属性値欄312には、タイトル欄310に記憶されているタイトルに対応する属性値が記憶される。例えば、タイトルとして「支払先」に対応する具体的な会社名等である。また、処理としては、例えば、予め定められた帳票の項目のタイトルを記憶しているテーブルを用意し、そのテーブル内のタイトルと文字認識モジュール130による文字認識結果とマッチングしない文字列を属性値としてもよい。
確信度欄314には、文字認識モジュール130による文字認識処理の結果として得られた文字コードの確信度(信頼度)を示す値が記憶される。例えば、確信度を求める方法として、特許第2991779号公報に記載の方法を適用することができる。
The
In the
図4を用いて、オペレータ入力モジュール140によるオペレータによる入力結果を取り扱うためのデータ構造の例を説明する。
オペレータ入力テーブル400は、図4に示すように、ID欄402、左上座標範囲欄404、右下座標範囲欄406、タイトル欄408、属性値欄410を有している。ID欄402からタイトル欄408までは、予め帳票に応じて設定されている。オペレータ入力モジュール140による入力文字列が属性値欄410に記憶される。
ID欄402には、その帳票内の項目を一意に識別できる符号(識別子)が記憶される。
左上座標範囲欄404、右下座標範囲欄406には、項目のその帳票内における位置を特定できる座標が記憶される。ここでの座標系は、領域分割・文字認識結果テーブル300の左上座標欄304、右下座標欄306と同じ座標系を用いる。ただし、座標は範囲を持った値であり、これは領域分割・文字認識結果テーブル300の左上座標欄304、右下座標欄306とマッチングをとるためである。すなわち、左上座標範囲欄404、右下座標範囲欄406内に領域分割・文字認識結果テーブル300の左上座標欄304、右下座標欄306の座標が含まれていれば、同等の項目であると判断する。
タイトル欄408には、その帳票内の項目のタイトルが記憶される。
属性値欄410には、オペレータによってキーボードを用いて入力された属性値が記憶される。
An example of a data structure for handling an input result by an operator by the
As shown in FIG. 4, the operator input table 400 has an
The
In the upper left coordinate
The
The
図5を用いて、学習DB170に記憶され、比較モジュール150、修正モジュール160による処理結果を取り扱うためのデータ構造の例を説明する。
学習テーブル500は、図5に示すように、ID欄502、タイトル欄504、修正前文字認識属性値欄506、機器ID欄508、修正前入力属性値欄510、オペレータID欄512、修正後属性値欄514、修正者ID欄516を有している。
ID欄502には、修正が行われた文字列を一意に識別できる符号(識別子)が記憶される。
タイトル欄504には、修正が行われた項目のタイトルが記憶される。
修正前文字認識属性値欄506には、文字認識モジュール130によって文字認識されたその項目内の文字列が記憶される。
機器ID欄508には、文字認識モジュール130を一意に識別できる識別子が記憶される。例えば、文字認識モジュール130による処理を行う文字認識装置、またはスキャナ等の識別子が記憶される。
修正前入力属性値欄510には、オペレータ入力モジュール140によって入力された、その項目内の属性値が記憶される。
オペレータID欄512には、オペレータ入力モジュール140において入力を行ったオペレータを一意に識別できる識別子が記憶される。
修正後属性値欄514には、修正モジュール160によって修正された属性値が記憶される。
修正者ID欄516には、修正モジュール160によって修正された場合に、オペレータによる修正であればオペレータIDが記憶され、オペレータの介入なく修正された場合は修正モジュール160を一意に識別できる識別子が記憶される。
An example of a data structure that is stored in the
As shown in FIG. 5, the learning table 500 includes an
The
The
In the pre-correction character recognition
The
The pre-correction input
The
The corrected
In the
次に作用・働き(動作)を説明する。
図6を用いて、画像入力モジュール110、領域分割モジュール120、文字認識モジュール130による処理例を説明する。
ステップS602では、画像入力モジュール110が対象とする紙文書である帳票を画像データとして読み取る。具体的には、スキャナで読み込んでもよいし、FAXのように通信回線を介して入力してもよいし、帳票画像を蓄積したデータベースから読み込むようにしてもよい。
ステップS604では、領域分割モジュール120がステップS602で入力した画像に対して領域分割を行う。これによって、領域分割・文字認識結果テーブル300のID欄302から種別欄308までに値が記憶される。
ステップS606では、文字認識モジュール130がステップS604で分割した領域のうち、文字領域、表領域に対して文字認識処理を行う。
ステップS608では、文字認識モジュール130がステップS606で文字認識した結果を、領域分割・文字認識結果テーブル300のタイトル欄310から確信度欄314までに値として記憶する。
一方、オペレータ入力モジュール140が、オペレータによって画像入力モジュール110によって入力された帳票の内容である各項目の属性値を入力し、オペレータ入力テーブル400の属性値欄410に記憶する。
Next, the function and operation (operation) will be described.
A processing example by the
In step S602, a form, which is a paper document targeted by the
In step S604, the
In step S606, the
In step S608, the result of character recognition performed by the
On the other hand, the
図7、図8を用いて、比較モジュール150、修正モジュール160による処理例を説明する。
ステップS702では、比較モジュール150が文字認識モジュール130による文字認識結果を入力する。つまり、文字認識モジュール130が領域分割・文字認識結果テーブル300を比較モジュール150に渡す。
ステップS704では、比較モジュール150がオペレータ入力モジュール140による入力結果を入力する。つまり、オペレータ入力モジュール140がオペレータ入力テーブル400を比較モジュール150に渡す。
ステップS706では、比較モジュール150が、同等の項目に対する属性値が一致するか否かを判断する。一致している場合(修正が不要な場合)はステップS716へ進み、そうでない場合(修正が必要な場合)はステップS708へ進む。
ステップS708では、修正モジュール160が、ステップS702とステップS704で入力した対応する属性値を画面に表示する。つまり、図8に示すように、文字認識結果欄802にステップS702での文字認識結果を表示し、文字認識結果欄802と対に並んで表示されているオペレータ入力結果欄804にステップS704でのオペレータによる入力値を表示する。例えば、文字認識結果が「連結書」であり、オペレータによる入力値が「連絡書」である場合、文字認識結果欄802には「連結書」を表示し、オペレータ入力結果欄804には「連絡書」を表示する。ただし、このステップS708の時点では、結果欄810には何も表示しない。
A processing example by the
In step S <b> 702, the
In step S <b> 704, the
In step S706, the
In step S708, the
ステップS710では、比較モジュール150は学習DB170を用いた修正値を結果欄810に表示する。ここで、学習DB170に記憶されている同等の帳票内における過去の修正履歴だけに基づいて修正値を表示するようにしてもよい。つまり、1枚の帳票内の誤認識、誤入力は同じことが繰り返されている可能性が高く、別の帳票で行った修正は修正の参考にならない場合があるからである。例えば、その帳票内において「連結書」が「連絡書」と修正されており、それが学習DB170に記憶されている場合、前述の例では、文字認識結果の「連結書」を採用せずに、学習DB170に記憶されている修正値である「連絡書」を採用して、結果欄810に表示してもよい。
ステップS712では、オペレータは紙文書である帳票を見ながら、結果欄810に表示されている属性値が正しいか否かを判断し、正しい場合は登録ボタン812を押下し、修正が必要な場合は、結果欄810に表示されている属性値をキーボードを用いて修正する。または、修正の際に、文字認識結果欄802、オペレータ入力結果欄804に表示されている属性値を用いたいのであれば、選択ボタン806または選択ボタン808を押下して、いずれかの属性値を選択することができる。例えば、前述の例では、ステップS710で、既に、結果欄810に正しい属性値である「連絡書」が表示されているので、オペレータによる登録ボタン812の押下によって、次のステップS714へ進む。また、過去に「連結書」を「連絡書」と修正されたことが無く、学習DB170に同等のパターンが無い場合は、ステップS710での学習DB170を用いた修正が行われないので、オペレータによって選択ボタン808が押下され、オペレータによる入力値である「連絡書」が正しい属性値として採用され、結果欄810にその属性値である「連絡書」を表示し、オペレータによる登録ボタン812の押下によって、次のステップS714へ進む。
ステップS714では、修正結果を学習DB170に登録する。つまり、学習テーブル500内に1行追加される。例えば、前述の例では、修正前文字認識属性値欄506には「連結書」、修正前入力属性値欄510には「連絡書」、修正後属性値欄514には「連絡書」がそれぞれ記憶される。
ステップS716では、帳票内の全てのデータに対してこの確認、修正作業が終了したか否かを判断する。終了した場合はステップS718(終了)へ進み、そうでない場合はステップS702へ戻り、次の項目に対してステップS702以降の処理を繰り返す。
In step S <b> 710, the
In step S712, the operator determines whether or not the attribute value displayed in the
In step S714, the correction result is registered in the
In step S716, it is determined whether or not the confirmation and correction work has been completed for all data in the form. If completed, the process proceeds to step S718 (end). If not, the process returns to step S702, and the processes after step S702 are repeated for the next item.
また、図7に示したフローチャートでは、ステップS706で一致した場合にステップS716へ進んでいたが、これをステップS714へ進むようにしてもよい。つまり、文字認識モジュール130による文字認識結果とオペレータ入力モジュール140による入力結果が同等であっても、学習DB170に登録するようにしてもよい。
そして、ステップS710では、文字認識モジュール130による入力結果を検索用のキーワードとして、学習DB170に記憶されている学習テーブル500のオペレータID欄512を検索し、検索されたオペレータID欄512内の属性値に対応する修正後属性値欄514の値によって修正するようにしてもよい。
Further, in the flowchart shown in FIG. 7, the process proceeds to step S716 when they coincide with each other in step S706. However, the process may proceed to step S714. That is, even if the character recognition result by the
In step S710, the
図9を参照して、本実施の形態のハードウェア構成例について説明する。図9に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部917と、プリンタなどのデータ出力部918を備えたハードウェア構成例を示している。
With reference to FIG. 9, a hardware configuration example of the present embodiment will be described. The configuration illustrated in FIG. 9 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a
CPU(Central Processing Unit)901は、上述の本実施の形態において説明した各種のモジュール、すなわち、領域分割モジュール120、文字認識モジュール130、比較モジュール150、修正モジュール160等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。
A CPU (Central Processing Unit) 901 describes execution sequences of various modules described in the above-described embodiment, that is, the
ROM(Read Only Memory)902は、CPU901が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス904により相互に接続されている。
A ROM (Read Only Memory) 902 stores programs used by the
ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス906に接続されている。
The
キーボード908、マウス等のポインティングデバイス909は、オペレータにより操作される入力デバイスである。ディスプレイ910は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
A
HDD(Hard Disk Drive)911は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU901によって実行するプログラムや情報を記録または再生させる。ハードディスクは、入力された帳票画像や学習テーブル500等のデータなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 911 incorporates a hard disk, drives the hard disk, and records or reproduces a program executed by the
ドライブ912は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体913に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース907、外部バス906、ブリッジ905、およびホストバス904を介して接続されているRAM903に供給する。リムーバブル記録媒体913も、ハードディスクと同様のデータ記録領域として利用可能である。
The
接続ポート914は、外部接続機器915を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート914は、インタフェース907、および外部バス906、ブリッジ905、ホストバス904等を介してCPU901等に接続されている。通信部916は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部917は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部918は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
The
なお、図9に示す情報処理システムのハードウェア構成は、1つの構成例を示すものであり、本実施の形態の情報処理システムは、図9に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図9に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している)などに組み込まれていてもよい。 Note that the hardware configuration of the information processing system shown in FIG. 9 shows one configuration example, and the information processing system of the present embodiment is not limited to the configuration shown in FIG. 9 and is described in the present embodiment. Any configuration can be used as long as the module can be executed. For example, some modules may be configured by dedicated hardware (for example, ASIC), and some modules may be in an external system and connected via a communication line. A plurality of systems shown in FIG. 5 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (also called a multi-function copying machine, which has functions of a scanner, a printer, a copying machine, a fax machine, etc.).
前記実施の形態においては、文字認識対象の文字画像が含まれている画像として、帳票を示したが、帳票以外であってもよく、例えば、文書画像等であってもよい。
なお、文字認識モジュール130を複数有していてもよい。それぞれの文字認識モジュール130はそれぞれ異なる文字認識アルゴリズムあるいは文字認識辞書を有しているようにしてもよい。その場合、文字認識結果は多数決によって決定するようにしてもよい。
また、オペレータ入力モジュール140を複数有していてもよい。異なるオペレータによる入力が行われるようにしてもよい。同様に、入力結果は多数決によって決定するようにしてもよい。
また、領域分割・文字認識結果テーブル300内の確信度欄314に記憶されている確信度を用いて修正モジュール160が修正を行うようにしてもよい。つまり、確信度が類似している場合にだけ、修正を行うようにしてもよい。
In the above embodiment, a form is shown as an image including a character image to be recognized. However, the form may be other than a form, for example, a document image.
A plurality of
A plurality of
Further, the
なお、説明したプログラムについては、記録媒体に格納することも可能であり、また、そのプログラムを通信手段によって提供することもできる。その場合、例えば、上記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えることもできる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。
The described program can be stored in a recording medium, and the program can be provided by communication means. In that case, for example, the above-described program can also be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standards such as “DVD + R, DVD + RW, etc.”, compact discs (CDs), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), etc. MO), flexible disk (FD), magnetic tape, hard disk, read only memory (ROM), electrically erasable and rewritable read only memory (EEPROM), flash memory, random access memory (RAM), etc. It is.
The program or a part of the program can be recorded on the recording medium and stored or distributed. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It can be transmitted using a transmission medium such as a network or a combination of these, and can also be carried on a carrier wave.
Furthermore, the above program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media.
110…画像入力モジュール
120…領域分割モジュール
130…文字認識モジュール
140…オペレータ入力モジュール
150…比較モジュール
160…修正モジュール
170…学習DB
210…スキャンサーバー
220…クライアントPC
230…通信回線
300…領域分割・文字認識結果テーブル
400…オペレータ入力テーブル
500…学習テーブル
DESCRIPTION OF
210:
230 ...
Claims (9)
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
を具備することを特徴とする情報処理システム。 A comparison means for comparing a first input value obtained by an operator's operation on an equivalent item with a second input value obtained by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different from each other by the comparison by the comparison means, a correction means for correcting based on the contents stored in the storage means is provided. Information processing system.
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項1に記載の情報処理システム。 The storage means stores the first input value or the second input value when the first input value and the second input value are equal by the comparison by the comparison means,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing system according to claim 1, wherein the information is corrected by a corrected value corresponding to the second input value.
ことを特徴とする請求項1に記載の情報処理システム。 The information processing system according to claim 1, wherein the correction unit corrects based on past corrections in an equivalent document stored in the storage unit.
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項1に記載の情報処理システム。 The character recognition process also outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing system according to claim 1, wherein the correction unit corrects according to a certainty factor stored in the storage unit.
前記画像入力手段によって入力された画像を文字認識する文字認識処理手段と、
前記画像内の文字を操作者の操作によって入力する文字入力手段と、
同等項目に対する前記文字入力手段による第1の入力値と前記文字認識処理手段による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に基づいて修正する第1の修正手段と、
前記第1の修正手段による修正の結果を操作者の操作によって修正する第2の修正手段
を具備することを特徴とする情報処理システム。 An image input means for inputting an image;
Character recognition processing means for recognizing characters of the image input by the image input means;
A character input means for inputting characters in the image by an operation of an operator;
Comparing means for comparing the first input value by the character input means for the equivalent item with the second input value by the character recognition processing means;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison means, a first correction means for correcting based on the storage means;
An information processing system comprising: second correction means for correcting a result of correction by the first correction means by an operation of an operator.
同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
として機能させることを特徴とする情報処理プログラム。 Computer
A comparison means for comparing a first input value obtained by an operator's operation on an equivalent item with a second input value obtained by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison unit, the comparison unit functions as a correction unit that corrects the content based on the contents stored in the storage unit. Information processing program.
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項6に記載の情報処理プログラム。 The storage means stores the first input value or the second input value when the first input value and the second input value are equal by the comparison by the comparison means,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing program according to claim 6, wherein the information is corrected by a corrected value corresponding to the second input value.
ことを特徴とする請求項6に記載の情報処理プログラム。 The information processing program according to claim 6, wherein the correction unit corrects based on past corrections in an equivalent document stored in the storage unit.
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項6に記載の情報処理プログラム。 The character recognition process also outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing program according to claim 6, wherein the correction unit corrects the degree of certainty stored in the storage unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006291926A JP2008108153A (en) | 2006-10-27 | 2006-10-27 | Information processing system and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006291926A JP2008108153A (en) | 2006-10-27 | 2006-10-27 | Information processing system and information processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008108153A true JP2008108153A (en) | 2008-05-08 |
Family
ID=39441439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006291926A Pending JP2008108153A (en) | 2006-10-27 | 2006-10-27 | Information processing system and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008108153A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015204015A (en) * | 2014-04-15 | 2015-11-16 | コニカミノルタ株式会社 | Electronic document creation system, image forming apparatus, communication terminal, and program |
JP2021081932A (en) * | 2019-11-18 | 2021-05-27 | 富士通クライアントコンピューティング株式会社 | Information processing system |
-
2006
- 2006-10-27 JP JP2006291926A patent/JP2008108153A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015204015A (en) * | 2014-04-15 | 2015-11-16 | コニカミノルタ株式会社 | Electronic document creation system, image forming apparatus, communication terminal, and program |
JP2021081932A (en) * | 2019-11-18 | 2021-05-27 | 富士通クライアントコンピューティング株式会社 | Information processing system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6575132B2 (en) | Information processing apparatus and information processing program | |
JP6119952B2 (en) | Image processing apparatus and image processing program | |
US9613299B2 (en) | Method of identifying pattern training need during verification of recognized text | |
US11438467B2 (en) | Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters | |
US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP6221220B2 (en) | Image processing apparatus and image processing program | |
US11670067B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2009251872A (en) | Information processing device and information processing program | |
JP4780184B2 (en) | Image processing apparatus and image processing program | |
JP2008108153A (en) | Information processing system and information processing program | |
US10346251B2 (en) | Information processing apparatus, non-transitory computer readable medium, and information processing method | |
JP2008052439A (en) | Image processing system and image processing program | |
JP5481965B2 (en) | Information processing apparatus and information processing program | |
JP5440043B2 (en) | Image processing apparatus and image processing program | |
US20150043832A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP2008176764A (en) | Image processing system, image processing method and image processing program | |
JP6003677B2 (en) | Image processing apparatus and image processing program | |
JP2020052480A (en) | Information processing apparatus and program | |
JP4793429B2 (en) | Image processing apparatus and image processing program | |
JP6323009B2 (en) | Image processing apparatus and image processing program | |
JP5928714B2 (en) | Information processing apparatus and information processing program | |
JP6575158B2 (en) | Information processing apparatus and information processing program | |
JP2017102526A (en) | Information processing device and information processing program | |
JP2010039810A (en) | Image processor and image processing program |