JP2008108153A - Information processing system and information processing program - Google Patents

Information processing system and information processing program Download PDF

Info

Publication number
JP2008108153A
JP2008108153A JP2006291926A JP2006291926A JP2008108153A JP 2008108153 A JP2008108153 A JP 2008108153A JP 2006291926 A JP2006291926 A JP 2006291926A JP 2006291926 A JP2006291926 A JP 2006291926A JP 2008108153 A JP2008108153 A JP 2008108153A
Authority
JP
Japan
Prior art keywords
input
input value
character recognition
correction
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006291926A
Other languages
Japanese (ja)
Inventor
Michihiro Tamune
道弘 田宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006291926A priority Critical patent/JP2008108153A/en
Publication of JP2008108153A publication Critical patent/JP2008108153A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information processing system capable of enhancing conversion accuracy, operability for correction, and convenience, when converting an image of a paper document into a character code, using a character recognition result obtained by recognizing characters from the image of the input paper document, and using an input, from an operator, of characters in an equivalent paper document. <P>SOLUTION: A comparison means of this information processing system compares the first input value by an operation of the operator in an equivalent item with the second input value by character recognition processing, a storage means stores the first input value in the past, the second input value in the past in the equivalent item corresponding to the first input value, and a value after corrected in the equivalent item, while correlated each other, and a correction means executes correction based on the storage means, when the first input value is different from the second input value by the comparison by the comparison means. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、情報処理システムおよび情報処理プログラムに関する。   The present invention relates to an information processing system and an information processing program.

紙文書は、情報の伝達や記録を行うための媒体として優れたものであるが、これを保存するためには書庫などのスペースが必要になる。また、情報を紙文書に記録して保存している場合、後にその紙文書に記録された情報が必要になったときには、書庫などに収納されている多くの紙文書の中から目的とする情報が記録された紙文書を探し出さなければならない。   Paper documents are excellent media for transmitting and recording information, but a space such as a library is required to store them. In addition, when information is recorded and stored in a paper document, if the information recorded in the paper document is needed later, the target information can be selected from many paper documents stored in the archive. I have to find a paper document in which I was recorded.

そこで、紙文書を電子化して保存することが行われるようになってきている。具体的には、スキャナなどによって紙文書の各ページに対応する画像を読み取り、その画像に対応する画像データを紙文書毎にファイル化してハードディスクなどの記憶装置に記憶させることが行われるようになってきている。そして、文書画像データに対して、文字認識処理を行い、テキストコードとしての文書として取り扱えるようになっている。   Therefore, digitization and storage of paper documents has been performed. Specifically, an image corresponding to each page of a paper document is read by a scanner or the like, and image data corresponding to the image is filed for each paper document and stored in a storage device such as a hard disk. It is coming. Then, character recognition processing is performed on the document image data so that it can be handled as a document as a text code.

これに関連する技術として、例えば、特許文献1には、自動説明機や自動発表機などに利用され、光学文字読取装置で認識された文字等の認識結果を表示するための認識結果表示方式に関して、認識結果を出力しながら、認識結果中のキーワードに対応して画像を表示するので、図や表などを本文の流れに沿ってディスプレイで見ることができて、原稿の内容を把握し易くし、その内容を相手に効率よく伝えることができる技術が開示されている。   As a technique related to this, for example, Patent Document 1 relates to a recognition result display method for displaying a recognition result of a character or the like that is used in an automatic explanation machine or an automatic announcement machine and is recognized by an optical character reader. Because the image is displayed in correspondence with the keyword in the recognition result while outputting the recognition result, it is possible to see the figure and table on the display along the flow of the text, making it easy to grasp the contents of the document. , A technology that can efficiently convey the contents to the other party is disclosed.

また、帳票類等の紙文書に対しては、文字認識による誤認識を低下させることが特に望まれている。例えば、文字認識結果をオペレータが目視して、誤認識文字が発生するとその都度修正入力を行い、正しい結果に直すようにしている。これに関連する技術として、例えば、特許文献2には、多くの人が手書きした帳票を高い認識率でかつ高速に処理することを課題とし、OCRシステムのコンピュータは、標準的な文字パターンが文字コードに対応して格納された標準文字パターン辞書ファイルと、帳票の記入者を特定するキー情報にして、文字認識時に不読とされた文字イメージと補正した際の文字コードとを記憶した補正データ履歴保存ファイルと、キー情報に対応付けて、文字認識時に誤読とされた文字イメージと修正した際の文字コードとを記憶した修正データ履歴保存ファイルと、標準文字パターン辞書ファイルを参照してイメージデータの中から手書き文字を文字認識し、認識結果の不読あるいは誤読については、キー情報に基づき補正データ履歴保存ファイルあるいは修正データ履歴保存ファイルを参照して補正あるいは修正するイメージデータ文字認識部とを備える技術が開示されている。
特開平2−271470号公報 特開2005−266925号公報
For paper documents such as forms, it is particularly desired to reduce misrecognition due to character recognition. For example, the operator visually observes the character recognition result, and when a misrecognized character is generated, a correction input is made each time to correct the result. As a technique related to this, for example, Patent Document 2 has a problem of processing a form handwritten by many people at a high recognition rate and at a high speed. Correction data that stores the standard character pattern dictionary file stored corresponding to the code, the key information that identifies the person who entered the form, and the character image that was unread during character recognition and the character code that was corrected Refers to the history save file, the correction data history save file that stores the character image that was misread during character recognition and the corrected character code, and the image data by referring to the standard character pattern dictionary file. Recognize handwritten characters from the list, and if the recognition result is unread or misread, the correction data history save file is based on the key information. Rui technique and a image data character recognition unit for correcting or modifying with reference to correction data history storage file is disclosed.
JP-A-2-271470 JP 2005-266925 A

本発明は、このような背景技術の状況の中でなされたもので、紙文書の画像から文字コードへ変換するにあたって正確であり効率的な文字コード変換が困難であることを課題として、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な変換および修正の操作性、利便性を向上させるようにした情報処理システムおよび情報処理プログラムを提供することを目的としている。   The present invention has been made in the background of the background art as described above, and has been input as an object that accurate and efficient character code conversion is difficult when converting an image of a paper document into a character code. Using the character recognition result obtained by character recognition from the image of the paper document and the input result of the paper document by the operator, when converting the image of the paper document to the character code, the operability of accurate conversion and correction An object of the present invention is to provide an information processing system and an information processing program that improve convenience.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
本願請求項1に記載の発明は、同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
を具備することを特徴とする情報処理システムである。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention according to claim 1 of the present application is a comparing means for comparing a first input value by an operator's operation with respect to an equivalent item and a second input value by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different from each other by the comparison by the comparison means, a correction means for correcting based on the contents stored in the storage means is provided. Information processing system.

本願請求項2に記載の発明は、前記記憶手段は、前記比較手段による比較によって、第1の入力値と第2の入力値とが同等である場合は、第1の入力値または第2の入力値を記憶し、
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項1に記載の情報処理システムである。
In the invention according to claim 2 of the present application, when the first input value and the second input value are equal to each other by the comparison by the comparison means, the storage means Memorize the input value,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing system according to claim 1, wherein the information is corrected by a corrected value corresponding to the second input value.

本願請求項3に記載の発明は、前記修正手段は、前記記憶手段に記憶されている同等の文書内における過去の修正に基づいて修正する
ことを特徴とする請求項1に記載の情報処理システムである。
The invention according to claim 3 of the present application is characterized in that the correction means corrects based on past corrections in an equivalent document stored in the storage means. It is.

本願請求項4に記載の発明は、前記文字認識処理は、文字認識結果と該文字認識処理による確信度をも出力し、
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項1に記載の情報処理システムである。
In the invention according to claim 4, the character recognition process outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing system according to claim 1, wherein the correction unit corrects according to a certainty factor stored in the storage unit.

本願請求項5に記載の発明は、画像を入力する画像入力手段と、
前記画像入力手段によって入力された画像を文字認識する文字認識処理手段と、
前記画像内の文字を操作者の操作によって入力する文字入力手段と、
同等項目に対する前記文字入力手段による第1の入力値と前記文字認識処理手段による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に基づいて修正する第1の修正手段と、
前記第1の修正手段による修正の結果を操作者の操作によって修正する第2の修正手段
を具備することを特徴とする情報処理システムである。
The invention according to claim 5 is an image input means for inputting an image;
Character recognition processing means for recognizing characters of the image input by the image input means;
A character input means for inputting characters in the image by an operation of an operator;
Comparing means for comparing the first input value by the character input means for the equivalent item with the second input value by the character recognition processing means;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison means, a first correction means for correcting based on the storage means;
An information processing system comprising: second correction means for correcting a result of correction by the first correction means by an operation of an operator.

本願請求項6に記載の発明は、コンピュータを、
同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
として機能させることを特徴とする情報処理プログラムである。
The invention according to claim 6 of the present application provides a computer,
A comparison means for comparing a first input value obtained by an operator's operation on an equivalent item with a second input value obtained by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison unit, the comparison unit functions as a correction unit that corrects the content based on the contents stored in the storage unit. An information processing program.

本願請求項7に記載の発明は、前記記憶手段は、前記比較手段による比較によって、第1の入力値と第2の入力値とが同等である場合は、第1の入力値または第2の入力値を記憶し、
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項6に記載の情報処理プログラムである。
In the invention according to claim 7 of the present application, when the first input value and the second input value are equal to each other by the comparison by the comparison unit, the storage means Memorize the input value,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing program according to claim 6, wherein the information is corrected by a corrected value corresponding to the second input value.

本願請求項8に記載の発明は、前記修正手段は、前記記憶手段に記憶されている同等の文書内における過去の修正に基づいて修正する
ことを特徴とする請求項6に記載の情報処理プログラムである。
The invention according to claim 8 is the information processing program according to claim 6, wherein the correction means corrects based on past corrections in an equivalent document stored in the storage means. It is.

本願請求項9に記載の発明は、前記文字認識処理は、文字認識結果と該文字認識処理による確信度をも出力し、
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項6に記載の情報処理プログラムである。
In the invention according to claim 9 of the present application, the character recognition process also outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing program according to claim 6, wherein the correcting unit corrects according to a certainty factor stored in the storage unit.

請求項1の情報処理システムによれば、本構成を有していない場合に比較して、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な文字コード変換ができ、修正の操作性、利便性を向上させることができる。   According to the information processing system of claim 1, compared to the case where the present configuration is not provided, the character recognition result obtained by character recognition from the input paper document image and the input result of the paper document by the operator When converting the image of the paper document into a character code using the above, accurate character code conversion can be performed, and the operability and convenience of correction can be improved.

請求項2の情報処理システムによれば、本構成を有していない場合に比較して、より広範囲に過去の結果を利用することができ、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。   According to the information processing system of claim 2, it is possible to use past results in a wider range, more accurate character code conversion, and operability of correction as compared with the case where this configuration is not provided. Convenience can be further improved.

請求項3の情報処理システムによれば、本構成を有していない場合に比較して、同じ誤認識結果に対する修正を利用できる確率が高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。   According to the information processing system of claim 3, the probability that the correction for the same erroneous recognition result can be used is higher than in the case where the present configuration is not provided, and more accurate character code conversion can be performed. And convenience can be further improved.

請求項4の情報処理システムによれば、本構成を有していない場合に比較して、過去の文字認識結果のうち同じ誤認識結果に対する修正を利用できる確率がさらに高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。   According to the information processing system of claim 4, the probability that the correction for the same erroneous recognition result among the past character recognition results can be used is higher than in the case where the present configuration is not provided, and more accurate characters are obtained. Code conversion can be performed, and the operability and convenience of correction can be further improved.

請求項5の情報処理システムによれば、本構成を有していない場合に比較して、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な文字コード変換ができ、修正の操作性、利便性を向上させることができる。   According to the information processing system of claim 5, compared with the case where the present configuration is not provided, the character recognition result obtained by character recognition from the input paper document image and the input result of the paper document by the operator When converting the image of the paper document into a character code using the above, accurate character code conversion can be performed, and the operability and convenience of correction can be improved.

請求項6の情報処理プログラムによれば、本構成を有していない場合に比較して、入力した紙文書の画像から文字認識して得た文字認識結果と操作者によるその紙文書の入力結果とを用いて、その紙文書の画像から文字コードへ変換するにあたって、正確な文字コード変換ができ、修正の操作性、利便性を向上させることができる。   According to the information processing program of claim 6, compared with the case where the present configuration is not provided, the character recognition result obtained by character recognition from the input paper document image and the input result of the paper document by the operator When converting the image of the paper document into a character code using the above, accurate character code conversion can be performed, and the operability and convenience of correction can be improved.

請求項7の情報処理プログラムによれば、本構成を有していない場合に比較して、より広範囲に過去の結果を利用することができ、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。   According to the information processing program of the seventh aspect, compared with the case where the present configuration is not provided, past results can be used in a wider range, more accurate character code conversion can be performed, and correction operability can be achieved. Convenience can be further improved.

請求項8の情報処理プログラムによれば、本構成を有していない場合に比較して、同じ誤認識結果に対する修正を利用できる確率が高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。   According to the information processing program of claim 8, there is a higher probability that the correction for the same erroneous recognition result can be used compared to the case where the present configuration is not provided, and more accurate character code conversion can be performed. And convenience can be further improved.

請求項9の情報処理プログラムによれば、本構成を有していない場合に比較して、過去の文字認識結果のうち同じ誤認識結果に対する修正を利用できる確率がさらに高くなり、より正確な文字コード変換ができ、修正の操作性、利便性も一層向上させることができる。   According to the information processing program of claim 9, the probability that the correction for the same erroneous recognition result among the past character recognition results can be used is further increased as compared to the case where the present configuration is not provided, and more accurate characters are obtained. Code conversion can be performed, and the operability and convenience of correction can be further improved.

以下、図面に基づき本発明の好適な一実施の形態を説明する。
図1は、本発明の一実施の形態の概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはプログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、プログラム、システムおよび方法の説明をも兼ねている。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散または並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続を含む。
また、システムとは、複数のコンピュータ、ハードウェア、装置等がネットワーク等で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。
以下、文字認識対象の文字画像が含まれている画像として、帳票を主に例示して説明する。
なお、操作者の操作による入力値、文字認識処理による入力値は、文字コードであり、その文字コードには数字コード、文字列のコード列を含む。日本語の文字コードに限らず、英語、中国語、ハングル語の文字コードであってもよい。
Hereinafter, a preferred embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a conceptual module configuration diagram of an embodiment of the present invention.
The module generally refers to a component such as software or hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a program, a system, and a method. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Hereinafter, “connection” includes not only physical connection but also logical connection.
The system includes a configuration in which a plurality of computers, hardware, devices, and the like are connected via a network and the like, and includes a case where the system is realized by one computer, hardware, devices, and the like.
Hereinafter, a form will be mainly exemplified and described as an image including a character image to be recognized.
The input value by the operator's operation and the input value by the character recognition process are character codes, and the character code includes a numeric code and a character string code string. Not only Japanese character codes but also English, Chinese, and Korean character codes may be used.

本実施の形態は、図1に示すように、画像入力モジュール110、領域分割モジュール120、文字認識モジュール130、オペレータ入力モジュール140、比較モジュール150、修正モジュール160、学習DB(データベース)170を有している。
画像入力モジュール110は、図1に示すように、領域分割モジュール120と接続されており、帳票画像を入力する。より具体的には、スキャナによって紙文書である帳票を画像として入力する。
領域分割モジュール120は、図1に示すように、画像入力モジュール110、文字認識モジュール130と接続されており、画像入力モジュール110によって入力された画像からその画像を構成している領域を分割する。その領域分割の結果を、文字認識モジュール130へ渡す。
領域の分割は、画像から空白等で区切られた領域を分割することによって行われる。この領域分割の処理は、例えば、画像入力モジュール110による入力画像を二値化処理し、白画素の領域が一定の長さ(あるいは面積)以上あるところによって区切る。そのように区切ると、黒画素の領域(例えば、矩形)を分割することができる。さらに、その黒画素の領域の画像としての特徴(例えば、面積、縦または横の大きさ、形状、黒画素塊の存在位置等)を分割し、文字領域、図形領域、表領域、写真領域等の種別を判別することができる。もちろん他の既存の方法で領域を分割してもよい。
As shown in FIG. 1, the present embodiment includes an image input module 110, an area division module 120, a character recognition module 130, an operator input module 140, a comparison module 150, a correction module 160, and a learning DB (database) 170. ing.
As shown in FIG. 1, the image input module 110 is connected to the area dividing module 120 and inputs a form image. More specifically, a form that is a paper document is input as an image by a scanner.
As shown in FIG. 1, the area division module 120 is connected to the image input module 110 and the character recognition module 130, and divides the area constituting the image from the image input by the image input module 110. The result of the area division is passed to the character recognition module 130.
The division of the area is performed by dividing an area divided by a blank or the like from the image. In this region division processing, for example, an input image by the image input module 110 is binarized and divided by a white pixel region having a certain length (or area) or more. By dividing in this way, a black pixel region (for example, a rectangle) can be divided. Furthermore, the characteristics (for example, area, vertical or horizontal size, shape, location of black pixel block, etc.) of the black pixel area are divided into character areas, graphic areas, table areas, photo areas, etc. Can be determined. Of course, the area may be divided by other existing methods.

文字認識モジュール130は、図1に示すように、領域分割モジュール120、比較モジュール150と接続されており、領域分割モジュール120によって領域分割された画像のうち文字画像の領域に対して文字認識を行い、その認識結果を比較モジュール150へ渡す。文字認識モジュール130は、文字領域、表領域に対して文字認識処理を行うことによりテキストデータである文字列を生成する。ただし、この文字認識結果には、誤認識の結果等が含まれている可能性がある。また、文字認識結果についての確からしさを表す確信度を算出し、個々の認識結果に付加するようにしてもよい。なお、確信度とは、文字認識処理の結果として得られた文字コードの信頼度を示す値として算出される値であり、例えば、特許第2991779号公報に記載の文字の信頼度値を適用することができる。
また、画像入力モジュール110によって入力された帳票画像が文字のみである場合または予め文字が記載されている領域が設定されており、その設定に従って文字認識ができる等の場合には、領域分割モジュール120による処理を行わずに、直接、画像入力モジュール110によって入力された画像に対して文字認識処理を行うようにしてもよい。
As shown in FIG. 1, the character recognition module 130 is connected to the area division module 120 and the comparison module 150, and performs character recognition on the area of the character image among the images divided by the area division module 120. The recognition result is passed to the comparison module 150. The character recognition module 130 generates a character string that is text data by performing character recognition processing on the character area and the table area. However, this character recognition result may include a misrecognition result or the like. Further, a certainty factor representing the certainty of the character recognition result may be calculated and added to each recognition result. Note that the certainty factor is a value calculated as a value indicating the reliability of the character code obtained as a result of the character recognition process. For example, the reliability value of the character described in Japanese Patent No. 2991779 is applied. be able to.
In addition, when the form image input by the image input module 110 is only a character or when an area in which characters are described is set in advance and the character can be recognized according to the setting, the area dividing module 120 is used. The character recognition process may be performed directly on the image input by the image input module 110 without performing the process according to the above.

オペレータ入力モジュール140は、図1に示すように、比較モジュール150と接続されており、文字認識モジュール130によって文字認識が行われた帳票と同等の帳票の内容をオペレータ(操作者、利用者、または管理者等を含む)が例えばキーボードを用いて入力する。なお、同等には、少なくとも同一の場合を含む。
比較モジュール150は、図1に示すように、文字認識モジュール130、オペレータ入力モジュール140、修正モジュール160、学習DB170と接続されており、同等の帳票内の同等項目に対するオペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とを比較する。
つまり、文字認識モジュール130とオペレータ入力モジュール140によって、同等の帳票の同等項目の内容が、文字認識とオペレータによる入力という2種類の異なる方法によって入力されることになる。この場合、本来ならば、両者から入力された文字コードは一致するはずである。しかし、現在の文字認識技術では認識結果を100%保証することは困難であり、誤認識結果が混在することになる。一方、オペレータによる入力も誤入力ということがありえる。ただし、2種類の異なる方法によって入力しているので、両方とも間違えるという確率は低いといえる。したがって、片方が正しい文字コードである可能性が高い。また、両方とも間違えたとしても、同じように間違える確率は更に低いと考えられる。したがって、文字認識による誤認識またはオペレータによる誤入力があった場合、その2種類の方法によって入力された文字コードは一致しないはずである。
比較モジュール150は、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とを比較して、異なる場合は、間違いが発生したとして修正のきっかけとする。
As shown in FIG. 1, the operator input module 140 is connected to the comparison module 150, and the contents of the form equivalent to the form that has been recognized by the character recognition module 130 are displayed as an operator (operator, user, or For example, using a keyboard. The equivalent includes at least the same case.
As shown in FIG. 1, the comparison module 150 is connected to the character recognition module 130, the operator input module 140, the correction module 160, and the learning DB 170, and the input value by the operator input module 140 for the equivalent item in the equivalent form The input value by the character recognition module 130 is compared.
That is, the contents of the equivalent items of the equivalent form are input by the character recognition module 130 and the operator input module 140 by two different methods of character recognition and input by the operator. In this case, originally, the character codes input from both should match. However, with the current character recognition technology, it is difficult to guarantee 100% of the recognition result, and erroneous recognition results are mixed. On the other hand, the input by the operator can also be an erroneous input. However, since the input is performed by two different methods, it can be said that there is a low probability that both are wrong. Therefore, there is a high possibility that one of them is a correct character code. Moreover, even if both are mistaken, it is thought that the probability of making a mistake similarly is still lower. Therefore, if there is an erroneous recognition due to character recognition or an erroneous input by an operator, the character codes input by the two types of methods should not match.
The comparison module 150 compares the input value from the operator input module 140 with the input value from the character recognition module 130, and if they are different, it determines that an error has occurred and triggers correction.

修正モジュール160は、図1に示すように、比較モジュール150、学習DB170と接続されており、比較モジュール150による比較によって、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とが異なる場合は、その入力値を学習DB170に記憶されている内容に基づいて修正する。つまり、オペレータ入力モジュール140による誤入力、文字認識モジュール130による誤認識は、同等文字に対して繰り返して行われることが多い。修正モジュール160は、過去の修正結果を参照することによって、修正する。
また、修正モジュール160は、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とが異なる場合は、その文字認識モジュール130による入力値に基づいて学習DB170に記憶されている文字認識モジュール130による入力値を検索し、検索された文字認識モジュール130による入力値に対応する修正後の値によって修正するようにしてもよい。つまり、文字認識モジュール130による文字認識は再現性がよいが、オペレータ入力モジュール140による入力はオペレータによるので一定しないという傾向がある。そこで、過去の修正結果を検索するにあたって、文字認識モジュール130による文字認識結果を優先して検索するようにしてもよい。
また、修正モジュール160は、直前の結果を最優先に利用するために、学習DB170に記憶されている同等の帳票内における過去の修正に基づいて修正するようにしてもよい。
As shown in FIG. 1, the correction module 160 is connected to the comparison module 150 and the learning DB 170, and the input value from the operator input module 140 and the input value from the character recognition module 130 are different due to the comparison by the comparison module 150. Corrects the input value based on the contents stored in the learning DB 170. That is, erroneous input by the operator input module 140 and erroneous recognition by the character recognition module 130 are often repeated for equivalent characters. The correction module 160 makes corrections by referring to past correction results.
In addition, when the input value from the operator input module 140 and the input value from the character recognition module 130 are different, the correction module 160 has a character recognition module 130 stored in the learning DB 170 based on the input value from the character recognition module 130. It is also possible to search for the input value by and to correct the value after correction corresponding to the input value by the searched character recognition module 130. That is, the character recognition by the character recognition module 130 has good reproducibility, but the input by the operator input module 140 is not constant because it is performed by the operator. Therefore, when searching for past correction results, the character recognition result by the character recognition module 130 may be preferentially searched.
Further, the correction module 160 may make corrections based on past corrections in an equivalent form stored in the learning DB 170 in order to use the immediately preceding result with the highest priority.

また、修正モジュール160は、前述した修正の後に、オペレータによって最終的な確認、第2の修正が行われるようにしてもよい。つまり、前記修正モジュール160による修正結果を表示し、オペレータの修正に関する操作を受け付け、該操作に応じて修正するようにしてもよい。その場合、オペレータによる修正結果を、学習DB170に記憶する。
学習DB170は、図1に示すように、比較モジュール150、修正モジュール160と接続されており、過去のオペレータ入力モジュール140による入力値、そのオペレータ入力モジュール140による入力値に対応する同等項目に対する過去の文字認識モジュール130による入力値、および同等項目に対する修正モジュール160による修正後の値を対応づけて記憶するデータベースである。さらに、学習DB170は、比較モジュール150による比較によって、オペレータ入力モジュール140による入力値と文字認識モジュール130による入力値とが同等である場合は、オペレータ入力モジュール140による入力値または文字認識モジュール130による入力値を記憶するようにしてもよい。つまり、文字認識モジュール130による文字認識は再現性がよいので、文字認識結果とオペレータ入力モジュール140による入力結果が一致した場合も有効に利用できる学習データとなる。オペレータ入力モジュール140では誤入力となった場合に、過去に同じ文字に対しては誤入力にならなかった場合(文字認識モジュール130の文字認識結果とオペレータ入力モジュール140による入力結果が一致した場合)があれば、その場合を利用して修正しようとするものである。なお、学習DB170はデータベースとして実現できるほか、記憶手段として機能するものであればよい。
Further, the correction module 160 may be configured so that the operator performs final confirmation and second correction after the above-described correction. That is, the correction result by the correction module 160 may be displayed, an operation related to the correction by the operator may be received, and the correction may be performed according to the operation. In that case, the correction result by the operator is stored in the learning DB 170.
As shown in FIG. 1, the learning DB 170 is connected to the comparison module 150 and the correction module 160, and the past values for the equivalent values corresponding to the input values of the past operator input module 140 and the input values of the operator input module 140 are stored. It is a database that stores the input value by the character recognition module 130 and the value after correction by the correction module 160 for equivalent items in association with each other. Further, the learning DB 170 determines that the input value by the operator input module 140 and the input value by the character recognition module 130 are the same as the input value by the operator input module 140 or the input by the character recognition module 130 when the input value by the operator input module 140 is equivalent to the input value by the character recognition module 130. The value may be stored. That is, since the character recognition by the character recognition module 130 has good reproducibility, even when the character recognition result matches the input result by the operator input module 140, the learning data can be used effectively. When an erroneous input is made in the operator input module 140, when the same character has not been erroneously entered in the past (when the character recognition result of the character recognition module 130 matches the input result of the operator input module 140) If there is, try to correct it using that case. Note that the learning DB 170 may be realized as a database and may function as a storage unit.

図2を用いて、本実施の形態を実現する場合のシステム例全体の構成を説明する。
全体の構成は、スキャンサーバー210とクライアントPC220とが通信回線230によって接続されている。スキャンサーバー210は、画像入力装置(スキャナ)の機能を有しており、通信回線230を介して、他の装置からの指示を受けて画像入力装置を動作させ、または画像入力装置によって入力された画像データを他の装置へ送信することができる機能を少なくとも有しているものである。
例えば、スキャンサーバー210内に図1で示した本実施の形態の構成が内蔵されており、クライアントPC220からオペレータの入力が行われ、その入力結果が通信回線230を介してスキャンサーバー210内のオペレータ入力モジュール140に入力されるようにしてもよい。また、スキャンサーバー210内には画像入力モジュール110、領域分割モジュール120、文字認識モジュール130が内蔵されており、クライアントPC220内にはオペレータ入力モジュール140、比較モジュール150、修正モジュール160、学習DB170が内蔵されていてもよい。
なお、スキャンサーバー210、クライアントPC220、通信回線230はそれぞれ複数あってもよい。
With reference to FIG. 2, the configuration of the entire system example in the case of realizing the present embodiment will be described.
As a whole configuration, the scan server 210 and the client PC 220 are connected by a communication line 230. The scan server 210 has a function of an image input device (scanner), receives an instruction from another device via the communication line 230, operates the image input device, or is input by the image input device. It has at least a function capable of transmitting image data to another device.
For example, the configuration of the present embodiment shown in FIG. 1 is built in the scan server 210, and an operator inputs from the client PC 220, and the input result is an operator in the scan server 210 via the communication line 230. It may be input to the input module 140. The scan server 210 includes an image input module 110, an area division module 120, and a character recognition module 130. The client PC 220 includes an operator input module 140, a comparison module 150, a correction module 160, and a learning DB 170. May be.
There may be a plurality of scan servers 210, client PCs 220, and communication lines 230.

図3を用いて、領域分割モジュール120、文字認識モジュール130による処理結果を取り扱うためのデータ構造の例を説明する。
領域分割・文字認識結果テーブル300は、図3に示すように、ID欄302、左上座標欄304、右下座標欄306、種別欄308、タイトル欄310、属性値欄312、確信度欄314を有している。ID欄302から種別欄308までは、領域分割モジュール120による処理結果を記憶し、タイトル欄310、属性値欄312、確信度欄314は、文字認識モジュール130による処理結果を記憶する。
An example of a data structure for handling the processing results obtained by the area dividing module 120 and the character recognition module 130 will be described with reference to FIG.
As shown in FIG. 3, the area division / character recognition result table 300 includes an ID column 302, an upper left coordinate column 304, a lower right coordinate column 306, a type column 308, a title column 310, an attribute value column 312, and a certainty factor column 314. Have. The ID column 302 to the type column 308 store the processing results by the area dividing module 120, and the title column 310, the attribute value column 312, and the certainty factor column 314 store the processing results by the character recognition module 130.

ID欄302には、その帳票画像内で抽出された領域を一意に識別できる符号(識別子)が記憶される。この領域は帳票内の項目に該当する。
左上座標欄304、右下座標欄306には、領域分割モジュール120によって分割された領域の帳票画像内における位置が記憶される。例えば、分割領域が矩形の場合、画像の縦をX軸、横をY軸とした平面空間とし、その画像内における抽出領域の左上角の座標を左上座標欄304に記憶し、右下角の座標を右下座標欄306に記憶することによって、画像内における抽出領域の位置を特定できる。
種別欄308には、その分割画像の種別(文字領域、図形領域、表領域、写真領域等)が記憶される。文字領域、表領域が、文字認識モジュール130以降の処理対象となる。
The ID column 302 stores a code (identifier) that can uniquely identify an area extracted in the form image. This area corresponds to an item in the form.
In the upper left coordinate column 304 and the lower right coordinate column 306, the positions of the areas divided by the area dividing module 120 in the form image are stored. For example, when the divided area is a rectangle, the image has a plane space with the vertical axis as the X axis and the horizontal axis as the Y axis, the upper left corner coordinates of the extraction area in the image are stored in the upper left coordinate column 304, and the lower right corner coordinates Is stored in the lower right coordinate field 306, the position of the extraction region in the image can be specified.
The type field 308 stores the type of the divided image (character area, graphic area, table area, photo area, etc.). The character area and the table area are to be processed after the character recognition module 130.

タイトル欄310には、左上座標欄304と右下座標欄306によって特定できる領域内に対する文字認識モジュール130による文字認識結果の中から項目のタイトル(題、題名、表題、見出し等、またサブタイトルを含む)として抽出された文字列が記憶される。例えば、タイトルとして「支払先」、「勘定科目」、「摘要」、「金額」、「合計」等がある。また、処理としては、例えば、予め定められた帳票の項目のタイトルを記憶しているテーブル(表、記憶手段)を用意し、そのテーブル内のタイトルと文字認識モジュール130による文字認識結果とのマッチングをとるようにしてもよい。マッチングの際に、数文字(1文字を含む)異なる場合は、異なる文字が文字の形態として類似しているものか否かを判断してタイトルとして認めるようにしてもよい。   The title column 310 includes item titles (title, title, title, heading, etc., and subtitles) from among the character recognition results by the character recognition module 130 for the area specified by the upper left coordinate column 304 and the lower right coordinate column 306. ) Is extracted as a character string. For example, titles include “payee”, “account item”, “summary”, “amount”, “total”, and the like. As processing, for example, a table (table, storage means) that stores titles of predetermined form items is prepared, and matching of the titles in the table and the character recognition result by the character recognition module 130 is performed. You may make it take. At the time of matching, when several characters (including one character) are different, it may be recognized as a title by determining whether or not the different characters are similar in character form.

属性値欄312には、タイトル欄310に記憶されているタイトルに対応する属性値が記憶される。例えば、タイトルとして「支払先」に対応する具体的な会社名等である。また、処理としては、例えば、予め定められた帳票の項目のタイトルを記憶しているテーブルを用意し、そのテーブル内のタイトルと文字認識モジュール130による文字認識結果とマッチングしない文字列を属性値としてもよい。
確信度欄314には、文字認識モジュール130による文字認識処理の結果として得られた文字コードの確信度(信頼度)を示す値が記憶される。例えば、確信度を求める方法として、特許第2991779号公報に記載の方法を適用することができる。
The attribute value column 312 stores an attribute value corresponding to the title stored in the title column 310. For example, a specific company name corresponding to “payee” as a title. In addition, as processing, for example, a table storing titles of predetermined form items is prepared, and a character string that does not match a title in the table and a character recognition result by the character recognition module 130 is used as an attribute value. Also good.
In the certainty factor column 314, a value indicating the certainty factor (reliability) of the character code obtained as a result of the character recognition processing by the character recognition module 130 is stored. For example, as a method for obtaining the certainty factor, a method described in Japanese Patent No. 2991779 can be applied.

図4を用いて、オペレータ入力モジュール140によるオペレータによる入力結果を取り扱うためのデータ構造の例を説明する。
オペレータ入力テーブル400は、図4に示すように、ID欄402、左上座標範囲欄404、右下座標範囲欄406、タイトル欄408、属性値欄410を有している。ID欄402からタイトル欄408までは、予め帳票に応じて設定されている。オペレータ入力モジュール140による入力文字列が属性値欄410に記憶される。
ID欄402には、その帳票内の項目を一意に識別できる符号(識別子)が記憶される。
左上座標範囲欄404、右下座標範囲欄406には、項目のその帳票内における位置を特定できる座標が記憶される。ここでの座標系は、領域分割・文字認識結果テーブル300の左上座標欄304、右下座標欄306と同じ座標系を用いる。ただし、座標は範囲を持った値であり、これは領域分割・文字認識結果テーブル300の左上座標欄304、右下座標欄306とマッチングをとるためである。すなわち、左上座標範囲欄404、右下座標範囲欄406内に領域分割・文字認識結果テーブル300の左上座標欄304、右下座標欄306の座標が含まれていれば、同等の項目であると判断する。
タイトル欄408には、その帳票内の項目のタイトルが記憶される。
属性値欄410には、オペレータによってキーボードを用いて入力された属性値が記憶される。
An example of a data structure for handling an input result by an operator by the operator input module 140 will be described with reference to FIG.
As shown in FIG. 4, the operator input table 400 has an ID column 402, an upper left coordinate range column 404, a lower right coordinate range column 406, a title column 408, and an attribute value column 410. ID column 402 to title column 408 are set in advance according to the form. The character string input by the operator input module 140 is stored in the attribute value column 410.
The ID column 402 stores a code (identifier) that can uniquely identify an item in the form.
In the upper left coordinate range column 404 and the lower right coordinate range column 406, coordinates that can specify the position of the item in the form are stored. The coordinate system here uses the same coordinate system as the upper left coordinate column 304 and the lower right coordinate column 306 of the region division / character recognition result table 300. However, the coordinates are values having a range, and this is for matching with the upper left coordinate column 304 and the lower right coordinate column 306 of the region division / character recognition result table 300. That is, if the coordinates of the upper left coordinate field 304 and the lower right coordinate field 306 of the region division / character recognition result table 300 are included in the upper left coordinate range field 404 and the lower right coordinate range field 406, they are equivalent items. to decide.
The title column 408 stores the titles of items in the form.
The attribute value column 410 stores attribute values input by the operator using the keyboard.

図5を用いて、学習DB170に記憶され、比較モジュール150、修正モジュール160による処理結果を取り扱うためのデータ構造の例を説明する。
学習テーブル500は、図5に示すように、ID欄502、タイトル欄504、修正前文字認識属性値欄506、機器ID欄508、修正前入力属性値欄510、オペレータID欄512、修正後属性値欄514、修正者ID欄516を有している。
ID欄502には、修正が行われた文字列を一意に識別できる符号(識別子)が記憶される。
タイトル欄504には、修正が行われた項目のタイトルが記憶される。
修正前文字認識属性値欄506には、文字認識モジュール130によって文字認識されたその項目内の文字列が記憶される。
機器ID欄508には、文字認識モジュール130を一意に識別できる識別子が記憶される。例えば、文字認識モジュール130による処理を行う文字認識装置、またはスキャナ等の識別子が記憶される。
修正前入力属性値欄510には、オペレータ入力モジュール140によって入力された、その項目内の属性値が記憶される。
オペレータID欄512には、オペレータ入力モジュール140において入力を行ったオペレータを一意に識別できる識別子が記憶される。
修正後属性値欄514には、修正モジュール160によって修正された属性値が記憶される。
修正者ID欄516には、修正モジュール160によって修正された場合に、オペレータによる修正であればオペレータIDが記憶され、オペレータの介入なく修正された場合は修正モジュール160を一意に識別できる識別子が記憶される。
An example of a data structure that is stored in the learning DB 170 and handles processing results by the comparison module 150 and the correction module 160 will be described with reference to FIG.
As shown in FIG. 5, the learning table 500 includes an ID column 502, a title column 504, a pre-correction character recognition attribute value column 506, a device ID column 508, a pre-correction input attribute value column 510, an operator ID column 512, a post-correction attribute. A value column 514 and a corrector ID column 516 are provided.
The ID column 502 stores a code (identifier) that can uniquely identify the corrected character string.
The title column 504 stores the title of the item that has been corrected.
In the pre-correction character recognition attribute value field 506, the character string in the item recognized by the character recognition module 130 is stored.
The device ID column 508 stores an identifier that can uniquely identify the character recognition module 130. For example, an identifier such as a character recognition device that performs processing by the character recognition module 130 or a scanner is stored.
The pre-correction input attribute value column 510 stores the attribute value in the item input by the operator input module 140.
The operator ID column 512 stores an identifier that can uniquely identify the operator who has input through the operator input module 140.
The corrected attribute value column 514 stores the attribute value corrected by the correction module 160.
In the corrector ID column 516, when the correction is made by the correction module 160, the operator ID is stored if the correction is made by the operator. When the correction is made without the intervention of the operator, an identifier for uniquely identifying the correction module 160 is stored. Is done.

次に作用・働き(動作)を説明する。
図6を用いて、画像入力モジュール110、領域分割モジュール120、文字認識モジュール130による処理例を説明する。
ステップS602では、画像入力モジュール110が対象とする紙文書である帳票を画像データとして読み取る。具体的には、スキャナで読み込んでもよいし、FAXのように通信回線を介して入力してもよいし、帳票画像を蓄積したデータベースから読み込むようにしてもよい。
ステップS604では、領域分割モジュール120がステップS602で入力した画像に対して領域分割を行う。これによって、領域分割・文字認識結果テーブル300のID欄302から種別欄308までに値が記憶される。
ステップS606では、文字認識モジュール130がステップS604で分割した領域のうち、文字領域、表領域に対して文字認識処理を行う。
ステップS608では、文字認識モジュール130がステップS606で文字認識した結果を、領域分割・文字認識結果テーブル300のタイトル欄310から確信度欄314までに値として記憶する。
一方、オペレータ入力モジュール140が、オペレータによって画像入力モジュール110によって入力された帳票の内容である各項目の属性値を入力し、オペレータ入力テーブル400の属性値欄410に記憶する。
Next, the function and operation (operation) will be described.
A processing example by the image input module 110, the region division module 120, and the character recognition module 130 will be described with reference to FIG.
In step S602, a form, which is a paper document targeted by the image input module 110, is read as image data. Specifically, it may be read by a scanner, may be input via a communication line such as FAX, or may be read from a database storing form images.
In step S604, the region division module 120 performs region division on the image input in step S602. As a result, values are stored in the ID column 302 to the type column 308 of the area division / character recognition result table 300.
In step S606, the character recognition module 130 performs character recognition processing on the character area and the table area among the areas divided in step S604.
In step S608, the result of character recognition performed by the character recognition module 130 in step S606 is stored as a value in the title column 310 to the certainty factor column 314 of the area division / character recognition result table 300.
On the other hand, the operator input module 140 inputs the attribute value of each item, which is the contents of the form input by the image input module 110 by the operator, and stores it in the attribute value column 410 of the operator input table 400.

図7、図8を用いて、比較モジュール150、修正モジュール160による処理例を説明する。
ステップS702では、比較モジュール150が文字認識モジュール130による文字認識結果を入力する。つまり、文字認識モジュール130が領域分割・文字認識結果テーブル300を比較モジュール150に渡す。
ステップS704では、比較モジュール150がオペレータ入力モジュール140による入力結果を入力する。つまり、オペレータ入力モジュール140がオペレータ入力テーブル400を比較モジュール150に渡す。
ステップS706では、比較モジュール150が、同等の項目に対する属性値が一致するか否かを判断する。一致している場合(修正が不要な場合)はステップS716へ進み、そうでない場合(修正が必要な場合)はステップS708へ進む。
ステップS708では、修正モジュール160が、ステップS702とステップS704で入力した対応する属性値を画面に表示する。つまり、図8に示すように、文字認識結果欄802にステップS702での文字認識結果を表示し、文字認識結果欄802と対に並んで表示されているオペレータ入力結果欄804にステップS704でのオペレータによる入力値を表示する。例えば、文字認識結果が「連結書」であり、オペレータによる入力値が「連絡書」である場合、文字認識結果欄802には「連結書」を表示し、オペレータ入力結果欄804には「連絡書」を表示する。ただし、このステップS708の時点では、結果欄810には何も表示しない。
A processing example by the comparison module 150 and the correction module 160 will be described with reference to FIGS.
In step S <b> 702, the comparison module 150 inputs a character recognition result by the character recognition module 130. That is, the character recognition module 130 passes the area division / character recognition result table 300 to the comparison module 150.
In step S <b> 704, the comparison module 150 inputs the input result from the operator input module 140. That is, the operator input module 140 passes the operator input table 400 to the comparison module 150.
In step S706, the comparison module 150 determines whether or not the attribute values for the equivalent items match. If they match (if correction is not necessary), the process proceeds to step S716. If not (correction is required), the process proceeds to step S708.
In step S708, the correction module 160 displays the corresponding attribute value input in steps S702 and S704 on the screen. That is, as shown in FIG. 8, the character recognition result in step S702 is displayed in the character recognition result column 802, and the operator input result column 804 displayed side by side with the character recognition result column 802 is displayed in step S704. Displays the input value by the operator. For example, when the character recognition result is “link” and the input value by the operator is “contact”, “link” is displayed in the character recognition result column 802, and “contact” is displayed in the operator input result column 804. ”Is displayed. However, nothing is displayed in the result column 810 at the time of step S708.

ステップS710では、比較モジュール150は学習DB170を用いた修正値を結果欄810に表示する。ここで、学習DB170に記憶されている同等の帳票内における過去の修正履歴だけに基づいて修正値を表示するようにしてもよい。つまり、1枚の帳票内の誤認識、誤入力は同じことが繰り返されている可能性が高く、別の帳票で行った修正は修正の参考にならない場合があるからである。例えば、その帳票内において「連結書」が「連絡書」と修正されており、それが学習DB170に記憶されている場合、前述の例では、文字認識結果の「連結書」を採用せずに、学習DB170に記憶されている修正値である「連絡書」を採用して、結果欄810に表示してもよい。
ステップS712では、オペレータは紙文書である帳票を見ながら、結果欄810に表示されている属性値が正しいか否かを判断し、正しい場合は登録ボタン812を押下し、修正が必要な場合は、結果欄810に表示されている属性値をキーボードを用いて修正する。または、修正の際に、文字認識結果欄802、オペレータ入力結果欄804に表示されている属性値を用いたいのであれば、選択ボタン806または選択ボタン808を押下して、いずれかの属性値を選択することができる。例えば、前述の例では、ステップS710で、既に、結果欄810に正しい属性値である「連絡書」が表示されているので、オペレータによる登録ボタン812の押下によって、次のステップS714へ進む。また、過去に「連結書」を「連絡書」と修正されたことが無く、学習DB170に同等のパターンが無い場合は、ステップS710での学習DB170を用いた修正が行われないので、オペレータによって選択ボタン808が押下され、オペレータによる入力値である「連絡書」が正しい属性値として採用され、結果欄810にその属性値である「連絡書」を表示し、オペレータによる登録ボタン812の押下によって、次のステップS714へ進む。
ステップS714では、修正結果を学習DB170に登録する。つまり、学習テーブル500内に1行追加される。例えば、前述の例では、修正前文字認識属性値欄506には「連結書」、修正前入力属性値欄510には「連絡書」、修正後属性値欄514には「連絡書」がそれぞれ記憶される。
ステップS716では、帳票内の全てのデータに対してこの確認、修正作業が終了したか否かを判断する。終了した場合はステップS718(終了)へ進み、そうでない場合はステップS702へ戻り、次の項目に対してステップS702以降の処理を繰り返す。
In step S <b> 710, the comparison module 150 displays a correction value using the learning DB 170 in the result column 810. Here, the correction value may be displayed based only on the past correction history in the equivalent form stored in the learning DB 170. That is, there is a high possibility that the same error recognition and erroneous input in one form are repeated, and corrections made in another form may not be a reference for correction. For example, if the “link” is corrected as “contact” in the form and stored in the learning DB 170, the “link” in the character recognition result is not adopted in the above example. The “contact” that is the correction value stored in the learning DB 170 may be adopted and displayed in the result column 810.
In step S712, the operator determines whether or not the attribute value displayed in the result column 810 is correct while looking at the form that is a paper document. If the attribute value is correct, the operator depresses the registration button 812. The attribute value displayed in the result column 810 is corrected using the keyboard. Alternatively, if it is desired to use the attribute values displayed in the character recognition result field 802 and the operator input result field 804 at the time of correction, the selection button 806 or the selection button 808 is pressed to change any attribute value. You can choose. For example, in the above-described example, because “correction form” that is the correct attribute value is already displayed in the result column 810 in step S710, the operator proceeds to the next step S714 when the registration button 812 is pressed. Also, if the “link” has not been corrected as “contact” in the past and there is no equivalent pattern in the learning DB 170, the correction using the learning DB 170 in step S710 is not performed. When the selection button 808 is pressed, the “contact form” that is an input value by the operator is adopted as the correct attribute value, the “contact form” that is the attribute value is displayed in the result column 810, and the registration button 812 is pressed by the operator. The process proceeds to the next step S714.
In step S714, the correction result is registered in the learning DB 170. That is, one line is added to the learning table 500. For example, in the above-mentioned example, “concatenation” is displayed in the character recognition attribute value field 506 before correction, “contact” is input in the input attribute value field 510 before correction, and “contact” is displayed in the attribute value field 514 after correction. Remembered.
In step S716, it is determined whether or not the confirmation and correction work has been completed for all data in the form. If completed, the process proceeds to step S718 (end). If not, the process returns to step S702, and the processes after step S702 are repeated for the next item.

また、図7に示したフローチャートでは、ステップS706で一致した場合にステップS716へ進んでいたが、これをステップS714へ進むようにしてもよい。つまり、文字認識モジュール130による文字認識結果とオペレータ入力モジュール140による入力結果が同等であっても、学習DB170に登録するようにしてもよい。
そして、ステップS710では、文字認識モジュール130による入力結果を検索用のキーワードとして、学習DB170に記憶されている学習テーブル500のオペレータID欄512を検索し、検索されたオペレータID欄512内の属性値に対応する修正後属性値欄514の値によって修正するようにしてもよい。
Further, in the flowchart shown in FIG. 7, the process proceeds to step S716 when they coincide with each other in step S706. However, the process may proceed to step S714. That is, even if the character recognition result by the character recognition module 130 and the input result by the operator input module 140 are equivalent, they may be registered in the learning DB 170.
In step S710, the operator ID column 512 of the learning table 500 stored in the learning DB 170 is searched using the input result from the character recognition module 130 as a search keyword, and the attribute value in the searched operator ID column 512 is searched. You may make it correct with the value of the attribute value column 514 after correction corresponding to.

図9を参照して、本実施の形態のハードウェア構成例について説明する。図9に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部917と、プリンタなどのデータ出力部918を備えたハードウェア構成例を示している。   With reference to FIG. 9, a hardware configuration example of the present embodiment will be described. The configuration illustrated in FIG. 9 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a data reading unit 917 such as a scanner and a data output unit 918 such as a printer.

CPU(Central Processing Unit)901は、上述の本実施の形態において説明した各種のモジュール、すなわち、領域分割モジュール120、文字認識モジュール130、比較モジュール150、修正モジュール160等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムに従った処理を実行する制御部である。   A CPU (Central Processing Unit) 901 describes execution sequences of various modules described in the above-described embodiment, that is, the area division module 120, the character recognition module 130, the comparison module 150, the correction module 160, and the like. The control unit executes processing according to the computer program.

ROM(Read Only Memory)902は、CPU901が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス904により相互に接続されている。   A ROM (Read Only Memory) 902 stores programs used by the CPU 901, operation parameters, and the like. A RAM (Random Access Memory) 903 stores programs used in the execution of the CPU 901, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 904 including a CPU bus.

ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス906に接続されている。   The host bus 904 is connected to an external bus 906 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 905.

キーボード908、マウス等のポインティングデバイス909は、オペレータにより操作される入力デバイスである。ディスプレイ910は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。   A keyboard 908 and a pointing device 909 such as a mouse are input devices operated by an operator. The display 910 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text and image information.

HDD(Hard Disk Drive)911は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU901によって実行するプログラムや情報を記録または再生させる。ハードディスクは、入力された帳票画像や学習テーブル500等のデータなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 911 incorporates a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 901 and information. The hard disk stores input form images, data such as a learning table 500, and the like. Further, various computer programs such as various other data processing programs are stored.

ドライブ912は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体913に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース907、外部バス906、ブリッジ905、およびホストバス904を介して接続されているRAM903に供給する。リムーバブル記録媒体913も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 912 reads out data or a program recorded in a removable recording medium 913 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 907 and the external bus 906. , The bridge 905, and the RAM 903 connected via the host bus 904. The removable recording medium 913 can also be used as a data recording area similar to a hard disk.

接続ポート914は、外部接続機器915を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート914は、インタフェース907、および外部バス906、ブリッジ905、ホストバス904等を介してCPU901等に接続されている。通信部916は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部917は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部918は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 914 is a port for connecting the external connection device 915, and has a connection unit such as USB, IEEE1394. The connection port 914 is connected to the CPU 901 and the like via the interface 907, the external bus 906, the bridge 905, the host bus 904, and the like. The communication unit 916 is connected to a network and executes data communication processing with the outside. The data reading unit 917 is a scanner, for example, and executes document reading processing. The data output unit 918 is, for example, a printer, and executes document data output processing.

なお、図9に示す情報処理システムのハードウェア構成は、1つの構成例を示すものであり、本実施の形態の情報処理システムは、図9に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えばASIC等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図9に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(多機能複写機とも呼ばれ、スキャナ、プリンタ、複写機、ファックス等の機能を有している)などに組み込まれていてもよい。   Note that the hardware configuration of the information processing system shown in FIG. 9 shows one configuration example, and the information processing system of the present embodiment is not limited to the configuration shown in FIG. 9 and is described in the present embodiment. Any configuration can be used as long as the module can be executed. For example, some modules may be configured by dedicated hardware (for example, ASIC), and some modules may be in an external system and connected via a communication line. A plurality of systems shown in FIG. 5 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (also called a multi-function copying machine, which has functions of a scanner, a printer, a copying machine, a fax machine, etc.).

前記実施の形態においては、文字認識対象の文字画像が含まれている画像として、帳票を示したが、帳票以外であってもよく、例えば、文書画像等であってもよい。
なお、文字認識モジュール130を複数有していてもよい。それぞれの文字認識モジュール130はそれぞれ異なる文字認識アルゴリズムあるいは文字認識辞書を有しているようにしてもよい。その場合、文字認識結果は多数決によって決定するようにしてもよい。
また、オペレータ入力モジュール140を複数有していてもよい。異なるオペレータによる入力が行われるようにしてもよい。同様に、入力結果は多数決によって決定するようにしてもよい。
また、領域分割・文字認識結果テーブル300内の確信度欄314に記憶されている確信度を用いて修正モジュール160が修正を行うようにしてもよい。つまり、確信度が類似している場合にだけ、修正を行うようにしてもよい。
In the above embodiment, a form is shown as an image including a character image to be recognized. However, the form may be other than a form, for example, a document image.
A plurality of character recognition modules 130 may be provided. Each character recognition module 130 may have a different character recognition algorithm or character recognition dictionary. In that case, the character recognition result may be determined by majority vote.
A plurality of operator input modules 140 may be provided. An input by a different operator may be performed. Similarly, the input result may be determined by majority vote.
Further, the correction module 160 may perform correction using the certainty factor stored in the certainty factor column 314 in the region division / character recognition result table 300. That is, the correction may be performed only when the certainty factors are similar.

なお、説明したプログラムについては、記録媒体に格納することも可能であり、また、そのプログラムを通信手段によって提供することもできる。その場合、例えば、上記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えることもできる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去および書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、上記のプログラムまたはその一部は、上記記録媒体に記録して保存や流通等させることが可能である。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにはこれらの組合せ等の伝送媒体を用いて伝送することが可能であり、また、搬送波に乗せて搬送することも可能である。
さらに、上記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。
The described program can be stored in a recording medium, and the program can be provided by communication means. In that case, for example, the above-described program can also be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standards such as “DVD + R, DVD + RW, etc.”, compact discs (CDs), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), etc. MO), flexible disk (FD), magnetic tape, hard disk, read only memory (ROM), electrically erasable and rewritable read only memory (EEPROM), flash memory, random access memory (RAM), etc. It is.
The program or a part of the program can be recorded on the recording medium and stored or distributed. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It can be transmitted using a transmission medium such as a network or a combination of these, and can also be carried on a carrier wave.
Furthermore, the above program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media.

本実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of this Embodiment. 本実施の形態を実現する場合のシステム例全体の構成図である。It is a block diagram of the whole system example in the case of implement | achieving this Embodiment. 本実施の形態が取り扱う領域分割処理結果、文字認識処理結果のデータ構造の例である。It is an example of the data structure of the area | region division process result and character recognition process result which this Embodiment handles. 本実施の形態が取り扱うオペレータ入力のデータ構造の例である。It is an example of the data structure of the operator input which this Embodiment handles. 本実施の形態が取り扱う学習データのデータ構造の例である。It is an example of the data structure of the learning data which this Embodiment handles. 本実施の形態による文字認識等の処理を示すフローチャート例である。It is an example of a flowchart which shows processes, such as character recognition by this Embodiment. 本実施の形態による修正処理を示すフローチャート例である。It is an example of a flowchart which shows the correction process by this Embodiment. 本実施の形態による修正処理における画面表示例である。It is an example of a screen display in the correction process by this Embodiment. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

符号の説明Explanation of symbols

110…画像入力モジュール
120…領域分割モジュール
130…文字認識モジュール
140…オペレータ入力モジュール
150…比較モジュール
160…修正モジュール
170…学習DB
210…スキャンサーバー
220…クライアントPC
230…通信回線
300…領域分割・文字認識結果テーブル
400…オペレータ入力テーブル
500…学習テーブル
DESCRIPTION OF SYMBOLS 110 ... Image input module 120 ... Area division module 130 ... Character recognition module 140 ... Operator input module 150 ... Comparison module 160 ... Correction module 170 ... Learning DB
210: Scan server 220 ... Client PC
230 ... Communication line 300 ... Area division / character recognition result table 400 ... Operator input table 500 ... Learning table

Claims (9)

同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
を具備することを特徴とする情報処理システム。
A comparison means for comparing a first input value obtained by an operator's operation on an equivalent item with a second input value obtained by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different from each other by the comparison by the comparison means, a correction means for correcting based on the contents stored in the storage means is provided. Information processing system.
前記記憶手段は、前記比較手段による比較によって、第1の入力値と第2の入力値とが同等である場合は、第1の入力値または第2の入力値を記憶し、
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項1に記載の情報処理システム。
The storage means stores the first input value or the second input value when the first input value and the second input value are equal by the comparison by the comparison means,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing system according to claim 1, wherein the information is corrected by a corrected value corresponding to the second input value.
前記修正手段は、前記記憶手段に記憶されている同等の文書内における過去の修正に基づいて修正する
ことを特徴とする請求項1に記載の情報処理システム。
The information processing system according to claim 1, wherein the correction unit corrects based on past corrections in an equivalent document stored in the storage unit.
前記文字認識処理は、文字認識結果と該文字認識処理による確信度をも出力し、
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項1に記載の情報処理システム。
The character recognition process also outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing system according to claim 1, wherein the correction unit corrects according to a certainty factor stored in the storage unit.
画像を入力する画像入力手段と、
前記画像入力手段によって入力された画像を文字認識する文字認識処理手段と、
前記画像内の文字を操作者の操作によって入力する文字入力手段と、
同等項目に対する前記文字入力手段による第1の入力値と前記文字認識処理手段による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に基づいて修正する第1の修正手段と、
前記第1の修正手段による修正の結果を操作者の操作によって修正する第2の修正手段
を具備することを特徴とする情報処理システム。
An image input means for inputting an image;
Character recognition processing means for recognizing characters of the image input by the image input means;
A character input means for inputting characters in the image by an operation of an operator;
Comparing means for comparing the first input value by the character input means for the equivalent item with the second input value by the character recognition processing means;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison means, a first correction means for correcting based on the storage means;
An information processing system comprising: second correction means for correcting a result of correction by the first correction means by an operation of an operator.
コンピュータを、
同等項目に対する操作者の操作による第1の入力値と文字認識処理による第2の入力値とを比較する比較手段と、
過去の第1の入力値、該第1の入力値に対応する同等項目に対する過去の第2の入力値、および同等項目に対する修正後の値を対応づけて記憶する記憶手段と、
前記比較手段で比較することによって、第1の入力値と第2の入力値とが異なる場合は、前記記憶手段に記憶されている内容に基づいて修正する修正手段
として機能させることを特徴とする情報処理プログラム。
Computer
A comparison means for comparing a first input value obtained by an operator's operation on an equivalent item with a second input value obtained by a character recognition process;
Storage means for associating and storing past first input values, past second input values for equivalent items corresponding to the first input values, and corrected values for equivalent items;
When the first input value and the second input value are different by the comparison by the comparison unit, the comparison unit functions as a correction unit that corrects the content based on the contents stored in the storage unit. Information processing program.
前記記憶手段は、前記比較手段による比較によって、第1の入力値と第2の入力値とが同等である場合は、第1の入力値または第2の入力値を記憶し、
前記修正手段は、第1の入力値と第2の入力値とが異なる場合は、該第2の入力値に基づいて前記記憶手段に記憶されている第2の入力値を検索し、検索された第2の入力値に対応する修正後の値によって修正する
ことを特徴とする請求項6に記載の情報処理プログラム。
The storage means stores the first input value or the second input value when the first input value and the second input value are equal by the comparison by the comparison means,
When the first input value is different from the second input value, the correcting means searches for the second input value stored in the storage means based on the second input value, and is searched. The information processing program according to claim 6, wherein the information is corrected by a corrected value corresponding to the second input value.
前記修正手段は、前記記憶手段に記憶されている同等の文書内における過去の修正に基づいて修正する
ことを特徴とする請求項6に記載の情報処理プログラム。
The information processing program according to claim 6, wherein the correction unit corrects based on past corrections in an equivalent document stored in the storage unit.
前記文字認識処理は、文字認識結果と該文字認識処理による確信度をも出力し、
前記記憶手段は、前記文字認識処理による確信度をさらに記憶し、
前記修正手段は、前記記憶手段に記憶されている確信度に応じて修正する
ことを特徴とする請求項6に記載の情報処理プログラム。
The character recognition process also outputs a character recognition result and a certainty factor by the character recognition process,
The storage means further stores a certainty factor by the character recognition process,
The information processing program according to claim 6, wherein the correction unit corrects the degree of certainty stored in the storage unit.
JP2006291926A 2006-10-27 2006-10-27 Information processing system and information processing program Pending JP2008108153A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006291926A JP2008108153A (en) 2006-10-27 2006-10-27 Information processing system and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006291926A JP2008108153A (en) 2006-10-27 2006-10-27 Information processing system and information processing program

Publications (1)

Publication Number Publication Date
JP2008108153A true JP2008108153A (en) 2008-05-08

Family

ID=39441439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006291926A Pending JP2008108153A (en) 2006-10-27 2006-10-27 Information processing system and information processing program

Country Status (1)

Country Link
JP (1) JP2008108153A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204015A (en) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 Electronic document creation system, image forming apparatus, communication terminal, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015204015A (en) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 Electronic document creation system, image forming apparatus, communication terminal, and program

Similar Documents

Publication Publication Date Title
JP6575132B2 (en) Information processing apparatus and information processing program
JP6119952B2 (en) Image processing apparatus and image processing program
US11438467B2 (en) Apparatus, method, and storage medium for supporting data entry by correcting erroneously recoginized characters
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
JP6221220B2 (en) Image processing apparatus and image processing program
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2009251872A (en) Information processing device and information processing program
JP4780184B2 (en) Image processing apparatus and image processing program
JP2008108153A (en) Information processing system and information processing program
US10346251B2 (en) Information processing apparatus, non-transitory computer readable medium, and information processing method
JP2008052439A (en) Image processing system and image processing program
JP5440043B2 (en) Image processing apparatus and image processing program
JP6131765B2 (en) Information processing apparatus and information processing program
JP2011008584A (en) Apparatus and program for processing information
JP5673277B2 (en) Image processing apparatus and program
JP2008176764A (en) Image processing system, image processing method and image processing program
JP6003677B2 (en) Image processing apparatus and image processing program
JP2020052480A (en) Information processing apparatus and program
JP6323009B2 (en) Image processing apparatus and image processing program
JP5928714B2 (en) Information processing apparatus and information processing program
JP6575158B2 (en) Information processing apparatus and information processing program
JP2017102526A (en) Information processing device and information processing program
JP2010039810A (en) Image processor and image processing program
JP2008123446A (en) Log information management system, log information management device, log information management method, and log information management program