JP2007272615A - Character reader - Google Patents

Character reader Download PDF

Info

Publication number
JP2007272615A
JP2007272615A JP2006098141A JP2006098141A JP2007272615A JP 2007272615 A JP2007272615 A JP 2007272615A JP 2006098141 A JP2006098141 A JP 2006098141A JP 2006098141 A JP2006098141 A JP 2006098141A JP 2007272615 A JP2007272615 A JP 2007272615A
Authority
JP
Japan
Prior art keywords
information
character
image data
unit
slip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006098141A
Other languages
Japanese (ja)
Other versions
JP4887867B2 (en
Inventor
Masahiro Sagara
雅宏 相良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2006098141A priority Critical patent/JP4887867B2/en
Publication of JP2007272615A publication Critical patent/JP2007272615A/en
Application granted granted Critical
Publication of JP4887867B2 publication Critical patent/JP4887867B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To allow work while making an operator performing correction work or confirmation of reading not recognize contents of information when reading the information of a slit or the like including personal information by use of an OCR device. <P>SOLUTION: A display control part 3 or 7 replaces display order of image information at random and displays it, and the operator cannot recognize the image information only as fragmentary information. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

この発明は、手書き文字認識装置(以下、OCR装置と略称する)に関し、特に、OCR装置によって自動的に認識できなかった文字、すなわちリジェクト文字の補正入力に際しての、秘密保持を支援する技術に関する発明である。   The present invention relates to a handwritten character recognition device (hereinafter abbreviated as an OCR device), and more particularly, to a technology for supporting confidentiality at the time of correction input of characters that could not be automatically recognized by the OCR device, that is, reject characters. It is.

従来より、金融機関や行政機関などにおいては、利用者の利便性や事務処理の信頼性を最大限確保する目的で、紙の伝票や帳票に必要事項を記載している事例が多い。
しかしながら、これらの機関においても、事務処理の効率化や情報処理の高度化は急務である。そのため、事務処理過程の途中で、これらの伝票や帳票に記載された情報を、OCR装置によってコード化して、コード化された情報をコンピュータによって処理する例が、多く見られる。
ところが、紙の伝票や帳票に記載された文字をOCR装置が認識できない不具合が、起こり得る。このような不具合は、記載された文字が、いわゆる手書き文字である場合に、顕著である。このように文字を認識できないケースが発生したときに、OCR装置は、この認識できない文字を、リジェクト文字として特別な処理の対象にする。
2. Description of the Related Art Conventionally, in financial institutions and administrative institutions, there are many cases where necessary items are described in paper slips and forms for the purpose of ensuring the convenience of users and the reliability of paperwork.
However, even in these organizations, it is urgent to improve the efficiency of paperwork and the advancement of information processing. Therefore, there are many examples in which information described in these slips and forms is encoded by an OCR device and the encoded information is processed by a computer during the paperwork process.
However, there is a possibility that the OCR device cannot recognize characters written on a paper slip or form. Such a defect is remarkable when the described character is a so-called handwritten character. When a case where the character cannot be recognized as described above occurs, the OCR apparatus sets the unrecognizable character as a target for special processing as a reject character.

現在多く見られるケースでは、OCR装置におけるリジェクト文字の処理として、OCR装置におけるスキャナ部分で取り込んだ当該リジェクト文字のイメージを画面に表示し、そのイメージをオペレータが目視により判読して、当該リジェクト文字に対応する文字コードを、キーボードなどの入力部を通じてOCR装置に入力する、という手法が、採用されている。
特開平07―021304号公報
In the case that is often seen at present, as the processing of reject character in the OCR device, the image of the reject character captured by the scanner part in the OCR device is displayed on the screen, and the operator visually interprets the image and converts it into the reject character. A method of inputting a corresponding character code into the OCR device through an input unit such as a keyboard is employed.
Japanese Patent Application Laid-Open No. 07-021304

しかしながら、上記の手法では、オペレータには伝票などの情報を見せなければならない。これは、リジェクト文字をOCR装置に認識させるためには、オペレータの目視に基づく判読に依存せざるを得ないため、である。
また、情報の内容によっては、初めからOCR装置を通さず、オペレータの目視のみに依存して判読する場合も有る。
ところが、上述のような金融機関や行政機関などで扱う情報には、本来、秘密保持の目的からは上記オペレータを含めた第三者への開示が望ましくない情報も、多数存在する。
そのよう秘密保持を要する情報の例としては、たとえば個人情報が挙げられる。具体的には、氏名、住所、電話番号、また金融機関においては、口座番号、取引金額などが有る。
However, in the above method, information such as a slip must be shown to the operator. This is because in order for the OCR device to recognize the rejected character, it must rely on interpretation based on the visual observation of the operator.
In addition, depending on the content of the information, there is a case where the reading is performed without relying on the OCR device from the beginning and depending only on the visual observation of the operator.
However, in the information handled by the financial institutions and administrative institutions as described above, there are many pieces of information that are originally not desired to be disclosed to third parties including the operator for the purpose of confidentiality.
An example of such information that requires confidentiality is personal information, for example. Specifically, there are a name, address, telephone number, and, in a financial institution, an account number, a transaction amount, and the like.

上記のような課題を解決するために、第1の発明においては、OCR装置によって自動認識された文字の表示順番をランダムに入れ替える手段と、
入れ替えられた順番で、自動認識された文字を表示する手段と、
オペレータによる補正入力を受け付ける手段と、
補正入力された情報を、ランダムな入れ替え以前の順番に並べなおす手段と
並べなおされた情報を、自動認識された情報と結合させる手段とを、それぞれ設けたものである。
In order to solve the above problems, in the first invention, means for randomly changing the display order of characters automatically recognized by the OCR device;
Means for displaying automatically recognized characters in the order of replacement;
Means for accepting correction input by an operator;
Means for rearranging the corrected input information in the order before random replacement and means for combining the rearranged information with the automatically recognized information are provided.

また第2の発明においては、
スキャナ装置によって帳票上の記載内容を読み取って生成されたイメージ情報を、項目単位で複数の帳票から無作為に抽出して合成する手段と、
抽出された情報を表示する手段と、
オペレータによる入力を受け付ける手段と、
補正入力された情報を、イメージ情報と関連づける手段と
を、それぞれ設けたものである。
In the second invention,
Means for randomly extracting and synthesizing image information generated by reading the description content on a form by a scanner device from a plurality of forms in item units;
Means for displaying the extracted information;
Means for receiving input by an operator;
Means for associating the corrected input information with image information is provided.

上記の各手段を設けることにより、オペレータは、情報を断片的にしか認識できないものの、リジェクト文字の判読と補正入力は可能である。
秘密保持を要する情報の中には、電話番号や口座番号のように、数字の順番が入れ替わったら無意味になる情報もある。
また、氏名のように、他の情報と組み合わせることによって、秘密保持の重要性が増大する性質の情報も有る。
これらの情報については、情報を構成する文字や数字の順番を入れ替えたり、他の情報との組み合わせを任意に入れ替えたりすることによって、情報の内容を認識困難にすることが可能である。
一方、補正入力のために、文字や数字を単独で認識する作業に限れば、一文字ずつでも、目視でなら判読可能なケースが多い。
By providing each of the above means, the operator can recognize the reject character and input the correction although the information can be recognized only in a fragmentary manner.
Some information that requires confidentiality, such as phone numbers and account numbers, is meaningless if the order of the numbers is changed.
In addition, there is information such as a name that has the property of increasing the importance of confidentiality when combined with other information.
For these pieces of information, it is possible to make it difficult to recognize the contents of the information by changing the order of letters and numbers constituting the information or arbitrarily changing the combination with other information.
On the other hand, as long as it is limited to the task of recognizing characters and numbers alone for correction input, there are many cases where even one character at a time can be read visually.

自動認識不能文字をオペレータが目視で認識して入力する際、ならびに自動認識の正否をオペレータが確認する際に、オペレータに目視させるためのイメージ表示の順番を、文字単位もしくは伝票の項目単位でランダムに入れ替えて、目視対象の情報を、補正もしくは確認に必要な程度でだけ、オペレータが情報を認識できるようにする。   When the operator visually recognizes and inputs characters that cannot be automatically recognized, and when the operator confirms whether automatic recognition is correct or not, the order of image display for the operator to visually check is random for each character or slip item Thus, the operator can recognize the information to be visually checked only to the extent necessary for correction or confirmation.

以下、本発明を実施する上で出願人が最良と考える形態の一例について説明する。図1に、本発明を適用したOCR装置の構成の概要を示す。
図1において、1はスキャナ部である。このスキャナ部1は、従来のOCR装置に用いられるスキャナと同様に、読み取り対象の伝票などに筆記された文字や数字などの情報を認識し、この情報をビットマップから成るイメージデータに変換する。
Hereinafter, an example of the form that the applicant considers best in carrying out the present invention will be described. FIG. 1 shows an outline of the configuration of an OCR apparatus to which the present invention is applied.
In FIG. 1, reference numeral 1 denotes a scanner unit. The scanner unit 1 recognizes information such as characters and numbers written on a slip to be read, and converts this information into image data composed of a bitmap, as in a scanner used in a conventional OCR apparatus.

2は自動認識部である。自動認識部2は、スキャナ部1が変換によって生成したイメージデータを解析し、伝票などに筆記された文字や数字などに対応するコードを特定して、文字コード列を生成する。   Reference numeral 2 denotes an automatic recognition unit. The automatic recognition unit 2 analyzes the image data generated by the scanner unit 1 through conversion, specifies a code corresponding to characters or numbers written on a slip or the like, and generates a character code string.

また、イメージデータの中に、対応するコードを特定できない情報が存在した際には、この情報を読み取り不可能なリジェクト文字と認識する。
また自動認識部2は、伝票に記載された氏名、住所などの項目ごとに、伝票上の文字列のうち、どれが各項目に該当する情報であるかを認識する。
この認識に際しては、伝票に予め印刷された記載枠の位置を基にして、その記載枠内においてスキャナ部によって認識されたイメージデータを、記載枠に対応する情報と認識する手法などが、考えられる。
When there is information in the image data that cannot identify the corresponding code, this information is recognized as an unreadable reject character.
Further, the automatic recognition unit 2 recognizes which of the character strings on the slip is information corresponding to each item for each item such as name and address described in the slip.
For this recognition, there may be a method of recognizing image data recognized by the scanner unit in the description frame as information corresponding to the description frame based on the position of the description frame pre-printed on the slip. .

3は表示制御部である。表示制御部3は、後述する各IDをもとに、イメージデータと自動認識結果とを関連付けて表示部4に表示させる。   Reference numeral 3 denotes a display control unit. The display control unit 3 causes the display unit 4 to display the image data and the automatic recognition result in association with each other, which will be described later.

4は表示部である。表示部4は、表示制御部3からの制御に基づいて、イメージデータと自動認識結果とを関連付けて表示する。   Reference numeral 4 denotes a display unit. The display unit 4 displays the image data and the automatic recognition result in association with each other based on the control from the display control unit 3.

5はイメージデータ記憶部である。
イメージデータ記憶部5は、認識結果記憶部6は、スキャナ部1で生成されたイメージデータを、1文字ごとに分解した上で、1文字ごとに付与される文字ID、氏名、住所、口座番号などの1項目の文字列ごとに付与される項目ID、伝票1枚ごとに付与される伝票IDと、1文字ごとに関連づけて記憶する。、
Reference numeral 5 denotes an image data storage unit.
The image data storage unit 5, the recognition result storage unit 6, decomposes the image data generated by the scanner unit 1 for each character, and then gives a character ID, name, address, account number given to each character The item ID assigned to each character string such as the item ID, the slip ID assigned to each slip, and the like are stored in association with each character. ,

6は認識結果記憶部である。
認識結果記憶部6は、スキャナ部1で生成されたイメージデータから自動認識部2において文字認識した結果生成された文字列を、1文字ごとに付与される文字ID、氏名、住所、口座番号などの1項目の文字列ごとに付与される項目ID、伝票1枚ごとに付与される伝票IDと、1文字ごとに関連づけて記憶する。、
Reference numeral 6 denotes a recognition result storage unit.
The recognition result storage unit 6 is a character ID, name, address, account number, etc. given to each character of a character string generated as a result of character recognition by the automatic recognition unit 2 from the image data generated by the scanner unit 1. The item ID given for each character string of item 1 and the slip ID given for each slip are stored in association with each character. ,

7は表示制御部である。表示制御部7は、上述の表示制御部3と同様に、後述する各IDをもとに、イメージデータと自動認識結果とを関連付けて表示部8に表示させる。   Reference numeral 7 denotes a display control unit. Similar to the display control unit 3 described above, the display control unit 7 causes the display unit 8 to display image data and an automatic recognition result in association with each other, which will be described later.

8は表示部である。表示部8は、上述の表示制御部4と同様に、表示制御部7からの制御に基づいて、イメージデータと自動認識結果とを関連付けて表示する。   Reference numeral 8 denotes a display unit. Similar to the above-described display control unit 4, the display unit 8 displays the image data and the automatic recognition result in association with each other based on the control from the display control unit 7.

9は補正入力記憶部である。補正入力記憶部9は、次に述べる補正入力部10においてオペレータによって入力された内容を、後述のIDを関連づけて記憶するとともに、この記憶内容を認識結果記憶部6に転送する。   Reference numeral 9 denotes a correction input storage unit. The correction input storage unit 9 stores the content input by the operator in the correction input unit 10 described below in association with an ID described later, and transfers the stored content to the recognition result storage unit 6.

10は補正入力部である。補正入力部10は、オペレータによる補正入力を受け付けるとともに、受け付けた補正入力を、補正入力記憶部9に転送する。   Reference numeral 10 denotes a correction input unit. The correction input unit 10 receives a correction input by the operator and transfers the received correction input to the correction input storage unit 9.

以下、ここまでに構成を説明した本発明OCR装置の動作について、図2以降のフローチャートを用いて説明する。
まず、文字の自動認識について、図2のフローチャートを用いて説明する。
The operation of the OCR apparatus of the present invention whose configuration has been described so far will be described below with reference to the flowcharts of FIG.
First, automatic character recognition will be described with reference to the flowchart of FIG.

読み取りの対象となる伝票(図示せず)がスキャナ部1にセットされると、ステップ201においてスキャナ部1がこの伝票をスキャンして、伝票のイメージデータを生成する。このとき、伝票に予め印刷された記入枠などは、スキャナ部1によっては認識されない、いわゆるドロップアウト・カラーによって印刷されており、イメージデータには含まれない。このため、イメージデータに含まれるのは、顧客などが伝票に記入した氏名、住所、口座番号などの文字や数字の情報のイメージのみとなる。この段階では、生成されたイメージデータは、伝票1枚に対して、伝票の全体に対応する1件のイメージとなる。   When a slip (not shown) to be read is set in the scanner unit 1, the scanner unit 1 scans the slip in step 201 to generate image data of the slip. At this time, an entry frame or the like preprinted on the slip is printed by so-called dropout color that is not recognized by the scanner unit 1 and is not included in the image data. For this reason, the image data includes only an image of character and number information such as name, address, and account number entered by the customer on the slip. At this stage, the generated image data is one image corresponding to the entire slip for one slip.

生成されたイメージデータは、イメージデータ記憶部5に送られる。ここで、伝票1枚分で1件のイメージデータに対して、ステップ202において、イメージデータ記憶部5において伝票IDが付与される。   The generated image data is sent to the image data storage unit 5. Here, in step 202, a slip ID is given to the image data for one piece of slip in the image data storage unit 5.

次にステップ203において、イメージデータ記憶部5において伝票イメージが解析され、予め指定された伝票上の所定位置に記載された情報を読み取って生成されたイメージデータが、項目単位で分割されて抽出される。この抽出に際しては、伝票上の各項目に対応した所定の記入枠の内側に相当する範囲に該当するイメージデータが、当該項目に対応するイメージデータして抽出される。   Next, in step 203, the slip image is analyzed in the image data storage unit 5, and the image data generated by reading the information described at a predetermined position on the slip designated in advance is divided and extracted in units of items. The In this extraction, image data corresponding to a range corresponding to the inside of a predetermined entry frame corresponding to each item on the slip is extracted as image data corresponding to the item.

次にステップ204において、イメージデータ記憶部5において、分割された項目ごとのイメージデータに、項目IDが付与される。   Next, in step 204, an item ID is given to the image data for each divided item in the image data storage unit 5.

次にステップ205において、イメージデータ記憶部5において、分割された項目ごとのイメージデータが、図1に示す自動認識部2に送られる。自動認識部2では、送られてきたイメージデータが、さらに文字単位に切り分けられる。この切り分け以降の処理は、既知の文字認識の処理の一部として行なわれるものである。   Next, in step 205, the image data for each divided item in the image data storage unit 5 is sent to the automatic recognition unit 2 shown in FIG. In the automatic recognition unit 2, the transmitted image data is further divided into character units. The processes after the segmentation are performed as a part of the known character recognition process.

次にステップ206において、自動認識部2において、ステップ205で切り分けられた文字単位のイメージデータに、文字IDが付与される。この文字IDと切り分けられたイメージデータは、再びイメージデータ記憶部5に送られて、相互に関連づけられて記憶される。   In step 206, the automatic recognition unit 2 assigns a character ID to the character unit image data segmented in step 205. The image data separated from the character ID is sent again to the image data storage unit 5 and stored in association with each other.

次にステップ207において、自動認識部2において、ステップ205で切り分けられた文字単位のイメージデータに基づいて文字認識を行う。さらにステップ208において、自動認識部2において、1文字ずつ認識された文字を、それぞれの項目ごとにまとめて、各項目ごとの文字列を作成する。これにより、たとえば住所の部分において認識された文字全部が、ひとつの文字列に統合され、住所の情報として意味を持つようになる。   Next, in step 207, the automatic recognition unit 2 performs character recognition based on the character unit image data segmented in step 205. Further, in step 208, the characters recognized by the automatic recognition unit 2 are collected for each item, and a character string for each item is created. Thereby, for example, all the characters recognized in the address portion are integrated into one character string and become meaningful as address information.

こうして作成された文字列は、図1の認識結果記憶部6に送られる、併せて、自動認識部2から認識結果記憶部6へ、認識の基となったイメージデータの文字IDと項目IDが認識結果記憶部6に送られ、ステップ209ならびに210において、これらのIDが認識結果の文字列に付与される。このとき、認識の基となったイメージデータと、当該イメージデータから認識された文字もしくは文字列には、文字ID,項目IDとも、各々同じIDが付与される。   The character string created in this way is sent to the recognition result storage unit 6 of FIG. 1. At the same time, the character ID and item ID of the image data used as the basis of recognition are transferred from the automatic recognition unit 2 to the recognition result storage unit 6. The ID is sent to the recognition result storage unit 6, and in steps 209 and 210, these IDs are given to the character string of the recognition result. At this time, the same ID is assigned to both the character ID and the item ID to the image data that is the basis of recognition and the character or character string recognized from the image data.

このID付与の処理により、認識前のイメージデータと認識後の文字もしくはもr時列とを、関連付けて参照することができる。すなわち、同じIDを持つイメージデータと文字もしくは文字列を抽出することで、文字認識前のデータと文字認識後のデータを比較することができる。
上記の自動認識が行なわれた部分の情報に関しては、自動認識が正しく行われたか否かを確認する確認補正作業が行われる。この確認補正作業の過程について、図3のフローチャートを用いて説明する。
By this ID assigning process, it is possible to refer to the image data before recognition and the characters after recognition or the r time sequence in association with each other. That is, by extracting image data having the same ID and characters or character strings, it is possible to compare the data before character recognition with the data after character recognition.
With respect to the information of the portion where the automatic recognition is performed, a confirmation correction operation for confirming whether the automatic recognition is correctly performed is performed. The confirmation correction process will be described with reference to the flowchart of FIG.

まず、図1に示す表示制御部3において、ステップ301において伝票IDを、ステップ302において項目IDを指定し、確認補正のための表示対象となる項目をひとつ指定する。   First, in the display control unit 3 shown in FIG. 1, a slip ID is designated in step 301, an item ID is designated in step 302, and one item to be displayed for confirmation correction is designated.

次いで、ステップ303において表示制御部3で擬似乱数を発生し、かかる擬似乱数をもって文字IDを指定し、上記指定された項目のうち、擬似乱数によって指定された文字IDの1文字について、イメージデータと自動認識結果の文字の両方を、表示部の画面上に表示する。ここで、イメージデータと自動認識結果の文字とは、同じ文字IDを有するものであり、この両者は、イメージデータを自動認識部2で文字認識したものが、自動認識結果の文字、という関係にある。   Next, in step 303, the display control unit 3 generates a pseudo random number, designates a character ID using the pseudo random number, and among the designated items, for one character of the character ID designated by the pseudo random number, image data and Both characters of the automatic recognition result are displayed on the screen of the display unit. Here, the image data and the character of the automatic recognition result have the same character ID, and both of them have the relationship that the image data recognized by the automatic recognition unit 2 is the character of the automatic recognition result. is there.

このイメージデータと自動認識結果の文字とを、ステップ305ならびにステップ306において、表示制御部3が表示部4に送って、表示部4の画面上に表示させる。
この表示を確認補正作業を担当するオペレータが表示部4の画面上で目視し、自動認識が正しく行われたか否かを1文字ごとに確認する。この結果、誤認識が発見されれば、オペレータが自動認識結果を適宜修正することになるが、この修正処理に関しては当業者にとっては周知であるため、説明を省略する。この図3に示した一連の過程が、自動認識の対象となったすべての項目について実行される。そののち、修正済みの自動認識結果は、認識結果記憶部6に記憶される。
In step 305 and step 306, the display control unit 3 sends the image data and the characters of the automatic recognition result to the display unit 4 to display them on the screen of the display unit 4.
The operator who is in charge of the confirmation and correction work visually confirms this display on the screen of the display unit 4 and confirms whether or not the automatic recognition is correctly performed for each character. As a result, if a misrecognition is found, the operator corrects the automatic recognition result as appropriate. However, since this correction process is well known to those skilled in the art, a description thereof will be omitted. The series of processes shown in FIG. 3 is executed for all items that are the targets of automatic recognition. After that, the corrected automatic recognition result is stored in the recognition result storage unit 6.

上記の確認補正作業以外に、自動認識の対象とされない項目に関しては、補正入力作業をオペレータが行い、イメージデータを目視してオペレータが内容を判断し、伝票の記載内容に相当する情報を、オペレータが入力する。以下、この補正入力作業について説明する。   For items that are not subject to automatic recognition other than the above confirmation correction work, the operator performs correction input work, the image is visually checked by the operator, the operator determines the contents, and the information corresponding to the contents described in the slip is Enter. Hereinafter, this correction input operation will be described.

図4に、補正入力作業におけるフローチャートを示す。
まずステップ401において、表示制御部7が、伝票IDを指定する。ここでは複数のIDを同時に指定するが、これは後述するように複数の伝票から抽出された情報を混在させることで、同一伝票上の複数の項目、たとえば氏名と口座番号との関連を、後述する画面表示から推測し難くするためである。
FIG. 4 shows a flowchart in the correction input operation.
First, in step 401, the display control unit 7 specifies a slip ID. Here, a plurality of IDs are specified at the same time. As described later, by mixing information extracted from a plurality of slips, the relationship between a plurality of items on the same slip, such as names and account numbers, will be described later. This is to make it difficult to guess from the screen display.

次にステップ402において、表示制御部7が、項目IDを指定する。
次いで、ステップ403において、表示制御部7が、擬似乱数を発生する。
次いで、ステップ404において、表示制御部7が、発生した擬似乱数を基に伝票IDを指定して、伝票IDを並べ替える。
Next, in step 402, the display control unit 7 specifies an item ID.
Next, in step 403, the display control unit 7 generates a pseudo random number.
Next, in step 404, the display control unit 7 specifies the slip IDs based on the generated pseudo-random numbers and rearranges the slip IDs.

次いでステップ405において、表示制御部7が、ステップ404で並べ替えられた伝票IDの順番に従って、まず1番目の伝票のイメージデータのうち、ステップ402において指定された項目IDに該当する項目のイメージデータを、イメージ記憶部5から呼び出して記憶する。
この作業を、すべての項目IDについて反復する。この過程が終了すると、表示制御部7には1枚分の伝票のイメージデータが記憶される。ただし、この状態では、複数の項目のイメージデータの間には、相互に何の連関も無い。たとえば、イメージデータのうち氏名の情報と住所の情報とは、擬似乱数に従って、別の伝票から偶々同時に読み出されただけのものであり、氏名と住所との間には、個人情報としては何の関連も保証されない。
Next, in step 405, the display control unit 7 first sets the image data of the item corresponding to the item ID specified in step 402 out of the image data of the first slip in accordance with the order of the slip IDs rearranged in step 404. Is called from the image storage unit 5 and stored.
This operation is repeated for all item IDs. When this process ends, the display control unit 7 stores image data of one slip. However, in this state, there is no relationship between the image data of a plurality of items. For example, in the image data, the name information and the address information are simply read from another slip at the same time according to a pseudo-random number. What is the personal information between the name and address? The relationship is not guaranteed.

次いでステップ406において、表示制御部7は表示部8の画面上に、これらのイメージデータを表示する。
このイメージデータの表示内容をみて、ステップ407において、補正入力作業を担当するオペレータは、イメージデータに対応した文字または数字を、文字入力部10から入力する。
Next, in step 406, the display control unit 7 displays these image data on the screen of the display unit 8.
Looking at the display content of the image data, in step 407, the operator who is in charge of the correction input operation inputs characters or numbers corresponding to the image data from the character input unit 10.

入力が行われると、ステップ408において、表示制御部7では、表示部8の画面上に表示されたイメージデータに関して、伝票IDと項目IDとを読み出して、この伝票IDと項目IDとを、入力された文字又は数字のデータと関連づけて、入力情報記憶部9に記憶させる。
そののち、入力情報記憶部9に記憶された文字又は数字のデータは、伝票IDと項目IDとともに認識結果記憶部6に送られ、ここで、確認補正作業によって確認された自動認識結果と、補正入力作業によって目視で認識され、入力された補正入力結果とが、統合される。
When input is performed, in step 408, the display control unit 7 reads out the slip ID and the item ID with respect to the image data displayed on the screen of the display unit 8, and inputs the slip ID and the item ID. It is stored in the input information storage unit 9 in association with the written character or number data.
After that, the character or number data stored in the input information storage unit 9 is sent to the recognition result storage unit 6 together with the slip ID and the item ID, where the automatic recognition result confirmed by the confirmation correction work and the correction The correction input result recognized and input by the input operation is integrated.

本発明は、OCR装置に適用可能であり、特に情報の秘匿を要する個人情報などの読み取りを行うOCR装置に適する。   The present invention is applicable to an OCR device, and is particularly suitable for an OCR device that reads personal information that requires confidentiality of information.

システム構成の概要を示す説明図である。It is explanatory drawing which shows the outline | summary of a system configuration. 自動認識処理の過程を示すフローチャートである。It is a flowchart which shows the process of an automatic recognition process. 補正入力処理の過程を示すフローチャートである。It is a flowchart which shows the process of a correction | amendment input process. 確認補正処理の過程を示すフローチャートである。It is a flowchart which shows the process of a confirmation correction process.

符号の説明Explanation of symbols

1 スキャナ部
2 自動認識部
3 表示制御部
4 補正入力部
5 補正部
6 認識結果記憶部
7 イメージデータ記憶部
1 Scanner Unit 2 Automatic Recognition Unit 3 Display Control Unit 4 Correction Input Unit 5 Correction Unit 6 Recognition Result Storage Unit 7 Image Data Storage Unit

Claims (2)

OCR装置によって自動認識された文字の表示順番をランダムに入れ替える手段と、
入れ替えられた順番で、自動認識された文字を表示する手段と、
オペレータによる補正入力を受け付ける手段と、
補正入力された情報を、ランダムな入れ替え以前の順番に並べなおす手段と
並べなおされた情報を、自動認識された情報と結合させる手段とを、それぞれ設けたことを特徴とする、文字読み取り装置。
Means for randomly changing the display order of characters automatically recognized by the OCR device;
Means for displaying automatically recognized characters in the order of replacement;
Means for accepting correction input by an operator;
A character reading apparatus, comprising: means for rearranging corrected input information in an order prior to random replacement; and means for combining the rearranged information with automatically recognized information.
スキャナ装置によって帳票上の記載内容を読み取って生成されたイメージ情報を、項目単位で複数の帳票から無作為に抽出して合成する手段と、
抽出された情報を表示する手段と、
オペレータによる入力を受け付ける手段と、
補正入力された情報を、イメージ情報と関連づける手段と
を、それぞれ設けたことを特徴とする、文字読み取り装置。
Means for randomly extracting and synthesizing image information generated by reading the description content on a form by a scanner device from a plurality of forms in item units;
Means for displaying the extracted information;
Means for receiving input by an operator;
A character reading apparatus, characterized in that means for associating corrected input information with image information is provided.
JP2006098141A 2006-03-31 2006-03-31 Character reader Active JP4887867B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006098141A JP4887867B2 (en) 2006-03-31 2006-03-31 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006098141A JP4887867B2 (en) 2006-03-31 2006-03-31 Character reader

Publications (2)

Publication Number Publication Date
JP2007272615A true JP2007272615A (en) 2007-10-18
JP4887867B2 JP4887867B2 (en) 2012-02-29

Family

ID=38675349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006098141A Active JP4887867B2 (en) 2006-03-31 2006-03-31 Character reader

Country Status (1)

Country Link
JP (1) JP4887867B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017182276A (en) * 2016-03-29 2017-10-05 株式会社東芝 Image processing system, image processing device, and image processing program
JP2018501670A (en) * 2015-11-30 2018-01-18 シャオミ・インコーポレイテッド Method and apparatus for recognizing type of electronic device connected to smart outlet

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004266428A (en) * 2003-02-28 2004-09-24 Dynacomware Corp Method for shuffling asian character images and shuffle processing system
JP2004318760A (en) * 2003-04-21 2004-11-11 Dynacomware Corp Character recognition method, character recognition device, and character image/text conversion service method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004266428A (en) * 2003-02-28 2004-09-24 Dynacomware Corp Method for shuffling asian character images and shuffle processing system
JP2004318760A (en) * 2003-04-21 2004-11-11 Dynacomware Corp Character recognition method, character recognition device, and character image/text conversion service method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018501670A (en) * 2015-11-30 2018-01-18 シャオミ・インコーポレイテッド Method and apparatus for recognizing type of electronic device connected to smart outlet
KR20180088937A (en) * 2015-11-30 2018-08-08 시아오미 아이엔씨. Method and apparatus for identifying type of electronic device on smart socket
KR102515769B1 (en) * 2015-11-30 2023-03-30 시아오미 아이엔씨. Method and apparatus for identifying type of electronic device on smart socket
JP2017182276A (en) * 2016-03-29 2017-10-05 株式会社東芝 Image processing system, image processing device, and image processing program

Also Published As

Publication number Publication date
JP4887867B2 (en) 2012-02-29

Similar Documents

Publication Publication Date Title
US20080244378A1 (en) Information processing device, information processing system, information processing method, program, and storage medium
JP2005173730A (en) Business form ocr program, method, and device
JP2008145611A (en) Information processor and program
CN111160860A (en) File printing and stamping method
US7596270B2 (en) Method of shuffling text in an Asian document image
CN113901434B (en) Display terminal identity recognition method, system and computer readable storage medium
JP2015138496A (en) Document file generation device and document file generation method
JP4887867B2 (en) Character reader
CN107317951B (en) Image processing system, image processing apparatus, and image processing method
JP2004152036A (en) Cellular phone with character recognizing function, correction method of recognized character, and program
JP4809637B2 (en) Character recognition system and character recognition method
JP6432179B2 (en) Document file generation apparatus and document file generation method
CN107016320B (en) Method for improving image security level identification accuracy rate based on Chinese lexicon
CN110942068B (en) Information processing apparatus, storage medium, and information processing method
JP5657401B2 (en) Document processing apparatus and document processing program
JP2009301441A (en) Form image filing system
IES940265A2 (en) Automated forms processing
JP2020052480A (en) Information processing apparatus and program
JP4864574B2 (en) Form processing device
JP2019125966A (en) Image communication device, control method, and program
KR101877609B1 (en) Image Forming Apparatus that controllable display of specific character string
JP2006201965A (en) Form identification system
JP3114446B2 (en) Character recognition device
JP2008017053A (en) Document processing apparatus
JP5251652B2 (en) Form image filing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111128

R150 Certificate of patent or registration of utility model

Ref document number: 4887867

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3