JPH09297821A - Character recognition method - Google Patents

Character recognition method

Info

Publication number
JPH09297821A
JPH09297821A JP8113466A JP11346696A JPH09297821A JP H09297821 A JPH09297821 A JP H09297821A JP 8113466 A JP8113466 A JP 8113466A JP 11346696 A JP11346696 A JP 11346696A JP H09297821 A JPH09297821 A JP H09297821A
Authority
JP
Japan
Prior art keywords
information
character
recognition result
item
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8113466A
Other languages
Japanese (ja)
Inventor
Koichiro Akiyama
浩一郎 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP8113466A priority Critical patent/JPH09297821A/en
Publication of JPH09297821A publication Critical patent/JPH09297821A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To surely detect and correct erroneous recognition at high speed by retrieving a data base from a recognized result through the use of semantic depending relation between items, operating the recognized result with prescribed algorithm, obtaining information which can be recognized at a glance and displaying it with the recognized result. SOLUTION: The filling position of the item is specified from reformat information identified in a format identification part 101 by an item information extraction part 102, and picture information of the position is extracted at every item. A character segment part 103 segments the character from item information at every character. The characters segmented at every character in a character segment part 108 are transmitted to a character recognition part 104 and they are recognized. The recognized result is displayed on the screen of a recognized result display part 105 in the order of the characters, which is decided in the character segment part 103, at every item decided in the item information extraction part 102. An information retrieval part 106 operates and displays information which can be extracted with the recognized result of the character recognition part 104 as a key by retrieving the data base.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は記入項目毎に領域分
割されたフォームに書かれた文字を認識する文字認識方
法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition method for recognizing characters written on a form divided into areas for each entry.

【0002】[0002]

【従来の技術】従来から項目毎に記入項目が予め定まっ
ているフォームを読み取る文字認識システムは、予め分
かっているフォーマット情報をもとに項目毎に文字列を
抽出し、更にそれを一文字毎に分け、文字認識部へ送っ
て認識処理を行っている。しかし、現在までのところ完
全な文字認識は存在しないので、程度の差こそあれ、認
識結果に誤認識が含まれている可能性がある。
2. Description of the Related Art Conventionally, a character recognition system for reading a form in which entry items are predetermined for each item extracts a character string for each item based on known format information, and further extracts it for each character. It is divided and sent to the character recognition unit for recognition processing. However, since there is no perfect character recognition so far, the recognition result may include erroneous recognition to some extent.

【0003】この点を解決するために従来からオペレー
タはフォームを一枚読み込む毎に正確に認識できている
かチェックするか、または処理するフォームが多い場合
には曖昧な文字含むフォームをリジェクトとし、リジェ
クトされたフォームのみを見直すなどの作業を行わなけ
ればならなかった。
In order to solve this point, conventionally, an operator checks whether or not each form is read correctly, or if there are many forms to be processed, rejects a form containing ambiguous characters and rejects it. I had to do some work such as reviewing only the submitted form.

【0004】一方、読み込む対象が数字データであるよ
うな文字認識システムでは、チェックディジットを利用
する方式がある。この方式は例えば銀行の口座番号のよ
うな数字列に対して予め記入段階から当該数字列から一
定のアルゴリズムで演繹される数字をチェックディジッ
トとして数字列の末尾または別項目に挿入しておき、数
字列の認識結果から演繹したチェックディジットの値と
記入されたチェックディジットの認識結果が一致してい
るかどうか認識する。このとき一致していない場合には
オペレータに修正を促し、そうでない場合はそのまま認
識結果が正しいものとして次のフォームの認識に進むと
いう処理である。これによって見直す対象を絞り込むこ
とができるため、オペレータに時間的な余裕が生まれ、
正確な見直し作業が期待できる。
On the other hand, in a character recognition system in which the object to be read is numeric data, there is a method using a check digit. In this method, for example, for a numerical string such as a bank account number, a number that is deduced from the numerical string by a certain algorithm from the entry stage is inserted as a check digit at the end of the numerical string or another item, and the numerical value is inserted. It is recognized from the recognition result of the column whether the deduced check digit value and the entered check digit recognition result match. At this time, if they do not match, the operator is prompted to make a correction. If not, the recognition result is regarded as correct and the process proceeds to the recognition of the next form. This allows you to narrow down the items to be reviewed, giving the operator more time,
Accurate review work can be expected.

【0005】しかし、チェックディジットは一般に1桁
の数字であるので、誤認識が重なった際は、1/10の
確率で誤認識を見逃してしまう可能性がある。また、数
字列であっても金額のように記入者にそのチェックディ
ジットを計算させることが事実上できないために適用で
きない対象もあり、依然問題は残る。
However, since the check digit is generally a one-digit number, there is a 1/10 chance of overlooking the erroneous recognition when the erroneous recognition overlaps. Further, even in the case of a numerical string, there are some objects that cannot be applied because it is practically impossible for the writer to calculate the check digit like the amount of money, and the problem still remains.

【0006】更に、次のような方式もある。例えば口座
番号から振込口座を特定する場合、振込用紙上の口座番
号と名義人の両方を認識して、口座番号の認識結果から
データベースを検索して得られる名義人名と、名義人欄
を認識して得られる名義人名が一致しなかったときのみ
修正を促すという方式である。
Further, there is the following method. For example, when identifying the transfer account from the account number, recognize both the account number and the holder on the transfer form, and recognize the holder name and the holder column obtained by searching the database from the recognition result of the account number. This is a method of urging correction only when the names of the holders obtained from the above do not match.

【0007】しかし、この場合口座番号が数字であるの
に対して名義人は漢字で書かれている場合がほとんどで
あるので認識率が極めて悪く、例え正しい記述が行われ
ていても修正を促される場合が多くなる。また、名義人
が法人の場合いろいろな記述形式が存在し、例え名義人
が正しく記述され、正しく認識できても記述形式が違う
ために修正作業を促される場合も多い。
[0007] However, in this case, the account number is a number, but in most cases the holder is written in Kanji, so the recognition rate is extremely poor, and even if a correct description is made, correction is urged. More often than not. In addition, when the holder is a corporation, there are various description formats, and even if the holder is correctly described and the recognition format is correct, the description format is often different and correction work is often urged.

【0008】いずれの場合も結局、人間にとって無意味
な数字の羅列をオペレータが比較して確認しなくてはな
らなく、このような数字の羅列を認識する際、人間が高
速に、しかも確実に確認する環境を提供する必要があっ
た。
In any case, after all, an operator must compare and confirm a list of numbers that is meaningless to humans, and when recognizing such a list of numbers, a human being can quickly and surely. It was necessary to provide an environment to check.

【0009】[0009]

【発明が解決しようとする課題】上記のような文字認識
処理において、認識結果をオペレータが確認する際、銀
行の口座番号のように単なる数字の羅列で一見で正しい
か否か判定しがたいものは一文字ごと比較しなければな
らなかった。これは単に作業時間がかかるばかりでな
く、ともすると誤認識を見逃して事故につながる可能性
があった。
In the above character recognition processing, when the operator confirms the recognition result, it is difficult to judge at first glance whether or not it is correct by simply enumerating numbers such as a bank account number. Had to compare character by character. This not only takes a lot of work time, but could lead to an accident by overlooking the misrecognition.

【0010】また、読み取り対象に漢字を含む場合は認
識率が低いばかりではなく、誤認識したばあい、現行の
認識方式では文字の類似性から判断している場合が多い
ため、類似文字に間違えることが多く、見た目合ってい
るように見えるのでチェックにはよほどの注意が必要で
ある。
In addition, when the reading target includes kanji, the recognition rate is not only low, but if the character is erroneously recognized, the current recognition method often makes a judgment based on the similarity of the characters. Often, it looks like it looks good, so you need to be very careful when checking.

【0011】このように無意味な数字の羅列や漢字列を
認識する際、人間が認識結果を高速に、しかも確実に確
認する環境を提供する必要があった。本発明はこの点に
鑑み、人間が認識結果を高速に、しかも確実に認識する
環境を提供することを目的としている。
As described above, when recognizing a sequence of meaningless numbers or a Chinese character string, it is necessary to provide an environment in which a person can confirm the recognition result at high speed and surely. In view of this point, the present invention has an object to provide an environment in which a person recognizes a recognition result at high speed and surely.

【0012】[0012]

【課題を解決するための手段】本発明は、口座番号のよ
うな人間にとっては無意味な情報や類似文字が存在する
ような文字列の認識結果を確認する際、項目間の意味的
な依存関係を用いて認識結果からデータベース等を検索
し、あるいは認識結果を一定のアルゴリズムで演繹する
ことによって、人間にも一目で確認可能な情報を取得
し、それを認識結果と共に表示することによって、オペ
レータが高速でしかも確実に誤認識を検出・修正できる
ようにする。
SUMMARY OF THE INVENTION The present invention, when confirming the recognition result of a character string such as information such as an account number that is meaningless to humans or a similar character, has a semantic dependency between items. By searching the database etc. from the recognition result using the relation, or by deducing the recognition result with a certain algorithm, information that can be confirmed by humans at a glance is also obtained, and by displaying it together with the recognition result, the operator Enables to detect and correct misrecognition at high speed and reliably.

【0013】本発明によれば、人間にとって確認困難な
情報が容易に確認できる情報とともに表示されるため、
確認結果を確認する際、従来の方式より高速でしかも確
実に行なえる。従って、従来よりも誤認識が少ないフォ
ームを対象にした文字認識方法が実現できる。
According to the present invention, since information that is difficult for humans to confirm is displayed together with information that can be easily confirmed,
It is faster and more reliable than the conventional method when confirming the confirmation result. Therefore, it is possible to realize a character recognition method for a form with less erroneous recognition than before.

【0014】[0014]

【発明の実施の形態】以下、本発明の一実施例を図面を
用いて説明する。図1は第1の実施例の処理方法を示す
ための図である。フォーマット識別部101はこれから
読み込もうとするフォームの形式を識別する部分であ
る。ここではこれから読み込もうとするフォームが既存
のフォームのどれに当たるかを識別する。識別方法とし
ては、罫線の位置などの情報を読み込もうとしているフ
ォームから抽出し、既存のフォームのデータと比較する
方法やフォームに予め書かれているフォーマット識別番
号を認識することによって、そのフォームを特定する手
法などがある。項目情報抽出部102ではフォーマット
識別部101で識別したりフォーマット情報から各項目
の記入位置を特定し、その位置の画像情報を項目毎に抽
出する。更に、文字切り出し部103ではその各々の項
目情報から文字を一文字毎に切り出す処理を行う。文字
切り出し部103の構成は、例えば一定間隔に文字が書
かれているフォームであれば、定められた間隔毎に切り
分ける手法がある。あるいは、図2に示されるように画
像中の黒画像(主に文字部分の画素)の分布を縦方向の
ヒストグラムとして表現し、ヒストグラムが0になった
ところで切り分ける手法もある。図2において201、
202、203がそれぞれの文字に対応する黒画素のヒ
ストグラムであり、204、205は切り出し位置であ
る。文字切り出し部103で一文字毎に切り出された文
字は文字認識部104に送られここで認識処理に掛けら
れる。ここでの認識結果を項目情報抽出部102で定め
られた項目毎に文字切り出し部103で定められた文字
の順番で、認識結果表示部105の画面上に表示する。
情報検索部106では、文字認識部104の認識結果を
キーにして抽出できる情報を種々データガ格納されたデ
ータベースを検索または演繹し、認識結果表示部105
でその結果を表示する。なお、データベースはこの部分
については、後段で詳しく述べる。認識結果表示画面を
見てオペレータが認識結果の誤りに気づいた場合、予め
定められたオペレーション操作により認識結果修正部1
07を起動して誤った認識結果を修正し、認識結果確定
部108によって修正を確定する。確定されたデータは
所定のメモリに格納される。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing a processing method of the first embodiment. The format identification unit 101 is a portion that identifies the form format to be read. Here, it is identified which existing form the form to be loaded corresponds to. As an identification method, information such as the position of the ruled line is extracted from the form to be read, and the form is identified by comparing the data with the existing form data or by recognizing the format identification number written in advance in the form. There is a method of specifying. The item information extraction unit 102 identifies the entry position of each item from the format identification unit 101 or the format information, and extracts the image information at that position for each item. Further, the character cutout unit 103 cuts out a character from each item information. As for the configuration of the character cutout unit 103, for example, in the case of a form in which characters are written at regular intervals, there is a method of dividing the characters at predetermined intervals. Alternatively, as shown in FIG. 2, there is also a method of expressing the distribution of a black image (mainly pixels of a character portion) in an image as a histogram in the vertical direction and cutting when the histogram becomes 0. In FIG. 2, 201,
202 and 203 are histograms of black pixels corresponding to the respective characters, and 204 and 205 are cutout positions. The characters cut out for each character by the character cutout unit 103 are sent to the character recognition unit 104 where they are subjected to recognition processing. The recognition result here is displayed on the screen of the recognition result display unit 105 in the order of characters determined by the character cutout unit 103 for each item determined by the item information extraction unit 102.
The information search unit 106 searches or deduces a database storing various data for information that can be extracted using the recognition result of the character recognition unit 104 as a key, and the recognition result display unit 105
To display the result. Note that this part of the database will be described in detail later. When the operator notices an error in the recognition result by looking at the recognition result display screen, the recognition result correction unit 1 is operated by a predetermined operation operation.
07 is activated to correct the incorrect recognition result, and the recognition result confirmation unit 108 confirms the correction. The confirmed data is stored in a predetermined memory.

【0015】更に、認識結果修正部107で修正された
内容は情報検索部106にもフィードバックされ検索結
果が認識結果表示部の表示画面にも反映する。また、認
識結果修正部107の起動は上記のようにオペレーショ
ンで行う方法のほか認識結果表示部105や検索情報表
示部107の処理が終了した段階で自動的に起動する方
法もあり、曖昧な文字が多く、認識結果を修正する可能
性が大きい時などに有効である。しかしこの場合、修正
が一箇所もない時でも認識結果確定部108によって認
識結果を確定する必要がある。
Further, the contents corrected by the recognition result correction unit 107 are fed back to the information retrieval unit 106 and the retrieval result is reflected on the display screen of the recognition result display unit. In addition to the method of activating the recognition result correction unit 107 by the operation as described above, there is also a method of automatically activating the recognition result display unit 105 and the search information display unit 107 at the stage when the processing is completed. This is effective when there is a large possibility that the recognition result will be corrected. However, in this case, it is necessary to confirm the recognition result by the recognition result confirmation unit 108 even when there is no correction.

【0016】さて、本発明の文字認識装置は図3に示す
ようなフォーム(帳票ともいう)を自動的に読み込むこ
とを想定している。詳しい説明の前に図3の説明を行
う。図3は銀行の振込用紙300の例であり、説明を明
瞭にするため細かい部分は省略してある。図3において
301は振込先銀行名の記述欄であり、302は支店名
の記述欄、303は振込み先の名義人の記述欄である。
304は301に記述された銀行の銀行番号、305は
302に記述された支店の店番号である。306は30
3の名義人がもつ口座番号である。ここでは簡単のため
振り込み先の口座を例えば普通預金の口座であると仮定
している。また、307は振り込み金額を記述する欄
で、308は振り込み人の氏名、309は住所も記述す
る項目である。
Now, it is assumed that the character recognition device of the present invention automatically reads a form (also called a form) as shown in FIG. Before the detailed description, the description of FIG. 3 will be given. FIG. 3 is an example of a bank transfer sheet 300, and detailed portions are omitted for clarity of explanation. In FIG. 3, reference numeral 301 is a transfer destination bank name description field, 302 is a branch name description field, and 303 is a transfer destination holder's description field.
304 is the bank number of the bank described in 301, and 305 is the store number of the branch described in 302. 306 is 30
This is the account number of the holder of 3. Here, for simplicity, it is assumed that the transfer destination account is, for example, a savings account. Further, 307 is a column for describing the transfer amount, 308 is an item for describing the name of the transfer person, and 309 is also an item for describing the address.

【0017】一般にフォームは記載事項が冗長であるこ
とが多く、図3の振り込み用紙でも銀行番号、店番号、
口座番号の組で銀行名、支店名、名義人が一意的に決ま
る。即ち、銀行番号、店番号、口座番号を記述すれば、
銀行名、支店名、名義人を記述しなくても正しい振り込
みが行えるのである。この意味で銀行名、支店名、名義
人は冗長な情報であるといえる。実際この振り込み用紙
を読み込む際には銀行番号、店番号、口座番号など正確
な認識が行われやすい部分のみを読み込み、オペレータ
がその数字を確認し、該当する口座の有無を確認して振
り込み行為を行うというような方法が取られてきた。こ
のような方法であると番号のようにシステムには認識対
象文字種が少ないので認識しやすいが、人間には理解し
にくい情報で認識することになり、認識結果をオペレー
タが確認する際、一文字ずつ確確認することになって確
認に時間がかかるばかりでなく、慣れてくると見逃す可
能性もあった。
Generally, the form is often redundant in terms of description, and the transfer form shown in FIG.
The bank name, branch name, and holder are uniquely determined by the set of account numbers. That is, if you enter the bank number, store number, and account number,
You can make a correct transfer without describing the bank name, branch name, and owner. In this sense, the bank name, branch name, and holder name are redundant information. Actually, when reading this transfer paper, only the part such as bank number, store number, account number etc. that is easy to be recognized accurately is read, the operator confirms the number and confirms the existence of the corresponding account and confirms the transfer action. The method of doing it has been taken. With such a method, the number of character types to be recognized in the system such as numbers is small, so it is easy to recognize, but it will be recognized with information that is difficult for humans to understand, and when the operator confirms the recognition result, each character Not only did it take a long time to confirm, but there was a possibility that I would miss it when I got used to it.

【0018】そこで、本実施例では、銀行番号、店番
号、口座番号を読み込んだ後データベースを検索し、該
当する銀行名、支店名、名義人を認識結果確認画面に表
示する。図4は認識結果確認画面の例である。図4にお
いて401は銀行番号からデータベースを検索して引き
出された銀行名であり、404は振込用紙から抽出した
銀行名の画像部分である。同様に402は銀行番号と支
店番号からデータベースを検索して引き出された支店名
であり、405は振込用紙から抽出した支店名の画像部
分である。また、403は銀行番号、店番号、口座番号
から検索された名義人であり、406は振込用紙から抽
出した名義人の画像部分である。407は銀行番号の認
識結果であり、本画面上もしくは別操作によってこれを
修正することができる。410は振込用紙から抽出した
銀行番号の画像部分である。同様に408は店番号の認
識結果であり、本画面上もしくは別操作によってこれを
修正することができる。411は振込用紙から抽出した
店番号の画像部分である。更に409は口座番号の認識
結果であり、本画面上もしくは別操作によってこれを修
正することができる。412は振込用紙から抽出した口
座番号の画像部分である。最後に、413は金額欄の認
識結果であり、本画面上もしくは別操作によってこれを
修正することができる。410は振込用紙から抽出した
金額欄の画像部分である。
Therefore, in the present embodiment, after reading the bank number, store number and account number, the database is searched and the corresponding bank name, branch name and holder are displayed on the recognition result confirmation screen. FIG. 4 is an example of the recognition result confirmation screen. In FIG. 4, 401 is a bank name extracted from the database by searching the bank number, and 404 is an image portion of the bank name extracted from the transfer form. Similarly, 402 is a branch name extracted from the database by searching the bank number and branch number, and 405 is an image portion of the branch name extracted from the transfer paper. Further, 403 is a holder searched from the bank number, store number, and account number, and 406 is an image portion of the holder extracted from the transfer paper. Reference numeral 407 is the recognition result of the bank number, which can be corrected on this screen or by another operation. 410 is an image part of the bank number extracted from the transfer paper. Similarly, 408 is the recognition result of the store number, which can be corrected on this screen or by another operation. Reference numeral 411 is an image portion of the store number extracted from the transfer paper. Further, reference numeral 409 is the recognition result of the account number, which can be corrected on this screen or by another operation. Reference numeral 412 is an image portion of the account number extracted from the transfer paper. Finally, 413 is the recognition result of the amount column, which can be corrected on this screen or by another operation. Reference numeral 410 is an image portion of the amount column extracted from the transfer paper.

【0019】この例においては412に示したように口
座番号の下5桁目が極めて曖昧な『0』であるので40
9に示す通り『6』と誤読してしまっている。この結
果、403に示す通り、データベースに格納されている
通り、名義人が『(株)日の出産業』となってしまっ
た。このように、口座番号では違いが少ない場合でも名
義人を表示すると違いが明瞭になる場合が多い。この例
の場合もそうであり、誤りの発見は番号同士を比較する
従来のやり方よりも格段に速く、しかも正確である。ま
た誤り箇所の発見も従来よりも容易である。なぜなら、
この場合銀行名と支店名は合っているので銀行番号、店
番号はあっていると考えられ、口座番号のみを見直せば
よいのである。これによって従来の半分以下の労力で修
正作業が実現できる。
In this example, as shown at 412, the last fifth digit of the account number is an extremely vague "0", so 40.
As shown in 9, it is misread as "6". As a result, as indicated by 403, the owner has become "Hinode Sangyo Co., Ltd." as stored in the database. In this way, even if there is little difference in account numbers, displaying the holder often makes the difference clear. As is the case with this example, the error detection is much faster and more accurate than the traditional method of comparing numbers. In addition, it is easier to find an error location than before. Because
In this case, since the bank name and branch name match, the bank number and the store number are considered to match, and only the account number needs to be reviewed. As a result, the correction work can be realized with less than half the effort of the conventional method.

【0020】更に本実施例の場合、口座番号を『6』か
ら『0』に修正した後、修正データを情報検索部に送
り、データベースの再検索を行ったのち認識結果表示画
面に再表示する。こうすることによって修正結果の確認
ができるばかりでなく、修正がより容易になる。このこ
とは例えば銀行番号の認識が間違っている場合、違った
銀行名が標示されるばかりでなく、例え店番号、口座番
号があっていても検索不能となるか、まるで関係ない支
店名や名義人が表示される。これはオペレータに店番号
や口座番号の見直しを強要することになり不便である。
そこで銀行番号を修正した時点で修正内容を自動的に情
報検索部106に送り、その結果を認識結果表示部10
8に再表示すれば支店名、名義人を確認することがで
き、見直す項目を減らすことができる。
Further, in the case of this embodiment, after correcting the account number from "6" to "0", the correction data is sent to the information retrieving section, the database is re-searched, and then re-displayed on the recognition result display screen. . This not only makes it possible to confirm the correction result, but also makes the correction easier. This means that if the bank number is not recognized correctly, not only will a different bank name be displayed, but even if there is a store number or account number, it will not be possible to search, or it will be as if the branch name or name is irrelevant. People are displayed. This is inconvenient because it forces the operator to review the store number and account number.
Therefore, when the bank number is corrected, the correction contents are automatically sent to the information retrieval unit 106, and the result is recognized by the recognition result display unit 10
If it is redisplayed in 8, the branch name and the holder can be confirmed, and the number of items to be reviewed can be reduced.

【0021】上記のように本実施例では一項目修正した
時点で自動的に検索をかけることとしているが、検索に
時間がかかる場合にはこの方法だとかえって作業時間が
かかってしまう。そのような場合はオペレータがいずれ
かのファンクションキーによって情報検索部106を任
意に起動できるように構成すればよい。
As described above, in the present embodiment, the retrieval is automatically performed when one item is corrected. However, when the retrieval takes time, this method takes a lot of work time. In such a case, the operator may arbitrarily activate the information search unit 106 with any function key.

【0022】更に、表示部に関しても従来は図5のよう
に原画像とは関係なく左詰めにする場合が多かった。図
5において4101は原画像表示ウィンドウであり、4
102は検索結果の表示ウィンドウである。このような
方式は、システム側の表示の都合上便利であってもオペ
レータ側の確認作業の点からは必ずしも便利ではなかっ
た。図6は右詰めの場合を示しているが、不便さにおい
ては左詰めの場合と同様である。この不便さは原画像と
文字とのずれが主な原因であり、その点を解決したのが
図7に示す方式である。
Further, in the past, the display unit was often left-justified regardless of the original image as shown in FIG. In FIG. 5, reference numeral 4101 denotes an original image display window,
Reference numeral 102 denotes a search result display window. Although such a method is convenient in terms of display on the system side, it is not always convenient from the viewpoint of confirmation work by the operator. Although FIG. 6 shows the case of right justification, inconvenience is the same as the case of left justification. This inconvenience is mainly caused by the difference between the original image and the characters, and the method shown in FIG. 7 solves this problem.

【0023】図7において、4101は原画像表示ウィ
ンドウで、4305は検索結果表示ウィンドウである。
更に4301から4304は原画像にある各文字の中心
線である。この方式は検索結果の表示文字の中心線が原
画像の文字の中心線と一致するように、検索結果の文字
表示位置を自動的に決定する。この方式によれば図7に
示したように比較確認しやすくなる。もちろんオペレー
タやその作業内容によっては左詰めや右詰めの方が比較
作業しやすい場合もあり、簡単なオペレーションによっ
てそれらを切り替えられるのが望ましい。
In FIG. 7, 4101 is an original image display window and 4305 is a search result display window.
Further, 4301 to 4304 are the center lines of the characters in the original image. In this method, the character display position of the search result is automatically determined so that the center line of the display character of the search result matches the center line of the character of the original image. According to this method, comparison and confirmation can be facilitated as shown in FIG. Of course, the left-justified and right-justified may be easier to perform comparison work depending on the operator and the work content thereof, and it is desirable to be able to switch between them by a simple operation.

【0024】更に、図8に示すように原画像の文字の大
きさに合わせて文字フォントのサイズを変更するとより
比較作業が容易になる。文字フォントサイズの決定は各
文字の文字サイズに最も近いものを自動的に選択するの
が望ましい。しかし、手書き文字に場合文字毎に文字の
大きさが異なる場合もある。このような場合は文字毎に
大きさを変えて原画像に見ため一致させるか、平均の文
字サイズを求め、そのサイズで全ての文字を表示する。
後者の方法は表示文字のサイズが一定しているので検索
結果の意味的内容が把握しやすい。もちろんフォントの
サイズには限りがあるので丁度良いフォントが無いこと
もある。この場合は原画像を拡大縮小して既存の文字フ
ォントに近づけるなどの工夫が必要となる。
Further, if the size of the character font is changed according to the size of the character of the original image as shown in FIG. 8, the comparison work becomes easier. It is desirable to automatically select the character font size that is closest to the character size of each character. However, in the case of handwritten characters, the size of each character may differ. In such a case, the size of each character is changed and the original image is visually matched, or an average character size is obtained, and all the characters are displayed in that size.
In the latter method, the size of the displayed characters is constant, so it is easy to understand the semantic content of the search results. Of course, the size of the font is limited, so there may not be a good font. In this case, it is necessary to enlarge or reduce the original image to bring it closer to the existing character font.

【0025】更に、認識結果かが間違っていて、原画像
と異なった検索結果を表示しなければならないこともあ
る。この場合文字数が異なる場合が多く、前記の方法は
うまく使えない。そこで、図9のように原画像の文字列
の左端4501と右端4502を求め、その間に丁度納
まるような文字フォントサイズを選択すると、表示が左
右にずれている場合に比べ比較作業が容易となる。もち
ろん、上記までに述べた文字サイズ変更に関するいくつ
かの方式も前記の場合と同様オペレータやその作業内容
によって作業のしやすさに誤りがあるので簡単なオペレ
ーションによってそれらを切り替えられるのが望まし
い。
Further, the recognition result may be wrong, and it may be necessary to display a search result different from the original image. In this case, the number of characters is often different, and the above method cannot be used successfully. Therefore, as shown in FIG. 9, if the left end 4501 and the right end 4502 of the character string of the original image are obtained and a character font size that fits exactly between them is selected, comparison work becomes easier compared to the case where the display is shifted to the left and right. . Of course, some of the character size changing methods described above have an error in easiness of work depending on the operator and the contents of the work as in the case described above, so it is desirable to switch between them by a simple operation.

【0026】また同一支店内での振り込み帳票のように
書かれる情報が少ないものもある。このような場合は図
4のように帳票1枚毎に画面で確認作業を行うのは大変
面倒であり時間も掛かる。そこで図10のように帳票何
枚かを同時に画面表示し、その画面上で確認・修正作業
を行えるようにする方式も考えられる。図10において
4601から4603はそれぞれ帳票1枚に対応する口
座番号と名義人と金額の情報であり、上段が原画像、下
段が認識結果及び検索結果である。ここでは振込は全て
同一支店内の口座に対して行われることが前提となって
いるので銀行番号や支店番号は認識処理する必要もな
く、当然修正の必要もない。しかし、この場合画面に表
示された情報だけでは分からないこともある。このよう
なときは該当の部分を選択すると帳票の詳細な情報が表
示され容易に詳細な確認作業ができることが望ましい。
この際に、項目の内容別に、この例でいえば、認識し結
果、得られる口座番号別にそろえて一覧表を表示するよ
うにすると修正が一層分かりやすくなる。
In addition, there is also a small amount of information written like a transfer form in the same branch. In such a case, it is very troublesome and time-consuming to perform the confirmation work on the screen for each form as shown in FIG. Therefore, as shown in FIG. 10, a method is possible in which several forms are simultaneously displayed on the screen and the confirmation / correction work can be performed on the screen. In FIG. 10, reference numerals 4601 to 4603 are information of an account number, a holder, and an amount of money corresponding to one form, respectively. The upper row shows the original image, and the lower row shows the recognition result and the search result. Since it is premised that all transfers are made to accounts in the same branch, there is no need to perform recognition processing for bank numbers and branch numbers, and of course no correction is necessary. However, in this case, the information displayed on the screen may not be enough. In such a case, it is desirable that the detailed information of the form be displayed by selecting the corresponding portion so that detailed confirmation work can be easily performed.
At this time, the correction becomes easier to understand by displaying the list by the contents of the items, in this example, the account numbers obtained as a result of recognition.

【0027】また、図4のように認識結果表示・修正画
面において認識結果を原画像のそばに表示したり、原画
像と認識結果を見比べやすいように、一方または両方を
拡大縮小することにより更に効率的な作業環境が提供で
きる。
Further, as shown in FIG. 4, the recognition result is displayed near the original image on the recognition result display / correction screen, or one or both of them are enlarged or reduced so that the original image and the recognition result can be easily compared. An efficient work environment can be provided.

【0028】図11は第2の実施例の全体構成を示すた
めのブロック図である。図11において507と508
以外は図1における該当部分と同じである。507は情
報演算部で、認識結果表示部か505から送られて来た
項目毎の認識結果が情報検索部506へ送られ必要な情
報が検索された後、検索された情報は認識結果とともに
この情報演算部507へ送られる。この情報演算部は認
識結果や検索結果から一定アルゴリズムで演繹される値
を演算する部分である。その後認識結果や506で得ら
れた検索結果及び507で得られた演算結果は情報整合
性判定部508へ送られ、同時に演算結果は情報検索部
506を経て認識結果表示部505へも送られ表示され
る。情報整合性判定部508では送られたて来た情報の
整合性を一定のアルゴリズムでチェックし判定する。5
08で得られた情報は507、508を経て認識結果表
示部へ送られ、判定結果に基づいて表示される。複数の
項目から帳票のある項目の認識結果、及び画像を並べて
項目毎に表示するようにしても良い。
FIG. 11 is a block diagram showing the overall structure of the second embodiment. In FIG. 11, 507 and 508
The other parts are the same as the corresponding parts in FIG. Reference numeral 507 denotes an information calculation unit, and the recognition result for each item sent from the recognition result display unit or 505 is sent to the information search unit 506 to search for necessary information, and the searched information is stored together with the recognition result. It is sent to the information calculation unit 507. The information calculation unit is a unit that calculates a value deduced by a certain algorithm from the recognition result and the search result. Thereafter, the recognition result, the search result obtained in 506, and the calculation result obtained in 507 are sent to the information consistency determination unit 508, and at the same time, the calculation result is also sent to the recognition result display unit 505 via the information search unit 506 and displayed. To be done. The information consistency determination unit 508 checks and determines the consistency of the transmitted information by a certain algorithm. 5
The information obtained in 08 is sent to the recognition result display unit via 507 and 508 and displayed based on the determination result. It is also possible to display the recognition result of a certain item in a form from a plurality of items and images side by side for each item.

【0029】図12は本実施例の対象となるフォームで
ある。これは電器機器の注文書であり、601のような
表形式となっている。602は注文の合計金額を記述す
る項目である。ここで読み取り対象となるのは『型番』
と『単価』と『数量』の欄である。第1の実施例で述べ
たのと同様のやり方で項目毎に文字列を切り出し、読み
取り項目であればそれをさらに一文字単位に切り分け、
認識する。
FIG. 12 shows a form which is the object of this embodiment. This is an order form for electrical equipment, and is in a tabular format such as 601. An item 602 describes the total amount of the order. The item to be read here is the "model number"
And "Unit price" and "Quantity" columns. In the same manner as described in the first embodiment, a character string is cut out for each item, and if it is a read item, it is further cut into character units.
recognize.

【0030】その認識結果を図13のように表示する。
図13において701〜704はそれぞれ一品目毎の認
識結果と原画像を表示している。まず、701について
は第1品目の『パソコンMZ80』の情報を表してお
り、上段が認識結果とそこから検索された情報や演繹さ
れた情報を表示している。下段は注文書に書かれた文字
そのものの画像を表示している。
The recognition result is displayed as shown in FIG.
In FIG. 13, reference numerals 701 to 704 respectively display the recognition result and the original image for each item. First, for 701, the information of the first item "personal computer MZ80" is displayed, and the upper row displays the recognition result and the information retrieved or deduced from it. The lower row shows an image of the letters written on the order form.

【0031】上段の内容を詳しく説明する。前述の通り
ここで認識するのは『型番』『単価』『数量』だけであ
る。従ってこの他の情報は検索されたり、演繹されたり
して得られたものである。まず、『品名』は『型番』の
認識結果から情報検索部506によりデータベースを使
って得られる。また、『代金』は『単価』と『数量』の
認識結果から情報演算部507において『単価』と『数
量』を掛けたものとして計算され、表示している。更に
『累積』は前の累積があればそれと『代金』との和を、
そうでなければ『代金』そのものを情報演算部507に
おいて求め、表示している。
The contents of the upper row will be described in detail. As mentioned above, only the "model number", "unit price" and "quantity" are recognized here. Therefore, the other information is obtained by searching or deducing. First, the “product name” is obtained from the recognition result of the “model number” by the information retrieval unit 506 using the database. Further, the "price" is calculated and displayed by multiplying the "unit price" and the "quantity" in the information calculation unit 507 from the recognition result of the "unit price" and the "quantity". Furthermore, "cumulative" is the sum of the previous accumulation, if any, and "price",
Otherwise, the "price" itself is obtained by the information calculation unit 507 and displayed.

【0032】また品名の『パーソナル・コンピュータM
Z80J』は前記の通り、型番の読み取り結果から情報
検索部を使って検索した情報であるが、注文者が書いた
品名と似ていることから同じものを指していると思われ
るが、正確には一致しない。このように注文者が正確な
品名を知っていることは稀で、大抵は省略したり、微妙
に異なる品名を記述することが多い。そのような場合は
例え品名のところに認識処理を施して、正確に読めたと
しても型番が正しいことは判定できない。この場合も同
様で品名の認識結果から型番が正しいことを自動的に判
定することは不可能であり、人間によるチェックが必要
となる。この際チェック対象として型番のように人間に
とって無意味な情報を選択するよりも品名のように意味
が分かる情報を選択した方が速く正確なチェックができ
るばかりでなく安心感が得られる。 次に、702は第
2品目の『増設メモリ』の情報を表示している。表示の
形式や検索及び演算の方式は前記第1品目の説明の通り
である。ここでは『型番』の上2桁目の『C』を『O』
と誤読してしまっている。このため『品目』が『オーデ
ィオ・ピーカーLO50』になってしまった。この誤り
は品名の欄をオペレータがチェックすることによって容
易に発見できるが、この場合誤りの発見だけなら自動的
にも可能である。まず、『型番』の認識結果から情報検
索部506によって単価が検索できる。この単価と『単
価』の欄の認識結果が情報整合性判定部508に送ら
れ、情報整合性判定部ではその両者が一致しない場合、
『型番』もしくは『単価』が間違っている旨の信号を情
報演算部、情報検索部を通して認識結果表示部505に
送り、認識結果に誤りを含んでいる旨の警告を出す。警
告の形式は例えば702に示されているように表示枠を
太くするというやり方でも実現できる。これによってオ
ペレータに注意を喚起し修正を促すことができるのであ
る。警告の形式はこの他にも表示の色を変えたり、該当
する文字を点滅させたり(該当する文字とは『型番』と
『単価』の欄の認識結果の部分(上段部)である)、該
当枠をその内部とともに点滅させたり、誤当箇所にカー
ソルを持って行き警告音を鳴らすなどの方法が考えられ
る。
The product name "Personal computer M"
As described above, "Z80J" is the information retrieved using the information retrieval unit from the result of reading the model number, but it seems to refer to the same item because it is similar to the item name written by the orderer. Do not match. In this way, the orderer rarely knows the exact product name, and often omits it or describes a slightly different product name. In such a case, it is impossible to determine that the model number is correct even if the recognition process is performed on the product name so that it can be read correctly. In this case as well, it is impossible to automatically determine that the model number is correct from the recognition result of the product name, and a human check is required. At this time, selecting information that has meaning such as a product name rather than selecting information that is meaningless to humans such as a model number as a check target enables not only quick and accurate checking but also a sense of security. Next, 702 displays information on the "extended memory" of the second item. The display format and the search and calculation method are as described for the first item. Here, "C" in the second digit of "Model Number" is replaced with "O"
I have misread it. As a result, the "item" has become "Audio Peaker LO50". This error can be easily found by checking the product name column by the operator, but in this case, the error can be found automatically. First, the unit price can be searched by the information search unit 506 from the recognition result of the “model number”. When the unit price and the recognition result in the “unit price” column are sent to the information consistency determination unit 508 and the information consistency determination unit does not match the two,
A signal indicating that the "model number" or the "unit price" is incorrect is sent to the recognition result display unit 505 through the information calculation unit and the information search unit to issue a warning that the recognition result contains an error. The format of the warning can be realized by thickening the display frame as shown in 702, for example. As a result, the operator can be alerted and a correction can be prompted. In addition to this, the warning format can be changed by changing the display color, blinking the corresponding character (the relevant character is the recognition result part (upper part) of the "model number" and "unit price"), Possible methods include blinking the relevant frame together with the inside of the frame, or moving the cursor to the incorrect location and sounding a warning sound.

【0033】警告されたオペレータは修正作業に入り、
同一画面上で『型番』の『O』を『C』に修正する。こ
の修正情報は直ちに情報検索部に送られ、新しい型番に
よる検索が行われる。その結果正しい品名が表示され、
同時に正しい単価が検索される。これらの情報は修正さ
れていない他の情報とともに情報演算部に送られ、前記
説明の通りの手法で『代金』、『累積』が計算される。
更にこれらの情報は情報整合性判定部へ送られる。情報
整合性判定部では情報検索部で得た単価の情報と『単
価』欄の認識結果とが合致することを確認し、逆の流れ
で認識結果表示部へ認識結果に整合性がある旨の信号を
送る。これを受け取った認識結果表示部は警告表示を解
除する。
The operator who has been warned enters the correction work,
On the same screen, correct "O" in "Model Number" to "C". This correction information is immediately sent to the information search unit, and a search using the new model number is performed. As a result, the correct product name is displayed,
At the same time, the correct unit price is retrieved. These pieces of information are sent to the information calculation section together with other information that has not been corrected, and the "cost" and "accumulation" are calculated by the method as described above.
Further, these pieces of information are sent to the information consistency determination unit. The information consistency determination unit confirms that the unit price information obtained in the information retrieval unit matches the recognition result in the "Unit price" column, and in the reverse flow, the recognition result display unit confirms that the recognition result is consistent. Send a signal. The recognition result display unit that receives this cancels the warning display.

【0034】また、警告の出し方として図13に示した
ように不整合が起こった、もしくは起こる可能性のある
全ての項目に警告を出すのではなく、『型番』と『単
価』のように不整合の原因となった場所、もしくは誤り
を含む最小の項目のみに警告を出す方式も考えられる。
本実施例の場合誤りを含む最小の項目は『型番』と『単
価』の2つである。なぜなら本実施例において得られた
情報からでは『型番』と『単位』の少なくとも一方が誤
っていることはわかるが、どちらが間違っているかわか
らないからである。このように警告を出す項目を絞り込
むことによって修正のためオペレータが確認する項目が
減り、確認作業がより容易になる。
In addition, as shown in FIG. 13, the warning is not issued to all the items in which the inconsistency has occurred or may occur, instead of the "model number" and the "unit price". A method of issuing a warning only to the place causing the inconsistency or only the smallest item including an error may be considered.
In the case of the present embodiment, the minimum items that include an error are “model number” and “unit price”. This is because it can be understood from the information obtained in this embodiment that at least one of the "model number" and the "unit" is incorrect, but it is not known which is incorrect. By narrowing down the items for which warnings are issued in this manner, the number of items to be confirmed by the operator for correction is reduced, and the confirmation work becomes easier.

【0035】また、703は第3品目の『本体カバー』
の情報を表示している。ここでは『数量』の項目で
『3』を『8』にする誤読が起っている。この結果、情
報演算部507で演繹される『代金』の項目が記入され
ている代金と食い違ってしまう。注意深いオペレータは
これだけでも十分誤りに気付くが、この場合はそこで気
が付かなくても他の箇所の表示から確実にこの誤りに気
付くことができる。705は注文全部の合計金額情報を
表示している。これは701〜704と同様に上段が認
識結果から情報演繹部507で演算された合計金額の情
報であり、下段は注文書に書かれた合計金額の画像その
ものである。
Reference numeral 703 is the "main body cover" of the third item.
The information of is displayed. There is a misreading that "3" is changed to "8" in the item of "quantity". As a result, the price deducted from the information calculation unit 507 is different from the price entered. The careful operator can notice the error enough by itself, but in this case, the error can be surely noticed from the display of other parts without noticing it. Reference numeral 705 displays total amount information of all orders. Similar to 701 to 704, the upper part is information on the total amount calculated by the information deduction unit 507 from the recognition result, and the lower part is the image itself of the total amount written on the order form.

【0036】合計金額は受注処理上最も重要な情報であ
るので、オペレータは必ず注意深くチェックをしなけれ
ばならない。したがってオペレータはここで確実に誤り
を発見することになる。誤りを発見したオペレータはこ
のことから704の『累積』に食い違いがあることを確
認する。次に703、702と遡ってチェックしていく
と702までは合っていて703から食い違うことがわ
かる。そこでオペレータは703の『累計』が食い違っ
ている原因を703の情報に求め、まずその『代金』が
食い違っていることを発見する。しかし、この項目は上
記で説明した通り、『単価』と『数量』から情報演算部
507で求めた値であり、ここが主原因ではない。即ち
オペレータがここを修正しても修正内容が情報検索部へ
送られないか、例え送られても上でも説明した通り『代
金』は『単価』や『数量』の認識結果から演算されるの
で修正結果は反映されない。そこでオペレータは『数
量』へ目をやり、『3』を『8』と誤読していることに
気が付く。
Since the total amount of money is the most important information in order processing, the operator must check it carefully. Therefore, the operator will surely find an error here. From this, the operator who finds an error confirms that there is a discrepancy in "accumulation" of 704. Next, when we check back 703 and 702, we can see that they are correct up to 702 and they are different from 703. Therefore, the operator seeks the cause of the discrepancy of the “total” of 703 in the information of 703, and first discovers that the “cost” is inconsistent. However, as described above, this item is a value obtained by the information calculation unit 507 from the “unit price” and the “quantity”, and this is not the main cause. That is, even if the operator corrects this, the correction content is not sent to the information search section, or even if it is sent, the "price" is calculated from the recognition result of the "unit price" and "quantity" as described above. The correction result is not reflected. Then, the operator pays attention to "quantity" and notices that "3" is mistakenly read as "8".

【0037】オペレータが『8』を『3』と訂正すると
702に『型番』を修正した時と同様の流れで703の
『代金』、『累積』、704の『累積』、合計がそれぞ
れ訂正されていき、合計が原画像(下段)の合計と一致
する。このことによりオペレータは注文書の認識に間違
いがないことを確認することができる。
When the operator corrects "8" to "3", the "cost" of 703, "accumulation", "accumulation" of 704, and total are corrected in the same flow as when the "model number" of 702 is corrected. And the total matches the total of the original image (lower row). This allows the operator to confirm that the order form is recognized correctly.

【0038】図14は第3の実施例が対象とするフォー
ムである。このフォームは第2の実施例が対象としてい
るフォームの下に顧客(注文主)の情報がついたもので
ある。801は顧客名の記入欄、802は顧客が以前こ
の会社に発注したかどうか利用有無の記入欄、803は
顧客住所の記入欄、804は顧客の電話番号の記入欄で
ある。
FIG. 14 shows a form targeted by the third embodiment. This form is one in which customer (orderer) information is added below the form targeted by the second embodiment. Reference numeral 801 is a customer name entry field, 802 is an entry field for whether or not the customer has previously placed an order with this company, 803 is a customer address entry field, and 804 is a customer telephone number entry field.

【0039】また、図11は本実施例に対応するブロッ
ク図である。本実施例の第1の読み取り対象は基本的に
『顧客氏名』の欄801と『利用有無』の欄802であ
る。本実施例では、これらの欄の読み取り結果及びそれ
をキーとして検索・演繹を行ない、その結果によって後
の読み取り処理及び検索処理を変更する。このことが本
実施例の主眼であり、段階的な読み取りを行なうことに
より効果的なオペレーティングが可能となる。
FIG. 11 is a block diagram corresponding to this embodiment. The first object to be read in this embodiment is basically a “customer name” column 801 and a “use / non-use” column 802. In the present embodiment, the reading result of these fields and the retrieval / deduction are performed by using the reading result as a key, and the subsequent reading process and retrieval process are changed according to the result. This is the main purpose of this embodiment, and effective operating becomes possible by performing the stepwise reading.

【0040】図15は認識結果の表示画面である。90
1は顧客番号である。これは『顧客氏名』と『利用有
無』の認識結果から『利用有無』にチェックがある場
合、『顧客氏名』の認識結果をキーにして顧客データベ
ースを検索して得られる。902は『顧客氏名』の認識
結果であり、903は『顧客氏名』の原画像である。ま
た、904は顧客番号または顧客氏名をキーにして、顧
客データベースから得られた『顧客住所』である。更
に、905はその原画像である。906は904と同様
の方法で得られた『顧客電話番号』であり、907はそ
の原画像である。
FIG. 15 shows a recognition result display screen. 90
1 is a customer number. This can be obtained by searching the customer database with the recognition result of "customer name" as a key when "use or non-use" is checked from the recognition results of "customer name" and "use or non-use". 902 is a recognition result of "customer name", and 903 is an original image of "customer name". Further, 904 is a "customer address" obtained from the customer database using the customer number or customer name as a key. Furthermore, 905 is the original image. 906 is a "customer telephone number" obtained by the same method as 904, and 907 is its original image.

【0041】図15の場合、『顧客氏名』の認識が間違
っていたため、『顧客住所』及び『顧客電話番号』が原
画像と全く異なるものとなってしまった。これによりオ
ペレータは『顧客氏名』の認識間違いに気付くことがで
きる。このように『顧客氏名』だけの情報では認識間違
いを発見しにくい場合、項目間の依存関係を用いる事に
より「木田」と「本田」などのように正解との差が小さ
な間違いを「神奈川県」と「岡山県」などのように差の
大きな間違いとして表示することができ、認識結果をよ
り確認しやすくすることが本発明の目的であった。
In the case of FIG. 15, since the recognition of "customer name" is wrong, "customer address" and "customer telephone number" are completely different from the original image. This allows the operator to notice a mistake in recognizing the "customer name". In this way, if it is difficult to find a recognition error with the information of "customer name" alone, by using the dependency between items, the error with a small difference between the correct answers such as "Kida" and "Honda" can be detected in "Kanagawa Prefecture". It is an object of the present invention to make it possible to display a recognition result more easily, such as "." And "Okayama Prefecture".

【0042】更に、オペレータが『顧客氏名』の認識結
果を正しく修正すると、修正された『顧客氏名』をキー
にして顧客データベースを検索し、正しい『顧客住所』
及び『顧客電話番号』を得る。
Further, when the operator corrects the recognition result of "customer name" correctly, the corrected "customer name" is used as a key to search the customer database, and the correct "customer address" is obtained.
And get the "customer phone number".

【0043】以上が『利用有無』の認識結果が『有』で
『顧客氏名』の認識が間違っており、かつその誤った顧
客氏名で顧客データベースが検索できてしまった場合の
本実施例の処理である。認識状況や検索・演繹状況によ
っては以下のような場合も考えられる。
The processing of this embodiment when the recognition result of "use or not" is "Yes", the recognition of "customer name" is incorrect, and the customer database can be searched by using the incorrect customer name Is. Depending on the recognition situation and search / deduction situation, the following cases are also possible.

【0044】まず、『顧客氏名』の認識結果が間違って
いるために、『利用有無』が正しく『有』と認識されて
も検索できないことがある。このような場合、『顧客住
所』や『顧客電話番号』を空欄にして、修正を促した
り、第2の実施例で述べたような方法で警告を出すこと
ができる。更に、このような場合『顧客電話番号』欄を
認識して、電話番号から顧客データベースを検索し、得
られた情報(『顧客番号』『顧客氏名』『顧客住所』)
を表示する。これによりオペレータは認識間違いを修正
する手間が省けるばかりでなく例えば、第2実施例でも
述べた会社名などの表記のゆれを吸収することができ、
2重登録などのトラブルを未然に防ぐことができる。ま
た、この場合電話番号の認識結果の欄の色を違えるなど
電話番号から検索された情報である旨明示して表示する
ことにより、オペレータに検索や演繹の状況を知らせ効
率の良い修正作業を行なわせることもできる。
First, since the recognition result of "customer name" is incorrect, there are cases in which a search cannot be performed even if "use" is correctly recognized as "present". In such a case, the "customer address" and "customer telephone number" can be left blank to prompt correction, or a warning can be issued by the method described in the second embodiment. Furthermore, in such a case, the "customer telephone number" column is recognized, the customer database is searched from the telephone number, and the obtained information ("customer number", "customer name", "customer address")
Is displayed. This not only saves the operator the trouble of correcting the recognition error, but also absorbs the fluctuation of the notation such as the company name described in the second embodiment.
Trouble such as double registration can be prevented. Also, in this case, by clearly displaying that the information is retrieved from the telephone number, such as changing the color of the telephone number recognition result field, the operator is notified of the situation of retrieval and deduction, and efficient correction work is performed. It can also be done.

【0045】次に、『顧客氏名』が正しく認識され『利
用有無』が『有』であっても全く違った『顧客住所』や
『顧客電話番号』が検索されることがある。これは主
に、顧客が住所変更した場合に起こる。このような場合
は、顧客に確認するなど一定の確認手段を行った上でオ
ペレータは『顧客住所』と『顧客電話番号』を認識処理
させ、得られた認識結果を確認・修正し、更新データと
して顧客データベースに登録する。こうにすることによ
り、不用意な2重登録を避け、常に最新のデータをデー
タベースに蓄積することができる。
Next, even if the "customer name" is correctly recognized and the "use / non-use" is "present", a completely different "customer address" or "customer telephone number" may be retrieved. This mainly happens when the customer changes his address. In such a case, the operator performs certain confirmation means such as confirmation with the customer, then the operator recognizes the "customer address" and "customer telephone number", confirms and corrects the obtained recognition result, and updates the data. As the customer database. By doing so, careless double registration can be avoided and the latest data can always be stored in the database.

【0046】また、上記の場合同姓同名であれば当然複
数の顧客候補が出てくる。この場合データベース等を検
索した結果を複数表示し、そこから候補の絞り込みを行
う方法を取るか、『顧客電話番号』欄を認識して顧客を
特定する。
In the above case, naturally, a plurality of customer candidates will appear if they have the same surname and name. In this case, a plurality of results obtained by searching a database or the like are displayed and candidates are narrowed down from the results, or the "customer telephone number" column is recognized and the customer is specified.

【0047】また、『利用有無』が『無』であった場合
は、例え『顧客氏名』欄が正しく認識できても顧客デー
タベースから情報を取得することはできない。しかし、
このような場合でも『利用有無』を『無』としたことが
顧客の勘違いであることもあるし、会社などの法人の場
合は注文主が過去に別の担当者が利用したケースを知ら
ない場合がある。更には個人の場合、注文主本人は利用
したことがなくても家族の誰かが注文していることもあ
り得る。
If the "use / no use" is "absent", information cannot be acquired from the customer database even if the "customer name" column is correctly recognized. But,
Even in such a case, it may be a customer's misunderstanding that "use" is "none", and in the case of a corporation such as a company, the orderer does not know the case that another person used in the past. There are cases. Furthermore, in the case of an individual, it is possible that someone in the family is placing an order even though the ordering person has never used it.

【0048】よってこの場合、自動的に『顧客電話番
号』を認識処理し、その認識結果をキーにして顧客デー
タベースを検索する。ここで該当するデータがなけれ
ば、新規顧客として『顧客住所』を認識処理し、オペレ
ータに新規登録の旨の表示をし、全項目に渡ってチェッ
クを促す。更に、確認・修正された時点で新たな顧客番
号を振り、データベースに登録する。
Therefore, in this case, the "customer telephone number" is automatically recognized and the customer database is searched using the recognition result as a key. If there is no corresponding data here, the “customer address” is recognized as a new customer, the operator is informed of the new registration, and the check is urged over all the items. Furthermore, at the time of confirmation / correction, a new customer number is assigned and registered in the database.

【0049】また、該当するものがあった場合は『顧客
氏名』と『顧客住所』『顧客番号』を表示する。上記の
場合と同様に電話番号の認識結果欄の色を違えるなどの
手段によりオペレータに『顧客電話番号』から検索した
情報である旨を知らせる。これによってオペレータは
『顧客住所』『顧客氏名』などをチェックし、正しい情
報であるかどうかを確認し、間違いがあれば一定のオペ
レーションによってその部分に認識処理を掛けるか、検
索結果を修正するかの指示をする。修正が終わった段階
で当該情報が新規顧客の情報であるか、そうでないかの
判断をオペレータが一定のオペレーションで入力する。
ここでもし、新規者であると判断されたら、新たな顧客
番号を振り、顧客データベースに登録する。そうでない
場合は検索された顧客番号のデータベースに得られた情
報を登録する。
If there is a corresponding item, "customer name", "customer address" and "customer number" are displayed. Similar to the above case, the operator is informed that the information is retrieved from the "customer telephone number" by means such as changing the color of the telephone number recognition result column. This allows the operator to check "customer address", "customer name", etc., to see if the information is correct, and if there is an error, perform a certain operation to recognize the part or correct the search result. Give instructions. When the correction is completed, the operator inputs a determination as to whether the information is a new customer information or not, by a certain operation.
If it is determined that the user is new, a new customer number is assigned and registered in the customer database. If not, the obtained information is registered in the database of searched customer numbers.

【0050】また、新規者であるか否かの判断を『顧客
氏名』の修正の有無や『顧客住所』の修正の有無などに
求めるやり方もある。即ち、何らかの修正が施された場
合、新規者と判断して自動的に新規登録するのである。
もちろんこのとき修正内容が住所変更であるばあいも考
えられるので、修正の有無による新規登録の判断を『顧
客氏名』のみを対象にするなど、修正されても新規登録
の判断の対象にはしない項目が存在しても良い。
There is also a method of determining whether or not the user is a new person based on whether or not the "customer name" has been corrected and the "customer address" has been corrected. That is, if any correction is made, it is judged as a new person and new registration is automatically performed.
Of course, at this time, it is possible that the correction content is an address change, so the judgment of new registration based on the presence or absence of correction is made only for "customer name", but it is not made the target of judgment of new registration even if it is corrected. Items may exist.

【0051】最後に本実施例において601や602は
第2の実施例と同じものであり、本実施例の処理とは項
目間の依存関係がないという意味で独立であるので、第
2の実施例の処理と本実施例の処理を並列にもできるこ
とを注意しておく。
Finally, in this embodiment, 601 and 602 are the same as those in the second embodiment, and are independent from the processing of this embodiment in the sense that there is no dependency between items, so the second embodiment is executed. It should be noted that the processing of the example and the processing of this embodiment can be performed in parallel.

【0052】このように本実施例においては項目間の依
存関係があるようなフォームを読み込み、認識処理する
ような文字認識装置において、予め定められた項目の認
識結果やその認識結果から検索・演繹された結果によっ
て、その後の処理を選択するように構成することもでき
る。これによりオペレータは効率的にデータ入力でき、
データベースの管理が容易になる。
As described above, in the present embodiment, a character recognition device for reading and recognizing a form in which there is a dependency relationship between items is a recognition result of a predetermined item and retrieval / deduction from the recognition result. Depending on the result obtained, it can be configured to select the subsequent processing. This allows the operator to enter data efficiently,
Database management becomes easier.

【0053】[0053]

【発明の効果】本発明によって項目毎に領域分割された
フォームを読み込み、認識する文字認識装置においてオ
ペレータの確認作業や修正作業が正確かつ容易に行える
環境が提供される。
According to the present invention, an environment is provided in which a character recognition device for reading and recognizing a region divided into items can accurately and easily perform an operator's confirmation work and correction work.

【図面の簡単な説明】[Brief description of drawings]

【図1】 第1の実施例のシステム図FIG. 1 is a system diagram of a first embodiment.

【図2】 黒画素のヒストグラムによる文字切り出しの
[Fig. 2] Example of character cutout by histogram of black pixels

【図3】 第1の実施例での読み込み対象となる銀行の
振込用紙
[FIG. 3] Bank transfer paper to be read in the first embodiment

【図4】 第1の実施例の認識結果表示・修正画面FIG. 4 is a recognition result display / correction screen of the first embodiment.

【図5】 第1の実施例の認識結果表示・修正画面の抜
粋(左詰めの場合)
[FIG. 5] Excerpt of the recognition result display / correction screen of the first embodiment (when left-justified)

【図6】 第1の実施例の認識結果表示・修正画面の抜
粋(右詰めの場合)
[Fig. 6] Excerpt of the recognition result display / correction screen of the first embodiment (when right-justified)

【図7】 第1の実施例の認識結果表示・修正画面の抜
粋(文字中心合わせの場合)
FIG. 7: Extraction of recognition result display / correction screen of the first embodiment (in the case of character center alignment)

【図8】 第1の実施例の認識結果表示・修正画面の抜
粋(文字サイズ合わせの場合)
[Fig. 8] Excerpt of the recognition result display / correction screen of the first embodiment (in the case of character size matching)

【図9】 第1の実施例の認識結果表示・修正画面の抜
粋(文字数が異なる場合)
FIG. 9 is an excerpt of the recognition result display / correction screen of the first embodiment (when the number of characters is different)

【図10】 第1の実施例の複数の帳票を同時に認識・
修正処理する認識結果表示・修正画面の
FIG. 10: Simultaneously recognizes a plurality of forms according to the first embodiment.
Of the recognition result display / correction screen

【図11】 第2の実施例のブロック図FIG. 11 is a block diagram of a second embodiment.

【図12】 第2の実施例での読み込み対象となる注文
[FIG. 12] Order form to be read in the second embodiment

【図13】 第2の実施例の認識結果表示・修正画面FIG. 13 is a recognition result display / correction screen of the second embodiment.

【図14】 第3の実施例での読み込み対象となる注文
FIG. 14: Order form to be read in the third embodiment

【図15】 第3の実施例の認識結果表示・修正画面FIG. 15: Recognition result display / correction screen of the third embodiment

【符号の説明】[Explanation of symbols]

101…フォーマット識別部 102…項目情報抽出部 103…文字切り出し部 104…文字認識部 105…認識結果表示部 106…情報検索部 107…認識結果修正部 108…認識結果確定部 201…文字『3』の黒画素ヒストグラム 202…文字『2』の黒画素ヒストグラム 203…文字『1』の黒画素ヒストグラム 204…文字『3』と文字『2』の分離点 205…文字『2』と文字『1』の分離点 300…銀行振込み用紙 301…銀行名記入欄 302…支店名記入欄 303…名義人記入欄 304…銀行番号記入欄 305…店番号記入欄 306…口座番号記入欄 307…金額記入欄 308…振り込み人記入欄 309…振り込み人住所 401…銀行番号から検索された銀行名の表示ウィンド
ウ 402…銀行番号と店番号から検索された支店名の表示
ウィンドウ 403…銀行番号と店番号と口座番号から検索された名
義人の表示ウィンドウ 404…銀行名の原画像表示ウィンドウ 405…支店名の原画像表示ウィンドウ 406…名義人の原画像表示ウィンドウ 407…銀行番号の認識結果表示ウィンドウ 408…店番号の認識結果表示ウィンドウ 409…口座番号の認識結果表示ウィンドウ 410…銀行番号の原画像表示ウィンドウ 411…店番号の原画像表示ウィンドウ 412…口座番号の原画像表示ウィンドウ 413…振込金額の認識結果表示ウィンドウ 414…振込金額の原画像表示ウィンドウ 4101…名義人の原画像表示ウィンドウ 4102…口座番号から検索された名義人の表示ウィン
ドウ 4201…口座番号から検索された名義人のウィンドウ 4301…名義人の第1文字原画像の中心線 4302…名義人の第2文字原画像の中心線 4303…名義人の第3文字原画像の中心線 4304…名義人の第4文字原画像の中心線 4305…口座番号から検索された名義人の表示ウィン
ドウ 4401…口座番号から検索された名義人の表示ウィン
ドウ 4501…名義人の原画像の左端線 4502…名義人の原画像の右端線 4601…第1の帳票の主要部の原画像、認識結果及び
検索結果(上段が原画像、下段が認識結果及び検索結
果) 4602…第2の帳票の主要部の原画像、認識結果及び
検索結果(上段が原画像、下段が認識結果及び検索結
果) 4603…第3の帳票の主要部の原画像、認識結果及び
検索結果(上段が原画像、下段が認識結果及び検索結
果) 501…フォーマット認識部 502…項目情報抽出部 503…文字切り出し部 504…文字認識部 505…認識結果表示部 506…情報検索部 507…情報演算部 508…情報整合性判定部 509…認識結果修正部 510…認識結果確定部 601…注文内容を記入する表 602…合計金額記入欄 701…注文表第1品目の情報表示ウィンドウ 702…注文表第2品目の情報表示ウィンドウ 703…注文表第3品目の情報表示ウィンドウ 704…注文表第4品目の情報表示ウィンドウ 705…合計金額の情報表示ウィンドウ 801…注文主の氏名記入欄 802…注文主がその会社を利用したかどうかを記入す
る欄 803…注文主の住所記入欄 804…注文主の電話番号記入欄 901…顧客番号表示ウィンドウ 902…顧客氏名の認識結果表示ウィンドウ 903…顧客氏名の原画像表示ウィンドウ 904…顧客住所の認識結果表示ウィンドウ 905…顧客住所の原画像表示ウィンドウ 906…顧客電話番号の認識結果表示ウィンドウ 907…顧客電話番号の原画像表示ウィンドウ
Reference numeral 101 ... Format identification unit 102 ... Item information extraction unit 103 ... Character cutout unit 104 ... Character recognition unit 105 ... Recognition result display unit 106 ... Information retrieval unit 107 ... Recognition result correction unit 108 ... Recognition result confirmation unit 201 ... Character “3” Black pixel histogram of 202 ... Black pixel histogram of character "2" 203 ... Black pixel histogram of character "1" 204 ... Separation point of character "3" and character "2" 205 ... Character "2" and character "1" Separation point 300 ... Bank transfer form 301 ... Bank name entry column 302 ... Branch name entry column 303 ... Nameholder entry column 304 ... Bank number entry column 305 ... Store number entry column 306 ... Account number entry column 307 ... Amount entry column 308 ... Transfer person entry field 309 ... Transferee address 401 ... Display window of bank name retrieved from bank number 402 ... Is it bank number and store number? Display window 403 of searched branch name ... Display window of holder searched from bank number, store number and account number 404 ... Display window of original image of bank name 405 ... Display window of original image of branch name 406 ... Original image display window 407 ... Bank number recognition result display window 408 ... Store number recognition result display window 409 ... Account number recognition result display window 410 ... Bank number original image display window 411 ... Store number original image display window 412 ... Original image display window for account number 413 ... Recognition result display window for transfer amount 414 ... Original image display window for transfer amount 4101 ... Original image display window for holder 4102 ... Holder display window 4201 searched for by account number The owner's email retrieved from the account number Dou 4301 ... Center line of the first character original image of the holder 4302 ... Center line of the second character original image of the holder 4303 ... Center line of the third character original image of the holder 4304 ... Fourth character original image of the holder Center line 4305 ... Display window of holder searched by account number 4401 ... Display window of holder searched by account number 4501 ... Left edge line of original image of holder 4502 ... Right edge line of original image of holder 4601 ... Original image of main portion of first form, recognition result and search result (upper row is original image, lower row is recognition result and search result) 4602 ... Original image of main portion of second form, recognition result and search result ( The upper part is the original image, the lower part is the recognition result and the search result) 4603 ... The original image of the main part of the third form, the recognition result and the search result (the upper part is the original image, the lower part is the recognition result and the search result) 501 ... Forma Recognition unit 502 ... item information extraction unit 503 ... character cutout unit 504 ... character recognition unit 505 ... recognition result display unit 506 ... information retrieval unit 507 ... information calculation unit 508 ... information consistency determination unit 509 ... recognition result correction unit 510 ... Recognition result confirmation part 601 ... Table for entering order details 602 ... Total amount entry column 701 ... Information display window for first item in order table 702 ... Information display window for second item in order table 703 ... Information for third item in order table Display window 704 ... Order display fourth item information display window 705 ... Total amount information display window 801 ... Orderer's name entry field 802 ... Orderer's entry field 803 ... Orderer's name entry field Address entry field 804 ... Orderer's telephone number entry field 901 ... Customer number display window 902 ... Customer name recognition result display window Window 903 ... Customer name original image display window 904 ... Customer address recognition result display window 905 ... Customer address original image display window 906 ... Customer telephone number recognition result display window 907 ... Customer telephone number original image display window

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】記入項目毎に領域分割されたフォームに書
かれた文字を、項目毎に読み込む文字認識方法におい
て、 前記各項目間の意味的な依存関係を用いて、認識結果も
しくは確定した情報またはその両方から演繹できる項目
の情報を表示することを特徴とする文字認識方法。
1. A character recognition method for reading a character written in a form divided into areas for each entry item, for each item, using a semantic dependency between each item, the recognition result or confirmed information. A character recognition method characterized by displaying information on items that can be deduced from both or both.
【請求項2】記入項目毎に領域分割されたフォームに書
かれた文字を、項目毎に読み込む文字認識装置におい
て、 各項目間の意味的な依存関係を用いて、認識結果もしく
は確定した情報またはその両方から演繹できる情報を演
繹し、演繹された情報同士、認識結果同士、あるいは演
繹された情報と認識結果との間に不整合があった場合
に、不整合があった箇所に警告を出すことを特徴とする
文字認識方法。
2. A character recognition device for reading characters written in a form divided into areas for each entry item, for each item, by using the semantic dependency between the items, a recognition result or confirmed information or Deduces information that can be deduced from both of them, and if there is a mismatch between the deduced information, the recognition results, or the deduced information and the recognition result, a warning is issued to the part where there is a mismatch. A character recognition method characterized by the above.
【請求項3】請求項2の文字認識方法において、演繹さ
れた情報同士、認識結果同士、あるいは演繹された情報
と認識結果との間に不整合があった場合には、その原因
となった箇所または誤り個数が最小になるような箇所の
みに報告を出すことを特徴とする文字認識方法。
3. The character recognition method according to claim 2, when there is a mismatch between the deduced information, the recognition results, or the deduced information and the recognition result. A character recognition method characterized in that a report is issued only to a location or a location where the number of errors is minimized.
【請求項4】記入項目毎に領域分割されたフォームに書
かれた文字を、項目毎に読み込む文字認識方法におい
て、 各項目を段階的に認識処理し、前階段までの認識結果及
び認識された項目間の意味的な依存関係を用いた検索・
演繹処理を行ない、それらの結果によって次の段階での
認識処理や検索・演繹処理を行なう項目を決定すること
を特徴とする文字認識方法。
4. In a character recognition method for reading characters written in a form divided into areas for each entry, each item is recognized step by step, and the recognition result up to the previous staircase and the recognition result are recognized. Search using semantic dependencies between items
A character recognition method characterized by performing deduction processing, and determining the items to be subjected to recognition processing or search / deduction processing in the next stage based on the results.
JP8113466A 1996-05-08 1996-05-08 Character recognition method Pending JPH09297821A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8113466A JPH09297821A (en) 1996-05-08 1996-05-08 Character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8113466A JPH09297821A (en) 1996-05-08 1996-05-08 Character recognition method

Publications (1)

Publication Number Publication Date
JPH09297821A true JPH09297821A (en) 1997-11-18

Family

ID=14612970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8113466A Pending JPH09297821A (en) 1996-05-08 1996-05-08 Character recognition method

Country Status (1)

Country Link
JP (1) JPH09297821A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065736A (en) * 2005-08-29 2007-03-15 Toshiba Corp Character recognition device and method
JP2016143284A (en) * 2015-02-03 2016-08-08 沖電気工業株式会社 Information processing apparatus, information processing system, information processing method, and program
JP2017091035A (en) * 2015-11-05 2017-05-25 株式会社野村総合研究所 Verification device and method of string of figure and/or character, and computer program
JP2018151868A (en) * 2017-03-13 2018-09-27 富士ゼロックス株式会社 Information processing device and program
WO2019234865A1 (en) * 2018-06-06 2019-12-12 株式会社Pfu Inspection device, control method, and control program
JP2021005173A (en) * 2019-06-25 2021-01-14 富士通株式会社 Ocr recognition result confirmation support program, ocr recognition result confirmation support method, and ocr recognition result confirmation support system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065736A (en) * 2005-08-29 2007-03-15 Toshiba Corp Character recognition device and method
JP2016143284A (en) * 2015-02-03 2016-08-08 沖電気工業株式会社 Information processing apparatus, information processing system, information processing method, and program
JP2017091035A (en) * 2015-11-05 2017-05-25 株式会社野村総合研究所 Verification device and method of string of figure and/or character, and computer program
JP2018151868A (en) * 2017-03-13 2018-09-27 富士ゼロックス株式会社 Information processing device and program
WO2019234865A1 (en) * 2018-06-06 2019-12-12 株式会社Pfu Inspection device, control method, and control program
JPWO2019234865A1 (en) * 2018-06-06 2021-01-07 株式会社Pfu Inspection equipment, control method and control program
JP2021005173A (en) * 2019-06-25 2021-01-14 富士通株式会社 Ocr recognition result confirmation support program, ocr recognition result confirmation support method, and ocr recognition result confirmation support system

Similar Documents

Publication Publication Date Title
WO2019194028A1 (en) Image processing device, image processing method, and storage medium for storing program
JPH03201166A (en) Display system at the time of correcting japanese document reading translation system
JPH09134372A (en) Method and device for retrieving document
JP6859977B2 (en) Image processing equipment, image processing systems, image processing methods and programs
CN110785773A (en) Bill recognition system
WO2019194026A1 (en) Image processing device, image processing method, and storage medium on which program is stored
JP2016177383A (en) Identification number retrieval system and identification number retrieval method
JPH09297821A (en) Character recognition method
WO2019194052A1 (en) Image processing device, image processing method, and storage medium storing program
JP7111143B2 (en) Image processing device, image processing method and program
WO2019193923A1 (en) Image processing device, image processing method and recording medium
JPH07114619A (en) Document recognizing device
JP3958722B2 (en) Image data document retrieval system
JP3353999B2 (en) Image data recognition device
JP3000349B2 (en) Key input editing method and editing device
JP2004046388A (en) Information processing system and character correction method
JP2731394B2 (en) Character input device
JP3292595B2 (en) Character recognition device
JPH0934888A (en) Character recognition method and character recognition device
JP2000246184A (en) Address specifying device
JPH0546803A (en) Output method for recognition result
JP2806420B2 (en) Kana-Kanji conversion device
JPH11143983A (en) Character recognition device and method and computer readable recording medium storing character recognition program
JP2001222679A (en) Character read system
JPS60214073A (en) European language word processor