JPH04218885A - Character recognizing method for optical character reader - Google Patents

Character recognizing method for optical character reader

Info

Publication number
JPH04218885A
JPH04218885A JP2403609A JP40360990A JPH04218885A JP H04218885 A JPH04218885 A JP H04218885A JP 2403609 A JP2403609 A JP 2403609A JP 40360990 A JP40360990 A JP 40360990A JP H04218885 A JPH04218885 A JP H04218885A
Authority
JP
Japan
Prior art keywords
character
character type
field
category
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2403609A
Other languages
Japanese (ja)
Other versions
JP2886690B2 (en
Inventor
Akizo Kadota
門田 彰三
Toshihiro Hananoi
花野井 歳弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2403609A priority Critical patent/JP2886690B2/en
Publication of JPH04218885A publication Critical patent/JPH04218885A/en
Application granted granted Critical
Publication of JP2886690B2 publication Critical patent/JP2886690B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To limit a character specification even when a large number of characters exist in the character specification when character recognition is efficiently performed by limiting the character specification at every field of a document. CONSTITUTION:A character specification designation mask table stored in character specification designation mask memory 8 is read out based on a field designation signal 6 which instructs a field performing reading at present outputted from a character recognizing means, and outputs a character specification designation signal 9 in accordance with the field. A character specification selection table stored in character specification selection memory 11 is read out based on a category instruction signal 13, and a character specification selection signal 15 in accordance with the above category is outputted. Also, a character specification selection function part 10 takes the AND of the character specification instruction mask signal 9 and the character specification selection signal 15, and instructs the execution or interruption of matching with a reference pattern, etc., to a character recognizing means based on the above result.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は光学的文字読取装置にお
ける文字認識方法にかかり、特に読取対象とする文字種
が多数にわたる場合に、読取精度の向上と読取速度の向
上を図るのに好適な光学的文字読取装置における文字認
識方法に関する。
[Industrial Application Field] The present invention relates to a character recognition method in an optical character reading device, and particularly to an optical character recognition method suitable for improving reading accuracy and reading speed when there are many types of characters to be read. The present invention relates to a character recognition method in a digital character reading device.

【0002】0002

【従来の技術】従来の光学的文字読取装置において、多
数の文字種の書かれた帳票を読み取るためには、特公昭
59−52473号公報に記載されているように、文字
種選択機能を用いて、フィールドごとの文字種を制限し
、できるだけ精度を上げるようにしていた。たとえば、
図11に示す帳票20を読み取る場合には、以下のよう
になる。図11において、フィールドは21,22,2
3の三つに分かれており、フィールド21は数字“0”
“1”“2”のみ、フィールド22には英数字のみ、フ
ィールド23には英字のみしか書かれていないことがわ
かっている。そこで、あらかじめ図12に示すような文
字種表を作っておく。図12には3種類の文字種a,b
,cが定義されている。文字種aは、カテゴリ“0”“
1”“2”のみ、文字種bは数字“0”〜“9”、文字
種cは英字“A”〜“Z”であるとする。
2. Description of the Related Art Conventional optical character reading devices use a character type selection function, as described in Japanese Patent Publication No. 59-52473, in order to read documents with a large number of character types. The character types for each field were restricted to increase accuracy as much as possible. for example,
When reading the form 20 shown in FIG. 11, the process is as follows. In Figure 11, the fields are 21, 22, 2
3, and field 21 is the number “0”.
It is known that only "1" and "2" are written, only alphanumeric characters are written in field 22, and only alphabetic characters are written in field 23. Therefore, a character type table as shown in FIG. 12 is created in advance. Figure 12 shows three types of characters a and b.
, c are defined. Character type a is in category “0”
1" and "2", the character type b is the numbers "0" to "9", and the character type c is the alphabetic characters "A" to "Z".

【0003】フィールド21を読み取る時には文字種a
のみを使用すれば“0”〜“2”が読み取れ、フィール
ド22を読み取る時には文字種b,cを使用すれば英数
字が読み取れ、フィールド23を読み取る時には文字種
cを使用すれば英字のみが読み取れる。
[0003] When reading field 21, character type a
"0" to "2" can be read by using only the field 22, alphanumeric characters can be read by using the character types b and c when reading the field 22, and only alphabetic characters can be read by using the character type c when reading the field 23.

【0004】このように、フィールドごとに文字種を制
限することにより、マッチングする標準パターンの数を
減らすことが可能になり、処理速度、認識精度ともに向
上させることができる。
By limiting the character types for each field in this manner, it is possible to reduce the number of standard patterns to be matched, and it is possible to improve both processing speed and recognition accuracy.

【0005】[0005]

【発明が解決しようとする課題】従来の光学的文字読取
装置において、上記したように文字種を定義するために
は、帳票を読み取る前に、あらかじめ読取制御パラメー
タを作成し、その中で文字種表とフィールドとの対応付
けを行っていた。
[Problems to be Solved by the Invention] In conventional optical character reading devices, in order to define character types as described above, reading control parameters are created in advance before reading a form, and a character type table and a I was making a correspondence with the field.

【0006】ここで、文字種に含まれる文字数が数字や
英字等のように少ない時は、キーボードから入力するこ
とができたが、漢字を読むようになると文字種に含まれ
る文字数が2000字以上にもなり、とうてい一字一字
キーボードから入力することは不可能である。
[0006] When the number of characters included in a character type is small, such as numbers or letters, it was possible to input from the keyboard, but when you start reading kanji, the number of characters included in the character type increases to more than 2000 characters. Therefore, it is impossible to input each character from the keyboard.

【0007】本発明は、かかる従来技術の問題点に鑑み
なされたもので、文字種内の文字数が多数存在する場合
においても、文字種選択機能の利用を可能にすることを
目的としている。
The present invention has been made in view of the problems of the prior art, and it is an object of the present invention to enable the use of a character type selection function even when a character type has a large number of characters.

【0008】[0008]

【課題を解決するための手段】本発明の光学的文字読取
装置における文字認識方法は、光電変換手段によって現
在読み取りを行っているフィールドを指示するフィール
ド信号に基づいて、フィールド毎に該フィールドに書か
れる可能性のある文字種を定めた文字種指定マスク表を
用いて、該フィールドに対応する文字種指定マスクを定
め、さらに各文字種について、カテゴリ毎に当該文字種
が使用されるか否かを定めた文字種選択表を用いて、上
記カテゴリに対応する文字種選択信号を形成し、上記文
字種指定マスクと文字種選択信号の論理積をとり、その
結果に基づいて標準パターンとのマッチングの実行また
は中止、またはを指示することを特徴としている。
[Means for Solving the Problems] A character recognition method in an optical character reading device of the present invention is based on a field signal that indicates the field currently being read by a photoelectric conversion means, and writes data into the field on a field-by-field basis. A character type specification mask table that defines the character types that may be used is used to define a character type specification mask corresponding to the field, and furthermore, for each character type, character type selection is performed that determines whether or not the character type is used for each category. Using a table, form a character type selection signal corresponding to the above category, perform a logical product of the character type designation mask and the character type selection signal, and instruct execution, cancellation, or execution of matching with the standard pattern based on the result. It is characterized by

【0009】また、上記文字種選択表は、各カラム位置
対応に設けるようにしてもよいし、上記論理積の結果に
基づいて、マッチングの結果得られた候補文字の選択を
行うようにしてもよい。
Further, the character type selection table may be provided for each column position, or candidate characters obtained as a result of matching may be selected based on the result of the logical product. .

【0010】なお、上記文字種選択表は、光学的文字読
取装置が有している単語辞書から容易に作成できる。
The above character type selection table can be easily created from a word dictionary possessed by the optical character reading device.

【0011】[0011]

【作用】すなわち、本発明によれば、前記した文字種指
定マスクと文字種選択信号の論理積をとり、その結果に
基づいて標準パターンとのマッチングの実行または中止
等を指示するため、無駄なマッチング処理を行うことが
なくなり、読取速度及び読取精度の向上を図ることがで
きる。
[Operation] That is, according to the present invention, the above-described character type designation mask and the character type selection signal are ANDed, and based on the result, an instruction is given to execute or cancel matching with the standard pattern, thereby eliminating unnecessary matching processing. The reading speed and reading accuracy can be improved.

【0012】また、文字種指定マスクと文字種選択信号
の論理積をとり、その結果に基づいて行われる候補文字
の選択は、マッチングの結果得られた候補文字について
行われる。この場合、論理積の結果により候補文字中の
カテゴリが文字種選択されていないと判定された場合、
その候補順位を下げることにより、文字種選択されてい
るカテゴリだけが候補文字の上位を占めるようにするこ
とができる。
Further, the character type designation mask and the character type selection signal are logically ANDed, and candidate characters are selected based on the result of the logical product for the candidate characters obtained as a result of matching. In this case, if it is determined that the category in the candidate characters is not selected as a character type based on the result of the logical product,
By lowering the candidate ranking, only the category in which the character type has been selected can occupy a high rank among the candidate characters.

【0013】なお、漢字を読み取ることが可能な光学的
文字読取装置は、一般に読取精度を向上させるために、
単語辞書を具備している。この単語辞書は、読み取った
結果と単語を比較照合して、最も合った単語を出力する
ために使用されている。そして、上記単語辞書に乗って
いない文字は認識される必要がないため、この単語辞書
から作成された文字種選択表で十分なのである。
[0013] In order to improve reading accuracy, optical character reading devices capable of reading kanji generally have the following features:
Equipped with a word dictionary. This word dictionary is used to compare and match words with the reading results and output the most matching word. Since characters that are not included in the word dictionary do not need to be recognized, a character type selection table created from this word dictionary is sufficient.

【0014】[0014]

【実施例】以下、添付の図面に示す実施例により、更に
詳細に本発明について説明する。まず最初に、本発明に
おいて用いられる帳票と文字種表と文字種選択表と文字
種指定マスク表について説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will now be described in more detail with reference to embodiments shown in the accompanying drawings. First, a description will be given of a form, a character type table, a character type selection table, and a character type designation mask table used in the present invention.

【0015】図1に示すように、帳票30にはフィール
ドが3つあり、フィールド31には数字“0”“1”“
2”だけが書かれ、フィールド32には英数字だけが書
かれ、フィールド33には漢字だけが書かれるものとす
る。ただし、フィールド33には、都道府県名が書かれ
るものであり、光学的文字読取装置には都道府県名辞書
(ファイル名F1)があらかじめ準備されているものと
する。
As shown in FIG. 1, the form 30 has three fields, and the field 31 has numbers "0", "1", and
2” is written, only alphanumeric characters are written in field 32, and only kanji are written in field 33.However, field 33 is where the prefecture name is written, and the optical It is assumed that a prefecture name dictionary (file name F1) is prepared in advance in the character reading device.

【0016】次に、図2に示すように、文字種表を定義
する。文字種a〜cは、図12に示したものと同じであ
る。文字種dは、文字種a〜cと異なり、ファイル名F
1によって表示されている。ファイル名を示すために、
先頭に“&”マークを付加している。ここで、ファイル
名F1は前記したように都道府県名の入っている都道府
県名辞書を意味している。
Next, as shown in FIG. 2, a character type table is defined. Character types a to c are the same as those shown in FIG. Character type d is different from character types a to c, and file name F
1 is displayed. To indicate the file name,
An “&” mark is added at the beginning. Here, the file name F1 means a prefecture name dictionary containing prefecture names as described above.

【0017】図2に示す文字種表に基づいて、図3に示
す文字種選択表と図5に示す文字種指定マスク表を作成
する。文字種選択表は、図3に示すように、光学的文字
読取装置において使用される全ての標準パターンと一対
一で対応している。それぞれのカテゴリは文字種a,b
,c,dに対応するフラグを有しており、文字種内にそ
のカテゴリが含まれていればフラグが“1”に設定され
る。文字種aは数字“0”“1”“2”しか使用しない
ため、“0”“1”“2”だけが“1”で他の全てのカ
テゴリは“0”である。文字種b,cについても対応す
る数字と英字のカテゴリのみフラグが“1”になってい
る。
Based on the character type table shown in FIG. 2, a character type selection table shown in FIG. 3 and a character type designation mask table shown in FIG. 5 are created. As shown in FIG. 3, the character type selection table has one-to-one correspondence with all standard patterns used in optical character reading devices. Each category is character type a, b
, c, and d, and if that category is included in the character type, the flag is set to "1". Since character type a uses only the numbers "0,""1," and "2," only "0,""1," and "2" are "1" and all other categories are "0." Regarding character types b and c, only the corresponding numeric and alphabetic categories have flags set to "1".

【0018】文字種dの場合には、次のようにして作成
される。あらかじめ、全てのカテゴリのフラグをオフに
しておく。次に、図2に示す文字種表にはファイル名を
示す“&”とファイル名F1が格納されているため、フ
ァイル名F1の示す都道府県名辞書内の全ての単語辞書
をロードする。次に、単語に含まれる文字から文字種の
一覧表を作成する。この文字種の一覧表から、文字種a
〜cと同様にして文字種選択表を作成する。このような
文字種選択表は、光学的文字読取装置において、辞書か
ら容易に作成することができる。
In the case of character type d, it is created as follows. First, turn off the flags for all categories. Next, since the character type table shown in FIG. 2 stores "&" indicating a file name and the file name F1, all word dictionaries in the prefecture name dictionary indicated by the file name F1 are loaded. Next, a list of character types is created from the characters included in the word. From this list of character types, character type a
Create a character type selection table in the same manner as in ~c. Such a character type selection table can be easily created from a dictionary in an optical character reading device.

【0019】フィールド毎にどの文字種を使用するかを
指定することにより、文字種指定マスク表が作成される
。文字種指定マスク表は、図4に示すような構成になっ
ている。フィールド31では文字種aだけが使用される
ため、“1000”のマスクが作成される。フィールド
32では文字種b,cだけが使用されるため、“011
0”のマスクが作成される。フィールド33では文字種
dだけが使用されるため、“0001”のマスクが作成
させる。このような文字種指定マスクは、光学的文字読
取装置において、容易に作成することができる。
A character type specification mask table is created by specifying which character type is to be used for each field. The character type designation mask table has a structure as shown in FIG. Since only character type a is used in field 31, a mask of "1000" is created. In field 32, only character types b and c are used, so “011
A mask of "0" is created. Since only the character type d is used in the field 33, a mask of "0001" is created. Such a character type specification mask can be easily created in an optical character reading device. I can do it.

【0020】次に、上記した文字種選択表と文字種指定
マスクを用いて、標準パターンと未知パターンのマッチ
ング回数を制限し、処理の高速化を図る場合について説
明する。図5は本発明の一実施例を示すブロック図であ
る。図5に示す実施例において、1は光電変換手段であ
り、帳票を光学的に走査し帳票イメージをメモリに取り
込む。2はフィールド抽出手段であり、光電変換手段1
の出力及びあらかじめ定められている読み取り制御パラ
メータから与えられたフィールド位置情報に基づいて、
現在読取を行っているフィールドを同定する。このフィ
ールド抽出手段2は読み取りの対象となっているフィー
ルドを示すフィールド指示信号6を出力する。3は1文
字切出手段であり、フィールド中の文字を一文字ずつ切
り出す。4は特徴抽出手段であり、1文字切出手段3か
ら出力される文字パタンの特徴抽出を行う。5は判定手
段であり、標準パタンメモリ14に記憶されている多数
の標準パタンを一つずつ取り出し、特徴抽出手段4によ
って特徴抽出された未知パタンの特徴とマッチングをと
り、最も似かよっている標準パタンについてそのカテゴ
リを出力する。7は文字種指定マスク選択手段であり、
フィールド抽出手段2から出力されたフィールド指示信
号6をアドレスとして用いて、文字種指定マスクメモリ
8に格納されている文字種指定マスクを読み出して文字
種指定マスク信号9を出力する。ここで、文字種指定マ
スクメモリ8は、図4に示す文字種指定マスク表を記憶
しているものとする。10は文字種選択機能部である。 この文字種選択機能部10は、標準パターンメモリ14
から出力されるカテゴリ指示信号13に基づいて、文字
種選択メモリ11をアクセスする。ここで、文字種選択
メモリ11は、図3に示す文字種選択表を記憶している
ものとする。文字種選択機能部10は、文字種選択メモ
リ11から上記カテゴリに対応する文字種選択信号を読
み出し、次に文字種指定マスク選択手段7から出力され
る文字種指定マスク信号9と読み出した文字種選択信号
15の間で論理積をとる。論理積をとった結果“1”が
得られた場合、文字種選択機能部10は選択信号12を
“1”として出力し、判定手段5に対して標準パターン
メモリ14から出力されている標準パターンと特徴抽出
手段4から出力されている未知パタンの間の判定処理を
実行を指示する。また、論理積をとった結果“0”が得
られた場合、文字種選択機能部10は選択信号12を“
0”として出力し、判定手段5に対して標準パターンメ
モリ14から出力されている標準パターンと特徴抽出手
段4から出力されている未知パタンの間の判定処理の中
止を指示する。
Next, a case will be described in which the above-described character type selection table and character type designation mask are used to limit the number of matchings between a standard pattern and an unknown pattern, thereby speeding up the processing. FIG. 5 is a block diagram showing one embodiment of the present invention. In the embodiment shown in FIG. 5, 1 is a photoelectric conversion means that optically scans a form and captures the form image into a memory. 2 is a field extraction means, and photoelectric conversion means 1
Based on the field position information given from the output of and predetermined reading control parameters,
Identifies the field currently being read. This field extraction means 2 outputs a field instruction signal 6 indicating the field to be read. Reference numeral 3 denotes a single character cutting means, which cuts out characters in the field one by one. Reference numeral 4 denotes a feature extracting means, which extracts features of the character pattern output from the single character cutting means 3. Reference numeral 5 denotes a determining means, which extracts a large number of standard patterns stored in the standard pattern memory 14 one by one, performs matching with the features of the unknown pattern extracted by the feature extracting means 4, and selects the most similar standard pattern. Output the category for. 7 is a character type designation mask selection means;
Using the field designation signal 6 outputted from the field extraction means 2 as an address, the character type designation mask stored in the character type designation mask memory 8 is read out, and a character type designation mask signal 9 is output. Here, it is assumed that the character type designation mask memory 8 stores a character type designation mask table shown in FIG. 10 is a character type selection function section. This character type selection function section 10 has a standard pattern memory 14.
The character type selection memory 11 is accessed based on the category instruction signal 13 output from the character type selection memory 11. Here, it is assumed that the character type selection memory 11 stores a character type selection table shown in FIG. The character type selection function section 10 reads out the character type selection signal corresponding to the above-mentioned category from the character type selection memory 11, and then selects between the character type designation mask signal 9 outputted from the character type designation mask selection means 7 and the read character type selection signal 15. Take a logical product. If “1” is obtained as a result of the logical product, the character type selection function unit 10 outputs the selection signal 12 as “1”, and the character type selection function unit 10 outputs the selection signal 12 as “1”, and the standard pattern output from the standard pattern memory 14 and the It instructs execution of a judgment process between unknown patterns output from the feature extraction means 4. Further, if “0” is obtained as a result of the logical product, the character type selection function unit 10 outputs the selection signal 12 as “0”.
0'' and instructs the determining means 5 to stop the determination process between the standard pattern output from the standard pattern memory 14 and the unknown pattern output from the feature extracting means 4.

【0021】図5に示す実施例において、帳票上の文字
の読み取りは、次のように行われる。以下の説明では、
図1に示す帳票30を図2に示す文字種表に基づいて読
み取る場合を例にしてついて説明する。また、文字種選
択表は図3に示すように作成され、文字種指定マスク表
は図4に示すように作成されているものとする。
In the embodiment shown in FIG. 5, characters on a form are read as follows. In the following explanation,
An example in which the form 30 shown in FIG. 1 is read based on the character type table shown in FIG. 2 will be described. It is also assumed that the character type selection table is created as shown in FIG. 3, and the character type designation mask table is created as shown in FIG.

【0022】光電変換手段1が帳票30を走査すること
によって得られたパターンは、図示しないメモリに格納
され、その後フィールド抽出手段2が現在読取を行って
いるフィールドの抽出を行う。フィールド抽出手段2は
、抽出されたフィールドのフィールド指示信号6を出力
する。例えば、図1に示すフィールド31が読取の対象
になっている場合には、フィールド指示信号6としてf
31が出力される。同様に、フィールド32,33が読
取の対象になっている場合には、それぞれフィールド指
示信号6としてf31,f32が出力されるのもとする
The pattern obtained by scanning the form 30 by the photoelectric conversion means 1 is stored in a memory (not shown), and then the field extraction means 2 extracts the field currently being read. The field extraction means 2 outputs a field instruction signal 6 of the extracted field. For example, if the field 31 shown in FIG. 1 is to be read, the field instruction signal 6 is f.
31 is output. Similarly, when fields 32 and 33 are to be read, f31 and f32 are output as field instruction signals 6, respectively.

【0023】文字種指定マスク選択手段7は、上記フィ
ールド指示信号6に基づいて、文字種指定マスクメモリ
8から当該フィールド指示信号6に対応する文字種指定
マスクを読み出して、文字種指定マスク信号9を出力す
る。この動作と並行して、1文字切出手段3は、フィー
ルド中の文字を1文字ずつ切り出す。その後、特徴抽出
手段4は、切出された1文字について特徴抽出を行い、
判定手段5に出力する。  次に、文字種選択機能部1
0は、標準パターンメモリ14から出力されるカテゴリ
指示信号13に基づいて、文字種選択メモリ11をアク
セスし、上記カテゴリ指示信号13に対応する文字種選
択表のデータを文字種選択信号15として読み出す。そ
して、次に文字種指定マスク選択手段7から出力される
文字種指定マスク信号9と読み出した文字種選択信号1
5の間で論理積をとる。すなわち、標準パターンと文字
種選択表は一対一に対応付けられているので、どの標準
パターンを使用すれば良いかは、文字選択信号15と文
字種指定マスク信号9の論理積を取ることによって求め
られる。たとえば、カテゴリ“0”では、図3に示す文
字種選択表の内容は“1100”であり、フィールド3
1における文字種指定マスク“1000”と論理積をと
ると“1000”となり、結果が“0”以外であるので
、文字種選択機能部10は選択信号12として“1”を
出力する。したがって、この場合には、判定手段5は、
標準パターンメモリ14から出力されるカテゴリ“0”
の標準パターンと特徴抽出手段4から出力される未知パ
ターンのマッチングをとる。また、カテゴリ“3”以上
の標準パターンでは、上記論理積は“0000”となり
、結果が“0”のため、文字種選択機能部10は選択信
号12として“0”を出力する。したがって、この場合
には、判定手段5は、マッチングを行わない。
The character type designation mask selection means 7 reads the character type designation mask corresponding to the field designation signal 6 from the character type designation mask memory 8 based on the field designation signal 6, and outputs the character type designation mask signal 9. In parallel with this operation, the character cutting means 3 cuts out the characters in the field one by one. After that, the feature extracting means 4 extracts features for the extracted character,
It is output to the determination means 5. Next, character type selection function section 1
0 accesses the character type selection memory 11 based on the category instruction signal 13 outputted from the standard pattern memory 14, and reads out data in the character type selection table corresponding to the category instruction signal 13 as the character type selection signal 15. Next, the character type designation mask signal 9 outputted from the character type designation mask selection means 7 and the read character type selection signal 1
Perform a logical product between 5. That is, since there is a one-to-one correspondence between the standard pattern and the character type selection table, which standard pattern should be used can be determined by taking the logical product of the character selection signal 15 and the character type designation mask signal 9. For example, for category "0", the content of the character type selection table shown in Figure 3 is "1100", and field 3
When the logical product is ANDed with the character type designation mask "1000" in 1, it becomes "1000", and since the result is other than "0", the character type selection function unit 10 outputs "1" as the selection signal 12. Therefore, in this case, the determining means 5
Category “0” output from standard pattern memory 14
The standard pattern is matched with the unknown pattern output from the feature extraction means 4. Further, for standard patterns of category "3" or higher, the above-mentioned logical product is "0000", and since the result is "0", the character type selection function section 10 outputs "0" as the selection signal 12. Therefore, in this case, the determining means 5 does not perform matching.

【0024】以上の例では、文字種選択表のすべてのカ
テゴリについて、初めから終わり論理積をとることによ
り、当該標準パターンによいるマッチング実行の可否を
決定した。しかし、例えば数字しか読まないことが分か
っているのに、すべてのカテゴリについて、論理積をと
ってマッチング実行の可否を決定するのは不経済である
。このような場合には、次のようにすることにより、調
べる範囲を限定することができる。
In the above example, by performing a logical product from beginning to end for all categories in the character type selection table, it was determined whether matching based on the standard pattern could be executed. However, even though it is known that, for example, only numbers are read, it is uneconomical to perform a logical product for all categories to determine whether or not to perform matching. In such a case, the range to be investigated can be limited by doing the following.

【0025】すなわち、あらかじめ、数字、英字、仮名
、漢字等のカテゴリ群別に、文字種選択表と同様な表(
カテゴリ群選択表と名付ける)を作成しておく。カテゴ
リ群選択表は、カテゴリ群中に含まれるカテゴリの文字
種選択表の論理和をとることによって作成される。カテ
ゴリ群の選択は、カテゴリの選択の場合と同じように、
カテゴリ群選択表と文字種選択マスクとの論理積をとる
ことによって行われる。たとえば、数字カテゴリ群とマ
スクの論理積が1であれば、数字が使用されることがわ
かり、0であれば数字は使用されないことがわかる。同
様に英字、仮名、漢字等の各カテゴリ群の使用可否を決
め、使用すべきカテゴリのみ文字種選択をすれば他のカ
テゴリとの整合チェックをすることなく、処理の高速化
が図れる。図6に上記カテゴリ群選択表の一例を示す。
That is, a table similar to the character type selection table (
Create a category group selection table (named category group selection table). The category group selection table is created by calculating the logical sum of the character type selection tables of the categories included in the category group. Selecting a group of categories is done in the same way as selecting a category.
This is done by performing a logical product between the category group selection table and the character type selection mask. For example, if the logical product of the number category group and the mask is 1, it can be seen that the number is used, and if it is 0, it can be seen that the number is not used. Similarly, by deciding whether to use each category group such as alphabetic characters, kana characters, kanji characters, etc., and selecting character types only for the categories to be used, processing speed can be increased without checking consistency with other categories. FIG. 6 shows an example of the category group selection table.

【0026】図7は、本発明の他の一実施例を示すブロ
ック図である。図7に示す実施例が図1に示す実施例と
異なっている点は、1文字切り出し手段3からカラム位
置信号16が出力され、このカラム位置信号16が文字
種選択機能10に入力されている点である。ここで、カ
ラム位置信号16は、フィールド内における文字位置を
示すものである。カラム位置信号16は、前記した文字
種選択表において、書かれた文字の位置情報を利用し、
より効率的なマッチングを行うために使用される。
FIG. 7 is a block diagram showing another embodiment of the present invention. The embodiment shown in FIG. 7 differs from the embodiment shown in FIG. It is. Here, the column position signal 16 indicates the character position within the field. The column position signal 16 uses the position information of the written character in the character type selection table described above,
Used for more efficient matching.

【0027】図8はカラム位置ごとの文字種選択表の一
例示す。図9において、カラムは1からnまであること
にする。ここで、nは単語の最大長により決まる。以下
の例では、単語辞書は都道府県名辞書であると仮定する
。最初に、単語辞書からカラム1に出現するカテゴリだ
けを集めてカテゴリ一覧表を作成する。すなわち、都道
府県名のカラム1に出現するカテゴリは、東京都の“東
”、神奈川県の“神”など数十種類に限定される。 このカテゴリ一覧表を使用して、カラム1用の文字種選
択表を作成する。図8に示す文字種選択表K1はカラム
1用の文字種選択表の一例である。同様にして、カラム
2からカラムnにそれぞれ出現するカテゴリのみを集め
てカテゴリ一覧表を作成し、図8に示すように、カラム
2からカラムnの文字種選択表K2〜Knを作成する。
FIG. 8 shows an example of a character type selection table for each column position. In FIG. 9, the columns are 1 to n. Here, n is determined by the maximum length of the word. In the following example, it is assumed that the word dictionary is a prefecture name dictionary. First, a category list is created by collecting only the categories that appear in column 1 from the word dictionary. That is, the categories that appear in column 1 of prefecture names are limited to several dozen types, such as "Higashi" in Tokyo and "Kami" in Kanagawa Prefecture. Using this category list, create a character type selection table for column 1. The character type selection table K1 shown in FIG. 8 is an example of a character type selection table for column 1. Similarly, a category list is created by collecting only the categories that appear in columns 2 to n, and character type selection tables K2 to Kn for columns 2 to n are created as shown in FIG.

【0028】図8に示すカラム位置ごとの文字種選択表
K1〜Knは、以下のようにして使用される。すなわち
、図8に示す光電変換手段1により帳票を走査し、帳票
イメージを図示しないメモリ上に取り込む。フィールド
抽出手段2は読取パラメータに示されたフィールド位置
情報から現在読取対象となっているフィールドを抽出し
、フィールド指示信号6を文字種指定マスク選択手段7
に出力する。1文字切り出し手段3は、フィールド抽出
手段2から出力される帳票イメージから1文字ずつ文字
を切り出し、特徴抽出手段4に出力する。特徴抽出手段
4は、一文字の特徴抽出を行い、判定手段5に出力する
The character type selection tables K1 to Kn for each column position shown in FIG. 8 are used as follows. That is, a form is scanned by the photoelectric conversion means 1 shown in FIG. 8, and a form image is captured onto a memory (not shown). The field extraction means 2 extracts the field currently being read from the field position information indicated in the reading parameters, and sends the field instruction signal 6 to the character type designation mask selection means 7.
Output to. The character extraction means 3 extracts characters one by one from the form image output from the field extraction means 2 and outputs them to the feature extraction means 4. The feature extraction means 4 extracts the features of one character and outputs it to the determination means 5.

【0029】一方、フィールド抽出手段2により出力さ
れたフィールド指示信号6により、文字種指定マスク選
択手段7は文字種指定マスクメモリ8をアクセスする。 そして、文字種指定マスク選択手段7は、文字種指定マ
スクメモリ8から読み出した文字種指定マスク信号9を
出力する。文字種選択機能10は、1文字切り出し手段
3より出力されたカラム位置信号16により、文字種選
択メモリ中のカラム位置に対応する文字種選択表(K1
〜Knの1つ)を選び、さらに標準パタンメモリ14よ
り出力されたカテゴリ指示信号13に基づいて上記選ば
れた文字種選択表をアクセスして、文字種選択信号15
と文字種選択マスク信号9との論理積を求める。もし、
論理積が“0”でなければ選択信号12みよりその標準
パタンは選択され、“0”であれば選択されない。判定
手段5は、選択された標準パターンとのみ、特徴抽出手
段4から出力される未知パターンとマッチングをとるこ
とにより、最も類似したカテゴリを答えとして出力する
On the other hand, the character type designation mask selection means 7 accesses the character type designation mask memory 8 in response to the field instruction signal 6 outputted by the field extraction means 2. Then, the character type designation mask selection means 7 outputs a character type designation mask signal 9 read out from the character type designation mask memory 8. The character type selection function 10 selects a character type selection table (K1
~Kn), and further accesses the selected character type selection table based on the category instruction signal 13 output from the standard pattern memory 14, and selects the character type selection signal 15.
and the character type selection mask signal 9. if,
If the AND is not "0", the standard pattern is selected based on the selection signal 12, and if it is "0", it is not selected. The determining means 5 matches only the selected standard pattern with the unknown pattern output from the feature extracting means 4, and outputs the most similar category as an answer.

【0030】以上の説明から明らかなように、単語辞書
を利用すると、全体としてのカテゴリの使用/非使用情
報のみならず、カラム位置ごとのカテゴリの使用/非使
用状況を知ることができる。また、カラム位置ごとに使
用されるカテゴリの種類が異なるので、カラム位置ごと
に文字種を選択することにより、読取精度はさらに向上
する。
As is clear from the above explanation, by using the word dictionary, it is possible to know not only the use/non-use information of categories as a whole, but also the use/non-use status of categories for each column position. Furthermore, since the type of category used is different for each column position, reading accuracy can be further improved by selecting a character type for each column position.

【0031】図9は本発明の他の実施例を示すブロック
図である。図9に示す実施例が図1に示す実施例と異な
っている点は、候補選択手段17が判定手段5の後段に
設けられ、図1においては判定手段5に入力されている
文字種選択信号12が候補選択手段17に入力される点
である。
FIG. 9 is a block diagram showing another embodiment of the present invention. The embodiment shown in FIG. 9 is different from the embodiment shown in FIG. is input to the candidate selection means 17.

【0032】一般に、単語照合を行う場合、単語辞書の
中に帳票上に書かれる単語が完全に含まれている場合に
は、かなり精度良く認識することができる。しかし、単
語辞書が不備で、帳票上に書かれた単語が辞書中に存在
しない場合には、誤って単語が照合されるため、認識精
度が低下することがある。図1に示す認識方式において
も同様に、単語辞書に含まれていないカテゴリはマッチ
ングするべき標準パターンがスキップされてしまうため
、正解が候補にあがってこない。図9に示す実施例は、
このような場合に適用されるものである。
In general, when performing word matching, if the word written on the form is completely included in the word dictionary, recognition can be achieved with fairly high accuracy. However, if the word dictionary is inadequate and the word written on the form does not exist in the dictionary, the word will be compared incorrectly, which may reduce recognition accuracy. Similarly, in the recognition method shown in FIG. 1, the standard pattern to be matched is skipped for categories that are not included in the word dictionary, so the correct answer is not selected as a candidate. The embodiment shown in FIG.
This applies to such cases.

【0033】すなわち、図9の実施例に示すように、判
定手段5は全てのカテゴリについて未知パターンと標準
パターンのマッチングを行い、文字種選択はマッチング
の結果得られた候補文字について候補選択手段17にお
いて行うようにする。図9においては、マッチングの結
果得られた複数の候補カテゴリのうちの上位からあらか
じめ定められた数の候補カテゴリが、候補選択手段17
により候補文字メモリ18に記憶される。ここで、候補
選択手段17は、選択信号12により候補文字中のカテ
ゴリが文字種選択されていないと判定した場合、その候
補順位を下げることにより、文字種選択されているカテ
ゴリだけが上位を占めるようにすることができる。図9
に示す実施例においては、単語辞書にないカテゴリがフ
ィールドに書かれた場合、上位には上がらないが候補文
字中から削除されることなく、候補文字中に含まれてい
るため、候補文字表示及び選択の処理により認識するこ
とができ、確実に誤読を防止できる。
That is, as shown in the embodiment of FIG. 9, the determining means 5 performs matching between unknown patterns and standard patterns for all categories, and character type selection is performed in the candidate selecting means 17 for candidate characters obtained as a result of matching. Let's do it. In FIG. 9, a predetermined number of candidate categories from the top among a plurality of candidate categories obtained as a result of matching are selected by the candidate selection means 17.
is stored in the candidate character memory 18. Here, when the candidate selection means 17 determines based on the selection signal 12 that a category among the candidate characters is not selected as a character type, the candidate selection means 17 lowers the candidate ranking so that only the category for which the character type has been selected occupies a higher rank. can do. Figure 9
In the example shown in , if a category that is not in the word dictionary is written in the field, it will not be ranked high, but it will not be deleted from the candidate characters, but will be included in the candidate characters, so the candidate character display and This can be recognized through selection processing, and misreading can be reliably prevented.

【0034】本発明の他の実施例を以下に示す。単語辞
書に単語の出現頻度が含まれている場合には、単語の出
現頻度を利用すれば、さらに認識精度を向上させること
ができる。未知パタンと標準パタンの類字度をS、カテ
ゴリの出現頻度をhとすると、出現頻度を考慮に入れた
評価関数rは、次の数1又は数2で表される。
Other embodiments of the invention are shown below. If the word dictionary includes word appearance frequencies, recognition accuracy can be further improved by using the word appearance frequencies. Assuming that the degree of similarity between the unknown pattern and the standard pattern is S, and the frequency of appearance of a category is h, the evaluation function r that takes the frequency of appearance into consideration is expressed by the following Equation 1 or Equation 2.

【0035】[0035]

【数1】[Math 1]

【0036】[0036]

【数2】[Math 2]

【0037】数1、数2から明らかなように、出現頻度
hの大きいカテゴリは、評価値rが大きくなり、認識さ
れやすくなる。
As is clear from Equations 1 and 2, a category with a high appearance frequency h has a large evaluation value r and is easily recognized.

【0038】単語辞書からカテゴリの出現頻度hを求め
るためには、以下のようにする。カテゴリiがk個の単
語中に含まれていたとすると、出現頻度h(i)は次の
数3で定義される。
In order to obtain the appearance frequency h of a category from the word dictionary, proceed as follows. Assuming that category i is included in k words, the frequency of appearance h(i) is defined by the following equation 3.

【0039】[0039]

【数3】[Math 3]

【0040】単語の出現頻度が単語辞書中に具備されて
いる場合には、以下のようにする。カテゴリiが単語1
、単語2、…単語kに含まれており、それぞれの単語の
出現頻度はT1,T2,…Tkであったとする。カテゴ
リiの出現頻度h(i)は
[0040] When the frequency of appearance of a word is included in the word dictionary, the following procedure is performed. Category i is word 1
, word 2, . . . are included in word k, and the frequency of appearance of each word is T1, T2, . . . Tk. The appearance frequency h(i) of category i is

【0041】[0041]

【数4】[Math 4]

【0042】で定義される。It is defined as:

【0043】このように定義された出現頻度は、図10
に示すように、文字種選択表の中に入れておく。図10
に示す例では、出現頻度は0〜10の10ランクに分け
られ、最も出現頻度の高いものを10とした。また、0
はその文字が選択されていないことを示す。
The appearance frequency defined in this way is shown in FIG.
Put it in the character type selection table as shown in the figure below. Figure 10
In the example shown in , the appearance frequency is divided into 10 ranks from 0 to 10, with 10 being the highest appearance frequency. Also, 0
indicates that the character is not selected.

【0044】与えられたカテゴリの文字種選択表と文字
種指定マスクを比較し、文字種指定マスクの“1”の立
っている文字種の出現頻度を見る。すべての文字種で出
現頻度が0であると、そのカテゴリは使用されない。ど
れかの文字種で出現頻度が0以外であれば、そのカテゴ
リは使用される。複数の文字種で出現頻度が0でない場
合には、その中で最も大きな値を用いて、評価値rを計
算する。
The character type selection table for the given category is compared with the character type designation mask, and the frequency of appearance of character types with "1" in the character type designation mask is determined. If the appearance frequency is 0 for all character types, that category is not used. If the appearance frequency of any character type is other than 0, that category is used. If the frequency of appearance is not 0 for multiple character types, the evaluation value r is calculated using the largest value among them.

【0045】上記出現頻度は、図1、図5、図7に示さ
れた実施例のみならず、図9に示す実施例においても適
用することができる。すなわち、図9に示す実施例にお
いては、文字種選択機能部10と候補選択手段17にお
いて、各候補文字毎に出現頻度を求め、最も大きな出現
頻度順に候補の順位付けを変更するか、あるいは評価値
rの大きさによって候補の順位付けを行うことにより、
出現頻度の大きい文字を上位にもって行くことができる
The frequency of appearance described above can be applied not only to the embodiments shown in FIGS. 1, 5, and 7, but also to the embodiment shown in FIG. That is, in the embodiment shown in FIG. 9, the character type selection function unit 10 and the candidate selection means 17 calculate the appearance frequency for each candidate character, and change the ranking of the candidates in order of the highest appearance frequency, or change the ranking of the candidates in order of the highest appearance frequency, or By ranking candidates according to the size of r,
Characters that appear frequently can be moved to the top.

【0046】なお、今までの説明では、単語辞書を用い
て説明してきたが、必ずしも単語辞書を用いないで文字
選択表を作成することが可能である。すなわち、1文字
ずつ使用すべき文字を、1文字単語(複数の文字から得
られる単語ではなく、1文字だけで構成される単語)と
して、単語辞書と同一の形式で作成したものを使用すれ
ば、上記実施例と同様の効果が得られる。
Note that although the explanation so far has been made using a word dictionary, it is possible to create a character selection table without necessarily using a word dictionary. In other words, if you use a word that is created in the same format as a word dictionary, with each character that should be used one by one, as a one-character word (a word consisting of only one character, not a word obtained from multiple characters). , the same effects as in the above embodiment can be obtained.

【0047】以上の説明から明らかなように、上記実施
例によれば、次のような効果が得られる。
As is clear from the above description, according to the above embodiment, the following effects can be obtained.

【0048】選択された標準パターンだけ使用してマッ
チングするため、認識精度・認識速度ともに向上する。
Since matching is performed using only the selected standard pattern, both recognition accuracy and recognition speed are improved.

【0049】文字種選択表は単語辞書から自動的に構成
されるため、文字種選択表を入力するためのキーイン作
業は不要である。
Since the character type selection table is automatically constructed from the word dictionary, no key-in operation is required to input the character type selection table.

【0050】文字種選択表は単語辞書から自動的に構成
されるため、カラム位置を考慮に入れた文字種選択表を
も作成することができる。
Since the character type selection table is automatically constructed from the word dictionary, it is also possible to create a character type selection table that takes column positions into account.

【0051】単語辞書に単語出現頻度が入っている場合
には、カテゴリごとの出現頻度を利用した認識結果が得
られる。
[0051] If the word dictionary contains word appearance frequencies, recognition results can be obtained using the appearance frequencies for each category.

【0052】単語辞書が完備していない場合には、図9
に示すように、選択信号による文字種選択の機能を候補
選択機能に取り入れることにより、認識精度を向上し、
かつ容易に修正することを可能にすることができる。
[0052] If the word dictionary is not complete, please refer to Figure 9.
As shown in Figure 2, recognition accuracy is improved by incorporating the character type selection function using selection signals into the candidate selection function.
and can be easily modified.

【0053】[0053]

【発明の効果】本発明によれば、以上説明したように構
成されているため、以下に記載されているような効果を
有する。
According to the present invention, since it is constructed as described above, it has the following effects.

【0054】文字種内の文字数が多数存在する場合にお
いても、文字種選択機能の利用が可能になるため、認識
精度と認識速度がともに向上する効果がある。
Even when there are a large number of characters in a character type, the character type selection function can be used, which has the effect of improving both recognition accuracy and recognition speed.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】帳票の一例を示す説明図。FIG. 1 is an explanatory diagram showing an example of a form.

【図2】文字種表の一例を示す説明図。FIG. 2 is an explanatory diagram showing an example of a character type table.

【図3】文字種選択表の一例を示す説明図。FIG. 3 is an explanatory diagram showing an example of a character type selection table.

【図4】文字種指定マスク表の一例を示す説明図。FIG. 4 is an explanatory diagram showing an example of a character type specification mask table.

【図5】本発明の実施例を示すブロック図。FIG. 5 is a block diagram showing an embodiment of the present invention.

【図6】カテゴリ群選択表の一例を示す説明図。FIG. 6 is an explanatory diagram showing an example of a category group selection table.

【図7】本発明の他の実施例を示すブロック図。FIG. 7 is a block diagram showing another embodiment of the present invention.

【図8】カラム位置毎に作成された文字種選択表の一例
示す説明図。
FIG. 8 is an explanatory diagram showing an example of a character type selection table created for each column position.

【図9】本発明の他の実施例を示すブロック図。FIG. 9 is a block diagram showing another embodiment of the present invention.

【図10】単語の出現頻度を考慮した文字種選択表の一
例を示す説明図。
FIG. 10 is an explanatory diagram showing an example of a character type selection table that takes into account the frequency of appearance of words.

【図11】帳票の一例を示す説明図。FIG. 11 is an explanatory diagram showing an example of a form.

【図12】文字種表の一例を示す説明図。FIG. 12 is an explanatory diagram showing an example of a character type table.

【符号の説明】[Explanation of symbols]

1  光電変換手段 2  フィールド抽出手段 3  1文字切出手段 4  特徴抽出手段 5  判定手段 6  フィールド指示信号 7  文字種指定マスク選択手段 8  文字種指定マスクメモリ 9  文字種指定マスク信号 10  文字種選択機能部 11  文字種選択メモリ 12  選択信号 13  カテゴリ指示信号 14  標準パターンメモリ 15  文字種選択信号 16  カラム位置信号 17  候補選択手段 18  候補文字メモリ 1 Photoelectric conversion means 2 Field extraction means 3 Single character cutting means 4 Feature extraction means 5 Judgment means 6 Field instruction signal 7 Character type specification mask selection means 8 Character type specification mask memory 9 Character type specification mask signal 10 Character type selection function section 11 Character type selection memory 12 Selection signal 13 Category instruction signal 14 Standard pattern memory 15 Character type selection signal 16 Column position signal 17 Candidate selection means 18 Candidate character memory

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】帳票上に設けられたフィールド内に記入さ
れた文字を読み取り、現在読み取りを行っている帳票上
のフィールドを同定し、読み取った文字を一文字ずつ切
り出し、切り出された文字と標準パタ−ンとのマッチン
グをとる文字認識手段と、上記標準パーターンを記憶し
ており、上記文字認識手段に対して各カテゴリに対応す
る標準パターンを順次読み出す標準パターンメモリとを
備えた光学的文字読取装置において、上記文字認識手段
から出力される現在読み取りを行っているフィールドを
指示するフィールド指示信号に基づいて、フィールド毎
に該フィールドに書かれる可能性のある文字種を定めた
文字種指定マスク表から該フィールドに対応する文字種
指定マスクを示す文字種指定マスク信号を形成し、さら
に、各文字種について、カテゴリ毎に当該文字種が使用
されるか否かを定めた文字種選択表から上記カテゴリに
対応する文字種選択信号を形成し、上記文字種指定マス
ク信号と文字種選択信号の論理積をとり、その結果に基
づいて、上記文字認識手段に対して、標準パターンとの
マッチングの実行または中止を指示することを特徴とす
る光学的文字読取装置における文字認識方法。
Claim 1: Read characters written in fields provided on a form, identify the field on the form that is currently being read, cut out the read characters one by one, and combine the cut out characters with a standard pattern. - an optical character reading device comprising a character recognition means for matching with the character recognition means; and a standard pattern memory storing the standard pattern and sequentially reading out standard patterns corresponding to each category to the character recognition means. , based on the field instruction signal output from the character recognition means that indicates the field currently being read, the field is selected from a character type designation mask table that determines the character types that may be written in the field for each field. A character type designation mask signal indicating a character type designation mask corresponding to the character type is formed, and for each character type, a character type selection signal corresponding to the above category is generated from a character type selection table that determines whether or not the character type is used for each category. the character type designation mask signal and the character type selection signal, and based on the result, instructs the character recognition means to execute or cancel matching with the standard pattern. A character recognition method in a digital character reading device.
【請求項2】帳票上に設けられたフィールド内に記入さ
れた文字を読み取り、現在読み取りを行っている帳票上
のフィールドを同定し、読み取った文字を一文字ずつ切
り出して各読み取り文字のカラム位置を同定し、さらに
切り出された文字と標準パタ−ンとのマッチングをとる
文字認識手段と、上記標準パーターンを記憶しており、
上記文字認識手段に対して各カテゴリに対応する標準パ
ターンを順次読み出す標準パターンメモリとを備えた光
学的文字読取装置において、上記文字認識手段から出力
される現在読み取りを行っているフィールドを指示する
フィールド指示信号に基づいて、フィールド毎に該フィ
ールドに書かれる可能性のある文字種を定めた文字種指
定マスク表から該フィールドに対応する文字種指定マス
クを示す文字種指定マスク信号を形成し、さらに、各文
字種について、カテゴリ毎に当該文字種が使用されるか
否かを定めた文字種選択表を各カラム位置対応に設け、
上記カラム位置対応に設けられた文字種選択表から上記
カテゴリ及びカラム位置に対応する文字種選択信号を形
成し、上記文字種指定マスク信号と文字種選択信号の論
理積をとり、その結果に基づいて、上記文字認識手段に
対して、標準パターンとのマッチングの実行または中止
を指示することを特徴とする光学的文字読取装置におけ
る文字認識方法。
Claim 2: Read characters written in fields provided on a form, identify the field on the form that is currently being read, cut out the read characters one by one, and determine the column position of each read character. Character recognition means that identifies and further matches cut out characters with a standard pattern, and stores the standard pattern,
In an optical character reading device equipped with a standard pattern memory that sequentially reads standard patterns corresponding to each category to the character recognition means, a field output from the character recognition means that indicates the field currently being read. Based on the instruction signal, a character type designation mask signal indicating a character type designation mask corresponding to the field is formed from a character type designation mask table that defines character types that may be written in the field for each field, and further, for each character type. , a character type selection table is provided for each column position that determines whether or not the character type is used for each category,
A character type selection signal corresponding to the category and column position is formed from the character type selection table provided corresponding to the column position, the logical product of the character type designation mask signal and the character type selection signal is performed, and based on the result, the character type selection signal is 1. A character recognition method in an optical character reading device, comprising instructing a recognition means to execute or stop matching with a standard pattern.
【請求項3】帳票上に設けられたフィールド内に記入さ
れた文字を読み取り、現在読み取りを行っている帳票上
のフィールドを同定し、読み取った文字を一文字ずつ切
り出し、切り出された文字と標準パタ−ンとのマッチン
グをとり、候補文字を選択して出力する文字認識手段と
、上記標準パーターンを記憶しており、上記文字認識手
段に対して各カテゴリに対応する標準パターンを順次読
み出す標準パターンメモリとを備えた光学的文字読取装
置において、上記文字認識手段から出力される現在読み
取りを行っているフィールドを指示するフィールド指示
信号に基づいて、フィールド毎に該フィールドに書かれ
る可能性のある文字種を定めた文字種指定マスク表から
該フィールドに対応する文字種指定マスク示す文字種指
定マスク信号を形成し、さらに、各文字種について、カ
テゴリ毎に当該文字種が使用されるか否かを定めた文字
種選択表から上記カテゴリに対応する文字種選択信号を
形成し、上記文字種指定マスク信号と文字種選択信号の
論理積をとり、その結果に応じて上記文字認識手段が候
補文字の選択を行うことを特徴とする光学的文字読取装
置における文字認識方法。
Claim 3: Read characters written in fields provided on a form, identify the field on the form that is currently being read, cut out the read characters one by one, and combine the cut out characters with a standard pattern. A standard pattern memory that stores the standard patterns and sequentially reads out the standard patterns corresponding to each category to the character recognition means. In an optical character reading device, the type of character that may be written in each field is determined for each field based on a field instruction signal output from the character recognition means and indicating the field currently being read. A character type designation mask signal indicating a character type designation mask corresponding to the field is formed from the determined character type designation mask table, and the above character type designation mask signal is generated from the character type selection table that determines whether or not the character type is used for each category for each character type. An optical character characterized in that a character type selection signal corresponding to a category is formed, the character type designation mask signal and the character type selection signal are ANDed, and the character recognition means selects a candidate character according to the result. Character recognition method in reading device.
JP2403609A 1990-12-19 1990-12-19 Character recognition method for optical character reader Expired - Lifetime JP2886690B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2403609A JP2886690B2 (en) 1990-12-19 1990-12-19 Character recognition method for optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2403609A JP2886690B2 (en) 1990-12-19 1990-12-19 Character recognition method for optical character reader

Publications (2)

Publication Number Publication Date
JPH04218885A true JPH04218885A (en) 1992-08-10
JP2886690B2 JP2886690B2 (en) 1999-04-26

Family

ID=18513339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2403609A Expired - Lifetime JP2886690B2 (en) 1990-12-19 1990-12-19 Character recognition method for optical character reader

Country Status (1)

Country Link
JP (1) JP2886690B2 (en)

Also Published As

Publication number Publication date
JP2886690B2 (en) 1999-04-26

Similar Documents

Publication Publication Date Title
JP3452774B2 (en) Character recognition method
JPH11161681A (en) Device and method for displaying retrieval result, and computer-readable recording medium where series of instructions are recorded to output retrieval result
US5096423A (en) Computer system for teaching abbreviations for text and data processing functions
KR970049402A (en) Image processing method and apparatus, and storage medium
US5890182A (en) Sentence processing method and apparatus
JP2740335B2 (en) Table reader with automatic cell attribute determination function
JPH04218885A (en) Character recognizing method for optical character reader
JPH0247788B2 (en)
JP2701350B2 (en) Document reading device
JPH0452509B2 (en)
JPH0816571A (en) Kanji input device
JPH09204511A (en) Filing device
JP2682456B2 (en) Optical character reader
JPH06290308A (en) Character recognizing device
JPH10254988A (en) Handwritten character recognizing device
JPH04235599A (en) Display process by group of recognition candidate information
JPH05257986A (en) Character string retrieval device
JPH08185484A (en) Character recognition device
JPS63138479A (en) Character recognizing device
JPS63188284A (en) Character reader
JPH0253832B2 (en)
JPH0922441A (en) Optical character reader
JPH02130693A (en) Personal recognition dictionary preparing system
JPS60160490A (en) Character reader
JPH0962859A (en) Image reader

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080212

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090212

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090212

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100212

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100212

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110212

Year of fee payment: 12

EXPY Cancellation because of completion of term