JPH05233881A - Recognizing character table preparing method for character recognizing device - Google Patents

Recognizing character table preparing method for character recognizing device

Info

Publication number
JPH05233881A
JPH05233881A JP4034753A JP3475392A JPH05233881A JP H05233881 A JPH05233881 A JP H05233881A JP 4034753 A JP4034753 A JP 4034753A JP 3475392 A JP3475392 A JP 3475392A JP H05233881 A JPH05233881 A JP H05233881A
Authority
JP
Japan
Prior art keywords
character
recognition
comparison result
storage area
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4034753A
Other languages
Japanese (ja)
Inventor
Hiroshi Nishiura
洋 西浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4034753A priority Critical patent/JPH05233881A/en
Publication of JPH05233881A publication Critical patent/JPH05233881A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To prepare a high-reliability recognizing character table with massive character patterns concerning the recognizing character table preparing method for a character recognizing device. CONSTITUTION:The recognizing character table 12 is provided with a compared result storage area number applied character pattern storing means 6 equipped with a recognizing character candidate for each table number and a character pattern corresponding to the number of a compared result storage area for storing the compared result obtained by comparing the character pattern with a character recognizing dictionary, a compared result summing-up means 7 to input the compared result storage area number applied character pattern and to sum up the number of characters expressed by the character pattern for each compared result area number, and recognizing character table preparing means 9 to prepare a correspondence table 4' making correspondent the compared result storage area number and the table number of the recognizing character table and to prepare a recognizing character table 12 based on the summed-up result.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は,文字認識装置において
認識文字候補を出力するために参照される認識文字テー
ブルの作成方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of creating a recognized character table referred to in order to output a recognized character candidate in a character recognition device.

【0002】英数字,カタカナ等の文字パターンの認識
は,読み取った文字パターンを文字認識辞書と比較し,
比較結果が格納される格納領域の番号と認識候補文字を
対応させた認識文字テーブルを参照して,認識候補文字
を出力することにより行われる。
To recognize character patterns such as alphanumeric characters and katakana, the read character pattern is compared with a character recognition dictionary,
This is performed by referring to the recognition character table in which the number of the storage area in which the comparison result is stored and the recognition candidate character are associated with each other, and outputting the recognition candidate character.

【0003】本発明は,大量の文字パターンを用いて信
頼性の高い認識文字テーブルを効率的に作成する方法を
提供する。
The present invention provides a method for efficiently creating a highly reliable recognition character table using a large number of character patterns.

【0004】[0004]

【従来の技術】図4は本発明の対象とする文字認識装置
の構成を表す。図において,100は認識対象の文字パ
ターンであって,英数字,カタカナ等の印刷文字,手書
き文字よりなるものである。101は光学文字読み取り
装置,102は文字認識辞書であって,読み取られた文
字パターンと比較して文字パターンを分析するためのも
のである。103は認識候補テーブルであって,文字パ
ターンと文字認識辞書の比較結果の格納領域の番号に対
応して認識文字候補を持つものである。104は文字認
識手段であって,文字パターン100を文字認識辞書1
02で参照し,比較結果に基づいて認識候補テーブル1
03を参照して認識文字候補を得るものである。105
は認識候補出力手段であって,文字認識手段104が認
識した文字候補を出力するものである。
2. Description of the Related Art FIG. 4 shows the structure of a character recognition apparatus to which the present invention is applied. In the figure, reference numeral 100 denotes a character pattern to be recognized, which is composed of print characters such as alphanumeric characters and katakana, and handwritten characters. Reference numeral 101 is an optical character reading device, and reference numeral 102 is a character recognition dictionary for comparing the read character pattern with a character pattern. A recognition candidate table 103 has recognition character candidates corresponding to the numbers of the storage areas of the comparison results of the character patterns and the character recognition dictionary. Reference numeral 104 is a character recognition means for converting the character pattern 100 into a character recognition dictionary 1
02, and the recognition candidate table 1 based on the comparison result.
03 is referred to obtain a recognized character candidate. 105
Is a recognition candidate output means for outputting the character candidates recognized by the character recognition means 104.

【0005】図5は本発明が対象とする文字認識辞書と
認識文字テーブルを示す。図において,110は文字認
識辞書の例であって,ツリー型辞書である。ツリー型辞
書は,イメージの特徴を大雑把な特徴から細部の特徴ま
で各分岐を選択的に辿り,末端の答えを比較結果とする
ものである。111は対応表であって,分岐末端の比較
結果格納領域の番号と認識文字テーブルのテーブル番号
を対応付けたものである。112は比較結果格納領域で
あって,それぞれに番号(末端番号)が附与されている
ものである。113はテーブル番号格納領域であって,
比較結果格納領域番号に対応した認識文字テーブルのテ
ーブル番号を格納するものである。
FIG. 5 shows a character recognition dictionary and a recognized character table to which the present invention is applied. In the figure, 110 is an example of a character recognition dictionary, which is a tree dictionary. The tree-type dictionary selectively traces each feature from rough features to detailed features of an image and uses the answer at the end as a comparison result. Reference numeral 111 is a correspondence table in which the number of the comparison result storage area at the branch end is associated with the table number of the recognition character table. Reference numeral 112 denotes a comparison result storage area, to which a number (terminal number) is given. 113 is a table number storage area,
The table number of the recognized character table corresponding to the comparison result storage area number is stored.

【0006】114は認識文字テーブルであって,文字
認識辞書110の比較結果の末端番号に対応したテーブ
ル番号毎に,認識候補文字に順位を付して格納するもの
である。
Reference numeral 114 denotes a recognition character table, which stores the recognition candidate characters in order by the table number corresponding to the terminal number of the comparison result of the character recognition dictionary 110.

【0007】120は文字認識辞書の分岐であって,例
えば,入力されたイメージにループがあるか,あるいは
ないかを判断するものであり,ループがあれば,次の分
岐Aに進み,ループがなければ次の分岐Bに進むもので
ある。
Reference numeral 120 is a branch of the character recognition dictionary, for example, for determining whether or not there is a loop in the input image. If there is a loop, proceed to the next branch A and the loop If not, it proceeds to the next branch B.

【0008】図の構成において,ループのある文字(例
えば,数字の「6」)を表す文字パターンが入力された
時,分岐120において,ループがあるので(YES)
として次の分岐Aに進む。ループのない文字(例えば,
数字「1」)を表す文字パターンが入力された場合に
は,ループがないので(NO)として次の分岐Bに進
む。
In the configuration shown in the figure, when a character pattern representing a looped character (for example, the numeral "6") is input, there is a loop at branch 120 (YES).
And proceed to the next branch A. Characters without loops (eg,
If the character pattern representing the numeral "1") is input, since there is no loop, the process proceeds to the next branch B as (NO).

【0009】このような比較結果が比較結果格納領域1
12に落ちたとする。比較結果格納領域112に対応す
るテーブル番号は200であるので,次に,認識文字テ
ーブル114のテーブル番号200を参照する。そこに
格納されている認識文字候補の第1位「6」,第2位
「ム」,第3位「4」が順位を付されて認識結果として
出力される。
Such a comparison result is stored in the comparison result storage area 1
Suppose it fell to 12. Since the table number corresponding to the comparison result storage area 112 is 200, next, the table number 200 of the recognition character table 114 is referred to. The recognition character candidates stored therein are ranked first, “6”, second “mu”, and third “4”, and output as a recognition result.

【0010】図6は従来の認識文字テーブル作成方法を
示す。従来,上記のようなツリー型辞書によるパターン
の比較結果に対応した認識文字テーブルは,ツリー型辞
書を作業者が分析し,ツリーの各末端の比較結果格納領
域に落ちる文字パターンを推測する人手作業により,候
補文字が決定されていた。
FIG. 6 shows a conventional method of creating a recognized character table. Conventionally, in the recognition character table corresponding to the pattern comparison result by the tree type dictionary as described above, a worker manually analyzes the tree type dictionary and guesses the character pattern falling in the comparison result storage area at each end of the tree. The candidate character was decided by.

【0011】図6により,従来の手作業による認識文字
テーブル作成方法を示す。 (1) 作業者は,ツリー型辞書の分岐と文字パターンの
特徴を見比べる。 (2) 文字パターンの特徴に従って分岐する方向を選択
する。
FIG. 6 shows a conventional method of manually creating a recognition character table. (1) The operator compares the branches of the tree dictionary with the characteristics of the character pattern. (2) Select the branch direction according to the characteristics of the character pattern.

【0012】(3) 最後の分岐まで,分析を終了してい
なければ(1) 以降の処理を繰り返す。 (4) 最後の分岐まで分析が終了し,比較結果格納領域
が求まったら,求められた比較結果格納領域に分析した
文字パターンの比較結果が落ちるものとし,認識文字テ
ーブルに分析した文字パターンの表す文字を認識文字候
補として登録する。
(3) If the analysis has not been completed until the final branch, the processing from (1) is repeated. (4) When the analysis is completed up to the last branch and the comparison result storage area is obtained, it is assumed that the comparison result of the analyzed character pattern falls in the obtained comparison result storage area, and the analyzed character pattern is displayed in the recognized character table. Register characters as recognition character candidates.

【0013】[0013]

【発明が解決しようとする課題】英数字,カナ文字等の
文字認識辞書(ツリー型辞書)であっても,末端の比較
結果格納領域の数は数万個程度あるものであって,上記
のように,手作業で分岐を追って比較結果の格納先を決
定することは膨大な時間を必要とするものであった。そ
のため,大量の文字バターンについて分析を行うことは
できず,従来の文字認識テーブルは統計的に裏付けられ
たものではなかった。
Even with a character recognition dictionary (tree dictionary) for alphanumeric characters, kana characters, etc., the number of storage areas for comparison results at the end is about tens of thousands. As described above, manually determining the storage location of the comparison result by following the branch requires a huge amount of time. Therefore, it was not possible to analyze a large number of character patterns, and the conventional character recognition table was not statistically supported.

【0014】本発明は,大量の文字パターンを用いて統
計的に処理することにより,信頼性の高い認識文字テー
ブルを作成する方法を提供することを目的とする。
An object of the present invention is to provide a method of creating a highly reliable recognition character table by statistically processing a large number of character patterns.

【0015】[0015]

【課題を解決するための手段】本発明は,まず,意味す
る文字の分かっている文字パターンを文字認識辞書と比
較し,各々の文字パターンに比較結果格納領域の番号
(ツリー型辞書の末端番号)を附与することにより比較
結果格納領域番号が附与された文字パターンを用意す
る。そして,比較結果格納領域番号毎に文字パターンに
該当する文字数の統計をとり,統計結果に基づいて,認
識文字テーブルの認識文字候補を決定するようにした。
According to the present invention, first, a character pattern in which a meaning character is known is compared with a character recognition dictionary, and the number of the comparison result storage area (the terminal number of the tree-type dictionary is assigned to each character pattern). ) Is added to prepare a character pattern to which the comparison result storage area number is added. Then, the number of characters corresponding to the character pattern is statistic for each comparison result storage area number, and the recognition character candidate of the recognition character table is determined based on the statistic result.

【0016】図1は,本発明の基本構成を示す。図にお
いて,1は文字パターン入力手段であって,表す文字
(答え)の分かっている大量の文字パターンを格納する
ディスク装置等よりなるものである。2は文字認識手段
であって,入力された文字パターンのデータに基づい
て,文字認識辞書を参照し,比較結果を得るものであ
る。3は文字認識辞書参照手段であって,入力された文
字パターンについて文字認識辞書を参照し,比較結果を
得るものである。
FIG. 1 shows the basic configuration of the present invention. In the figure, reference numeral 1 is a character pattern input means, which comprises a disk device or the like for storing a large number of character patterns whose characters (answers) to be expressed are known. A character recognition unit 2 refers to a character recognition dictionary on the basis of input character pattern data to obtain a comparison result. Reference numeral 3 is a character recognition dictionary reference means for referring to the character recognition dictionary for the input character pattern and obtaining a comparison result.

【0017】4は文字認識辞書であって,例えば,ツリ
ー型辞書であり,末端に比較結果格納領域を持つもので
ある。4’は対応表であって,比較結果格納領域の番号
と認識文字テーブルのテーブル番号を対照させたもので
ある。
Reference numeral 4 is a character recognition dictionary, for example, a tree type dictionary, which has a comparison result storage area at the end. Reference numeral 4'is a correspondence table in which the number of the comparison result storage area and the table number of the recognition character table are compared.

【0018】5は比較結果格納領域番号附与手段であっ
て,比較した文字パターンに対して,文字認識辞書との
比較結果として格納された比較結果格納領域の番号を附
与するものである。6は比較結果格納領域番号附与文字
パターン格納手段であって,比較結果格納領域番号を附
与された文字パターンに格納するものである。7は比較
結果集計手段であって,比較結果格納領域番号附与文字
パターン格納手段6の文字パターンを入力し,比較結果
格納領域番号(末端番号)毎に,格納された文字パター
ンの表す文字について集計するものである。8は集計結
果格納部であって,集計結果を格納するものである。
Reference numeral 5 is a comparison result storage area number giving means for giving the number of the comparison result storage area stored as the comparison result with the character recognition dictionary to the compared character pattern. Reference numeral 6 is a comparison result storage area number-attached character pattern storage means for storing the comparison result storage area number in the attached character pattern. Reference numeral 7 denotes a comparison result totaling means, which inputs the character pattern of the comparison result storage area number-added character pattern storage means 6 and for each comparison result storage area number (terminal number), indicates the character represented by the stored character pattern. It is to count. A totaling result storage unit 8 stores the totaling results.

【0019】9は認識文字テーブル作成手段であって,
集計された比較結果に基づいて認識文字候補を決定し,
認識文字テーブルを作成するものである。10は対応表
作成部であって,比較結果格納領域番号と認識文字テー
ブル作成部11のテーブル番号を対応付けるものであ
る。11は認識文字テーブル作成部であって,集計され
た比較結果に基づいて認識文字候補を決定し,認識文字
テーブルを作成するものである。
Reference numeral 9 is a recognition character table creating means,
Decide the recognition character candidate based on the totaled comparison result,
The recognition character table is created. Reference numeral 10 is a correspondence table creating unit that associates the comparison result storage area number with the table number of the recognition character table creating unit 11. Reference numeral 11 denotes a recognition character table creation unit, which determines recognition character candidates based on the aggregated comparison results and creates a recognition character table.

【0020】12は認識文字テーブルであって,テーブ
ル番号毎に認識候補文字の順位を付して格納するもので
ある。13はリジェクト条件入力手段であって,比較結
果格納領域番号における集計結果にばらつきがあり,第
1位の認識文字候補を決定し難い場合に,認識文字候補
を決定しないものとするためのリジェクト条件を入力す
るものである。14はリジェクト条件設定手段であっ
て,入力されたリジェクト条件を保持するものである。
Reference numeral 12 is a recognition character table, which stores the recognition candidate characters in order by table number. Reference numeral 13 is a reject condition inputting means, which is a reject condition for not deciding a recognized character candidate when it is difficult to decide the first-ranked recognized character candidate because of a variation in the counting result in the comparison result storage area number. Is to be entered. Reference numeral 14 is a reject condition setting means, which holds the inputted reject condition.

【0021】[0021]

【作用】図1の基本構成動作を説明する。 (1) 比較結果格納領域番号附与文字パターン格納手段
6の作成までの処理。
The operation of the basic configuration of FIG. 1 will be described. (1) Processing up to creation of the comparison result storage area number-added character pattern storage means 6.

【0022】文字パターン入力手段1より,文字パター
ン(例えば,英数字,カナ文字,記号等の印刷文字,手
書き文字)についてのデータ(例えば,光学的読み取り
装置で読み取られ,磁気ディスク等に格納されているデ
ータ)を文字認識手段2に入力する。文字認識手段2
は,文字認識辞書参照手段3により入力された文字パタ
ーンについて文字認識辞書を参照する(ツリー型辞書の
場合,ツリーの先端に文字パターンのデータを入力す
る)。そして,文字パターン毎に得られた比較結果格納
領域の番号(ツリー型辞書の場合,ツリーの末端番号)
を得る。
Data (for example, print characters such as alphanumeric characters, kana characters, symbols, and handwritten characters) (for example, read by an optical reader and stored in a magnetic disk or the like) from the character pattern input means 1. Input data) to the character recognition means 2. Character recognition means 2
Refers to the character recognition dictionary for the character pattern input by the character recognition dictionary reference means 3 (in the case of a tree type dictionary, the character pattern data is input to the end of the tree). Then, the number of the comparison result storage area obtained for each character pattern (the end number of the tree in the case of a tree dictionary)
To get

【0023】比較結果格納領域番号附与手段5は,文字
認識手段2の参照した比較結果格納領域番号を対応する
文字パターンに附与する。そして,比較結果格納領域番
号附与文字パターン格納手段6は,文字認識辞書との比
較で得られた比較結果格納領域番号(ツリー型辞書の末
端番号)を附与された各文字パターンを格納する(文字
パターン入力手段1がディスクであれば,そのディスク
に格納されている文字パターンに末端番号を附与す
る)。
The comparison result storage area number giving means 5 gives the comparison result storage area number referred to by the character recognition means 2 to the corresponding character pattern. Then, the comparison result storage area number-added character pattern storage means 6 stores each character pattern provided with the comparison result storage area number (end number of the tree dictionary) obtained by comparison with the character recognition dictionary. (If the character pattern input means 1 is a disk, the terminal number is given to the character pattern stored in the disk).

【0024】(2) 認識文字テーブル作成の処理 比較結果集計手段7は,比較結果格納領域番号附与文字
パターン格納手段6に格納されている文字パターンにつ
いて,比較結果格納領域番号(末端番号)毎に,文字パ
ターンの表す文字と文字数を集計する。
(2) Processing for creating recognition character table The comparison result totaling means 7 is for each comparison result storage area number (end number) for the character pattern stored in the comparison result storage area number-added character pattern storage means 6. Then, the characters and the number of characters represented by the character pattern are totaled.

【0025】対応表作成部10は比較結果格納領域番号
(末端番号)と認識テーブルのテーブル番号を対応させ
る。文字認識辞書の対応表4’を作成する。認識文字テ
ーブル作成部11は,集計結果格納部8より,比較結果
格納領域番号毎の集計データを取り出し,対応表作成部
10の作成したテーブル番号に文字パターンの表す文字
を認識文字として登録する。例えば,図示の末端番号1
の集計結果のように,答えの文字「ア」が200個,
「P」が50個,「T」が10個の場合には,第1位の
認識候補として「ア」,第2位の認識候補として
「P」,第3位の認識候補として「T」を登録する。
The correspondence table creating section 10 associates the comparison result storage area number (terminal number) with the table number of the recognition table. The correspondence table 4'of the character recognition dictionary is created. The recognition character table creation unit 11 retrieves the collection data for each comparison result storage area number from the collection result storage unit 8 and registers the character represented by the character pattern as a recognition character in the table number created by the correspondence table creation unit 10. For example, end number 1 shown
As you can see in the tabulation result of, the answer letter "A" is 200
When there are 50 “P” s and 10 “Ts”, “A” is the first recognition candidate, “P” is the second recognition candidate, and “T” is the third recognition candidate. To register.

【0026】このとき,認識文字テーブル作成部11は
リジェクト条件を参照し,例えば,第1位の文字が該当
する末端番号の文字総数の1/2以下の場合には認識文
字候補として登録しないというリジェクト条件が設定さ
れていたなら,その条件を参照し,例えば図示の末端番
号2のようにリジェクト条件を満たす場合には,認識候
補なしとして該当するテーブル番号の第1位の認識候補
の欄にリジェクトを登録する。
At this time, the recognized character table creating unit 11 refers to the reject condition and, for example, if the first character is less than 1/2 of the total number of characters of the corresponding terminal number, it is not registered as a recognized character candidate. If a reject condition has been set, the condition is referenced, and if the reject condition is satisfied, such as the end number 2 shown in the figure, it is determined that there is no recognition candidate in the column of the first recognition candidate of the corresponding table number. Register the reject.

【0027】本発明によれば,比較結果格納領域番号附
与文字パターン格納手段6にデータファイル化された大
量の文字パターンにより,統計的な処理で認識文字候補
が決定される。そのため,信頼性の高い認識文字テーブ
ルを簡単に作成することができる。
According to the present invention, the recognized character candidates are determined by statistical processing from the large number of character patterns stored in the data file in the comparison result storage area number-added character pattern storage means 6. Therefore, a highly reliable recognition character table can be easily created.

【0028】また,リジェクト条件も,簡単に設定で
き,リジェクト条件を変更することにより,様々の条件
の認識文字テーブルが簡単に作成できる。
Rejection conditions can also be set easily and recognition character tables for various conditions can be easily created by changing the rejection conditions.

【0029】[0029]

【実施例】図2は本発明の比較結果格納領域番号附与文
字パターン格納手段の作成方法実施例を示す。
FIG. 2 shows an embodiment of a method for creating a comparison result storage area number-added character pattern storage means of the present invention.

【0030】図において,20は文字パターン格納手段
であって,英数字,かな文字,記号の数百万から1千万
種類の文字パターンを格納するものである。21は文字
パターンの例,22は文字パタ−ンの比較結果格納領域
番号(以後,末端番号とする)を格納する末端番号格納
領域である。
In the figure, reference numeral 20 is a character pattern storage means for storing several million to 10 million kinds of alphanumeric characters, kana characters and symbols. Reference numeral 21 is an example of a character pattern, and 22 is an end number storage area for storing a comparison result storage area number (hereinafter, referred to as an end number) of a character pattern.

【0031】23は文字認識手段,24は文字パターン
取り出し手段であって,文字パーン格納手段20の文字
パターンを取り出すものである。25は文字認識辞書参
照手段である。
Reference numeral 23 is a character recognizing means, and 24 is a character pattern extracting means for extracting the character pattern of the character pattern storing means 20. Reference numeral 25 is a character recognition dictionary reference means.

【0032】26は文字認識辞書であって,ツリー型辞
書である。27は対応表,28は対応表の末端番号格納
領域,29は対応表のテーブル番号格納領域である。3
0は末端番号(認識結果格納領域番号)附与手段であ
る。
Reference numeral 26 is a character recognition dictionary, which is a tree-type dictionary. Reference numeral 27 is a correspondence table, 28 is an end number storage area of the correspondence table, and 29 is a table number storage area of the correspondence table. Three
0 is a terminal number (recognition result storage area number) giving means.

【0033】20’は末端番号(認識文字格納領域番
号)附与文字パターン格納手段であって,文字パターン
格納手段20において文字パターンの末端番号格納領域
に末端番号が書き込まれたものを表す。21’は文字パ
ターンの例であって,文字パターン21と同じものであ
る。22’は末端番号格納領域であって,末端番号が書
き込まれたものを表す。
Numeral 20 'is a terminal number (recognition character storage area number) -added character pattern storage means, which represents the terminal number written in the terminal number storage area of the character pattern in the character pattern storage means 20. 21 'is an example of the character pattern and is the same as the character pattern 21. Reference numeral 22 'is an end number storage area in which the end number is written.

【0034】図における文字パターン21を処理する場
合について説明する。文字パターン取り出し手段24は
文字パターン21を読み出す。文字認識辞書参照手段2
5は読み出した文字パターン21を文字認識辞書26に
入力する。文字認識辞書26は文字パターン21の特徴
に従って,各分岐を選択し,比較結果を求める。比較結
果が末端番号格納領域28に格納される(図では,末端
番号500)。
The case of processing the character pattern 21 in the figure will be described. The character pattern extracting means 24 reads the character pattern 21. Character recognition dictionary reference means 2
5 inputs the read character pattern 21 into the character recognition dictionary 26. The character recognition dictionary 26 selects each branch according to the characteristics of the character pattern 21 and obtains a comparison result. The comparison result is stored in the terminal number storage area 28 (terminal number 500 in the figure).

【0035】末端番号(認識結果格納領域番号)附与手
段30は,文字パターン21(21’) の末端番号格
納領域22(22’)に末端番号500を格納する。以
上の処理を各文字パターンについて行い,末端番号(比
較結果格納領域番号)附与文字パターン格納手段20’
を作成する。
The terminal number (recognition result storage area number) giving means 30 stores the terminal number 500 in the terminal number storage area 22 (22 ') of the character pattern 21 (21'). The above processing is performed for each character pattern, and the terminal number (comparison result storage area number) attached character pattern storage means 20 '
To create.

【0036】図3は,本発明の認識文字テーブル作成の
実施例を示す。図において,40は末端番号附与文字パ
ターン格納手段,41は文字パターン取り出し手段,4
2は比較結果集計手段,43は集計結果格納領域であ
る。
FIG. 3 shows an embodiment of creating a recognized character table according to the present invention. In the figure, 40 is a character pattern storing means for adding terminal numbers, 41 is a character pattern extracting means, 4
Reference numeral 2 is a comparison result totaling means, and 43 is a totaling result storage area.

【0037】44は文字認識辞書であって,ツリー型辞
書である。45は対応表,46は比較結果格納領域,4
7はテーブル番号である。48は認識文字テーブル作成
手段,49は対応表作成部,50は認識文字テーブル作
成部である。
Reference numeral 44 is a character recognition dictionary, which is a tree dictionary. 45 is a correspondence table, 46 is a comparison result storage area, 4
7 is a table number. Reference numeral 48 is a recognition character table creating unit, 49 is a correspondence table creating unit, and 50 is a recognition character table creating unit.

【0038】54は認識文字テーブル,55はリジェク
ト条件設定手段,56は入力手段であって,リジェクト
条件を入力するキーボード等よりなるものである。図の
構成において,文字パターン取り出し手段41は末端番
号附与文字パターン格納手段40より文字パターンと末
端番号を取り出し,比較結果集計手段42に入力する。
Reference numeral 54 is a recognition character table, 55 is a reject condition setting means, and 56 is an input means, which comprises a keyboard for inputting reject conditions. In the configuration shown in the figure, the character pattern extracting means 41 extracts the character pattern and the terminal number from the terminal number-added character pattern storing means 40 and inputs them to the comparison result totaling means 42.

【0039】比較結果集計手段42は,末端番号毎に文
字パターンの表す文字対応に文字パターン数を集計す
る。図示の例は,末端番号100においては文字「7」
の文字パターンが200個,文字「ク」の文字パターン
が50個,文字「ワ」の文字パターンが30個であるこ
とを表す。同様に末端番号101は文字「2」の文字パ
ターンが100個,文字「ユ」の文字パターンが5個,
文字「コ」の文字パターンが5個の場合を表す。末端番
号102は文字「P」の文字パターンが50個,文字
「ア」の文字パターンが50個,文字「D」の文字パタ
ーンか5個であることを表す。
The comparison result totaling means 42 totals the number of character patterns corresponding to the characters represented by the character patterns for each terminal number. In the illustrated example, the character "7" is displayed at the terminal number 100.
Indicates that there are 200 character patterns, the character pattern of the character "ku" is 50, and the character pattern of the character "wa" is 30. Similarly, the terminal number 101 has 100 character patterns of the character "2", 5 character patterns of the character "Yu",
The case where the character pattern of the character "K" is 5 is shown. The terminal number 102 indicates that there are 50 character patterns of the character “P”, 50 character patterns of the character “A”, and 5 character patterns of the character “D”.

【0040】認識文字テーブル作成手段48において,
対応表作成部49は対応表45の比較結果格納領域46
の格納領域番号にテーブル番号を対応付け,対応表45
を作成する。そして,比較結果集計手段42より集計結
果が取り込まれ,認識文字テーブル作成部50はリジェ
クト条件(後述)を参照し,比較結果に基づいて認識文
字テーブル54を作成する。
In the recognition character table creating means 48,
The correspondence table creation unit 49 uses the comparison result storage area 46 of the correspondence table 45.
Correspondence table 45
To create. Then, the totalized result is fetched by the comparison result totaling means 42, and the recognized character table creation unit 50 refers to the reject condition (described later) and creates the recognized character table 54 based on the comparison result.

【0041】第1位の文字パターン数が末端番号総数の
1/2以下のときには認識文字候補としないとする場
合,リジェクト条件として入力手段56より1/2を入
力する。そして,リジェクト条件はリジェクト条件設定
手段55に保持される。その場合,集計結果において第
1位の文字数が末端番号の総文字数の1/2以下であれ
ば,認識文字テーブル作成部50は認識文字テーブル5
4の第1位の欄にリジェクトを書き込む。また,第1位
の文字数が末端番号の総文字数の1/2以上であれば,
認識文字テーブルに文字数の多い順に候補順位を付して
登録する。候補順位は例えば,第8位まで登録する。
When the number of first-ranked character patterns is not more than 1/2 of the total number of terminal numbers, the character is not recognized as a recognized character candidate, and 1/2 is input from the input means 56 as a reject condition. Then, the reject condition is held in the reject condition setting means 55. In that case, if the number of first-ranked characters is 1/2 or less of the total number of terminal numbers in the counting result, the recognized character table creation unit 50 causes the recognized character table 5
Write the reject in the first column of 4. If the number of first-ranked characters is 1/2 or more of the total number of terminal numbers,
The candidate characters are registered in the recognized character table in descending order of the number of characters and registered. For example, the candidate ranks are registered up to the eighth rank.

【0042】[0042]

【発明の効果】本発明によれば,大量の文字パターンに
基づく認識テーブルの作成を自動的に行うことができ
る。また,決定された認識文字候補は,大量のデータに
基づいて統計的に処理して求めたものであるので信頼性
が高いものとなる。
According to the present invention, it is possible to automatically create a recognition table based on a large number of character patterns. Further, the determined recognized character candidates are highly reliable because they are obtained by statistically processing based on a large amount of data.

【0043】さらに,リジェクト条件を可変に設定でき
るので,異なる条件により何種類もの認識文字テーブル
を簡単に作成することができる。また,処理するデータ
を数字のみとすることにより,数字だけの文字認識テー
ブルを作成する等,文字の種類毎に専用の文字認識テー
ブルを簡単に作成することができる。
Further, since the reject condition can be variably set, it is possible to easily create many kinds of recognition character tables according to different conditions. In addition, by using only numbers as the data to be processed, it is possible to easily create a dedicated character recognition table for each type of character, such as creating a character recognition table for only numbers.

【0044】また,ツリー型辞書の場合,認識文字テー
ブル自体がツリー型辞書の集計結果であるのでツリー型
辞書の改善のための資料とすることができ,辞書の改良
を容易にする。
Further, in the case of the tree type dictionary, the recognition character table itself is the total result of the tree type dictionary, so that it can be used as a material for improving the tree type dictionary, and the dictionary can be easily improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の基本構成を示す図である。FIG. 1 is a diagram showing a basic configuration of the present invention.

【図2】本発明の比較結果格納領域番号附与文字パター
ン格納手段の作成方法実施例を示す図である。
FIG. 2 is a diagram showing an embodiment of a method of creating a comparison result storage area number-added character pattern storage means of the present invention.

【図3】本発明の認識文字テーブル作成の実施例を示す
図である。
FIG. 3 is a diagram showing an example of creating a recognized character table of the present invention.

【図4】本発明の対象とする文字認識装置を示す図であ
る。
FIG. 4 is a diagram showing a character recognition device as a target of the present invention.

【図5】本発明の対象とする文字認識辞書と認識文字テ
ーブルを示す図である。
FIG. 5 is a diagram showing a character recognition dictionary and a recognized character table, which are objects of the present invention.

【図6】従来の認識文字テーブル作成方法を示す図であ
る。
FIG. 6 is a diagram showing a conventional recognition character table creating method.

【符号の説明】[Explanation of symbols]

1 :文字パターン入力手段 2 :文字認識手段 3 :文字認識辞書参照手段 4 :文字認識辞書 4’:対応表 5 :比較結果格納領域番号附与手段 6 :比較結果格納領域番号附与文字パターン格納手段 7 :比較結果集計手段 8 :集計結果格納部 9 :認識文字テーブル作成手段 10:対応表作成部 11:認識文字テーブル作成部 12:認識文字テーブル 1: Character pattern input means 2: Character recognition means 3: Character recognition dictionary reference means 4: Character recognition dictionary 4 ': Correspondence table 5: Comparison result storage area number giving means 6: Comparison result storage area number giving character pattern storage Means 7: Comparison result totaling means 8: Totalization result storage section 9: Recognized character table preparation means 10: Correspondence table preparation section 11: Recognized character table preparation section 12: Recognized character table

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 文字パターンを文字認識辞書(4) と比較
し,比較結果に基づいて認識文字テーブル(12)を参照し
て認識候補文字を出力する文字認識装置における認識文
字テーブル作成方法において,認識文字テーブル(12)は
テーブル番号毎に認識文字候補を持ち,文字パターンを
文字認識辞書(4) と比較することにより得られる比較結
果を格納する比較結果格納領域の番号を対応付けた文字
パターンを持つ比較結果格納領域番号附与文字パターン
格納手段(6) と,比較結果格納領域番号附与文字パター
ンを入力し,比較結果格納領域番号毎に文字パターンの
表す文字の文字数を集計する比較結果集計手段(7) と,
比較結果格納領域番号と認識文字テーブルのテーブル番
号を対応付けた対応表(4')を作成するとともに,集計
結果に基づいて認識文字テーブルを作成する認識文字テ
ーブル作成手段(9) とを備え,比較結果格納領域番号附
与文字パターンに基づいて,末端番号毎に文字パターン
の表す文字の文字数を集計し,集計結果に基づいて認識
文字テーブル(12)を作成することを特徴とする文字認識
装置における認識文字テーブル作成方法。
1. A method for creating a recognition character table in a character recognition device for comparing a character pattern with a character recognition dictionary (4) and referring to a recognition character table (12) based on the comparison result to output recognition candidate characters, The recognition character table (12) has a recognition character candidate for each table number, and a character pattern in which the number of the comparison result storage area that stores the comparison result obtained by comparing the character pattern with the character recognition dictionary (4) is associated. The comparison result storage area number-added character pattern storage means (6) and the comparison result storage area number-added character pattern are input, and the number of characters represented by the character pattern is totaled for each comparison result storage area number. Aggregating means (7),
A correspondence table (4 ') in which the comparison result storage area number and the table number of the recognition character table are associated with each other is created, and a recognition character table creating means (9) for creating a recognition character table based on the counting result is provided. A character recognition device characterized by totaling the number of characters represented by a character pattern for each terminal number based on a comparison result storage area number-added character pattern and creating a recognition character table (12) based on the totalized result. For creating a recognition character table in.
【請求項2】 請求項1において,比較結果に応じて認
識候補文字を設定しないためのリジェクト条件を入力す
るリジェクト条件入力手段(13)と,リジェクト条件設定
手段(14)とを備え,認識文字テーブル作成手段(9) は,
リジェクト条件と比較結果集計手段の集計結果を比較
し,集計結果がリジェクト条件を満たしていない場合に
は認識文字テーブル(12)に認識文字を登録しないことを
特徴とする文字認識装置における認識文字テーブル作成
方法。
2. The recognition character according to claim 1, further comprising reject condition input means (13) for inputting a rejection condition for not setting a recognition candidate character according to the comparison result, and reject condition setting means (14). The table creation means (9)
The recognition character table in the character recognition device characterized in that the rejection condition is compared with the aggregation result of the comparison result aggregation means, and if the aggregation result does not satisfy the rejection condition, no recognition character is registered in the recognition character table (12). How to make.
【請求項3】 請求項1および2において,文字認識辞
書(4) はツリー型辞書であり,比較結果格納領域はツリ
ー末端に対応するものであることを特徴とする文字認識
装置における認識文字テーブル作成方法。
3. The recognition character table in a character recognition device according to claim 1 or 2, wherein the character recognition dictionary (4) is a tree-type dictionary and the comparison result storage area corresponds to the end of the tree. How to make.
JP4034753A 1992-02-21 1992-02-21 Recognizing character table preparing method for character recognizing device Withdrawn JPH05233881A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4034753A JPH05233881A (en) 1992-02-21 1992-02-21 Recognizing character table preparing method for character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4034753A JPH05233881A (en) 1992-02-21 1992-02-21 Recognizing character table preparing method for character recognizing device

Publications (1)

Publication Number Publication Date
JPH05233881A true JPH05233881A (en) 1993-09-10

Family

ID=12423086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4034753A Withdrawn JPH05233881A (en) 1992-02-21 1992-02-21 Recognizing character table preparing method for character recognizing device

Country Status (1)

Country Link
JP (1) JPH05233881A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008026414A1 (en) * 2006-08-31 2008-03-06 Osaka Prefecture University Public Corporation Image recognition method, image recognition device, and image recognition program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008026414A1 (en) * 2006-08-31 2008-03-06 Osaka Prefecture University Public Corporation Image recognition method, image recognition device, and image recognition program
JP4883649B2 (en) * 2006-08-31 2012-02-22 公立大学法人大阪府立大学 Image recognition method, image recognition apparatus, and image recognition program
US8199973B2 (en) 2006-08-31 2012-06-12 Osaka Prefecture University Public Corporation Image recognition method, image recognition device, and image recognition program

Similar Documents

Publication Publication Date Title
Kanai et al. Automated evaluation of OCR zoning
Ha et al. Off-line, handwritten numeral recognition by perturbation method
JPH04296989A (en) Method and apparatus for recognizing character
JPH0520500A (en) Document recognizing device
US5426711A (en) Online handwritten character recognition
Spinrad Machine recognition of hand printing
JP3083562B2 (en) Character recognition mechanism
CN112182140B (en) Information input method, device, computer equipment and medium combining RPA and AI
JPS6120038B2 (en)
JPH05233881A (en) Recognizing character table preparing method for character recognizing device
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
CN114780577A (en) SQL statement generation method, device, equipment and storage medium
CN112347121A (en) Configurable method and system for converting natural language into sql
JPH06215197A (en) Method and device for recognizing character
JP2766205B2 (en) Character recognition device
Lembo et al. Information Extraction through AI techniques: The KIDs use case at CONSOB
JPS5852267B2 (en) Character analysis method
KR960001102B1 (en) Resolution of case confusions by majority voting rule in on-line
CN109522414B (en) Document delivery object selection system
Dasarathy et al. CHITRA: Cognitive handprinted input-trained recursively analyzing system for recognition of alphanumeric characters
JPH04337888A (en) Device for recognizing character
JP3109476B2 (en) Character recognition device with candidate number control function and method
JPH04256194A (en) System for processing character recognition
JPS62281082A (en) Character recognizing device
JP2792063B2 (en) Character recognition dictionary creation method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990518