JPH0340186A - Character recognizer - Google Patents

Character recognizer

Info

Publication number
JPH0340186A
JPH0340186A JP1176128A JP17612889A JPH0340186A JP H0340186 A JPH0340186 A JP H0340186A JP 1176128 A JP1176128 A JP 1176128A JP 17612889 A JP17612889 A JP 17612889A JP H0340186 A JPH0340186 A JP H0340186A
Authority
JP
Japan
Prior art keywords
character
dictionary
characters
pattern
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1176128A
Other languages
Japanese (ja)
Inventor
Toru Matsuo
松尾 徹
Makoto Okazaki
真 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP1176128A priority Critical patent/JPH0340186A/en
Publication of JPH0340186A publication Critical patent/JPH0340186A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To perform character recognition with high likelihood by performing comparative collation with a second dictionary consisting of a reference pattern for a character with low frequency in use sequentially when the collation result of a character pattern is less than a prescribed level. CONSTITUTION:The character is classified at every frequency in use at a dictionary part 4, and is stored as individual dictionaries (1)-(3), respectively. Also, a character pattern collation part 3 is connected to a reject level judging part 5 which employs the collation result with a dictionary with high frequency in use when it exceeds the prescribed level, and performs collative comparison with the dictionary with low frequency in use when it is less than the prescribed level. Therefore, it is possible to prevent the character seldom used outputted accidentally as the recognition result, and to improve the accuracy of the recognition result, and furthermore, since collation is separated corresponding to the frequency in use, the collation of an ordinary character with the character with low frequency in use can be omitted. In such a way, the character recognition with high likelihood can be performed.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は紙等の記録媒体上に描出された文字を認識する
文字認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a character recognition device that recognizes characters drawn on a recording medium such as paper.

[従来の技術〕 近年、ワードプロセッサ等の普及により、文字をコード
化して記憶することが広く行われている。
[Background Art] In recent years, with the spread of word processors and the like, it has become common practice to encode and store characters.

そして、コード化して記憶すれば、その記憶容量が少な
くて済み、また共通のコード(例えばJISコード)を
用いれば異なる機種の機械によって認識することも容易
である。更に、コード化した文字データに応じて表示を
行えば、各種要望に応じた所望の表示を行うことができ
る。
If it is encoded and stored, the storage capacity can be reduced, and if a common code (for example, JIS code) is used, it can be easily recognized by different types of machines. Furthermore, if display is performed according to coded character data, desired display can be performed according to various demands.

このように、文字をコード化して記憶すれば、各種の利
点が得られるが、このためには文字の人列手段としてキ
ーボード等のコードを指定できる手段を要し、既に紙等
に描出された文字からはコドを抽出することができず、
紙等に描出された文字を見ながら、キーボード等を操作
し文字を人力しなければならないという問題点かあった
In this way, various advantages can be obtained by encoding and memorizing characters, but this requires a means to specify codes such as a keyboard as a means of stringing characters. It is not possible to extract the code from the characters,
There was a problem in that the characters had to be written manually by operating a keyboard or the like while looking at the characters drawn on paper or the like.

そこで、これら既に紙等の記録媒体上に描出された文字
を自動的に読取り、これを文字認識してコード化するこ
とが提案されている。このような読取り、コード化がで
きれば、上述のような問題点か解消され、非常に便利で
ある。
Therefore, it has been proposed to automatically read the characters already drawn on a recording medium such as paper, recognize the characters, and encode them. If such reading and encoding were possible, the above-mentioned problems would be solved and it would be very convenient.

すなわち、従来の文字認識装置は、紙等の記録媒体上に
描出された文字を光学的に検出し、これを所定数のドツ
ト毎に2値化してデジタルデータからなる二次元ドツト
パターンとして読取る。そして、この読取り結果を予め
記憶している文字パターンと比較し、最も近い文字パタ
ーンを該当文字として検出する。
That is, conventional character recognition devices optically detect characters drawn on a recording medium such as paper, binarize the characters into a predetermined number of dots, and read the characters as a two-dimensional dot pattern consisting of digital data. This reading result is then compared with pre-stored character patterns, and the closest character pattern is detected as the corresponding character.

このような従来の装置により、紙等に描出された文字が
印刷された活字文字であれば、文字ごとの読取り結果は
、かなり正確であり、活字文字の字体などが認識できれ
ば、かなりの精度の照合を行うことができる。
With such conventional devices, if the characters drawn on paper etc. are printed characters, the reading results for each character are quite accurate, and if the font etc. of the printed characters can be recognized, the reading results can be quite accurate. Verification can be performed.

通常、前述した文字比較は、印刷あるいは手書き文字を
二次元ドツトパターンとして読み取った後、各文字の特
徴切り出しを行い、辞書に記憶されている全文字の各特
徴との比較を行う。
Normally, in the above-mentioned character comparison, printed or handwritten characters are read as a two-dimensional dot pattern, the characteristics of each character are extracted, and the characteristics of each character are compared with the characteristics of all characters stored in a dictionary.

従って、前記比較結果としてのパターン間距離は、実際
上複数の文字でほぼ等しい場合がある。
Therefore, the inter-pattern distances as a result of the comparison may actually be approximately equal for a plurality of characters.

特に複雑な文字に対しては、特徴か近似した複数の文字
でほぼ等距離の場合があり、単一の入カバターンに対し
てパターン間距離かほぼ等しい複数の候補を選び出すこ
とが多い。
In particular, for complex characters, there are cases where multiple characters with similar characteristics are approximately equidistant, and for a single input pattern, multiple candidates with approximately equal interpattern distances are often selected.

[発明が解決しようとする課題] 従って、従来においては、パターン間距離の最も近い文
字を選択するので、全辞書から選ばれた前記最も距離の
近い文字が出力され、距離は近いがまったく異る文字が
選ばれてしまい、真の文字か選ばれる可能性を低下させ
る原因となっていた。
[Problem to be Solved by the Invention] Therefore, in the past, since the character with the closest distance between patterns is selected, the character with the closest distance selected from all dictionaries is output, and the characters that are close but completely different are output. This caused the characters to be selected, reducing the possibility that the real characters would be selected.

すなわち、従来の方法においては、使用者の文字使用頻
度を考慮していないために、通常使用されないような文
字が期せずして候補に上げられ、前記パターン間距離が
最少であっても、これらの文字は実際に使用されている
確率が少ないために、誤った候補となる場合が多く、こ
れが使用者にとっての不満の要因となっていた。
That is, in the conventional method, since the frequency of character use by the user is not taken into consideration, characters that are not normally used are unexpectedly selected as candidates, and even if the distance between the patterns is the minimum, Since these characters have a low probability of being actually used, they are often incorrect candidates, which has been a source of dissatisfaction for users.

本発明は、文字の使用頻度の違いを考慮して、確度の高
い文字認識を行うことができる文字認識装置を提供する
ことを目的とする。
SUMMARY OF THE INVENTION An object of the present invention is to provide a character recognition device that can perform highly accurate character recognition while taking into account differences in the frequency of use of characters.

[課題を解決するための手段] 上記目的を達成するために、本発明装置は、辞書を文字
の使用頻度によって複数に分割するとともに、通常は使
用頻度の高い辞書のみでパターン比較を行う文字パター
ン照合部を含む。
[Means for Solving the Problems] In order to achieve the above object, the device of the present invention divides a dictionary into a plurality of parts according to the frequency of use of characters, and usually performs pattern comparison only in the frequently used dictionaries. Contains a matching section.

そして、本発明装置において、前記文字パターン照合部
は、前記使用頻度の高い辞書との照合結果が所定レベル
以上であった場合には、これを採用し、所定レベル以下
の場合には頻度の低い辞書との照合比較を行うリジェク
トレベル判定部と接続されている。
In the device of the present invention, the character pattern matching unit adopts the frequently used dictionary if the result of matching with the frequently used dictionary is equal to or higher than a predetermined level; It is connected to a rejection level determination unit that performs comparison with a dictionary.

[作用] 本発明に係る文字認識装置は、上述のような構成を有し
ており、紙等の記録媒体上に描出された文字を二次元ド
ツトパターンとして読み取る。そして、この読み取られ
た結果を使用頻度の高い文字についての標準パターンデ
ータと照合する。そして、この照合において、文字が認
識できなかった場合に使用頻度の低い文字についての標
準パターンとの照合を行う。
[Operation] The character recognition device according to the present invention has the above-described configuration, and reads characters drawn on a recording medium such as paper as a two-dimensional dot pattern. The read results are then compared with standard pattern data for frequently used characters. In this comparison, if a character cannot be recognized, it is compared with a standard pattern for characters that are used less frequently.

従って、極希にしか使用されない文字が認識結果として
誤って出力されることを防止でき、認識結果の精度を高
めることができる。更に、照合を使用頻度に応じて分け
たため、通常の文字については、使用頻度の少ない文字
との照合を省略できるという利点も得られる。
Therefore, it is possible to prevent characters that are used very rarely from being erroneously output as recognition results, and it is possible to improve the accuracy of recognition results. Furthermore, since the matching is divided according to the frequency of use, there is an advantage that matching of ordinary characters with characters that are used less frequently can be omitted.

[実施例コ 以下、本発明に係る文字認識装置の実施例について図面
に基づいて説明する。
[Example 7] Hereinafter, an example of a character recognition device according to the present invention will be described based on the drawings.

第1図において、光学的検出部1は紙等の記録媒体P上
に描出された文字Cに光を照射するとともに、その反射
光の強度により、記録媒体P上の濃淡を検出し、2値化
し、二次元ドツトパターンに変換する。次に、この二次
元ドツトパターンを読取りデータ処理部2へ供給する。
In FIG. 1, an optical detection unit 1 irradiates light onto a character C drawn on a recording medium P such as paper, and detects the shading on the recording medium P based on the intensity of the reflected light. and convert it into a two-dimensional dot pattern. Next, this two-dimensional dot pattern is supplied to the read data processing section 2.

読取りデータ処理部2においては、光学的検出部1にお
ける検出結果(2次元ドツトパターン)を文字毎に切り
出し正規化を行う。すなわち、記録媒体P上に通常の手
書き文書が記載されているような場合においては、その
文字量空白部分を用いて一文字毎の分離切り出しを行い
、切り出された一つの文字(人力文字)について、例え
ば60X60の二次元ドツトパターンに変換する。つま
り、入力文字の大きさによっては、この読取りデータ処
理部2によって拡大又は縮小の処理(正規化)を行い、
人力されたデータを所望の大きさの二次元ドツトパター
ンに変換するのである。
In the read data processing section 2, the detection result (two-dimensional dot pattern) obtained by the optical detection section 1 is extracted and normalized for each character. That is, in a case where a normal handwritten document is written on the recording medium P, each character is separated and extracted using the blank part of the character amount, and for each character (human handwritten character) that is extracted, For example, it is converted into a 60x60 two-dimensional dot pattern. In other words, depending on the size of the input character, the read data processing unit 2 performs enlargement or reduction processing (normalization).
It converts human data into a two-dimensional dot pattern of a desired size.

そして、このようにして得た二次元ドツトパターンは文
字パターン照合部3に供給される。この文字パターン照
合部3は、予め辞書部4に記憶されている文字毎の標準
パターンデータと読取りブタ処理部2から供給された二
次元ドツトパターンを比較することによって照合処理を
行う。ここで、この照合処理は単にドツト毎の濃淡が一
致するかという比較照合ではなく、読取りデータ処理部
2から供給されたデータについての特徴の抽出を行い、
この抽出された特徴データと標準文字パターンデータの
特徴とを比較することによって行う。そして、この特徴
データの抽出は、例えば60×60ドツトの二次元パタ
ーンデータを3×3のブロック毎に分け、この3×3ド
ツトからなるブロック内の1ドツト毎にそのドツトから
見た右方向又は下方向に線があるか否かによって0″“
1”というようなデジタルデータの集合とすることによ
って行う。また、これら特徴データ同士の照合は、各ド
ツト毎の入力文字と標準パターンとの差についての全体
の二乗和を計算し、検出した文字と辞書に記憶されてい
る標準パターンとのパターン間距離を算出することによ
って行う。
The two-dimensional dot pattern thus obtained is then supplied to the character pattern matching section 3. The character pattern matching section 3 performs matching processing by comparing standard pattern data for each character stored in advance in the dictionary section 4 with the two-dimensional dot pattern supplied from the reading pig processing section 2. Here, this matching process is not simply a comparison of whether the shading of each dot matches, but also extracts features of the data supplied from the read data processing section 2.
This is done by comparing the extracted feature data with the features of the standard character pattern data. To extract this feature data, for example, the two-dimensional pattern data of 60 x 60 dots is divided into 3 x 3 blocks, and each dot in the block consisting of 3 x 3 dots is extracted in the right direction as seen from that dot. Or 0"" depending on whether there is a line downwards or not.
This is done by making a set of digital data such as ``1''.Also, these feature data are compared by calculating the total sum of squares of the difference between the input character for each dot and the standard pattern, and then comparing the detected characters. This is done by calculating the inter-pattern distance between the standard pattern stored in the dictionary and the standard pattern stored in the dictionary.

また、上述の特徴データ抽出による文字認識の詳細につ
いては、「文字認識概論」 (橋本新一部編著 け)電
機通信協会 昭和57年3月20日発行)に記載されて
いる。
Further, details of character recognition by extracting feature data as described above are described in "Introduction to Character Recognition" (edited by Shinichi Hashimoto, published by the Electrical Communication Association, March 20, 1982).

このようにして得た文字パターン照合部3における文字
毎の照合データはりジェットレベル判定部5において所
定のりジエクトレベルと比較される。すなわち、パター
ン間距離が所定のりジエクトレベルより小さければ、類
似性が大きいとして認識される文字の候補文字として取
り上げられ、このリジェクトレベルより距離が大きけれ
ば異なる文字であるとして採用されない。そして、この
ようにリジェクトレベル以上の候補文字が複数取り上げ
られた場合には、このなかで最も距離の近いものを認識
文字として表示部6に供給する。表示部6はこの認識文
字をデイスプレィD等に表示する。また、必要によって
は複数の候補文字の表示も行う。
The collation data for each character in the character pattern collation unit 3 thus obtained is compared with a predetermined level in the jet level determination unit 5. That is, if the distance between patterns is smaller than a predetermined rejection level, the characters are taken up as candidate characters for characters recognized as having a high degree of similarity, and if the distance is larger than this reject level, they are considered to be different characters and are not adopted. When a plurality of candidate characters having a reject level or higher are picked up in this way, the closest one among them is supplied to the display section 6 as a recognized character. The display unit 6 displays the recognized characters on a display D or the like. In addition, a plurality of candidate characters may be displayed if necessary.

ここで、この発明において特徴的なことは、辞書部4に
おいて使用頻度別に文字を分類し、それぞれ別個の辞書
(1)〜辞書(3)として記憶していることである。そ
して、文字パターン照合部3は、その照合処理において
、辞書部4全体に記憶されている文字パターンと比較す
ることなく、使用頻度毎に分類されている辞書毎に比較
を行う。
Here, what is characteristic of this invention is that the dictionary section 4 classifies characters according to their frequency of use and stores them as separate dictionaries (1) to (3). In the matching process, the character pattern matching unit 3 compares each dictionary classified by frequency of use, without comparing it with the character patterns stored in the entire dictionary unit 4.

次に、この実施例の文字認識の手順について第2図に基
づいて説明する。
Next, the character recognition procedure of this embodiment will be explained based on FIG. 2.

まず処理を開始した際には、最初に使用頻度の高い文字
についての標準文字パターンを記憶している辞書(1)
を照合対象として採用する(照合対象を辞書(1)に)
。次に、読取りデータ処理部2から供給される人力文字
の二次元ドツトパターンから抽出した特徴データを辞書
(1)からの標準文字パターンについての特徴データと
比較し、パターン間距離を求める(辞書内の文字につい
て文字照合を行う)。そして、このようにして求められ
たパターン間距離を予め記憶しているリジェクトレベル
と比較し、入力文字の特徴データか比較対象となった標
準文字パターンと充分似ているかどうかを判定する(リ
ジェクトレベル判定)。
First, when processing starts, a dictionary (1) that stores standard character patterns for frequently used characters is used.
is adopted as the matching target (matching target is dictionary (1))
. Next, the feature data extracted from the two-dimensional dot pattern of the human-powered characters supplied from the read data processing unit 2 is compared with the feature data about the standard character pattern from the dictionary (1), and the distance between the patterns is determined (in the dictionary). ). The inter-pattern distance obtained in this way is then compared with a pre-stored rejection level to determine whether the input character feature data is sufficiently similar to the standard character pattern to be compared (reject level judgement).

ここで、このリジェクトレベルとの比較は辞書(1) 
内の全ての標準文字パターンについて行われ、これが全
てリジェクトされたか否かについての判定を行う(リジ
ェクトされたか)。そして、全てリジェクトされたので
あれば、辞書(1)内においては候補文字がなかったこ
ととなるので、次に全辞書について照合を行ったか否か
を判定する(全辞書について照合を行ったか)。今回の
場合はまた辞書(1)についてのみしか照合を行ってい
ないためこの結果はNoとなり、次の辞書に切り換える
こととなる(次の辞書に切り換える)。
Here, the comparison with this reject level is dictionary (1)
This is performed for all standard character patterns in the file, and a determination is made as to whether or not all of them have been rejected (rejected?). If all of them are rejected, it means that there are no candidate characters in dictionary (1), so next it is determined whether or not all dictionaries have been checked (whether all dictionaries have been checked) . In this case, since only the dictionary (1) is checked, the result is No, and a switch is made to the next dictionary (switch to the next dictionary).

そして、辞書を切り換えて次の辞書、すなわち辞書(2
)内の文字等の照合を前回と同様として行う。そして、
辞書(2)内の全ての文字パターンの比較においてもリ
ジェクトレベル以上の文字パターンがなかった場合には
また次の辞書、すなわち辞書(3)に切り換えこの辞書
内の文字パターン等の比較を行う。この辞書(3)にお
いてもリジェクトレベル以上の標準パターンがなかった
場合には、全辞書について照合を行ったが、候補文字が
ないため、候補文字なしと判定し、これを表示すること
となる(候補文字なし)。
Then, switch the dictionary to the next dictionary, that is, dictionary (2
) The characters in parentheses etc. are compared in the same way as the previous time. and,
If all the character patterns in the dictionary (2) are compared and there is no character pattern that is higher than the reject level, the next dictionary, that is, the dictionary (3) is switched to and the character patterns, etc. in this dictionary are compared. If there is no standard pattern of reject level or higher in this dictionary (3), all dictionaries are checked, but there are no candidate characters, so it is determined that there are no candidate characters, and this is displayed ( (no candidate characters).

一方、辞書(1)’、(2)、(3)のいずれかにおい
て、リジェクトレベル以上の標準パターンがあれば、こ
れを候補文字として認識し、これを記憶する(候補文字
出力)。そして、この入力文字についての照合処理を終
了する。
On the other hand, if there is a standard pattern of reject level or higher in any of the dictionaries (1)', (2), and (3), this is recognized as a candidate character and stored (candidate character output). Then, the matching process for this input character ends.

このように、本発明においては、辞書(1)との照合に
おいてリジェクトレベル以上の類似標準パターンがあれ
ばそれを候補文字として出力して照合処理を終了するこ
ととなる。
As described above, in the present invention, if there is a similar standard pattern of a reject level or higher in the comparison with the dictionary (1), it is output as a candidate character and the matching process is ended.

すなわち、本実施例の装置によれば、使用頻度の高い順
に辞書(1)、辞書(2)、辞書(3)と順次照合を行
う。そして、辞書(1)において候補文字が挙がれば、
以下の順次のパターン辞書との照合は行わない。そこで
、使用頻度の高い文字が優先的に候補に挙げられる事と
なり、余り使われないような文字が候補に挙がることが
避けられ、全体的な認識精度を向上させることができる
That is, according to the apparatus of this embodiment, the dictionary (1), dictionary (2), and dictionary (3) are checked in order of frequency of use. Then, if a candidate character is listed in dictionary (1),
The following sequential pattern dictionary matching is not performed. Therefore, frequently used characters are preferentially selected as candidates, and characters that are rarely used are prevented from being selected as candidates, thereby improving the overall recognition accuracy.

次に、このような文字認識についての全体処理について
第3図に基づいて説明する。
Next, the overall processing for such character recognition will be explained based on FIG. 3.

記録媒体に記録された文字についての認識を行う場合に
は、まず記録媒体を所定の部位にセット2 し、これについて光学的な読取りを行う。そして、この
ように読取ったデータについて各文字毎の切り出しを行
い、これを文字毎に辞書内の標準文字パターンと比較し
て照合処理を行う。そして、入力文書全体についての照
合処理を前述のようにして行う(入力文書に対し照合処
理を行う)。そして、このような認識結果に基づいて第
1候補(最もパターン間距離の近い文字)について文字
毎に表示を行いその認識結果についてデイスプレィ等に
表示する(認識結果表示)。そして、使用者は、この表
示を見て誤って認識された文字があるか否かを判定する
(誤認識文字があるか)。誤認識文字がなければ全ての
認識結果が正しいため、修正処理は行う必要がないため
処理を終了する(終了)。
When recognizing characters recorded on a recording medium, the recording medium is first set in a predetermined position 2 and optically read. Then, each character is extracted from the data read in this way, and this is compared for each character with standard character patterns in the dictionary to perform a matching process. Then, the verification process for the entire input document is performed as described above (the verification process is performed for the input document). Then, based on such recognition results, the first candidate (the character with the closest pattern distance) is displayed for each character, and the recognition results are displayed on a display or the like (recognition result display). Then, the user looks at this display and determines whether there are any characters that have been erroneously recognized (are there any erroneously recognized characters?). If there are no misrecognized characters, all recognition results are correct, and there is no need to perform correction processing, so the processing ends (end).

一方、誤認識文字があった場合には、その誤認識文字に
ついて修正を行わなければならない。そこで、カーソル
をその誤認識文字に合わせるなどの手段により、誤認識
文字についての指定を行い、そこで候補文字の表示を行
う(候補文字表示)。
On the other hand, if there is a misrecognized character, the misrecognized character must be corrected. Therefore, the erroneously recognized character is specified by moving the cursor to the erroneously recognized character, and candidate characters are then displayed (candidate character display).

すなわち、上述の一文字毎の認識処理において、リジェ
クトレベル以上の類似性を持つ文字はそれぞれ候補文字
として記憶されているため、誤認識文字が指定されれば
、これについての候補文字を出力することが出来る。そ
して、使用者は、この候補文字の中に正しい文字が含ま
れているか否かを判定する(該当文字は含まれているか
)。該当文字が含まれていれば、候補文字の中からその
文字を選択する(候補文字の選択)。そして、この選択
が行われた場合には、この選択された文字を誤認識文字
である第1候補の文字と入れ換えこの文字による修正を
行う(選択された文字で修正)。
In other words, in the above-mentioned character-by-character recognition process, each character that has similarity equal to or higher than the reject level is stored as a candidate character, so if an incorrectly recognized character is specified, a candidate character for this character can be output. I can do it. Then, the user determines whether or not the correct characters are included in these candidate characters (are the corresponding characters included?). If the corresponding character is included, that character is selected from the candidate characters (candidate character selection). When this selection is made, the selected character is replaced with the first candidate character, which is the misrecognized character, and correction is performed using this character (correction using the selected character).

そして、次の文字の修正動作に移る。Then, the process moves on to the correction operation for the next character.

また、候補文字表示において該当文字が含まれていなか
った場合には、前回の照合処理において該当文字が出力
されなかったのであるから辞書を切り換えて照合を行う
(辞書を切り換えて照合)。
Furthermore, if the corresponding character is not included in the candidate character display, this means that the corresponding character was not output in the previous matching process, and therefore the dictionary is switched and matching is performed (switching dictionary and matching).

これは、本実施例の装置においては、辞書が複数分類さ
れて別個に設けられているため、照合処理はそれぞれ辞
書毎に行われる。そして、使用頻度の高い辞書との照合
において候補文字があった場合は次の辞書とは照合して
いない。そこで、該当文字が候補文字中になかった場合
には、次の辞書に該当文字が含まれていると考えられ、
前回候補文字が選択された辞書の次の順位の辞書を選択
して個々に記憶されている文字パターンとの照合処理を
行う。
This is because in the apparatus of this embodiment, the dictionaries are classified into multiple categories and provided separately, so the matching process is performed for each dictionary. If a candidate character is found in a frequently used dictionary, it is not compared with the next dictionary. Therefore, if the corresponding character is not among the candidate characters, it is assumed that the next dictionary contains the corresponding character,
The dictionary with the next rank after the dictionary in which the candidate character was selected last time is selected and matched with the individually stored character patterns.

そして、この次の辞書内の全ての文字パター“ンとの照
合処理を行いここで幾つかの候補文字があれば候補文字
表示に戻り、該当文字が含まれているか否かの判定を行
う。一方、辞書を切り換えて照合したにも拘らず全ての
文字パターンとの照合結果において候補文字が一つもな
かった場合には、次に照合する辞書があるかないかにつ
いての判定を行う(全ての辞書の照合は終わったか)。
Then, a comparison process is performed with all the character patterns in the next dictionary, and if there are some candidate characters, the display returns to the candidate character display and it is determined whether or not the corresponding character is included. On the other hand, if there is no candidate character in the results of matching with all character patterns even though the dictionary has been switched and matching is performed, it is determined whether there is a dictionary to match next (all dictionaries are checked). Has the verification been completed?)

そして、残りの辞書があればそれに切り換えて改めて照
合処理を行い、このような処理においても候補文字が出
力されなかった場合にはキーボードより文字を入力する
(キーホードより文字を人力)。
Then, if there is a remaining dictionary, the system switches to it and performs the matching process again, and if no candidate character is output even in this process, the character is input from the keyboard (the character is entered manually from the keyboard).

そして、このキーボードより人力した文字を修正5 文字として人力し次の文字の修正動作に移る。Then, correct the characters manually from this keyboard 5 Manually edit the characters and move on to correcting the next character.

以上のようにして、当初の文字認識において誤りがあっ
た場合における修正を行うことができる。
In the manner described above, it is possible to correct an error in the initial character recognition.

なお、上記実施例においては、辞書(1)〜辞書(3)
の3つの辞書を採用したが、2つ以上の任意の数とする
ことができる。
In addition, in the above embodiment, dictionary (1) to dictionary (3)
Although three dictionaries were adopted, any number of dictionaries greater than or equal to two can be used.

また、辞書4の使用頻度別の分類は、予め決定しておい
てもよいが、学習機能等によって随時変更してもよい。
Furthermore, the classification of the dictionary 4 according to usage frequency may be determined in advance, but may be changed at any time using a learning function or the like.

さらに、実施例においては、分類した辞書(1)〜辞書
(3)を物理的に別個に設けたが、辞書4自体は1つと
し、記憶している標準文字パターン毎に辞書(1)〜辞
書(3)の分類を識別する符号を設けて区別してもよい
。また、文字認識において一文字毎の照合結果のみでな
く前後の認識文字との比較により、熟語としての照合処
理を行う機能を付加してもよい。また、上述の特徴デー
タ抽出後の特徴比較によるリジェクトレベルは、文字に
よってリジェクトレベルを非常に小さな距離としてよい
場合も大きな距離としなければならない場合もあるため
、これを文字毎に6 変更するとよい。
Furthermore, in the embodiment, classified dictionaries (1) to dictionaries (3) are physically separate, but there is only one dictionary 4, and dictionaries (1) to dictionaries (1) to dictionaries (3) are provided for each stored standard character pattern. A code may be provided to identify the classification of the dictionary (3). Furthermore, in character recognition, a function may be added to perform matching processing as an idiom by comparing not only the matching result for each character but also the preceding and succeeding recognized characters. Furthermore, the rejection level determined by the feature comparison after the feature data extraction described above may be set to a very small distance or a large distance depending on the character, so it is recommended to change the rejection level by 6 for each character.

[発明の効果コ 以上説明したように、この発明によれば、使用頻度の高
い文字を優先的に照合することができるため、余り使わ
れないような文字が候補としてあげられる可能性か低く
なり、全体的な認識制度を向上させることか出来る。ま
た、使用頻度の低い文字の辞書に際しては、照合を行う
回数が減るため、全体として認識速度の改善をすること
ができる。
[Effects of the Invention] As explained above, according to this invention, frequently used characters can be compared preferentially, which reduces the possibility that rarely used characters will be selected as candidates. , it is possible to improve the overall recognition system. Furthermore, in the case of a dictionary of characters that are used infrequently, the number of times of matching is reduced, so that the overall recognition speed can be improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明の実施例の構成を示すブロック図、 第2図は同実施例における文字認識の処理の流れを示す
フローチャート、 第3図は同実施例における文字認識全体の処理の流れを
説明するためのフローチャートである。 1 ・・・ 光学的検出部 2 ・・・ 読取りデータ処理部 3 ・・・ 文字パターン照合部 4 ・・・ 辞書部 リジェクトレベル判定部 表示部
Fig. 1 is a block diagram showing the configuration of an embodiment of the present invention, Fig. 2 is a flowchart showing the flow of character recognition processing in the embodiment, and Fig. 3 shows the overall processing flow of character recognition in the embodiment. It is a flow chart for explanation. 1... Optical detection section 2... Read data processing section 3... Character pattern matching section 4... Dictionary section Rejection level judgment section Display section

Claims (1)

【特許請求の範囲】[Claims] (1)紙等の記録媒体上に描出された文字を光学的に検
出し、二次元ドットパターンとして読取る光学的検出部
と、 この光学的検出部によって読取られた前記二次元ドット
パターンを正規化等の前処理する読取りデータ処理部と
、 文字毎の標準パターンデータをその使用頻度に応じて複
数の辞書に分類して記憶する辞書部と、前記光学的検出
部と読取データ処理部とによって得られた読取り結果を
使用頻度の高い文字についての標準パターンからなる第
1の辞書と比較照合する文字パターン照合部と、 この文字パターン照合部による結果が予め記憶している
所定レベル以上であった場合にその文字を認識候補文字
と判定するリジェクトレベル判定部と、を含み、 前記文字パターン照合部は、文字パターン照合部におけ
る結果が所定レベル以下であった場合に、順次使用頻度
の低い文字についての標準パターンからなる第2の辞書
との比較照合を行うことを特徴とする文字認識装置。
(1) An optical detection unit that optically detects characters drawn on a recording medium such as paper and reads them as a two-dimensional dot pattern, and normalizes the two-dimensional dot pattern read by this optical detection unit. a read data processing unit that performs pre-processing such as the above, a dictionary unit that classifies and stores standard pattern data for each character into a plurality of dictionaries according to the frequency of use, and the optical detection unit and the read data processing unit. a character pattern matching section that compares and matches the read results obtained with a first dictionary consisting of standard patterns for frequently used characters; a rejection level determination unit that determines the character as a recognition candidate character, and the character pattern matching unit sequentially rejects characters with low usage frequency when the result in the character pattern matching unit is below a predetermined level. A character recognition device characterized by performing comparison verification with a second dictionary consisting of standard patterns.
JP1176128A 1989-07-07 1989-07-07 Character recognizer Pending JPH0340186A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1176128A JPH0340186A (en) 1989-07-07 1989-07-07 Character recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1176128A JPH0340186A (en) 1989-07-07 1989-07-07 Character recognizer

Publications (1)

Publication Number Publication Date
JPH0340186A true JPH0340186A (en) 1991-02-20

Family

ID=16008159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1176128A Pending JPH0340186A (en) 1989-07-07 1989-07-07 Character recognizer

Country Status (1)

Country Link
JP (1) JPH0340186A (en)

Similar Documents

Publication Publication Date Title
JP2000353215A (en) Character recognition device and recording medium where character recognizing program is recorded
KR100249055B1 (en) Character recognition apparatus
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
JPH05217025A (en) Apparatus and method for on-line handwritten- character recognition
US4491965A (en) Character recognition apparatus
JPH0340186A (en) Character recognizer
JP2903779B2 (en) Character string recognition method and apparatus
JPS6142083A (en) Character recognition device
JP2677271B2 (en) Character recognition device
JP2985813B2 (en) Character string recognition device and knowledge database learning method
JPS6146573A (en) Character recognizing device
JP2851865B2 (en) Character recognition device
JPS6160184A (en) Optical character reader
JP3138665B2 (en) Handwritten character recognition method and recording medium
JPS60138689A (en) Character recognizing method
JPH07107698B2 (en) Character recognition method
JPH1011541A (en) Character recognition device
JPH08202830A (en) Character recognition system
JPH02217981A (en) Device for recognizing on-line hand-written character
JPH0576674B2 (en)
JPH04318687A (en) Character recognition unit
JP2002074269A (en) Method for recognizing character
JPS5851390A (en) Font character recognizing device
JPH06259595A (en) Device and method for processing character recognition
JPH03224079A (en) Character recognizer