JPH0935006A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH0935006A
JPH0935006A JP7181275A JP18127595A JPH0935006A JP H0935006 A JPH0935006 A JP H0935006A JP 7181275 A JP7181275 A JP 7181275A JP 18127595 A JP18127595 A JP 18127595A JP H0935006 A JPH0935006 A JP H0935006A
Authority
JP
Japan
Prior art keywords
character
recognition
unit
statistical information
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7181275A
Other languages
Japanese (ja)
Inventor
Yasunao Isaki
保直 伊▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP7181275A priority Critical patent/JPH0935006A/en
Publication of JPH0935006A publication Critical patent/JPH0935006A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To generate an optimum standard character pattern dictionary for operation by automatically altering the contents of the standard pattern dictionary according to character statistical information obtained through the character recognition of a document to be recognized or a test document on which bias of characters used for the operation is reflected. SOLUTION: The character recognition is performed by using the test document, etc., and a character statistical information generation part 2 generates a frequency of appearance or character statistical information on a character, etc., whose misread is corrected, character by character, according to the recognition result 6". A standard pattern dictionary alteration part 3 alters the contents of the standard pattern dictionary 4 on the basis of the character statistical information. Thus, the character pattern of the document is inputted from a character pattern input part 5 first for the character recognition. A character recognition part 6 segments one character out of the inputted character pattern, extracts and compares features with features (template) in the generated standard pattern dictionary 4, and finds similarity, a distance, etc., to recognize the character. A recognition result output part 7 outputs the character recognition result.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は,文字認識装置に関す
る。文字認識装置は,あらかじめ多数の学習サンプルに
よって作られた標準パターン辞書を使って文字認識する
ものであり,OCRの利用分野が広まるに伴って,様々
な業務に使用されている。そのため,文字認識の対象と
なる帳票は,様々なフォーマットの帳票が使用され,そ
こに記入される文字種も異なり,文字種の使用頻度も業
務毎に偏りがあるものである。例えば,住所や氏名だけ
を記入する帳票では,都市名,県名,姓,名前等で使用
される文字に偏り,また,数字10文字だけを記入する
帳票であっても,0と1の出現頻度は他の数字に比べて
著しく高いのが普通である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device. The character recognition device recognizes characters using a standard pattern dictionary created in advance by a large number of learning samples, and is used in various jobs as the field of use of OCR spreads. For this reason, as a form to be subjected to character recognition, forms of various formats are used, the character types to be written therein are different, and the frequency of use of the character types is biased for each business. For example, in a form in which only addresses and names are entered, the letters used in city names, prefecture names, surnames, names, etc. are biased, and even in the form in which only 10 numbers are entered, 0 and 1 appear. The frequency is usually significantly higher than other numbers.

【0002】これら全ての業務に適用できるように開発
された汎用の標準パターン辞書を使った場合にはいずれ
の業務においても高い認識精度が得られるとは限らな
い。そのため,出現頻度に偏りがある場合にも高い認識
精度で認識できる文字認識装置が求められている。
When a general-purpose standard pattern dictionary developed so as to be applicable to all of these jobs is used, high recognition accuracy may not always be obtained in every job. Therefore, there is a demand for a character recognition device that can recognize with high recognition accuracy even when the appearance frequencies are biased.

【0003】[0003]

【従来の技術】図15は従来の文字認識装置を示す。図
15において,310は文字認識装置である。
2. Description of the Related Art FIG. 15 shows a conventional character recognition device. In FIG. 15, reference numeral 310 is a character recognition device.

【0004】311は文字パターン入力部であって,光
学的文字読み取り装置等により帳票に記入された手書き
文字のパターンを入力するものである。312は標準パ
ターン辞書であって,文字カテゴリ毎の標準パターンの
特徴を集めたものである。テンプレートはそれぞれの文
字カテゴリーの標準パターンの特徴を表すものである。
Reference numeral 311 is a character pattern input unit for inputting a pattern of handwritten characters written on a form by an optical character reading device or the like. A standard pattern dictionary 312 is a collection of standard pattern features for each character category. The template represents the characteristics of the standard pattern of each character category.

【0005】標準パターン辞書312において,321
は文字カテゴリであって,「ア」,「イ」,「ウ」等の
文字パターンの意味を表すものである。
321 in the standard pattern dictionary 312
Is a character category and represents the meaning of a character pattern such as "A", "I", "U".

【0006】322は標準パターンであって,「ア」の
手書き文字の標準パターンである。323はテンプレー
トであって,手書き文字の標準パターンの特徴を表すも
のである(例えば,横線の本数,縦線の本数,輪郭線の
形状等)。
Reference numeral 322 is a standard pattern, which is a standard pattern of a handwritten character "A". Reference numeral 323 is a template that represents the characteristics of a standard pattern of handwritten characters (for example, the number of horizontal lines, the number of vertical lines, the shape of contour lines, etc.).

【0007】図15の従来の文字認識装置の動作につい
て説明する。文字パターン入力部311は光学文字読み
取り装置等により読み取られた帳票の手書き文字を入力
する。文字認識部313は,手書き文字の入力パターン
から1文字の文字パターンを切り出し,特徴を抽出す
る。そして,抽出した特徴について標準パターン辞書3
12の各テンプレートと比較し,類似度計算もしくは距
離計算を行う。最大の類似度もしくは最小の距離となる
テンプレートの文字カテゴリを認識結果として出力す
る。
The operation of the conventional character recognition device shown in FIG. 15 will be described. The character pattern input unit 311 inputs handwritten characters of a form read by an optical character reading device or the like. The character recognition unit 313 extracts a character pattern of one character from the input pattern of the handwritten character and extracts the feature. Then, for the extracted features, the standard pattern dictionary 3
The similarity calculation or the distance calculation is performed by comparing each of the 12 templates. The character category of the template having the maximum similarity or the minimum distance is output as the recognition result.

【0008】[0008]

【発明が解決しようとする課題】従来の文字認識装置
は,あらかじめすべての業務を想定し,すべての文字が
等頻度で出現するものとして多数の学習サンプルの中か
ら複数の標準パタ−ンを選び,標準パターン辞書として
いた。そのため,実際に使用するのにあたって,各文字
が等頻度で出現する業務に適用する場合には最大の認識
精度が得られるが,多くの場合,文字の出現頻度に偏り
があり,標準パターン辞書の作成条件と大きく異なるた
め,認識精度が低下するという問題があった。
A conventional character recognition device, assuming all jobs in advance, selects a plurality of standard patterns from a large number of learning samples assuming that all characters appear with equal frequency. , It was a standard pattern dictionary. Therefore, in actual use, the maximum recognition accuracy is obtained when applied to a job in which each character appears with equal frequency, but in many cases, the appearance frequency of characters is biased and There is a problem that the recognition accuracy is reduced because it differs greatly from the creation conditions.

【0009】また,学習文字サンプルは全ての手書き文
字のパターンを含むわけではないので,実際の業務での
出現頻度の高い文字種については学習サンプルより変形
の大きい文字パターンについては認識精度が低下するの
で,従来の文字認識装置は実際に想定していた場合より
文字認識精度が低い場合がある。
Further, since the learning character sample does not include all the patterns of handwritten characters, the recognition accuracy decreases for a character pattern that frequently appears in actual work and for a character pattern that is more deformed than the learning sample. However, the conventional character recognition device may have a lower character recognition accuracy than actually assumed.

【0010】本発明は,帳票で使用されている文字に偏
りがある場合にも高い認識精度が得られる文字認識装置
を提供することを目的とする。
It is an object of the present invention to provide a character recognition device that can obtain high recognition accuracy even when the characters used in a form are biased.

【0011】[0011]

【課題を解決するための手段】本発明の基本構成(1)
は,帳票の文字統計情報を作成する文字統計情報作成部
と,文字の特徴を表す標準パターンをもつ標準パターン
辞書と,文字統計情報をもとに標準パターン辞書の内容
を変更する標準パターン辞書変更部と,認識対象の文字
パターンと標準パターン辞書の標準パターンとを比較し
て該文字パターンの文字認識をする文字認識部と,文字
認識の結果を出力する認識結果出力部とを備える構成を
もつ。
[Means for Solving the Problems] Basic configuration of the present invention (1)
Is a character statistical information creation unit that creates the character statistical information of the form, a standard pattern dictionary that has standard patterns that represent the characteristics of the characters, and a standard pattern dictionary change that changes the contents of the standard pattern dictionary based on the character statistical information. Section, a character recognition section for comparing the character pattern to be recognized with the standard pattern in the standard pattern dictionary to recognize the character of the character pattern, and a recognition result output section for outputting the result of the character recognition. .

【0012】本発明の基本構成(2) は,帳票の文字統計
情報を作成する文字統計情報作成部と,文字の特徴を表
す標準パターンをもつ標準パターン辞書と,認識対象の
文字パターンと標準パターン辞書の標準パターンとを比
較し該文字パターンの文字認識をする文字認識部と,文
字統計情報をもとに文字に重み付けをする重み作成部
と,文字認識の結果を出力する認識結果出力部とを備
え,認識対象の文字パターンと標準パターンとの特徴点
の比較結果と重み作成部の作成した重みとに基づいて認
識結果を求め,出力する構成をもつ。
The basic configuration (2) of the present invention is to provide a character statistical information creating unit for creating character statistical information of a form, a standard pattern dictionary having standard patterns representing characteristics of characters, a character pattern to be recognized and a standard pattern. A character recognition unit that compares the character pattern of the character pattern with a standard pattern of a dictionary, a weight creation unit that weights the characters based on the character statistical information, and a recognition result output unit that outputs the result of character recognition. The recognition result is obtained and output based on the comparison result of the feature points of the character pattern to be recognized and the standard pattern and the weight created by the weight creation unit.

【0013】図1は本発明の基本構成を示す。図1にお
いて,1は文字認識装置である。
FIG. 1 shows the basic configuration of the present invention. In FIG. 1, 1 is a character recognition device.

【0014】2は文字統計情報作成部であって,例え
ば,文字の出現回数,文字の修正回数等を作成するもの
である。3は標準パターン辞書変更部であって,入力さ
れた文字の統計情報に基づいて標準パターン辞書の内容
を変更するものである。例えば,文字の出現回数に応じ
て文字カテゴリ毎に文字認識に使用するテンプレート数
を変更するものである。
Reference numeral 2 denotes a character statistical information creating unit, which creates, for example, the number of times a character appears and the number of times a character is modified. A standard pattern dictionary changing unit 3 changes the contents of the standard pattern dictionary on the basis of the statistical information of the input characters. For example, the number of templates used for character recognition is changed for each character category according to the number of times a character appears.

【0015】4は標準パターン辞書である。5は文字パ
ターン入力部であって,光学的文字読み取り装置等で読
み取られた帳票の文字パターンを入力するものである。
Reference numeral 4 is a standard pattern dictionary. A character pattern input unit 5 is for inputting a character pattern of a form read by an optical character reading device or the like.

【0016】6は文字認識部であって,入力された文字
パターンについて1文字ずつ標準パターン辞書4の文字
パターンと比較し,文字認識をするものである。6”は
認識結果である。
Reference numeral 6 denotes a character recognition unit, which compares the input character pattern with the character pattern of the standard pattern dictionary 4 character by character and recognizes the character. 6 "is a recognition result.

【0017】7は認識結果出力部であって,ディスプレ
イ等に認識結果を出力するものである。図1の本発明の
基本構成(1) の動作を説明する。
A recognition result output unit 7 outputs the recognition result to a display or the like. The operation of the basic configuration (1) of the present invention in FIG. 1 will be described.

【0018】まず,業務で使用する帳票,学習用のテス
ト帳票等により文字認識し,その認識結果6”により文
字統計情報作成部2は,出現回数,あるいは誤読を修正
した文字等の文字統計情報を文字毎に作成する。そし
て,標準パターン辞書変更部3は文字統計情報を基に標
準パターン辞書4の内容を変更する。例えば,出現回数
が多い文字についてはテンプレート数を多くし,出現回
数が低い文字についてはテンプレート数を少なくする等
である。あるいは,文字統計情報が誤読により修正され
た文字(修正文字)の修正回数(修正文字毎の修正回
数)であれば,修正回数の多い修正文字のテンプレート
数を多くし,修正回数の少ない修正文字についてはテン
プレート数を少なくする等である。
First, character recognition is performed by a form used in business, a test form for learning, etc., and the character statistical information creation unit 2 uses the recognition result 6 "to determine the number of appearances or character statistical information such as a character whose misreading is corrected. Then, the standard pattern dictionary changing unit 3 changes the contents of the standard pattern dictionary 4 based on the character statistical information.For example, for a character with a large number of appearances, the number of templates is increased and the number of appearances is increased. For low characters, reduce the number of templates, etc. Alternatively, if the character statistical information is the number of corrections (correction number) of a character that has been corrected by misreading (correction number), the correction character with many corrections The number of templates is increased, and the number of templates is reduced for modified characters with a small number of modifications.

【0019】そのようにして,標準パターン辞書4の内
容を変更する。文字認識はまず文字パターン入力部5よ
り帳票の文字パターンを入力する。文字認識部6は,入
力された文字パターンから1文字を切り出して特徴を抽
出し,上記のように作成した標準パターン辞書4の特徴
(テンプレート)と比較し,類似度,距離等を求め,文
字認識をする。認識結果出力部7は文字認識結果を出力
する。
In this way, the contents of the standard pattern dictionary 4 are changed. For character recognition, first, the character pattern of the form is input from the character pattern input unit 5. The character recognition unit 6 cuts out one character from the input character pattern, extracts the feature, compares it with the feature (template) of the standard pattern dictionary 4 created as described above, obtains the degree of similarity, distance, etc. Be aware. The recognition result output unit 7 outputs the character recognition result.

【0020】図2は本発明の基本構成(2) である。図2
において,1は文字認識装置である。
FIG. 2 shows the basic configuration (2) of the present invention. FIG.
In, 1 is a character recognition device.

【0021】4は標準パターン辞書である。5は文字パ
ターン入力部である。6は文字認識部である。
Reference numeral 4 is a standard pattern dictionary. Reference numeral 5 is a character pattern input unit. 6 is a character recognition unit.

【0022】6’は比較部であって,入力された1文字
の文字パターンの特徴と標準辞書の特徴を比較して類似
度,距離等を計算するものである。そして,類似度もし
くは距離等に重み作成部13で作成された重みを加味す
るものである。
Reference numeral 6'denotes a comparison unit for calculating the degree of similarity, distance, etc. by comparing the characteristics of the input character pattern of one character with the characteristics of the standard dictionary. Then, the weight created by the weight creating unit 13 is added to the similarity or the distance.

【0023】6”は認識結果である。12は統計情報作
成部である。13は重み作成部であって,文字の出現回
数等の文字統計情報に基づいて文字毎に重みを作成する
ものであり,例えば,出現回数の高い文字に対しては低
い重み付けをし,出現回数の低い文字に対しては高い重
み付けをし,文字認識部6において,距離計算結果に重
みを乗算し,乗算結果に基づいて文字認識するものであ
る。あるいは類似度により文字認識する場合には出現回
数の多い文字の重みを大きくし,出現回数の少ない文字
の重みを小さくし,文字認識部6において,類似度に重
みを乗算し,乗算結果に基づいて文字認識するものであ
る。
6 "is a recognition result. 12 is a statistical information creating unit. 13 is a weight creating unit, which creates a weight for each character based on character statistical information such as the number of appearances of characters. Yes, for example, a character with a high frequency of appearance is weighted low, a character with a low frequency of occurrence is weighted high, and in the character recognition unit 6, the distance calculation result is multiplied by the weight, and the multiplication result is Alternatively, when recognizing a character based on the similarity, the weight of the character having a large number of appearances is increased, the weight of the character having a small number of appearances is reduced, and the character recognition unit 6 determines the similarity. The weight is multiplied and character recognition is performed based on the multiplication result.

【0024】図2の構成の動作を説明する。まず,業務
で使用する帳票,学習用のテスト帳票等により文字認識
し,文字統計情報作成部2はその認識結果6”により,
出現回数,あるいは誤読を修正した文字等の文字統計情
報を文字毎に作成する。そして,重み作成部13は文字
統計情報に基づいて文字毎に重み付けをする。例えば1
文字の文字パターンと標準パターン辞書のテンプレート
との距離により認識する場合には,出現回数の多い文字
の重みを小さくし,出現回数の少ない文字の重みを大き
くする。類似度により文字認識する場合にはその反対に
出現回数の多い文字の重みを大きくし,出現回数の少な
い文字の重みを小さくする。
The operation of the configuration of FIG. 2 will be described. First, character recognition is performed on a form used in business, a test form for learning, etc., and the character statistical information creation unit 2 uses the recognition result 6 "to
Character statistical information is created for each character, such as the number of appearances or characters with corrected misreading. Then, the weight creating unit 13 weights each character based on the character statistical information. Eg 1
In the case of recognition based on the distance between the character pattern of the character and the template of the standard pattern dictionary, the weight of the character having the high frequency of appearance is reduced and the weight of the character having the low frequency of occurrence is increased. On the other hand, when recognizing a character based on the similarity, the weight of the character having a high appearance frequency is increased, and the weight of the character having a low appearance frequency is decreased.

【0025】文字パターン入力部5は帳票の文字パター
ンを入力する。文字認識部6は入力文字パターンから1
文字の文字パターンを切り出し,その特徴について標準
パターン辞書4の特徴と比較する。そして,特徴を比較
することにより得られた距離もしくは類似度に重み作成
部13の作成した重みを加味し,文字認識する。例え
ば,特徴を比較して得られた距離もしくは類似度に重み
を乗算し,換算距離,換算類似度とする。換算距離の小
さい順に1つもしくは複数個を認識結果として出力す
る。換算類似度の場合には,換算類似度の大きい順に1
つもしくは複数個を認識結果として出力する。
The character pattern input unit 5 inputs the character pattern of the form. The character recognizing unit 6 selects 1 from the input character pattern.
A character pattern of a character is cut out, and its characteristic is compared with the characteristic of the standard pattern dictionary 4. Then, the distance or the similarity obtained by comparing the features is added with the weight created by the weight creating unit 13 to perform character recognition. For example, the distance or the similarity obtained by comparing the features is multiplied by a weight to obtain the converted distance and the converted similarity. One or a plurality of conversion distances are output in the ascending order of the recognition distances. In the case of conversion similarity, 1 in descending order of conversion similarity
One or more are output as the recognition result.

【0026】[0026]

【作用】本発明の基本構成(1) によれば,認識対象とな
る帳票もしくは業務で使用する文字の偏りを反映したテ
スト帳票を文字認識して得られる文字統計情報をもとに
標準パターン辞書の内容を自動的に変更するので,常に
業務に応じた最適な標準文字パターン辞書を作成するこ
とができる。そのため,業務毎に常に最大の認識精度に
近い精度の文字認識をすることができる。
According to the basic configuration (1) of the present invention, the standard pattern dictionary is obtained based on the character statistical information obtained by character recognition of the form to be recognized or the test form reflecting the bias of the characters used in the work. Since the contents of are automatically changed, it is always possible to create an optimal standard character pattern dictionary according to the work. Therefore, it is possible to always perform character recognition with accuracy close to the maximum recognition accuracy for each job.

【0027】また,本発明の基本構成(2) によれば,認
識対象となる帳票もしくは業務で使用する文字の偏りを
反映したテスト帳票を文字認識して得られる文字統計情
報をもとに文字に重み付けをし,文字認識部の認識結果
に反映できるので,認識の基準とする値が曖昧でなくな
り,認識精度を向上させることができる。
Further, according to the basic configuration (2) of the present invention, characters are recognized based on character statistical information obtained by character recognition of a form to be recognized or a test form reflecting a bias of characters used in business. Can be weighted and reflected in the recognition result of the character recognition unit, so that the value used as the recognition reference is not ambiguous and the recognition accuracy can be improved.

【0028】[0028]

【実施例】図3は本発明の実施例1であって,出現頻度
に応じて標準パターン辞書の内容を変更するようにした
ものである。
FIG. 3 shows the first embodiment of the present invention, in which the contents of the standard pattern dictionary are changed according to the appearance frequency.

【0029】図3において,31は文字認識装置であ
る。32は制御部であって,標準パターン辞書,文字認
識部,その他の各部の動作制御をするものである。
In FIG. 3, reference numeral 31 is a character recognition device. A control unit 32 controls the operations of the standard pattern dictionary, the character recognition unit, and other units.

【0030】33は標準パターン辞書変更部であって,
辞書変更モードで標準パターン辞書の内容を変更するも
のである。34は標準パターン辞書である。
33 is a standard pattern dictionary changing unit,
The contents of the standard pattern dictionary are changed in the dictionary change mode. 34 is a standard pattern dictionary.

【0031】35は文字パターン入力部であって,文字
パターン読み取り装置211の読み取った文字パターン
を入力するものである。36は文字認識部であって,文
字認識モードの指定で入力された文字パターンの文字認
識をするものである。
Reference numeral 35 is a character pattern input section for inputting a character pattern read by the character pattern reading device 211. A character recognition unit 36 recognizes characters in a character pattern input by designating a character recognition mode.

【0032】36”は認識結果である。37は認識結果
出力部であって,認識結果をディスプレイ212,他の
データ処理装置213等に出力するものである。
Reference numeral 36 "is a recognition result. Reference numeral 37 is a recognition result output unit, which outputs the recognition result to the display 212, another data processing device 213 or the like.

【0033】38は文字統計情報作成部である。41は
文字切り出し部であって,入力された文字パターンから
1文字の文字パターンを切り出すものである。
Reference numeral 38 is a character statistical information creating section. Reference numeral 41 denotes a character cutout unit, which cuts out a character pattern of one character from the input character pattern.

【0034】42は特徴抽出部であって,1文字の文字
パターンから特徴を抽出するものである。43は特徴比
較部であって,1文字の文字パターンの特徴と標準パタ
ーン辞書34の特徴(テンプレート)との距離計算をす
るものである。
Reference numeral 42 is a feature extraction unit for extracting features from a character pattern of one character. A feature comparison unit 43 calculates the distance between the feature of one character pattern and the feature (template) of the standard pattern dictionary 34.

【0035】44は出現回数測定部であって,認識結果
出力部37の出力する認識結果に基づいて文字毎の出現
回数をカウントするものである。45は出現回数保持部
であって,文字毎の出現回数を保持するものである。
An appearance frequency measuring unit 44 counts the appearance frequency of each character based on the recognition result output from the recognition result output unit 37. Reference numeral 45 denotes an appearance count holding unit, which holds the appearance count for each character.

【0036】210は入力装置であって,辞書変更モー
ド,文字認識モードの等のモード指定,誤読文字の修正
等をするキーボード等である。211は文字パターン読
み取り装置であって,帳票に記入された文字のパターン
を読み取るものである。
An input device 210 is a keyboard or the like for designating modes such as a dictionary change mode and a character recognition mode, and correcting misread characters. A character pattern reading device 211 reads a pattern of characters written on a form.

【0037】212はディスプレイであって,帳票の認
識結果を表示するものである。213は他のデータ処理
装置であって,文字認識されたデータを処理する他のコ
ンピュータ等の装置である。
Reference numeral 212 denotes a display, which displays the recognition result of the form. Reference numeral 213 denotes another data processing device, which is another device such as a computer for processing the data whose characters have been recognized.

【0038】図3の構成の動作を説明する前に図4によ
り本発明の実施例2の標準パターン辞書の変更方法につ
いて説明する。図4において,31は文字認識装置であ
る。
Before explaining the operation of the configuration of FIG. 3, a method of changing the standard pattern dictionary according to the second embodiment of the present invention will be described with reference to FIG. In FIG. 4, 31 is a character recognition device.

【0039】33は標準パターン辞書変更部である。3
4は標準パターン辞書である。37は認識結果出力部で
ある。
Reference numeral 33 is a standard pattern dictionary changing unit. 3
Reference numeral 4 is a standard pattern dictionary. 37 is a recognition result output unit.

【0040】44は出現回数測定部である。45は出現
回数保持部である。標準パターン辞書34において,5
1はポインタテーブルであって,標準パターン辞書34
のテンプレートのうち文字カテゴリ毎に使用するテンプ
レートの開始アドレスを保持するものである。
Reference numeral 44 is an appearance frequency measuring unit. Reference numeral 45 is an appearance frequency holding unit. 5 in the standard pattern dictionary 34
1 is a pointer table, which is a standard pattern dictionary 34
Of the templates, the starting address of the template used for each character category is held.

【0041】52はテンプレート保持部であって,文字
カテゴリ毎に20テンプレートを保持するものである。
各文字カテゴリの最終テンプレートには最終位置である
ことを示すフラグ「1」をセットする。他のフラグは
「0」である。
A template holding unit 52 holds 20 templates for each character category.
A flag "1" indicating the final position is set in the final template of each character category. The other flags are "0".

【0042】図4において,出現回数測定部44は認識
結果出力部37の出力する認識文字について文字毎の出
現回数を測定する。そして,出現回数保持部45に文字
毎に出現回数を記録する。
In FIG. 4, the appearance frequency measuring unit 44 measures the appearance frequency of each character of the recognition character output by the recognition result output unit 37. Then, the appearance count is recorded in the appearance count storage unit 45 for each character.

【0043】辞書変更モードが指定されると,標準パタ
ーン辞書変更部33は出現回数保持部45に記録されて
いる内容を入力する。そして,標準パターン辞書変更部
33は文字の出現回数に応じてポインタテーブル51の
ポインタの値を文字(文字カテゴリ)毎に変更する。
When the dictionary changing mode is designated, the standard pattern dictionary changing unit 33 inputs the contents recorded in the appearance frequency holding unit 45. Then, the standard pattern dictionary changing unit 33 changes the value of the pointer of the pointer table 51 for each character (character category) according to the number of appearances of the character.

【0044】ポインタテーブル51はテンプレート保持
部52の使用するテンプレートの開始アドレスを文字毎
に保持していて,ポインタの指定するアドレスがその文
字カテゴリのテンプレートを使用する開始アドレスであ
る。例えば,図4の場合,アのカテゴリの場合にはポイ
ンタの指定する開始アドレスがア5 であるので,ア5
らア1 までのテンプレートが使用される。
The pointer table 51 holds the starting address of the template used by the template holding unit 52 for each character, and the address designated by the pointer is the starting address using the template of the character category. For example, in the case of FIG. 4, the start address designated by the pointer if the A categories since it is A 5, the template of up to A 5 Karaa 1 is used.

【0045】ポインタテーブル51の保持するポインタ
の初期値は各文字カテゴリの中央のアドレスになってい
て,それぞれア10,イ10,ウ10,エ10のアドレスであ
る。そして,標準パターン辞書変更部33は文字の出現
回数の割合に応じてそれぞれの文字カテゴリで使用する
テンプレートの数を決め,使用するテンプレート数がそ
の数になるようにそれぞれの文字カテゴリのテンプレー
トの開始アドレスを変更する(指定されたアドレスのテ
ンプレートからフラグが1のテンプレートまでが使用さ
れる)。図4の例の場合,文字アの出現回数は5回,イ
の出現回数は5回,エの出現回数は5回であって少ない
ので,それぞれのテンプレートのうち使用するテンプレ
ートの数も少ないように開始アドレスをア5 ,イ5 ,エ
5 のテンプレートの位置にする。また,ウの出現回数は
多いので,ウに使用するテンプレートの開始アドレスは
20の位置とする。
The initial value of the pointer held by the pointer table 51 have been at the center of the address of each character category, respectively A 10, b 10, c 10, is the address of d 10. Then, the standard pattern dictionary changing unit 33 determines the number of templates to be used in each character category according to the ratio of the number of appearances of characters, and starts the template of each character category so that the number of templates to be used becomes that number. Change the address (the template from the specified address to the template with the flag 1 is used). In the case of the example of FIG. 4, the number of appearances of the character “a” is 5, the number of appearances of “a” is 5, and the number of appearances of “d” is 5, which is small. Therefore, the number of templates used in each template is small. a 5, Lee 5 a start address to, d
Set to template position 5 . Further, since the number of occurrences of U are many, the start address of the template used in c are the position of the window 20.

【0046】ここで,図3の実施例1の構成の動作を説
明する。帳票の文字認識が開始されてからの最初の複数
枚の認識結果を基に得られる文字情報により,標準パタ
ーン辞書の内容を変更する。例えば,帳票の処理単位が
100枚のとき,当初の10枚程度の認識結果が得られ
た時点で,辞書変更モードを指定して標準パターン辞書
の内容を変更する。
The operation of the configuration of the first embodiment shown in FIG. 3 will be described. The contents of the standard pattern dictionary are changed according to the character information obtained based on the recognition results of the first multiple sheets since the character recognition of the form was started. For example, when the processing unit of the form is 100 sheets, the dictionary change mode is designated to change the contents of the standard pattern dictionary when the initial recognition result of about 10 sheets is obtained.

【0047】標準パターン辞書34の変更は文字認識処
理の過程において随時行うことができる。出現回数の計
測は文字認識処理において絶えず行い,標準パターン辞
書34の変更に反映された時点で一旦クリアされる。
The standard pattern dictionary 34 can be changed at any time during the character recognition process. The number of appearances is constantly measured in the character recognition process, and is once cleared when the change in the standard pattern dictionary 34 is reflected.

【0048】文字認識するときは文字認識モードを指定
する。モード選択部46により文字認識モードの指定が
制御部32に通知され,制御部32は各部の文字認識処
理を制御する。
When recognizing characters, a character recognition mode is designated. The mode selection unit 46 notifies the control unit 32 of the designation of the character recognition mode, and the control unit 32 controls the character recognition processing of each unit.

【0049】文字パターン読み取り装置211で読み取
られた帳票の文字パターンは文字パターン入力部35に
より文字認識部36に入力される。文字切り出し部41
は読み込まれた文字パターンから1文字の文字パターン
を切り出す。特徴抽出部42はその文字パターンの特徴
抽出をする。特徴比較部43は抽出した特徴と標準辞書
パターン辞書34の特徴(テンプレート)とを比較す
る。比較において標準パターン辞書34の特徴と1文字
の文字パターンの特徴の距離を計算する(距離の計算方
法は後述する)。そして,文字認識部36は距離の最小
な特徴のテンプレートの文字カテゴリを認識結果36’
とし,認識結果出力部37により,ディスプレイ21
2,他のデータ処理装置213等に出力する。認識結果
は距離の小さい方から順に候補順位を付して出力する。
The character pattern of the form read by the character pattern reading device 211 is input to the character recognition unit 36 by the character pattern input unit 35. Character cutout unit 41
Cuts out a one-character character pattern from the read character pattern. The feature extraction unit 42 extracts the features of the character pattern. The feature comparison unit 43 compares the extracted feature with the feature (template) of the standard dictionary pattern dictionary 34. In the comparison, the distance between the feature of the standard pattern dictionary 34 and the feature of the character pattern of one character is calculated (a method of calculating the distance will be described later). Then, the character recognition unit 36 recognizes the character category of the template having the feature with the minimum distance as the recognition result 36 '.
The recognition result output unit 37 causes the display 21
2, output to another data processing device 213 or the like. The recognition result is output with candidate ranks assigned in order from the smallest distance.

【0050】そして,出現回数測定部44は認識結果と
して出力される文字(第1順位)をカウントし,出現回
数保持部45に保持する。標準パターン辞書34を変更
する場合には,辞書変更モードを指定する。モード選択
部(図示せず)は辞書変更モードの指定がなされたこと
を制御部32に通知する。制御部32は標準パターン辞
書変更部33等の各部の動作を制御する。
Then, the appearance number measuring unit 44 counts the characters (first rank) output as the recognition result, and holds them in the appearance number holding unit 45. When changing the standard pattern dictionary 34, a dictionary changing mode is designated. A mode selection unit (not shown) notifies the control unit 32 that the dictionary change mode has been designated. The control unit 32 controls the operation of each unit such as the standard pattern dictionary changing unit 33.

【0051】辞書変更モードが指定されると,標準パタ
ーン辞書変更部33は,出現回数保持部45の保持する
文字毎の出現回数を入力する。標準パターン辞書変更部
33は文字の出現回数を考慮して前述の方法により文字
毎に表示パターン辞書34のポインタテーブルのポイン
タ値を変更し,文字(文字カテゴリ)毎に使用するテン
プレート数を変更する。標準パターン辞書34の内容が
変更された時点で,出現回数保持部45はクリアされ
る。
When the dictionary change mode is designated, the standard pattern dictionary change unit 33 inputs the number of appearances for each character held by the number-of-appearances holding unit 45. The standard pattern dictionary changing unit 33 changes the pointer value in the pointer table of the display pattern dictionary 34 for each character and changes the number of templates to be used for each character (character category) in consideration of the number of times the character appears. . When the contents of the standard pattern dictionary 34 are changed, the appearance frequency holding unit 45 is cleared.

【0052】以後,再び文字認識モードが指定されると
変更された標準パターン辞書34を使用して帳票の文字
認識が継続され,認識文字の測定が新たに開始される。
特徴比較部43の距離の計算は次のように行う。
After that, when the character recognition mode is designated again, the changed standard pattern dictionary 34 is used to continue the character recognition of the form, and the measurement of the recognized characters is newly started.
The distance of the feature comparison unit 43 is calculated as follows.

【0053】 である。ここに,x(i)は入力文字の特徴ベクトルで
ある。s(i)は標準辞書のカテゴリAの特徴ベクトル
である。nは特徴ベクトルの次元数である。mはカテゴ
リAの標準パターンの数すなわちテンプレート数であ
る。
[0053] It is. Here, x (i) is the feature vector of the input character. s (i) is a feature vector of category A in the standard dictionary. n is the dimension number of the feature vector. m is the number of standard patterns of category A, that is, the number of templates.

【0054】入力文字の特徴を標準辞書のテンプレート
と比較し,m個のテンプレート数のうち最小の距離のテ
ンプレートとの距離が入力文字と比較した文字カテゴリ
の距離である。このようにして,各文字カテゴリとの距
離を求め,距離が小さい方から順に認識候補文字として
出力する。
The characteristic of the input character is compared with the template of the standard dictionary, and the distance to the template with the smallest distance among the number of m templates is the distance of the character category compared with the input character. In this way, the distance from each character category is obtained and the recognition candidate characters are output in order from the smallest distance.

【0055】図5は本発明の実施例1の標準パターン辞
書変更部のフローチャートである。 S1 出現回数保持部45から出現回数を入力する。 S2 総出現回数に対する文字毎の出現回数の割合を求
める。
FIG. 5 is a flowchart of the standard pattern dictionary changing unit according to the first embodiment of the present invention. S1 The number of appearances is input from the number-of-appearances holding unit 45. S2 The ratio of the number of appearances for each character to the total number of appearances is calculated.

【0056】S3 文字毎に出現回数の割合に応じてそ
れぞれの文字カテゴリで使用するテンプレート数を求め
る。 S4 使用するテンプレート数に従って,文字毎にテン
プレートの使用開始アドレスを求め,それぞれの文字カ
テゴリのポインタとしてポインタテーブルに設定する。
S3 For each character, the number of templates used in each character category is calculated according to the ratio of the number of appearances. S4: The use start address of the template is obtained for each character according to the number of templates to be used, and is set in the pointer table as a pointer for each character category.

【0057】図6は本発明の実施例2であって,認識結
果が誤りであった場合に修正して正しくされた修正文字
毎に修正回数を測定し,標準パターン辞書を変更する情
報とするものである。
FIG. 6 shows the second embodiment of the present invention, in which when the recognition result is incorrect, the number of corrections is measured for each corrected character that is corrected and used as information for changing the standard pattern dictionary. It is a thing.

【0058】図6において,31は文字認識装置であ
る。32は制御部である。
In FIG. 6, reference numeral 31 is a character recognition device. Reference numeral 32 is a control unit.

【0059】33は標準パターン辞書変更部である。3
4は標準パターン辞書である。35は文字パターン入力
部である。
Reference numeral 33 is a standard pattern dictionary changing unit. 3
Reference numeral 4 is a standard pattern dictionary. Reference numeral 35 is a character pattern input unit.

【0060】36は文字認識部である。36”は認識結
果である。37は認識結果出力部である。
Reference numeral 36 is a character recognition unit. 36 "is a recognition result. 37 is a recognition result output unit.

【0061】38は文字統計情報作成部である。51は
ポインタテーブルである。52はテンプレート保持部で
ある。
Reference numeral 38 is a character statistical information creating section. Reference numeral 51 is a pointer table. 52 is a template holding unit.

【0062】62は認識結果修正部であって,誤認され
た文字に対して入力装置210により入力された正しい
文字に認識結果を修正するものである。63は修正回数
測定部であって,修正されて正しくなった文字毎に修正
回数を測定するものである(以後,修正されて得られた
文字を修正文字と称する)。
Reference numeral 62 is a recognition result correction unit, which corrects the recognition result of the erroneously recognized character to the correct character input by the input device 210. Reference numeral 63 denotes a correction number measuring unit, which measures the number of corrections for each corrected and correct character (hereinafter, the corrected character is referred to as a corrected character).

【0063】64は修正回数保持部であって,修正文字
の得られた回数(以後,修正回数と称する)を保持する
ものである。210は入力装置であって,キーボード等
である。
Reference numeral 64 denotes a correction number holding unit, which holds the number of times the correction character has been obtained (hereinafter referred to as the correction number). An input device 210 is a keyboard or the like.

【0064】211は文字パターン読み取り装置であ
る。212はディスプレイである。213は他のデータ
処理装置である。
Reference numeral 211 is a character pattern reading device. 212 is a display. 213 is another data processing device.

【0065】図6の構成の動作を説明する。認識結果出
力部37の出力する認識結果はディスプレイ212に表
示されるので,認識結果に誤りがあった場合には,誤認
した文字に対して入力装置210により正しい文字を入
力して修正する。認識結果修正部62は誤認した文字を
正しい文字に修正し,認識結果出力部は修正文字を出力
する。
The operation of the configuration of FIG. 6 will be described. Since the recognition result output from the recognition result output unit 37 is displayed on the display 212, if there is an error in the recognition result, a correct character is input to the erroneously recognized character by the input device 210 to correct it. The recognition result correction unit 62 corrects the erroneously recognized character to a correct character, and the recognition result output unit outputs the corrected character.

【0066】修正回数測定部63は修正文字の修正回数
を文字毎に測定する。修正回数保持部64は文字毎に修
正回数を保持する。実際に帳票を処理する場合には,例
えば,100枚程度の帳票を処理する場合,最初の10
枚程度の文字認識結果の修正回数をもとに標準パターン
辞書34を変更する。
The correction number measuring unit 63 measures the number of corrections of the correction character for each character. The correction count holding unit 64 holds the correction count for each character. When actually processing the forms, for example, when processing about 100 forms, the first 10
The standard pattern dictionary 34 is changed based on the number of corrections of the character recognition result of about one sheet.

【0067】図6の構成において,文字認識の動作は図
3の実施例1と同様なので説明は省略する。標準パター
ン辞書34の変更は,図4の標準パターン辞書の変更方
法と同様になされる。即ち,標準パターン辞書変更部3
3は,辞書変更モードの指定の入力がなされると修正回
数保持部64に保持されている修正文字毎の修正回数を
入力する。そして,文字毎に修正回数に応じてポインタ
テーブルのポインタを変更する。修正結果により得られ
た文字についてその回数の多い文字のテンプレート数が
多くなるようにポインタを設定し,その回数が少ない文
字のテンプレート数が少なくなるようにポインタを設定
する。
In the configuration of FIG. 6, the character recognition operation is the same as that of the first embodiment of FIG. The standard pattern dictionary 34 is changed in the same manner as the standard pattern dictionary changing method of FIG. That is, the standard pattern dictionary changing unit 3
When the designation of the dictionary change mode is input, the number 3 inputs the number of corrections for each correction character held in the correction number holding unit 64. Then, the pointer in the pointer table is changed for each character according to the number of corrections. The pointer is set so that the number of templates of the character obtained by the correction is large, and the number of templates of the character whose number is small is small.

【0068】このようにして標準パターン辞書34が修
正されると,修正回数保持部64はクリアされる。そし
て,文字認識モードの指定により文字認識が開始される
と,変更された標準パターン辞書34で文字認識がなさ
れ,修正回数測定部63は誤認した文字を修正する毎に
修正文字の修正回数を1ずつ増やす。
When the standard pattern dictionary 34 is corrected in this way, the correction number holding unit 64 is cleared. Then, when the character recognition is started by the designation of the character recognition mode, the changed standard pattern dictionary 34 performs the character recognition, and the correction number measurement unit 63 sets the correction number of the corrected character to 1 each time the character which is erroneously recognized is corrected. Increase by one.

【0069】図7は本発明で使用する実施例2の修正回
数保持部と標準パターン辞書変更部のフローチャートで
ある。図7 (a)は修正回数保持部64であり,修正文字
毎に修正回数を保持するものである。例えば,「ア」の
文字カテゴリの文字パターンが文字認識において,誤認
されて「ア」に修正された回数が5回であることを示
す。同様に,「イ」は10回,「ウ」は5回であること
を示す。
FIG. 7 is a flow chart of the correction number holding unit and the standard pattern dictionary changing unit of the second embodiment used in the present invention. FIG. 7A shows a correction count holding unit 64, which holds the correction count for each correction character. For example, it is shown that the number of times that a character pattern in the character category of "A" is mistakenly recognized and corrected to "A" in character recognition is 5. Similarly, "a" indicates 10 times and "c" indicates 5 times.

【0070】図7 (b)は標準パターン辞書変更部のフロ
ーチャートである。 S1 辞書変更モードの指定により標準パターン辞書変
更部は修正回数保持部から修正文字毎の修正回数を入力
する。
FIG. 7B is a flowchart of the standard pattern dictionary changing unit. By specifying the S1 dictionary change mode, the standard pattern dictionary change unit inputs the number of corrections for each correction character from the correction number holding unit.

【0071】S2 総修正回数に対する文字毎の修正回
数の割合を求める。 S3 修正回数の割合に応じて文字(文字カテゴリ)毎
に使用テンプレート数を定める。
S2 The ratio of the number of corrections for each character to the total number of corrections is calculated. S3 The number of templates used is determined for each character (character category) according to the ratio of the number of corrections.

【0072】S4 使用テンプレート数となるように文
字毎に使用テンプレートの開始アドレスを求め,ポイン
タとしてそれぞれの文字カテゴリ毎にポインタテーブル
に設定する。
S4: The start address of the used template is obtained for each character so as to be the number of used templates, and is set as a pointer in the pointer table for each character category.

【0073】図8は本発明の実施例3の説明図である。
図8 (a)において101は入力文字列Aであって,「ト
ウキョウ」と正しく認識されたものである。
FIG. 8 is an explanatory diagram of the third embodiment of the present invention.
In FIG. 8A, 101 is the input character string A, which is correctly recognized as "Tokyo".

【0074】図8 (b)において,104は入力文字列B
であって,認識対象の文字パターンである。図8 (c)に
おいて,110は隣接文字出現回数表保持部であって,
カウント方法の説明図である。
In FIG. 8 (b), 104 is the input character string B.
Which is the character pattern to be recognized. In FIG. 8 (c), 110 is an adjacent character appearance frequency table holding unit,
It is explanatory drawing of a counting method.

【0075】図8 (d)において,111は隣接文字出現
回数表保持部であって,文字毎の隣接文字数の表を保持
するものである。隣接文字数は対象文字が文字認識され
た後に続いて文字認識された文字である。図8 (d)は対
象文字「ト」に対して隣接文字「ウ」が100回,
「ク」が30回であることを示すものである。
In FIG. 8 (d), 111 is an adjacent character appearance frequency table holding unit, which holds a table of the number of adjacent characters for each character. The number of adjacent characters is the number of characters recognized after the target character is recognized. In Fig. 8 (d), the adjacent character "U" is 100 times the target character "T",
This indicates that "ku" is 30 times.

【0076】図8 (a)のような入力文字列の文字認識に
おいて,対象文字「ト」102に続いて「ウ」103が
認識されると,隣接文字出現回数表保持部110の対象
文字「ト」の隣接文字「ウ」の回数を1加算する(図の
(c)は+1で加算したことを表している)。
In the character recognition of the input character string as shown in FIG. 8A, when the target character "TO" 102 and "U" 103 are recognized, the target character " 1 is added to the number of times the adjacent character “U” of “T” is added ((c) in the figure indicates that addition is made by +1).

【0077】このようにして,文字認識の処理において
隣接文字出現表を作成する。実際に文字認識で使用する
時は,例えば,処理を開始した後に10枚程度の文字認
識をした時点で,標準パターン辞書変更部が隣接文字出
現回数表の内容を取り込み,保持する。そして,標準パ
ターン辞書変更部は文字認識の結果がでる毎に認識結果
の文字を対象文字とし,その対象文字の隣接文字の出現
回数に応じて標準パターン辞書を変更する。その隣接文
字の出現回数の多い文字カテゴリのテンプレート数を多
くし,少ない文字カテゴリのテンプレート数を少なくす
る。そのようにして変更された標準パターン辞書により
対象文字に続く文字パターンの文字認識をする。
In this way, the adjacent character appearance table is created in the character recognition process. When actually used for character recognition, for example, when about 10 characters are recognized after the processing is started, the standard pattern dictionary changing unit fetches and holds the contents of the adjacent character appearance count table. Then, the standard pattern dictionary changing unit changes the standard pattern dictionary according to the number of appearances of the adjacent character of the target character, with the character of the recognition result as the target character each time the character recognition result is obtained. The number of templates in the character category in which the number of times of occurrence of the adjacent character is large is increased, and the number of templates in the character category in which the adjacent character is small is decreased. Character recognition of the character pattern following the target character is performed by the standard pattern dictionary thus changed.

【0078】例えば,図8 (b)のような入力文字列B
(104)を文字認識する場合には,まず「ト」105
が認識されたら,隣接文字出現回数表を参照して「ト」
に隣接する文字「ウ」,「ク」等の出現回数を参照す
る。図8 (b)の場合,対象文字「ト」の隣接文字「ウ」
の回数は100,「ク」の回路は30であるので,文字
カテゴリ「ウ」のテンプレート数を多くし,「ク」のテ
ンプレート数をその回数に応じて設定する。他の文字に
ついても出現回数(図示していない)に応じてテンプレ
ート数を設定する。このようにして変更された標準パタ
ーン辞書を使用して文字パターン106の文字を認識す
る。
For example, the input character string B as shown in FIG.
When recognizing (104) as a character, first, "TO" 105
Is recognized, refer to the adjacent character appearance count table
Refers to the number of appearances of the characters "U", "KU", etc. adjacent to. In the case of Fig. 8 (b), the adjacent character "U" of the target character "TO"
Since the number of times is 100 and the number of "K" circuits is 30, the number of templates of the character category "U" is increased, and the number of templates of "K" is set according to the number of times. For other characters, the number of templates is set according to the number of appearances (not shown). The characters of the character pattern 106 are recognized using the standard pattern dictionary thus changed.

【0079】図9は本発明の実施例3であって,図8の
文字認識方法を実施するための装置構成である。図9に
おいて,31は文字認識装置である。
FIG. 9 shows a third embodiment of the present invention, which is an apparatus configuration for carrying out the character recognition method of FIG. In FIG. 9, 31 is a character recognition device.

【0080】33は標準パターン辞書変更部である34
は標準パターン辞書である。35は文字パターン入力部
である。
Reference numeral 33 is a standard pattern dictionary changing unit 34.
Is a standard pattern dictionary. Reference numeral 35 is a character pattern input unit.

【0081】36は文字認識部である。36”は認識結
果である。37は認識結果出力部である。
Reference numeral 36 is a character recognition unit. 36 "is a recognition result. 37 is a recognition result output unit.

【0082】109は隣接文字出現回数測定部であっ
て,認識結果に基づいて,隣接文字の出現回数を対象文
字毎にカウントするものである。110は隣接文字出現
回数表保持部であって,隣接文字の出現回数を対象文字
毎に保持するものである。
Reference numeral 109 denotes an adjacent character appearance count measuring unit, which counts the number of adjacent character appearances for each target character based on the recognition result. Reference numeral 110 denotes an adjacent character appearance count table holding unit, which holds the number of appearances of adjacent characters for each target character.

【0083】115は標準パターン辞書変更部33に保
持されている隣接文字出現回数表である。図9におい
て,入力装置,文字パターン読み取り装置,ディスプレ
イ,他のデータ処理装置は省略されている。
Reference numeral 115 is an adjacent character appearance frequency table held in the standard pattern dictionary changing unit 33. In FIG. 9, an input device, a character pattern reading device, a display, and other data processing devices are omitted.

【0084】図9の構成の動作を説明する。隣接文字出
現回数測定部109は,認識結果に基づいて対象文字毎
に隣接文字数をカウントし,カウント値を隣接文字出現
回数表保持部110に保持する。
The operation of the configuration shown in FIG. 9 will be described. The adjacent character appearance count measuring unit 109 counts the number of adjacent characters for each target character based on the recognition result, and holds the count value in the adjacent character appearance count table holding unit 110.

【0085】例えば,100枚程度の帳票を処理する場
合,文字認識を開始した最初の10枚程度の帳票の文字
認識結果により得られる隣接文字出現回数表115を標
準パターン辞書変更部33は隣接文字出現回数表保持部
110から入力して保持する。
For example, when processing about 100 sheets, the standard pattern dictionary changing unit 33 uses the adjacent character appearance frequency table 115 obtained by the character recognition result of the first about 10 sheets which started the character recognition. It is input from the appearance frequency table storage unit 110 and stored.

【0086】文字認識結果が得られると,標準パターン
辞書変更部33はその認識結果を対象文字としてその隣
接文字の出現回数を隣接文字出現回数表115より求
め,その出現回数に応じて対象文字のテンプレート数を
変更する。前述したように隣接文字出現回数が多い文字
カテゴリのテンプレートは多くし,隣接文字出現回数の
少ない文字カテゴリのテンプレートは少なくする。この
ように変更された標準パターン辞書34を使用して対象
文字に続く文字の文字認識を行う。
When the character recognition result is obtained, the standard pattern dictionary changing unit 33 determines the number of appearances of the adjacent character from the adjacent character appearance number table 115 by using the recognition result as the object character, and determines the number of appearances of the object character according to the number of appearances. Change the number of templates. As described above, the number of templates in the character category in which the number of appearances of adjacent characters is high is increased, and the number of templates in the character category in which the number of appearances of adjacent characters is low is decreased. Character recognition of the character following the target character is performed using the standard pattern dictionary 34 thus modified.

【0087】図10は本発明の実施例3の隣接文字出現
回数測定部のフローチャートである。 S1 隣接文字出現回数測定部は認識結果の文字Aを判
定する。
FIG. 10 is a flowchart of the adjacent character appearance frequency measuring unit according to the third embodiment of the present invention. S1 The adjacent character appearance frequency measurement unit determines the character A of the recognition result.

【0088】S2 文字Aに続く文字の認識結果の文字
Bを判定する。 S3 文字Aを対象文字とし,文字Bを隣接文字として
隣接文字出現回数表保持部の値を更新する。
S2 The character B as a recognition result of the character following the character A is determined. S3 With the character A as the target character and the character B as the adjacent character, the value of the adjacent character appearance count table holding unit is updated.

【0089】S4 クリアの指示があるか判定し,クリ
アがなければS1以降の処理を繰り返し,クリアの指示
があればS5に進む。 S5 隣接文字出現回数表保持部110をクリアする。
S4: It is judged whether or not there is a clear instruction. If there is no clear instruction, the processing from S1 is repeated, and if there is a clear instruction, the operation proceeds to S5. S5 Clear the adjacent character appearance frequency table holding unit 110.

【0090】S6 文字認識の処理を終了するか判定
し,終了するのでなければS1以降の処理を繰り返す。
終了するのであれば処理を終了する。図11は本発明の
実施例3の標準パターン辞書変更部のフローチャートを
示す。
S6 It is determined whether the character recognition processing is to be ended. If not, the processing from S1 onward is repeated.
If it ends, the process ends. FIG. 11 shows a flowchart of the standard pattern dictionary changing unit according to the third embodiment of the present invention.

【0091】S1 標準パターン変更部は隣接文字出現
回数表保持部から隣接文字出現回数表を入力する。 S2 制御部は,隣接文字出現回数表保持部をクリアす
る。
The S1 standard pattern changing unit inputs the adjacent character appearance number table from the adjacent character appearance number table holding unit. The S2 control unit clears the adjacent character appearance count table holding unit.

【0092】S3 標準パターン辞書変更部は,認識結
果(A)を判定する。 S4 標準パターン辞書変更部は認識結果(A)を対象
文字として隣接文字の出現回数に従って標準パターン辞
書における隣接文字のテンプレート数を変更する。
The S3 standard pattern dictionary changing section determines the recognition result (A). The S4 standard pattern dictionary changing unit changes the number of templates of adjacent characters in the standard pattern dictionary according to the number of appearances of adjacent characters with the recognition result (A) as the target character.

【0093】S5 文字認識部は,文字Aに続く文字パ
ターンについてS4で作成された標準パターン辞書によ
り文字認識をする。 S6 文字認識を終了するのであれば処理を終了し,終
了するのでなければS7の処理をする。
The S5 character recognition unit recognizes the character pattern following the character A using the standard pattern dictionary created in S4. If the S6 character recognition is to be ended, the processing is ended, and if not ended, the processing of S7 is executed.

【0094】S7 標準パターン辞書変更部の隣接文字
出現回数表を入力し直すのであればS1以降の処理を繰
り返し,入力し直さないのであればS3以降の処理を繰
り返す。
S7 If the adjacent character appearance frequency table of the standard pattern dictionary changing unit is to be input again, the processing from S1 onward is repeated, and if it is not input again, the processing from S3 onward is repeated.

【0095】図12は本発明の実施例4であって,本発
明の基本構成(2) の実施例である。図12において,3
1は文字認識装置である。
FIG. 12 shows Embodiment 4 of the present invention, which is an embodiment of the basic configuration (2) of the present invention. In FIG. 12, 3
1 is a character recognition device.

【0096】34は標準パターン辞書である。35は文
字パターン入力部である。36は文字認識部である。
Reference numeral 34 is a standard pattern dictionary. Reference numeral 35 is a character pattern input unit. 36 is a character recognition unit.

【0097】36”は認識結果である。37は認識結果
出力部である。121は出現回数作成部であって,文字
の出現回数を測定するものである。
36 "is a recognition result. 37 is a recognition result output section. 121 is an appearance number creating section, which measures the number of appearances of a character.

【0098】122は重み付け部であって,出現回数に
応じて文字に重み付けをするものである。例えば,距離
により文字認識する場合には,出現回数が多い文字の重
みは小さくし,出現回数の少ない重みは大きくする。
A weighting unit 122 weights characters in accordance with the number of appearances. For example, in the case of character recognition based on distance, the weight of a character having a large number of appearances is reduced, and the weight of a character having a small number of appearances is increased.

【0099】123は重み表保持部であって,重み付け
部122の算出した重みを保持するものである。文字ア
の重みはWアである。文字イの重みはWイである。文字
ウの重みはWウ等である。
A weight table holding unit 123 holds the weights calculated by the weighting unit 122. The weight of the letter a is W. The weight of the character a is W. The weight of the letter C is W, etc.

【0100】125は距離計算部である。文字認識部3
6において,125は距離計算部であって,重みを考慮
して入力文字パターンから切り出された1文字のパター
ンの特徴とテンプレートとの距離を求め,該距離に重み
を乗算した換算距離Dを求めるものである。
Reference numeral 125 is a distance calculator. Character recognition unit 3
6, a distance calculator 125 calculates the distance between the template of the pattern of one character cut out from the input character pattern and the template in consideration of the weight, and calculates the converted distance D by multiplying the distance by the weight. It is a thing.

【0101】128は最小距離判定部であって,換算距
離Dの小さい方から順に高い順位の認識候補とするもの
である。129は重み表であって,重み表保持部123
から入力したものである。
Reference numeral 128 is a minimum distance determination unit, which is a recognition candidate having a higher rank in the ascending order of the converted distance D. A weight table 129 is a weight table holding unit 123.
It was input from.

【0102】図12の実施例4の動作を説明する。文字
認識を開始した当初の複数枚の帳票をもとに出現回数作
成部121により測定された出現回数を基に,重み付け
部122は出現回数に応じて文字毎に重みを計算し,重
み表保持部123に保持する。例えば,100枚程度の
帳票を処理するとき,当初の10枚程度の文字認識結果
を基に作成された文字毎の出現回数により重みを計算す
る。
The operation of the fourth embodiment shown in FIG. 12 will be described. The weighting unit 122 calculates a weight for each character according to the number of appearances based on the number of appearances measured by the number-of-appearances creating unit 121 based on the initial plurality of forms that started character recognition, and holds the weight table. It is held in the part 123. For example, when processing about 100 forms, the weight is calculated based on the number of appearances of each character created based on the initial character recognition result of about 10 characters.

【0103】文字認識部36において,図3の実施例1
の場合と同様に入力パターンから切り出した1文字のパ
ターンの特徴について標準辞書のテンプレートと比較
し,距離を求める。そして,求めた距離に重み表129
のその文字の重みを乗算し,換算距離Dを求める。
In the character recognition unit 36, the first embodiment shown in FIG.
Similar to the case, the distance of the pattern of one character cut out from the input pattern is compared with the template of the standard dictionary. Then, a weight table 129 is added to the calculated distance.
The conversion distance D is obtained by multiplying the weight of that character of.

【0104】距離の小さいカテゴリからM位までを候補
して求め,候補メモリ(図示せず)に格納する。換算距
離Dは次のように求める。
Candidates from the category with the shortest distance to the Mth are obtained as candidates and stored in a candidate memory (not shown). The converted distance D is calculated as follows.

【0105】 である。ここに,x(i)は入力文字の特徴ベクトルで
ある。s(i)は標準辞書のカテゴリAの特徴ベクトル
である。nは特徴ベクトルの次元数である。mはカテゴ
リAの標準パターンの数すなわちテンプレート数であ
る。
[0105] It is. Here, x (i) is the feature vector of the input character. s (i) is a feature vector of category A in the standard dictionary. n is the dimension number of the feature vector. m is the number of standard patterns of category A, that is, the number of templates.

【0106】本発明の文字認識方法は,前記の標準パタ
ーン辞書の変更を文字認識中の複数枚の帳票の文字認識
結果を基に作成した文字統計情報により行う方法(文字
認識方法(1) )と,業務内容に合わせて作成した学習用
テスト帳票を基に標準パターン辞書を設定する方法(文
字認識方法(2) )の2通りがある。
In the character recognition method of the present invention, the standard pattern dictionary is changed based on the character statistical information created based on the character recognition results of a plurality of forms during character recognition (character recognition method (1)). There are two methods: setting a standard pattern dictionary based on the learning test form created according to the work content (character recognition method (2)).

【0107】図13は本発明の文字認識方法(1) を示す
図である。 S1 文字統計情報作成部を一旦クリアする。 S2 文字認識する。
FIG. 13 is a diagram showing a character recognition method (1) of the present invention. Clear the S1 character statistical information creation unit. S2 Character recognition.

【0108】S3 文字統計情報を更新する。 S4 文字認識処理を終了するか判定する。文字認識処
理を終了しないのであればS5に進む。
S3 The character statistical information is updated. S4 It is determined whether the character recognition processing is to be ended. If the character recognition process is not completed, the process proceeds to S5.

【0109】S5 標準パターン辞書を変更するか判断
する。変更しないのであればS2以降の処理を繰り返
す。変更するのであれば,S6に進む。 S6 文字統計情報を入力する。
S5: Determine whether to change the standard pattern dictionary. If it is not changed, the processing from S2 is repeated. If it is changed, the process proceeds to S6. S6 Enter the character statistical information.

【0110】S7 標準パターン辞書を変更し,S1以
降の処理を繰り返す。図14は本発明の文字認識方法
(2) を示す図である。 S1 標準パターン辞書変更用のテスト帳票を用意す
る。
S7: Change the standard pattern dictionary and repeat the processing from S1. FIG. 14 is a character recognition method of the present invention.
It is a figure showing (2). S1 Prepare a test form for changing the standard pattern dictionary.

【0111】S2 テスト帳票の文字認識をして文字統
計情報を作成する。 S3 標準パターン辞書更新部は,文字統計情報を入力
して標準パターン辞書を変更する。
S2 Character recognition of the test form is performed and character statistical information is created. The S3 standard pattern dictionary updating unit changes the standard pattern dictionary by inputting character statistical information.

【0112】S4 テスト帳票の文字認識をする。 S5 文字認識率を求め,一定値以上であれば,S7で
その標準パターン辞書により通常の帳票の文字認識を行
う。一定枚数以下であったら,S6に進む。
S4 Character recognition of the test form is performed. The character recognition rate of S5 is obtained, and if it is a certain value or more, the character recognition of a normal form is performed by the standard pattern dictionary in S7. If the number is less than the predetermined number, the process proceeds to S6.

【0113】S6 標準パターン辞書のテンプレート数
を変更し,S4でテスト帳票を再度文字認識してS5で
文字認識率が一定値以上になったかを判定する。 なお,上記の実施例4の距離に出現回数に基づく重みを
乗算する場合にも,上記の文字認識方法(1) のように処
理対象の帳票の文字統計情報に基づいて重みを求め,重
みを加味して文字認識する方法と,文字認識方法(2) の
ように業務に合わせて作成した学習用テスト帳票により
作成した文字統計情報により重みを求め,重みを加味し
て文字認識する方法の2通りがある。
S6 The number of templates in the standard pattern dictionary is changed, the test form is again character-recognized in S4, and it is determined in S5 whether the character recognition rate is equal to or higher than a certain value. Even when the distance in the fourth embodiment is multiplied by the weight based on the number of appearances, the weight is calculated based on the character statistical information of the form to be processed as in the character recognition method (1), and the weight is calculated. There are two methods: character recognition with consideration and character recognition with the statistical information created by the test test form prepared for the work as in character recognition method (2). There is a street.

【0114】なお,上記の実施例ではカタカナ文字につ
いて説明したが,本発明はカタカナに限られるものでな
く,それ以外の数字,英字,漢字およびそれらの混在す
る帳票の文字認識に適用できるものである。本発明は字
種が多い程,効果が大きいものである。
Although the Katakana characters have been described in the above embodiments, the present invention is not limited to Katakana characters, and can be applied to character recognition of other numbers, letters, kanji and forms in which they are mixed. is there. The present invention is more effective as the number of character types is increased.

【0115】[0115]

【発明の効果】本発明の基本構成(1) によれば,業務に
応じて最適な標準パターン辞書を自動的に作成でき,そ
の標準パターン辞書により文字認識するので業務毎に常
に最大の認識精度に近い精度で文字認識することができ
る。
According to the basic configuration (1) of the present invention, the optimum standard pattern dictionary can be automatically created according to the work, and the character recognition is performed by the standard pattern dictionary, so that the maximum recognition accuracy is always obtained for each work. Characters can be recognized with accuracy close to.

【0116】また,本発明の基本構成(2) によれば,実
際の帳票に出現する文字の重み付けを的確にすることが
でき,文字認識結果に反映されるので,曖昧さのない正
確な文字認識をすることができるようになる。
Further, according to the basic configuration (2) of the present invention, it is possible to accurately weight the characters appearing in the actual form and to reflect them in the character recognition result, so that accurate characters without ambiguity can be obtained. You will be able to recognize.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の基本構成(1) を示す図である。FIG. 1 is a diagram showing a basic configuration (1) of the present invention.

【図2】本発明の基本構成(2) を示す図である。FIG. 2 is a diagram showing a basic configuration (2) of the present invention.

【図3】本発明の実施例1を示す図である。FIG. 3 is a diagram showing a first embodiment of the present invention.

【図4】本発明の実施例1の標準パターン辞書の変更方
法を示す図である。
FIG. 4 is a diagram showing a method of changing the standard pattern dictionary according to the first embodiment of the present invention.

【図5】本発明の実施例1の標準パターン辞書変更部の
フローチャートを示す図である。
FIG. 5 is a diagram showing a flowchart of a standard pattern dictionary changing unit according to the first embodiment of the present invention.

【図6】本発明の実施例2を示す図である。FIG. 6 is a diagram showing a second embodiment of the present invention.

【図7】本発明の実施例2の修正回数保持部と標準パタ
ーン辞書変更部のフローチャートを示す図である。
FIG. 7 is a diagram showing a flowchart of a correction number holding unit and a standard pattern dictionary changing unit according to a second embodiment of the present invention.

【図8】実施例3の説明図である。FIG. 8 is an explanatory diagram of the third embodiment.

【図9】本発明の実施例3を示す図である。FIG. 9 is a diagram showing Embodiment 3 of the present invention.

【図10】本発明の実施例3の隣接文字出現回数測定部
のフローチャートを示す図である。
FIG. 10 is a diagram showing a flowchart of an adjacent character appearance frequency measurement unit according to the third embodiment of the present invention.

【図11】本発明の実施例3の標準パターン辞書変更部
と文字認識部のフローチャートを示す図である。
FIG. 11 is a diagram showing a flowchart of a standard pattern dictionary changing unit and a character recognizing unit according to the third embodiment of the present invention.

【図12】本発明の実施例4を示す図である。FIG. 12 is a diagram showing Embodiment 4 of the present invention.

【図13】本発明の文字認識方法(1) を示す図である。FIG. 13 is a diagram showing a character recognition method (1) of the present invention.

【図14】本発明の文字認識方法(2) を示す図である。FIG. 14 is a diagram showing a character recognition method (2) of the present invention.

【図15】従来の文字認識装置を示す図である。FIG. 15 is a diagram showing a conventional character recognition device.

【符号の説明】[Explanation of symbols]

1:文字認識装置 2:文字統計情報作成部 3:標準パターン辞書変更部 4:標準パターン辞書 5:文字パターン入力部 6:文字認識部 6”:認識結果 7: 認識結果出力部 1: Character recognition device 2: Character statistical information creation unit 3: Standard pattern dictionary change unit 4: Standard pattern dictionary 5: Character pattern input unit 6: Character recognition unit 6 ″: Recognition result 7: Recognition result output unit

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 帳票の文字統計情報を作成する文字統計
情報作成部と,文字の特徴を表す標準パターンをもつ標
準パターン辞書と,文字統計情報をもとに標準パターン
辞書の内容を変更する標準パターン辞書変更部と,認識
対象の文字パターンと標準パターン辞書の標準パターン
とを比較して該文字パターンの文字認識をする文字認識
部と,文字認識の結果を出力する認識結果出力部とを備
えること特徴とする文字認識装置。
1. A character statistical information creating unit for creating character statistical information of a form, a standard pattern dictionary having a standard pattern representing character characteristics, and a standard for changing the contents of the standard pattern dictionary based on the character statistical information. A pattern dictionary changing unit, a character recognizing unit that compares a character pattern to be recognized with a standard pattern of a standard pattern dictionary to recognize a character of the character pattern, and a recognition result output unit that outputs a result of the character recognition. Character recognition device characterized.
【請求項2】 文字統計情報は帳票の文字の出現回数で
あることを特徴とする請求項1に記載の文字認識装置。
2. The character recognition device according to claim 1, wherein the character statistical information is the number of appearances of characters on the form.
【請求項3】 文字統計情報は認識結果の修正により正
しく修正された文字の修正回数であることを特徴とする
請求項1に記載の文字認識装置。
3. The character recognition device according to claim 1, wherein the character statistical information is the number of times of correction of the character corrected correctly by the correction of the recognition result.
【請求項4】 任意の文字Aの認識結果を対象文字と
し,その対象文字に続く文字Bの認識結果を隣接文字と
したとき,文字統計情報は対象文字Aに対する隣接文字
Bの出現回数であり,対象文字Aの認識結果が得られる
と,文字認識部は該文字統計情報の該対象文字Aの隣接
文字の出現回数に基づいて標準パターン辞書の内容を変
更し,文字認識するものであることを特徴とする請求項
1に記載の文字認識装置。
4. When the recognition result of an arbitrary character A is a target character and the recognition result of a character B following the target character is an adjacent character, the character statistical information is the number of appearances of the adjacent character B to the target character A. When the recognition result of the target character A is obtained, the character recognition unit modifies the contents of the standard pattern dictionary based on the number of appearances of the adjacent character of the target character A of the character statistical information and recognizes the character. The character recognition device according to claim 1.
【請求項5】 標準パターン辞書は文字カテゴリごとに
文字の特徴を表す複数のテンプレートを持ち,標準パタ
ーン辞書変更部は文字統計情報に従ってテンプレート数
を増減することを特徴とする請求項1,2,3もしくは
4に記載の文字認識装置。
5. The standard pattern dictionary has a plurality of templates representing character characteristics for each character category, and the standard pattern dictionary changing unit increases or decreases the number of templates according to character statistical information. The character recognition device according to 3 or 4.
【請求項6】 帳票の文字統計情報を作成する文字統計
情報作成部と,文字の特徴を表す標準パターンをもつ標
準パターン辞書と,認識対象の文字パターンと該標準パ
ターンとを比較し該文字パターンの文字認識をする文字
認識部と,文字統計情報をもとに文字に重み付けをする
重み作成部と,文字認識の結果を出力する認識結果出力
部とを備え,認識対象の文字パターンと標準パターンと
の特徴点の比較結果と重み作成部の作成した重みとに基
づいて認識結果を求め,出力することを特徴とする文字
認識装置。
6. A character statistical information creating unit for creating character statistical information of a form, a standard pattern dictionary having a standard pattern representing characteristics of characters, a character pattern to be recognized and the standard pattern, and the character pattern. A character recognition unit for recognizing characters, a weight creation unit for weighting characters based on character statistical information, and a recognition result output unit for outputting the result of character recognition. A character recognition device characterized in that a recognition result is obtained and output based on a comparison result of feature points with and a weight created by a weight creation unit.
【請求項7】 文字統計情報は出現回数であり,出現回
数の高い文字は重みを小さくし,出現回数の低い文字は
重みを大きくし,文字認識部における比較は文字パター
ンと標準辞書のテンプレートの特徴との距離を求めるも
のであり,該距離と重みとの乗算結果に基づいて認識結
果を出力することを特徴とする請求項6に記載の文字認
識装置。
7. The character statistical information is the number of appearances, a character having a high appearance frequency has a small weight, a character having a low appearance frequency has a large weight, and a character recognition unit compares a character pattern with a template of a standard dictionary. 7. The character recognition device according to claim 6, wherein the character recognition device is for obtaining a distance to a feature, and outputs a recognition result based on a multiplication result of the distance and the weight.
【請求項8】 請求項1,2,3,4,5もしくは6に
記載の文字認識装置において,文字統計情報作成部は,
文字認識処理を対象とする帳票の文字認識結果をもとに
文字統計情報を作成することを特徴とする文字認識装
置。
8. The character recognition device according to claim 1, 2, 3, 4, 5 or 6, wherein the character statistical information creation unit comprises:
A character recognition device characterized in that character statistical information is created based on a character recognition result of a form targeted for character recognition processing.
【請求項9】 請求項1,2,3,4,5もしくは6に
記載の文字認識装置において,文字統計情報作成部は,
テスト帳票の文字認識結果をもとに文字統計情報を作成
することを特徴とする文字認識装置。
9. The character recognition device according to claim 1, 2, 3, 4, 5 or 6, wherein the character statistical information creation unit comprises:
A character recognition device characterized in that it creates character statistical information based on the character recognition result of a test form.
JP7181275A 1995-07-18 1995-07-18 Character recognition device Pending JPH0935006A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7181275A JPH0935006A (en) 1995-07-18 1995-07-18 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7181275A JPH0935006A (en) 1995-07-18 1995-07-18 Character recognition device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002093787A Division JP2002334303A (en) 2002-03-29 2002-03-29 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH0935006A true JPH0935006A (en) 1997-02-07

Family

ID=16097853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7181275A Pending JPH0935006A (en) 1995-07-18 1995-07-18 Character recognition device

Country Status (1)

Country Link
JP (1) JPH0935006A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366898A (en) * 2001-06-07 2002-12-20 Toshiba Corp Device and method for location information recognition and sectioning device
JP2005505866A (en) * 2001-10-15 2005-02-24 シルバーブルック リサーチ ピーティワイ リミテッド Character recognition
JP2008276311A (en) * 2007-04-25 2008-11-13 Denso Corp Character recognition device, appearance inspection device, and character recognition method
JP2019537103A (en) * 2016-09-28 2019-12-19 シストラン インターナショナル カンパニー.,リミテッド.Systran International Co.,Ltd. Method and apparatus for translating characters
CN112084771A (en) * 2020-07-22 2020-12-15 浙江工业大学 Address-based single word weight statistical method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366898A (en) * 2001-06-07 2002-12-20 Toshiba Corp Device and method for location information recognition and sectioning device
JP4733859B2 (en) * 2001-06-07 2011-07-27 株式会社東芝 Location information recognition device and sorting device
JP2005505866A (en) * 2001-10-15 2005-02-24 シルバーブルック リサーチ ピーティワイ リミテッド Character recognition
US7760947B2 (en) 2001-10-15 2010-07-20 Silverbrook Research Pty Ltd Method of modifying classification scheme stored in processing system
US7903879B2 (en) 2001-10-15 2011-03-08 Silverbrook Research Pty Ltd System for modifying classification scheme for handwritten characters
US8019160B2 (en) 2001-10-15 2011-09-13 Silverbrook Research Pty Ltd Method of modifying classification scheme for hand-written characters
US8363948B2 (en) 2001-10-15 2013-01-29 Silverbrook Research Pty Ltd Classification scheme and system for modifying character allographs contained therein
JP2008276311A (en) * 2007-04-25 2008-11-13 Denso Corp Character recognition device, appearance inspection device, and character recognition method
JP2019537103A (en) * 2016-09-28 2019-12-19 シストラン インターナショナル カンパニー.,リミテッド.Systran International Co.,Ltd. Method and apparatus for translating characters
CN112084771A (en) * 2020-07-22 2020-12-15 浙江工业大学 Address-based single word weight statistical method

Similar Documents

Publication Publication Date Title
EP0844583B1 (en) Method and apparatus for character recognition
US5675665A (en) System and method for word recognition using size and placement models
KR100412317B1 (en) Character recognizing/correcting system
US10963717B1 (en) Auto-correction of pattern defined strings
JP2000315247A (en) Character recognizing device
US8208685B2 (en) Word recognition method and word recognition program
KR102282025B1 (en) Method for automatically sorting documents and extracting characters by using computer
JPH0935006A (en) Character recognition device
JP2022095391A (en) Information processing apparatus and information processing program
JP4046941B2 (en) Document format identification device and identification method
JP2002334303A (en) Character recognizing device
JP3958722B2 (en) Image data document retrieval system
JP3128357B2 (en) Character recognition processor
US6636636B1 (en) Character recognizing apparatus, method, and storage medium
US20230419712A1 (en) Image processing apparatus, image processing method, and storage medium
JPH09274645A (en) Method and device for recognizing character
JP2894305B2 (en) Recognition device candidate correction method
JPH07271921A (en) Character recognizing device and method thereof
JP2697790B2 (en) Character type determination method
JPS60217483A (en) Recognizer of character
JP2023002090A (en) Information processing system, display control method, and program
JPH01171080A (en) Recognizing device for error automatically correcting character
JP2963474B2 (en) Similar character identification method
JPH05120494A (en) Character recognizing method and its device
JPH05298489A (en) System for recognizing character

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030318