JPH10116317A - Character recognition method and recording medium - Google Patents

Character recognition method and recording medium

Info

Publication number
JPH10116317A
JPH10116317A JP8270892A JP27089296A JPH10116317A JP H10116317 A JPH10116317 A JP H10116317A JP 8270892 A JP8270892 A JP 8270892A JP 27089296 A JP27089296 A JP 27089296A JP H10116317 A JPH10116317 A JP H10116317A
Authority
JP
Japan
Prior art keywords
character
ratio
candidate
aspect ratio
pattern dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8270892A
Other languages
Japanese (ja)
Inventor
Takakuni Minewaki
隆邦 嶺脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8270892A priority Critical patent/JPH10116317A/en
Publication of JPH10116317A publication Critical patent/JPH10116317A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To suppress the increase of the size of a pattern dictionary by avoiding providing similar character features which make the same value by many characters for the pattern dictionary but supposing and processing a default value concerning them. SOLUTION: A pattern dictionary memory 8 registers the character feature quantity of each character, the value of a standard aspect ratio and its allowable range. A pattern dictionary comparing part 7 compares the feature quantity of a recognition object character and the character feature quantity within the dictionary to obtain a recognition result candidate. The aspect ratio of this candidate and the aspect ratio of a similar character within the dictionary are compared. When the aspect ratio is not registered in the dictionary, both of the aspect ratios are compared with the use of the default value to output as a recognition result when they are within the allowable range.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、パターン辞書のサ
イズを小さくできる文字認識方法および記録媒体に関す
る。
[0001] 1. Field of the Invention [0002] The present invention relates to a character recognition method and a recording medium capable of reducing the size of a pattern dictionary.

【0002】[0002]

【従来の技術】従来、類似文字を認識する方法として
は、例えば、類似文字を識別する際に、基準サイズの面
積に対する対象文字の面積の比(面積比)を特徴量とし
て高精度に判定する文字認識方法(特開平3−1470
84号公報を参照)、文字が正規化されてから認識する
ことにより類似文字の誤認識が発生するという問題に対
して、類似文字を識別する際に、個々の文字の高さと幅
の比(縦横比)を用いて高精度に判定する文字認識方法
(特開平4−98383号公報を参照)、文字辞書の縦
横比と面積比に対して相違度が閾値を越えるのものを候
補から削除(リジェクト)する候補文字足切り方法(特
開平4ー372089号公報を参照)、切り出された個
々の文字を縦横比によって判定する際に、基準となる文
字矩形の縦横比に対する、対象文字の縦横比(相対縦横
比)を算出し、文字辞書に格納された値と比較すること
によって判定する文字認識方法(特願平6−30452
3号)がある。
2. Description of the Related Art Conventionally, as a method of recognizing similar characters, for example, when recognizing similar characters, the ratio of the area of the target character to the area of the reference size (area ratio) is determined with high accuracy as a feature amount. Character recognition method (Japanese Unexamined Patent Publication No.
No. 84), and the problem of erroneous recognition of similar characters due to recognition after normalization of characters is solved. When identifying similar characters, the ratio between the height and width of each character ( Character recognition method for determining with high accuracy using the aspect ratio (see Japanese Patent Application Laid-Open No. Hei 4-98383), and deleting character dictionaries in which the difference between the aspect ratio and the area ratio exceeds a threshold value from the candidates ( Reject) candidate character truncation method (see Japanese Patent Application Laid-Open No. Hei 4-372889). When judging individual cut-out characters based on the aspect ratio, the aspect ratio of the target character with respect to the aspect ratio of the reference character rectangle. (Relative aspect ratio) is calculated and compared with a value stored in a character dictionary to determine a character (Japanese Patent Application No. 6-30452).
No. 3).

【0003】[0003]

【発明が解決しようとする課題】上記した従来の類似文
字特徴(縦横比・面積比・上空自比)を用いた認識方法
では、パターン辞書の各文字毎に類似文字特徴を持つ必
要がある。しかし、実際には、それらの多くは同じ値を
持つことからパターン辞書のサイズが増大する傾向にあ
った。また、全ての文字について適切な類似文字特徴値
を設定するには手間がかかり、相当に時間を要する作業
であった。
In the above-described conventional recognition method using similar character features (aspect ratio, area ratio, and sky ratio), each character in the pattern dictionary must have a similar character feature. However, in practice, since many of them have the same value, the size of the pattern dictionary tends to increase. Also, setting appropriate similar character feature values for all characters is troublesome and takes a considerable amount of time.

【0004】本発明の目的は、多くの文字で同じ値とな
る類似文字特徴をパターン辞書に持たずに、それらにつ
いてはデフォルト値を仮定して処理することにより、パ
ターン辞書のサイズ増大を抑えることができる文字認識
方法および記録媒体を提供することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to suppress an increase in the size of a pattern dictionary by processing similar character features having the same value in many characters in a pattern dictionary without assuming default values. The present invention provides a character recognition method and a recording medium that can perform the above method.

【0005】本発明の他の目的は、標準的な類似文字特
徴量を持つ文字については、デフォルト値を用いること
により、個々の文字毎の設定を行うことなく、簡単に類
似文字処理の対象文字として扱うことができ、パターン
辞書の類似文字特徴量の作成、調整作業を軽減した文字
認識方法および記録媒体を提供することにある。
Another object of the present invention is to use a default value for a character having a standard similar character feature amount to easily execute a similar character processing target character without setting each individual character. It is an object of the present invention to provide a character recognizing method and a recording medium which can reduce the work of creating and adjusting similar character features of a pattern dictionary.

【0006】[0006]

【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像から文字行およ
び文字を切り出し、文字を正規化し、該正規化された文
字イメージから特徴量を抽出し、パターン辞書に登録さ
れた複数文字のデータと比較して、特徴量の距離が小さ
い文字または類似度が大きい文字を認識結果とする文字
認識方法であって、前記パターン辞書には、前記複数の
文字の標準的な縦横比と許容範囲と文字特徴量を登録し
ておき、前記文字イメージから抽出された文字特徴量と
前記パターン辞書の文字特徴量とを比較し、類似度の高
い文字を認識結果候補(以下、候補文字)として生成
し、前記パターン辞書に、該候補文字に類似した文字の
縦横比が登録されているとき、前記候補文字の縦横比と
前記パターン辞書内の縦横比とを比較し、許容範囲内に
あるか否かを判定し、前記パターン辞書に、前記候補文
字に類似した文字の縦横比が登録されていないとき、前
記候補文字の縦横比をデフォルトと比較し、許容範囲内
にあるか否かを判定し、縦横比が許容範囲内にある候補
文字を認識結果とすることを特徴としている。
In order to achieve the above object, according to the first aspect of the present invention, a character line and a character are cut out from a document image, the character is normalized, and a feature amount is calculated from the normalized character image. Is extracted, and compared with the data of a plurality of characters registered in the pattern dictionary, a character recognition method for a character having a small feature distance or a character having a large similarity as a recognition result, wherein the pattern dictionary includes: The standard aspect ratio, allowable range, and character feature amount of the plurality of characters are registered, and the character feature amount extracted from the character image is compared with the character feature amount of the pattern dictionary. A character is generated as a recognition result candidate (hereinafter, candidate character), and when the aspect ratio of a character similar to the candidate character is registered in the pattern dictionary, the aspect ratio of the candidate character and the Compare with the aspect ratio, determine whether or not within the allowable range, in the pattern dictionary, when the aspect ratio of the character similar to the candidate character is not registered, the aspect ratio of the candidate character as a default It is characterized in that a comparison is made to determine whether the candidate character is within an allowable range, and a candidate character whose aspect ratio is within the allowable range is used as a recognition result.

【0007】請求項2記載の発明では、文書画像から文
字行および文字を切り出し、文字を正規化し、該正規化
された文字イメージから特徴量を抽出し、パターン辞書
に登録された複数文字のデータと比較して、特徴量の距
離が小さい文字または類似度が大きい文字を認識結果と
する文字認識方法であって、前記パターン辞書には、前
記複数の文字の標準的な相対縦横比と許容範囲と文字特
徴量を登録しておき、前記文字イメージから抽出された
文字特徴量と前記パターン辞書の文字特徴量とを比較
し、類似度の高い文字を認識結果候補(以下、候補文
字)として生成し、前記パターン辞書に、該候補文字に
類似した文字の相対縦横比が登録されているとき、前記
候補文字の相対縦横比と前記パターン辞書内の相対縦横
比とを比較し、許容範囲内にあるか否かを判定し、前記
パターン辞書に、前記候補文字に類似した文字の相対縦
横比が登録されていないとき、前記候補文字の相対縦横
比をデフォルトと比較し、許容範囲内にあるか否かを判
定し、相対縦横比が許容範囲内にある候補文字を認識結
果とすることを特徴としている。
According to the second aspect of the present invention, character lines and characters are cut out from a document image, the characters are normalized, a characteristic amount is extracted from the normalized character image, and data of a plurality of characters registered in a pattern dictionary is obtained. A character recognition method that recognizes a character having a small feature distance or a character having a large similarity as a recognition result, wherein the pattern dictionary includes a standard relative aspect ratio and an allowable range of the plurality of characters. And a character feature amount registered in advance. The character feature amount extracted from the character image is compared with the character feature amount of the pattern dictionary, and a character having a high similarity is generated as a recognition result candidate (hereinafter, candidate character). When the relative aspect ratio of a character similar to the candidate character is registered in the pattern dictionary, the relative aspect ratio of the candidate character is compared with the relative aspect ratio in the pattern dictionary to determine an allowable range. In the pattern dictionary, if the relative aspect ratio of the character similar to the candidate character is not registered, the relative aspect ratio of the candidate character is compared with a default, and within the allowable range. It is characterized in that it is determined whether or not there is a candidate character, and a candidate character whose relative aspect ratio is within an allowable range is used as a recognition result.

【0008】請求項3記載の発明では、文書画像から文
字行および文字を切り出し、文字を正規化し、該正規化
された文字イメージから特徴量を抽出し、パターン辞書
に登録された複数文字のデータと比較して、特徴量の距
離が小さい文字または類似度が大きい文字を認識結果と
する文字認識方法であって、前記パターン辞書には、前
記複数の文字の標準的な面積比と許容範囲と文字特徴量
を登録しておき、前記文字イメージから抽出された文字
特徴量と前記パターン辞書の文字特徴量とを比較し、類
似度の高い文字を認識結果候補(以下、候補文字)とし
て生成し、前記パターン辞書に、該候補文字に類似した
文字の面積比が登録されているとき、前記候補文字の面
積比と前記パターン辞書内の面積比とを比較し、許容範
囲内にあるか否かを判定し、前記パターン辞書に、前記
候補文字に類似した文字の面積比が登録されていないと
き、前記候補文字の面積比をデフォルトと比較し、許容
範囲内にあるか否かを判定し、面積比が許容範囲内にあ
る候補文字を認識結果とすることを特徴としている。
According to the third aspect of the invention, a character line and a character are cut out from a document image, the character is normalized, a feature amount is extracted from the normalized character image, and data of a plurality of characters registered in a pattern dictionary is obtained. And a character recognition method for recognizing a character having a small feature distance or a character having a large similarity as a recognition result, wherein the pattern dictionary includes a standard area ratio and an allowable range of the plurality of characters. A character feature amount is registered, a character feature amount extracted from the character image is compared with a character feature amount of the pattern dictionary, and a character having a high degree of similarity is generated as a recognition result candidate (hereinafter, candidate character). When the area ratio of a character similar to the candidate character is registered in the pattern dictionary, the area ratio of the candidate character is compared with the area ratio in the pattern dictionary to determine whether the area ratio is within an allowable range. When the area ratio of the character similar to the candidate character is not registered in the pattern dictionary, the area ratio of the candidate character is compared with a default, and it is determined whether or not the area ratio is within an allowable range. It is characterized in that candidate characters whose ratio is within an allowable range are recognized as recognition results.

【0009】請求項4記載の発明では、文書画像から文
字行および文字を切り出し、文字を正規化し、該正規化
された文字イメージから特徴量を抽出し、パターン辞書
に登録された複数文字のデータと比較して、特徴量の距
離が小さい文字または類似度が大きい文字を認識結果と
する文字認識方法であって、前記パターン辞書には、前
記複数の文字の標準的な上空白比と許容範囲と文字特徴
量を登録しておき、前記文字イメージから抽出された文
字特徴量と前記パターン辞書の文字特徴量とを比較し、
類似度の高い文字を認識結果候補(以下、候補文字)と
して生成し、前記パターン辞書に、該候補文字に類似し
た文字の上空白比が登録されているとき、前記候補文字
の上空白比と前記パターン辞書内の上空白比とを比較
し、許容範囲内にあるか否かを判定し、前記パターン辞
書に、前記候補文字に類似した文字の上空白比が登録さ
れていないとき、前記候補文字の上空白比をデフォルト
と比較し、許容範囲内にあるか否かを判定し、上空白比
が許容範囲内にある候補文字を認識結果とすることを特
徴としている。
According to the fourth aspect of the present invention, character lines and characters are cut out from a document image, the characters are normalized, a characteristic amount is extracted from the normalized character image, and data of a plurality of characters registered in a pattern dictionary is obtained. A character recognition method that recognizes a character having a small feature distance or a character having a large similarity as a recognition result, wherein the pattern dictionary includes a standard upper blank ratio and an allowable range of the plurality of characters. And a character feature amount are registered, and the character feature amount extracted from the character image is compared with the character feature amount of the pattern dictionary.
When a character having a high degree of similarity is generated as a recognition result candidate (hereinafter, a candidate character) and an upper space ratio of a character similar to the candidate character is registered in the pattern dictionary, the upper space ratio of the candidate character is Comparing the top blank ratio in the pattern dictionary to determine whether the top blank ratio is within an allowable range, and when the top blank ratio of a character similar to the candidate character is not registered in the pattern dictionary, It is characterized in that the upper blank ratio of a character is compared with a default to determine whether the upper blank ratio is within an allowable range, and a candidate character having an upper blank ratio within the allowable range is used as a recognition result.

【0010】請求項5記載の発明では、請求項1記載の
縦横比、請求項2記載の相対縦横比、請求項3記載の面
積比、請求項4記載の上空白比を全て比較し、あるいは
何れかを組み合わせて比較し、許容範囲内にあるか否か
を判定し、許容範囲内にある候補文字を認識結果とする
ことを特徴としている。
According to a fifth aspect of the present invention, the aspect ratio of the first aspect, the relative aspect ratio of the second aspect, the area ratio of the third aspect, and the top blank ratio of the fourth aspect are all compared, or It is characterized in that any one of the combinations is compared to determine whether the candidate character is within the allowable range and a candidate character within the allowable range is used as a recognition result.

【0011】請求項6記載の発明では、前記デフォルト
は、文字種毎に異なる値であることを特徴としている。
In the invention described in claim 6, the default value is different for each character type.

【0012】請求項7記載の発明では、文書画像から文
字行および文字を切り出し、文字を正規化し、該正規化
された文字イメージから特徴量を抽出し、パターン辞書
に登録された複数文字のデータと比較して、特徴量の距
離が小さい文字または類似度が大きい文字を認識結果と
する文字認識機能を、コンピュータに実現させるための
プログラムを記録した記録媒体であって、前記パターン
辞書には、前記複数の文字の標準的な縦横比、相対縦横
比、面積比、上空白比の一部または全部と許容範囲と文
字特徴量を登録する機能と、前記文字イメージから抽出
された文字特徴量と前記パターン辞書の文字特徴量とを
比較し、類似度の高い文字を認識結果候補(以下、候補
文字)として生成する機能と、前記パターン辞書に、該
候補文字に類似した文字の縦横比、相対縦横比、面積
比、上空白比の一部または全部が登録されているとき、
前記候補文字の縦横比、相対縦横比、面積比、上空白比
の一部または全部と前記パターン辞書内の縦横比、相対
縦横比、面積比、上空白比の一部または全部とを比較
し、許容範囲内にあるか否かを判定する機能と、前記パ
ターン辞書に、前記候補文字に類似した文字の縦横比、
相対縦横比、面積比、上空白比の一部または全部が登録
されていないとき、前記候補文字の縦横比、相対縦横
比、面積比、上空白比の一部または全部をデフォルトと
比較し、許容範囲内にあるか否かを判定する機能と、縦
横比、相対縦横比、面積比、上空白比の一部または全部
が許容範囲内にある候補文字を認識結果とする機能を実
現させるためのプログラムを記録したことを特徴として
いる。
According to the present invention, a character line and a character are cut out from a document image, the character is normalized, a feature amount is extracted from the normalized character image, and data of a plurality of characters registered in a pattern dictionary is obtained. Compared with, a character recognition function that recognizes a character having a small feature distance or a character having a high similarity as a recognition result, a recording medium that records a program for causing a computer to realize the pattern dictionary, A function of registering part or all of a standard aspect ratio, a relative aspect ratio, an area ratio, an upper blank ratio, an allowable range, and a character feature amount of the plurality of characters, and a character feature amount extracted from the character image. A function of comparing a character feature amount of the pattern dictionary and generating a character having a high degree of similarity as a recognition result candidate (hereinafter, a candidate character); The aspect ratio of the character, the relative aspect ratio, the area ratio, when a portion of the upper space ratio or the whole has been registered,
Compare part or all of the aspect ratio, relative aspect ratio, area ratio, and top blank ratio of the candidate character with part or all of the aspect ratio, relative aspect ratio, area ratio, and top blank ratio in the pattern dictionary. A function for determining whether or not it is within an allowable range; and the pattern dictionary has an aspect ratio of characters similar to the candidate characters,
When part or all of the relative aspect ratio, area ratio, and upper blank ratio are not registered, the aspect ratio, relative aspect ratio, area ratio, and part or all of the upper blank ratio of the candidate character are compared with defaults, To realize a function of determining whether or not the character is within an allowable range and a function of recognizing a candidate character having a part or all of an aspect ratio, a relative aspect ratio, an area ratio, and an upper blank ratio within an allowable range as a recognition result. Is recorded.

【0013】[0013]

【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。図1は、本発明の実施例の構
成を示す。図において、画像入力部1は、光学的スキャ
ナまたはファイルなどから文書イメージを取り出し、画
像メモリ2に書き込む。行・文字切り出し部3は、画像
メモリ2を参照し、文書イメージから文字列イメージを
抽出し、さらに文字列イメージから文字イメージを抽出
し、文字イメージや文字矩形サイズや位置の情報を文字
切り出しメモリ4に書き込む。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be specifically described below with reference to the drawings. FIG. 1 shows the configuration of an embodiment of the present invention. In the figure, an image input unit 1 takes out a document image from an optical scanner or a file or the like and writes it into an image memory 2. The line / character extracting unit 3 refers to the image memory 2, extracts a character string image from the document image, further extracts a character image from the character string image, and extracts information on the character image, character rectangle size, and position into a character extracting memory. Write to 4.

【0014】正規化部5は、文字切り出しメモリ4など
を参照し、文字のサイズを特徴抽出に都合のよい形に変
形する。一般的には、文字外接矩形の縦横比が1対1
で、決まったサイズの正方形になるように、文字イメー
ジの引き伸ばしや縮小を行う。
The normalizing section 5 refers to the character extraction memory 4 and the like, and transforms the size of the character into a form convenient for feature extraction. Generally, the aspect ratio of a character circumscribed rectangle is 1: 1.
Then, the character image is enlarged or reduced so as to form a square of a predetermined size.

【0015】特徴量抽出部6は、正規化された文字イメ
ージを参照し、文字形の特徴を表わす特徴量を算出す
る。特徴量の種類については特に限定しない。パターン
辞書比較部7は、文字切り出しメモリ4などを参照し、
文字の特徴量、文字サイズを、パターン辞書メモリ8に
格納されている複数の文字テンプレートと比較し、パタ
ーン辞書中で最も類似する(距離の小さい)文字を比較
結果として判定し、結果メモリ9に書き込む。本実施例
は、このパターン辞書比較部7の内部処理に関するもの
である。
The characteristic amount extracting section 6 refers to the normalized character image and calculates a characteristic amount representing the characteristic of the character form. The type of the feature amount is not particularly limited. The pattern dictionary comparison unit 7 refers to the character cutout memory 4 and the like,
The feature amount and the character size of the character are compared with a plurality of character templates stored in the pattern dictionary memory 8, and the most similar (smallest distance) character in the pattern dictionary is determined as a comparison result. Write. The present embodiment relates to the internal processing of the pattern dictionary comparison unit 7.

【0016】なお、後述するように、パターン辞書メモ
リ8には、認識対象となる各文字について、文字特徴量
と、標準的な縦横比(文字矩形の高さに対する幅の比)
の値と許容範囲が格納されている。
As will be described later, the pattern dictionary memory 8 stores, for each character to be recognized, a character feature amount and a standard aspect ratio (the ratio of the width to the height of the character rectangle).
And the allowable range are stored.

【0017】〈実施例1〉文書中に現われた文字列「電
脳絵巻」に含まれる文字「脳」を認識する場合を例にし
て実施例1を説明する。図2は、文字列「電脳絵巻」か
ら、文字矩形が切り出された図である。この文字列を先
頭から順番に認識し、「脳」を認識する場合を考える。
<Embodiment 1> An embodiment 1 will be described by taking as an example a case where a character "brain" included in a character string "denno picture scroll" appearing in a document is recognized. FIG. 2 is a diagram in which a character rectangle is cut out from the character string “Electronic picture scroll”. Consider a case in which this character string is recognized in order from the beginning and "brain" is recognized.

【0018】「脳」の文字は偏と旁の文字矩形に分か
れ、それらを偏と旁それぞれを1文字として認識する場
合と、統合した1文字として認識する場合があり、両方
の認識結果を比較して、その文字が2文字であるのかま
たは1文字であるのかを判定する。
The character of the "brain" is divided into partial and rectangular character rectangles, and there are cases where they are recognized as one character each of the partial and neighboring characters, and cases where they are recognized as one integrated character. Then, it is determined whether the character is two characters or one character.

【0019】図3は、本発明の処理フローチャートを示
す。ステップ101では、画像を入力し、画像メモリ2
に書き込む。ステップ102では、文字を切り出し、メ
モリ4に書き込む。ステップ103では、正規化処理を
行い、ステップ104では、文字形の特徴を表わす特徴
量を抽出する。ステップ105では、認識対象文字とパ
ターン辞書とを比較し、ステップ106では、パターン
辞書中で最も類似する文字を比較結果として出力する。
FIG. 3 shows a processing flowchart of the present invention. In step 101, an image is input and the image memory 2
Write to. In step 102, characters are cut out and written into the memory 4. In step 103, a normalization process is performed, and in step 104, a feature amount representing a character-shaped feature is extracted. In step 105, the character to be recognized is compared with the pattern dictionary. In step 106, the most similar character in the pattern dictionary is output as a comparison result.

【0020】図4は、図3中のパターン辞書比較処理の
詳細フローチャートを示す。まず、正規化した文字特徴
量を用いてパターン辞書と比較したとき、例えば、図5
に示す認識結果候補文字が得られたとする(ステップ2
02)。つまり、偏と旁をそれぞれ認識した結果が
「月」「凶」となり、統合して認識した結果が「脳」と
なる。
FIG. 4 is a detailed flowchart of the pattern dictionary comparison processing in FIG. First, when a normalized character feature value is compared with a pattern dictionary, for example, FIG.
(Step 2)
02). In other words, the result of recognizing the bias and the side is “moon” and “evil”, and the result of the integrated recognition is “brain”.

【0021】次に、ステップ203以下で、本発明によ
る類似文字の判定処理を行う。漢字文字の縦横比がデフ
ォルト値として中心値1.0、許容範囲が0.5〜2.
0であるとする。
Next, in step 203 and subsequent steps, similar character determination processing according to the present invention is performed. The aspect ratio of kanji characters is 1.0 as the default value, the center value is 1.0, and the allowable range is 0.5-2.
Assume that it is 0.

【0022】ステップ203では、候補文字の先頭を選
択してパターン辞書との比較を繰り返すループに入る。
まず、「脳」の偏である「月」に注目する。認識結果候
補文字が、「月」であり、「月」のパターン辞書には類
似文字の縦横比が登録されていないものとする(ステッ
プ204)。
In step 203, the process enters a loop in which the head of the candidate character is selected and comparison with the pattern dictionary is repeated.
First, pay attention to the “moon”, which is a bias of the “brain”. It is assumed that the recognition result candidate character is “month” and that the pattern dictionary of “month” does not register the aspect ratio of similar characters (step 204).

【0023】そこで、漢字「月」のデフォルト縦横比で
ある0.5〜2.0の範囲と、この偏の文字矩形の縦横
比を比較する(ステップ205、206)。図6に示す
ように、月偏の文字矩形は縦に長く、縦横比(文字矩形
幅/文字矩形高さ)の値が0.3であるので、許容範囲
外となり、「月」はリジェクトされる(ステップ20
7)。
Therefore, the default aspect ratio of the Chinese character "month" in the range of 0.5 to 2.0 is compared with the aspect ratio of this deviated character rectangle (steps 205 and 206). As shown in FIG. 6, the month-biased character rectangle is vertically long, and the value of the aspect ratio (character rectangle width / character rectangle height) is 0.3. Therefore, the value is outside the allowable range, and “month” is rejected. (Step 20
7).

【0024】ステップ208で候補文字が終了していな
いので、ステップ203に戻り、次の候補文字「凶」に
ついて、比較処理を行う。ここではパターン辞書に類似
文字の縦横比が登録されていて、候補文字の縦横比が許
容範囲内にあるものとする。許容範囲内にあるものは縦
横比の中心値に近いものの順に優先順位を決定し、認識
結果として出力する。この候補文字「凶」は有効と判定
される。
Since the candidate character has not been completed in step 208, the process returns to step 203, and a comparison process is performed for the next candidate character "". Here, it is assumed that the aspect ratio of the similar character is registered in the pattern dictionary, and the aspect ratio of the candidate character is within an allowable range. Priorities within the allowable range are determined in the order of the ones closer to the center value of the aspect ratio, and are output as recognition results. This candidate character “evil” is determined to be valid.

【0025】一方、統合して認識した「脳」の文字は、
文字矩形が正方形に近く縦横比が許容範囲内にあるので
(ステップ206)、リジェクトされない。図7に示す
ように、分離して2文字として認識した場合にはリジェ
クトされた「月」があり、統合して1文字として認識し
た場合には「脳」はリジェクトされないので、文字組合
せとしては統合した「脳」の方が評価が高く、「脳」の
文字を選択して出力する(図3のステップ106)。
On the other hand, the letters of the "brain" that are integrated and recognized are:
Since the character rectangle is close to a square and the aspect ratio is within the allowable range (step 206), it is not rejected. As shown in FIG. 7, there is a rejected "month" when separated and recognized as two characters, and when combined and recognized as one character, "brain" is not rejected. The integrated “brain” has a higher evaluation, and the character “brain” is selected and output (step 106 in FIG. 3).

【0026】つまり、本発明のデフォルト類似文字パラ
メータ処理によって、「脳」の月偏が1文字として不適
当であることが判定され、その判定結果が文字組合せの
選択に反映され、正しい文字である、統合された「脳」
が選択される。
That is, by the default similar character parameter processing of the present invention, it is determined that the month bias of "brain" is inappropriate as one character, and the determination result is reflected in the selection of the character combination, and the character is correct. , Integrated "brain"
Is selected.

【0027】〈実施例2〉実施例2は、実施例1のステ
ップ204、205、206での縦横比の比較を、相対
縦横比の比較に変更したものである。ここで、相対縦横
比とは、前掲した出願(特願平6−304523号)で
提案したものと同一のものである。
Embodiment 2 In Embodiment 2, the comparison of the aspect ratios in Steps 204, 205, and 206 of Embodiment 1 is changed to the comparison of the relative aspect ratio. Here, the relative aspect ratio is the same as that proposed in the above-mentioned application (Japanese Patent Application No. 6-304523).

【0028】〈実施例3〉実施例3は、実施例1のステ
ップ204、205、206での縦横比の比較を、面積
比の比較に変更したものである。ここで、面積比とは、
前掲した公報(特開平3−147084号公報)に記載
されたものと同様である。また、パターン辞書には、認
識対象となる各文字について、文字特徴量と、標準的な
面積比(標準文字面積に対する対象文字面積の比)の値
と許容範囲が登録されている。面積比の値は、文字矩形
の面積比が1.0(つまり、標準文字面積と同じ面積)
からある程度以上離れたもののみ登録されている。
Embodiment 3 In Embodiment 3, the comparison of the aspect ratio in Steps 204, 205, and 206 of Embodiment 1 is changed to the comparison of the area ratio. Here, the area ratio is
This is the same as that described in the above-mentioned publication (Japanese Patent Laid-Open Publication No. 3-170884). In the pattern dictionary, for each character to be recognized, a character feature amount, a value of a standard area ratio (a ratio of the target character area to the standard character area), and an allowable range are registered. The value of the area ratio is that the area ratio of the character rectangle is 1.0 (that is, the same area as the standard character area).
Only those that are at least a certain distance from are registered.

【0029】なお、デフォルトの値としては、文字種毎
に異なる値を設定する。例えば、認識結果が漢字の候補
については、面積比中心値は1.0を仮定し、ひらがな
の候補については、面積比中心値は0.8と、若干小さ
い値を仮定する。これによって、より細かい認識精度の
制御が可能となる。
As a default value, a different value is set for each character type. For example, it is assumed that the area ratio center value is 1.0 for a kanji candidate whose recognition result is a small value, and the area ratio center value is 0.8 for a hiragana candidate. As a result, finer control of recognition accuracy becomes possible.

【0030】〈実施例4〉実施例4は、実施例1のステ
ップ204、205、206での縦横比の比較を、上空
白比の比較に変更したものである。ここで、上空白比と
は、標準文字高さに対する認識対象文字の上空白高さの
比である。また、パターン辞書には、認識対象となる各
文字について、文字特徴量と、標準的な上空白比(標準
文字高さに対する対象文字の上空白高さの比)の値と許
容範囲が登録されている。上空白比値は、文字矩形の上
空白比が0(つまり、行の上基準線と対象文字矩形の上
辺が同じ位置)からある程度以上離れたもののみ登録さ
れている。
Fourth Embodiment In a fourth embodiment, the comparison of the aspect ratio in steps 204, 205, and 206 of the first embodiment is changed to the comparison of the top blank ratio. Here, the upper blank ratio is the ratio of the upper blank height of the recognition target character to the standard character height. In the pattern dictionary, for each character to be recognized, a character feature amount, a value of a standard upper blank ratio (ratio of a target character upper blank height to a standard character height), and an allowable range are registered. ing. The upper blank ratio values are registered only when the upper blank ratio of the character rectangle is more than a certain distance from 0 (that is, the upper reference line of the line and the upper side of the target character rectangle are at the same position).

【0031】〈実施例5〉本実施例では、縦横比比較ま
たは相対縦横比比較、面積比比較、上空白比比較を適宜
組み合わせて評価を行い、認識結果候補のリジェクトお
よび優先順位を決定するものである。
<Embodiment 5> In this embodiment, evaluation is performed by appropriately combining aspect ratio comparison or relative aspect ratio comparison, area ratio comparison, and top blank ratio comparison, and rejection and priority of recognition result candidates are determined. It is.

【0032】〈実施例6〉図8は、本発明の実施例6の
構成を示す。本実施例は、ソフトウェアによって実現す
る場合の実施例であり、CPU21、メモリ22、ハー
ドディスク23、入力装置24、CD−ROMドライブ
25、ディスプレイ26、マウスなどからなる汎用の処
理装置を用意する。CD−ROMなどの記録媒体27に
は、本発明の文字認識の処理機能や処理手順を実現させ
るためのプログラムが記録されている。また、文書など
の原稿画像は、例えばハードディスク23などに格納さ
れている。CPU21は、記録媒体27から上記した処
理機能、手順を実現するプログラムを読み出し実行し、
原稿画像の文字を認識処理し、文字認識結果などをディ
スプレイ26などに表示出力する。
<Embodiment 6> FIG. 8 shows the structure of Embodiment 6 of the present invention. This embodiment is an embodiment implemented by software, and prepares a general-purpose processing device including a CPU 21, a memory 22, a hard disk 23, an input device 24, a CD-ROM drive 25, a display 26, a mouse, and the like. On a recording medium 27 such as a CD-ROM, a program for realizing the character recognition processing function and processing procedure of the present invention is recorded. Document images such as documents are stored on the hard disk 23, for example. The CPU 21 reads a program for realizing the above-described processing functions and procedures from the recording medium 27 and executes the program.
The characters in the document image are recognized and the result of character recognition is displayed on the display 26 or the like.

【0033】[0033]

【発明の効果】以上、説明したように、本発明によれ
ば、類似文字特徴をパターン辞書に登録せずに、デフォ
ルト値を仮定して類似文字を判定処理しているので、パ
ターン辞書のサイズが減るとともに、メモリやディスク
などのハードウェア資源が節約される。また、類似文字
特徴量の設定や調整を簡単に行うことが可能となる。
As described above, according to the present invention, similar character features are not registered in the pattern dictionary, and similar characters are determined by assuming default values. And hardware resources such as memory and disks are saved. Further, it is possible to easily set and adjust the similar character feature amount.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例1の構成を示す。FIG. 1 shows a configuration of a first exemplary embodiment of the present invention.

【図2】文字列「電脳絵巻」から、文字矩形が切り出さ
れた図である。
FIG. 2 is a diagram in which a character rectangle is cut out from a character string “Digital picture scroll”.

【図3】本発明の処理フローチャートを示す。FIG. 3 shows a processing flowchart of the present invention.

【図4】パターン辞書比較処理の詳細フローチャートを
示す。
FIG. 4 shows a detailed flowchart of a pattern dictionary comparison process.

【図5】認識結果の候補例を示す。FIG. 5 shows an example of a recognition result candidate.

【図6】偏「月」の縦横比と、漢字「月」のデフォルト
縦横比を説明する図である。
FIG. 6 is a diagram for explaining the aspect ratio of the partial “month” and the default aspect ratio of the Chinese character “month”.

【図7】分離、統合の認識結果から正しい文字を選択す
る図である。
FIG. 7 is a diagram for selecting a correct character from a recognition result of separation and integration.

【図8】本発明の実施例6の構成を示す。FIG. 8 shows a configuration of a sixth embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 画像入力部 2 画像メモリ 3 行・文字切り出し部 4 文字切り出しメモリ 5 正規化部 6 特徴量抽出部 7 パターン辞書比較部 8 パターン辞書メモリ 9 結果メモリ DESCRIPTION OF SYMBOLS 1 Image input part 2 Image memory 3 Line / character cutout part 4 Character cutout memory 5 Normalization part 6 Feature extraction part 7 Pattern dictionary comparison part 8 Pattern dictionary memory 9 Result memory

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 文書画像から文字行および文字を切り出
し、文字を正規化し、該正規化された文字イメージから
特徴量を抽出し、パターン辞書に登録された複数文字の
データと比較して、特徴量の距離が小さい文字または類
似度が大きい文字を認識結果とする文字認識方法であっ
て、前記パターン辞書には、前記複数の文字の標準的な
縦横比と許容範囲と文字特徴量を登録しておき、前記文
字イメージから抽出された文字特徴量と前記パターン辞
書の文字特徴量とを比較し、類似度の高い文字を認識結
果候補(以下、候補文字)として生成し、前記パターン
辞書に、該候補文字に類似した文字の縦横比が登録され
ているとき、前記候補文字の縦横比と前記パターン辞書
内の縦横比とを比較し、許容範囲内にあるか否かを判定
し、前記パターン辞書に、前記候補文字に類似した文字
の縦横比が登録されていないとき、前記候補文字の縦横
比をデフォルトと比較し、許容範囲内にあるか否かを判
定し、縦横比が許容範囲内にある候補文字を認識結果と
することを特徴とする文字認識方法。
1. A character line and a character are cut out from a document image, the character is normalized, a characteristic amount is extracted from the normalized character image, and compared with data of a plurality of characters registered in a pattern dictionary. A character recognition method for recognizing a character having a small amount of distance or a character having a large similarity, wherein the pattern dictionary registers a standard aspect ratio, a permissible range, and a character feature amount of the plurality of characters. In addition, a character feature amount extracted from the character image is compared with a character feature amount of the pattern dictionary, and a character having a high degree of similarity is generated as a recognition result candidate (hereinafter, candidate character). When the aspect ratio of a character similar to the candidate character is registered, the aspect ratio of the candidate character is compared with the aspect ratio in the pattern dictionary, and it is determined whether the candidate character is within an allowable range. Letter When the aspect ratio of a character similar to the candidate character is not registered in the document, the aspect ratio of the candidate character is compared with a default to determine whether the aspect ratio is within an allowable range, and the aspect ratio is within the allowable range. A character recognition method characterized in that a candidate character in the above is used as a recognition result.
【請求項2】 文書画像から文字行および文字を切り出
し、文字を正規化し、該正規化された文字イメージから
特徴量を抽出し、パターン辞書に登録された複数文字の
データと比較して、特徴量の距離が小さい文字または類
似度が大きい文字を認識結果とする文字認識方法であっ
て、前記パターン辞書には、前記複数の文字の標準的な
相対縦横比と許容範囲と文字特徴量を登録しておき、前
記文字イメージから抽出された文字特徴量と前記パター
ン辞書の文字特徴量とを比較し、類似度の高い文字を認
識結果候補(以下、候補文字)として生成し、前記パタ
ーン辞書に、該候補文字に類似した文字の相対縦横比が
登録されているとき、前記候補文字の相対縦横比と前記
パターン辞書内の相対縦横比とを比較し、許容範囲内に
あるか否かを判定し、前記パターン辞書に、前記候補文
字に類似した文字の相対縦横比が登録されていないと
き、前記候補文字の相対縦横比をデフォルトと比較し、
許容範囲内にあるか否かを判定し、相対縦横比が許容範
囲内にある候補文字を認識結果とすることを特徴とする
文字認識方法。
2. A character line and a character are cut out from a document image, the character is normalized, a feature amount is extracted from the normalized character image, and compared with data of a plurality of characters registered in a pattern dictionary. A character recognition method for recognizing a character having a small amount of distance or a character having a large similarity, wherein a standard relative aspect ratio, an allowable range, and a character feature amount of the plurality of characters are registered in the pattern dictionary. In addition, a character feature amount extracted from the character image is compared with a character feature amount of the pattern dictionary, and a character having a high degree of similarity is generated as a recognition result candidate (hereinafter, candidate character). When the relative aspect ratio of a character similar to the candidate character is registered, the relative aspect ratio of the candidate character is compared with the relative aspect ratio in the pattern dictionary to determine whether the candidate character is within an allowable range. I When the relative aspect ratio of a character similar to the candidate character is not registered in the pattern dictionary, the relative aspect ratio of the candidate character is compared with a default,
A character recognition method comprising: determining whether or not a candidate character is within an allowable range; and determining a candidate character having a relative aspect ratio within the allowable range as a recognition result.
【請求項3】 文書画像から文字行および文字を切り出
し、文字を正規化し、該正規化された文字イメージから
特徴量を抽出し、パターン辞書に登録された複数文字の
データと比較して、特徴量の距離が小さい文字または類
似度が大きい文字を認識結果とする文字認識方法であっ
て、前記パターン辞書には、前記複数の文字の標準的な
面積比と許容範囲と文字特徴量を登録しておき、前記文
字イメージから抽出された文字特徴量と前記パターン辞
書の文字特徴量とを比較し、類似度の高い文字を認識結
果候補(以下、候補文字)として生成し、前記パターン
辞書に、該候補文字に類似した文字の面積比が登録され
ているとき、前記候補文字の面積比と前記パターン辞書
内の面積比とを比較し、許容範囲内にあるか否かを判定
し、前記パターン辞書に、前記候補文字に類似した文字
の面積比が登録されていないとき、前記候補文字の面積
比をデフォルトと比較し、許容範囲内にあるか否かを判
定し、面積比が許容範囲内にある候補文字を認識結果と
することを特徴とする文字認識方法。
3. A character line and a character are cut out from a document image, the character is normalized, a characteristic amount is extracted from the normalized character image, and the characteristic amount is compared with data of a plurality of characters registered in a pattern dictionary. A character recognition method for recognizing a character having a small amount distance or a character having a large similarity, wherein a standard area ratio, an allowable range, and a character feature amount of the plurality of characters are registered in the pattern dictionary. In addition, a character feature amount extracted from the character image is compared with a character feature amount of the pattern dictionary, and a character having a high degree of similarity is generated as a recognition result candidate (hereinafter, candidate character). When the area ratio of a character similar to the candidate character is registered, the area ratio of the candidate character is compared with the area ratio in the pattern dictionary, and it is determined whether the area ratio is within an allowable range. Letter When the area ratio of a character similar to the candidate character is not registered in the document, the area ratio of the candidate character is compared with a default to determine whether or not the area ratio is within an allowable range. A character recognition method characterized in that a candidate character in the above is used as a recognition result.
【請求項4】 文書画像から文字行および文字を切り出
し、文字を正規化し、該正規化された文字イメージから
特徴量を抽出し、パターン辞書に登録された複数文字の
データと比較して、特徴量の距離が小さい文字または類
似度が大きい文字を認識結果とする文字認識方法であっ
て、前記パターン辞書には、前記複数の文字の標準的な
上空白比と許容範囲と文字特徴量を登録しておき、前記
文字イメージから抽出された文字特徴量と前記パターン
辞書の文字特徴量とを比較し、類似度の高い文字を認識
結果候補(以下、候補文字)として生成し、前記パター
ン辞書に、該候補文字に類似した文字の上空白比が登録
されているとき、前記候補文字の上空白比と前記パター
ン辞書内の上空白比とを比較し、許容範囲内にあるか否
かを判定し、前記パターン辞書に、前記候補文字に類似
した文字の上空白比が登録されていないとき、前記候補
文字の上空白比をデフォルトと比較し、許容範囲内にあ
るか否かを判定し、上空白比が許容範囲内にある候補文
字を認識結果とすることを特徴とする文字認識方法。
4. A character line and a character are cut out from a document image, the character is normalized, a feature amount is extracted from the normalized character image, and compared with data of a plurality of characters registered in a pattern dictionary. What is claimed is: 1. A character recognition method for recognizing a character having a small amount of distance or a character having a large similarity, wherein a standard upper blank ratio, an allowable range, and a character feature amount of the plurality of characters are registered in the pattern dictionary. In addition, a character feature amount extracted from the character image is compared with a character feature amount of the pattern dictionary, and a character having a high degree of similarity is generated as a recognition result candidate (hereinafter, candidate character). When a top space ratio of a character similar to the candidate character is registered, the top space ratio of the candidate character is compared with the top space ratio in the pattern dictionary to determine whether the ratio is within an allowable range. And the When the top space ratio of a character similar to the candidate character is not registered in the turn dictionary, the top space ratio of the candidate character is compared with a default to determine whether or not the ratio is within an allowable range. A character recognition method characterized in that a candidate character whose is within an allowable range is a recognition result.
【請求項5】 請求項1記載の縦横比、請求項2記載の
相対縦横比、請求項3記載の面積比、請求項4記載の上
空白比を全て比較し、あるいは何れかを組み合わせて比
較し、許容範囲内にあるか否かを判定し、許容範囲内に
ある候補文字を認識結果とすることを特徴とする文字認
識方法。
5. The aspect ratio according to claim 1, the relative aspect ratio according to claim 2, the area ratio according to claim 3, and the top blank ratio according to claim 4, or a combination of any of them. A character recognition method comprising: determining whether or not a candidate character is within an allowable range; and determining a candidate character within the allowable range as a recognition result.
【請求項6】 前記デフォルトは、文字種毎に異なる値
であることを特徴とする請求項1、2、3、4または5
記載の文字認識方法。
6. The apparatus according to claim 1, wherein the default value is different for each character type.
The character recognition method described.
【請求項7】 文書画像から文字行および文字を切り出
し、文字を正規化し、該正規化された文字イメージから
特徴量を抽出し、パターン辞書に登録された複数文字の
データと比較して、特徴量の距離が小さい文字または類
似度が大きい文字を認識結果とする文字認識機能を、コ
ンピュータに実現させるためのプログラムを記録した記
録媒体であって、前記パターン辞書には、前記複数の文
字の標準的な縦横比、相対縦横比、面積比、上空白比の
一部または全部と許容範囲と文字特徴量を登録する機能
と、前記文字イメージから抽出された文字特徴量と前記
パターン辞書の文字特徴量とを比較し、類似度の高い文
字を認識結果候補(以下、候補文字)として生成する機
能と、前記パターン辞書に、該候補文字に類似した文字
の縦横比、相対縦横比、面積比、上空白比の一部または
全部が登録されているとき、前記候補文字の縦横比、相
対縦横比、面積比、上空白比の一部または全部と前記パ
ターン辞書内の縦横比、相対縦横比、面積比、上空白比
の一部または全部とを比較し、許容範囲内にあるか否か
を判定する機能と、前記パターン辞書に、前記候補文字
に類似した文字の縦横比、相対縦横比、面積比、上空白
比の一部または全部が登録されていないとき、前記候補
文字の縦横比、相対縦横比、面積比、上空白比の一部ま
たは全部をデフォルトと比較し、許容範囲内にあるか否
かを判定する機能と、縦横比、相対縦横比、面積比、上
空白比の一部または全部が許容範囲内にある候補文字を
認識結果とする機能を実現させるためのプログラムを記
録した記録媒体。
7. A character line and a character are cut out from a document image, the character is normalized, a feature amount is extracted from the normalized character image, and compared with data of a plurality of characters registered in a pattern dictionary. A storage medium storing a program for causing a computer to realize a character recognition function of recognizing a character having a small amount of distance or a character having a high degree of similarity, wherein the pattern dictionary includes a standard for the plurality of characters. Of registering a part or all of a typical aspect ratio, a relative aspect ratio, an area ratio, an upper blank ratio, an allowable range and a character feature amount, a character feature amount extracted from the character image and a character feature of the pattern dictionary. And a function of generating a character having a high degree of similarity as a recognition result candidate (hereinafter referred to as a candidate character). When part or all of the ratio, area ratio, and top blank ratio are registered, part or all of the aspect ratio, relative aspect ratio, area ratio, and top blank ratio of the candidate character and the aspect ratio in the pattern dictionary A function of comparing the relative aspect ratio, area ratio, part or all of the upper blank ratio to determine whether or not the ratio is within an allowable range; and the pattern dictionary has an aspect ratio of a character similar to the candidate character. When part or all of the relative aspect ratio, area ratio, and top blank ratio are not registered, the aspect ratio, relative aspect ratio, area ratio, and part of the top blank ratio of the candidate character are compared with defaults. And a function of determining whether or not a part or all of an aspect ratio, a relative aspect ratio, an area ratio, and a top blank ratio are within an allowable range as a recognition result. Recording medium on which a program for recording is recorded.
JP8270892A 1996-10-14 1996-10-14 Character recognition method and recording medium Pending JPH10116317A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8270892A JPH10116317A (en) 1996-10-14 1996-10-14 Character recognition method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8270892A JPH10116317A (en) 1996-10-14 1996-10-14 Character recognition method and recording medium

Publications (1)

Publication Number Publication Date
JPH10116317A true JPH10116317A (en) 1998-05-06

Family

ID=17492431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8270892A Pending JPH10116317A (en) 1996-10-14 1996-10-14 Character recognition method and recording medium

Country Status (1)

Country Link
JP (1) JPH10116317A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008305133A (en) * 2007-06-07 2008-12-18 Kyocera Mita Corp Information processor, information processing method, and information processing program
US10521686B2 (en) 2016-01-28 2019-12-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus, information processing method and storage medium for generating an image file by extracting character pixels of a target image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008305133A (en) * 2007-06-07 2008-12-18 Kyocera Mita Corp Information processor, information processing method, and information processing program
US10521686B2 (en) 2016-01-28 2019-12-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus, information processing method and storage medium for generating an image file by extracting character pixels of a target image

Similar Documents

Publication Publication Date Title
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5784487A (en) System for document layout analysis
JP3259993B2 (en) Word form measurement method and image signal processing method
JP3278471B2 (en) Area division method
CN111630522B (en) Recording area extracting device and computer readable recording medium
JPH05242292A (en) Separating method
KR100412317B1 (en) Character recognizing/correcting system
JPH08255236A (en) Device and method for filing image
JPH09179937A (en) Method for automatically discriminating boundary of sentence in document picture
JPH01253077A (en) Detection of string
JPH09179942A (en) Method for automatically recognizing drop word in document picture using no ocr
JP2006065477A (en) Character recognition device
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH10116317A (en) Character recognition method and recording medium
JP3215163B2 (en) Ruled line identification method and area identification method
US7929773B2 (en) Method for recognizing characters
JPH10162102A (en) Character recognition device
JP3835652B2 (en) Method for determining Japanese / English of document image and recording medium
JP4162195B2 (en) Image processing apparatus and image processing program
WO2023042270A1 (en) Character recognition program, character recognition system, and character recognition method
US20220309273A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JPH0757040A (en) Filing device provided with ocr
JP3220226B2 (en) Character string direction determination method
JP2005078287A (en) Character recognizing device and character recognizing program
JP4079333B2 (en) Method for determining Japanese / English of document image and recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050517