JPH11134435A - Method for normalizing character picture and device for recognizing character - Google Patents

Method for normalizing character picture and device for recognizing character

Info

Publication number
JPH11134435A
JPH11134435A JP9342313A JP34231397A JPH11134435A JP H11134435 A JPH11134435 A JP H11134435A JP 9342313 A JP9342313 A JP 9342313A JP 34231397 A JP34231397 A JP 34231397A JP H11134435 A JPH11134435 A JP H11134435A
Authority
JP
Japan
Prior art keywords
character
normalization
character image
thinning
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9342313A
Other languages
Japanese (ja)
Other versions
JP3560794B2 (en
Inventor
Jutaro Ishioka
寿太郎 石岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Digital Laboratory Co Ltd
Original Assignee
Japan Digital Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Digital Laboratory Co Ltd filed Critical Japan Digital Laboratory Co Ltd
Priority to JP34231397A priority Critical patent/JP3560794B2/en
Publication of JPH11134435A publication Critical patent/JPH11134435A/en
Application granted granted Critical
Publication of JP3560794B2 publication Critical patent/JP3560794B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a character recognition device equipped with a normalization processing means for attaining stable recognition without necessitating plural dictionaries even when the thickness of a line in one character fluctionates. SOLUTION: Thinning processing of a character picture for one character segmented by character segmenting part 110 is operated by a thinning processing part 121, and a circumscribed rectangle of the character is detected by a circumscribed rectangle detecting part 122 for the thinned character picture, and the enlargement or reduction judgement of the picture is operated according to the size of the circumscribed rectangle. When the enlargement judgement is operated, the enlargement normalization processing of the thinned character picture is operated by an enlargement normalizing part 123 so that a picture arth a normalized size can be obtained. When the reduction judgement is operated, the OR normalization processing of the thinned character picture is operated by an OR normalizing part 124 so that a picture with a normalized size can be obtained. Then, the picture whose size is normalized by the enlargement normalizing part 123 or the OR normalizing part 124 is processed by a thickness processing part 125 so that the width of the segment line of the picture can be turned into preliminarily set thickness.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識装置に関
し、特に、記入線の太さや文字の大きさが異なる文字画
像を正規化する技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device and, more particularly, to a technique for normalizing character images having different line widths and character sizes.

【0002】[0002]

【従来の技術】文字認識装置では、読取った文字画像の
線の太さは一様とはいえず、文字の大きさも一定ではな
く、様々な線の太さと大きさの文字画像が得られる。こ
のような文字画像から文字認識を行なうために、前処理
として読取った文字画像の正規化を行なっている。
2. Description of the Related Art In a character recognition apparatus, the line width of a read character image is not uniform, the character size is not constant, and character images having various line thicknesses and sizes can be obtained. To perform character recognition from such a character image, the read character image is normalized as preprocessing.

【0003】読取られた文字画像の線の太さと大きさを
正規化する方法として、間引き正規化技法およびOR正
規化技法が知られている。ここで、間引き正規化は、画
素を一定の間隔で抽出し、他の画素を切捨てることによ
り入力画素より小さいサイズの画素を生成する方法であ
り、OR正規化は一定間隔内の画素のOR(論理和)を
とることにより、入力画像より小さいサイズの画像を生
成する方法である。
As methods for normalizing the thickness and size of lines of a read character image, a thinning normalization technique and an OR normalization technique are known. Here, the thinning-out normalization is a method of extracting a pixel at a fixed interval and generating a pixel smaller in size than the input pixel by truncating other pixels. This is a method of generating an image having a smaller size than the input image by taking (logical sum).

【0004】しかしながら、間引き正規化の場合には細
かい線が消失したり、かすれたりする等の減少が生じや
すいという問題点があり、また、OR正規化では文字の
ループ内の画素が潰れやすい等の問題点があった。
[0004] However, thinning normalization has a problem that fine lines are easily lost or faded, and pixels are liable to collapse in a character loop in OR normalization. There was a problem.

【0005】上記問題点を考慮したものとして、入力画
像に対して線分の細め処理を行ない、細め処理後の画像
に対してOR正規化を行なう方法(特開平3−3778
3号)がある。
In consideration of the above problems, a method of performing line segment thinning processing on an input image and performing OR normalization on the image after the thinning processing (Japanese Patent Laid-Open No. 3-3778).
No. 3).

【0006】更に、上記特開平3−37783号に開示
の技術を改善したものとして、入力画像に対して線分の
細め処理をその強さを変えて施し、それぞれの細め処理
後の文字画像に対してOR正規化することにより、一つ
の画像に対して複数の正規化文字画像を得てそれぞれ認
識処理を行ない、得られた複数の認識結果から最終認識
結果を得る方法(特開平4−687号)がある。
Further, as an improvement of the technique disclosed in the above-mentioned Japanese Patent Application Laid-Open No. 3-37783, a line segment thinning process is performed on an input image while changing its strength, and each character image after the thinning process is applied to the input image. By performing OR normalization on the image, a plurality of normalized character images are obtained for one image, each of them is subjected to recognition processing, and a final recognition result is obtained from the obtained plurality of recognition results (Japanese Patent Laid-Open No. 4-687). No.).

【0007】[0007]

【発明が解決しようとする課題】上記特開平4−687
号に開示の文字認識技法では、入力画像に施す線分の細
め処理の強さを変えて、それぞれの細め処理後の文字画
像に対してOR正規化を行なうので、一文字の中で線分
の太さの変化の程度が大きい場合にはその度合いに応じ
て細め処理の回数が増大することになり、OR正規化に
よる正規化文字も増大し、認識処理の回数が増す結果に
なり、線分の幅の変化が一定以上の場合には処理速度が
遅くなる等、メモリー容量および認識処理速度の上から
一定の制限があった。
SUMMARY OF THE INVENTION The above-mentioned Japanese Patent Application Laid-Open No. 4-687.
In the character recognition technique disclosed in Japanese Patent Application Laid-Open No. H11-260, the normalization of line segments applied to an input image is changed, and OR normalization is performed on each character image after the thinning process. If the degree of change in thickness is large, the number of narrowing processes increases in accordance with the degree, the number of characters normalized by OR normalization also increases, and the number of recognition processes increases. There is a certain limit in terms of memory capacity and recognition processing speed, for example, when the change in the width of is larger than a certain value, the processing speed becomes slower.

【0008】例えば、ボールペンで書かれた文字を例に
とるとボールペンではペン先にインクがたまることがま
まあり、そのままの状態で記入を続けていると、一文字
の中でも記入線が太くなったり細くなったりして文字中
の線分の太さの変化が大きくなる場合がある。また、複
写等で拡大した文字の場合、倍率が大きい場合と線幅が
太くなり、画質が粗くなる。
For example, in the case of a character written with a ballpoint pen, for example, ink may accumulate on the pen tip of the ballpoint pen, and if writing is continued as it is, the writing line becomes thicker or thinner in one character. In some cases, the thickness of the line segment in the character changes greatly. Further, in the case of a character enlarged by copying or the like, the line width becomes thicker when the magnification is large, and the image quality becomes coarse.

【0009】筆記具にも鉛筆、ボールペン、サインペン
等、様々なものがあり芯の太さにも各種の種類がある。
このように筆記具によって書かれる文字のあらゆる線幅
の文字を同一のパターンマッチングによる認識処理で行
なう際に、線幅によって特徴データが変る特徴抽出法を
用いると線幅に応じた多くの辞書を要することとなり、
認識処理の効率が低下するという問題点があった。
There are various types of writing implements such as pencils, ball-point pens, and felt-tip pens, and there are various types of core thicknesses.
As described above, when a character having all line widths of a character written by a writing instrument is subjected to recognition processing by the same pattern matching, a large number of dictionaries corresponding to the line width are required by using a feature extraction method in which feature data changes depending on the line width. That means
There is a problem that the efficiency of the recognition processing is reduced.

【0010】本発明は、上記従来技術の問題点に鑑みて
なされたものであり、一文字中の線の太さの変動があっ
ても線幅に応じた辞書を要することなく、安定した認識
を可能とする文字画像の正規化方法および正規化処理手
段を備えた文字認識装置の提供を目的とする。
The present invention has been made in view of the above-mentioned problems of the prior art, and enables stable recognition without the need of a dictionary corresponding to the line width even if the thickness of a line in one character varies. It is an object of the present invention to provide a character recognition device including a character image normalization method and a normalization processing unit that can be used.

【0011】[0011]

【課題を解決するための手段】上記課題を解決するため
に、第1の発明の文字画像の正規化方法は、入力画像か
ら文字画像を切出して正規化処理を行なった後、正規化
された文字画像に対して文字認識処理を行なう文字認識
装置において、切出された文字画像に細線化処理を施す
工程と、細線化処理後の文字画像の外接矩形を検出して
その大きさにより当該文字画像を拡大正規化するか縮小
正規化するかを判定する工程と、判定結果に基づいて文
字画像の拡大正規化処理または縮小正規化処理を行なう
工程と、拡大正規化処理または縮小正規化処理された文
字画像に対して太め処理を施して所定の太さの線幅の文
字画像とする工程、とを有することを特徴とする。
In order to solve the above-mentioned problems, a character image normalization method according to a first aspect of the present invention extracts a character image from an input image, performs a normalization process, and then performs normalization. In a character recognition device that performs character recognition processing on a character image, a step of performing thinning processing on the cut-out character image, detecting a circumscribed rectangle of the character image after the thinning processing, and determining the size of the A step of determining whether to enlarge or reduce the image by normalizing; a step of performing an enlargement normalization process or a reduction normalization process on the character image based on the determination result; Performing a thickening process on the obtained character image to obtain a character image having a line width of a predetermined thickness.

【0012】また、第2の発明の文字画像の正規化方法
は、入力画像から文字画像を切出して正規化処理を行な
った後、正規化された文字画像に対して文字認識処理を
行なう文字認識装置において、切出された文字画像の外
接矩形を検出してその大きさにより当該文字画像を拡大
正規化するか縮小正規化するかを判定する工程と、判定
結果に基づいて文字画像の拡大正規化処理または縮小正
規化処理を行なう工程と、拡大正規化処理または縮小正
規化処理された文字画像に対して細線化処理を施す工程
と、細線化処理後の文字画像に太め処理を施して所定の
太さの線幅の文字画像とする工程、とを有することを特
徴とする。
According to a second aspect of the present invention, there is provided a character recognition method for extracting a character image from an input image, performing a normalization process, and then performing a character recognition process on the normalized character image. A step of detecting a circumscribed rectangle of the cut-out character image and determining whether to enlarge or reduce the character image based on its size; and Performing thinning processing or reduction normalization processing, performing thinning processing on a character image that has been subjected to enlargement normalization processing or reduction normalization processing, and performing thickening processing on the character image after thinning processing and performing predetermined processing. And forming a character image having a line width of the thickness of the character image.

【0013】また、第3の発明の文字画像の正規化方法
は、入力画像から文字画像を切出して正規化処理を行な
った後、正規化された文字画像に対して文字認識処理を
行なう文字認識装置において、切出された文字画像の外
接矩形を検出する工程と、外接矩形の大きさと外接矩形
に占める文字の画素数の割合から、切出された文字画像
に対して拡大正規化のみを行なうか間引き正規化を行な
うか、細線化を行なうかを判定する工程と、判定結果に
基づいて文字画像の拡大正規化処理、間引き正規化処
理、または細線化処理を行なう工程と、を有し、さら
に、細線化処理の工程の後段に、細線化処理後の文字画
像の外接矩形を検出してその大きさにより当該文字画像
を拡大正規化するか縮小正規化するかを判定する工程
と、判定結果に基づいて細線化された文字画像の拡大正
規化処理または縮小正規化処理を行なう工程と、拡大正
規化処理または縮小正規化処理された文字画像に対して
太め処理を施して所定の太さの線幅の文字画像とする工
程、とを有することを特徴とする。
According to a third aspect of the present invention, there is provided a character recognition method for extracting a character image from an input image, performing a normalization process, and performing a character recognition process on the normalized character image. In the apparatus, a process of detecting a circumscribed rectangle of the cut-out character image and performing only enlargement normalization on the cut-out character image based on the size of the circumscribed rectangle and the ratio of the number of pixels of the character occupying the circumscribed rectangle Or performing thinning normalization, a step of determining whether to perform thinning, and a step of performing enlargement normalization processing, thinning normalization processing, or thinning processing of the character image based on the determination result, Further, after the step of thinning processing, a step of detecting a circumscribed rectangle of the character image after thinning processing and determining whether to enlarge or reduce the character image based on its size, Based on the result A process of performing an enlargement normalization process or a reduction normalization process on the linearized character image; and performing a thickening process on the character image that has been subjected to the enlargement normalization process or the reduction normalization process to obtain a line width of a predetermined thickness. Forming a character image.

【0014】また、第4の発明の文字画像の正規化方法
は、入力画像から文字画像を切出して正規化処理を行な
った後、正規化された文字画像に対して文字認識処理を
行なう文字認識装置において、切出された文字画像の外
接矩形を検出する工程と、外接矩形の大きさと外接矩形
に占める文字の画素数の割合から、切出された文字画像
に対して拡大正規化のみを行なうか間引き正規化のみを
行なうか、拡大正規化,間引き正規化,または縮小化の
いずれを行なうかを判定する工程と、判定結果に基づい
て文字画像の拡大正規化処理、間引き正規化処理、また
は縮小正規化処理を行なう工程と、を有し、さらに、判
定結果が、拡大正規化,間引き正規化,または縮小化の
場合に、対応の、拡大正規化処理、間引き正規化処理、
または縮小正規化処理を行なう工程と、その後段に拡大
正規化処理、間引き正規化処理、または縮小正規化処理
された文字画像に対して細線化処理を行なう工程と、該
細線化された文字画像に太め処理を所定の太さの線幅の
文字画像とする工程、とを有することを特徴とする。
According to a fourth aspect of the present invention, there is provided a character recognition method for extracting a character image from an input image, performing a normalization process, and then performing a character recognition process on the normalized character image. In the apparatus, a process of detecting a circumscribed rectangle of the cut-out character image and performing only enlargement normalization on the cut-out character image based on the size of the circumscribed rectangle and the ratio of the number of pixels of the character occupying the circumscribed rectangle Deciding whether to perform only normalization or thinning normalization, or to perform enlargement normalization, thinning normalization, or reduction, and based on the judgment result, enlargement normalization processing, thinning normalization processing, or Performing a reduction normalization process; and further comprising, when the determination result is expansion normalization, thinning normalization, or reduction, corresponding expansion normalization processing, thinning normalization processing,
Or a step of performing reduction normalization processing, and a step of subsequently performing thinning processing on a character image that has been subjected to enlargement normalization processing, thinning normalization processing, or reduction normalization processing, and a step of performing the thinning character image. Converting the thickening process to a character image having a line width of a predetermined thickness.

【0015】また、第5の発明の文字認識装置は、入力
画像から文字画像を切出して正規化処理を行なった後、
正規化された文字画像に対して文字認識処理を行なう文
字認識装置において、切出された文字画像に細線化処理
を施す細線化処理手段と、細線化処理後の文字画像の外
接矩形を検出してその大きさにより当該文字画像を拡大
正規化するか縮小正規化するかを判定する外接矩形検出
手段と、外接矩形検出手段の判定結果に基づいて文字画
像の拡大正規化処理を行なう拡大正規化手段と、外接矩
形検出手段の判定結果に基づいて文字画像の縮小正規化
処理を行なう縮小正規化手段と、拡大正規化手段または
縮小正規化手段の出力に対して太め処理を施して所定の
太さの線幅の文字画像とする太め処理手段と、からなる
文字正規化手段を有することを特徴とする。
The character recognition device according to a fifth aspect of the present invention cuts out a character image from an input image and performs a normalization process.
In a character recognition device that performs character recognition processing on a normalized character image, a thinning processing unit that performs thinning processing on the cut-out character image and a circumscribed rectangle of the character image after the thinning processing are detected. Circumscribed rectangle detecting means for determining whether to enlarge or reduce the character image in accordance with the size of the character image, and enlargement normalization processing for enlarging and normalizing the character image based on the determination result of the circumscribed rectangle detection means Means, a reduction normalizing means for performing reduction normalization processing of the character image based on the determination result of the circumscribing rectangle detection means, and a thickening processing for applying a thickening processing to the output of the enlargement normalization means or reduction normalization means. And a character normalizing means comprising a thickening means for forming a character image having a line width.

【0016】また、第6の発明の文字認識装置は、入力
画像から文字画像を切出して正規化処理を行なった後、
正規化された文字画像に対して文字認識処理を行なう文
字認識装置において、切出された文字画像の外接矩形を
検出してその大きさにより当該文字画像を拡大正規化す
るか縮小正規化するかを判定する外接矩形検出手段と、
外接矩形検出手段の判定結果に基づいて文字画像の拡大
正規化処理を行なう拡大正規化手段と、外接矩形検出手
段の判定結果に基づいて文字画像の縮小正規化処理を行
なう縮小正規化手段と、拡大正規化手段または縮小正規
化手段の出力に対して細線化処理を施す細線化処理手段
と、細線化処理手段の出力に対して太め処理を施して所
定の太さの線幅の文字画像とする太め処理手段と、から
なる文字正規化手段を有することを特徴とする。
The character recognition apparatus according to a sixth aspect of the present invention cuts out a character image from an input image and performs a normalization process.
In a character recognition device that performs character recognition processing on a normalized character image, whether a circumscribed rectangle of the cut-out character image is detected and whether the character image is enlarged or normalized according to its size Circumscribed rectangle detection means for determining
Enlargement normalizing means for performing enlargement normalization processing of the character image based on the determination result of the circumscribed rectangle detection means; reduction normalization means for performing reduction normalization processing of the character image based on the determination result of the circumscribed rectangle detection means; A thinning processing means for performing thinning processing on the output of the enlargement normalizing means or the reduction normalizing means; and a character image having a line width of a predetermined thickness by performing thickening processing on the output of the thinning processing means. And a character normalizing means comprising:

【0017】また、第7の発明の文字認識装置は、入力
画像から文字画像を切出して正規化処理を行なった後、
正規化された文字画像に対して文字認識処理を行なう文
字認識装置において、切出された文字画像の外接矩形を
検出する第1の外接矩形検出手段と、外接矩形の大きさ
と外接矩形に占める文字の画素数の割合から、切出され
た文字画像に対して拡大正規化のみを行なうか間引き正
規化を行なうか、細線化を行なうかを判定する文字画素
検出手段と、文字画素検出手段の判定結果に基づいて文
字画像の拡大正規化処理を行なう正規化処理手段と、文
字画素検出手段の判定結果に基づいて文字画像の縮小正
規化処理を行なう縮小正規化手段と、文字画素検出手段
の判定結果に基づいて文字画像の細線化処理を行なう細
線化処理手段と、を有し、さらに、細線化処理後の文字
画像の外接矩形を検出してその大きさにより当該文字画
像を拡大正規化するか縮小正規化するかを判定する第2
の外接矩形検出手段と、第2の外接矩形検出手段の判定
結果に基づいて拡大正規化手段または縮小拡大正規化手
段により拡大正規化または縮小正規化された文字画像に
対して太め処理を施して所定の太さの線幅の文字画像と
する太め処理手段とを有する、文字正規化手段を備える
ことを特徴とする。
The character recognition device according to a seventh aspect of the present invention cuts out a character image from an input image and performs a normalization process.
In a character recognition device for performing character recognition processing on a normalized character image, a first circumscribed rectangle detecting means for detecting a circumscribed rectangle of the cut-out character image, a size of the circumscribed rectangle and a character occupying the circumscribed rectangle Character pixel detecting means for determining whether to perform only enlargement normalization, thinning normalization, or thinning of the extracted character image based on the ratio of the number of pixels Normalization processing means for performing an expansion normalization process on the character image based on the result; reduction normalization means for performing a reduction normalization process on the character image based on the determination result of the character pixel detection means; and determination by the character pixel detection means Thinning processing means for performing thinning processing of the character image based on the result, further detecting a circumscribed rectangle of the character image after the thinning processing, and enlarging and normalizing the character image according to the size. Or reduced second determines normalized
And performing a fattening process on the character image enlarged or reduced by the enlargement normalizing means or the reduced enlargement normalizing means based on the determination result of the circumscribed rectangle detection means and the second circumscribed rectangle detection means. A character normalizing unit having a thickening processing unit for forming a character image having a line width of a predetermined thickness.

【0018】また、第8の発明の文字認識装置は、入力
画像から文字画像を切出して正規化処理を行なった後、
正規化された文字画像に対して文字認識処理を行なう文
字認識装置において、切出された文字画像の外接矩形を
検出する外接矩形検出手段と、外接矩形の大きさと外接
矩形に占める文字の画素数の割合から、切出された文字
画像に対して拡大正規化のみを行なうか間引き正規化の
みを行なうか、拡大正規化,間引き正規化,または縮小
化のいずれを行なうかを判定する文字画素検出手段と、
文字画素検出手段の判定結果に基づいて文字画像の拡大
正規化処理を行なう拡大正規化手段と、文字画素検出手
段の判定結果に基づいて文字画像の間引き正規化処理を
行なう間引き正規化手段と、文字画素検出手段の判定結
果に基づいて文字画像の縮小正規化処理を行なう縮小正
規化手段とを有し、さらに、文字画素検出手段の判定結
果が、拡大正規化,間引き正規化,または縮小化の場合
に、拡大正規化処理、間引き正規化処理、または縮小正
規化処理後の文字画像に対して細線化処理を行なう細線
化処理手段と、該細線化された文字画像に太め処理を所
定の太さの線幅の文字画像とする太め処理手段とを有す
る、文字正規化手段を備えることを特徴とする。
The character recognition device according to an eighth aspect of the present invention cuts out a character image from an input image and performs a normalization process.
In a character recognition device that performs a character recognition process on a normalized character image, a circumscribed rectangle detection unit that detects a circumscribed rectangle of the cut-out character image, a size of the circumscribed rectangle, and the number of pixels of the character occupying the circumscribed rectangle Character pixel detection to determine whether to perform only enlargement normalization or only thinning normalization, or to perform enlargement normalization, thinning normalization, or reduction on the extracted character image based on the ratio of Means,
Enlargement normalizing means for performing enlargement normalization processing of a character image based on the determination result of the character pixel detection means, and thinning normalization means for performing thinning normalization processing of the character image based on the determination result of the character pixel detection means; Reduction normalization means for performing a reduction normalization process on the character image based on the determination result of the character pixel detection means, and further comprising a determination result of the character pixel detection means which is enlarged, thinned, or reduced. In the case of (1), thinning processing means for performing thinning processing on the character image after the enlargement normalization processing, thinning normalization processing, or reduction normalization processing, and performing thickening processing on the thinned character image by a predetermined A character normalizing unit having a thick processing unit for forming a character image having a line width of a thickness.

【0019】[0019]

【発明の実施の形態】本発明の文字画像の正規化方法
は、切出された文字画像の線分の外接矩形を検出し、外
接矩形の大きさにより拡大、縮小、間引、または細線化
による正規化処理等て線分の幅をほぼ一定の太さにす
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A character image normalizing method according to the present invention detects a circumscribed rectangle of a line segment of a cut-out character image, and enlarges, reduces, thins out, or thins the line according to the size of the circumscribed rectangle. , The width of the line segment is made substantially constant.

【0020】<実施形態1>本発明の正規化方法の第1
は、切出された文字画像の線分の細線化処理を行なった
後、外接矩形を検出し、外接矩形の大きさにより拡大正
規化または縮小正規化を行ない、得られた線分に太め処
理を施して線分の幅を一定にする。
<Embodiment 1> First of the normalization methods of the present invention
Performs thinning processing of the line segment of the extracted character image, detects the circumscribed rectangle, performs expansion normalization or reduction normalization according to the size of the circumscribed rectangle, and thickens the obtained line segment. To make the line segment width constant.

【0021】図1は、上記第1の正規化方法を適用した
文字認識装置の一実施例の構成図であり、文字認識装置
10は文字切り出し部110、正規化処理ブロック12
0、および文字認識部130から構成され、正規化処理
ブロック120は細線化処理部121、外接矩形検出部
122、拡大正規化部123、OR正規化部124、お
よび太め処理部125を有している。
FIG. 1 is a block diagram showing an embodiment of a character recognition apparatus to which the first normalization method is applied. The character recognition apparatus 10 includes a character cutout unit 110 and a normalization processing block 12.
0, and a character recognition unit 130. The normalization processing block 120 includes a thinning processing unit 121, a circumscribed rectangle detection unit 122, an expansion normalization unit 123, an OR normalization unit 124, and a thick processing unit 125. I have.

【0022】文字切り出し部110はスキャナー等の文
字読取り装置で読み込んだ画像Imから一文字ずつ文字
画像を切出す。
The character extracting section 110 extracts character images one by one from the image Im read by a character reading device such as a scanner.

【0023】正規化処理ブロック120は、切出された
一文字分の画像の線分の細線化処理を行なった後、外接
矩形を検出し、外接矩形の大きさにより拡大正規化また
は縮小正規化を行なってサイズを一定にし、得られた線
分の幅を予め設定された太さにして認識処理部130に
与える。そのために、先ず、細線化処理部121で文字
切り出し部110によって切出された1文字分の文字画
像の細線化処理を行ない、その細線化画像を得る。次
に、細線化処理部121で細線化された画像に対して外
接矩形検出部122でその文字の外接矩形を検出し、外
接矩形の大きさによって、当該文字画像の拡大または縮
小判定を行なう。すなわち、外接矩形検出部122では
外接矩形の大きさをn×mドットとし、n’×m’を文
字画像の正規化サイズとする時、nおよびmがn’より
小さく、かつnおよびmがm’より小さいとき、その文
字画像に拡大処理が必要と判定し、nまたはmの少なく
とも一方がn’或いはnより大きい時、その文字画像に
縮小処理が必要と判定する。
The normalization processing block 120 detects the circumscribed rectangle after performing the thinning process of the line of the extracted image of one character, and performs enlargement normalization or reduction normalization according to the size of the circumscribed rectangle. The size of the line is made constant, and the width of the obtained line segment is set to a predetermined thickness and given to the recognition processing unit 130. For this purpose, first, the thinning processing section 121 performs thinning processing on the character image of one character cut out by the character cutout section 110, and obtains the thinned image. Next, the circumscribed rectangle detection unit 122 detects the circumscribed rectangle of the character from the image thinned by the thinning processing unit 121, and determines the enlargement or reduction of the character image based on the size of the circumscribed rectangle. That is, in the circumscribed rectangle detection unit 122, when the size of the circumscribed rectangle is n × m dots and n ′ × m ′ is the normalized size of the character image, n and m are smaller than n ′, and n and m are smaller than n ′. When it is smaller than m ′, it is determined that the character image needs to be enlarged, and when at least one of n and m is larger than n ′ or n, it is determined that the character image needs to be reduced.

【0024】外接矩形検出部122で拡大判定がなされ
た場合には、拡大正規化部123で細線化処理部122
によって細線化された文字画像を拡大正規化処理してサ
イズが正規化された画像を得る。また、縮小判定がなさ
れた場合には、OR正規化部124で細線化処理部12
2によって細線化された文字画像をOR正規化処理して
サイズが正規化された画像を得る。
If the circumscribed rectangle detection unit 122 determines that the enlargement has been performed, the enlargement normalization unit 123 performs the thinning processing unit 122.
The thinned character image is enlarged and normalized to obtain an image whose size is normalized. If the reduction is determined, the OR normalization unit 124 sets the thinning processing unit 12
The character image thinned by 2 is subjected to OR normalization processing to obtain an image whose size is normalized.

【0025】拡大正規化部123またはOR正規化部1
24でサイズが正規化された文字画像に対して太め処理
部125で文字画像の線分の幅が予め設定された太さに
なるように太め処理を施す。
The expansion normalizing unit 123 or the OR normalizing unit 1
The thickening processing section 125 performs thickening processing on the character image whose size has been normalized at 24 so that the line segment width of the character image becomes a predetermined thickness.

【0026】文字認識部130は、正規化処理ブロック
120で生成された正規化画像をもとに文字の認識を行
ない、その文字コードを認識結果として出力する。
The character recognition unit 130 performs character recognition based on the normalized image generated by the normalization processing block 120, and outputs the character code as a recognition result.

【0027】[実施例]本実施形態の正規化ブロック1
20の一実施例について以下説明する。なお、図5は入
力画像の例を示す図、図6は図5の画像から切出された
文字画像の例を示す図、図7は細線化処理された文字画
像の例を示す図、図8は拡大正規化された文字画像の例
を示す図、図9は正規化された文字画像の例を示す図で
ある。スキャナー等から読み込んだ画像Im(図5)を
1文字分ずつ切り出して線幅が3ドット、大きさが30
×30ドットの文字画像(図9)に正規化する場合を例
とし、文字切り出し部120によって切出された5文字
分の文字画像のうち、ボールペンのペン先にインクが溜
まったため書き始めが太くて途中がかすれている’2’
の文字画像(図6)を正規化する場合について述べる。
[Example] Normalized block 1 of the present embodiment
One embodiment of the invention will now be described. 5 shows an example of an input image, FIG. 6 shows an example of a character image cut out from the image of FIG. 5, and FIG. 7 shows an example of a character image subjected to thinning processing. 8 is a diagram illustrating an example of a character image that has been enlarged and normalized, and FIG. 9 is a diagram illustrating an example of a normalized character image. An image Im (FIG. 5) read from a scanner or the like is cut out one character at a time and has a line width of 3 dots and a size of 30 dots.
In the case of normalizing to a character image of × 30 dots (FIG. 9) as an example, in the character image of five characters cut out by the character cutout unit 120, the writing start is thick because ink is accumulated at the pen tip of the ballpoint pen. '2' with halfway
The case where the character image (FIG. 6) is normalized will be described.

【0028】正規化ブロック120に取り込まれた文
字’2’を現わす文字画像61(図6)は、先ず、細線
化処理部121で細線化処理され、図7に示すような細
線化文字画像となる。次に、外接矩形検出部122で細
線化された文字画像71の外接矩形(図7)を求める
(図7の例では、19×26ドットの外接矩形72を得
た)。ここで、n=19,m=26、n’=30,m’
=30であるから、nおよびmがn’より小さくかつ、
nおよびmがm’より小さいので拡大正規化処理部12
3で文字サイズの拡大正規化を行ない、図8に示すよう
に文字サイズが拡大され正規化された文字画像81を得
る。次に、正規化された文字画像81に対し太め処理部
125で太め処理を行ない、図9に示すような太さが3
ドットで、大きさが30×30ドットの文字画像91を
得る。
The character image 61 (FIG. 6) representing the character "2" taken into the normalization block 120 is first subjected to thinning processing by the thinning processing section 121, and the thinned character image as shown in FIG. Becomes Next, a circumscribed rectangle (FIG. 7) of the character image 71 thinned by the circumscribed rectangle detection unit 122 is obtained (in the example of FIG. 7, a circumscribed rectangle 72 of 19 × 26 dots is obtained). Here, n = 19, m = 26, n ′ = 30, m ′
= 30, so that n and m are smaller than n ′ and
Since n and m are smaller than m ′, the extended normalization processing unit 12
In step 3, the character size is enlarged and normalized, and a character image 81 in which the character size is enlarged and normalized as shown in FIG. 8 is obtained. Next, thickening processing is performed on the normalized character image 81 by the thickening processing unit 125, and the thickness is reduced to 3 as shown in FIG.
A character image 91 having a dot size of 30 × 30 dots is obtained.

【0029】なお、外接矩形検出部122で細線化され
た文字画像の外接矩形が正規化画像の所定サイズn’×
m’ドットより大きい場合(例えば、35×24ドット
とか21ドット×34ドットとか、36×40ドットと
いった場合)には、OR正規化部124でサイズが縮小
された正規化画像を得て、太め処理部125で太め処理
を行ない、所定サイズn’×m’ドット(本例では、3
0×30ドット)の文字画像91を得る。
The circumscribed rectangle of the character image thinned by the circumscribed rectangle detection unit 122 has a predetermined size n ′ ×
If it is larger than m ′ dots (for example, 35 × 24 dots, 21 dots × 34 dots, or 36 × 40 dots), a normalized image whose size has been reduced by the OR normalization unit 124 is obtained, and The thickening process is performed by the processing unit 125, and a predetermined size of n ′ × m ′ dots (3 in this example)
A character image 91 of (0 × 30 dots) is obtained.

【0030】このようにして、正規化処理ブロック12
0で生成された正規化画像(図9)は線分の太さの変化
の大きい部分(例えば、図6に示したような書き始めの
太い部分や、途中でかすれている部分)もほぼ同一の線
幅にされる。従って、文字の幅に対応した複数の辞書を
要することなく、文字認識部130での安定した文字認
識が実現する。
Thus, the normalization processing block 12
In the normalized image (FIG. 9) generated at 0, the portion where the line segment has a large change in thickness (for example, a thick portion at the beginning of writing as shown in FIG. 6 or a portion blurred in the middle) is almost the same. Line width. Therefore, stable character recognition in the character recognition unit 130 is realized without requiring a plurality of dictionaries corresponding to character widths.

【0031】<実施形態2>本発明の正規化方法の第2
は、切出された文字画像の外接矩形を検出し、外接矩形
の大きさにより拡大正規化または縮小正規化を行なった
後、入力画像の線分の細線化処理を行なって得られた線
分の幅をほぼ一定の太さにする。
<Embodiment 2> Second embodiment of the normalization method of the present invention
Is a line segment obtained by detecting a circumscribed rectangle of a cut-out character image, performing expansion normalization or reduction normalization according to the size of the circumscribed rectangle, and then performing line thinning processing of an input image. To a substantially constant width.

【0032】図2は、上記第2の正規化方法を適用した
文字認識装置の一実施例の構成図であり、文字認識装置
20は文字切り出し部110、正規化処理ブロック22
0、および文字認識部130から構成され、正規化処理
ブロック220は、外接矩形検出部221、拡大正規化
部222、OR正規化部223、細線化処理部224、
および太め処理部225を有している。
FIG. 2 is a block diagram of an embodiment of a character recognition apparatus to which the second normalization method is applied. The character recognition apparatus 20 includes a character cutout unit 110 and a normalization processing block 22.
0, and a character recognition unit 130. The normalization processing block 220 includes a circumscribed rectangle detection unit 221, an expansion normalization unit 222, an OR normalization unit 223, a thin line processing unit 224,
And a thick processing unit 225.

【0033】文字切り出し部110はスキャナー等の文
字読取り装置で読み込んだ画像Imから一文字ずつ文字
画像を切出す(図6)。
The character extracting section 110 extracts character images one by one from the image Im read by a character reading device such as a scanner (FIG. 6).

【0034】正規化処理ブロック220は、一文字分の
画像の外接矩形を検出して外接矩形の大きさにより拡大
正規化または縮小正規化を行なった後、切出された一文
字分の画像の線分の細線化処理を行ない、得られた線分
の幅を予め設定された太さにして認識処理部130に与
える。そのために、先ず、文字切り出し部110によっ
て切出された文字画像に対して外接矩形検出部221で
その文字の外接矩形を検出し、外接矩形の大きさによっ
て、その画像の拡大または縮小判定を行なう。なお、拡
大/縮小判定の方法は実施形態1の外接矩形検出部12
1と同様でよい。
The normalization processing block 220 detects a circumscribed rectangle of the image of one character, performs enlargement normalization or reduction normalization according to the size of the circumscribed rectangle, and then extracts a line segment of the extracted image of one character. Is performed, and the width of the obtained line segment is set to a predetermined thickness and given to the recognition processing unit 130. For this purpose, first, the circumscribed rectangle detection unit 221 detects the circumscribed rectangle of the character from the character image cut out by the character cutout unit 110, and determines whether to enlarge or reduce the image based on the size of the circumscribed rectangle. . Note that the enlargement / reduction determination method is the same as the circumscribed rectangle detection unit 12 in the first embodiment.
It may be the same as 1.

【0035】外接矩形検出部221で拡大判定がなされ
た場合には、拡大正規化部222で当該画像を拡大正規
化処理して拡大し、サイズが正規化された文字画像を得
る。また、縮小判定がなされた場合には、OR正規化部
223で当該画像をOR正規化処理してサイズが正規化
された文字画像を得る。
If the circumscribed rectangle detection unit 221 determines enlargement, the enlargement normalization unit 222 enlarges the image by enlargement normalization processing and enlarges it to obtain a character image whose size is normalized. When the reduction is determined, the image is OR-normalized by the OR normalizing unit 223 to obtain a character image whose size is normalized.

【0036】上記拡大正規化部222またはOR正規化
部223でサイズが正規化された文字画像に対して細線
化処理部221で細線化処理を行ない、その細線化画像
を得る。そして、細線化処理部221で細線化された文
字画像に対して太め処理部225で予め設定された太さ
になるようにする。
The thinning processing unit 221 performs thinning processing on the character image whose size has been normalized by the enlargement normalizing unit 222 or the OR normalizing unit 223, and obtains the thinned image. Then, the thickening processing unit 225 sets the thickness of the character image thinned by the thinning processing unit 221 to a preset thickness.

【0037】文字認識部130は、正規化処理ブロック
220で生成された正規化画像をもとに文字の認識を行
ない、その文字コードを認識結果として出力する。
The character recognizing section 130 performs character recognition based on the normalized image generated by the normalization processing block 220, and outputs the character code as a recognition result.

【0038】これにより、実施形態1の場合と同様に、
正規化処理ブロック220で生成された正規化画像(図
9)は線分の太さの変化の大きい部分もほぼ同一の線幅
にされる。従って、文字の幅に対応した複数の辞書を要
することなく、文字認識部130での安定した文字認識
が実現する。
Thus, similar to the first embodiment,
In the normalized image (FIG. 9) generated in the normalization processing block 220, a portion where a change in the thickness of the line segment is large has almost the same line width. Therefore, stable character recognition in the character recognition unit 130 is realized without requiring a plurality of dictionaries corresponding to character widths.

【0039】<実施形態3>本発明の正規化方法の第3
は、切出された文字画像の外接矩形を検出し、文字画像
の画素数が外接矩形に占める割合の大小によって、間引
き正規化、拡大正規化または縮小正規化を行なった後、
拡大正規化または縮小正規化を行なった文字画像につい
ては太め処理を施し、線分の幅をほぼ一定の太さにし、
間引き正規化行なった文字画像はそのまま出力する。な
お、文字の線幅を一定にしなくても文字認識に悪影響を
与えない場合、すなわち、外接矩形が所定値Cより大き
い場合については太め処理を施すことなく、サイズの間
引き処理を行なう。また、外接矩形の大きさが所定値D
とCの間にある場合についても太め処理を施すことなく
サイズの拡大正規化処理を行なって処理速度を高める。
<Embodiment 3> Third embodiment of the normalization method of the present invention
Detects the circumscribed rectangle of the extracted character image, and performs thinning normalization, enlargement normalization, or reduction normalization according to the ratio of the number of pixels of the character image to the circumscribed rectangle.
Thickness processing is performed on the character image that has been subjected to enlargement normalization or reduction normalization, so that the width of the line segment is almost constant,
The character image subjected to thinning-out normalization is output as it is. In addition, when the line width of the character is not fixed, the character recognition is not adversely affected, that is, when the circumscribed rectangle is larger than the predetermined value C, the size thinning process is performed without performing the thickening process. Also, the size of the circumscribed rectangle is a predetermined value D
Also in the case between C and C, the processing speed is increased by performing size expansion normalization processing without performing thickening processing.

【0040】図3は、上記第3の正規化方法を適用した
文字認識装置の一実施例の構成図であり、文字認識装置
30は文字切り出し部110、正規化処理ブロック32
0、および文字認識部130から構成され、正規化処理
ブロック320は、外接矩形検出部321、文字画素検
出部322、細線化処理部323、外接矩形検出部32
4、拡大正規化部325、OR正規化部326、間引き
処理部327、および太め処理部328を有している。
FIG. 3 is a block diagram of an embodiment of a character recognition apparatus to which the third normalization method is applied. The character recognition apparatus 30 includes a character cutout unit 110 and a normalization processing block 32.
0, and a character recognition unit 130. The normalization processing block 320 includes a circumscribed rectangle detection unit 321, a character pixel detection unit 322, a thin line processing unit 323, and a circumscribed rectangle detection unit 32.
4, an expansion normalizing unit 325, an OR normalizing unit 326, a thinning processing unit 327, and a thickening processing unit 328.

【0041】文字切り出し部110はスキャナー等の文
字読取り装置で読み込んだ画像Imから一文字ずつ文字
画像を切り出す。
The character extracting section 110 extracts character images one by one from the image Im read by a character reading device such as a scanner.

【0042】正規化処理ブロック320は、一文字分の
画像の外接矩形を検出して、文字画像の画素数が外接矩
形に占める割合の大小によって、間引き正規化、拡大正
規化または縮小正規化を行なった後、拡大正規化または
縮小正規化を行なった文字画像については太め処理を施
し、得られた線分の幅を予め設定された太さにして認識
処理部130に与える。なお、文字の線幅を一定にしな
くても文字認識に悪影響を与えない場合、すなわち、外
接矩形が所定値Cより大きい場合については太め処理を
施すことなく、サイズの間引き処理を行ない、文字認識
部130に出力する。また、外接矩形の大きさが所定値
DとCの間にある場合についても太め処理を施すことな
くサイズの拡大正規化処理を行ない、文字認識部130
に出力する。
The normalization processing block 320 detects a circumscribed rectangle of the image of one character, and performs thinning normalization, enlargement normalization, or reduction normalization according to the ratio of the number of pixels of the character image to the circumscribed rectangle. After that, the character image subjected to the enlargement normalization or the reduction normalization is subjected to a thickening process, and the obtained line segment is given to the recognition processing unit 130 with a predetermined width. Note that if the character line width is not fixed and the character recognition is not adversely affected, that is, if the circumscribed rectangle is larger than the predetermined value C, the size is thinned without performing the thickening process, and the character recognition is performed. Output to the unit 130. Also, in the case where the size of the circumscribed rectangle is between the predetermined values D and C, the enlargement normalization process is performed without performing the thickening process, and the character recognition unit 130
Output to

【0043】そのために、外接矩形検出部321は、文
字切り出し部310で切り出された1文字分の文字画像
に対し文字の外接矩形を検出する。
For this purpose, the circumscribed rectangle detection unit 321 detects a circumscribed rectangle of a character in the character image of one character cut out by the character cutout unit 310.

【0044】文字画素検出部322は、文字切り出し部
310で切り出した1文字分の文字画像の文字の画素数
を検出すると共に、外接矩形検出部321で検出された
外接矩形に対する文字画素の占める割合(以下、画素率
R)を検出する。そして、外接矩形の大きさをLとし、
A、B、C、Dを閾値とするとき、A≦R≦Bで、かつ
L>Cのとき、当該文字画素に対し間引き正規化のみを
行なうと判定し、A≦R≦Bで、かつD≦L≦Cのと
き、当該文字画素に対し拡大正規化のみを行なうと判定
し、A≦R≦Bで、かつL<Dのとき、または、R<A
またはR>Bのとき、当該文字画素に対し細線化処理を
行なうと判定する。
The character pixel detecting section 322 detects the number of pixels of the character in the character image of one character cut out by the character cutout section 310 and the ratio of the character pixel to the circumscribed rectangle detected by the circumscribed rectangle detection section 321. (Hereinafter, pixel ratio R) is detected. Then, let the size of the circumscribed rectangle be L,
When A, B, C, and D are threshold values, when A ≦ R ≦ B and L> C, it is determined that only the thinning normalization is performed on the character pixel, A ≦ R ≦ B, and When D ≦ L ≦ C, it is determined that only the enlargement normalization is performed on the character pixel. When A ≦ R ≦ B and L <D, or R <A
Alternatively, when R> B, it is determined that thinning processing is to be performed on the character pixel.

【0045】細線化処理部323は、文字画素検出部3
22で細線化処理を行なうと判定された場合に、文字切
り出し部110によって切出された1文字分の文字画像
の細線化処理を行ない、その細線化画像を得る。次に、
細線化処理部121で細線化された文字画像に対して外
接矩形検出部324でその文字の外接矩形を検出し、外
接矩形の大きさによって、その画像の拡大または縮小判
定を行なう。なお、拡大/縮小判定の方法は実施形態1
の外接矩形検出部121と同様でよい。
The thinning processing section 323 includes the character pixel detecting section 3
If it is determined at 22 that the thinning processing is to be performed, the thinning processing of the character image of one character cut out by the character cutout unit 110 is performed to obtain the thinned image. next,
The circumscribed rectangle detecting unit 324 detects the circumscribed rectangle of the character from the thinned character image in the thinning processing unit 121, and determines the enlargement or reduction of the image based on the size of the circumscribed rectangle. Note that the method of enlargement / reduction determination is described in the first embodiment.
May be the same as the circumscribed rectangle detection unit 121.

【0046】拡大正規化部325は、文字画素検出部3
22または外接矩形検出部324で拡大判定がなされた
文字画像に対し、拡大正規化処理を施してサイズが正規
化された画像を得る。
The enlargement normalizing section 325 includes the character pixel detecting section 3
Enlargement normalization processing is performed on the character image whose enlargement is determined by the circumscribed rectangle detection unit 224 or the circumscribed rectangle detection unit 324 to obtain an image whose size is normalized.

【0047】OR正規化部326は、外接矩形検出部3
24で縮小判定がなされた文字画像に対し、OR正規化
処理を施してサイズが正規化された画像を得る。
The OR normalizing section 326 outputs the circumscribed rectangle detecting section 3
An OR normalization process is performed on the character image for which reduction has been determined in 24 to obtain an image whose size has been normalized.

【0048】間引き正規化部327は、文字画素検出部
322で間引き判定がなされた文字画像に対し、間引き
正規化処理を施してサイズが正規化された画像を得る。
The thinning-out normalizing section 327 performs thinning-out normalization processing on the character image for which thinning-out determination has been made by the character pixel detecting section 322 to obtain an image whose size has been normalized.

【0049】太め処理部328では、拡大正規化部32
5またはOR正規化部326でサイズが正規化された画
像に対して画像の線分の幅が予め設定された太さになる
ように太め処理を施して文字認識部130に出力する。
なお、文字画素検出部322で拡大正規化のみを行なう
と判定された文字画像については拡大正規化部325で
の拡大正規化処理後、太め処理を施すことなく文字認識
部130に出力する。また、同様に、文字画素検出部3
22で間引き処理を行なうと判定された文字画像につい
ては間引き正規化部327での拡大正規化処理後、太め
処理を施すことなく文字認識部130に出力する。
In the thickening processing section 328, the expansion normalizing section 32
5 or the image normalized in size by the OR normalizing unit 326 is subjected to a thickening process so that the width of the line segment of the image becomes a predetermined thickness, and is output to the character recognition unit 130.
Note that the character image that has been determined by the character pixel detection unit 322 to perform only enlargement normalization is output to the character recognition unit 130 without performing the thickening process after the enlargement normalization process performed by the enlargement normalization unit 325. Similarly, the character pixel detection unit 3
The character image determined to perform the thinning process in 22 is output to the character recognition unit 130 without performing the thickening process after the enlargement normalization process in the thinning normalization unit 327.

【0050】文字認識部130は、正規化処理ブロック
320から出力された正規化画像または間引き処理後の
画像をもとに文字の認識を行ない、その文字コードを認
識結果として出力する。
The character recognizing unit 130 performs character recognition based on the normalized image output from the normalization processing block 320 or the image after the thinning processing, and outputs the character code as a recognition result.

【0051】これにより、実施形態1の場合と同様に、
正規化処理ブロック320から出力された正規化画像は
線分の太さの変化の大きい部分もほぼ同一の線幅にされ
る。従って、文字の線幅に対応した複数の辞書を要する
ことなく文字認識部130での安定した文字認識が実現
する。
Thus, similar to the first embodiment,
In the normalized image output from the normalization processing block 320, even a portion where the line segment has a large change in thickness is made to have substantially the same line width. Therefore, stable character recognition in the character recognition unit 130 is realized without requiring a plurality of dictionaries corresponding to the line width of characters.

【0052】<実施形態4>本発明の正規化方法の第4
は、切出された文字画像の外接矩形を検出し、文字画像
の画素数が外接矩形に占める割合の大小によって、拡大
正規化、OR正規化または間引き正規化を行なった後、
それら正規化画像に細線化処理等を施し、更に、太め処
理を施して線分の幅をほぼ一定の太さにする。なお、文
字の線幅を一定の太さにしなくても文字認識に悪影響を
与えない場合、すなわち、外接矩形に対する文字の画素
数の占める割合が所定値Eより小さく、かつ当該外接矩
形の大きさが所定値Fより小さい場合については太め処
理を施すとなく当該文字画像サイズの間引き処理を行な
う。また、外接矩形に対する文字の画素数の占める割合
が所定値GとHの間にある場合についても太め処理を施
すことなく、サイズの拡大正規化処理を行なって処理速
度を高める。
<Embodiment 4> A fourth embodiment of the normalization method of the present invention.
After detecting the circumscribed rectangle of the extracted character image, and performing enlargement normalization, OR normalization, or thinning normalization according to the ratio of the number of pixels of the character image to the circumscribed rectangle,
The normalized image is subjected to a thinning process and the like, and further subjected to a thickening process to make the width of the line segment almost constant. If the character line width does not have a certain thickness and does not adversely affect character recognition, that is, the ratio of the number of pixels of the character to the circumscribed rectangle is smaller than the predetermined value E, and the size of the circumscribed rectangle is Is smaller than the predetermined value F, the thinning process is performed without performing the thickening process. Even when the ratio of the number of pixels of the character to the circumscribed rectangle is between the predetermined values G and H, the processing speed is increased by performing the size expansion normalization processing without performing the thickening processing.

【0053】図4は、上記第4の正規化方法を適用した
文字認識装置の一実施例の構成図であり、文字認識装置
40は文字切り出し部110、正規化処理ブロック42
0、および文字認識部130から構成され、正規化処理
ブロック420は、外接矩形検出部421、文字画素検
出部422、拡大正規化部423、OR正規化部42
4、間引き処理部425、細線化処理部426および太
め処理部427を有している。
FIG. 4 is a block diagram of an embodiment of a character recognition apparatus to which the above-described fourth normalization method is applied. The character recognition apparatus 40 includes a character cutout unit 110 and a normalization processing block 42.
0, and the character recognition unit 130. The normalization processing block 420 includes a circumscribed rectangle detection unit 421, a character pixel detection unit 422, an enlarged normalization unit 423, and an OR normalization unit 42.
4, a thinning section 425, a thinning section 426, and a thickening section 427.

【0054】文字切り出し部110はスキャナー等の文
字読取り装置で読み込んだ画像Imから一文字ずつ文字
画像を切り出す。
The character extracting section 110 extracts character images one by one from the image Im read by a character reading device such as a scanner.

【0055】正規化処理ブロック420は、一文字分の
画像の外接矩形を検出して、文字画像の画素数が外接矩
形に占める割合の大小によって、拡大正規化、OR正規
化または間引き正規化を行なった後、それら正規化画像
に細線化処理等を施し、更に、太め処理を施して文字認
識部130に出力する。なお、文字の線幅を一定の太さ
にしなくても文字認識に悪影響を与えない場合、すなわ
ち、外接矩形に対する文字の画素数の占める割合が所定
値Eより小さく、かつ当該外接矩形の大きさが所定値F
より小さい場合については太め処理を施すとなく当該文
字画像サイズの間引き処理を行なう。また、外接矩形に
対する文字の画素数の占める割合が所定値GとHの間に
ある場合についても太め処理を施すことなく、サイズの
拡大正規化処理を行なって文字認識部130に出力す
る。
The normalization processing block 420 detects a circumscribed rectangle of an image of one character, and performs enlargement normalization, OR normalization, or thinning normalization according to the ratio of the number of pixels of the character image to the circumscribed rectangle. After that, the normalized images are subjected to thinning processing and the like, and further subjected to thickening processing and output to the character recognition unit 130. If the character line width does not have a certain thickness and does not adversely affect character recognition, that is, the ratio of the number of pixels of the character to the circumscribed rectangle is smaller than the predetermined value E, and the size of the circumscribed rectangle is Is the predetermined value F
If it is smaller, the thinning process is performed without performing the thickening process. In addition, even when the ratio of the number of pixels of the character to the circumscribed rectangle is between the predetermined values G and H, the enlargement normalization process is performed without performing the thickening process, and the result is output to the character recognition unit 130.

【0056】そのために、先ず、文字切り出し部110
によって切出された文字画像に対して外接矩形検出部4
21でその文字の外接矩形を検出し、外接矩形の大きさ
によって、その画像の拡大または縮小判定を行なう。な
お、拡大/縮小判定の方法は実施形態1の外接矩形検出
部121と同様でよい。
For this purpose, first, the character extracting unit 110
Circumscribed rectangle detection unit 4 for the character image cut out by
At 21 the circumscribed rectangle of the character is detected, and the enlargement or reduction of the image is determined based on the size of the circumscribed rectangle. The enlargement / reduction determination method may be the same as that of the circumscribed rectangle detection unit 121 of the first embodiment.

【0057】文字画素検出部422は、文字切り出し部
110で切り出した1文字分の文字画像の文字の画素数
を検出すると共に、外接矩形検出部421で検出された
外接矩形に対する文字画素の占める割合(以下、画素率
R)を検出する。そして、外接矩形の大きさをLとし、
E、F、G、Hを閾値とするとき、R≧E、または、外
接矩形検出部421で拡大判定されていた場合でL<F
のとき、当該文字画素に対し拡大正規化を行なった後に
細線化処理を行なうものと判定し、R<Eで、かつ外接
矩形検出部421で拡大判定されていた場合で、L≧F
のとき、当該文字画素に対し拡大正規化のみを行なうと
判定し、R<Gで、かつ外接矩形検出部421で縮小判
定されていた場合に、当該文字画素に対しOR正規化を
行なった後に細線化処理を行なうものと判定し、R>H
で、かつ外接矩形検出部421で縮小判定されていた場
合に、当該文字画素に対し間引き正規化を行なった後に
細線化処理を行なうものと判定し、G≦R≦Hで、かつ
外接矩形検出部421で縮小判定されていた場合に、当
該文字画素に対し間引き正規化のみを行うものと判定す
る。
The character pixel detecting section 422 detects the number of pixels of the character in the character image of one character cut out by the character cutout section 110 and the ratio of the character pixel to the circumscribed rectangle detected by the circumscribed rectangle detecting section 421. (Hereinafter, pixel ratio R) is detected. Then, let the size of the circumscribed rectangle be L,
When E, F, G, and H are set as threshold values, R ≧ E, or L <F when the circumscribed rectangle detection unit 421 determines that the enlargement is performed.
, It is determined that the thinning processing is performed after performing the expansion normalization on the character pixel. If R <E and the circumscribed rectangle detection unit 421 determines that the character is enlarged, L ≧ F
When it is determined that only the expansion normalization is performed on the character pixel and R <G and the circumscribed rectangle detection unit 421 determines that the character pixel is reduced, after performing OR normalization on the character pixel, It is determined that thinning processing is to be performed, and R> H
If the circumscribed rectangle detection unit 421 determines that the character pixel has been reduced, it is determined that thinning processing is to be performed after thinning normalization is performed on the character pixel. When the reduction is determined by the unit 421, it is determined that only the thinning-out normalization is performed on the character pixel.

【0058】拡大正規化部423は、文字画素検出部4
22で拡大正規化の判定がなされた文字画像に対し、拡
大正規化処理を施してサイズが正規化された画像を得
る。
The enlargement normalizing section 423 includes the character pixel detecting section 4
An enlargement normalization process is performed on the character image for which enlargement normalization has been determined in 22 to obtain an image whose size has been normalized.

【0059】OR正規化部424は、文字画素検出部4
22でOR正規化の判定がなされた文字画像に対し、O
R正規化処理を施してサイズが正規化された画像を得
る。
The OR normalizing section 424 is provided for the character pixel detecting section 4
For the character image for which the OR normalization was determined in step 22,
An image whose size is normalized by performing R normalization processing is obtained.

【0060】間引き正規化部425は、文字画素検出部
422で間引き正規化判定がなされた文字画像に対し、
間引き正規化処理を施してサイズが正規化された画像を
得る。
The thinning-out normalizing section 425 applies the character image for which the thinning-out normalization is determined by the character pixel detecting section 422 to
An image whose size is normalized by performing the thinning normalization process is obtained.

【0061】細線化処理部426は、文字画素検出部4
22で細線化処理を行なうと判定された場合に、拡大正
規化部423,OR正規化部424,または間引き正規
化部でサイズの正規化が行なわれた文字画像に対し、細
線化処理を行ない、その細線化画像を得る。太め処理部
427では、細線化処理部426で得た細線化画像に対
して画像の線分の幅が予め設定された太さになるように
太め処理を施す。なお、文字画素検出部422で拡大正
規化のみを行なうと判定された文字画像については拡大
正規化部423での拡大正規化処理後、細線化処理及び
太め処理を施すことなく文字認識部130に出力する。
また、同様に、文字画素検出部422で間引き処理を行
なうと判定された文字画像については間引き正規化部4
25での拡大正規化処理後、細線化処理および太め処理
を施すことなく文字認識部130に出力する。
The thinning processing section 426 includes the character pixel detecting section 4
If it is determined at 22 that thinning processing is to be performed, thinning processing is performed on the character image whose size has been normalized by the enlargement normalizing section 423, the OR normalizing section 424, or the thinning-out normalizing section. To obtain the thinned image. The thickening processing section 427 performs thickening processing on the thinned image obtained by the thinning processing section 426 so that the width of the line segment of the image becomes a predetermined thickness. Note that the character image determined by the character pixel detection unit 422 to be subjected to only the enlargement normalization is subjected to the enlargement normalization process by the enlargement normalization unit 423 and then to the character recognition unit 130 without performing the thinning process and the thickening process. Output.
Similarly, for a character image determined to be subjected to the thinning process by the character pixel detecting unit 422, the thinning normalizing unit 4
After the enlargement normalization process in step S25, the data is output to the character recognition unit 130 without performing the thinning process and the thickening process.

【0062】文字認識部130は、正規化処理ブロック
420で生成された正規化画像をもとに文字の認識を行
ない、その文字コードを認識結果として出力する。
The character recognition unit 130 performs character recognition based on the normalized image generated by the normalization processing block 420, and outputs the character code as a recognition result.

【0063】これにより、実施形態1の場合と同様に、
正規化処理ブロック420で生成された正規化画像は線
分の太さの変化の大きい部分もほぼ同一の線幅にされ
る。従って、文字の線幅に対応した複数の辞書を要する
ことなく文字認識部130での安定した文字認識が実現
する。
Thus, similar to the first embodiment,
In the normalized image generated in the normalization processing block 420, a portion where a change in the thickness of the line segment is large has almost the same line width. Therefore, stable character recognition in the character recognition unit 130 is realized without requiring a plurality of dictionaries corresponding to the line width of characters.

【0064】[0064]

【発明の効果】本発明の文字画像正規化方法および文字
認識装置によれば、文字画像の文字の線幅をほぼ一定に
できるので、従来技術のように文字の線幅に対応した複
数の辞書を要することなく、文字認識部での安定した文
字認識が実現でき文字認識の信頼性が向上した。
According to the character image normalizing method and character recognition device of the present invention, the line width of characters in a character image can be made substantially constant. , And stable character recognition by the character recognition unit can be realized, thereby improving the reliability of character recognition.

【図面の簡単な説明】[Brief description of the drawings]

【図1】第1の正規化方法を適用した文字認識装置の一
実施例の構成図である。
FIG. 1 is a configuration diagram of an embodiment of a character recognition device to which a first normalization method is applied.

【図2】第2の正規化方法を適用した文字認識装置の一
実施例の構成図である。
FIG. 2 is a configuration diagram of an embodiment of a character recognition device to which a second normalization method is applied.

【図3】第3の正規化方法を適用した文字認識装置の一
実施例の構成図である。
FIG. 3 is a configuration diagram of an embodiment of a character recognition device to which a third normalization method is applied.

【図4】第4の正規化方法を適用した文字認識装置の一
実施例の構成図である。
FIG. 4 is a configuration diagram of an embodiment of a character recognition device to which a fourth normalization method is applied.

【図5】読み込み画像Imの一例を示す図である。FIG. 5 is a diagram illustrating an example of a read image Im.

【図6】図5の画像から切出された文字画像を示す図で
ある。
FIG. 6 is a diagram showing a character image cut out from the image of FIG. 5;

【図7】細線化処理された文字画像の例を示す図であ
る。
FIG. 7 is a diagram illustrating an example of a character image subjected to a thinning process.

【図8】拡大正規化された文字画像の例を示す図であ
る。
FIG. 8 is a diagram illustrating an example of an enlarged and normalized character image.

【図9】正規化された文字画像の例を示す図である。FIG. 9 is a diagram illustrating an example of a normalized character image.

【符号の説明】[Explanation of symbols]

61 入力画像 71 文字画像 81 拡大正規化された文字画像 91 所定の線幅の文字画像 121,224,323,426 細線化処理手段 122,221,422 外接矩形検出部 123,222,325,423 拡大正規化部 124,223,326,424 OR正規化部(縮小
正規化部) 321 外接矩形検出部(第1の外接矩形検出部) 324 外接矩形検出部(第2の外接矩形検出部) 327,425 間引き正規化部 328,427 太め処理部
61 Input Image 71 Character Image 81 Enlarged and Normalized Character Image 91 Character Image of Predetermined Line Width 121, 224, 323, 426 Thinning Processing Unit 122, 221, 422 Bounding Rectangle Detection Unit 123, 222, 325, 423 Enlarge Normalizing sections 124, 223, 326, 424 OR normalizing section (reduced normalizing section) 321 circumscribed rectangle detection section (first circumscribed rectangle detection section) 324 circumscribed rectangle detection section (second circumscribed rectangle detection section) 327, 425 Thinning-out normalization section 328, 427 Thick processing section

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像に細線化処理を施す工程と、 細線化処理後の文字画像の外接矩形を検出してその大き
さにより当該文字画像を拡大正規化するか縮小正規化す
るかを判定する工程と、 上記判定結果に基づいて前記文字画像の拡大正規化処理
または縮小正規化処理を行なう工程と、 上記、拡大正規化処理または縮小正規化処理された文字
画像に対して太め処理を施して所定の太さの線幅の文字
画像とする工程、とを有することを特徴とする文字画像
の正規化方法。
1. A character recognition device for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image. And a step of detecting a circumscribed rectangle of the character image after the thinning process and determining whether to enlarge or reduce the character image based on the size of the circumscribed rectangle. A step of performing enlargement normalization processing or reduction normalization processing of the character image; and performing a fattening processing on the character image subjected to the enlargement normalization processing or reduction normalization processing to obtain a character image having a line width of a predetermined thickness. A normalization method for a character image.
【請求項2】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像の外接矩形を検出してその大きさに
より当該文字画像を拡大正規化するか縮小正規化するか
を判定する工程と、 上記判定結果に基づいて前記文字画像の拡大正規化処理
または縮小正規化処理を行なう工程と、 上記、拡大正規化処理または縮小正規化処理された文字
画像に対して細線化処理を施す工程と、 上記細線化処理後の文字画像に太め処理を施して所定の
太さの線幅の文字画像とする工程、とを有することを特
徴とする文字画像の正規化方法。
2. A character recognition apparatus for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image. Detecting and determining whether to enlarge or reduce the character image based on the size of the character image, and performing an enlargement normalization process or a reduction normalization process on the character image based on the determination result. A step of performing a thinning process on the character image that has been subjected to the enlargement normalization process or the reduction normalization process; and performing a thickening process on the character image after the thinning process to obtain a character having a predetermined width. Converting the character image into an image.
【請求項3】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像の外接矩形を検出する工程と、 前記外接矩形の大きさと前記外接矩形に占める文字の画
素数の割合から、前記切出された文字画像に対して拡大
正規化のみを行なうか間引き正規化を行なうか、細線化
を行なうかを判定する工程と、 上記判定結果に基づいて前記文字画像の拡大正規化処
理、間引き正規化処理、または細線化処理を行なう工程
と、を有し、 さらに、上記細線化処理の工程の後段に、細線化処理後
の文字画像の外接外接矩形を検出してその大きさにより
当該文字画像を拡大正規化するか縮小正規化するかを判
定する工程と、 上記判定結果に基づいて前記細線化された文字画像の拡
大正規化処理または縮小正規化処理を行なう工程と、 上記、拡大正規化処理または縮小正規化処理された文字
画像に対して太め処理を施して所定の太さの線幅の文字
画像とする工程、とを有することを特徴とする文字画像
の正規化方法。
3. A character recognition device for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image. Detecting, based on the size of the circumscribed rectangle and the ratio of the number of pixels of the character occupying the circumscribed rectangle, to perform only the enlargement normalization or the thinning normalization on the cut-out character image, And performing a normalization process of enlargement, thinning-out normalization, or thinning of the character image based on the result of the determination. In the subsequent stage, a step of detecting a circumscribed circumscribed rectangle of the character image after the thinning process, and determining whether to enlarge or normalize the character image based on the size of the circumscribed rectangle, based on the determination result, Fine Performing an enlargement normalization process or a reduction normalization process on the converted character image; and performing a thickening process on the character image subjected to the enlargement normalization process or the reduction normalization process to obtain a line width having a predetermined thickness. A character image normalizing method.
【請求項4】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像の外接矩形を検出する工程と、 前記外接矩形の大きさと前記外接矩形に占める文字の画
素数の割合から、前記切出された文字画像に対して拡大
正規化のみを行なうか間引き正規化のみを行なうか、拡
大正規化,間引き正規化,または縮小化のいずれを行な
うかを判定する工程と、 上記判定結果に基づいて前記文字画像の拡大正規化処
理、間引き正規化処理、または縮小正規化処理を行なう
工程と、を有し、 さらに、上記判定結果が、拡大正規化,間引き正規化,
または縮小化の場合に、対応の、拡大正規化処理、間引
き正規化処理、または縮小正規化処理を行なう工程と、
その後段に拡大正規化処理、間引き正規化処理、または
縮小正規化処理された文字画像に対して細線化処理を行
なう工程と、該細線化された文字画像に太め処理を所定
の太さの線幅の文字画像とする工程、とを有することを
特徴とする文字画像の正規化方法。
4. A character recognition device for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image. Detecting, from the size of the circumscribed rectangle and the ratio of the number of pixels of the character occupying the circumscribed rectangle, to perform only enlargement normalization or only thinning normalization on the cut-out character image, Determining whether to perform normalization, thinning normalization, or reduction; and performing enlargement normalization processing, thinning normalization processing, or reduction normalization processing of the character image based on the determination result. In addition, the above-mentioned determination result is obtained by expanding normalization, thinning normalization,
Or in the case of reduction, performing a corresponding expansion normalization process, thinning normalization process, or reduction normalization process;
In the subsequent stage, a process of performing a thinning process on the character image that has been subjected to the expansion normalization process, the thinning normalization process, or the reduction normalization process, and performing a thickening process on the thinned character image with a line having a predetermined thickness Forming a character image having a width.
【請求項5】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像に細線化処理を施す細線化処理手段
と、 細線化処理後の文字画像の外接矩形を検出してその大き
さにより当該文字画像を拡大正規化するか縮小正規化す
るかを判定する外接矩形検出手段と、 上記外接矩形検出手段の判定結果に基づいて前記文字画
像の拡大正規化処理を行なう拡大正規化手段と、 上記外接矩形検出手段の判定結果に基づいて前記文字画
像の縮小正規化処理を行なう縮小正規化手段と、 上記、拡大正規化手段または縮小正規化手段の出力に対
して太め処理を施して所定の太さの線幅の文字画像とす
る太め処理手段と、からなる文字正規化手段を有するこ
とを特徴とする文字認識装置。
5. A character recognition apparatus for extracting a character image from an input image, performing a normalization process, and then performing a character recognition process on the normalized character image, wherein a thinning process is performed on the extracted character image. Circumscribing rectangle detecting means for detecting a circumscribed rectangle of the character image after the thinning processing, and determining whether to enlarge or normalize the character image based on the size of the circumscribed rectangle; Enlarging normalizing means for performing enlarging and normalizing processing of the character image based on the determination result of the circumscribing rectangle detecting means; and reducing normalization for performing reducing and normalizing processing of the character image based on the judging result of the circumscribing rectangle detecting means. Means for thickening the output of the enlargement normalizing means or the reduction normalizing means to obtain a character image having a line width of a predetermined thickness. Character recognition device according to claim.
【請求項6】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像の外接矩形を検出してその大きさに
より当該文字画像を拡大正規化するか縮小正規化するか
を判定する外接矩形検出手段と、 上記外接矩形検出手段の判定結果に基づいて前記文字画
像の拡大正規化処理を行なう拡大正規化手段と、 上記外接矩形検出手段の判定結果に基づいて前記文字画
像の縮小正規化処理を行なう縮小正規化手段と、 上記、拡大正規化手段または縮小正規化手段の出力に対
して細線化処理を施す細線化処理手段と、 上記細線化処理手段の出力に対して太め処理を施して所
定の太さの線幅の文字画像とする太め処理手段と、から
なる文字正規化手段を有することを特徴とする文字認識
装置。
6. A character recognition apparatus for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image. Circumscribing rectangle detecting means for detecting and determining whether to enlarge or normalize the character image based on its size, and enlarging and normalizing processing of the character image based on the determination result of the circumscribing rectangle detecting means. Expansion normalizing means for performing, reduction normalization means for performing reduction normalization processing of the character image based on the determination result of the circumscribed rectangle detection means, and output from the expansion normalization means or reduction normalization means A thinning processing means for performing thinning processing; and a thickening processing means for performing thickening processing on the output of the thinning processing means to obtain a character image having a line width of a predetermined thickness. Character recognition apparatus, characterized by.
【請求項7】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像の外接矩形を検出する第1の外接矩
形検出手段と、 前記外接矩形の大きさと前記外接矩形に占める文字の画
素数の割合から、前記切出された文字画像に対して拡大
正規化のみを行なうか間引き正規化を行なうか、細線化
を行なうかを判定する文字画素検出手段と、 上記文字画素検出手段の判定結果に基づいて前記文字画
像の拡大正規化処理を行なう正規化処理手段と、 上記文字画素検出手段の判定結果に基づいて前記文字画
像の縮小正規化処理を行なう縮小正規化手段と、 上記文字画素検出手段の判定結果に基づいて前記文字画
像の細線化処理を行なう細線化処理手段と、を有し、 さらに、上記細線化処理後の文字画像の外接外接矩形を
検出してその大きさにより当該文字画像を拡大正規化す
るか縮小正規化するかを判定する第2の外接矩形検出手
段と、第2の外接矩形検出手段の判定結果に基づいて前
記拡大正規化手段または縮小拡大正規化手段により拡大
正規化または縮小正規化された文字画像に対して太め処
理を施して所定の太さの線幅の文字画像とする太め処理
手段とを有する、文字正規化手段を備えることを特徴と
する文字認識装置。ことを特徴とする文字認識装置。
7. A character recognition device for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image, comprising: extracting a circumscribed rectangle of the extracted character image; First circumscribing rectangle detecting means for detecting, from the size of the circumscribing rectangle and the ratio of the number of pixels of the character occupying the circumscribing rectangle, to perform only enlargement normalization or thinning normalization on the cut-out character image Character pixel detecting means for determining whether to perform the thinning or thinning; normalizing processing means for performing expansion normalization processing of the character image based on the determination result of the character pixel detecting means; Reduction normalizing means for performing the reduction normalization processing of the character image based on the result of the determination, and thinning processing means for performing the thinning processing of the character image based on the determination result of the character pixel detection means. And a second circumscribing rectangle for detecting the circumscribed circumscribed rectangle of the character image after the thinning processing and determining whether to enlarge or normalize the character image based on the size of the circumscribed rectangle. A thickening process is performed on a character image enlarged or reduced by the enlargement normalizing unit or the reduced enlargement normalizing unit based on the determination result of the detection unit and the second circumscribed rectangle detection unit, and a predetermined process is performed. A character recognizing device comprising: character normalizing means; and bold processing means for forming a character image having a thickness of a line width. A character recognition device characterized in that:
【請求項8】 入力画像から文字画像を切出して正規化
処理を行なった後、正規化された文字画像に対して文字
認識処理を行なう文字認識装置において、 切出された文字画像の外接矩形を検出する外接矩形検出
手段と、 前記外接矩形の大きさと前記外接矩形に占める文字の画
素数の割合から、前記切出された文字画像に対して拡大
正規化のみを行なうか間引き正規化のみを行なうか、拡
大正規化,間引き正規化,または縮小化のいずれを行な
うかを判定する文字画素検出手段と、 上記文字画素検出手段の判定結果に基づいて前記文字画
像の拡大正規化処理を行なう拡大正規化手段と、 上記文字画素検出手段の判定結果に基づいて前記文字画
像の間引き正規化処理を行なう間引き正規化手段と、 上記文字画素検出手段の判定結果に基づいて前記文字画
像の縮小正規化処理を行なう縮小正規化手段とを有し、 さらに、上記文字画素検出手段の判定結果が、拡大正規
化,間引き正規化,または縮小化の場合に、拡大正規化
処理、間引き正規化処理、または縮小正規化処理後の文
字画像に対して細線化処理を行なう細線化処理手段と、
該細線化された文字画像に太め処理を所定の太さの線幅
の文字画像とする太め処理手段とを有する、文字正規化
手段を備えることを特徴とする文字認識装置。
8. A character recognition device for extracting a character image from an input image and performing a normalization process, and then performing a character recognition process on the normalized character image. Circumscribing rectangle detecting means for detecting, and performing only enlargement normalization or only thinning normalization on the cut-out character image based on the size of the circumscribed rectangle and the ratio of the number of pixels of characters occupying the circumscribed rectangle. Character pixel detecting means for determining whether to perform expansion normalization, thinning normalization, or reduction; and an expansion normalizing means for performing the expansion normalization processing of the character image based on the determination result of the character pixel detecting means. Decimating means, decimating normalizing means for performing decimating normalization processing of the character image based on the determination result of the character pixel detecting means, Reduction normalization means for performing reduction normalization processing of the character image, and further comprising: when the determination result of the character pixel detection means is expansion normalization, thinning normalization, or reduction, Thinning processing means for performing thinning processing on a character image after thinning normalization processing or reduction normalization processing;
A character recognizing device, comprising: character thickening means having thickening processing means for converting the thinned character image into a character image having a line width of a predetermined thickness.
JP34231397A 1997-10-31 1997-10-31 Character image normalization method and character recognition device Expired - Lifetime JP3560794B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34231397A JP3560794B2 (en) 1997-10-31 1997-10-31 Character image normalization method and character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34231397A JP3560794B2 (en) 1997-10-31 1997-10-31 Character image normalization method and character recognition device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004064002A Division JP2004220625A (en) 2004-03-08 2004-03-08 Normalization method of character image, and character recognition device

Publications (2)

Publication Number Publication Date
JPH11134435A true JPH11134435A (en) 1999-05-21
JP3560794B2 JP3560794B2 (en) 2004-09-02

Family

ID=18352766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34231397A Expired - Lifetime JP3560794B2 (en) 1997-10-31 1997-10-31 Character image normalization method and character recognition device

Country Status (1)

Country Link
JP (1) JP3560794B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569859A (en) * 2021-07-27 2021-10-29 北京奇艺世纪科技有限公司 Image processing method and device, electronic equipment and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569859A (en) * 2021-07-27 2021-10-29 北京奇艺世纪科技有限公司 Image processing method and device, electronic equipment and storage medium
CN113569859B (en) * 2021-07-27 2023-07-04 北京奇艺世纪科技有限公司 Image processing method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
JP3560794B2 (en) 2004-09-02

Similar Documents

Publication Publication Date Title
US5212739A (en) Noise tolerant optical character recognition system
US7054485B2 (en) Image processing method, apparatus and system
US6185341B1 (en) Image processing using vector data to reduce noise
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
EP0381773B1 (en) Character recognition apparatus
JP4655335B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium on which image recognition program is recorded
JP3062382B2 (en) Image processing apparatus and method
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP3560794B2 (en) Character image normalization method and character recognition device
JP2004220625A (en) Normalization method of character image, and character recognition device
CN113421256A (en) Dot matrix text line character projection segmentation method and device
JP2000090194A (en) Image processing method and image processor
JP2000076378A (en) Character recognizing method
JP3868637B2 (en) Character recognition device, dictionary creation method, and recording medium
JPH05159062A (en) Document recognition device
JPH0528319A (en) Method and device for processing image
JP3140079B2 (en) Ruled line recognition method and table processing method
JP3163698B2 (en) Character recognition method
JPH05128305A (en) Area dividing method
Shirali-Shahreza et al. Removing noises similar to dots from Persian scanned documents
JP2612383B2 (en) Character recognition processing method
JP2000155806A (en) Character recognition method and its device and dictionary preparation method and its device and character quality judgment method and recording medium
JP3446794B2 (en) Polygon approximation method and character recognition device for character recognition
JPH056461A (en) Noise eliminating system
JP2000048191A (en) Method for processing image and medium having recorded image processing program thereon

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040420

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040526

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A072

Effective date: 20040914

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100604

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130604

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term