JP2564276B2 - Pattern recognition method and device - Google Patents

Pattern recognition method and device

Info

Publication number
JP2564276B2
JP2564276B2 JP61140019A JP14001986A JP2564276B2 JP 2564276 B2 JP2564276 B2 JP 2564276B2 JP 61140019 A JP61140019 A JP 61140019A JP 14001986 A JP14001986 A JP 14001986A JP 2564276 B2 JP2564276 B2 JP 2564276B2
Authority
JP
Japan
Prior art keywords
pattern
input pattern
contour
character
axes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61140019A
Other languages
Japanese (ja)
Other versions
JPS62297987A (en
Inventor
康雄 黒須
修 国崎
佳弘 横山
宏一 岡澤
彰三 門田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP61140019A priority Critical patent/JP2564276B2/en
Publication of JPS62297987A publication Critical patent/JPS62297987A/en
Application granted granted Critical
Publication of JP2564276B2 publication Critical patent/JP2564276B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、パターン認識装置に係り、特に手書漢字認
識に好適な大分類論理を採用する文字認識装置の改良に
関する。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a pattern recognition device, and more particularly to an improvement of a character recognition device that employs a large classification logic suitable for handwritten Chinese character recognition.

〔従来の技術〕[Conventional technology]

従来の文字認識装置は、特開昭55-134484号に記載の
ように、ストローク密度、関数のベクトルとしての要素
ごとの比較によるマッチングにより入力文字を分類ある
いは識別する構成となっていた。このストローク密度関
数は、文字図形の該座標軸に関する複雑さを表現する関
数で、水平あるいは垂直座標軸方向から文字を眺め、該
座標軸に沿って文字を構成する文字線の本数を計数し、
それを文字図形の該座標軸上のベクトルとして抽出す
る。
A conventional character recognition device is configured to classify or identify an input character by matching by comparing each element as a stroke density and a vector of a function, as described in JP-A-55-134484. This stroke density function is a function that expresses the complexity of the character graphic with respect to the coordinate axes, views the character from the horizontal or vertical coordinate axis direction, and counts the number of character lines that form the character along the coordinate axis.
It is extracted as a vector on the coordinate axis of the character graphic.

ここで分類と識別の相異について述べる。 Here, the difference between classification and identification will be described.

分類はすべての対象カテゴリーセットの中から入力カ
テゴリーを含む複数の候補を決定する操作を指し、対象
字種数の膨大な漢字認識装置等において、認識系全体の
処理効率を高めるためによく利用される手法である。す
なわち、識別用の比較的情報量の大きな標準パターンと
入力パターンとの間で比較する前に、分類用の情報量の
小さな標準パターンを用いて対象候補数を限定し、しか
る後に識別を行なうものである。場合によって分類を大
分類と呼ぶこともある。
Classification refers to the operation of determining multiple candidates including the input category from all target category sets, and is often used to increase the processing efficiency of the entire recognition system in a kanji recognition device with a large number of target character types. It is a method. That is, the number of target candidates is limited by using a standard pattern having a small amount of information for classification before comparison between a standard pattern having a relatively large amount of information for identification and an input pattern, and then identification is performed. Is. In some cases, the classification is also called a large classification.

識別はすべての対象カテゴリーセットの中から入力カ
テゴリーを一意に決定する操作を指し、入力パターンの
細かな特徴を捕える必要があるため、比較的大きな情報
量の標準パターンが用意される。場合によって識別を認
識と呼ぶこともある。
Identification refers to the operation of uniquely determining the input category from all the target category sets, and it is necessary to capture the detailed features of the input pattern, so a standard pattern with a relatively large amount of information is prepared. In some cases, identification is also called recognition.

上記従来技術は、任意の情報量のストローク密度関数
を抽出できるため、分類と識別の双方に適用することが
できる。すなわち、ストローク密度関数の量子化精度を
大きくとれば、文字構造の微細な部分を表現することが
でき、識別用に適した特徴となる。また量子化精度を小
さくとれば、文字構造の大局的な形状を表現することが
でき、分類用に適した特徴となる。
Since the above-mentioned conventional technique can extract a stroke density function having an arbitrary amount of information, it can be applied to both classification and identification. That is, if the quantization accuracy of the stroke density function is increased, a fine portion of the character structure can be expressed, which is a feature suitable for identification. Also, if the quantization accuracy is small, it is possible to represent the overall shape of the character structure, which is a feature suitable for classification.

また、上記従来技術は、漢字の文字線分の構成が非常
に単純なものから複雑なものまであり、この多様な文字
線密度分布を利用している。この性質のため、文字線密
度分布の異なるカテゴリーを容易に分離することができ
る。すなわち、座標軸上に射影した文字線分の本数とそ
の位置の異なるカテゴリーに限り分類することができ
る。しかし、ストローク密度関数の抽出に際して、文字
の基本的な構成要因の一つである文字線分の方向につい
ては配慮されていなかった。
Further, in the above-mentioned conventional technique, the character line segment of the Chinese character has a very simple structure to a complicated one, and uses this various character line density distribution. Due to this property, categories having different character line density distributions can be easily separated. That is, it is possible to classify only the categories in which the number and the position of the character line segments projected on the coordinate axes are different. However, when extracting the stroke density function, the direction of the character line segment, which is one of the basic constituent factors of the character, has not been considered.

〔発明が解決しようとする問題点〕 上記従来技術は、文字線分の基本的な構成要因の一つ
である線分の方向性が特徴量に反映されておらず、異な
る形状の図形から同一の特徴が抽出されるという、いわ
ゆる縮退の問題があった。すなわち、形状の異なる文字
が特徴空間上で同一の位置を占め、これらの文字間で判
別不能になることを意味する。このため、このような縮
退は、文字を認識する上で重大な欠陥であると考えられ
ている。この従来技術の問題点について、第2図を参照
して説明する。
[Problems to be Solved by the Invention] In the above-described conventional technology, the directionality of a line segment, which is one of the basic constituent factors of a character line segment, is not reflected in the feature amount, and it is the same from figures of different shapes. There was a problem of so-called degeneracy, in which the feature of was extracted. That is, it means that characters having different shapes occupy the same position in the feature space and it becomes impossible to distinguish between these characters. Therefore, such degeneracy is considered to be a serious defect in recognizing characters. The problem of this prior art will be described with reference to FIG.

第2図は異なる図形から同一のストローク密度関数が
抽出される実例を示している。第2図(a)はL字図形
22と3軸上に抽出されたストローク密度関数21を示し、
第2図(b)は斜線図形24と同様に3軸上に抽出された
ストローク密度関数23を示す。ストローク密度関数は、
座標軸に直交する断面上の線分の交差回数を計数するた
め、両図形は3軸ともに高さ1に相当するストローク密
度関数が抽出される。
FIG. 2 shows an example in which the same stroke density function is extracted from different figures. Figure 2 (a) is an L-shaped figure
22 and the stroke density function 21 extracted on the 3 axis are shown,
FIG. 2 (b) shows the stroke density function 23 extracted on the three axes as with the shaded figure 24. The stroke density function is
In order to count the number of intersections of line segments on the cross section orthogonal to the coordinate axes, a stroke density function corresponding to a height of 1 is extracted for both figures on all three axes.

上記のごとく、ストローク密度関数は、異なる形状の
図形から同一の特徴が抽出される可能性があり、この性
質は認識装置を構成する上で重大な欠陥となる可能性を
孕んでいた。
As described above, in the stroke density function, the same feature may be extracted from figures having different shapes, and this property has a possibility of being a serious defect in constructing a recognition device.

本発明の目的は、手書漢字の特徴を抽出する際の上記
問題点を解決するため、異なる形状の文字から同一の特
徴を抽出しないように、抽出する特徴に複雑性とその位
置のみならず文字線分の方向性を反映した特徴を抽出す
ることができて、手書漢字を高速かつ高精度に認識する
ことができるパターン認識装置を提供することにある。
An object of the present invention is to solve the above-mentioned problems when extracting the characteristics of handwritten Chinese characters, so that not only the same characteristics are extracted from characters of different shapes, but also the characteristics to be extracted are not only complicated and their positions. It is an object of the present invention to provide a pattern recognition device capable of extracting features reflecting the directionality of character line segments and recognizing handwritten Chinese characters at high speed and with high accuracy.

〔問題点を解決するための手段〕[Means for solving problems]

本願は、上記問題点を解決するための手段として、そ
の第1発明は、 入力パターンを観測して認識対象となるパターン情報
を得て、該認識対象パターン情報を、あらかじめ定めた
カテゴリーごとの標準パターン情報と比較して、該入力
パターンが属すべきカテゴリーに分類するパターン認識
方法において、 上記入力パターンをラスタごとに走査し、入力パター
ンとの交点から入力パターンにそって輪郭追跡を行って
輪郭の方向を求め、 上記求めた輪郭の方向から、X,Y座標軸及び2つの45
度斜軸の4軸のそれぞれについて、該各軸と平行する輪
郭の方向成分を抽出し、該抽出した方向成分の数を計数
し、 上記4軸に関しそれぞれ計数された入力パターンの輪
郭の方向成分の数により入力パターンが属すべきカテゴ
リーに分類することを特徴とする。
The first aspect of the present invention, as means for solving the above-mentioned problems, is to obtain pattern information to be a recognition target by observing an input pattern, and use the recognition target pattern information as a standard for each predetermined category. In the pattern recognition method for comparing the pattern information with the pattern information to classify the input pattern into the category to which the input pattern belongs, the input pattern is scanned for each raster, and the contour tracing is performed along the input pattern from the intersection with the input pattern. Obtain the direction, and from the direction of the contour obtained above, the X and Y coordinate axes and two 45
For each of the four oblique axes, the direction component of the contour parallel to each axis is extracted, the number of the extracted direction components is counted, and the direction component of the contour of the input pattern counted for each of the four axes is calculated. It is characterized in that the input patterns are classified into categories to which they belong.

また、本願第2の発明は、 入力パターンを観測する手段と、上記観測により得ら
れた入力パターンから特徴を抽出して認識対象となるパ
ターン情報を取り出す手段と、該認識パターン情報を、
あらかじめ定めたカテゴリーごとの標準情報と比較し
て、該入力パターンの属すべきカテゴリーに分類する手
段を備えたパターン認識装置において、 上記入力パターンをラスタごとに走査し、入力パター
ンとの交点から入力パターンにそって輪郭追跡を行って
輪郭の方向を求める手段と、 上記求めた輪郭の方向から、X,Y座標軸及び2つの45
度斜軸の4軸のそれぞれについて、該各軸と平行する輪
郭の方向成分を抽出し、該抽出した方向成分の数を計数
する手段と、 上記4軸に関しそれぞれ計数された入力パターンの輪
郭の方向成分の数により入力パターンを特徴辞書と比較
し入力パターンが属すべきカテゴリーに分類する手段と
を有することを特徴とする。
Further, a second invention of the present application comprises: a means for observing an input pattern; a means for extracting features from the input pattern obtained by the observation to extract pattern information to be recognized; and the recognition pattern information,
In a pattern recognition device provided with means for classifying the input pattern into categories to which the input pattern belongs, by comparing with standard information for each predetermined category, the input pattern is scanned for each raster, and the input pattern is detected from the intersection with the input pattern. A means for determining the direction of the contour by tracing the contour along with the X and Y coordinate axes and two 45
Means for extracting the direction component of the contour parallel to each of the four oblique axes and counting the number of the extracted direction components, and the contour of the input pattern counted for each of the four axes. Means for comparing the input pattern with a feature dictionary according to the number of directional components and classifying the input pattern into a category to which the input pattern should belong.

上記本願各発明は、その分類結果を、他の態様によっ
て得られる、別種の特徴を抽出した認識対象パターンの
識別結果と照合して、最終判定を下すようにすることも
できる。
In each invention of the present application, the classification result may be collated with the identification result of the recognition target pattern in which another type of feature is extracted, which is obtained by another aspect, to make the final determination.

〔作用〕[Action]

本発明のパターン認識方法および装置においては、上
記目的を達成するため、輪郭が文字線分の方向を反映し
ている性質を利用する。すなわち、入力文字パターンか
ら輪郭とその方向を求め、二つ以上の座標軸に平行する
輪郭の方向成分のみを各座標軸ごとに計数し、これを特
徴量とする。ここで、二つ以上の座標軸とは縦軸、横
軸、斜め軸等を指す。
In order to achieve the above-mentioned object, the pattern recognition method and apparatus of the present invention utilize the property that the contour reflects the direction of the character line segment. That is, the contour and its direction are obtained from the input character pattern, and only the direction component of the contour parallel to two or more coordinate axes is counted for each coordinate axis, and this is used as the feature amount. Here, the two or more coordinate axes indicate a vertical axis, a horizontal axis, an oblique axis, and the like.

この改良により、入力文字の複雑性とその位置のみな
らず線分の方向性をも反映した特徴が抽出でき、異なる
形状の文字を容易に識別し得る特徴が抽出できるように
なる。本明細書では、これを文字図形の複雑さと方向性
を表現する変形線密度特徴と呼ぶ。
With this improvement, it is possible to extract the features that reflect not only the complexity of the input character and its position but also the directionality of the line segment, and it is possible to extract the features that can easily identify the characters of different shapes. In this specification, this is called a modified linear density feature expressing the complexity and directionality of a character graphic.

以下、本発明の原理を図面を参照して説明する。 Hereinafter, the principle of the present invention will be described with reference to the drawings.

第2図は、前述のごとく異なる図形から同一のストロ
ーク密度関数が抽出される実例を示している。第1図
は、第2図と同一の図形から異なる変形線密度特徴が抽
出される実例を示している。第1図(a)はL字図形12
と3軸上に抽出された変形線密度特徴11を示し、第1図
(b)は斜線図形14と同様に3軸上に抽出された変形線
密度特徴を示す。
FIG. 2 shows an example in which the same stroke density function is extracted from different figures as described above. FIG. 1 shows an example in which different modified linear density features are extracted from the same figure as in FIG. Figure 1 (a) shows an L-shaped figure 12.
And the deformed linear density feature 11 extracted on the three axes, and FIG. 1 (b) shows the deformed linear density feature extracted on the three axes similarly to the shaded figure 14.

変形線密度特徴は、二つ以上の座標軸に平行する輪郭
の方向成分のみを各座標軸ごとに計数するため、ストロ
ーク密度関数とは異なり、両図形は違った特徴が抽出さ
れる。すなわちL字形図形は、縦軸と横軸上に高さ2に
相当する変形線密度特徴が抽出され、斜め軸上には抽出
されない。これに対して斜線図形は、斜め軸上に高さ2
に相当する変形線密度特徴が抽出され、縦軸と横軸上に
は抽出されない。
Since the deformed linear density feature counts only the direction component of the contour parallel to two or more coordinate axes for each coordinate axis, different features are extracted from both figures unlike the stroke density function. That is, in the L-shaped figure, the deformed linear density feature corresponding to the height 2 is extracted on the vertical axis and the horizontal axis, and is not extracted on the diagonal axis. On the other hand, the shaded figure has a height of 2 on the diagonal axis.
The deformed linear density feature corresponding to is extracted and is not extracted on the vertical axis and the horizontal axis.

これらの実例から明らかなように、文字線分の方向性
が考慮されていないストローク密度関数では区別できな
い文字図形でも、方向性を反映した変形線密度関数を用
いれば、容易に区別できるようになる。
As is clear from these examples, even a character figure that cannot be distinguished by a stroke density function that does not consider the directionality of character line segments can be easily distinguished by using a modified linear density function that reflects the directionality. .

かくして、本発明によれば、入力文字パターンから輪
郭とその方向を求め、二つ以上の座標軸に平行する輪郭
の方向成分のみを各座標軸ごとに計数する構成としてい
るので、入力文字の複雑性とその位置情報のみならず線
分の方向性をも反映した特徴を抽出でき、特に、手書漢
字を対象とした分類能力あるいは識別能力を飛躍的に向
上することができる。このように、少ない改良により、
特徴の分類能力あるいは識別能力を向上できる実用的利
点は絶大である。
Thus, according to the present invention, the contour and its direction are obtained from the input character pattern, and only the direction component of the contour parallel to the two or more coordinate axes is counted for each coordinate axis. Features that reflect not only the position information but also the directionality of line segments can be extracted, and in particular, the classification ability or identification ability for handwritten Chinese characters can be dramatically improved. Thus, with a few improvements,
The practical advantage of improving the ability to classify or identify features is tremendous.

〔実施例〕〔Example〕

本発明の実施例について図面を参照して説明する。な
お、以下の実施例は、手書漢字の認識に適用した例であ
るが、もちろん、他のパターン認識にも適用できる。
Embodiments of the present invention will be described with reference to the drawings. Note that the following embodiments are examples applied to recognition of handwritten Chinese characters, but of course they can be applied to other pattern recognition.

〈実施例の構成〉 第3図に、本発明パターン認識方法を実施するための
装置であり、また、パターン認識装置の一実施例である
ものの構成を示す。
<Structure of Embodiment> FIG. 3 shows the structure of an apparatus for carrying out the pattern recognition method of the present invention, which is an embodiment of the pattern recognition apparatus.

同図において、本実施例の装置は、入力未知パターン
の観測手段として機能する文字観測部51と、観測された
文字パターンを前処理して正規化パターンとする前処理
部33と、上記正規化パターンから特徴を抽出して認識対
象パターン情報を形成し、該パターン情報を分類用の情
報量の小さな標準パターンと比較して対象候補を分類選
定する大分類部52と、上記分類選定された対象候補を記
憶保持する候補バッファ37と、上記正規化パターンから
特徴を抽出し、この特徴を、上記対象候補を参照しつ
つ、比較的大きな情報量の標準パターンと比較して類似
度を求める認識部53と、上記認識部53で求められた類似
度とカテゴリー情報とから、該カテゴリーが入力パター
ンの属するカテゴリーか否か判定する判定部41と、上記
各部の動作を制御する制御部42とを備えて構成される。
In the figure, the apparatus of this embodiment includes a character observing section 51 that functions as an observing means for an input unknown pattern, a pre-processing section 33 that pre-processes an observed character pattern into a normalized pattern, and the above normalization. A large classification unit 52 that classifies and selects target candidates by extracting features from patterns to form recognition target pattern information and comparing the pattern information with a standard pattern having a small amount of information for classification; A candidate buffer 37 that stores and holds candidates, and a recognition unit that extracts a feature from the normalized pattern and compares the feature with a standard pattern having a relatively large amount of information while referring to the target candidate to obtain a similarity. 53, a determination unit 41 that determines whether the category is a category to which an input pattern belongs from the similarity and the category information obtained by the recognition unit 53, and control that controls the operation of each unit. Configured with a 42.

上記文字観測部51は、光電変換部31およびアナログデ
ィジタル(A/D)変換部32を有して構成される。
The character observing section 51 includes a photoelectric conversion section 31 and an analog / digital (A / D) conversion section 32.

上記大分類部52は、変形線密度抽出部34と、整合部35
と、特徴辞書36とを有して構成される。特徴辞書36に
は、分類用の比較的情報量の小さな標準パターンが格納
されている。
The large classification unit 52 includes a modified linear density extraction unit 34 and a matching unit 35.
And a feature dictionary 36. The characteristic dictionary 36 stores standard patterns for classification that have a relatively small amount of information.

上記変形線密度抽出部34は、たとえば、第4図に示す
ように構成される。すなわち、上記正規化パターンを一
時保持する文字パターンバッファ61と、該正規化パター
ンについて各方向ごとに輪郭を抽出する輪郭抽出回路62
および該方向別抽出データを保持する方向面バッファ63
と、該方向面バッファの方向面ごとのデータを座標軸を
共通にするため回転する回転回路64および各方向面ごと
の輪郭数、すなわち変形線密度特徴を計数する加算器65
と、計数された変形線密度特徴を記憶保持する変形線密
度バッファ66とを備えて構成される。
The modified linear density extraction unit 34 is configured, for example, as shown in FIG. That is, the character pattern buffer 61 that temporarily holds the normalized pattern, and the contour extraction circuit 62 that extracts the contour of the normalized pattern in each direction.
And a direction plane buffer 63 holding the direction-specific extracted data
And a rotation circuit 64 for rotating the data for each direction surface of the direction surface buffer to make the coordinate axes common, and an adder 65 for counting the number of contours for each direction surface, that is, the modified linear density feature.
And a modified linear density buffer 66 that stores and holds the counted modified linear density features.

〈実施例の作用〉 つぎに、本実施例の作用について、図面を参照して説
明する。
<Operation of Embodiment> Next, the operation of the present embodiment will be described with reference to the drawings.

第3図において、紙面等に記入された文字パターン
は、光電変換部31によりビデオ信号に変換されたのち、
アナログディジタル変換部32によりサンプリング、量子
化が行なわれて二値メッシュパターンとなる。
In FIG. 3, the character pattern written on the paper or the like is converted into a video signal by the photoelectric conversion unit 31,
The analog-to-digital conversion unit 32 performs sampling and quantization to form a binary mesh pattern.

観測された文字パターンは、前処理部33において、切
り出し、雑音除去、正規化などの一連の前処理が行なわ
れて正規化パターンとなる。
The observed character pattern is subjected to a series of preprocessing such as clipping, noise removal, and normalization in the preprocessing unit 33, and becomes a normalized pattern.

切り出しは、認識等の処理単位が一文字ごとになるた
め、紙面上の文字パターン群から一文字を取り出す処理
を指し、通常は一文字を含む100×100メッシュ程度の領
域を切り出す。
The cutout is a process of taking out one character from the character pattern group on the paper because the processing unit of recognition or the like is for each character, and usually cuts out an area of about 100 × 100 mesh including one character.

また、雑音除去は、紙面等に付着したゴミ等の文字パ
ターン以外のパターンを除去する処理を指し、これは濁
点等の文字本来のパターンとの区別が難しく、通常は種
々の工夫が施されている。
Further, noise removal refers to a process of removing a pattern other than a character pattern such as dust adhering to a paper surface, etc. This is difficult to distinguish from a character's original pattern such as a dakuten, and usually various measures are taken. There is.

最後に、正規化処理は、認識を容易にするため、文字
を一定の大きさに揃える処理を指し、認識手法に応じ
て、外接枠に揃える手法や重心を揃える手法等が選ばれ
る。
Finally, the normalization process refers to a process of aligning characters to a certain size for facilitating recognition, and a technique of aligning with a circumscribing frame or a technique of aligning centroids is selected according to the recognition technique.

つぎに、前処理を施された正規化パターンは、変形線
密度抽出部34に加えられ、変形線密度抽出部34におい
て、縦、横、斜めに対応した座標軸上に変形線密度特徴
が抽出される。
Next, the preprocessed normalized pattern is added to the modified linear density extraction unit 34, and the modified linear density extraction unit 34 extracts modified linear density features on the coordinate axes corresponding to the vertical, horizontal, and diagonal directions. It

抽出された変形線密度特徴は、整合部35に加えられ、
整合部35において特徴辞書36に格納された大分類用の標
準パターンとの間で類似度が算出される。
The extracted deformed linear density feature is added to the matching unit 35,
The matching unit 35 calculates the similarity with the standard pattern for large classification stored in the feature dictionary 36.

整合部35では、まず、4座標軸上に計数された入力文
字パターンの変形線密度特徴を特徴バッファから読み出
す。つぎに、特徴辞書36に記憶された大分類用の標準パ
ターンを順次読み出し、入力文字パターンの特徴との間
で類似度を求め、あらかじめ設定された基準を満たすも
のをカテゴリー情報とともに候補バッファ37に加える。
The matching unit 35 first reads the modified linear density features of the input character pattern counted on the four coordinate axes from the feature buffer. Next, the standard patterns for large classification stored in the feature dictionary 36 are sequentially read out, the degree of similarity with the features of the input character pattern is obtained, and those satisfying the preset criteria are stored in the candidate buffer 37 together with the category information. Add.

一方、前処理を施された正規化パターンは、認識用の
特徴抽出部38にも加えられ、特徴抽出部38において、認
識用の特徴が抽出される。
On the other hand, the preprocessed normalized pattern is also added to the recognition feature extraction unit 38, and the recognition feature is extracted in the feature extraction unit 38.

抽出される特徴は、大分類によって絞られた候補文字
群から1字種を認識し得るものであれば、いずれを用い
ても差支えない。たとえば、入力文字パターンの細部の
構造を反映するため、変形線密度特徴の量子化精度をよ
り細かく取った特徴等が考えられる。
Any feature can be used as the extracted feature as long as one character type can be recognized from the candidate character group narrowed down by the large classification. For example, in order to reflect the detailed structure of the input character pattern, it is conceivable that the modified linear density feature has a finer quantization accuracy.

抽出された認識用の特徴は、整合部39に加えられ、整
合部39において特徴辞書40に格納された認識用の標準パ
ターンのうち候補バッファ37に格納された標準パターン
との間で類似度が算出される。
The extracted recognition feature is added to the matching unit 39, and the matching unit 39 has a similarity between the recognition standard pattern stored in the feature dictionary 40 and the standard pattern stored in the candidate buffer 37. It is calculated.

整合部39では、まず、入力パターンから抽出した認識
用の特徴を特徴抽出部38から読み出す。つぎに、候補バ
ッファ37を参照しながら、特徴辞書40に記憶された該当
する標準パターンを順次読み出し、入力文字パターンの
特徴との間で類似度を求め、この類似度と特徴辞書に記
憶されているカテゴリー情報とともに判定部41に加え
る。
The matching unit 39 first reads the recognition feature extracted from the input pattern from the feature extraction unit 38. Next, referring to the candidate buffer 37, the corresponding standard patterns stored in the feature dictionary 40 are sequentially read out, the similarity between the features of the input character pattern is obtained, and the similarity and the feature dictionary are stored. It is added to the determination unit 41 together with the category information that exists.

判定部41では、まず類似度とカテゴリー情報を用い
て、最も類似度の大きなカテゴリーを選択する。つぎ
に、次大値を持つ類似度と最大の類似度との差の絶対値
を求める。この差の絶対値があらかじめ設定した閾値よ
りも大きければ、最大の類似度を持つカテゴリーを受理
する。すなわち最大の類似度をもつカテゴリーが入力さ
れた文字カテゴリーであるらしいと判断され、そのカテ
ゴリーを出力する。逆に前記絶対値があらかじめ設定し
た閾値よりも小さければ、最大の類似度をもつカテゴリ
ーを拒否する。すなわち、最大の類似度を持つカテゴリ
ーが入力された文字カテゴリーではないらしいと判定さ
れ、拒否のコードを出力する。
The determination unit 41 first selects the category with the highest degree of similarity using the degree of similarity and the category information. Next, the absolute value of the difference between the similarity having the next largest value and the maximum similarity is calculated. If the absolute value of this difference is larger than a preset threshold value, the category having the maximum similarity is accepted. That is, it is determined that the category having the maximum similarity is the input character category, and the category is output. On the contrary, if the absolute value is smaller than the preset threshold value, the category having the maximum similarity is rejected. That is, it is determined that the category having the maximum similarity is not the input character category, and the rejection code is output.

つぎに、上記変形線密度抽出部34における作用の詳細
について説明する。
Next, details of the operation in the modified linear density extraction unit 34 will be described.

第4図は変形線密度抽出部の一例の構成を示す詳細な
ブロック図である。
FIG. 4 is a detailed block diagram showing the configuration of an example of the modified linear density extraction unit.

第4図において、前処理を施された正規化パターン
は、文字パターンバッファ61を介して輪郭抽出回路62に
送られる。ここで、各方向別に4枚の文字パターンが作
成され、4枚の方向面バッファ63に加えられる。
In FIG. 4, the preprocessed normalized pattern is sent to the contour extraction circuit 62 via the character pattern buffer 61. Here, four character patterns are created for each direction and added to the four direction surface buffers 63.

輪郭抽出回路62では、まず輪郭抽出を施す。すなわち
文字パターンの左上から順次下方へラスタごとにスキャ
ナしていき、文字パターンに当った点から、文字パター
ンにそって輪郭追跡を開始する。これと同時に各輪郭点
の方向と座標を検出し、対応する方向面に文字パターン
を記述していく。このような手順を経て一文字分の方向
面の作成が完了すると、各方向に分離された文字パター
ンは対応する方向面バッファ63に加えられる。
The contour extraction circuit 62 first performs contour extraction. That is, the scanner is sequentially scanned downward from the upper left of the character pattern for each raster, and from the point of hitting the character pattern, contour tracing is started along the character pattern. At the same time, the direction and coordinates of each contour point are detected, and the character pattern is described on the corresponding direction surface. When the creation of the direction surface for one character is completed through the above procedure, the character patterns separated in each direction are added to the corresponding direction surface buffer 63.

つぎに、方向面キャップ63に加えられた文字パターン
は、回転回路64を介して加算器65に加えられる。加算器
65において、各座標軸ごとの変形線密度特徴が計数さ
れ、最後に変形線密度バッファ66に加えられる。
Next, the character pattern applied to the direction cap 63 is applied to the adder 65 via the rotation circuit 64. Adder
At 65, the deformed linear density features for each coordinate axis are counted and finally added to the deformed linear density buffer 66.

回転回路64では、各座標軸の変形線密度特徴を加算器
65において、同じ手順で演算できるように並べ換える。
たとえば、縦座標の変形線密度特徴を抽出する方向面に
は回転を加えず、横座標の特徴を抽出する方向面は90度
の回転を加える。同様の手順に従って、残り2面の演算
方向を整え、加算器65において各方向ごとの輪郭数を計
数し、変形線密度バッファ66に格納する。
In the rotation circuit 64, the modified linear density feature of each coordinate axis is added by an adder.
In 65, rearrange so that the same procedure can be performed.
For example, no rotation is applied to the directional surface for extracting the modified linear density feature on the ordinate, and 90 ° is applied to the directional surface for extracting the abscissa feature. According to the same procedure, the calculation directions of the remaining two planes are adjusted, the number of contours in each direction is counted by the adder 65, and stored in the modified linear density buffer 66.

以上の説明では、方向面を介して変形線密度特徴を抽
出したが、正規化文字パターンから直接抽出してもよ
い。
In the above description, the deformed linear density feature is extracted via the direction plane, but it may be extracted directly from the normalized character pattern.

また第3図および第4図の説明において、制御部42か
ら回路各部に制御信号が供給され、また回路各部の状態
を通知する信号が制御部42に与えられるのであるが、本
発明を理解する上で必ずしも必要ではないので、これら
は簡単化のため図示および説明を省略した。
Further, in the description of FIGS. 3 and 4, the control unit 42 supplies a control signal to each unit of the circuit, and a signal notifying the state of each unit of the circuit is given to the control unit 42. Since these are not always necessary, they are not shown and described for simplification.

以上の説明から明らかなように、本実施例によれば、
文字パターンの方向成分を求め、少なくとも二つの座標
軸に平行する輪郭の方向成分のみを各座標軸ごとに計数
することにより特徴を抽出する構成とし、文字線分の方
向性が大分類用の特徴に反映するようになったので、手
書漢字をきわめて高効率に分類できるという効果があ
る。
As is clear from the above description, according to this embodiment,
The feature is extracted by finding the direction component of the character pattern and counting only the direction component of the contour parallel to at least two coordinate axes for each coordinate axis, and the directionality of the character line segment is reflected in the feature for major classification. As a result, it has the effect of classifying handwritten kanji with extremely high efficiency.

〈他の実施例〉 上記実施例では、大分類部52と認識部53の両者を備え
ているが、大分類部52において、候補が一つに絞れる場
合には、認識部53を省略した構成としてもよい。
<Other Embodiments> In the above embodiment, both the large classification unit 52 and the recognition unit 53 are provided. However, in the large classification unit 52, when the candidates are narrowed down to one, the recognition unit 53 is omitted. May be

また、上記実施例では、手書漢字の認識の場合につい
て説明したが、本発明は、これに限らず、他のパターン
認識にも適用可能である。
Further, in the above embodiment, the case of recognizing handwritten Chinese characters has been described, but the present invention is not limited to this, and can be applied to other pattern recognition.

〔発明の効果〕〔The invention's effect〕

本発明によれば、手書漢字の特性を効果的に表現する
文字線分の方向性を大分類あるいは識別用の特徴に反映
することができるので、膨大な処理量が要求される手書
漢字認識において、きわめて高速、高精度に認識するこ
とができる。
According to the present invention, it is possible to reflect the directionality of a character line segment that effectively expresses the characteristics of a handwritten Chinese character in the characteristics for large classification or identification, so that a large amount of processing is required for the handwritten Chinese character. In recognition, it is possible to recognize with extremely high speed and high accuracy.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明に係るパターン認識方法における特徴抽
出法の原理図、第2図は従来の特徴抽出法の原理図、第
3図は本発明に係るパターン認識方法および装置の一実
施例を示すブロック図、第4図は上記実施例の主要な構
成部分である特徴抽出部の一例を示すブロック図であ
る。 11……変形線密度特徴 12……L字図形、13……斜線図形 21……ストローク密度関数 22……L字図形、23……斜線図形 31……光電変換部、32……A/D変換部 33……前処理部、34……変形線密度抽出部 35……整合部、36……特徴辞書 37……候補バッファ、38……特徴抽出部 39……整合部、40……特徴辞書 41……判定部、42……制御部 51……文字観測部、52……大分類部 53……認識部 61……文字パターンバッファ 62……輪郭抽出回路、63……方向面バッファ 64……回転回路、65……加算器 66……変形線密度バッファ
FIG. 1 is a principle diagram of a feature extraction method in a pattern recognition method according to the present invention, FIG. 2 is a principle diagram of a conventional feature extraction method, and FIG. 3 is an embodiment of a pattern recognition method and apparatus according to the present invention. FIG. 4 is a block diagram shown in FIG. 4, and FIG. 4 is a block diagram showing an example of a feature extraction unit which is a main constituent part of the above embodiment. 11 …… Deformed linear density feature 12 …… L-shaped figure, 13 …… Diagonal line figure 21 …… Stroke density function 22 …… L-shaped figure, 23 …… Diagonal line figure 31 …… Photoelectric conversion part, 32 …… A / D Conversion unit 33 …… Preprocessing unit, 34 …… Modified linear density extraction unit 35 …… Matching unit, 36 …… Feature dictionary 37 …… Candidate buffer, 38 …… Feature extraction unit 39 …… Matching unit, 40 …… Features Dictionary 41 …… Decision unit, 42 …… Control unit 51 …… Character observation unit, 52 …… Large classification unit 53 …… Recognition unit 61 …… Character pattern buffer 62 …… Contour extraction circuit, 63 …… Direction plane buffer 64 ...... Rotating circuit, 65 …… Adder 66 …… Modified linear density buffer

───────────────────────────────────────────────────── フロントページの続き (72)発明者 横山 佳弘 横浜市戸塚区吉田町292番地 株式会社 日立製作所マイクロエレクトロニクス機 器開発研究所内 (72)発明者 岡澤 宏一 横浜市戸塚区吉田町292番地 株式会社 日立製作所マイクロエレクトロニクス機 器開発研究所内 (72)発明者 門田 彰三 小田原市国府津2880 株式会社日立製作 所小田原小場内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Yoshihiro Yokoyama, inventor Yoshihiro Yokoyama, 292 Yoshida-cho, Totsuka-ku, Yokohama Inside Microelectronics Device Development Laboratory, Hitachi, Ltd. (72) Inventor Koichi Okazawa 292 Yoshida-cho, Totsuka-ku, Yokohama Shares Company Hitachi, Ltd. Microelectronics Equipment Development Laboratory (72) Inventor Shozo Kadota 2880 Kozu, Odawara-shi Hitachi Ltd. Odawara Koba

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力パターンを観測して認識対象となるパ
ターン情報を得て、該認識対象パターン情報を、あらか
じめ定めたカテゴリーごとの標準パターン情報と比較し
て、該入力パターンが属すべきカテゴリーに分類するパ
ターン認識方法において、 上記入力パターンをラスタごとに走査し、入力パターン
との交点から入力パターンにそって輪郭追跡を行って輪
郭の方向を求め、 上記求めた輪郭の方向から、X,Y座標軸及び2つの45度
斜軸の4軸のそれぞれについて、該各軸と平行する輪郭
の方向成分を抽出し、該抽出した方向成分の数を計数
し、 上記4軸に関しそれぞれ計数された入力パターンの輪郭
の方向成分の数により入力パターンが属すべきカテゴリ
ーに分類することを特徴とするパターン認識方法。
1. A pattern information to be recognized is obtained by observing an input pattern, the pattern information to be recognized is compared with standard pattern information for each predetermined category, and the category to which the input pattern belongs should be compared. In the pattern recognition method to classify, the input pattern is scanned for each raster, contour tracing is performed along the input pattern from the intersection with the input pattern to obtain the contour direction, and from the obtained contour direction, X, Y With respect to each of the coordinate axes and the four axes of the two 45-degree oblique axes, the direction components of the contour parallel to the respective axes are extracted, the number of the extracted direction components is counted, and the input pattern counted for each of the four axes is extracted. A pattern recognition method characterized by classifying an input pattern into a category to which the input pattern should belong, according to the number of direction components of the contour of the.
【請求項2】入力パターンを観測する手段と、上記観測
により得られた入力パターンから特徴を抽出して認識対
象となるパターン情報を取り出す手段と、該認識パター
ン情報を、あらかじめ定めたカテゴリーごとの標準情報
と比較して、該入力パターンの属すべきカテゴリーに分
類する手段を備えたパターン認識装置において、 上記入力パターンをラスタごとに走査し、入力パターン
との交点から入力パターンにそって輪郭追跡を行って輪
郭の方向を求める手段と、 上記求めた輪郭の方向から、X,Y座標軸及び2つの45度
斜軸の4軸のそれぞれについて、該各軸と平行する輪郭
の方向成分を抽出し、該抽出した方向成分の数を計数す
る手段と、 上記4軸に関しそれぞれ計数された入力パターンの輪郭
の方向成分の数により入力パターンを特徴辞書と比較し
入力パターンが属すべきカテゴリーに分類する手段とを
有することを特徴とするパターン認識装置。
2. A means for observing an input pattern, a means for extracting pattern information to be a recognition target by extracting features from the input pattern obtained by the observation, and the recognition pattern information for each predetermined category. In a pattern recognition device having means for classifying the input pattern into a category to which the input pattern belongs, the input pattern is scanned for each raster, and contour tracing is performed along the input pattern from the intersection with the input pattern. Means for performing the contour direction and extracting the direction component of the contour parallel to each of the four axes of the X and Y coordinate axes and the two 45-degree oblique axes from the obtained contour direction, The input pattern is characterized by means for counting the number of the extracted directional components, and the number of directional components of the contour of the input pattern counted for each of the four axes. Pattern recognition apparatus characterized by comprising a means for classifying the compared category should have the input pattern belongs as written.
JP61140019A 1986-06-18 1986-06-18 Pattern recognition method and device Expired - Lifetime JP2564276B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61140019A JP2564276B2 (en) 1986-06-18 1986-06-18 Pattern recognition method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61140019A JP2564276B2 (en) 1986-06-18 1986-06-18 Pattern recognition method and device

Publications (2)

Publication Number Publication Date
JPS62297987A JPS62297987A (en) 1987-12-25
JP2564276B2 true JP2564276B2 (en) 1996-12-18

Family

ID=15259047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61140019A Expired - Lifetime JP2564276B2 (en) 1986-06-18 1986-06-18 Pattern recognition method and device

Country Status (1)

Country Link
JP (1) JP2564276B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5697178A (en) * 1979-12-29 1981-08-05 Fujitsu Ltd Character feature pickup system
JPS57189277A (en) * 1981-05-15 1982-11-20 Nippon Telegr & Teleph Corp <Ntt> Character recognizing device
JPS60258685A (en) * 1984-06-06 1985-12-20 Ricoh Co Ltd Feature detecting method of image pattern

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5697178A (en) * 1979-12-29 1981-08-05 Fujitsu Ltd Character feature pickup system
JPS57189277A (en) * 1981-05-15 1982-11-20 Nippon Telegr & Teleph Corp <Ntt> Character recognizing device
JPS60258685A (en) * 1984-06-06 1985-12-20 Ricoh Co Ltd Feature detecting method of image pattern

Also Published As

Publication number Publication date
JPS62297987A (en) 1987-12-25

Similar Documents

Publication Publication Date Title
Kim et al. An architecture for handwritten text recognition systems
US4491960A (en) Handprinted symbol recognition system
Wang et al. Classification of newspaper image blocks using texture analysis
Shi et al. A steerable directional local profile technique for extraction of handwritten arabic text lines
US5050222A (en) Polygon-based technique for the automatic classification of text and graphics components from digitized paper-based forms
Tombre et al. Text/graphics separation revisited
US5058182A (en) Method and apparatus for handwritten character recognition
US5335290A (en) Segmentation of text, picture and lines of a document image
US5995642A (en) Method for automatic fingerprint classification
CN111753706A (en) Complex table intersection point clustering extraction method based on image statistics
Cao et al. A model of stroke extraction from chinese character images
CN110222660B (en) Signature authentication method and system based on dynamic and static feature fusion
Sas et al. Three-stage method of text region extraction from diagram raster images
JP2564276B2 (en) Pattern recognition method and device
Heutte et al. Combining structural and statistical features for the recognition of handwritten characters
Della Ventura et al. Graphic symbol recognition using a signature technique
Okun et al. A survey of texture-based methods for document layout analysis
Malik et al. Video script identification using a combination of textural features
JP3391223B2 (en) Character recognition device
KR910000786B1 (en) Pattern recognition system
Breul Recognition of handprinted digits using optimal bounded error matching
JPH02204881A (en) Pattern-character separating method
JP2890317B2 (en) Character / graphic separation device
JP2605807B2 (en) Feature extraction method
JPH11120291A (en) Pattern recognition system