JPH0253831B2 - - Google Patents

Info

Publication number
JPH0253831B2
JPH0253831B2 JP57111262A JP11126282A JPH0253831B2 JP H0253831 B2 JPH0253831 B2 JP H0253831B2 JP 57111262 A JP57111262 A JP 57111262A JP 11126282 A JP11126282 A JP 11126282A JP H0253831 B2 JPH0253831 B2 JP H0253831B2
Authority
JP
Japan
Prior art keywords
character
series
dictionary
line segments
partial pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57111262A
Other languages
Japanese (ja)
Other versions
JPS592193A (en
Inventor
Yoshihisa Fujii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57111262A priority Critical patent/JPS592193A/en
Publication of JPS592193A publication Critical patent/JPS592193A/en
Publication of JPH0253831B2 publication Critical patent/JPH0253831B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (A) 発明の技術分野 本発明は、文字認識装置、特に漢字を例えば
「へん」と「つくり」とに分離して認識精度を高
めるようにした文字認識装置において、文字スト
ロークによつて挾まれる白領域を代表する文字内
部線分を抽出して、その系列を求め、当該系列の
発生態様にもとづいて、1つの文字を部分パター
ンに分離するようにした文字認識装置に関するも
のである。
[Detailed Description of the Invention] (A) Technical Field of the Invention The present invention provides a character recognition device, particularly a character recognition device that separates kanji into, for example, “hen” and “tsukuri” to improve recognition accuracy. Character recognition that extracts character internal line segments that represent white areas interposed by character strokes, determines their series, and separates one character into partial patterns based on the manner in which the series occurs. It is related to the device.

(B) 技術の背景と問題点 漢字認識処理に当つては、先づ何んらかの公知
の手段によつて大分類を行い、その上で認識対象
文字を例えば「へん」、「かんむり」、「つくり」な
どの部分パターンに分離して夫々を認識し、全体
としての認識精度を向上させることが考慮されて
いる。
(B) Background and problems of the technology In the process of recognizing kanji characters, the characters to be recognized are first roughly classified by some known means, and then the characters to be recognized are classified into characters such as "hen" and "crown." It is being considered that the recognition accuracy can be improved as a whole by separating into partial patterns such as ``'' and ``zukuri'' and recognizing each of them.

しかし、漢字特に手書き漢字の場合には、例え
ば「へん」と「つくり」とが部分的に接触してい
たりして、必らずしも十分な分離を行うことがで
きず、正しく分離しようとすると部分パターンの
種類によつて処理の仕方を異にする必要があるな
ど汎用性に欠けるという難点をもつている。
However, in the case of kanji, especially handwritten kanji, for example, the words ``hen'' and ``tsukuri'' may partially touch each other, making it difficult to separate them properly. This has the drawback of lacking versatility, as it is necessary to use different processing methods depending on the type of partial pattern.

(C) 発明の目的と構成 本発明は上記の点を解決することを目的として
おり、本発明の文字認識装置は、認識対象漢字文
字を走査して特徴を抽出し、標準漢字文字に対応
した特徴が格納されている辞書の内容と照合し
て、上記認識対象漢字文字のカテゴリを決定する
に当つて、単一の文字内を部分パターンに分離し
て認識精度を高めるようにした文字認識装置にお
いて、認識対象漢字文字を水平方向に探索した際
における文字ストロークに挾まれる白領域を代表
する水平方向文字内部線分の系列と、当該認識対
象漢字文字を垂直方向に探索した際における文字
ストロークに挾まれる白領域を代表する垂直方向
文字内部線分の系列とを抽出すると共に、1つの
文字内を分離可能なカテゴリ文字の個々について
当該分離が生じる場合の上記文字内部線分の系列
を部分パターン分離用辞書に格納してなり、上記
抽出された文字内部線分の系列と上記辞書の内容
とを照合し、単一の文字を部分パターンに分離す
るようにしたことを特徴としている。以下図面を
参照しつつ説明する。
(C) Object and Structure of the Invention The present invention aims to solve the above-mentioned problems, and the character recognition device of the present invention scans the kanji characters to be recognized, extracts the features, and extracts the features corresponding to the standard kanji characters. A character recognition device that improves recognition accuracy by separating a single character into partial patterns when determining the category of the kanji character to be recognized by comparing the characteristics with the contents of a dictionary in which the characteristics are stored. , a series of horizontal character internal line segments representing white areas sandwiched by character strokes when searching for the recognition target Kanji character in the horizontal direction, and character strokes when searching for the recognition target Kanji character in the vertical direction. At the same time, extract a series of vertical character internal line segments that represent the white area sandwiched between characters, and extract a series of character internal line segments when separation occurs for each category character that can be separated within one character. The character is stored in a dictionary for partial pattern separation, and a single character is separated into partial patterns by comparing the extracted series of character internal line segments with the contents of the dictionary. This will be explained below with reference to the drawings.

(D) 発明の実施例 第1図A,Bは夫々本発明にいう文字内部線分
とそれによる部分パターン分離の概念を説明する
説明図、第2図は本発明に用いられる部分パター
ン分離用辞書の一実施例内容を説明する説明図、
第3図は本発明の一実施例構成を示す。
(D) Embodiments of the Invention FIGS. 1A and 1B are explanatory diagrams each explaining the concept of character internal line segments and partial pattern separation according to the present invention, and FIG. 2 is a diagram for partial pattern separation used in the present invention. An explanatory diagram illustrating the contents of an example of a dictionary,
FIG. 3 shows the configuration of an embodiment of the present invention.

第1図Aに示す如き手書き漢字1が与えられた
とき、図示矢印方向に走査2を行い、 (i) 背景の左白領域から最初に黒領域に達した点
Aを抽出する。
When a handwritten kanji character 1 as shown in FIG. 1A is given, a scan 2 is performed in the direction of the arrow shown in the figure, and (i) point A, which first reaches the black area from the left white area of the background, is extracted.

(ii) 次に黒領域から白領域に達した点aを抽出す
る。
(ii) Next, extract the point a that reaches the white area from the black area.

(iii) 次に白領域から黒領域に達した点Bを抽出す
る。
(iii) Next, extract the point B that reaches the black area from the white area.

(iv) 次に黒領域から白領域に達した点bを抽出す
る。
(iv) Next, extract the point b that reaches the white area from the black area.

〓 (v) 最后に黒領域から背景の右白領域に達した点
nを抽出する。
(v) Finally, extract the point n that reaches the right white area of the background from the black area.

ようにする。そしてこのように抽出された点aと
点Bとの中央点(仮にP1とする)、点bと点N
との中央点(仮にP2とする)……を求めてお
く。
Do it like this. Then, the center point between point a and point B extracted in this way (temporarily set as P1), point b and point N
Find the center point (temporarily assumed to be P2) between the two points.

この状態の下で、第1図図示の場合には上下に
並ぶ走査線に対応して得られた点P1,P2,…
…の夫々について、上下方向に連結して、第1図
に示す如き水平方向文字内部線分L1,L2,…
…を抽出する。なお、このとき、上下に並ぶ2つ
の走査に対応して得られた上記例えば点P1に対
応する点の水平位置が閾値以上離れていれば、線
分L1などが不連続であるとみる。そして、各線
分の始端と終端とが求まると、この両端をいわば
直線で結んだ図示線分L1,L2,……が得られ
る。更に上記始端や終端が文字の黒領域によつて
封さがれている場合(図示黒丸)と封さがれてい
ない場合(図示白丸)とを区別して抽出するよう
にされる。
Under this state, in the case shown in FIG. 1, points P1, P2, . . . are obtained corresponding to the vertically arranged scanning lines.
. . are connected in the vertical direction, and horizontal character internal line segments L1, L2, . . . as shown in FIG.
Extract... At this time, if the horizontal positions of the points corresponding to, for example, the point P1 obtained in correspondence with the two vertically arranged scans are separated by a threshold value or more, the line segment L1 etc. is considered to be discontinuous. When the starting end and ending end of each line segment are found, the illustrated line segments L1, L2, . . . are obtained by connecting both ends with straight lines. Further, cases in which the start and end ends are sealed by a black area of the character (black circles in the figure) and cases in which they are not sealed (white circles in the figure) are extracted separately.

上記の如き文字内部線分の抽出は、文字を垂直
方向に走査した場合にも同様に得られる。
Extraction of character internal line segments as described above can be similarly obtained when a character is scanned in the vertical direction.

水平方向に走査した場合に得られる水平方向文
字内部線分は、第1図AやBに示される線分L
1,L2,……のみではないが、第1図A図示の
如く線分L1,L2,L3の系列が存在したり、
また第1図B図示の如く線分L1,L2,L3の
如く系列が存在したりした場合には、当該文字
「教」から左右の各部分パターンに分離され得る
ことを明らかにしている。
The horizontal character internal line segment obtained when scanning in the horizontal direction is the line segment L shown in Figure 1 A and B.
1, L2, . . . as shown in FIG. 1A, there may be a series of line segments L1, L2, L3,
Furthermore, it is clarified that if there is a series such as line segments L1, L2, and L3 as shown in FIG. 1B, the character "kyo" can be separated into left and right partial patterns.

このように1つの文字例えば手書き文字「教」
について部分パターンに分離できる水平方向文字
内部線分の系列を種々調査しておき、これらの各
系列を第2図図示の如く部分パターン分離用辞書
に登録しておく。
In this way, one character, for example, the handwritten character ``kyo''
Various series of horizontal character internal line segments that can be separated into partial patterns are investigated, and each of these series is registered in a partial pattern separation dictionary as shown in FIG.

第2図は、文字「教」を左右に分離する際に現
われる各種の「文字内部線分の系列」を示してい
る。図示の系列は第1図A図示の場合に対応
し、図示の系列は第1図B図示の場合に対応
し、図示の系列は……の如く、一般に複数種類
の系列が登録される。
FIG. 2 shows various "sequences of character internal line segments" that appear when the character "kyo" is separated into left and right parts. Generally, a plurality of types of series are registered, such as the illustrated series corresponds to the case shown in FIG. 1A, the illustrated series corresponds to the case illustrated in FIG. 1B, and the illustrated series...

第3図は本発明の一実施例構成を示している。
図中の符号3は入力文字であつて例えば第1図A
に示される如き文字、4は大分類回路であつて例
えば第1図A図示の文字1が入力されたとき従来
公知の手段によつて候補文字群(例えば教、数、
散……)を抽出するもの、5は部分パターン分離
判定回路であつて公知の手段によつて上記候補文
字群に属する文字が左・右または上・下の部分パ
ターンに分離可能なものか否かを決定するもの、
6は水平方向文字内部線分を抽出してその系列を
得るもの、7は垂直方向文字内部線分を抽出して
その系列を得るもの、8は部分パターン分離用辞
書、9は線分探索回路であつて辞書8の内容と回
路6や7によつて抽出された系列とを照合して部
分パターンを決定するもの、10は部分パターン
辞書であつて各部分パターンについての認識特徴
が格納されているもの、11は判定回路であつて
部分パターン辞書10の内容にもとづいて上記決
定された部分パターンが如何なる形状をもつ部分
パターンであるかを判定して入力文字についての
認識を行い文字コードを出力するものを表わして
いる。
FIG. 3 shows the configuration of an embodiment of the present invention.
Reference numeral 3 in the figure is an input character, for example, A in Figure 1.
Characters 4 as shown in FIG.
5 is a partial pattern separation determination circuit which determines whether the characters belonging to the candidate character group can be separated into left, right, upper and lower partial patterns by known means. What determines
6 is a device that extracts horizontal character internal line segments and obtains their series; 7 is a device that extracts vertical character internal line segments and obtains their series; 8 is a dictionary for partial pattern separation; and 9 is a line segment search circuit. 10 is a partial pattern dictionary in which recognition features for each partial pattern are stored. 11 is a determination circuit which determines what shape the determined partial pattern has based on the contents of the partial pattern dictionary 10, recognizes the input character, and outputs a character code. It represents what you do.

入力文字は大分類回路4によつて例えば(教、
数、散、……)の如き候補文字群に属するものと
判定される。そして入力文字が左・右または上・
下に分類可能か否かを、部分パターン分離判定回
路5が判定する。分離可能な場合、回路6や7に
よつて上述の文字内部線分の系列が上述の如く抽
出される。
The input characters are sorted by the major classification circuit 4, for example,
It is determined that the character belongs to a candidate character group such as numeral, san, ...). And the input character is left, right or top
The partial pattern separation determination circuit 5 determines whether the partial pattern can be classified into the lower categories. If separable, the above-mentioned series of character internal line segments are extracted by circuits 6 and 7 as described above.

この抽出結果は、部分パターン分離用辞書8の
内容と照合され、部分パターンを得る。該部分パ
ターンは判定回路11に導びかれ、部分パターン
辞書10の内容にもとづいて、上記得られた部分
パターンが如何なる形状をもつ部分パターンであ
るかを判定する。そして、判定回路11は、例え
ば第1図A図示の文字が「孝」なる部分パターン
と「父」なる部分パターンとで構成されているこ
とを知つて、第1図A図示の文字が「教」である
ことを決定する。
This extraction result is compared with the contents of the partial pattern separation dictionary 8 to obtain a partial pattern. The partial pattern is led to a determination circuit 11, which determines what shape the obtained partial pattern has based on the contents of the partial pattern dictionary 10. Then, the determination circuit 11 knows that, for example, the characters shown in FIG. ”.

なお、第3図図示の大分類回路4や部分パター
ン分離判定回路5や判定回路11などにおいて利
用する特徴量については、従来公知のものを利用
することができるが、例えば第1図A図示の点A
を上下方向に連らねた場合に得られる輪郭左線分
系列や点nを上下方向に連らねた場合に得られる
輪郭右線分系列を利用することができる。これら
の特徴を利用する場合には、上記文字内部線分系
列を抽出する処理と同様な処理によつて一緒に抽
出することが可能となる。
Note that conventionally known features can be used as the feature amounts used in the major classification circuit 4, partial pattern separation judgment circuit 5, judgment circuit 11, etc. shown in FIG. Point A
It is possible to use the contour left line segment series obtained when the points n are connected in the vertical direction, and the contour right line segment series obtained when the points n are connected in the vertical direction. When these features are utilized, they can be extracted together by a process similar to the process for extracting the character internal line segment series described above.

(E) 発明の効果 以上説明した如く、本発明によれば、漢字を複
数の部分パターンに分離することが容易となり、
文字認識精度を向上せしめることが可能となる。
(E) Effects of the invention As explained above, according to the present invention, it is easy to separate kanji into multiple partial patterns,
It becomes possible to improve character recognition accuracy.

【図面の簡単な説明】[Brief explanation of drawings]

第1図A,Bは夫々本発明にいう文字内部線分
とそれによる部分パターン分離の概念を説明する
説明図、第2図は本発明に用いられる部分パター
ン分離用辞書の一実施例内容を説明する説明図、
第3図は本発明の一実施例構成を示す。 図中、1は認識対象の漢字、2は走査線、4は
大分類回路、5は部分パターン分離判定回路、6
は水平方向線分抽出回路、7は垂直方向線分抽出
回路、8は部分パターン分離用辞書、9は線分探
索回路、10は部分パターン辞書、11は判定回
路を表わす。
FIGS. 1A and 1B are explanatory diagrams respectively explaining the concept of internal character line segments and partial pattern separation according to the present invention, and FIG. 2 shows the contents of an embodiment of a dictionary for partial pattern separation used in the present invention. An explanatory diagram to explain,
FIG. 3 shows the configuration of an embodiment of the present invention. In the figure, 1 is the kanji to be recognized, 2 is the scanning line, 4 is the major classification circuit, 5 is the partial pattern separation judgment circuit, and 6
Reference numeral 1 represents a horizontal line segment extraction circuit, 7 a vertical line segment extraction circuit, 8 a partial pattern separation dictionary, 9 a line segment search circuit, 10 a partial pattern dictionary, and 11 a determination circuit.

Claims (1)

【特許請求の範囲】[Claims] 1 認識対象漢字文字を走査して特徴を抽出し、
標準漢字文字に対応した特徴が格納されている辞
書の内容と照合して、上記認識対象漢字文字のカ
テゴリを決定するに当つて、単一の文字内を部分
パターンに分離して認識精度を高めるようにした
文字認識装置において、認識対象漢字文字を水平
方向に探索した際における文字ストロークに挾ま
れる白領域を代表する水平方向文字内部線分の系
列と、当該認識対象漢字文字を垂直方向に探索し
た際における文字ストロークに挾まれる白領域を
代表する垂直方向文字内部線分の系列とを抽出す
ると共に、1つの文字内を分離可能なカテゴリ文
字の個々について当該分離が生じる場合の上記文
字内部線分の系列を部分パターン分離用辞書に格
納してなり、上記抽出された文字内部線分の系列
と上記辞書の内容とを照合し、単一の文字を部分
パターンに分離するようにしたことを特徴とする
文字認識装置。
1 Scan the kanji characters to be recognized and extract the features,
When determining the category of the kanji character to be recognized by comparing it with the contents of a dictionary that stores features corresponding to standard kanji characters, the recognition accuracy is improved by separating a single character into partial patterns. In a character recognition device configured as shown in FIG. In addition to extracting a series of vertical internal character line segments that represent the white area sandwiched between character strokes during the search, the above character is extracted for each of the category characters that can be separated within one character. A series of internal line segments is stored in a dictionary for partial pattern separation, and a single character is separated into partial patterns by comparing the extracted character internal line segment series with the contents of the dictionary. A character recognition device characterized by:
JP57111262A 1982-06-28 1982-06-28 Character recognizing device Granted JPS592193A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57111262A JPS592193A (en) 1982-06-28 1982-06-28 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57111262A JPS592193A (en) 1982-06-28 1982-06-28 Character recognizing device

Publications (2)

Publication Number Publication Date
JPS592193A JPS592193A (en) 1984-01-07
JPH0253831B2 true JPH0253831B2 (en) 1990-11-19

Family

ID=14556737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57111262A Granted JPS592193A (en) 1982-06-28 1982-06-28 Character recognizing device

Country Status (1)

Country Link
JP (1) JPS592193A (en)

Also Published As

Publication number Publication date
JPS592193A (en) 1984-01-07

Similar Documents

Publication Publication Date Title
US5579408A (en) Character recognition method and apparatus
US5668892A (en) Table recognition apparatus
JPS5837779A (en) Document processor
Bai et al. An approach to extracting the target text line from a document image captured by a pen scanner
JPH0253831B2 (en)
Heutte et al. Combining structural and statistical features for the recognition of handwritten characters
KR19980058349A (en) Person Identification Using Image Information
JPH0253830B2 (en)
JPS57209574A (en) Kanji (chinese characters) recognizing device
JP2789622B2 (en) Character / graphic area determination device
KR100248384B1 (en) Individual character extraction method in multilingual document recognition and its recognition system
Paranjape et al. A Robust and Automated Approach for Multilingual Indian Document Indexing
JPH0246988B2 (en)
JP2797523B2 (en) Drawing follower
JPS63269267A (en) Character recognizing device
JPS62194590A (en) Character recognizing system
JPS59136879A (en) Character recognizing system
JP2578768B2 (en) Image processing method
JPS6252912B2 (en)
JPS57113185A (en) Character recognition system
JPS60147891A (en) Character recognition device
JPH08202883A (en) Method for recognizing paint-out graphic in automatic drawing input device
JPH03189784A (en) Character feature extracting system
JPH04309185A (en) Drawing element separating method for automatic drawing input device
JPS61220081A (en) Segmentation and recognition system for pattern