JPS60142784A - Character separating system - Google Patents
Character separating systemInfo
- Publication number
- JPS60142784A JPS60142784A JP58246709A JP24670983A JPS60142784A JP S60142784 A JPS60142784 A JP S60142784A JP 58246709 A JP58246709 A JP 58246709A JP 24670983 A JP24670983 A JP 24670983A JP S60142784 A JPS60142784 A JP S60142784A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line segment
- character pattern
- end point
- singular line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
Description
【発明の詳細な説明】
(発明の技術分野〕
本発明は手書きされたアルファ・ニューメリック文字に
おいて、文字と文字が接合されたものを分離するように
した文字分離方式に関する。DETAILED DESCRIPTION OF THE INVENTION (Technical Field of the Invention) The present invention relates to a character separation method for separating joined characters in handwritten alphanumeric characters.
従来の手書き文字認識技術は、−文字毎に決められた文
字枠内に書かれたものを認識するために、一定の文字枠
に書かれたものだけしか認識できなかった。しかも文字
枠内に書かれるため文字と文字との接合はなかった。Conventional handwritten character recognition technology recognizes what is written within a predetermined character frame for each character, and can only recognize what is written within a predetermined character frame. Moreover, since it was written within the character frame, there was no joining between the characters.
ところで論理回路図等では回路素子の名称や人力信号表
示等のために手書き文字でこれらの記号を表示している
。しかるに論理回路図をデータ処理装置に入力する場合
、この手書き文字部分が特別な文字枠内で書かれたもの
ではなく、文字間の連続部分が存在するためにこの手書
き文字を認識することができなかった。そのため従来で
は回路設計者が図面を作成する場合にこの手書き文字の
記号部分をパンチカードにデータとして入力し、カード
リーグでデータ処理装置に入力しなければならなかった
。By the way, in logic circuit diagrams and the like, these symbols are displayed with handwritten characters to indicate names of circuit elements, human input signals, and the like. However, when inputting a logic circuit diagram into a data processing device, this handwritten character cannot be recognized because it is not written within a special character frame, but because there are continuous parts between characters. There wasn't. For this reason, in the past, when a circuit designer created a drawing, he or she had to input the symbol portion of the handwritten characters as data on a punch card, and then input it into a data processing device using a card league.
そのため回路設計者には図面の作成の外に手書き文字部
分をデータ入力しなければならないという負担がか\る
ので、この手書き文字部分を自動読取りできるような装
置の開発が要求されている。As a result, circuit designers are burdened with having to input data of handwritten characters in addition to creating drawings, so there is a demand for the development of a device that can automatically read these handwritten characters.
本発明の目的は、このような手書き文字部分の認識に際
して必要な、文字枠という規定がなく書かれた文字列群
の中で文字と文字が接合したデータに対してこれを分離
して個々の文字を抽出することを可能とする文字分離方
式を提供することである。The purpose of the present invention is to separate data in which characters are joined in a group of character strings written without a character frame, which is necessary for recognizing such handwritten character parts, and to separate them into individual characters. The object of the present invention is to provide a character separation method that allows character extraction.
この目的を達成するため、本発明の文字分離方式では、
接合された手書き文字を保持する手書き文字保持手段と
、この接合された手書き文字領域の文字量中心推定位置
より一定範囲内を走査して特異線分を抽出する特異線分
抽出手段と、この特異線分が文字バタンと接触する特異
線分終点を検出する特異線分終点検出手段と、この特異
線分終点により文字パタンを分離する文字分離処理部を
備え、接合された手書き文字バタンから1文字分の文字
パタンを分離するようにしたことを特徴とする。To achieve this objective, the character separation method of the present invention:
handwritten character holding means for holding joined handwritten characters; singular line segment extraction means for extracting a singular line segment by scanning within a certain range from the estimated character center position of the joined handwritten character area; It is equipped with a singular line segment end point detection means for detecting a singular line segment end point where a line segment contacts a character stamp, and a character separation processing unit that separates a character pattern using this singular line segment end point, and is capable of detecting one character from a joined handwritten character stamp. The feature is that the character pattern for minutes is separated.
本発明を一実施例にもとづき詳述するに先立ち、その動
作原理を説明する。Before describing the present invention in detail based on one embodiment, the principle of operation thereof will be explained.
(1)まず図面を走査して手書き文字グループを検出す
る。手書き文字グループは、パターンや線部分に比較し
て黒領域がある程度集合しているので容易に識別し、抽
出することがわかる。(1) First, a drawing is scanned to detect handwritten character groups. It can be seen that handwritten character groups can be easily identified and extracted because black areas are concentrated to a certain extent compared to patterns and line parts.
(2)このようにして手書き文字グループを抽出後、第
1図(イ)に示す如(、これを水平方向に走査して、同
(ロ)に示す如く、その文字グループの高さく垂直方向
の長さ)Hと長さLをめる。(2) After extracting a handwritten character group in this way, as shown in Figure 1 (a), scan this in the horizontal direction, and as shown in Figure 1 (b), the height of the character group is (length) H and length L.
それから第1図(ロ)に示す如く、この領域を垂直方向
にスキャンして分離可能な文字を分離する。この結果、
第1図においてA、ESC,Dは個別に分離可能である
が、「4N」は接合しているので第2図(イ)に示す如
く、これが一つの単位として抽出される。Then, as shown in FIG. 1(b), this area is scanned vertically to separate separable characters. As a result,
In FIG. 1, A, ESC, and D can be separated individually, but since "4N" is joined, it is extracted as one unit as shown in FIG. 2 (A).
(3)ところで通常文字の大きさは、第1図(ハ)に示
す如く、その幅と高さの比は約2対3て′あるので、こ
の場合第2図(イ)の縦YWと横XWとの比率より2文
字が接合された場合に相当することが識別される。(3) By the way, as shown in Figure 1 (C), the size of normal characters has a width to height ratio of approximately 2:3, so in this case, the vertical YW in Figure 2 (A) From the ratio with horizontal XW, it is identified that this corresponds to a case where two characters are joined.
(4)次に第2図(ロ)に示す如く、この文字領域の横
領域の中心線Cより閾値αの区域を定め、これを水平走
査して黒点と黒点とのはさまれた部分の中心位置を特異
線分としてめる。このときその一方または両方の側に黒
点領域が存在しないとき閾値αの枠部分と黒点間の中心
位置、または枠部分間の中心位置を前記特異線分とする
。(4) Next, as shown in Figure 2 (b), an area with a threshold value α is determined from the center line C of the horizontal area of this character area, and this area is horizontally scanned to find the area between the black dots. Take the center position as a singular line segment. At this time, if there is no black spot area on one or both sides, the center position between the frame portion of the threshold value α and the black spot, or the center position between the frame portions is defined as the singular line segment.
このようにして上の部分と、下の部分よりそれぞれ特異
線分をめるが、特異線分が複数本存在するときその中心
線Cに近いものを残す。In this way, singular line segments are obtained from the upper part and the lower part, respectively, but when there are a plurality of singular line segments, those close to the center line C are left.
(5)この上の方からの特異線分と、下の方からの特異
線分が文字バタンと接したとき、第2図(ニ)に示す如
く、その中心線Cに近い接点により、この文字パタンを
分離する。(5) When the singular line segment from above and the singular line segment from below touch the character slam, as shown in Figure 2 (d), this Separate character patterns.
本発明の一実施例を第3図〜第5図にもとづき、第2図
を参照しつつ説明する。An embodiment of the present invention will be described based on FIGS. 3 to 5 and with reference to FIG. 2.
図中、10は画像メモリ、11は矩形領域バ・ソファ・
メモリ、12は閾値保持レジスタ、13はアドレス制御
部、14は特異線分抽出部、15は特異線分終点検出部
、16は一文字分離処理部である。In the figure, 10 is an image memory, 11 is a rectangular area
12 is a memory, a threshold value holding register, 13 is an address control section, 14 is a singular line segment extraction section, 15 is a singular line segment end point detection section, and 16 is a single character separation processing section.
画像メモリ10はビデオ入力信号が格納されるものであ
って原画像全体が保持されるものである。The image memory 10 stores video input signals and holds the entire original image.
矩形領域バッファ・メモリ11は、前記第2図(イ)に
示す如く、接続されたものとして判定されたデータが入
力されるバッファ・メモリである。The rectangular area buffer memory 11 is a buffer memory into which data determined to be connected is input, as shown in FIG. 2(a).
閾値保持レジスタ12は、第2図(ロ)に示す閾値αが
記入されるレジスタである。この閾値αはシュミレーシ
ョンにより決定されるが、例えばXWの幅の値の10〜
20%位に定められる。The threshold value holding register 12 is a register in which the threshold value α shown in FIG. 2 (b) is written. This threshold value α is determined by simulation, but for example, from 10 to the width value of XW.
It is set at around 20%.
アドレス制御部13は画像メモリ10から第2図(イ)
に示す領域を切り出して矩形領域バ・ソファ・メモリ1
1に格納したり、あるいは矩形領域バッファ・メモリ1
1に格納された文字バタンを読み出したり、中心線Cを
中心にそれぞれ左右αずつ領域を切り出す等の如きアド
レスを発生するものである。The address control unit 13 starts from the image memory 10 as shown in FIG.
Cut out the area shown in and create a rectangular area Ba Sofa Memory 1
1 or rectangular area buffer memory 1
This function generates an address for reading out a character stamp stored in 1 or for cutting out areas α on the left and right sides of the center line C.
特異線分抽出部14は前記閾値αで設定された領域内の
特異線分を抽出するものである。ここで特異線分は文字
パタンの中間点を示すものであるが、第4図に示す如く
、領域内においてβ1の部分は文字パタンか存在しない
ためその領域の中間点を示す■が特異線分となり、β2
の部分は文字パタンP2のみが存在するため、領域の左
端部分と文字パタンP2の左側部分の中間点を示す■と
、文字パタンP2の右側部分と領域の右端部分の中間点
を示す■′とが特異線分となる。そして13の部分では
文字パタンP1の右側と文字パタンP2の左側の中間点
を示す■と、領域の右端部分と文字パタンP1の左側の
中間点を示す■′および上記■゛とが特異線分となる。The singular line segment extraction unit 14 extracts singular line segments within the area set by the threshold value α. Here, the singular line segment indicates the midpoint of the character pattern, but as shown in Figure 4, there is no character pattern in the part β1 within the area, so the symbol ■ indicating the midpoint of that area is the singular line segment. So, β2
Since only character pattern P2 exists in the part, ■ indicates the midpoint between the left end of the area and the left side of character pattern P2, and ■' indicates the midpoint between the right side of character pattern P2 and the right end of the area. is a singular line segment. In the part 13, ■, which indicates the midpoint between the right side of the character pattern P1 and the left side of the character pattern P2, ■', which indicates the midpoint between the right end of the area and the left side of the character pattern P1, and the above ■゛ are singular line segments. becomes.
そして特異線分が複数存在するとき、領域の中心線Cに
近いものを採用する。When a plurality of singular line segments exist, the one closest to the center line C of the area is adopted.
特異線分終点検出部15は、特異線分と文字パタンの接
触する終点をめるものであり、例えば第5図に示す如く
、特異線分■と文字パタンPが接触する特異線分終点E
1及び特異線分■と文字パタンPとの接触する特異線分
終点E2をめるものである。なお、特異線分終点が上ま
たは下のそれぞれにおいて複数存在するとき、中心線C
に近いものと文字パタンとの特異線分終点を検出するこ
とになる。The singular line segment end point detection unit 15 detects the end point where the singular line segment and the character pattern come into contact, and for example, as shown in FIG.
This is to find the end point E2 of the singular line segment where the character pattern P and the singular line segment 1 and the character pattern P are in contact. In addition, when there are multiple singular line segment end points on each of the upper and lower sides, the center line C
The end point of the singular line segment between the character pattern and the character pattern is detected.
一文字分離処理部16は接合されている文字パタンPを
分離処理するものであって上記特異線分終点E1および
β2のうちのいずれか中心線Cに近い方の特異線分終点
を通り中心線Cに平行な直線にもとづき文字パタンを分
離処理するものであって、第5図の例では特異線分終点
E1より垂下した直線りにもとづき文字パタンPを分離
するものである。The character separation processing unit 16 separates the joined character patterns P, and passes through the singular line segment end point which is closer to the center line C among the singular line segment end points E1 and β2, and the center line C In the example shown in FIG. 5, character patterns P are separated based on straight lines that are parallel to the end point E1 of the singular line segment.
次に本発明の一実施例構成である第3図の動作について
説明する。Next, the operation of FIG. 3, which is an embodiment of the present invention, will be explained.
(a)画像メモリ10に入力されている画像データを、
図示省略した図形処理装置で処理し、第1図(ロ)に示
す如き文字バタン群を抽出し、これを上下方向に走査し
て分離できない幅が2文字分あるWの部分を検出する。(a) Image data input to the image memory 10,
Processing is performed by a graphic processing device (not shown) to extract a character stamp group as shown in FIG.
それからこの部分の文字パタンか接合しているのか否か
を検出するため、第2図(イ)に示すYW力方向走査に
より最初に文字パタンに接触する点Sを検出し、この点
Sより周知の方法でこの文字パタンの周辺を追跡してX
Wのほぼ全幅の範囲を通過して出発点である点Sに戻っ
たとき、このXWとYWの領域に接合された文字パタン
か存在するものと判断できる。Then, in order to detect whether or not the character patterns in this part are joined, the point S that first contacts the character pattern is detected by scanning in the YW force direction shown in Figure 2 (a), and the point S that first contacts the character pattern is known from this point S. Trace the area around this character pattern using the method
When it passes through almost the full width of W and returns to point S, which is the starting point, it can be determined that a joined character pattern exists in the XW and YW regions.
(b)このようにして第2図(イ)の領域に2文字のバ
タンか接合されているものと判断されたとき、この領域
を矩形領域バッファ・メモリー1に記入する。そして第
2図(ロ)に示す如く、この領域の中心線C−Cより閾
値保持レジスター2に記入されているαの範囲の領域を
定め、特異線分抽出部14により例えば第4図に示す如
き特異線分■、■、■・−をその上方と下においてめる
。(b) In this way, when it is determined that two characters are joined in the area shown in FIG. 2(a), this area is written into the rectangular area buffer memory 1. Then, as shown in FIG. 2(b), a region within the range of α entered in the threshold value holding register 2 is determined from the center line C-C of this region, and the singular line segment extraction unit 14 determines the region as shown in FIG. 4, for example. Place singular line segments such as ■, ■, ■, - above and below it.
勿論この際、第4図の■′や■′の如き特異線。Of course, in this case, singular lines like ■' and ■' in Figure 4.
分は特異線分■、■よりも中心線C−Cから遠くにある
ので、除外されることになる。minute is further away from the center line C-C than the singular line segments ① and ②, so it will be excluded.
(C)次に特異線分終点検出部15により、前記第4図
のような処理結果により残された特異線分が、文字パタ
ンと接する点である、例えば第5図におけるEl、β2
を特異線分終点として検出する。(C) Next, the singular line segment end point detection unit 15 determines that the singular line segment left as a result of the processing shown in FIG.
is detected as the end point of the singular line segment.
(d)そして−文字分離処理部16によりこの特異線分
終点El、β2のうち中心線C−Cに近い特異線分終点
E1において、線りにもとづき文字パタンPを分離する
。(d) - The character separation processing unit 16 separates the character pattern P based on the line at the singular line segment end point E1, which is closer to the center line C-C, among the singular line segment end points El and β2.
このようにして分離された文字パタンを、それぞれ周知
の方法で辞書バタンと比較してこの分離した文字パタン
を認識することが可能となる。It becomes possible to recognize the separated character patterns by comparing each of the character patterns separated in this way with a dictionary button using a well-known method.
なお上記説明ではアルファ・ニューメリック文字を例に
して説明したが勿論本発明はこれのみに限定されるもの
ではない。1つの文字が縦方向に分離していないもので
あれば分離することが可能であり、アルファ・ニューメ
リック文字は1つの文字に分離部分が存在しないので効
果的に分離することが、可能である。In the above description, alpha numeric characters were used as an example, but the present invention is of course not limited to this. If one character is not separated in the vertical direction, it can be separated, and alpha numeric characters can be effectively separated because there is no separation part in one character.
0
しかも接合文字数は2文字のみに限定されるものではな
い。例えばその文字パタンの縦横の比より3文字の接合
と判定されたときは、その領域を3等分するような位置
に引いてその左右の閾値範囲を同等に処理すればよい。0 Furthermore, the number of joined characters is not limited to only two characters. For example, when it is determined that three characters are joined based on the aspect ratio of the character pattern, the area may be drawn to a position that divides the area into three equal parts, and the left and right threshold ranges may be processed equally.
本発明によれば接合した手書き文字パタンを比較的簡単
な手段により、正確に分離することができる。According to the present invention, joined handwritten character patterns can be accurately separated using relatively simple means.
第1図は文字パタンの説明図、第2図は接合文字パタン
の分離状態説明図、第3図は本発明の一実施例構成図、
第4図および第5図はその動作状態説明図である。
図中、10は画像メモリ、11は矩形領域バッファ・メ
モリ、12は闇値保持レジスタ、13はアドレス制御部
、14は特異線分抽出部、15は特異線分終点検出部、
16は一文字分離処理部である。
特許出願人 富士通株式会社
代理人弁理士 山 谷 晧 榮
1Fig. 1 is an explanatory diagram of a character pattern, Fig. 2 is an explanatory diagram of a separated state of a joined character pattern, and Fig. 3 is a configuration diagram of an embodiment of the present invention.
FIG. 4 and FIG. 5 are explanatory diagrams of its operating state. In the figure, 10 is an image memory, 11 is a rectangular area buffer memory, 12 is a dark value holding register, 13 is an address control section, 14 is a singular line segment extraction section, 15 is a singular line segment end point detection section,
16 is a single character separation processing section. Patent applicant Fujitsu Ltd. Representative Patent Attorney Akira Yamatani 1
Claims (1)
段と、この接合された手書き文字領域の文字量中心推定
位置より一定の範囲内を走査して特異線分を抽出する特
異線分抽出手段と、この特異線分が文字バタンと接触す
る特異線分終点を検出する特異線分終点検出手段と、こ
の特異線分終点により文字バタンを分離する文字分離処
理部を備え、接合された手書き文字バタンから1文字分
の文字バタンを分離するようにしたことを特徴とする文
字分離方式。 2、前記文字バタンかアルファ・ニューメリック文字で
あることを特徴とする特許請求の範囲第1項記載の文字
分離方式。[Scope of Claims] 1. A handwritten character holding means that holds joined handwritten characters, and a specific line segment is extracted by scanning within a certain range from the estimated character center position of the joined handwritten character area. comprising a singular line segment extraction means, a singular line segment end point detection means for detecting a singular line segment end point where the singular line segment contacts a character slam, and a character separation processing unit that separates the character bang by the singular line segment end point, A character separation method characterized in that a character stamp for one character is separated from joined handwritten character stamps. 2. The character separation method according to claim 1, wherein the character BATA is an alpha numeric character.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58246709A JPS60142784A (en) | 1983-12-29 | 1983-12-29 | Character separating system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58246709A JPS60142784A (en) | 1983-12-29 | 1983-12-29 | Character separating system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60142784A true JPS60142784A (en) | 1985-07-27 |
Family
ID=17152469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58246709A Pending JPS60142784A (en) | 1983-12-29 | 1983-12-29 | Character separating system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60142784A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6237786A (en) * | 1985-08-13 | 1987-02-18 | Matsushita Electric Ind Co Ltd | Character segmenting device |
JPS6252687A (en) * | 1985-08-30 | 1987-03-07 | Toshiba Corp | Character detecting and segmenting system for character reader |
JPS6361387A (en) * | 1986-09-02 | 1988-03-17 | Hitachi Ltd | Character segmenting system |
JPS63142485A (en) * | 1986-12-05 | 1988-06-14 | Mitsubishi Electric Corp | Character string pattern segmenting system |
JPS6436385A (en) * | 1987-07-31 | 1989-02-07 | Matsushita Electric Ind Co Ltd | Character recognition device |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56166587A (en) * | 1980-05-28 | 1981-12-21 | Toshiba Corp | Character segmenting system |
JPS5745676A (en) * | 1980-08-29 | 1982-03-15 | Fujitsu Ltd | Cut-out system of character |
-
1983
- 1983-12-29 JP JP58246709A patent/JPS60142784A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56166587A (en) * | 1980-05-28 | 1981-12-21 | Toshiba Corp | Character segmenting system |
JPS5745676A (en) * | 1980-08-29 | 1982-03-15 | Fujitsu Ltd | Cut-out system of character |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6237786A (en) * | 1985-08-13 | 1987-02-18 | Matsushita Electric Ind Co Ltd | Character segmenting device |
JPS6252687A (en) * | 1985-08-30 | 1987-03-07 | Toshiba Corp | Character detecting and segmenting system for character reader |
JPS6361387A (en) * | 1986-09-02 | 1988-03-17 | Hitachi Ltd | Character segmenting system |
JPS63142485A (en) * | 1986-12-05 | 1988-06-14 | Mitsubishi Electric Corp | Character string pattern segmenting system |
JPS6436385A (en) * | 1987-07-31 | 1989-02-07 | Matsushita Electric Ind Co Ltd | Character recognition device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5751851A (en) | Method of splitting handwritten input | |
Mullick et al. | An efficient line segmentation approach for handwritten Bangla document image | |
JPH0721310A (en) | Document recognizing device | |
JPS60142784A (en) | Character separating system | |
Lehal et al. | A technique for segmentation of Gurmukhi text | |
JPH04112283A (en) | Character separating system | |
JP2000113106A (en) | Document image processor | |
JPH06180771A (en) | English letter recognizing device | |
JPH06187489A (en) | Character recognizing device | |
JP2565150B2 (en) | Character cutting method | |
KR100286709B1 (en) | Method for separating ideographic character in alphabetic string | |
JPH07160810A (en) | Character recognizing device | |
JPS615383A (en) | Character pattern separating device | |
JP2728086B2 (en) | Character extraction method | |
JPS61190679A (en) | Character data processing device | |
JPH0713994A (en) | Character recognizing device | |
KR930012142B1 (en) | Individual character extracting method of letter recognition apparatus | |
JPS63316288A (en) | Character recognizing device | |
JP2917394B2 (en) | Character recognition device and character segmentation method | |
JP2570415B2 (en) | Character extraction method | |
JPH10162104A (en) | Character recognition device | |
JPH05174185A (en) | Japanese character recognizing device | |
JPH07168911A (en) | Document recognition device | |
JPH03122786A (en) | Optical character reader | |
JP2000181989A (en) | Character recognition device, method therefor and computer readable recording medium recording the method as program |