JPS6130313B2 - - Google Patents

Info

Publication number
JPS6130313B2
JPS6130313B2 JP53130786A JP13078678A JPS6130313B2 JP S6130313 B2 JPS6130313 B2 JP S6130313B2 JP 53130786 A JP53130786 A JP 53130786A JP 13078678 A JP13078678 A JP 13078678A JP S6130313 B2 JPS6130313 B2 JP S6130313B2
Authority
JP
Japan
Prior art keywords
signal
character
register
circuit
becomes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53130786A
Other languages
Japanese (ja)
Other versions
JPS5557973A (en
Inventor
Yoshitake Tsuji
Yukio Hoshino
Hiroyuki Kami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP13078678A priority Critical patent/JPS5557973A/en
Publication of JPS5557973A publication Critical patent/JPS5557973A/en
Publication of JPS6130313B2 publication Critical patent/JPS6130313B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は光学式文字認識装置に関し、詳しくは
文字の切り出し装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an optical character recognition device, and more particularly to a character segmentation device.

紙上の文字枠列内の記入手書き文字を光学式文
字認識装置(以下OCRと呼ぶ)で読む場合、紙
上を光学的に走査後2値量子化して個々の文字に
分離し、しかる後特徴抽出を行ない、抽出された
特徴から何という文字であるかを認識させる方法
が一般的に行なわれている。
When reading handwritten characters in a string of character frames on paper using an optical character recognition device (hereinafter referred to as OCR), the paper is scanned optically, then binary quantized and separated into individual characters, and then features are extracted. A commonly used method is to recognize the name of a character from the extracted features.

ところで光学的に走査量子化を行う際、一般的
に文字枠を光学系で検出しないような色(ドロツ
プアウトカラー)で印刷し、記入文字は枠の色と
は異なる色系統の筆記具を使用すること等により
文字枠が文字部と同等な2値量子化レベル(文字
部に相当するレベルを“1”、それ以外を“0”
とする。)にならないような操作を行なつてい
る。
By the way, when performing optical scanning quantization, the character frame is generally printed in a color that cannot be detected by the optical system (drop-out color), and the characters are written using a writing instrument with a color system different from the color of the frame. By using, etc., the character frame has the same binary quantization level as the character part (the level corresponding to the character part is "1", the rest is "0")
shall be. ).

一般に受光ダイオードアレーとか電荷結合素子
とかを用いた半導体スキヤナーには赤色系統の色
がドロツプアウトカラーとなるが、一般に用いら
れる黒インクのボールペンのあるものにはドロツ
プアウトカラーと同種の色が混存するため、それ
らのボールペンで書かれた文字の読取りが困難と
なることがある。このような文字を鉛筆で記入さ
れた文字並みに読むためにフイルターを入れると
今度は枠部のドロツプアウトカラーも文字部と同
じレベルに感知するために更に読取困難となる。
In general, semiconductor scanners that use photodetector diode arrays or charge-coupled devices use drop-out colors that are red in color, but black-ink ballpoint pens that are commonly used have drop-out colors that are similar to the drop-out colors. Because of the mixture of colors, it may be difficult to read characters written with these ballpoint pens. If a filter is installed to read such characters as if they were written with a pencil, the drop-out color of the frame will be perceived at the same level as the text, making it even more difficult to read.

この場合には枠の形を検出して量子化パターン
から除去してやれば良いのであるが実線で構成さ
れた枠の場合は文字枠に文字部が接することがあ
り文字枠を消去すると文字枠に接した文字部も消
去され、誤読の原因となる。
In this case, it would be better to detect the shape of the frame and remove it from the quantization pattern, but if the frame is made up of solid lines, the character part may touch the character frame, and if the character frame is erased, it will touch the character frame. The printed text will also be erased, causing misreading.

本発明の目的は文字枠と文字とが同系統の色で
あつても文字枠を検出し消去することによつて2
値量子化レベルの設定を簡単にしかも安定に行い
文字の切り出しおよび文字部のみの検出を可能に
する装置を提供することにある。
The purpose of the present invention is to detect and erase the character frame even if the character frame and the characters are of the same color.
To provide a device which can easily and stably set a value quantization level and can cut out characters and detect only character parts.

本発明によれば一定範囲以下の大きさを持つ信
号“1”のかたまりを点として検出する点検出手
段と、一つ一つの文字に分離すべき位置を検出す
る文字分離手段と、一定間隔で配列された点線に
より構成された文字枠を消去し、文字部のみを検
出する文字部検出手段を持つ文字切り出し装置が
得られる。即ち、文字分離手段において量子化パ
ターンの最も左の縦走査列位置から始めて右の方
へ移動しながら点検出手段により検出された点が
一定個数以上に達した走査列位置を左端とする。
この左端に縦の点線の位置ずれ幅を加えた範囲内
を縦の点線の存在すべき範囲とする。前記左端に
文字枠の幅を加えた走査列位置から縦の点線の位
置ずれ幅を加え、または減じることによつて得ら
れる縦の点線の存在すべき範囲において、前記点
検出手段により検出された点が一定個数以上に達
した走査列位置を右端とする。これにより左端と
右端の間が1つの枠と見なせる。更に、枠の右端
から隣接した枠の間隔および縦の点線の位置ずれ
幅を加えることによつて得られる縦の点線の存在
すべき範囲において、前記点検出手段により検出
された点が一定個数以上に達した走査列位置を次
の枠の左端として前述と同様な操作を行なつて次
の右端の検出を行なう。また、前記文字部検出手
段では前記縦の点線の存在すべき範囲内において
前記点検出手段により検出された点を消去する。
更に文字枠の上端及び下端の最初の横の点に対し
ては前記縦の点線の存在すべき範囲内において文
字枠の上端及び下端の存在すべき範囲を設定し、
前記範囲内において点検出手段により検出された
点の最も上の点の位置と最も下の点の位置をそれ
ぞれ上位の点位置、下位の点位置とし、前記上位
の点位置には横の点間の位置ずれ幅を加え、前記
下位の点位置には横の点間の位置ずれ幅を減じる
ことにより文字枠の上端及び下端の存在すべき範
囲を決定し、この範囲内において点検出手段によ
り検出された点を消去する。
According to the present invention, the point detection means detects as a point a cluster of signal "1"s having a size below a certain range, the character separation means detects the position to be separated into individual characters, and the A character cutting device having a character portion detecting means for erasing a character frame constituted by arranged dotted lines and detecting only a character portion is obtained. That is, the character separating means starts from the leftmost vertical scanning row position of the quantization pattern and moves to the right, and the scanning row position where a certain number of points or more are detected by the point detection means is set as the left end.
The range where the vertical dotted line should exist is defined as the left end plus the misalignment width of the vertical dotted line. The point detected by the point detection means is within the range where the vertical dotted line should exist, which is obtained by adding or subtracting the displacement width of the vertical dotted line from the scanning line position, which is the left end plus the width of the character frame. The scan line position where the number of points reaches a certain number or more is set as the right end. This allows the space between the left end and right end to be considered as one frame. Furthermore, the number of points detected by the point detection means is greater than or equal to a certain number in the range where the vertical dotted line should exist, which is obtained by adding the distance between adjacent frames and the positional deviation width of the vertical dotted line from the right end of the frame. The scan line position reached is set as the left end of the next frame, and the same operation as described above is performed to detect the next right end. Further, the character portion detecting means erases the points detected by the point detecting means within the range where the vertical dotted line should exist.
Furthermore, for the first horizontal points of the upper and lower ends of the character frame, set the range where the upper and lower ends of the character frame should exist within the range where the vertical dotted line should exist,
The positions of the uppermost point and the lowermost point of the points detected by the point detection means within the range are defined as the upper point position and the lower point position, respectively, and the upper point position includes the horizontal distance between the points. The range in which the upper and lower ends of the character frame should exist is determined by adding the positional deviation width between the horizontal points to the lower point position, and detecting the position within this range by the point detection means. Erase the marked points.

このようにして文字枠に対応する位置にある点
線を消去し、文字部のみの検出を行なう。
In this way, the dotted line at the position corresponding to the character frame is erased, and only the character portion is detected.

以下図面を用いて説明を行なう。 The following will be explained using the drawings.

第1図はOCR用紙の一例を示すものであり、
用紙800上に一定間隔で並べた点線により構成
された一行文の文字枠列と記入文字の例を示して
いる。
Figure 1 shows an example of OCR paper.
An example of a character frame string and written characters of a one-line sentence formed by dotted lines arranged at regular intervals on a sheet 800 is shown.

図中l2は文字枠の幅であり、l3は隣接した文字
枠の間隔、l1×nで記入文字一行文の大きさを含
む範囲を示している。
In the figure, l 2 is the width of the character frame, l 3 is the interval between adjacent character frames, and l 1 ×n indicates the range including the size of one line of written characters.

第2図は第1図を光電変換後2値パターンに量
子化(文字部及び点線を“1”、それ以外を
“0”で示すべきところを空白で示してある。)さ
れた量子化パターンの一部をメツシユパターンで
示したものであり、図中L1,L2,Nは第1図の
l1,l2,nに相当する量子化パターンの大きさを
示している。
Figure 2 shows a quantized pattern obtained by photoelectrically converting Figure 1 and quantizing it into a binary pattern (characters and dotted lines are shown as "1", and other parts are shown as blanks) This is a mesh pattern showing a part of
It shows the sizes of quantization patterns corresponding to l 1 , l 2 , and n.

第3図、第4図、第5図、第6図は本願の具体
的な一実施例を示す図である。
FIG. 3, FIG. 4, FIG. 5, and FIG. 6 are diagrams showing a specific embodiment of the present application.

以下第3図、第4図、第5図は信号線の番号の
後にSを付けることによりその信号線上の信号を
表わすことにする。
Hereinafter, in FIGS. 3, 4, and 5, the signal on the signal line will be represented by adding S after the number of the signal line.

第3図は点検出を説明するためのマスクの配置
の一例を示す図である。第2図のような量子化パ
ターンを第3図のような5×5のマスクで見た時
に第3図のM7〜M9,M12〜M14,M17〜M19の3×
3メツシユのうちの少なくとも1メツシユは
“1”となりマスクの周囲16メツシユが“0”と
なれば3×3の大きさ以下の“1”のかたまりを
検出することができる。(3×3の大きさ以下の
“1”のかたまりを今後は点と呼ぶことにする。) 第4図は第3図によるマスクの一実施例を示す
ブロツク図である。第4図のM1〜M25は点検出回
路の入力端子であり、第3図のマスクM1〜M25
位置がそれぞれOR回路110およびAND回路1
11のM1〜M25に入力される。第4図において、
入力端子M1,M2,M3,M4,M5,M6,M10
M11,M15,M16,M20,M21〜M25の全てが“0”
の時のみ信号115Sは“0”となり、インバー
タ113の出力信号117Sは“1”となる。一
方入力端子M7〜M9,M12〜M14,M17〜M19の少な
くとも1つが“1”の時OR回路111の出力信
号116Sは“1”となる。信号117Sおよび
信号116Sが“1”となるとAND回路112
の出力信号114Sが“1”となり、点を検出す
ることができる。
FIG. 3 is a diagram showing an example of mask arrangement for explaining point detection. When the quantization pattern shown in Figure 2 is viewed with a 5x5 mask as shown in Figure 3, the 3x of M 7 to M 9 , M 12 to M 14 , M 17 to M 19 in Figure 3 is
If at least one of the three meshes becomes "1" and 16 meshes around the mask become "0", a cluster of "1"s smaller than 3x3 can be detected. (Hereafter, clusters of "1"s with a size of 3.times.3 or less will be referred to as points.) FIG. 4 is a block diagram showing an embodiment of the mask shown in FIG. 3. M 1 to M 25 in FIG. 4 are the input terminals of the point detection circuit, and the positions of the masks M 1 to M 25 in FIG. 3 correspond to the OR circuit 110 and the AND circuit 1, respectively.
11 M1 to M25 . In Figure 4,
Input terminals M 1 , M 2 , M 3 , M 4 , M 5 , M 6 , M 10 ,
All of M 11 , M 15 , M 16 , M 20 , M 21 to M 25 are “0”
Only when this happens, the signal 115S becomes "0" and the output signal 117S of the inverter 113 becomes "1". On the other hand, when at least one of the input terminals M7 to M9 , M12 to M14 , and M17 to M19 is "1", the output signal 116S of the OR circuit 111 becomes "1". When the signal 117S and the signal 116S become “1”, the AND circuit 112
The output signal 114S becomes "1" and the point can be detected.

尚、点を検出する場合において5×5とマスク
の大きさを限定しなくても良い。
Note that when detecting points, the size of the mask does not have to be limited to 5×5.

第5図は本発明の文字切り出し装置の一実施例
を示すブロツク図である。
FIG. 5 is a block diagram showing an embodiment of the character cutting device of the present invention.

第5図の1は第2図のようなN×L1の大きさ
を持つ1行文の量子化パターンが記憶されている
N×L1のステージから構成されたシフトレジス
タ(ラインバツフアと呼ぶ)とする。シフトレジ
スタ200は第5図に示される5×Nのステージ
から成り、最上段のステージ2Nにラインバツフ
ア1の出力信号185Sを入力した後、順に下方
にシフトされる構造になつている。ラインバツフ
ア1の出力線185上の量子化パターンの信号は
第2図の図中a1の量子化パターンの信号を最初
に、2番目はa23番目はa3というように最上段の
ステージ2Nに入力し、次に2列目を同様に入力
する。なお、ラインバツフア1は読み出し信号に
よつて一定時間間隔で順にシフトレジスタ200
のステージ2Nに読み出すようにN×L1ビツト
の容量を持つメモリを使用することもできる。シ
フトレジスタ200のうち5×5個のステージ2
i〜6i(i=1………5)の値が第3図、第4
図で説明したと同等の点検出回路9で調べられ
る。ステージ2i〜6i(i=1………5)の出
力線501〜525は第4図のOR回路110お
よびOR回路111の入力端子M1〜M25にそれぞ
れ接続される。
1 in Fig. 5 is a shift register (called a line buffer) consisting of N x L 1 stages in which the quantization pattern of one line sentence having a size of N x L 1 is stored as shown in Fig. 2. do. The shift register 200 consists of 5.times.N stages shown in FIG. 5, and has a structure in which the output signal 185S of the line buffer 1 is input to the uppermost stage 2N, and then shifted downward in order. The signal of the quantization pattern on the output line 185 of the line buffer 1 is the signal of the quantization pattern of a 1 in the figure of FIG. 2 first, the second is a 2 , the third is a 3, etc. , then enter the second column in the same way. Note that the line buffer 1 is sequentially connected to the shift register 200 at fixed time intervals according to the readout signal.
It is also possible to use a memory having a capacity of N×L 1 bits for reading to stage 2N. 5×5 stage 2 of shift register 200
The values of i to 6i (i = 1...5) are shown in Figures 3 and 4.
This can be checked using a point detection circuit 9 equivalent to that explained in the figure. Output lines 501-525 of stages 2i-6i (i=1...5) are connected to input terminals M1 - M25 of OR circuit 110 and OR circuit 111 in FIG. 4, respectively.

第5図の40は1文字分のN×L2の大きさを
持つ量子化パターンを記憶するのに十分な大きさ
を持つたN×L2個以上のステージから成るシフ
トレジスタ(ワークバツフアと呼ぶ)とする。更
にシフトレジスタ200の最下段のステージ61
の出力信号183Sがワークバツフア40に入力
される。尚、ワークバツフア40もラインバツフ
ア1と同様にN×L2ビツト以上の容量を持つメ
モリであつても良い。
40 in Fig. 5 is a shift register (called a work buffer) that is large enough to store a quantization pattern with a size of N x L 2 for one character, and consists of two or more N x L stages. ). Furthermore, the lowest stage 61 of the shift register 200
The output signal 183S is input to the work buffer 40. Incidentally, like the line buffer 1, the work buffer 40 may also be a memory having a capacity of N×L 2 bits or more.

第5図のクロツク信号170Sは制御部30よ
り出力され、ラインバツフア1からの読み出しシ
フトレジスタ200のシフトおよび書き込み、ワ
ークバツフア40への書き込みに用いられる。
A clock signal 170S in FIG. 5 is output from the control section 30 and is used for shifting and writing to the read shift register 200 from the line buffer 1 and writing to the work buffer 40.

第5図の信号154Sはデータ信号であり、常
に“0”を出力する。データ信号線154はシフ
トレジスタ200のうちステージ2i〜6i(i
=1………5)の内容を“0”に書き換えること
により点を消去するための信号線である。
The signal 154S in FIG. 5 is a data signal and always outputs "0". The data signal line 154 is connected to stages 2i to 6i (i) of the shift register 200.
=1...This is a signal line for erasing a point by rewriting the contents of 5) to "0".

第5図の信号線152Sはクロツク信号170
Sの周期の2倍の周期を持つシフト・ロード制御
信号であり、制御部30より出力されると、ライ
ンバツフア1からの読み出し、シフトレジスタ2
00のシフトおよび書き込み、ワークバツフア4
0への書き込みを制御する。即ち、ラインバツフ
ア1、シフトレジスタ200、ワークバツフア4
0はシフト・ロード制御信号152Sが“1”と
なる時、クロツク信号線170よりクロツクパル
スが出力され、1回シフトを行なう。また制御部
30はシフト・ロード制御信号152Sが“0”
となる時に点消去信号153Sが“1”となると
クロツク信号線170上にクロツクパルスを出力
してステージ2i〜6i(i=1………5)のみ
をロード状態にしてデータ信号154Sによつて
ステージ2i〜6i(i=1………5)のみを
“0”にリセツトする。
The signal line 152S in FIG.
This is a shift/load control signal having a period twice that of S, and when outputted from the control unit 30, read from line buffer 1 and shift register 2.
00 shift and write, work buffer 4
Controls writing to 0. That is, line buffer 1, shift register 200, work buffer 4
0, when the shift/load control signal 152S becomes "1", a clock pulse is output from the clock signal line 170 and one shift is performed. In addition, the control unit 30 sets the shift/load control signal 152S to “0”.
When the point erasure signal 153S becomes "1" at the time when Only 2i to 6i (i=1...5) are reset to "0".

更に、シフト・ロード制御信号152Sが
“0”となる時に点消去信号153Sが“0”の
状態ではクロツク信号線170上にクロツクパル
スを出力しないことによつてシフトレジスタ20
0のステージ2i〜6i(i=1………5)の内
容は変化しない。尚、ラインバツフア1、ステー
ジ2i〜6i(i=1………5)以外のシフトレ
ジスタ200の各ステージ及びワークバツフア4
0はシフト・ロード制御信号152Sが“1”の
時クロツク信号線よりクロツクパルスが出力さ
れ、1回シフトするがシフト・ロード制御信号1
52Sが“0”の時には、各ステージの内容は変
化しないようになつている。
Furthermore, if the point erase signal 153S is "0" when the shift/load control signal 152S is "0", the shift register 20 is not outputted on the clock signal line 170.
The contents of stages 2i to 6i (i=1...5) of 0 do not change. Note that each stage of the shift register 200 other than the line buffer 1 and stages 2i to 6i (i=1...5) and the work buffer 4
0 means that when the shift/load control signal 152S is "1", a clock pulse is output from the clock signal line, and the clock is shifted once, but the shift/load control signal 152S is "1".
When 52S is "0", the contents of each stage do not change.

第5図の信号163Sは制御部30より出力さ
れる一走査列終了信号であり、ラインバツフア1
に記憶された量子化パターンの縦方向の1列分が
シフト(N回)すると“1”になる。
A signal 163S in FIG. 5 is a one-scan line end signal output from the control unit 30,
When one column of the quantization pattern stored in the vertical direction is shifted (N times), it becomes "1".

第5図の201は縦の点線範囲決定部であり、
レジスタ11、レジスタ46、走査列位置カウン
ター10比較回路12、比較回路47、OR回路
300から構成される。縦の点線位置ずれ幅記憶
レジスター46には第2図の縦の点線位置ずれ幅
ΔL2が記憶されている。一文字切り出し開始値
記憶レジスタ11は後述する文字枠の左端が検出
されるまでリセツト信号168Sによつて“0”
にリセツトされているが、文字枠の左端が検出さ
れると信号167Sにより文字枠の幅L2から縦
の点線の位置ずれ幅ΔL2を引いた値(L2−Δ
L2)がセツトされ、後述する文字枠の右端が検出
されるとリセツト信号168Sにより再び“0”
にリセツトされる。走査列位置カウンター10
は、一走査終了列信号163Sが“1”になると
1カウントアツプされ、文字枠の左端あるいは右
端に対応する走査列位置が検出されると、リセツ
ト信号168Sにより“0”にリセツトされる。
比較回路12において走査列位置カウンター10
の値が一文字切り出し開始値記憶レジスタ11の
値より大きいか否かを調べ、大きければその出力
信号160Sが“1”となる。
201 in FIG. 5 is a vertical dotted line range determination section,
It is composed of a register 11, a register 46, a scanning column position counter 10, a comparison circuit 12, a comparison circuit 47, and an OR circuit 300. The vertical dotted line positional deviation width storage register 46 stores the vertical dotted line positional deviation width ΔL 2 shown in FIG. The character extraction start value storage register 11 is kept at "0" by the reset signal 168S until the left end of the character frame is detected, which will be described later.
However, when the left end of the character frame is detected, a signal 167S is sent to calculate the value (L 2 - Δ
L2 ) is set, and when the right end of the character frame (described later) is detected, it is set to "0" again by the reset signal 168S.
will be reset to Scanning row position counter 10
is incremented by one when the one-scanning end column signal 163S becomes "1", and is reset to "0" by the reset signal 168S when the scanning column position corresponding to the left or right end of the character frame is detected.
In the comparator circuit 12, the scanning column position counter 10
It is checked whether the value of is larger than the value of the single character extraction start value storage register 11, and if it is, the output signal 160S becomes "1".

また走査列位置カウンター10の値が縦の点線
位置ずれ幅記憶レジスタ46の値(ΔL2)より小
さいか否かを調べ小さければその出力信号159
Sが“1”となる。これによつて縦の点線が不揃
いな場合や傾いた場合も縦の点線位置ずれ幅Δ
L2により決まる許容範囲内にあれば、前記点検
出回路により検出された点は縦の点線の一部と見
なす。
Also, it is checked whether the value of the scanning column position counter 10 is smaller than the value (ΔL 2 ) of the vertical dotted line position shift width storage register 46, and if it is smaller, the output signal 159
S becomes "1". As a result, even if the vertical dotted lines are uneven or tilted, the vertical dotted line position shift width Δ
If the point is within the tolerance determined by L2 , the point detected by the point detection circuit is considered to be part of the vertical dotted line.

なお、信号160Sが、あるいは信号159S
が“1”となるとOR回路300が開いて縦の点
線範囲決定部201の出力信号156Sが“1”
となる。
Note that the signal 160S or the signal 159S
When becomes "1", the OR circuit 300 opens and the output signal 156S of the vertical dotted line range determining section 201 becomes "1".
becomes.

第5図の202は縦方向に並んだ点の個数が一
定値以上か決定する縦の点線検出部であり、レジ
スタ18、点計数カウンター17、比較回路16
から構成される。レジスタ18には縦方向の点の
個数の標準値(r)が記憶される。点計数カウン
ター17は点検出回路9の出力信号114S及び
点線範囲決定部201の出力信号156Sがそれ
ぞれ“1”になるとAND回路302の出力信号
が1”となり、1カウントアツプされる。即ち、
点計数カウンター17は縦方向に並んだ点の個数
をカウントする。比較回路16において一走査線
列了信号163Sが“1”のとき点計数カウンタ
ー17が縦方向の点の個数の標準値(r)記憶レ
ジスタ18の内容より大きいか否かを調べ、大き
ければその出力信号157Sが“1”となる。信
号157Sが“1”となると文字枠の右端かある
いは左端が検出されたことになる。
Reference numeral 202 in FIG. 5 is a vertical dotted line detection unit that determines whether the number of points arranged in the vertical direction is greater than or equal to a certain value.
It consists of The standard value (r) of the number of points in the vertical direction is stored in the register 18. When the output signal 114S of the point detection circuit 9 and the output signal 156S of the dotted line range determination unit 201 each become "1", the output signal of the AND circuit 302 becomes "1", and the point counting counter 17 is incremented by 1. That is,
The point counting counter 17 counts the number of points arranged in the vertical direction. In the comparator circuit 16, when the one scanning line row complete signal 163S is "1", the point counting counter 17 checks whether the standard value (r) of the number of vertical points is larger than the content of the storage register 18, and if it is larger, the value is The output signal 157S becomes "1". When the signal 157S becomes "1", it means that either the right end or the left end of the character frame has been detected.

文字枠の左端が検出された時には制御部30よ
りリセツト信号168S及びセツト信号167S
が出力され走査列位置カウンター10はリセツト
信号168Sにより“0”にリセツトされ、一文
字切り出し開始値記憶レジスタにはセツト信号1
67SによりL2−ΔL2がセツトされる。文字枠
の右端が検出された時にはリセツト信号168S
が制御部30より出力され、走査列位置カウンタ
ー10及び一文字切り出し開始値記憶レジスタ1
1は“0”にリセツトされる。なお、点計数カウ
ンター17は縦の点線範囲決定部201の出力信
号156Sが“0”になると制御部30より出力
されるリセツト信号181Sにより“0”にリセ
ツトされる。
When the left end of the character frame is detected, the control unit 30 sends a reset signal 168S and a set signal 167S.
is output, the scanning line position counter 10 is reset to "0" by the reset signal 168S, and the character cutting start value storage register is set to the set signal 1.
67S sets L 2 -ΔL 2 . When the right edge of the character frame is detected, a reset signal 168S is sent.
is output from the control unit 30, and the scanning line position counter 10 and the single character extraction start value storage register 1
1 is reset to "0". Note that the point counting counter 17 is reset to "0" by a reset signal 181S output from the control section 30 when the output signal 156S of the vertical dotted line range determination section 201 becomes "0".

第5図の14は2ビツトカウンターであり、縦
の点線検出部202の出力信号157Sが“1”
となると1カウントアツプする。また2ビツトカ
ウンター14の2ビツト目が“1”になれば、一
文字切り出し信号158Sが“1”になり、その
後でリセツト信号182Sにより“0”にセツト
される。即ち、一文字切り出し信号158Sは文
字枠の右端が検出される時に“1”となる。
14 in FIG. 5 is a 2-bit counter, and the output signal 157S of the vertical dotted line detection section 202 is "1".
Then, the count increases by 1. Further, when the second bit of the 2-bit counter 14 becomes "1", the single character cutting signal 158S becomes "1", and is then set to "0" by the reset signal 182S. That is, the single character cutting signal 158S becomes "1" when the right end of the character frame is detected.

次に文字部のみの検出について説明する。 Next, detection of only the character portion will be explained.

第2図の図中ΔN2は横の点間の位置ずれ幅を
示し、ΔN1は最初に検出される横方向の上位の
点を見つけるための許容範囲を示す。
In FIG. 2, ΔN 2 indicates the positional deviation width between the horizontal points, and ΔN 1 indicates the allowable range for finding the first detected upper point in the horizontal direction.

第6図は第5図の横の点線範囲決定部45の具
体的な構成回路である。第6図の451はカウン
ターであり、シフト・ロード制御信号152Sが
“1”となり、第5図のラインバツフア1、シフ
トレジスタ200、ワークバツフア40が1回シ
フトすると1カウントアツプされ、一走査列終了
信号163Sが“1”となると“0”にリセツト
される。即ち、カウンター451の値は、量子化
パターンの上端からの縦の位置を示している。レ
ジスタ456には横の点間の位置ずれ幅ΔN2
記憶されている。457は加算回路であり、レジ
スタ456の値(ΔN2)とカウンター451の値
を加える。452は減算回路であり、カウンター
451の値からレジスタ456の値(ΔN2)を引
く。レジスタ453およびレジスタ458は、は
じめに文字枠の上端及び下端の最初に検出される
点を得るに十分な初期設定値(ΔN1及びN−Δ
N1)が記憶されている。
FIG. 6 shows a specific configuration circuit of the range determining section 45 shown in the horizontal dotted line in FIG. Reference numeral 451 in FIG. 6 is a counter, and when the shift/load control signal 152S becomes "1" and the line buffer 1, shift register 200, and work buffer 40 in FIG. When 163S becomes "1", it is reset to "0". That is, the value of the counter 451 indicates the vertical position from the top of the quantization pattern. The register 456 stores the positional deviation width ΔN 2 between horizontal points. 457 is an adder circuit which adds the value (ΔN 2 ) of the register 456 and the value of the counter 451. A subtraction circuit 452 subtracts the value (ΔN 2 ) of the register 456 from the value of the counter 451. Register 453 and register 458 initially have initial setting values (ΔN 1 and N−Δ
N 1 ) is stored.

比較回路454においてカウンター451の値
がレジスター453の値(はじめにΔN1がセツ
トされている。)より小さいか否かを調べ、小さ
ければその出力信号471Sが“1”となる。ま
た比較回路455においてカウンター451の値
がレジスター458の値(はじめにN−ΔN1
セツトされている。)より大きいか否かを調べ、
大きければその出力信号472Sが“1”とな
る。信号471Sかあるいは信号472Sが
“1”となると横の点線範囲決定部45の出力信
号169Sが“1”となる。また、信号471S
および縦の点線範囲決定部の出力信号156Sが
“1”となる時に点検出回路により点が検出さ
れ、信号114Sが“1”となるとAND回路4
76が開いて信号473Sが“1”となる。信号
473Sが“1”となるとレジスター456の値
(ΔN2)とカウンター451の値が加算回路45
7により加えられ、レジスター415に記憶され
る。
A comparison circuit 454 checks whether the value of the counter 451 is smaller than the value of the register 453 (initially set to ΔN1 ), and if it is smaller, the output signal 471S becomes "1". Also, in the comparison circuit 455, it is checked whether the value of the counter 451 is larger than the value of the register 458 (N- ΔN1 is set first).
If it is larger, the output signal 472S becomes "1". When the signal 471S or the signal 472S becomes "1", the output signal 169S of the horizontal dotted line range determining section 45 becomes "1". Also, signal 471S
When the output signal 156S of the vertical dotted line range determination section becomes "1", a point is detected by the point detection circuit, and when the signal 114S becomes "1", the AND circuit 4
76 is opened and the signal 473S becomes "1". When the signal 473S becomes “1”, the value of the register 456 (ΔN 2 ) and the value of the counter 451 are added to the adder circuit 45.
7 and stored in register 415.

比較回路416においてレジスタ415の値が
ワークレジスタ459(はじめはΔN1がセツト
されている。)より小さいか否かを調べ、小さけ
れば出力信号830Sが“1”となり、レジスタ
415の値がワークレジスター459に転送さ
れ、ワークレジスタ415の値によつてレジスタ
459の値が変更される。
The comparator circuit 416 checks whether the value of the register 415 is smaller than the work register 459 (initially ΔN 1 is set), and if it is, the output signal 830S becomes "1" and the value of the register 415 becomes the work register. 459, and the value of the register 459 is changed according to the value of the work register 415.

一走査列終了信号163Sが“1”となるとワ
ークレジスタ459の値がレジスタ453に転送
され、レジスタ453の値がワークレジスタ45
9の値によつて変更される。このようにしてレジ
スタ453には縦の点線の最上位の点の位置に横
の点間の位置ずれ幅ΔN2を加えた値がセツトさ
れる。
When the one scanning line end signal 163S becomes "1", the value of the work register 459 is transferred to the register 453, and the value of the register 453 is transferred to the work register 45.
Changed by the value of 9. In this way, the register 453 is set to a value obtained by adding the positional deviation width ΔN 2 between the horizontal points to the position of the highest point on the vertical dotted line.

一方、信号472S及び縦の点線範囲決定部の
出力信号156Sが“1”となつた時、点検出回
路9により点が検出され、信号114Sが“1”
となるとAND回路477が開いて信号474S
が“1”となる。信号474Sが“1”となると
カウンター451の値からレジスタ456の値
(ΔN2)を減算回路452において引かれ、レジ
スタ420に記憶される。
On the other hand, when the signal 472S and the output signal 156S of the vertical dotted line range determination section become "1", a point is detected by the point detection circuit 9, and the signal 114S becomes "1".
Then, the AND circuit 477 opens and the signal 474S
becomes “1”. When the signal 474S becomes "1", the value of the register 456 (ΔN 2 ) is subtracted from the value of the counter 451 in the subtraction circuit 452 and stored in the register 420.

比較回路421において、レジスタ420の値
がワークレジスタ460(はじめはN−ΔN1
セツトされている。)より大きいか否かを調べ、
大きければ出力信号831Sが“1”となり、レ
ジスタ420の値がワークレジスタ460に転送
されワークレジスタ460の値がレジスタ420
の値によつて変更される。
The comparison circuit 421 checks whether the value of the register 420 is larger than the work register 460 (initially set to N- ΔN1 );
If it is larger, the output signal 831S becomes "1", the value of the register 420 is transferred to the work register 460, and the value of the work register 460 is transferred to the register 420.
is changed by the value of .

一走査列終了信号163Sが“1”となるとワ
ークレジスタ460の値がレジスタ458に転送
され、レジスタ458の値がワークレジスタ42
0の値によつて変更される。このようにしてレジ
スタ458には縦の点線の最下位の点の位置から
横の点間の位置ずれ幅ΔN2を減じた値がセツト
される。
When the one scanning line end signal 163S becomes "1", the value of the work register 460 is transferred to the register 458, and the value of the register 458 is transferred to the work register 42.
Changed by a value of 0. In this way, a value obtained by subtracting the positional deviation width ΔN 2 between the horizontal points from the position of the lowest point on the vertical dotted line is set in the register 458.

尚、縦の点線範囲決定部201の出力信号15
6Sかあるいは横の点線範囲決定部45の出力信
号169Sが“1”となると第5図のOR回路3
01が開き、更に点検出回路9によつて点が検出
されて、その出力信号が“1”となると第5図の
AND回路303が開いて第5図の点消去信号1
53Sが“1”となるため前述のようにステージ
2i〜6i(i=1………5)の内容が“0”に
なり点は消去される。
Note that the output signal 15 of the vertical dotted line range determination unit 201
6S or the output signal 169S of the horizontal dotted range determining section 45 becomes "1", the OR circuit 3 of FIG.
01 is opened, a point is further detected by the point detection circuit 9, and the output signal becomes "1", as shown in FIG.
The AND circuit 303 opens and the point erasure signal 1 in FIG.
Since 53S becomes "1", the contents of stages 2i to 6i (i=1...5) become "0" and the points are erased as described above.

また一行文の文字の分離が終了すると制御部3
0よりセツト信号195Sが出力され、レジスタ
453及びワークレジスタにはΔN1、レジスタ
458及びワークレジスタ460にはN−ΔN1
のそれぞれの初期設定値がセツトされる。
Also, when the separation of characters in a single line sentence is completed, the control unit 3
A set signal 195S is output from 0, ΔN 1 is output to the register 453 and the work register, and N-ΔN 1 is output to the register 458 and the work register 460.
The initial setting values for each are set.

一文字切り出し信号158Sが出力されると制
御部30はラインバツフア1、ワークバツフア4
0、レジスタ200、走査列位置カウンター10
をホールド状態にし、更にワークバツフア40に
すでに記憶されている一文字分の量子化パターン
を文字認識部のメモリパターン領域(図面は省
略)へ転送する。
When the single character cutting signal 158S is output, the control unit 30 controls the line buffer 1 and the work buffer 4.
0, register 200, scan column position counter 10
is placed in a hold state, and the quantization pattern for one character already stored in the work buffer 40 is transferred to the memory pattern area (not shown) of the character recognition section.

文字認識部より認識終了信号(図面は省略)が
出力されるとクロツク信号170S及びシフト・
ロード制御信号152Sにより、レジスタ20
0、ラインバツフア1、ワークバツフア40はシ
フトを開始する。
When a recognition end signal (not shown in the drawing) is output from the character recognition section, the clock signal 170S and shift signal are output.
The load control signal 152S causes the register 20
0, line buffer 1, and work buffer 40 start shifting.

更に、一走査列終了信号163Sにより走査列
位置カウンター10はカウントを開始する。
Furthermore, the scanning column position counter 10 starts counting in response to the one scanning column end signal 163S.

このようにして一文字を次々と分離する。 In this way, characters are separated one after another.

以上のように本願により文字枠を積極的に検出
することにより個々の文字に分離することができ
しかもその後文字枠を消去することにより、文字
部のみの量子化パターンを得ることができ、光学
的に走査した枠の色と文字部の色が同系統であつ
ても2値量子化パターンを安定に抽出することが
できる。
As described above, by actively detecting the character frame according to the present application, it is possible to separate the characters into individual characters, and by subsequently erasing the character frame, it is possible to obtain a quantization pattern of only the character part, and optically Even if the color of the scanned frame and the color of the character part are the same, a binary quantization pattern can be stably extracted.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はOCR用紙上に一定間隔に縦・横に並
べた点線により構成された一行分の文字枠列の例
を示した図である。第2図は、第1図を2値パタ
ーンに量子化された量子化パターンの一部をメツ
シユパターンで示した図である。第3図は第2図
のような量子化パターンのうち一定の大きさ以下
の点を検出する5×5のマスクを示した図であ
り、第4図は一定の大きさ以下の点を検出するた
めの点検出回路の具体例を示した図である。第5
図は本発明の文字切り出し装置の一実施例を示す
ブロツク図である。第6図は横の点線範囲決定部
での具体例を示した図である。 図において、200は5×N個のステージから
成るシフトレジスター、201は縦の点線範囲決
定部、9は点検出回路、202は縦の点線検出
部、45は横の点線範囲決定部、153は点消去
信号線、154はデータ信号線、30は制御部、
1はラインバツフアを示した図である。
FIG. 1 is a diagram showing an example of a line of character frames formed by dotted lines arranged vertically and horizontally at regular intervals on an OCR sheet. FIG. 2 is a diagram showing a part of the quantization pattern obtained by quantizing FIG. 1 into a binary pattern as a mesh pattern. Figure 3 shows a 5x5 mask that detects points below a certain size in the quantization pattern shown in Fig. 2, and Figure 4 shows a mask that detects points below a certain size. FIG. 3 is a diagram illustrating a specific example of a point detection circuit for detecting a point. Fifth
The figure is a block diagram showing one embodiment of the character cutting device of the present invention. FIG. 6 is a diagram showing a specific example of the horizontal dotted range determining section. In the figure, 200 is a shift register consisting of 5×N stages, 201 is a vertical dotted line range determination unit, 9 is a point detection circuit, 202 is a vertical dotted line detection unit, 45 is a horizontal dotted line range determination unit, and 153 is a vertical dotted line range determination unit. A point erasure signal line, 154 a data signal line, 30 a control unit,
1 is a diagram showing a line buffer.

Claims (1)

【特許請求の範囲】[Claims] 1 一定間隔に一定の大きさの点を直線状に並べ
て構成した点線を紙面上に縦・横に並べて印刷し
た1文字分の四角形の文字枠および前記文字枠内
に記入された文字パターンを少なくとも1組含む
領域を整数個×整数個のマス目(メツシユ)に分
割した2値の量子化パターンに変換する量子化回
路と、前記量子化パターンに一定の範囲以上には
拡散していない信号のメツシユのかたまりを点と
して検出する点検出回路と、前記量子化パターン
のうち、縦に並べた点線を含む垂直走査列範囲内
に前記点検出回路により検出された点が一定個数
以上検出される位置を文字枠の縦の点線の位置と
し、検出された縦の点線の最上位と最下位とを文
字枠の2つの横の点線の位置として検出する回路
と、前記文字枠に対応する位置にある点線を消去
する回路を具備し、文字部のメツシユのみが信号
となることを特徴とする文字切り出し装置。
1. A rectangular character frame for one character in which dotted lines formed by linearly arranging dots of a certain size at regular intervals are printed vertically and horizontally on the paper, and the character pattern written in the character frame is at least A quantization circuit that converts a region containing one set into a binary quantization pattern divided into an integer number of squares (mesh), and a quantization circuit that converts a signal that does not spread beyond a certain range into the quantization pattern a point detection circuit that detects a chunk of mesh as a point, and a position in the quantization pattern where a certain number or more of points detected by the point detection circuit are detected within a vertical scanning row range that includes vertically arranged dotted lines. is the position of a vertical dotted line in a character frame, and a circuit detects the highest and lowest points of the detected vertical dotted line as positions of two horizontal dotted lines in the character frame, and A character cutting device characterized in that it is equipped with a circuit for erasing dotted lines, and only the mesh of the character portion serves as a signal.
JP13078678A 1978-10-24 1978-10-24 Character segmentation device Granted JPS5557973A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13078678A JPS5557973A (en) 1978-10-24 1978-10-24 Character segmentation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13078678A JPS5557973A (en) 1978-10-24 1978-10-24 Character segmentation device

Publications (2)

Publication Number Publication Date
JPS5557973A JPS5557973A (en) 1980-04-30
JPS6130313B2 true JPS6130313B2 (en) 1986-07-12

Family

ID=15042637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13078678A Granted JPS5557973A (en) 1978-10-24 1978-10-24 Character segmentation device

Country Status (1)

Country Link
JP (1) JPS5557973A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0424892Y2 (en) * 1985-08-06 1992-06-12
US11268191B2 (en) 2017-11-01 2022-03-08 Korea Institute Of Fusion Energy Atomic layer polishing method and device therefor

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60160486A (en) * 1984-01-31 1985-08-22 Toshiba Corp Optical character reader
JPS61187086A (en) * 1985-02-14 1986-08-20 Hitachi Ltd Optical character reader
JPS61193277A (en) * 1985-02-20 1986-08-27 Mitsubishi Electric Corp Document reader

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0424892Y2 (en) * 1985-08-06 1992-06-12
US11268191B2 (en) 2017-11-01 2022-03-08 Korea Institute Of Fusion Energy Atomic layer polishing method and device therefor

Also Published As

Publication number Publication date
JPS5557973A (en) 1980-04-30

Similar Documents

Publication Publication Date Title
EP0277964B1 (en) Optical scanner including position sensors
EP0299383B1 (en) Method of reading identification code sheets
JP3204259B2 (en) Character string extraction method, handwritten character string extraction method, character string extraction device, and image processing device
JPS63158678A (en) Inter-word space detecting method
JPS6043555B2 (en) Printed character cutting device
JPS6130313B2 (en)
EP0606021A2 (en) Data storage device with multiple levels of spacial density
US6701013B1 (en) System for recognition of hand-written characters
WO2001093188A9 (en) Method for processing document, recorded medium on which document processing program is recorded and document processor
JPS627590B2 (en)
JP3309084B2 (en) How to digitize shapes
JPS6027088A (en) Recording method and recording carrier of digital information
JP2908495B2 (en) Character image extraction device
JPH10254610A (en) Writing data input device and program recording medium therefor
JP2913177B2 (en) Digital data recording paper
JPH0327953B2 (en)
JPH01191280A (en) Kanji recognizing system
JPS609887Y2 (en) Preprocessing circuit in character reading device
JP3272207B2 (en) Drawing paper
JPH083827B2 (en) Character image processing method
JP2721415B2 (en) Character image extraction method
JPS635797B2 (en)
JPH01145787A (en) Character segmenting method
JPS61196381A (en) Character segmenting system
JPS6333194B2 (en)