JPS596419B2 - Character extraction method - Google Patents

Character extraction method

Info

Publication number
JPS596419B2
JPS596419B2 JP51008702A JP870276A JPS596419B2 JP S596419 B2 JPS596419 B2 JP S596419B2 JP 51008702 A JP51008702 A JP 51008702A JP 870276 A JP870276 A JP 870276A JP S596419 B2 JPS596419 B2 JP S596419B2
Authority
JP
Japan
Prior art keywords
character
sensor
signal
area
unit area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP51008702A
Other languages
Japanese (ja)
Other versions
JPS5291617A (en
Inventor
功雄 一色
浩二 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP51008702A priority Critical patent/JPS596419B2/en
Publication of JPS5291617A publication Critical patent/JPS5291617A/en
Publication of JPS596419B2 publication Critical patent/JPS596419B2/en
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は文字認識装置用切出し方法に関するもので、特
に文字以外のノイズ除去を効果的に行い得る文字切出し
方法に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character extraction method for a character recognition device, and more particularly to a character extraction method that can effectively remove noise other than characters.

一般に、横1行に印刷された文字を垂直方向に1列に並
んだ光電変換素子を有するセンサで垂直方向の走査をし
、該センサ或いは文字を水平方向へ移動させて順次読取
つていく。
Generally, characters printed in one horizontal line are scanned in the vertical direction by a sensor having photoelectric conversion elements arranged in a vertical row, and the sensor or characters are moved horizontally to sequentially read the characters.

第1図にセンサの視野2が文字の印刷されている用紙1
上を移動している状況を示す。用紙1には読取るべき文
字3、4、5として数「1」 「2」 「3」が印刷さ
れているほか、まわりの汚れ6、T、8がある。これら
の汚れは認識すべき文字情報以外のものであり、ノイズ
となり誤読取や読取不能の原因となる。従来、このよう
なノイズの除去には読取レベルを変えたり、センサの前
に特殊なフィルタを備えたりする方法、或いはノイズ分
ともに一度読取つてからソフト的に処理して除去する方
式などが実施されていた。
In Figure 1, the field of view 2 of the sensor is shown on paper 1 on which characters are printed.
Indicates the situation of moving above. Paper 1 has the numbers ``1'', ``2'', and ``3'' printed on it as characters 3, 4, and 5 to be read, as well as stains 6, T, and 8 around it. These stains are other than character information to be recognized, and become noise, causing misreading or unreadability. Conventionally, such noise has been removed by changing the reading level, installing a special filter in front of the sensor, or by reading the noise once and then processing it using software to remove it. was.

しかしながら、前者は動作が不確実であり、後渚は多く
のプログラム容量と処理時間を要し、且つそれでも効果
的なノイズ除去ができなかつた。本発明の目的は従来技
術における前述の欠点を除去し得るようにし、ノイズ除
去効果の高い切出し方式を提供するものである。
However, the former method has unreliable operation, and the latter method requires a large amount of program capacity and processing time, and even then, effective noise removal cannot be achieved. SUMMARY OF THE INVENTION An object of the present invention is to eliminate the above-mentioned drawbacks of the prior art and to provide a cutting method that is highly effective in removing noise.

本発明の他の目的は隣接文字との区分を確実に識別出来
るように切出す方式である。
Another object of the present invention is to provide a method for cutting out characters so that they can be reliably distinguished from adjacent characters.

本発明の更に他の目的は切出しをハードウェアによつて
実現することにより、認識部の計算機の負担を軽減し、
読取速度を向上させる切出し方式である。又本発明の更
に他の目的は走査速度が異なることが生じても、走査速
度に影響をさほどうけないように切出す方式である。本
発明は垂直方向の1走査が終るごとに、読取つたパター
ンの垂直軸へ投影した文字線分の出現頻度分布を求め、
頻度分布を正規化し、正規化データから垂直方向に連続
した一定長の線分を求め、その線分の長さの範囲から文
字の高さとして切出しをおこなうことを特徴とするもの
である。
Still another object of the present invention is to reduce the burden on the computer of the recognition unit by realizing extraction using hardware.
This is a cutting method that improves reading speed. Still another object of the present invention is to provide a method for cutting out images in such a way that even if the scanning speed differs, the scanning speed is not affected much. The present invention calculates the appearance frequency distribution of character line segments projected onto the vertical axis of the read pattern every time one scan in the vertical direction is completed,
This method is characterized by normalizing the frequency distribution, finding vertically continuous line segments of a certain length from the normalized data, and cutting out the height of the character from the length range of the line segments.

以下図面に従つて本発明を説明する。第2図は本発明の
実施例として、手にスキヤナ12を持ち水平方向に移動
させ、人手で走査する文字認繊装置の場合である。
The present invention will be explained below with reference to the drawings. FIG. 2 shows, as an embodiment of the present invention, a character recognition apparatus in which a scanner 12 is held in the hand and moved in the horizontal direction to perform manual scanning.

ランプ13a,13bで用紙11を照明し、用紙11上
の文字パターンをレンズ系14を介して1列に並んだ光
電変換素子を有するセンサ15土に結像させる。
A sheet of paper 11 is illuminated with lamps 13a and 13b, and a character pattern on the sheet of paper 11 is imaged through a lens system 14 onto a sensor 15 having photoelectric conversion elements arranged in a row.

センサ15のそれぞれの光電変換素子をセルと称し、必
要分解能までデータ圧縮した場合の領域を単位領域と称
して説明する。用紙11の背景領域からの反射光と文字
領域からの反射光はそれぞれ異なるから、それらに対応
した各セルからの信号レベルは異なる。センサ15の各
々のセルで得られた信号は制御及び二値化回路16に加
えられて、レベル判定により白黒の判定が行われる。例
えば用紙11の背景領域すなわち白に対応する信号を″
O″、文字領域すなわち黒に対応する信号″1″として
後述の各々に出力される。カウンタ制御回路25は制御
及び:値化回路16から各単位領域に対応する信号が順
次入力されると、その信号が黒即ち″17のとき、プリ
セツトカウンタ26にシフトレジスタ27の出力をプリ
セツトし、ブリセツトカウンタ26の内容に1を加算し
てシフトレジスタ27に格納する。
Each photoelectric conversion element of the sensor 15 will be referred to as a cell, and the area where data is compressed to the required resolution will be referred to as a unit area. Since the light reflected from the background area of the paper 11 and the light reflected from the character area are different, the corresponding signal levels from each cell are different. The signals obtained from each cell of the sensor 15 are applied to a control and binarization circuit 16, and black and white are determined by level determination. For example, the signal corresponding to the background area of paper 11, that is, white, is
The counter control circuit 25 receives signals corresponding to each unit area sequentially from the control and value conversion circuit 16. When the signal is black, that is, "17", the output of the shift register 27 is preset to the preset counter 26, and the content of the preset counter 26 is incremented by 1, and the result is stored in the shift register 27.

又、信号が白即ち″0″のときプリセツトカウンタ26
にシフトレジスタ2rの出力をプリセツトし、プリセツ
トカウンタ26の内容をそのまま該シフトレジスタ27
に格納するように制御するものである。またカウンタ制
御回路25は後述の1文字の走査終了信号GAPがギア
フッラグ21から入力されていると、プリセツトカウン
タ26の内容をクリアした後、信号がり7の時には1を
加鼻し、″O″の時にはそのままプリセツトカウンタ2
6の内容をシフトレジスタ27に格納する様に制御する
Also, when the signal is white, that is, "0", the preset counter 26
The output of the shift register 2r is preset to , and the contents of the preset counter 26 are directly transferred to the shift register 27
It is controlled so that the data is stored in the . Further, when the one-character scanning end signal GAP, which will be described later, is input from the gear flag 21, the counter control circuit 25 clears the contents of the preset counter 26, and when the signal is 7, adds 1 to "O". When , the preset counter 2 is used as is.
Control is performed so that the contents of 6 are stored in the shift register 27.

該シフトレジスタ27はセンサ15のセル数或いは垂直
方向へデータを圧縮すればそれに対応する単位領域数だ
けの段数を哨するものであり、垂直方向の単位領域走査
毎のパルス信号CKにより、各単位領域ごとの黒の出現
回数を計数するものであり、シフトレジスタ27の内容
は各単位領域毎の水平方向の叉字線分の出現回数を表わ
すものである。またプリセツトカウンタ26の内容をシ
フトレジスタ27へ格納する時に、ブリセツトカウンタ
26の内容を比較回路28に送る。比較回路28は記憶
装置29の内容(Aとする)とプリセツトカウンタ26
から入力される内容(Bとする)を比較し、B>Aのと
きのみBを記憶装置29に格納する。1垂直方向の走査
が終了すると制御及び二値化回路16からの信号SEN
Dのタイミングで、記憶装置29の内容を最大値記憶装
置30に移送し、その後、前記記憶装置29の内容をク
リアする。
The shift register 27 registers the number of stages corresponding to the number of cells of the sensor 15 or the number of unit areas corresponding to the data compressed in the vertical direction. The number of times black appears in each area is counted, and the contents of the shift register 27 represent the number of times a horizontal fork line segment appears in each unit area. Further, when the contents of the preset counter 26 are stored in the shift register 27, the contents of the preset counter 26 are sent to the comparison circuit 28. The comparison circuit 28 compares the contents of the storage device 29 (assumed as A) with the preset counter 26.
The contents inputted from the input terminals (referred to as B) are compared, and B is stored in the storage device 29 only when B>A. When one vertical scan is completed, the signal SEN from the control and binarization circuit 16
At timing D, the contents of the storage device 29 are transferred to the maximum value storage device 30, and then the contents of the storage device 29 are cleared.

即ち最大値記憶装置30にはシフトレジスタ27に記憶
されている各単位領域毎の黒の出現回数の計数値の最大
値を格納することになる。
That is, the maximum value storage device 30 stores the maximum value of the counted number of black appearances for each unit area stored in the shift register 27.

正規化回路31はシフトレジスタ2rの内容と最大値記
憶装置30の内容との比を求め、それを複数に区分する
。(以下正規化データと称する)人手で移動される場合
には個人差或いは同人でも走査時毎に走査速度が大幅に
異なるが、しかし本発明においては黒の出現回数の最大
値により各単位領域に出現する黒の出現回数の正規化を
行なうので、水平方向の走査速度が異なつても正規化値
は大きな影響をうけない。正規化し複数に区分された内
容は二値化回路32或いは識別回路35に送られる。
The normalization circuit 31 calculates the ratio between the contents of the shift register 2r and the contents of the maximum value storage device 30, and divides it into a plurality of ratios. (Hereinafter referred to as normalized data) When moving by hand, the scanning speed varies greatly depending on the individual or the same person, but in the present invention, the scanning speed is determined based on the maximum number of times black appears in each unit area. Since the number of appearances of black is normalized, the normalized value is not affected greatly even if the horizontal scanning speed differs. The normalized and divided contents are sent to the binarization circuit 32 or the identification circuit 35.

繊別回路35では正規化データから例えば正規化データ
の配列などにより文字を識別する。また:値化回路32
では正規化データを一定の閾値SHLと比較し二値即ち
垂直軸に投影されたパターン情報を用紙11の文字領域
と背景領域とに分ける。
The sorting circuit 35 identifies characters from the normalized data, for example, based on the arrangement of the normalized data. Also: value conversion circuit 32
Then, the normalized data is compared with a certain threshold value SHL, and the binary information, that is, the pattern information projected on the vertical axis is divided into a character area and a background area of the paper 11.

例えば第1図においてセンサ視野2がt1の位置からT
2の位置へ移動した時、T2位置における正規化データ
を第5図に、該正規化データを二値化したものを第6図
に示す。
For example, in FIG. 1, the sensor field of view 2 is from the position t1 to T
FIG. 5 shows the normalized data at the T2 position when moving to the T2 position, and FIG. 6 shows the binarized normalized data.

文字3、及び汚れ4,5に対応する正規化データは61
及び60,62となる。
The normalized data corresponding to character 3 and stains 4 and 5 is 61
and 60,62.

二値化を行なつた後の第6図では背景領域、文字領域を
それぞれW(白)、B(黒)で表現している。読出専用
記憶装置33は二値化回路32の出力信号及び記憶装置
34の出力内容から構成され読出された内容は記憶装置
34に書き込むとともに、信号SET,.POUTを出
力する。
In FIG. 6 after binarization, the background area and character area are represented by W (white) and B (black), respectively. The read-only storage device 33 is composed of the output signal of the binarization circuit 32 and the output contents of the storage device 34, and the read contents are written in the storage device 34, and the signals SET, . Output POUT.

1垂直走査終了信号SENDにより該記憶装置34はク
リアされる。
The memory device 34 is cleared by the 1 vertical scan end signal SEND.

第4図に読出専用記憶装置33の読出される内容である
状態遷移図を示す。
FIG. 4 shows a state transition diagram of the contents read from the read-only storage device 33.

二値化回路32から第6図に示す様な信号が入力される
とする。SO及びSnはセンサ視野2の最上端及び最下
端の単位領域を示す。単位領域の上端から二値化信号が
B,W,W,W,W,W,B,B,B,B,B,B,W
,W,W,B,W,W,W,W,W,,W,W,W,と
出力されたとすれば、第4図において、状態は0B,1
B,1W,0B,1B,2B,3B,4B,5B,6B
,6W,0B,1B,0Bとなる。またSET..PO
UTは状態1B,5W,6Wに成つたとき出力する信号
を表わしており、信号SETは文字の切出し始め、信号
POUTは文字の切出し終了を意味するものであり、信
号SETが何度も出力される場合にはされた信号の方を
優先している。第6図に示す二値化データでは1Bで1
度信号SETが出力され再度信号SET、次にPOUT
が出力され、垂直方向に文字の切出しが終了したことを
示す。制御及び二値化回路16では垂直走査時に現在何
番目の単位領域が選択されているかを判断するためにカ
ウンタを有しており、このカウンタの内容SCCが単位
領域のアドレスSCCを示している。
Assume that a signal as shown in FIG. 6 is input from the binarization circuit 32. SO and Sn indicate unit areas at the uppermost and lowermost ends of the sensor field of view 2. The binary signal from the upper end of the unit area is B, W, W, W, W, W, B, B, B, B, B, B, W
, W, W, B, W, W, W, W, W, , W, W, W, the states are 0B, 1 in FIG.
B, 1W, 0B, 1B, 2B, 3B, 4B, 5B, 6B
, 6W, 0B, 1B, 0B. Also SET. .. P.O.
UT represents the signal that is output when states 1B, 5W, and 6W are reached, the signal SET means the start of cutting out characters, and the signal POUT means the end of cutting out characters, and the signal SET is output many times. When a signal is sent, priority is given to the signal sent. In the binarized data shown in Figure 6, 1B is 1
The signal SET is output, the signal SET is output again, and then POUT is output.
is output, indicating that vertical character cutting has been completed. The control and binarization circuit 16 has a counter to determine which unit area is currently selected during vertical scanning, and the content SCC of this counter indicates the address SCC of the unit area.

第3図において、記憶装置49は読出専用記憶装置33
から信号SETが入力されると、その時のセルアドレス
SCCを書き込むものである。後から出力された信号の
方を優先するので、第6図の二値化データでは2度目の
SET信号で再びその時のアドレスSCCが書き込まれ
る。又記憶装置34の内容即ちその時の状態Ci(1B
,2B・・・・・・など)を記憶装置51に書き込むO
もし、文字と同じ位のノイズが存在した場合には一度切
出しを終了した後、再び同様に切出しを行なう。
In FIG. 3, a storage device 49 is a read-only storage device 33.
When the signal SET is input from the cell, the cell address SCC at that time is written. Since priority is given to the signal output later, in the binary data of FIG. 6, the address SCC at that time is written again at the second SET signal. In addition, the contents of the storage device 34, that is, the current state Ci (1B
, 2B, etc.) to the storage device 51.
If there is noise of the same level as the characters, the extraction is completed once and then the extraction is performed again in the same manner.

例えばセンサ視野2が第1図のT3の位置に移動した時
には文字5、ノイズ8の正規化データは第7図の63,
64となる。正規化データ63により切出しを終了し、
そのときのSCC.Ciは記憶装置49,51に書き込
まれ、次に正規化データ64により切出しを終了した際
、該記憶装置49,51の内容をそれぞれ記憶装置50
,52に移送した後次のSCC、Ciを記憶装置49,
51に書き込む。
For example, when the sensor field of view 2 moves to position T3 in Figure 1, the normalized data of character 5 and noise 8 are 63 and 63 in Figure 7, respectively.
It becomes 64. The extraction is finished using the normalized data 63,
SCC at that time. Ci is written to the storage devices 49 and 51, and when the extraction is finished using the normalized data 64, the contents of the storage devices 49 and 51 are written to the storage device 50, respectively.
, 52, the next SCC, Ci is transferred to the storage device 49,
Write to 51.

第3図では2度の切出しで説明したが、2度以上でも同
様である。選択回路53は、複数個切出しを行なつたも
のの中から、文字領域を選択するものであり、記憶装置
38の内容即ち直前の垂直走査にて切出されたときのア
ドレスSCC及び記憶装置51,52即ち切出した際の
状態Ciから文字領域を判定し、記憶装置49或いは5
0の一方の内容を記憶装置54に書き込む。
In FIG. 3, the explanation has been made with two cuts, but the same holds true for two or more cuts. The selection circuit 53 selects a character area from among a plurality of extracted character areas, and stores the contents of the storage device 38, that is, the address SCC when it was extracted in the previous vertical scan, and the storage device 51, 52, that is, the character area is determined from the state Ci at the time of cutting out, and the character area is determined from the storage device 49 or 5.
0 is written to the storage device 54.

例えば走査された文字領域は隣の文字領域と大きな誤差
は生じないことや、状態Ciの中で、文字の標準の高さ
に最も近いものなどから文字領域を判定する。
For example, the character area is determined based on the fact that there is no large difference between the scanned character area and the adjacent character area, and on the basis of the condition Ci that is closest to the standard height of the character.

一垂直走査が終了した時にPOUT信号が少なくとも一
度出力されている場合には選択回路53はCK2信号を
出し続け、SEND信号の到来する直前にCKlのタイ
ミングで記憶装置54の内容を記憶装置38に書き込む
ことにより該記憶装置38には垂直方向に文字を切出し
、文字の最上端の単位領域のアドレスCTAが格納され
る。
If the POUT signal has been output at least once when one vertical scan is completed, the selection circuit 53 continues to output the CK2 signal, and transfers the contents of the storage device 54 to the storage device 38 at the timing of CK1 immediately before the arrival of the SEND signal. By writing, a character is cut out in the vertical direction and the address CTA of the unit area at the uppermost end of the character is stored in the storage device 38.

信号SETはアンドゲート39によりそれぞれ単位領域
走査ごとに出力される信号CKとの論理積をとり、記憶
装置49に入力する。1垂直走査が終了すると、記憶装
置49,50,51,52の内容をクリアする。
The signal SET is logically ANDed with the signal CK output for each scan of the unit area by the AND gate 39, and is input to the storage device 49. When one vertical scan is completed, the contents of the storage devices 49, 50, 51, and 52 are cleared.

また論理積回路40の出力が論理″1″となると、切出
しフラグ42をセツトし、垂直方向に文字が切出されて
いることを示す。
Further, when the output of the AND circuit 40 becomes logic "1", a cutout flag 42 is set to indicate that a character is cut out in the vertical direction.

切出しの際のノイズなどにより出力される信号ER或い
は後述のスペース信号SPが出力されるとオアゲート4
5により切出しフラグ42をクリアし、文字が切出され
ていないものとする。文字の切出しがなされていない場
合には誤認識をさけるために文字の識別を行なわない。
演算回路44は1文字の走査終了を検出する際、文字の
垂直方向に切出された範囲よりも上に余裕をとり検出す
るためにセルのアドレスにある定数(第6図d)を加え
比較回路41に出力する。
When the signal ER, which is caused by noise during cutting, or the space signal SP, which will be described later, is output, the OR gate 4
5 clears the cutout flag 42 and assumes that no character is cut out. If the characters have not been cut out, the characters are not identified to avoid erroneous recognition.
When detecting the end of scanning for one character, the arithmetic circuit 44 adds a constant (FIG. 6 d) to the address of the cell and compares it with a margin above the vertically cut out range of the character. Output to circuit 41.

該比較回路41は切出された文字の最上端の単位領域ア
ドレスCTAと前記演算回路44から送られる内容と比
較し両渚が等しくなつた時(上端のセルをOとし、下方
のセル程アドレスが大とする)に文字高さ検出フラグ4
3へ信号を出力する。文字高さ検出フラグ43は切出し
フラグ42がセツトされておりかつ比較回路41から信
号が入力されたときセツトされ、信号POFを出力する
。カウンタ47は信号POFが論理21″になつてから
、文字の高さCHH(第6図参照)分の単位領域が走査
されるまでクロツク信号CKをカウントし、CHH個カ
ウントした時、オーバーフロー信号を出力する文字高さ
検出フラグ43は、このオーバーフロー信号と1列垂直
走査終了信号SENDとの論理和信号(論理和回路48
)によりクリアされる。例えば垂直走査時のSCCの内
容をSnとし、文字の高さはhとわかつているので、)
第6図においてCHH=h+2d CTA+h+d≧Sn≧CTA−dのとき文字工リアで
あり、信号POFを出力する。
The comparison circuit 41 compares the unit area address CTA of the uppermost end of the cut out character with the content sent from the arithmetic circuit 44, and when both sides are equal (the upper end cell is set to O, and the lower cells have addresses) is large), character height detection flag 4
Outputs the signal to 3. The character height detection flag 43 is set when the cutout flag 42 is set and a signal is input from the comparison circuit 41, and outputs a signal POF. The counter 47 counts the clock signal CK after the signal POF becomes logic 21'' until a unit area corresponding to the character height CHH (see FIG. 6) has been scanned, and when it has counted CHH, it outputs an overflow signal. The character height detection flag 43 to be output is an OR signal (OR circuit 48) of this overflow signal and the 1-column vertical scanning end signal SEND.
) is cleared by For example, we know that the content of the SCC during vertical scanning is Sn, and the height of the character is h.)
In FIG. 6, when CHH=h+2d CTA+h+d≧Sn≧CTA-d, the character is in operation, and the signal POF is output.

カウンタ4rはまた信号SENDによつてクリ 〉アさ
れる。
Counter 4r is also cleared by signal SEND.

以上の動作で第6図にPOFとして示すように垂直方向
の文字位置が切出されたこととなる。次に水平方向の切
出しについて述べる。ギヤツプ検出フラグ18,19は
垂直走査終了後に発生されるSEND信号によつてセツ
トされ、ギ5アップ検出フラグ18は垂直方向切出し信
号POFの間で黒(文字線分)が検出されたときクリア
され、ギヤツプ検出フラグ19は一垂直走査内で黒(文
字線分)が検出された時クリアされるフリツプフロツプ
である。一垂直走査終了後SEND信号を発生する直前
にクロツクCKlのタイミングでギヤツプ検出フラグ1
8,19の出力信号の論理和をとり(論理和回路20)
この論理信号をギヤツプフラグ21へ記憶すると共にギ
ヤツプフラグ21の内容をギヤツプフラグ22に 4移
送する。つまりギヤツプフラグ21は垂直方向文字切出
し区間(POF)で文字線分が検出されなかつた時ある
いは一垂直走査内で文字線分がまつたく検出されなかつ
た時にセツトされるフラグであり、ギヤツプフラグ22
は直前の垂直走査時のギヤツプフラグ21の内容を記憶
するものである。ギヤツプフラグ21の出力信号GAP
は前記カウンタ制御回路25へ出力し、且つアンドゲー
ト23により信号SENDとの論理積をとつてスペース
カウンタ24の内容を加算する。該スペースカウンタ2
4の内容があらかじめ設定した定数以上になると1行の
文字を走査終了とみなし、スペース信号SPを出力し、
初期状態とする。スペースカウンタ24は黒(文字線分
)が検出された時クリアされる。ギヤツプフラグ22は
信号BFGAPを出力し、信号GAPを格納する。
With the above operations, the character position in the vertical direction is cut out as shown as POF in FIG. 6. Next, we will discuss cutting out in the horizontal direction. Gap detection flags 18 and 19 are set by the SEND signal generated after vertical scanning, and gap up detection flag 18 is cleared when black (character line segment) is detected between the vertical cutting signals POF. , a gap detection flag 19 is a flip-flop that is cleared when black (character line segment) is detected within one vertical scan. Immediately before generating the SEND signal after one vertical scan, the gap detection flag is set to 1 at the timing of clock CKl.
Take the logical sum of the output signals of 8 and 19 (logical sum circuit 20)
This logic signal is stored in the gap flag 21 and the contents of the gap flag 21 are transferred to the gap flag 22. In other words, the gap flag 21 is a flag that is set when no character line segment is detected in the vertical character extraction section (POF) or when no character line segment is detected at all within one vertical scan.
is used to store the contents of the gap flag 21 during the previous vertical scan. Output signal GAP of gap flag 21
is output to the counter control circuit 25, and is ANDed with the signal SEND by the AND gate 23, and the contents of the space counter 24 are added. The space counter 2
When the content of 4 exceeds a preset constant, it is considered that one line of characters has been scanned and a space signal SP is output.
Initial state. The space counter 24 is cleared when black (character line segment) is detected. The gap flag 22 outputs the signal BFGAP and stores the signal GAP.

このとき、BFGAPが″1″かつGAPが202のと
き1文字の走査が終了したとみなし、文字の識別を行う
。第1図において、位置T2にセンサ視野2が移動した
とき、第6図に示すように切出されたとすると、ギヤツ
プ検出フラグ19は/′0″であるが、ギヤツプ検出フ
ラグ18は″1″となりギヤツプフラグ21は7「5に
セツトされる。
At this time, when BFGAP is "1" and GAP is 202, it is assumed that scanning of one character has been completed, and the character is identified. In FIG. 1, when the sensor field of view 2 moves to position T2, if it is cut out as shown in FIG. 6, the gap detection flag 19 is /'0'', but the gap detection flag 18 is ``1''. Then, the gap flag 21 is set to 7"5.

T2以前の位置ではギヤツプフラグ21は″O″とすれ
ばT2でGAP=″17BFGAP=′207となり1
文字の走査が終了したとみなし以後識別動作をする。
If the gap flag 21 is set to "O" at the position before T2, then at T2 GAP="17BFGAP='207 and 1
It assumes that character scanning is completed and then performs identification operations.

スペースカウンタ24では文字と文字との間にて垂直走
査される回数よりもはるかに大きい回数で1行の終了と
する。以上説明したように、本発明では垂直走査ごとに
垂直軸に投影した各単位領域毎に文字線分の出現頻度分
布を求め、単位領域毎の出現回数を最大出現回数で正規
化したのち、文字の切出しを行うため、走査速度の影響
をうけないことを特徴としている。
The space counter 24 determines that one line ends when the number of vertical scans is much greater than the number of vertical scans between characters. As explained above, in the present invention, the appearance frequency distribution of character line segments is determined for each unit area projected onto the vertical axis for each vertical scan, the number of appearances for each unit area is normalized by the maximum number of appearances, and then the character The feature is that it is not affected by the scanning speed because it cuts out images.

又、正規化し、閾値SHL8適当に選ぶことにより:値
化を行うので、文字周辺のノイズをも除去できる。
Furthermore, by normalizing and appropriately selecting the threshold value SHL8, value conversion is performed, so that noise around characters can also be removed.

説明ではセンサ15のセル数と同じ段数のシフトレジス
タ27としたが、データの圧縮などを行ないシフトレジ
スタ27の段数を減らすことも可能である。
In the description, the shift register 27 has the same number of stages as the number of cells of the sensor 15, but it is also possible to reduce the number of stages of the shift register 27 by compressing data or the like.

又、読取の対称とする文字やセンサの寸法などから第4
図に示す状態遷移は異なる。
In addition, the fourth factor is determined based on the characters to be read and the dimensions of the sensor.
The state transitions shown in the diagram are different.

以上の説明では水平方向の走査速度が可変の場合につい
て述べたが、例えば機械的に一定速度で走査する時には
各単位領域毎の文字線分の出現回数の計数値と該出現回
数の最大値との比を求めなくて、計数値のみでも同様で
ある。
The above explanation deals with the case where the scanning speed in the horizontal direction is variable, but for example, when scanning is performed mechanically at a constant speed, the count value of the number of appearance of character line segments for each unit area and the maximum value of the number of appearance The same is true if you do not calculate the ratio of , but only the count value.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は読取文字と読取ヘツドとの関係図、第2図、第
3図は本発明のプロツク図、第4図は読取専用記憶装置
の説明図、第5図及び7図は文字線分の出現頻度分布図
、第6図は二値化変更図を示す。 符号の説明、1・・・・・・用紙、2・・・・・・セン
サ、3・・・・・・文字、4,5・・・・・・ノイズ、
11・・・・・・用紙、12・・・・・・スキヤナ、1
3a,b・・・・・・ランプ、14・・・・・・レンズ
系、15・・・・・・センサ、16・・・・・・制御、
及び二値化回路、17,23,39,40,46・・・
・・・アンドゲート、20,45,48・・・・・・オ
アゲート、18,19・・・・・・ギヤツプ検出フラグ
、21,22・・・・・・ギヤツプフラグ、24・・・
・・・スペースカウンタ、25・・・・・・カウンタ制
御回路、26・・・・・・プリセツトカウンタ、27・
・・・・・シフトレジスタ、28・・・・・・比較回路
、29・・・・・・記憶装置、30・・・・・・最大値
記憶装置、31・・・・・・正規化回路、32・・・・
・・:値化回路、33・・・・・・読出専用記憶装置、
34・・・・・・記憶装置、35・・・・・・識別回路
、3r,38・・・・・・記憶装置、41・・・・・・
比較回路、42・・・・・・切出しフラグ、43・・・
・・・文字高さ検出フラグ、44・・・・・・演算回路
、47・・・・・・文字高さカウンタ、50,51,5
2,54・・・・・・記憶装置、53・・・・・・選択
回路。
Figure 1 is a diagram of the relationship between read characters and read heads, Figures 2 and 3 are block diagrams of the present invention, Figure 4 is an explanatory diagram of a read-only storage device, and Figures 5 and 7 are character line segments. The appearance frequency distribution diagram, FIG. 6 shows the binarization change diagram. Explanation of symbols, 1...Paper, 2...Sensor, 3...Character, 4,5...Noise,
11...paper, 12...scanner, 1
3a, b... Lamp, 14... Lens system, 15... Sensor, 16... Control,
and binarization circuit, 17, 23, 39, 40, 46...
...AND gate, 20,45,48...OR gate, 18,19...Gap detection flag, 21,22...Gap flag, 24...
... Space counter, 25 ... Counter control circuit, 26 ... Preset counter, 27.
... Shift register, 28 ... Comparison circuit, 29 ... Storage device, 30 ... Maximum value storage device, 31 ... Normalization circuit , 32...
...: Value conversion circuit, 33... Read-only storage device,
34...Storage device, 35...Identification circuit, 3r, 38...Storage device, 41...
Comparison circuit, 42... Cutting flag, 43...
... Character height detection flag, 44 ... Arithmetic circuit, 47 ... Character height counter, 50, 51, 5
2, 54... Storage device, 53... Selection circuit.

Claims (1)

【特許請求の範囲】 1 文字、記号などを垂直方向或いは水平方向に並んだ
光電変換素子を有するセンサで走査し、走査された文字
、記号などを識別する文字認識装置において、センサの
文字線分の出現回数を各単位領域毎に計数し、センサ配
列方向の単位領域毎の文字線分の出現頻度分布を求め、
この出現頻度分布によつてセンサ列方向の文字領域を検
出し、センサ配列の方向に文字領域が複数個検出された
場合にはその中から一つを選択することによつてセンサ
列方向の文字領域の切出しを行なうことを特徴とする文
字切出し方式。 2 文字、記号などを垂直方向或いは水平方向に並んだ
光電変換素子を有するセンサで走査し走査された文字、
記号などを識別する文字認識装置において、センサの文
字線分の出現回数を各単位領域毎に計数し、センサ配列
方向の単位領域毎の文字線分の出現頻度分布を求め、さ
らに各単位領域毎の文字線分の出現回数の最大値を検知
し、該最大値と単位領域毎に計数された出現回数との比
によつて正規化された出現頻度分布を求めて、センサ列
方向に複数個の文字領域を検出した場合、その中から一
つを選択することにより、文字領域の切出しを行なうこ
とを特徴とする文字切出し方法。
[Claims] 1. In a character recognition device that scans characters, symbols, etc. with a sensor having photoelectric conversion elements arranged vertically or horizontally, and identifies the scanned characters, symbols, etc., character line segments of the sensor are used. The number of occurrences of is counted for each unit area, and the appearance frequency distribution of character line segments for each unit area in the sensor array direction is calculated.
The character area in the direction of the sensor array is detected based on this appearance frequency distribution, and if multiple character areas are detected in the direction of the sensor array, one is selected from them to detect the character area in the direction of the sensor array. A character cutting method characterized by cutting out an area. 2. Characters, symbols, etc. that are scanned by a sensor having photoelectric conversion elements arranged vertically or horizontally;
In a character recognition device that identifies symbols, etc., the number of occurrences of character line segments on the sensor is counted for each unit area, the appearance frequency distribution of character line segments for each unit area in the sensor array direction is calculated, and the frequency distribution of character line segments for each unit area is calculated. Detect the maximum number of occurrences of character line segments, find the appearance frequency distribution normalized by the ratio of the maximum value to the number of occurrences counted for each unit area, and detect multiple numbers in the sensor row direction. 1. A character extraction method characterized in that when a character area is detected, the character area is extracted by selecting one of the character areas.
JP51008702A 1976-01-28 1976-01-28 Character extraction method Expired JPS596419B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP51008702A JPS596419B2 (en) 1976-01-28 1976-01-28 Character extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP51008702A JPS596419B2 (en) 1976-01-28 1976-01-28 Character extraction method

Publications (2)

Publication Number Publication Date
JPS5291617A JPS5291617A (en) 1977-08-02
JPS596419B2 true JPS596419B2 (en) 1984-02-10

Family

ID=11700254

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51008702A Expired JPS596419B2 (en) 1976-01-28 1976-01-28 Character extraction method

Country Status (1)

Country Link
JP (1) JPS596419B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6128319U (en) * 1984-07-26 1986-02-20 株式会社クボタ rice transplanter
JPS6342001U (en) * 1986-09-08 1988-03-19
JPH052282B2 (en) * 1985-03-14 1993-01-12 Kubota Kk

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6128319U (en) * 1984-07-26 1986-02-20 株式会社クボタ rice transplanter
JPH052282B2 (en) * 1985-03-14 1993-01-12 Kubota Kk
JPS6342001U (en) * 1986-09-08 1988-03-19

Also Published As

Publication number Publication date
JPS5291617A (en) 1977-08-02

Similar Documents

Publication Publication Date Title
US5048096A (en) Bi-tonal image non-text matter removal with run length and connected component analysis
US4180800A (en) Character reading system
US4104616A (en) Hand operated optical character recognition system
JPS63261486A (en) Writing style identifying device
US5381241A (en) Method for discriminating between figure and text areas of an image
JPS6357831B2 (en)
US4797940A (en) Optical character reader
KR100383858B1 (en) Character extracting method and device
JPH0721310A (en) Document recognizing device
CA1316605C (en) Method of searching binary images to find search regions in which straight lines may be found
EP0144006B1 (en) An improved method of character recognitionand apparatus therefor
JPS596419B2 (en) Character extraction method
JP3089396B2 (en) Mark reading apparatus and method
JPS594065B2 (en) Character extraction method
JPS594066B2 (en) Character extraction method
JPS596418B2 (en) Character reading method
JP2753427B2 (en) Binary threshold setting device
JPS61221982A (en) Calculating device for surrounding length of picture pattern
JPH0575850A (en) Picture area discriminating device
JPS6343788B2 (en)
JPH0357507B2 (en)
JPH0660226A (en) Character reader
JPH10233930A (en) Image processor
JPH05143733A (en) Contour extracting device
JPS5936309B2 (en) Character reading method