JPH03141482A - Character segmenting device - Google Patents

Character segmenting device

Info

Publication number
JPH03141482A
JPH03141482A JP1279554A JP27955489A JPH03141482A JP H03141482 A JPH03141482 A JP H03141482A JP 1279554 A JP1279554 A JP 1279554A JP 27955489 A JP27955489 A JP 27955489A JP H03141482 A JPH03141482 A JP H03141482A
Authority
JP
Japan
Prior art keywords
character
scanning
area
line
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1279554A
Other languages
Japanese (ja)
Other versions
JP2888885B2 (en
Inventor
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1279554A priority Critical patent/JP2888885B2/en
Publication of JPH03141482A publication Critical patent/JPH03141482A/en
Application granted granted Critical
Publication of JP2888885B2 publication Critical patent/JP2888885B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To improve precision by scanning inside a mask scanning area by using a scanning line mask only when a character line area whose length in a line direction exceeds a threshold is detected, and detecting a scanning path in which the number of black bits becomes minimum, and segmenting the character pattern of one unit on the basis of this position. CONSTITUTION:In the case the character line area whose length in the line direction exceeds the prescribed threshold is detected by a block detecting means 12, it is considered to be a contact character area where adjoining character patterns overlap each other or are in contact with each other, and the mask scanning area is set for the contact character area by a scanning area setting means 14, and a mask scanning means 16 scans it by using plural scanning line masks of different paths. Thus, the scanning path is which the number of the black bits on the path becomes minimum is detected from among the scanning paths of the scanning line masks, and a character segmenting means 18 divides the contact character area by a dividing line set on the basis of the position of the minimum scanning path, and segments the character pattern of every divided contact character area as the character pattern of one unit. Thus, the character pattern of one unit can be segmented precisely.

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、帳票類に記W&された文字図形の原画像パ
タンかう、−単位の文字図形パタンを切出すための文字
切出し装置に関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a character cutting device for cutting out a character/graphic pattern in units of - from an original image pattern of a character/graphic character marked "W&" on a form.

(挙来の技術) 従来より文字認識処理において、行単位に格納された文
字図形の原画像パタン(データ)から1文字分のパタン
(データ)を分離することが行なわれている。
(Prior Art) Conventionally, in character recognition processing, a pattern (data) for one character has been separated from an original image pattern (data) of a character figure stored on a line-by-line basis.

この分離に広く用いられている従来技術では、1行分の
原画像パタンを文字行方向に垂直な列方向に走査して各
主走査位置毎に文字線部分を表す黒ビットを累積し1行
分の画像パタンに関する黒ビットのヒストグラムを作成
する。そして各主走査位置毎に累積黒ビット数を予め定
めた特定の値Sと比較し、行方向における文字始端及び
終端の位置として累積黒ビット数がS以上となる主走査
位置及びSより小さい値となる主走査位置を検出し、文
字始端から終端までの領域のパタンを1文字のパタンと
して分離する(切出す)。
In the conventional technology widely used for this separation, the original image pattern for one line is scanned in the column direction perpendicular to the character line direction, and black bits representing the character line portion are accumulated for each main scanning position. Create a histogram of black bits for the image pattern. Then, the cumulative number of black bits is compared with a predetermined specific value S for each main scanning position, and the main scanning position where the cumulative number of black bits is S or more and a value smaller than S as the character start and end positions in the line direction. Detects the main scanning position where the character starts and ends, and separates (cuts out) the pattern of the area from the start of the character to the end of the character as a pattern of one character.

しかしこの従来技術では、隣接する文字同士がオーバー
ラツプする又は接触する場合、これら文字を表す黒ビッ
トの分布領域が重なってひとつとなり、これがため−文
字分のパタンを正しく切出すことができなかった。
However, in this prior art, when adjacent characters overlap or touch each other, the distribution areas of the black bits representing these characters overlap and become one, making it impossible to correctly cut out a pattern for the characters.

このような問題点を解決する従来技術として、文献I:
特公昭62−46039号公報に開示されでいる技術が
ある。
As a conventional technique for solving such problems, Document I:
There is a technique disclosed in Japanese Patent Publication No. 62-46039.

この従来技術は、一定幅の帯状の文字枠内に記入された
複数の文字の原画像パタンかう一文字分のパタンを切出
す技術であり、この従来技術1こおいては、文字枠の一
方の枠線から文字線部までの列方向における第一文字距
離の変化と、文字枠の他方の枠線から文字線部までの列
方向における第二文字距離の変化とを検出し、これら文
字距離の変化が所定以上変化した変化点ヲ検出し、一方
の枠側にて検出された第一の変化点と他方の枠側にて検
出された第二の変化点との間の少なくとも文字行方向に
お1丈る距離が所定距離内にある一対の変化点を一つの
組として検出し、この一対の変化点の位置に対応して文
字の切出し位置を決定する。この結果、隣接する文字同
士がオーバーラツプする場合にも、これら接触文字を精
度良く分離して一文字分のパタンを切出すことができる
This prior art is a technique for cutting out a pattern for one character from the original image pattern of a plurality of characters written in a band-shaped character frame of a constant width. A change in the first character distance in the column direction from the frame line to the character line part and a change in the second character distance in the column direction from the other frame line of the character frame to the character line part are detected, and changes in these character distances are detected. Detects the change point where the change is more than a predetermined value, and detects the change point at least in the character line direction between the first change point detected on one frame side and the second change point detected on the other frame side. A pair of change points within a predetermined distance of one length are detected as one set, and a character cutting position is determined in accordance with the position of the pair of change points. As a result, even when adjacent characters overlap, it is possible to accurately separate these touching characters and cut out a pattern for one character.

(発明が解決しようとする課題) しかしながら上述した文献工の従来技術では、第一文字
距離の変化を検出するために文字枠の全面に関して原画
像パタンを走査し、ざらに第二文字距離の変化を検出す
るために文字枠の全面に関して原画像パタンを走査する
必要があり、これら2回の走査を行なうために処理速度
が遅くなるという問題点があった。
(Problem to be Solved by the Invention) However, in the prior art of the literature engineer described above, in order to detect a change in the first character distance, the original image pattern is scanned over the entire surface of the character frame, and the change in the second character distance is roughly detected. In order to detect the character frame, it is necessary to scan the original image pattern over the entire surface of the character frame, and there is a problem in that the processing speed becomes slow because these two scans are performed.

この発明の目的は上述した従来の問題点を解決するため
、文字同士がオーバーラツプ又は接触している場合に少
ない走査量で原画像パタンかう一文字分のパタンを切出
すことができる文字切出し装Mを提供することにある。
The purpose of this invention is to solve the above-mentioned conventional problems by providing a character cutting device M that can cut out a pattern for one character from an original image pattern with a small amount of scanning when characters overlap or touch each other. It is about providing.

(課題を解決するための手段) この目的の達成を図るため、この発明の文字切出し装置
は、 文字図形の原画像パタンから一単位の文字図形パタンそ
切出す文字切出し装置において、1行分の原画像パタン
壱行方向と垂直な列方向に投影して得られる列方向の累
積黒と・ント数のヒストグラムに基づいて、1行分の原
画像パタンの文字線領域を検出するブロック検出手段と
、文字線領域の行方向における長さが所定の閾値を越え
るとき、当該文字線領域を接触文字領域とみなし接触文
字領域のマスク走査領域の位置を設定する走査領域設定
手段と、 走査経路がそれぞれ異なる複数の走査線マスクを用いて
マスク走査領域内の原画像パタンを走査し、走査線マス
クの走査経路のなかから走査経路上の黒ビット数が最小
となる最小走査経路を検出するマスク走査手段と、 最小走査経路の位置に基づき設定した分割線で接触文字
領域を分割し、該分割した接触文字領域毎の文字図形パ
タンを一単位の文字図形パタンとしで切出す文字切出し
手段とを備えて成ることを特徴とする文字切出し装置。
(Means for Solving the Problem) In order to achieve this object, the character cutting device of the present invention cuts out one unit of character figure pattern from the original image pattern of character figure. block detection means for detecting a character line area of one row of the original image pattern based on a histogram of cumulative black and nt counts in the column direction obtained by projecting the original image pattern in a column direction perpendicular to the first row direction; scanning area setting means for determining the character line area to be a contact character area and setting the position of a mask scanning area for the contact character area when the length of the character line area in the row direction exceeds a predetermined threshold; a mask scanning means for scanning an original image pattern within a mask scanning area using a plurality of scanning line masks, and detecting a minimum scanning path in which the number of black bits on the scanning path is minimized from among the scanning paths of the scanning line mask; , character cutting means that divides the contact character area by a dividing line set based on the position of the minimum scanning path, and cuts out the character figure pattern of each divided contact character area as one unit character figure pattern. A character cutting device characterized by:

(作用) このような構成の文字切出し装Hによれば、行方向にお
ける長さが所定の閾@を越える文字線領域を検出した場
合、当該文字線領域を隣接する文字図形同士がオーバー
ラツプする或は接触する接触文字領域とみなす(以下、
これら互いにオーバーラツプ或は接触する文字図形を接
触文字図形と称す)。そしてこの接触文字領域を、接触
文字図形の各文字図形毎に分割するための分割線を設定
する。この分割線で分割された接触文字領域の文字図形
パタンを一単位例えば−文字分のパタンとして原画像デ
ータから切出す。
(Function) According to the character cutting device H having such a configuration, when a character line area whose length in the line direction exceeds a predetermined threshold is detected, adjacent character figures overlap each other in the character line area. is considered to be the touching character area (hereinafter,
These character figures that overlap or touch each other are called touching character figures). Then, a dividing line is set to divide this touching character area into each character figure of the touching character figures. The character/graphic pattern of the contact character area divided by the dividing line is cut out from the original image data as one unit, for example, a pattern for a - character.

分割線の設定に当っては、接触文字領域に対しマスク走
査領域を設定し、このマスク走査領域内を、走査経路が
異なる複数の走査線マスクを用いて走査する。そして、
走査線マスクの走査経路のなかからその経路上の黒ビッ
ト数が最小となる走査経路を検出する。この最小走査経
路上の黒ビット数が最小であるがゆえに、最小走査経路
及びこの経路近傍領域では接触文字図形の文字線の重な
りは最も少ないか又は重なりは無いとみなせる。
In setting the dividing line, a mask scanning area is set for the contact character area, and the inside of this mask scanning area is scanned using a plurality of scanning line masks having different scanning paths. and,
A scanning path with the minimum number of black bits on that path is detected from among the scanning paths of the scanning line mask. Since the number of black bits on this minimum scanning path is the minimum, it can be considered that the character lines of the touching character figures have the least amount of overlap or no overlap in the minimum scanning path and the area near this path.

従って最小走査経路及びこの経路近傍領域を包含する領
域内の任意好適な位置に分割線を設定する(例えば最小
走査経路を分割線とする)ことによって、精度良く一単
位の文字図形パタンを切出せる。
Therefore, by setting a dividing line at any suitable position within the area that includes the minimum scanning path and the area near this path (for example, by setting the minimum scanning path as the dividing line), it is possible to accurately cut out one unit of character/figure pattern. .

(実施例) 以下、図面を参照し、この発明の実施例につき説明する
。尚、図面はこの発明が理解できる程度に概略的に示さ
れているにすぎず、従って各構成成分の形状、配設値1
及び寸法を図示例に限定するものではない。
(Embodiments) Hereinafter, embodiments of the present invention will be described with reference to the drawings. It should be noted that the drawings are merely shown schematically to the extent that this invention can be understood, and therefore the shapes of each component and the arrangement values 1
and dimensions are not limited to the illustrated example.

第1図はこの発明の実施例の構成の説明に供する機能ブ
ロック図である。
FIG. 1 is a functional block diagram for explaining the configuration of an embodiment of the present invention.

この実施例の文字切出し装置10は、第1図にも示すよ
うに、1行分の原画像パタンを行方向と垂直な列方向に
投影して得られる列方向の累積黒ビット数のヒストグラ
ムに基づいて、1行分の原画像パタンの文字線領域を検
出するブロック検出手段12と、文字vJ領領域行方向
における長さが所定の閾値を越えるとき、当該文字線領
域を接触文字領域とみなし接触文字領域のマスク走査領
域の位置を設定する走査領域設定手段14と、走査経路
がそれぞれ異なる複数の走査線マスクを用いてマスク走
査領域内の原画像パタンを走査し、走査線マスクの走査
経路のなかから走査経路上の黒ビット数が最小となる最
小走査経路を検出するマスク走査手段16と、最小走査
経路の位置に基づき設定した分割線で接触文字領域を分
割し、この分割した接触文字領域毎の文字図形パタンを
一単位の文字図形パタンとして切出す文字切出し手段1
8とを備え、ざらに走査線マスクを格納するマスクメモ
リ20を備えて成る。
As shown in FIG. 1, the character cutting device 10 of this embodiment produces a histogram of the cumulative number of black bits in the column direction, which is obtained by projecting the original image pattern for one row in the column direction perpendicular to the row direction. Based on this, a block detection means 12 detects a character line area of the original image pattern for one line, and when the length of the character vJ area area in the row direction exceeds a predetermined threshold, the character line area is regarded as a contact character area. Scanning area setting means 14 sets the position of the mask scanning area in the contact character area, and scans the original image pattern in the mask scanning area using a plurality of scanning line masks each having a different scanning path, and sets the scanning path of the scanning line mask. The mask scanning means 16 detects the minimum scanning path with the minimum number of black bits on the scanning path from among the scanning paths, and the contact character area is divided by a dividing line set based on the position of the minimum scanning path, and the contact character area is divided into the divided contact characters. Character cutting means 1 for cutting out character and figure patterns for each region as one unit of character and figure patterns
8, and a mask memory 20 that roughly stores a scanning line mask.

以下、この実施例につきより詳細に説明する。This example will be explained in more detail below.

この実施例では、原画像パタンとして、光電変換部22
かうの画像パタンを用いる。
In this embodiment, as the original image pattern, the photoelectric conversion unit 22
The image pattern of the elephant is used.

光電変換部22は、帳票類の文字行記載領域を1行ずつ
光学的に走査し、文字行記載領域からの光信号りを光電
変換して量子化した画像パタン、例えば文字線部を黒ビ
ット及び文字背景部を白ビットで表現した白黒2値のデ
ィジタル信号を出力する0画像メモリ24は光電変換部
22からの1行分の画像パタンを原画像パタンとして格
納する。
The photoelectric conversion unit 22 optically scans the text line writing area of the form one line at a time, photoelectrically converts the optical signal from the text line writing area, and converts it into a quantized image pattern, for example, converts the text line portion into black bits. The 0 image memory 24, which outputs a black and white binary digital signal in which the character background is expressed with white bits, stores the image pattern for one line from the photoelectric converter 22 as an original image pattern.

第2図は画像メモリ24に格納された原画像パタンの例
であり、同図において26は原画像パタンを示す。
FIG. 2 shows an example of the original image pattern stored in the image memory 24, and in the figure, 26 indicates the original image pattern.

第2図にも示すように、画像メモリ24上には任意好適
な位置を原点○とするX−Y座標系を設定しでおり、こ
の座標系で表される画素位置の原画像パタンのデータを
自在に読出せるように構成しでいる。第2図に示す例で
は、文字行が横書きの例なので、仮想的に、X軸方向を
文字行に沿う行方向及びY軸方向を行方向と直交する列
方向とする。
As shown in FIG. 2, an X-Y coordinate system is set on the image memory 24 with an arbitrary suitable position as the origin ○, and the data of the original image pattern at the pixel position represented by this coordinate system is set. It is structured so that it can be read freely. In the example shown in FIG. 2, since the character lines are written horizontally, the X-axis direction is hypothetically the row direction along the character lines, and the Y-axis direction is the column direction perpendicular to the row direction.

画像メモリ24に原画像パタンか格納されると、ブロッ
ク検出部12は1行分の原画像パタン26ヲ列方向に投
影して列方向の累積黒ビット数のヒストグラムを作成す
る。
When the original image pattern is stored in the image memory 24, the block detection unit 12 projects one row of the original image pattern 26 in the column direction to create a histogram of the cumulative number of black bits in the column direction.

第3図は第2図の画像パタン26P8走査しで作成した
ヒストグラムの例を示す図であり、同図の縦軸は累積黒
ヒツト数及び横軸は第2図のX軸に対応するX軸である
FIG. 3 is a diagram showing an example of a histogram created by scanning the image pattern 26P8 in FIG. 2, in which the vertical axis is the cumulative number of black hits, and the horizontal axis is the It is.

ブロック検出手段12はヒストグラムの作成のために、
列方向を主走査方向として画像メモリ24内の原画像デ
ータ26ヲ走査する。そしで各副走査位置X毎に走査線
SCI  CM2図参照)上の黒ビット数を累積し、各
位置X毎の累積黒ビット数から成るヒストグラムを得る
In order to create a histogram, the block detection means 12
The original image data 26 in the image memory 24 is scanned with the column direction as the main scanning direction. Then, for each sub-scanning position

次いでブロック検出手段12はヒストグラムを調べ、原
画像データ26の行方向の文字線領域を検出する。
Next, the block detection means 12 examines the histogram and detects character line areas in the row direction of the original image data 26.

第4図は第3図のヒストグラムを調べて検出した文字線
領域の分布状態を示す図であり、同図1こおいでは、第
3図のX軸に対応するX軸を横軸とすると共に、検出さ
れた文字線領域の位置をハツチングを付した矩形領域で
表す、第4図中、検出された文字線領域を符号an(n
=1.2.3)を付して示した。また第4図において、
文字線領域Bnの始端位置及び終端値Mを符号×3□及
びXgnを付しで示し、ざらに理解の助けのために、第
2図及び第3図において第4図の始端位?il X s
 n及び終端位置X。に対応する位Hを符号XS++及
びXE、1を付して示した。以下の説明では検出された
文字線領域Bn、始端位置XSn及び終端値MX。
Fig. 4 is a diagram showing the distribution state of character line areas detected by examining the histogram in Fig. 3. In Fig. 1, the horizontal axis is the X axis corresponding to the , the position of the detected character line area is represented by a hatched rectangular area. In FIG.
=1.2.3). Also, in Figure 4,
The starting end position and end value M of the character line area Bn are shown with the symbol ×3□ and Xgn attached, and for the sake of rough understanding, the starting end position of FIG. 4 in FIGS. il Xs
n and end position X. The positions H corresponding to are shown with the symbols XS++, XE, and 1. In the following description, the detected character line area Bn, start position XSn, and end value MX will be described.

を単に文字線領域B、始端位11Xs及び終端位置XE
とも表現する。
simply character line area B, start position 11Xs and end position XE
Also expressed as

プロ・ンク検出手段12は文字線領域Bを検出するため
、列方向の累積黒ビット数が予め定めた閾値THL+ 
(例えばTHLl= 1 )未満がらTHL 1以上と
なったときの副走査位It X s及びTHL 1以上
からTHL +未満になったときの副走査位置Xi:!
検出し、これら位置×8及びXEFffiのTHL 1
以上の累積黒ビット数が連続する領[8の行方向1こお
ける長ざへXを求める。そして長ざΔXを予め定めた閾
値THL2(例えばTHL2= 2 )と比較し、閾値
THL2以上の長さへXを有する領域Bを文字線領域と
して検出する。このときの位Wxs及びXEは、文字線
領域Bの行方向の始端及び終端位置である。閾値THL
+及びTHL2を任意好適に設定することによって原画
像データ26中のノイズ領域を文字線領域としで検出す
るのを避けることができる。
In order to detect the character line area B, the print detection means 12 detects the character line area B so that the cumulative number of black bits in the column direction is set to a predetermined threshold THL+
(For example, THLl=1) The sub-scanning position It
Detect and THL 1 of these positions x8 and XEFffi
Find the length X in the row direction of the area [8] where the above cumulative black bit numbers are continuous. Then, the length ΔX is compared with a predetermined threshold value THL2 (for example, THL2=2), and a region B having a length of X greater than or equal to the threshold value THL2 is detected as a character line region. The positions Wxs and XE at this time are the starting and ending positions of the character line area B in the row direction. Threshold THL
By setting + and THL2 arbitrarily and suitably, it is possible to avoid detecting a noise area in the original image data 26 as a character line area.

文字線領域Bが検出されると、走査領域設定手段14は
、ブロック検出手段12から入力した文字線領域Bの長
さへXを予め定めた閾値T)IL3と比較する。閾値T
HL3は文字線領tftBが何単位分の文字図形パタン
を包含するが判定するためのものであり、この実施例で
は1個の任意好適な値の閾値THL3を設定し、閾値T
HL3以下の長ざΔXを有する文字線領域Bは1単位分
の文字図形パタンを包含し、閾値T)lL3を越える長
ざΔXを有する文字線領域Bはオーパーラ・ンブ又は接
触する文字図形(接触文字図形)例えば第2図の数字「
1」及び「2」の2単位分のパタンを包含する接触文字
領域であるとみなす。
When the character line area B is detected, the scanning area setting means 14 compares the length X of the character line area B inputted from the block detection means 12 with a predetermined threshold value T)IL3. Threshold T
HL3 is for determining how many units of character/figure patterns the character line area tftB includes. In this embodiment, a threshold value THL3 of one arbitrary suitable value is set, and the threshold value T
A character line area B having a length ΔX of HL3 or less includes one unit of character/figure patterns, and a character line area B having a length ΔX exceeding a threshold T)lL3 includes overlapping or contacting character figures (contacting For example, the numbers in Figure 2
It is assumed that this is a touching character area that includes two units of patterns, ``1'' and ``2''.

走査領域設定手段14は長ざΔXが閾値T)IL3以下
のとき当該長さΔXの文字線領域Bの始端位置X、及び
×6と、当該文字線領域Bを分割しないことを表す情報
Pとを出力する。
When the length ΔX is less than or equal to the threshold T)IL3, the scanning area setting means 14 sets the starting end position X of the character line area B of the length ΔX and x6, and information P indicating that the character line area B is not divided. Output.

また走査領域設定手段14は長さΔXが閾i1 THL
3を越えるとき当該長ざΔXの文字線領域Bは接触文字
図形を包含する接触文字領域であるのでこれら文字図形
を一単位毎に分離するための分割線を得るべくマスク走
査領域の位置を設定し、当該接触文字領域Bの始端位置
xs及び終端値M X Eと、マスク走査領域の行方向
の始端位置XM8及び終端値WIXM!と、当該接触文
字領域Bを分割することを表す情報Qとを出力する。
Further, the scanning area setting means 14 has a length ΔX as a threshold i1 THL
When the length exceeds 3, the character line area B with the length ΔX is a contact character area that includes contact character figures, so the position of the mask scanning area is set to obtain a dividing line to separate these character figures unit by unit. Then, the start position xs and end value M X E of the touched character area B, and the start end position XM8 and end value WIXM in the row direction of the mask scanning area. and information Q indicating that the touched character area B is divided.

この実施例では、接触文字領域Bの全領域又は局所領域
の列方向の累積黒ビット数のなかから最小の累積黒ビツ
ト数lFr検出し、この最小の累積黒ビット数を得た行
方向の位置Xff、i□及び当該位置近傍の領域を包含
するようにマスク走査領域の位置XMS及びX ut’
jr設定する。これらXMS及びXMEの設定は、例え
ばX s S X MS< X ME≦Xεとなるよう
に行なえばよい。
In this embodiment, the minimum cumulative number lFr of black bits is detected from among the cumulative number of black bits in the column direction of the entire area or local area of the touching character area B, and the position in the row direction where this minimum cumulative number of black bits is obtained is determined. The position XMS and X ut' of the mask scanning area so as to include Xff, i□ and the area near the position
Set jr. The settings of XMS and XME may be set so that, for example, X s S X MS<X ME≦Xε.

第5図はマスク走査領域の設定例を示す図であり、第3
図と同様の列方向の累積黒ビット数のヒストグラムを示
す。
FIG. 5 is a diagram showing an example of setting the mask scanning area.
A histogram of the cumulative number of black bits in the column direction similar to the figure is shown.

第5図に示す例では、接触文字領域Bの任意好適な位置
例えば中央部に局所領域を設定しでおり、例えば行方向
の長さかΔX/2となるように設定した接触文字領域B
内のXc   (ΔX74)≦X≦Xe+(Δx/4)
の節回を局所領域とする。但し、Xcは行方向における
接触文字領域Bの中心位置を表す。
In the example shown in FIG. 5, a local area is set at an arbitrary suitable position, for example, the center of the contact character area B, and the contact character area B is set to have a length of ΔX/2 in the line direction, for example.
Xc (ΔX74)≦X≦Xe+(Δx/4)
Let the node gyrus of be the local region. However, Xc represents the center position of the contact character area B in the row direction.

またマスク走査領域3oヲ例えば行方向の長さがX/4
となるように設定しでおり、例えば接触文字領域B内(
7)X、、。−(ΔX/8)≦x ≦x 、、。
Further, the length of the mask scanning area 3o in the row direction is, for example, X/4.
For example, in contact character area B (
7)X... -(ΔX/8)≦x≦x,,.

+(ΔX/8)の範囲の領域をマスク走査領域3゜とす
る。
The area within the range of +(ΔX/8) is defined as a mask scanning area of 3°.

マスク走査手段16は走査領域設定手段14よっ情報P
又はQを入力し、これら情報に応じた動作を行なう。
The mask scanning means 16 receives information P from the scanning area setting means 14.
Or input Q and perform the operation according to this information.

情報Pを入力した場合、マスク走査手段16は走査領域
設定手段14がら入力した情報Pと文字線領を裟Bの位
置XS及びX、とを出力する。
When the information P is input, the mask scanning means 16 outputs the information P input from the scanning area setting means 14 and the positions XS and X of the character line area B.

また情報Qを入力した場合マスク走査手段16は走査領
域設定手段14から入力した接触文字領域Bの位置xa
及びXEと、マスク走査領域の位置XM8及びXMl:
とに基づき、走査線マスクを用いた処理のための動作を
開始する。この動作につき第6図〜第8図を譬照し、説
明する。
Further, when information Q is input, the mask scanning means 16 selects the position xa of the contact character area B input from the scanning area setting means 14.
and XE, and the positions XM8 and XMl of the mask scanning area:
Based on this, an operation for processing using a scanning line mask is started. This operation will be explained with reference to FIGS. 6 to 8.

第6図は接触文字領域の列方向の位置検出の説明に供す
る図であり、第2図と同様の原画像パタンを示す。
FIG. 6 is a diagram for explaining the position detection of the touched character area in the column direction, and shows the same original image pattern as FIG. 2.

まずマスク走査手段16は接触文字領域Bの列方向の始
端位置Y、及び終端位置Ytを検出する。
First, the mask scanning means 16 detects the starting end position Y and the ending end position Yt of the contact character area B in the column direction.

これら位置Ys 、YEの検出のため、マスク走査手段
16は、接触文字領域B (xs≦X≦X、の領域)内
の原画像パタン26ヲ行方向に投影して行方向の累積黒
ビット数のヒストグラムを作成する。この作成では、行
方向を主走査方向として接触文字領[8の原画像データ
26ヲ走査し、各副走査位1fY毎に走査1j!SC2
(第6図参照)上の黒ビット数を累積し、各位ItY毎
の累積黒ビット数から成るヒストグラムを得る。そして
このヒストグラムを調ベブロック検出手段12の行方向
の文字線領域Bの検出の場合と同様にしで、接触文字図
形已における列方向の文字線領域の始端位置Y。
In order to detect these positions Ys and YE, the mask scanning means 16 projects the original image pattern 26 in the contact character area B (area where xs≦X≦X) in the row direction and calculates the cumulative number of black bits in the row direction. Create a histogram of In this creation, original image data 26 of the contact character area [8] is scanned with the line direction as the main scanning direction, and 1j! SC2
(See FIG. 6) The above black bit numbers are accumulated to obtain a histogram consisting of the cumulative black bit numbers for each ItY. Then, this histogram is examined in the same manner as in the case of detecting the character line area B in the row direction by the block detection means 12, and the starting end position Y of the character line area in the column direction on the side of the contact character figure is determined.

及び終端位NY、を検出する。and the terminal position NY.

第6図にも示すように、点(Xs 、Ys )、(XE
 、 YS )、(Xs 、 Ye )及び(XE、Y
E)を結ぶ矩形枠は接触文字図形の外接枠Gとなる。
As shown in Fig. 6, the points (Xs, Ys), (XE
, YS ), (Xs , Ye ) and (XE, Y
The rectangular frame connecting E) becomes the circumscribing frame G of the contact character figure.

そしてマスク走査手段16は検出した位1tYs及びY
6に基づいて、マスク走査領域3oの列方向の始端位!
Yms及びYMI−を設定する。これら位置VMS及び
Y■の設定は、例えば1行分の画像パタン26の格納領
域内においてY□≦Y8、YE≦YMEとなるように行
なえばよいが、以下の説明ではV MS = Y s及
びYME=Yiとする。
Then, the mask scanning means 16 detects 1tYs and Y
6, the starting position of the mask scanning area 3o in the column direction!
Set Yms and YMI-. These positions VMS and Y■ may be set so that, for example, Y□≦Y8 and YE≦YME within the storage area of the image pattern 26 for one line, but in the following explanation, VMS = Ys and Let YME=Yi.

マスク走査領域30の位置 Y Ml、Y Miを設定
すると、次にマスク走査手段16はマスク走査領域30
(XMII≦X≦XMEかつYM8≦Y≦Yweの領域
)のマスク走査を行なう。
After setting the positions Y Ml and Y Mi of the mask scanning area 30, the mask scanning means 16 then scans the mask scanning area 30.
Mask scanning is performed in the area where XMII≦X≦XME and YM8≦Y≦Ywe.

第7図はマスク走査手段のマスク走査処理の流れの一例
を示す図である。
FIG. 7 is a diagram showing an example of the flow of mask scanning processing by the mask scanning means.

マスク走査手段16は、マスク走査領域30の位置Y 
MS、 Y MEを設定し終えると、当該マスク領域3
0を設定した接触文字領域Bに関してのマスク走査を開
始する( 5TART)。
The mask scanning means 16 scans the mask scanning area 30 at a position Y
After setting MS, Y ME, the corresponding mask area 3
Start mask scanning for the contact character area B where 0 is set (5TART).

マスク走査を開始したマスク走査手段16は、走査線マ
スクの走査経路SC3(後述する第7図参照)上の累積
黒と・ント数の最小を検出するための最小値レジスフ(
MINレジスタ)に初期値例えば1000!設定してM
INレジスタを初期化しくSl)、そして各走査線マス
ク毎に付された番号(No)を指定するための走査No
カウンタに初期値例えば11Fr設定して走査Noカウ
ンタを初期化する(S2)。
The mask scanning means 16 that has started the mask scanning calculates a minimum value register (
MIN register) to an initial value of 1000, for example! Set and M
Initialize the IN register (Sl), and scan No. to specify the number (No) assigned to each scan line mask.
The scanning number counter is initialized by setting the counter to an initial value, for example, 11Fr (S2).

次にマスク走査手段16は、走査Noカウンタの格納値
で指定される番号の走査線マスクをマスクメモリ20か
ら読み込み、マスク走査領域30内において走査線マス
クの走査経路SC3上の黒ビット数を計数(累積)し、
計数結果を81ACKレジスタに保存する(S3)。
Next, the mask scanning means 16 reads the scanning line mask of the number specified by the stored value of the scanning number counter from the mask memory 20, and counts the number of black bits on the scanning path SC3 of the scanning line mask within the mask scanning area 30. (cumulative),
The count result is stored in the 81ACK register (S3).

第8図(A)〜(F)は6種類の走査線マスクを1組の
走査線マスクとして用意した例を示す図であり、同図(
A)、(B)、(C)、(D)、(E)及び(F)はそ
れぞれ走査N。
FIGS. 8(A) to 8(F) are diagrams showing an example in which six types of scanning line masks are prepared as one set of scanning line masks.
A), (B), (C), (D), (E) and (F) are each scan N.

1.2.3.4.5及び6が付された走査線マスクを示
す。これら図において線分■、■、■、■及び■はそれ
ぞれ直線X=×□、Y=YMs+△Y/2、X =XM
E、 Y = YM8+△Y/4及びY=YM8+(Δ
Y・3/4)上の走査経路を示しく但しΔYは位置YM
8及びYMEの間の列方向にあけるM間距離)、第8図
にも示すように、行方向の走査経路■と、列方向の走査
経路■、■又は■と、行方向の走査経路■とを任意好適
に組合せることによって61!の走査経路SC3を形成
している。
1.2.3.4.5 and 6 are shown as scan line masks. In these figures, line segments ■, ■, ■, ■, and ■ are straight lines X=×□, Y=YMs+△Y/2, and X=XM, respectively.
E, Y = YM8+△Y/4 and Y=YM8+(Δ
Y・3/4), where ΔY is the position YM
8 and YME in the column direction), as shown in FIG. By any suitable combination of 61! A scanning path SC3 is formed.

S3の次に、マスク走査手段16はBLACKレジスタ
の内容が○か否か、すなわち走査経路SC3上に黒ヒツ
トが無い走査経路SC3!検出したか否かを判定する(
S4)。
Next to S3, the mask scanning means 16 checks whether the contents of the BLACK register are ○ or not, that is, the scanning path SC3 where there is no black hit on the scanning path SC3! Determine whether or not it has been detected (
S4).

S4で5LAG:にレジスタの内容がOでなければマス
ク走査手段16はS5の処理を行なう。
If the contents of the register 5LAG: are not O in S4, the mask scanning means 16 performs the processing in S5.

第6図のマスク走査領域30を第8図(A)の走査No
1の走査線マスクを用いで走査した場合、走査経路SC
3上の累積黒ビット数は2となり、従って81ACにレ
ジスタには2が保存されS4に次いでS5の処理が行な
われる。
The mask scanning area 30 in FIG. 6 is scanned by the scanning number in FIG. 8(A).
When scanning is performed using a scanning line mask of 1, the scanning path SC
The cumulative number of black bits on 3 is 2, so 2 is stored in the register 81AC, and the process of S5 is performed after S4.

S5では、BLACKレジスタ及びMINレジスタの内
容(格納値)を比較する。
In S5, the contents (stored values) of the BLACK register and the MIN register are compared.

S5でBLACにレジスタの内容がMINレジスタの内
容より小さければ、走査経路SCa上の累積黒ビット数
の最小を検出すべくMINレジスタの内容をBLACK
レジスタの内容に書換え、これと共に最小走査経路S0
3%検出すべく5CANレジスタの内容をこのときの走
査Noレジスタの内容に書換え(S6)、その後走査N
oレジスタの格納値に1を加算して走査Noを更新する
(S7)。
If the contents of the BLAC register are smaller than the contents of the MIN register in S5, the contents of the MIN register are changed to BLACK in order to detect the minimum number of cumulative black bits on the scanning path SCa.
Rewrite the contents of the register, and along with this, the minimum scanning path S0
In order to detect 3%, the contents of the 5CAN register are rewritten to the contents of the scan No. register at this time (S6), and then scan N
The scan number is updated by adding 1 to the value stored in the o register (S7).

走査No1の走査では、BLACKレジスタの内容が2
でMINレジスタの内容が1000であるので85の次
に86、S7が行なわれる。
In scan No. 1, the contents of the BLACK register are 2.
Since the content of the MIN register is 1000, 86 and S7 are performed after 85.

またS5でBLACKレジスクの内容がMINレジスタ
の内容と等しいか大きければ、S5の次に86を行なわ
ずに87の処理を行なう。
Further, if the contents of the BLACK register are equal to or larger than the contents of the MIN register in S5, the process of 87 is performed without performing 86 after S5.

S7の次に、マスク走査手段16はマスクメモリ20に
格納された走査線マスク(例えば第8図に示す6種の走
査線マスク)の全てにつきマスク走査を終了したか否か
を判定する(S8)。
Next to S7, the mask scanning means 16 determines whether or not mask scanning has been completed for all of the scanning line masks (for example, the six types of scanning line masks shown in FIG. 8) stored in the mask memory 20 (S8 ).

S8でマスク走査を行なっていない走査線マスクが残っ
ていたらS3の処理に戻る。
If there are remaining scanning line masks that have not been subjected to mask scanning in S8, the process returns to S3.

またS8で走査線マスクの全てにつきマスク走査を終了
していれば、5CANレジスタの格納値で指定される番
号の走査線マスクの走査経路SC3が最小走査経路であ
るので、当該最小走査経路の位置と、接触文字領域Bの
行方向の位置X、、X、と情報Qとを出力しくS9)、
次いでマスク走査処理を終了し、そして次の接触文字領
域SIJ<検出され次の接触文字領域已につきマスク走
査領域30の位置Y Ml Y Ml:が設定されたら
Slから処理を開始すべく待機する(END ) 。
Furthermore, if mask scanning has been completed for all of the scanning line masks in S8, the scanning path SC3 of the scanning line mask with the number specified by the value stored in the 5CAN register is the minimum scanning path, so the position of the minimum scanning path is , the position X in the row direction of the touched character area B, ,X, and the information Q should be outputted (S9).
Next, the mask scanning process is finished, and when the next touching character area SIJ< is detected and the position Y Ml Y Ml of the mask scanning area 30 is set for the next touching character area SIJ, the process waits to start the process from Sl ( END).

またS4でBLACKレジスタの内容が0であった場合
には、マスク走査手段16はこのときの走査Noレジス
クの内容(格納値)で指定される走査線マスクの走査経
路SC3は最小走査経路であるとみなし5CANレジス
クの内容をこのときの走査NOレジスタの内容に書換え
(SIO)、その後S9の処理を行なう。
Further, if the contents of the BLACK register are 0 in S4, the mask scanning means 16 determines that the scanning path SC3 of the scanning line mask specified by the contents (stored value) of the scanning No. register at this time is the minimum scanning path. Then, the content of the 5CAN register is rewritten to the content of the scan NO register at this time (SIO), and then the process of S9 is performed.

第6図のマスク走査領域30をM8図CC)の走査No
3の走査線マスクを用いて走査した場合、走査経路SC
a上の累積具ヒツト数は0となりS4で8LACKレジ
スタの内容が07:あるためS4の次に810の処理が
行なわれる。この場合S10では最小走査経路SC3の
位置としで、例えば走査経路SC3の端点D 1 (X
ME、 Ys )、D4(X、S、Y ME)及び折れ
点D2(XME、Y。
The scan number of the mask scanning area 30 in FIG. 6 is M8 (CC).
When scanning using a scanning line mask of 3, the scanning path SC
The cumulative number of hits on a becomes 0, and since the content of the 8LACK register is 07: in S4, the process of 810 is performed after S4. In this case, in S10, the position of the minimum scanning path SC3 is determined, for example, the end point D 1 (X
ME, Ys), D4 (X, S, Y ME) and bending point D2 (XME, Y.

+3・△Y/4) 、D3 (XMS、Y3+3・△y
/4)の位置が出力される。
+3・△Y/4), D3 (XMS, Y3+3・△y
/4) position is output.

文字切出し手段18はマスク走査手段16がら情報P及
び文字線領域Bの行方向の位1fXs、Xgを受信する
と、1行分の画像データ26の位置X5、XE周のパタ
ンを一単位の文字図形パタンとして切出し出力する。
When the character cutting means 18 receives the information P and the row direction positions 1fXs and Xg of the character line area B from the mask scanning means 16, the character cutting means 18 converts the pattern of the position X5 and XE circumference of the image data 26 for one line into one unit of character figure. Cut out and output as a pattern.

また、文字切出し手段18はマスク走査手段16から情
報Q、最小走査経路の位1tD1〜D4及び接触文字領
域Bの位置XS、XEを入力すると、位置D]〜D4及
び接触文字領域Bの位置Xs、X、に基づき接触文字領
域Bを分割し、分割した接触文字領域B内のパタンをそ
れぞれ切出し一単位の文字図形パタンとして出力する。
Further, when the character cutting means 18 inputs the information Q, the position of the minimum scanning path 1tD1 to D4, and the positions XS and XE of the contact character area B from the mask scanning means 16, The touching character area B is divided based on ,

第6図にも示すように、例えば点(XME、o)、Dl
、D2、D3、D4及び(XMS、 Y−a−) @結
ぶ線分を分割線として接触文字領域Bを分割すればよい
As shown in FIG. 6, for example, the point (XME, o), Dl
, D2, D3, D4 and (XMS, Y-a-) @ may be used as dividing lines to divide the contact character area B.

この発明は上述した実施例にのみ限定されるものではな
く、従って各構成成分の数値的条件、範囲、形状、位置
関係、動作、入出力信号の流れを任意好適に変更できる
The present invention is not limited to the embodiments described above, and therefore the numerical conditions, ranges, shapes, positional relationships, operations, and flows of input and output signals of each component can be changed as desired.

例えば上述した実施例では走査線マスクとして6個のマ
スクを用意したが、マスク数を増加することにより一単
位の文字図形パタンの欠けがない状態で又は欠けを最小
限度に抑えて精度良く文字切出しを行なえるようになる
For example, in the above-mentioned embodiment, six masks were prepared as scanning line masks, but by increasing the number of masks, characters can be cut out accurately without missing a unit of character figure pattern or with minimizing the missing part. You will be able to do this.

第9図(A)〜(H)は5tisの走査線マスクを用意
した例を示す図である。これら図においで線分■、■、
■及び■はそれぞれ直線Y=YMs+ΔY/8、Y=Y
M!++ΔY −3/8、Y=YM8+ΔY・5/8及
びY=VMS+ΔY・7/8上の走査経路を示し、第9
図にも示すように、走査経路■と、走査経路■、■、■
又は■と、走査経路■とを任意好適な位置、長さで結合
し組合せることによって8種の走査経路5C38形成し
でいる。
FIGS. 9A to 9H are diagrams showing an example in which a 5tis scanning line mask is prepared. In these figures, the line segments ■, ■,
■ and ■ are straight lines Y=YMs+ΔY/8, Y=Y, respectively
M! ++ΔY −3/8, Y=YM8+ΔY・5/8 and Y=VMS+ΔY・7/8, showing the scanning path on the 9th
As shown in the figure, scanning path ■, scanning path ■, ■, ■
Alternatively, eight types of scanning paths 5C38 are formed by combining and combining (1) and scanning path (2) at arbitrary suitable positions and lengths.

これら8種類の走査線マスク1こおいで行方向の走査経
路■、■、■、■の位置はΔY/8を単位としで変化し
、従ってこのΔY/8単位の変化に応して精度良く接触
文字領域を分割し一単位の文字図形パタンの切出しが行
なえる。
The positions of the scanning paths ■, ■, ■, ■ in the row direction in one mask of these eight types of scanning lines change in units of ΔY/8, and therefore, contact is made accurately according to the change in units of ΔY/8. It is possible to divide the character area and cut out one unit of character/graphic pattern.

走査線マスクの走査経路の形状は任意好適に変更するこ
とができ、上述の走査線マスクの他、文字切出し対象と
なる文字図形の連続する2文字(或は接触文字図形)を
分離するために、最も効率よく分離できる走査線マスク
を予め統計処理により求め、当該マスクをマスクメモ1
ノに登録し用いるようにしてもよい。
The shape of the scanning path of the scanning line mask can be changed arbitrarily and suitably, and in addition to the above-mentioned scanning line mask, it can be used to separate two consecutive characters (or contacting character figures) , the scanning line mask that can be separated most efficiently is determined in advance through statistical processing, and the mask is stored in mask memo 1.
It may also be registered and used in .

また上述の実施例では画像メモリに1行革位に格納した
原画像パタンがら一単位の文字図形パタンを切出す例に
つき説明したが、複数行単位に原画像パタンを格納し、
1行分の原画像パタンを切出して或は行位置等の書式情
報を用いて1行分の原画像パタンを走査するようにし上
述と同様にして一単位の文字図形パタンを切出すように
してもよい。
Further, in the above embodiment, an example was explained in which one unit of character/figure pattern is cut out from the original image pattern stored in one line in the image memory, but the original image pattern is stored in units of multiple lines,
The original image pattern for one line is cut out, or the original image pattern for one line is scanned using format information such as line position, and one unit of character/figure pattern is cut out in the same manner as described above. Good too.

またマスク走査領域は位II x ff1in及びその
近傍領域を包含する領域に限定されず、任意好適に設定
することができ、例えば接触文字領域の中央部の領域を
マスク走査領域としてもよい。
Further, the mask scanning area is not limited to the area including the position II x ff1in and its neighboring area, but can be set as desired. For example, the area at the center of the touched character area may be set as the mask scanning area.

また−単位の文字図形パタンの列方向及び行方向におけ
る切出し位置は上述の実施例のものに限定されず任意好
適に変更することができる。
Furthermore, the cutout positions of the - unit character/figure pattern in the column and row directions are not limited to those of the above-mentioned embodiments, but can be changed as desired.

また原画像パタンとして背景処理等の前処理が施された
画像バクンを用いてもよい。
Furthermore, an image background that has been subjected to preprocessing such as background processing may be used as the original image pattern.

(発明の効果) 上述した説明からも明らかなように、この発明の文字切
出し装置によれば、1行分の原画像パタンを列方向に投
影しで得たヒストグラムを調べで文字線領域の行方向の
位置%検出し、この行方向の位置から文字線領域の行方
向の長さを求める。
(Effects of the Invention) As is clear from the above description, the character segmentation device of the present invention projects the original image pattern for one line in the column direction and examines the histogram obtained. The position in the direction % is detected, and the length in the line direction of the character line area is determined from this position in the line direction.

そして行方向の長さが所定の閾値を越える文字線領域(
接触文字領域)7&検出した場合にのみ、マスク走査領
域内を走査線マスクを用いて走査して走査線マスクの走
査経路につきその経路上の累積黒ビット数が最小となる
最小走査経路を検出し、この最小走査経路の位置に基づ
いて接触文字領域を分割し、−単位の文字図形パタンを
切出す。
Then, the character line area whose length in the line direction exceeds a predetermined threshold (
(Contact character area) 7 & Only when detected, scan the inside of the mask scanning area using a scanning line mask and detect the minimum scanning path that minimizes the cumulative number of black bits on that path for the scanning path of the scanning line mask. , the contact character area is divided based on the position of this minimum scanning path, and - unit character figure patterns are cut out.

最小走査経路の位置に基づいて一単位の文字図形パタン
を切出すので、lI#l+Iする文字同士が手書きによ
りオーバーラツプ又は接触して帳票類に記入された場合
でも、−単位の文字図形パタンの欠けを無くし或は欠け
が非常に少ない状態で切出しを精度良く行なえる。
Since one unit of character/figure pattern is cut out based on the position of the minimum scanning path, even if the letters I#l+I overlap or touch each other and are written on a form by hand, there will be no loss of - unit of the character/figure pattern. Cutting can be performed with high precision without chipping or with very little chipping.

また行方向の長さが所定の閾@を越える文字線領域(接
触文字領域)を検出した場合にのみ、マスク走査領域内
を走査線マスクを用いて走査するので、従来の文字切出
し処理よりも原画像パタンの走査量を少なくすることが
でき、これがため高速に文字切出しを行なえる。
In addition, only when a character line area (contact character area) whose length in the line direction exceeds a predetermined threshold is detected, the mask scanning area is scanned using a scanning line mask, which is better than conventional character extraction processing. The amount of scanning of the original image pattern can be reduced, and therefore characters can be cut out at high speed.

従って本発明を文字認識装置に利用すれば高速な文字認
識装置が実現可能となる。
Therefore, if the present invention is applied to a character recognition device, a high-speed character recognition device can be realized.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の実施例の構成をの説明に供する機能
ブロック図、 第2図は原画像パタンの例を示す図、 第3図は列方向の累積黒ビット数のヒストグラムの例を
示す図、 第4図は文字線領域の分布状態の例を示す図、第5図は
実施例におけるマスク走査領域の設定例を示す図、 第6図は実施例における接触文字領域の列方向の位冒検
出の説明に供する図、 第7図は実施例におけるマスク走査処理の流れの一例を
示す図、 第8図(A)〜(F)は6種類の走査線マスクを用意し
た例を示す図、 第9図(A)〜(H)は8種類の走査線マスクを用意し
た例を示す図である。 10・・・文字切出し装置、12・・・ブロック検出手
段14・・・走査領域設定手段 + 6−・・マスク走査手段、26・・・原画像パタン
30・・・マスク走査領域。 第2 図 ヒストグラムの例 第3図 ×1 HXsi Xt2 X@S gs 文字線IN域の分布状態 第4図 累積黒ビット数 30 6種類の走査線マスクを用意した例 第8 図 マスク走査処理の流れの一例 第7図 u 6種類の走査線マスクを用意した例 第8図 30 8fi類の走蓋線マスクを用意した例 第9図 0 8種類の走斎線マスクを用意した例 第9 図
FIG. 1 is a functional block diagram for explaining the configuration of an embodiment of the present invention. FIG. 2 is a diagram showing an example of an original image pattern. FIG. 3 is a diagram showing an example of a histogram of the cumulative number of black bits in the column direction. 4 is a diagram showing an example of the distribution state of the character line area, FIG. 5 is a diagram showing an example of setting the mask scanning area in the embodiment, and FIG. 6 is a diagram showing the position of the contact character area in the column direction in the embodiment. Figure 7 is a diagram showing an example of the flow of mask scanning processing in the embodiment; Figures 8 (A) to (F) are diagrams showing an example in which six types of scanning line masks are prepared; , FIGS. 9A to 9H are diagrams showing an example in which eight types of scanning line masks are prepared. DESCRIPTION OF SYMBOLS 10... Character cutting device, 12... Block detection means 14... Scanning area setting means + 6-... Mask scanning means, 26... Original image pattern 30... Mask scanning area. Fig. 2 Example of a histogram Fig. 3 ×1 HXsi Xt2 An example of Fig. 7 u An example of preparing 6 types of scanning line masks Fig. 8 30 An example of preparing 8fi type scanning line masks Fig. 9 0 An example of preparing 8 types of scanning line masks Fig. 9

Claims (2)

【特許請求の範囲】[Claims] (1)文字図形の原画像パタンから一単位の文字図形パ
タンを切出す文字切出し装置において、1行分の原画像
パタンを行方向と垂直な列方向に投影して得られる列方
向の累積黒ビット数のヒストグラムに基づいて、前記1
行分の原画像パタンの文字線領域を検出するブロック検
出手段と、 前記文字線領域の行方向における長さが所定の閾値を越
えるとき、当該文字線領域を接触文字領域とみなし該接
触文字領域のマスク走査領域の位置を設定する走査領域
設定手段と、 走査経路がそれぞれ異なる複数の走査線マスクを用いて
前記マスク走査領域内の原画像パタンを走査し、前記走
査線マスクの走査経路のなかから走査経路上の黒ビット
数が最小となる最小走査経路を検出するマスク走査手段
と、 前記最小走査経路の位置に基づき設定した分割線で前記
接触文字領域を分割し、該分割した接触文字領域毎の文
字図形パタンを一単位の文字図形パタンとして切出す文
字切出し手段とを備えて成ることを特徴とする文字切出
し装置。
(1) In a character cutting device that cuts out one unit of character/figure pattern from the original image pattern of character/figures, the cumulative black in the column direction obtained by projecting the original image pattern of one line in the column direction perpendicular to the row direction. Based on the bit number histogram, the above 1
block detection means for detecting a character line area of an original image pattern for a line; when the length of the character line area in the line direction exceeds a predetermined threshold, the character line area is regarded as a contact character area; scanning area setting means for setting the position of a mask scanning area; and scanning an original image pattern within the mask scanning area using a plurality of scanning line masks each having a different scanning path, mask scanning means for detecting a minimum scanning path in which the number of black bits on the scanning path is minimized; dividing the touching character area by dividing lines set based on the position of the minimum scanning path; 1. A character cutting device comprising: a character cutting means for cutting out each character figure pattern as one unit character figure pattern.
(2)前記走査領域設定手段を、 前記接触文字領域の列方向の累積黒ビット数のなかから
最小の累積黒ビット数を検出し、該最小の累積黒ビット
数を得た行方向の位置及び当該位置近傍の領域を包含す
るマスク走査領域を設定する手段としたことを特徴とす
る請求項1に記載の文字切出し装置。
(2) The scanning area setting means detects the minimum cumulative number of black bits from among the cumulative number of black bits in the column direction of the contact character area, and detects the position in the row direction where the minimum cumulative number of black bits is obtained; 2. The character cutting device according to claim 1, further comprising means for setting a mask scanning area that includes an area near the position.
JP1279554A 1989-10-26 1989-10-26 Character extraction device Expired - Fee Related JP2888885B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1279554A JP2888885B2 (en) 1989-10-26 1989-10-26 Character extraction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1279554A JP2888885B2 (en) 1989-10-26 1989-10-26 Character extraction device

Publications (2)

Publication Number Publication Date
JPH03141482A true JPH03141482A (en) 1991-06-17
JP2888885B2 JP2888885B2 (en) 1999-05-10

Family

ID=17612584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1279554A Expired - Fee Related JP2888885B2 (en) 1989-10-26 1989-10-26 Character extraction device

Country Status (1)

Country Link
JP (1) JP2888885B2 (en)

Also Published As

Publication number Publication date
JP2888885B2 (en) 1999-05-10

Similar Documents

Publication Publication Date Title
EP0054439B1 (en) Character segmentation method
CA1160347A (en) Method for recognizing a machine encoded character
US4513442A (en) Method for locating and circumscribing text areas on a master which may contain text, graphics and/or image areas
US4817187A (en) Apparatus and method for vectorization of incoming scanned image data
US5898795A (en) Character recognition method using a method for deleting ruled lines
JPH0256708B2 (en)
JPH03141482A (en) Character segmenting device
JPS58112176A (en) Optical character reader
JP2501646B2 (en) Character background processor
JP2957729B2 (en) Line direction determination device
JP3083609B2 (en) Information processing apparatus and character recognition apparatus using the same
JP3710164B2 (en) Image processing apparatus and method
JPH0433074B2 (en)
JP2957739B2 (en) Line direction determination device
JPS62290984A (en) Pattern information inputting paper and method of recognizing pattern information using said paper
JP2980636B2 (en) Character recognition device
JP2957740B2 (en) Line direction determination device
JP2929919B2 (en) Optical character extraction device
JP2954218B2 (en) Image processing method and apparatus
JPH0377183A (en) Character segmenting device
JPH0833908B2 (en) Feature extraction method
JPH0245230B2 (en)
JPH01152586A (en) Character graphic recognizing method
JPH0421911B2 (en)
JPH0576673B2 (en)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees