JPH07175927A - Image processor - Google Patents

Image processor

Info

Publication number
JPH07175927A
JPH07175927A JP5319801A JP31980193A JPH07175927A JP H07175927 A JPH07175927 A JP H07175927A JP 5319801 A JP5319801 A JP 5319801A JP 31980193 A JP31980193 A JP 31980193A JP H07175927 A JPH07175927 A JP H07175927A
Authority
JP
Japan
Prior art keywords
run
image
ruled line
signal
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5319801A
Other languages
Japanese (ja)
Other versions
JP3253201B2 (en
Inventor
Hiroki Sugano
浩樹 菅野
Gururajiyu Rao
ラオ・グルラジュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP31980193A priority Critical patent/JP3253201B2/en
Publication of JPH07175927A publication Critical patent/JPH07175927A/en
Application granted granted Critical
Publication of JP3253201B2 publication Critical patent/JP3253201B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

PURPOSE:To efficiently perform the registration of a document by discriminating the classification of an object image from the information such as the location/ length, etc., of the ruled line extracted from the object image and enabling a document classification work without manual aid. CONSTITUTION:The image signal of a picture element under consideration in a processing object image is binarized in a binarization means, a black run length is calculated from this binarized image signal in a run length coding means 3, a short run is eliminated from this encoded run length code in a run elimination means 4, the area of connected runs is investigated based on the image signal where this short run is eliminated, a rectangle circumscribed about this area is extracted by a labeling/circumscribed rectangle extraction means 5, a ruled line area is decided by a ruled line area decision means 6 by the size of this extracted rectangle and the kind of an image is discriminated from this decided ruled area by an image decision means 7.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、一般オフィスで用い
られる複数の文書画像を対象として、処理対象画像がど
の様な画像に分類できるかを判別処理する画像処理装置
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus for subjecting a plurality of document images used in a general office to determining what kind of image a processing target image can be classified.

【0002】[0002]

【従来の技術】一般に、電子ファイリング装置の文書登
録においては、単に文書にタイトルを付けて登録するだ
けでなく、迅速な検索を可能とするために、ファイル構
造を階層的に構築する。つまり、文書を分類し、キャビ
ネットやバインダといったボックスのなかに、従来の紙
文書のファイルと同じ様な概念で登録を行う。
2. Description of the Related Art Generally, in registering a document in an electronic filing apparatus, a file structure is hierarchically constructed not only to register a document with a title but also to enable a quick search. In other words, documents are classified and registered in boxes such as cabinets and binders in the same concept as conventional paper document files.

【0003】登録する文書の量が少ない場合は、この文
書分類作業を人手で行っても大した時間を要することは
無いが、大量の文書登録においては文書分類作業はかな
り煩雑な作業となる。
When the amount of documents to be registered is small, it does not take much time to manually perform this document classification work, but in the case of registering a large number of documents, the document classification work is considerably complicated.

【0004】さらに、帳票等定型フォーマットの文書の
登録では、それらの文書の分類されるボックスは予め決
まっており、この文書分類作業を人手で行うのは非効率
的である。
Further, in registering documents in a fixed format such as a form, the boxes into which those documents are classified are predetermined, and it is inefficient to manually perform this document classification work.

【0005】しかしながら、この文書分類作業を自動的
に行う方法は確立されておらず、現状の電子ファイリン
グ装置では、いかなる文書についても、文書分類作業は
人手に頼らざるを得ない。
However, a method for automatically performing this document classification work has not been established, and the current electronic filing apparatus has no choice but to rely on humans for the document classification work for any document.

【0006】[0006]

【発明が解決しようとする課題】電子ファイリング装置
等、文書の種類を識別判定することが必要な画像処理装
置においては、文書分類作業を自動的に行う方法は搭載
されておらず、文書分類作業は人手に頼っている。した
がって、文書の登録は、煩雑かつかなりの時間を要し、
効率の悪い作業であった。
In an image processing apparatus such as an electronic filing apparatus that needs to identify and determine the type of a document, a method for automatically performing the document classification work is not installed, and the document classification work is not performed. Relies on manpower. Therefore, document registration is cumbersome and time consuming,
It was inefficient work.

【0007】この発明では、画像の種類を識別判定する
画像処理装置において、文書画像から罫線情報を抽出す
る。これらの情報をもとに文書画像の種類を識別判定す
ることを目的とする。
According to the present invention, ruled line information is extracted from a document image in an image processing apparatus for identifying and determining the type of image. The purpose is to identify and determine the type of document image based on these pieces of information.

【0008】[0008]

【課題を解決するための手段】この発明の画像処理装置
は、処理対象画像における注目画素の画像信号を2値化
する2値化手段、この2値化手段により2値化した画像
信号から黒ラン長を算出するランレングス符号化手段、
このランレングス符号化手段により符号化されたランレ
ングス符号から短いランを除去するラン除去手段、この
ラン除去手段により短いランが除去された画像信号を基
に、連結するランの領域を調べ、この領域に外接する矩
形を求める外接矩形抽出手段、この外接矩形抽出手段に
より抽出された矩形の大きさにより罫線領域を判定する
罫線判定手段、およびこの罫線判定手段により判定され
た罫線領域から画像の種類を判別する画像判定手段から
構成されている。
An image processing apparatus according to the present invention is a binarizing unit for binarizing an image signal of a pixel of interest in an image to be processed, and the image signal binarized by the binarizing unit is blackened. A run length encoding means for calculating a run length,
A run removing means for removing a short run from the run length code encoded by the run length encoding means, and an area of the run to be connected are examined based on the image signal from which the short run is removed by the run removing means, and A circumscribing rectangle extracting means for determining a rectangle circumscribing the area, a ruled line determining means for determining a ruled line area based on the size of the rectangle extracted by the circumscribing rectangle extracting means, and an image type from the ruled line area determined by the ruled line determining means It is composed of image determination means for determining.

【0009】この発明の画像処理装置は、処理対象画像
における注目画素の画像信号を2値化する2値化手段、
この2値化手段により2値化した画像信号から黒ラン長
を算出するランレングス符号化手段、このランレングス
符号化手段により符号化されたランレングス符号から短
いランを除去するラン除去手段、このラン除去手段によ
り短いランが除去された画像信号を基に、連結するラン
の領域を調べ、この領域に外接する矩形を求める外接矩
形抽出手段、この外接矩形抽出手段により抽出された矩
形の大きさにより罫線領域を判定する罫線判定手段、お
よびこの罫線判定手段により判定された罫線の位置・長
さと予め登録された原稿の罫線の位置・長さとの類似度
により画像の種類を判別する画像判定手段から構成され
ている。
The image processing apparatus of the present invention is a binarizing means for binarizing the image signal of the pixel of interest in the image to be processed.
A run length encoding means for calculating a black run length from the image signal binarized by the binarizing means, a run removing means for removing a short run from the run length code encoded by the run length encoding means, Based on the image signal from which short runs have been removed by the run removal means, the area of the connected runs is examined, and the circumscribed rectangle extraction means for determining the rectangle circumscribing this area, the size of the rectangle extracted by this circumscribed rectangle extraction means Ruled line determining means for determining a ruled line area by means of, and image determining means for determining the type of image based on the degree of similarity between the position / length of the ruled line determined by the ruled line determining means and the position / length of the ruled line of the document registered in advance. It consists of

【0010】[0010]

【作用】この発明は、処理対象画像における注目画素の
画像信号を2値化し、この2値化した画像信号から黒ラ
ン長を算出し、この符号化されたランレングス符号から
短いランを除去し、この短いランが除去された画像信号
を基に、連結するランの領域を調べ、この領域に外接す
る矩形を抽出し、この抽出された矩形の大きさにより罫
線領域を判定し、この判定された罫線領域から画像の種
類を判別するようにしたものである。
According to the present invention, the image signal of the pixel of interest in the image to be processed is binarized, the black run length is calculated from this binarized image signal, and the short run is removed from this encoded run length code. , Based on the image signal from which this short run has been removed, the area of the connected run is examined, the rectangle circumscribing this area is extracted, and the ruled line area is determined by the size of this extracted rectangle. The image type is discriminated from the ruled line area.

【0011】この発明は、処理対象画像における注目画
素の画像信号を2値化し、この2値化した画像信号から
黒ラン長を算出し、この符号化されたランレングス符号
から短いランを除去し、この短いランが除去された画像
信号を基に、連結するランの領域を調べ、この領域に外
接する矩形を抽出し、この抽出された矩形の大きさによ
り罫線領域を判定し、この判定された罫線領域から罫線
の位置・長さと予め登録された原稿の罫線の位置・長さ
との類似度により画像の種類を判別するようにしたもの
である。
According to the present invention, the image signal of the pixel of interest in the image to be processed is binarized, the black run length is calculated from this binarized image signal, and the short run is removed from this encoded run length code. , Based on the image signal from which this short run has been removed, the area of the connected run is examined, the rectangle circumscribing this area is extracted, and the ruled line area is determined by the size of this extracted rectangle. The type of image is discriminated from the ruled line area based on the degree of similarity between the position and length of the ruled line and the position and length of the ruled line of the document registered in advance.

【0012】[0012]

【実施例】以下、図面を参照しながらこの発明の一実施
例について説明する。図1はこの発明の原稿種別を判定
する画像処理装置の構成図である。図1において、1は
入力画像信号、2は入力信号を2値化する2値化手段、
21は2値化画像信号、3はランレングス符号化手段、
31はランレングス信号、4はラン除去手段、41はラ
ン除去後の画像信号、5はラベリング・外接矩形抽出手
段、51は矩形信号、7は罫線領域判定手段、61は罫
線領域信号、7は画像判定手段、8は判定信号である。
以下、この発明の原稿種別判定方法を詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram of an image processing apparatus for determining the document type of the present invention. In FIG. 1, 1 is an input image signal, 2 is a binarizing means for binarizing the input signal,
Reference numeral 21 is a binarized image signal, 3 is run length encoding means,
31 is a run length signal, 4 is a run removal means, 41 is an image signal after run removal, 5 is a labeling / circumscribing rectangle extraction means, 51 is a rectangular signal, 7 is a ruled line area determination means, 61 is a ruled line area signal, and 7 is Image determination means, 8 is a determination signal.
The document type determination method of the present invention will be described in detail below.

【0013】スキャナ等の入力装置で読み取られた入力
画像信号1は、2値化手段2において、2値化閾値Th
との比較処理を行い2値化され、2値化画像信号21
(0または1)を出力する。ラングレス符号化手段3で
は2値化画像情報21から画像をラン情報に変換する。
このラン情報を元に罫線領域情報61を抽出する。ま
ず、ラン除去手段4では主走査方向および副走査方向の
短いランをそれぞれ除去する。
An input image signal 1 read by an input device such as a scanner is binarized by a binarizing means 2 which has a binarization threshold Th.
Is binarized and binarized image signal 21
(0 or 1) is output. The rungless encoding means 3 converts the image from the binarized image information 21 into run information.
Ruled line area information 61 is extracted based on this run information. First, the run removing means 4 removes short runs in the main scanning direction and in the sub-scanning direction, respectively.

【0014】次に、ラベリング・外接矩形抽出手段5で
はラン除去手段4で出力された画像信号をもとに連結す
るランを1つの領域として統合(ラベリング)し、その
ラベリングされたそれぞれの領域に外接する矩形を求め
る。罫線領域判定手段6ではこの矩形の大きさにより罫
線領域情報61を出力する。画像判定手段7ではこれら
罫線領域情報61により画像の種類を判定する。
Next, the labeling / circumscribing rectangle extraction means 5 integrates (labels) the connected runs based on the image signal output from the run removal means 4 into one area, and then adds them to the respective labeled areas. Find the circumscribing rectangle. The ruled line area determination means 6 outputs ruled line area information 61 according to the size of the rectangle. The image determination means 7 determines the type of image based on the ruled line area information 61.

【0015】次に、この発明の原稿種別判定処理を搭載
した画像処理装置の一実施例について説明する。図1は
この実施例に係わる画像処理装置の概略構成図である。
この画像処理装置は一般の文書原稿をイメージ・スキャ
ナ等の読み取り装置にて読み取り入力し、例えば1画素
当り8ビットのデジタルデータとして入力し、この原稿
種類を判定して出力するものである。以下、この実施例
について詳しく説明する。
Next, an embodiment of an image processing apparatus equipped with the document type determination processing of the present invention will be described. FIG. 1 is a schematic configuration diagram of an image processing apparatus according to this embodiment.
This image processing apparatus reads and inputs a general document original with a reading device such as an image scanner, inputs as 8-bit digital data per pixel, and determines and outputs the original type. Hereinafter, this embodiment will be described in detail.

【0016】図1において、まず1は入力された画像信
号である。入力画像信号1(f)は2値化手段2で所定
の閾値Thと比較し2値化処理を行い、2値化画像信号
21(g)を出力する。2値化手段2は、閾値Thを記
憶する閾値メモリと入力画像信号1(f)と閾値Thを
比較する比較器とで構成される。入力画像信号1が2値
化閾値Thより小さければ2値化画像信号21(g)と
して“0”を出力し、大きければ“1”を出力する。比
較処理は(1)式に示す。
In FIG. 1, reference numeral 1 is an input image signal. The input image signal 1 (f) is compared with a predetermined threshold Th by the binarizing means 2 to be binarized, and a binarized image signal 21 (g) is output. The binarization unit 2 is composed of a threshold memory that stores the threshold Th and a comparator that compares the input image signal 1 (f) with the threshold Th. If the input image signal 1 is smaller than the binarization threshold Th, "0" is output as the binarized image signal 21 (g), and if it is larger, "1" is output. The comparison process is shown in equation (1).

【0017】 g=0 : f<Th g=1 : f≧Th …(1) 図2に2値化手段2の構成を示す。2値化手段2は8ビ
ットの比較器で構成される。8ビットの入力画素信号1
と予め設定した8ビットの閾値Thが比較され、(1)
式に示す条件で2値化画像信号21が出力される。
G = 0: f <Th g = 1: f ≧ Th (1) FIG. 2 shows the configuration of the binarizing means 2. The binarization means 2 is composed of an 8-bit comparator. 8-bit input pixel signal 1
Is compared with a preset 8-bit threshold Th, and (1)
The binarized image signal 21 is output under the condition shown in the equation.

【0018】次に、ランレングス符号化手段3において
2値化画像信号21からラン情報を作成する。図3はラ
ン情報抽出方法を説明する図であり、以下詳細に説明す
る。図3の(a)は原画像を示す。図3の(b)は原画
像をビットマップ表現したものであり、各マス目が画素
に対応し、斜線部が黒(1)画素、それ以外が白(0)
画素を表す。図3の(b)において、最初の黒画素は座
標(2,1)にありさらに右方向に座標(4.1)迄連
結している。
Next, the run length encoding means 3 creates run information from the binarized image signal 21. FIG. 3 is a diagram for explaining the run information extraction method, which will be described in detail below. FIG. 3A shows an original image. FIG. 3B is a bitmap representation of the original image. Each square corresponds to a pixel, the shaded area is a black (1) pixel, and the others are white (0).
Represents a pixel. In FIG. 3B, the first black pixel is at the coordinate (2,1) and is further connected to the coordinate (4.1) in the right direction.

【0019】また、座標(1,6)の画素は座標(5,
6)迄連結している。このように画素の連結状態を、図
3の(c)に示すように右方向に連結している画素をひ
とまとめとした情報(ラン)に置き換える。さらにこれ
らのランを、ランの始点および長さの情報として出力す
る。例えば、第1番目のランは、始点(2,1)、長さ
3、第2番目のランは、始点(1,2)、長さ1…とい
う具合である。このようにランレングス符号化手段3で
は2値化画像信号21からランの始点および長さをラン
情報として出力する。
Further, the pixel at the coordinate (1,6) is the pixel at the coordinate (5,5).
It is connected up to 6). In this way, the connection state of the pixels is replaced with information (run) in which the pixels connected in the right direction are collected as shown in FIG. 3C. Further, these runs are output as information on the start point and length of the run. For example, the first run has a starting point (2,1) and a length of 3, and the second run has a starting point (1,2) and a length of 1 ... In this way, the run length encoding means 3 outputs the start point and length of the run from the binarized image signal 21 as run information.

【0020】図4にランレングス符号化手段3の構成を
示す。まず、2値化画像信号21により第1のクロック
で1番目の画素がラッチ300にストアされる。続いて
第2のクロックでアンドゲート310では1画素目が
白、2画素目が黒の場合“1”、それ以外では“0”が
出力される。つまり、アンドゲート310の出力311
(ラン開始信号)は黒ランの開始を示す信号である。
FIG. 4 shows the configuration of the run length encoding means 3. First, the binarized image signal 21 causes the first pixel to be stored in the latch 300 at the first clock. Then, at the second clock, the AND gate 310 outputs "1" when the first pixel is white and the second pixel is black, and outputs "0" otherwise. That is, the output 311 of the AND gate 310
(Run start signal) is a signal indicating the start of a black run.

【0021】一方、アンドゲート320では1画素目が
黒、2画素目が白の場合“1”、それ以外では“0”が
出力される。つまり、アンドゲート320の出力321
(ラン終了信号)は黒ランの終了を示す信号である。カ
ウンタ330は前述のラン開始信号311によりリセッ
トされ、画像クロック22(CLK)によりカウントさ
れる。カウンタ330の出力信号331は前述のラン終
了信号321によりラッチ360にストアされる。つま
りラッチ360にはラン長がストアされることとなる。
On the other hand, the AND gate 320 outputs "1" when the first pixel is black and the second pixel is white, and outputs "0" otherwise. That is, the output 321 of the AND gate 320
(Run end signal) is a signal indicating the end of a black run. The counter 330 is reset by the above-mentioned run start signal 311, and is counted by the image clock 22 (CLK). The output signal 331 of the counter 330 is stored in the latch 360 by the run end signal 321 described above. That is, the run length is stored in the latch 360.

【0022】次に、カウンタ331には画像クロック2
2(CLK)および垂直画像クロック23(VCLK)
が入力され、現在の画像位置(X座標、Y座標)がカウ
ントされる。ラン開始のX座標341およびY座標34
2は前述したラン開始信号311によりそれぞれラッチ
370およびラッチ380にストアされる。セレクタ3
90はラッチ370,380,360にストアされたラ
ン開始のX座標、Y座標、ラン長を、X座標、Y座標、
ラン長の順に選択し出力するもので、セレクト信号35
1はカウンタ350がラン終了信号321のタイミング
から出力する。
Next, the counter 331 displays the image clock 2
2 (CLK) and vertical image clock 23 (VCLK)
Is input, and the current image position (X coordinate, Y coordinate) is counted. Run start X coordinate 341 and Y coordinate 34
2 is stored in the latch 370 and the latch 380 by the run start signal 311 described above. Selector 3
90 is the X coordinate, Y coordinate, and run length of the run start stored in the latches 370, 380, and 360, and the X coordinate, Y coordinate,
Select and output in order of run length. Select signal 35
1 is output from the counter 350 from the timing of the run end signal 321.

【0023】以上の手順で算出したラン情報を元に、ラ
ン除去手段4、ラベリング・外接矩形抽出手段5、罫線
領域判定手段6により罫線領域情報61を出力する。以
下、罫線領域情報61算出方法について詳述する。
Based on the run information calculated by the above procedure, the run removing means 4, the labeling / circumscribing rectangle extracting means 5, and the ruled line area determining means 6 output ruled line area information 61. Hereinafter, the method of calculating the ruled line area information 61 will be described in detail.

【0024】まず、ラン除去手段4は、ランレングス符
号化手段3により求めたラン情報から、短いランの除
去、または長いランの除去をそれぞれ独立に行う。この
手順を詳しく説明する。図5の(a)はランレングス符
号化手段3により求めたランである。まず、短いランの
除去では、ラン長の短いもののみ除去する。図5の
(b)はラン長1のものを除去した例であり、2番目か
ら6番目のランは除去されている。つまり本処理はラン
長をL、短いランのラン長閾値をThs としたとき L<Ths …(2) を満たすランを除去するものである。
First, the run removing means 4 removes a short run or a long run independently from the run information obtained by the run length encoding means 3. This procedure will be described in detail. FIG. 5A shows a run obtained by the run length encoding means 3. First, in removing short runs, only those with short run lengths are removed. FIG. 5B is an example in which the run length 1 is removed, and the second to sixth runs are removed. In other words, this processing is to remove a run that satisfies L <Ths (2) where L is the run length and Ths is the run length threshold for short runs.

【0025】図6の(a)はさらに具体的に文書画像で
あり、罫線および文字から構成される文書の一例であ
る。図6の(a)に対し短いランの除去処理を行うと図
6の(b)に示すようになる。この図からわかるよう
に、本処理では縦の罫線および文字の一部が除去され
る。このラン除去処理では短いランの除去を行う一方長
いランの除去を平行して行う。この処理は長いランのラ
ン長閾値をTh1 としたとき L<Th1 …(3) を満たすランを除去するものである。
More specifically, FIG. 6A shows a document image, which is an example of a document composed of ruled lines and characters. When short run removal processing is performed on (a) of FIG. 6, it becomes as shown in (b) of FIG. As can be seen from this figure, the vertical ruled lines and part of the characters are removed in this process. In this run removal process, short runs are removed while long runs are removed in parallel. This processing is to remove a run that satisfies L <Th1 (3) when the run length threshold of a long run is Th1.

【0026】図7は長いランの除去処理の一例を示した
もので、図7の(a)の文書画像に対して、図7の
(b)に示す画像が出力される。図8にラン除去手段4
の回路構成を示す。
FIG. 7 shows an example of long run removal processing. The image shown in FIG. 7B is output with respect to the document image shown in FIG. 7A. FIG. 8 shows the run removing means 4
The circuit configuration of is shown.

【0027】まず、ラッチ410,420,430,4
40にはラン情報31が順次入力され、3クロック毎に
それぞれラン長、Y座標、X座標、ラン長がストアされ
る。比較器450および460は例えば13ビット(A
3版、400dpi(ドットパー インチ)の主走査画
素数に相当する)の比較器で構成され、比較器450で
は閾値Thsとラン長が(2)式に基づいて比較され
(2)式を満たす場合に“0”、それ以外の場合に
“1”が判定信号451として出力される。つまり、閾
値Ths以上のランの場合にのみ“1”が出力され。
First, the latches 410, 420, 430, 4
The run information 31 is sequentially input to 40, and the run length, the Y coordinate, the X coordinate, and the run length are stored every 3 clocks. The comparators 450 and 460 are, for example, 13 bits (A
3rd version, 400 dpi (dots per inch) equivalent to the number of main scanning pixels), the comparator 450 compares the threshold Ths with the run length based on the equation (2) and satisfies the equation (2). Is output as the determination signal 451. That is, "1" is output only when the run is equal to or greater than the threshold Ths.

【0028】一方、比較器460ではTh1とラン長が
(3)式に基づいて比較され、(3)式を満たす場合に
“0”、それ以外の場合に“1”が判定信号461とし
て出力される。つまり、閾値Th1以下のランの場合に
のみ“1”が出力される。ゲート470はオアゲートで
あり、判定信号451および461のオア信号が判定信
号471として出力される。
On the other hand, in the comparator 460, Th1 and run length are compared based on the equation (3). If the equation (3) is satisfied, "0" is output, and otherwise, "1" is output as the determination signal 461. To be done. That is, "1" is output only in the case of a run that is the threshold Th1 or less. The gate 470 is an OR gate, and the OR signals of the determination signals 451 and 461 are output as the determination signal 471.

【0029】480,482,484はラッチであり、
判定信号471が“1”のときにそれぞれX座標、Y座
標、ラン長がストアされる。カウンタ486はラッチ4
80,482,484にストアされたX座標、Y座標、
ラン長を順次選択するための選択信号を発生するカウン
タで、セレクト信号487によりセレクタ488はX座
標、Y座標、ラン長の順にラッチ480,482,48
4にストアされた信号をラン除去信号41として出力す
る。
Reference numerals 480, 482 and 484 are latches,
When the determination signal 471 is "1", the X coordinate, the Y coordinate, and the run length are stored respectively. Counter 486 is latch 4
X, Y coordinates stored in 80, 482, 484,
A counter that generates a selection signal for sequentially selecting run lengths. A selector 488 causes a selector 488 to sequentially latch the latches 480, 482, 48 in the order of X coordinate, Y coordinate, and run length.
The signal stored in 4 is output as the run removal signal 41.

【0030】次にラベリング・外接矩形抽出手段5では
ラン除去手段4で出力された画像信号41をもとに連結
するランを1つの領域として統合(ラベリング)する。
図9の(a)はランレングス符号化手段3により求めた
ランを示し、図9の(b)はそのラン情報である。図9
の(a)において第1番目のランは第2番目のランと連
結している。さらに、第1番目のランと第3番目のラン
も連結している。つまり、第1、第2、第3番目のラン
はすべて連結している。このようにラベリング・外接矩
形抽出手段5では連結しているランを1つの領域として
統合(ラベリング)する。図9の(c)は図9の(a)
に示す画像情報をラベリングし、ラベル(A)として出
力したものである。
Next, the labeling / circumscribing rectangle extraction means 5 integrates (labels) the connected runs based on the image signal 41 output from the run removal means 4 as one area.
9A shows a run obtained by the run length encoding means 3, and FIG. 9B shows the run information. Figure 9
In (a), the first run is connected to the second run. In addition, the first run and the third run are also connected. That is, the first, second, and third runs are all connected. In this way, the labeling / circumscribing rectangle extraction means 5 integrates (labels) the connected runs as one area. FIG. 9C shows FIG. 9A.
The image information shown in is labeled and output as a label (A).

【0031】また、ラベリング・外接矩形抽出手段5で
は上記のラベリングされたそれぞれの領域に外接する矩
形の位置および大きさを求める。図9の(c)より、ラ
ベル(A)はラン(1)、ラン(2)、ラン(3)が統
合されたものである。ラベリング・外接矩形抽出手段5
では、これらのランの始点(x1,y1)、(x2,y
2)、(x3,y3)のうち最も小さいxおよび最も小
さいyを外接矩形の始点(x0,y0)として求める。
つまり、対象ラベルに含まれるn個のランの始点をそれ
ぞれ(x1,y1)、(x2,y2)…(xn,yn)
としたとき x0=min(x1,x2,…xn) …(4) y0=min(y1,y2,…yn) …(5) として求める。また始点の算出と同様の方法で終点(x
e,ye)を算出し、外接矩形の大きさ(xs,ys)
を以下の式で算出する。
Further, the labeling / circumscribing rectangle extraction means 5 obtains the position and size of the rectangle circumscribing each of the labeled regions. From FIG. 9C, the label (A) is a combination of the run (1), the run (2), and the run (3). Labeling / circumscribing rectangle extraction means 5
Then, the start points (x1, y1), (x2, y) of these runs
2), the smallest x and the smallest y of (x3, y3) are obtained as the starting point (x0, y0) of the circumscribed rectangle.
That is, the start points of n runs included in the target label are (x1, y1), (x2, y2) ... (xn, yn), respectively.
Then, x0 = min (x1, x2, ... Xn) (4) y0 = min (y1, y2, ... Yn) (5) Moreover, the end point (x
e, ye), and the size of the circumscribed rectangle (xs, ys)
Is calculated by the following formula.

【0032】 xs=xe−x0+1 …(6) ys=ye−y0+1 …(7) 図11は図9の(a)に示すラン情報に対し、以上の手
順で算出した外接矩形情報51である。
Xs = xe−x0 + 1 (6) ys = ye−y0 + 1 (7) FIG. 11 shows the circumscribed rectangle information 51 calculated by the above procedure for the run information shown in FIG. 9A.

【0033】図10はラベリング・外接矩形抽出手段5
の回路構成の一例である。ラン除去手段4の出力信号4
1について、まず第1ライン目のライン情報(ラン開始
位置のX座標、Y座標、ラン長)がセレクタ510を介
してメモリ512に記憶される。メモリ512に記憶さ
れたラン情報はセレクタ514を介し、比較器520,
522,524,526,528において第2ライン目
の情報と比較される。
FIG. 10 shows the labeling / circumscribing rectangle extraction means 5
2 is an example of the circuit configuration of FIG. Output signal 4 of run removing means 4
For No. 1, first, line information of the first line (X coordinate, Y coordinate of run start position, run length) is stored in the memory 512 via the selector 510. The run information stored in the memory 512 is transmitted via the selector 514 to the comparator 520,
At 522, 524, 526 and 528, the information of the second line is compared.

【0034】以下では第1ライン目のランの開始位置を
X0,Y0、ラン長をL0とし、第2ライン目のランの
開始位置をX1,Y1、ラン長をL1として説明する。
まず比較器520では第1ライン目の第1番目のランの
開始位置X0と第2ライン目の第1番目のランの終了位
置X1+L1を比較する。
In the following description, the start position of the run on the first line is X0, Y0, the run length is L0, the start position of the run on the second line is X1, Y1, and the run length is L1.
First, the comparator 520 compares the start position X0 of the first run on the first line with the end position X1 + L1 of the first run on the second line.

【0035】このとき、 X0>X1 であれば比較信号521として“1”をそれ以外では
“0”を出力する。
At this time, if X0> X1, "1" is output as the comparison signal 521, and "0" is output otherwise.

【0036】以下同様に、比較器522では、 X0>X1+L1 であれば、比較信号523として“1”をそれ以外では
“0”を出力する。
Similarly, the comparator 522 outputs "1" as the comparison signal 523 if X0> X1 + L1 and "0" otherwise.

【0037】比較器524では、 X0+L0>X1+L1 であれば、比較信号525として“1”をそれ以外では
“0”を出力する。
The comparator 524 outputs "1" as the comparison signal 525 if X0 + L0> X1 + L1 and "0" otherwise.

【0038】比較器526では、 X0+L0>X1 であれば、比較信号527として“1”をそれ以外では
“0”を出力する。
The comparator 526 outputs "1" as the comparison signal 527 if X0 + L0> X1 and "0" otherwise.

【0039】比較器528では、 Y0>Y1 であれば、比較信号529として“1”をそれ以外では
“0”を出力する。
The comparator 528 outputs "1" as the comparison signal 529 if Y0> Y1 and "0" otherwise.

【0040】一方、加減算器530ではランが連結した
場合に統合したラン長として X0+L0−X1+1 または X1+L1−X0+1 を計算し、その出力信号531としてX0,Y0,X
1,Y1,X0+L0−X1+1,X1+L1−X0+
1を出力する。
On the other hand, the adder / subtractor 530 calculates X0 + L0-X1 + 1 or X1 + L1-X0 + 1 as the integrated run length when the runs are connected, and outputs X0, Y0, X as its output signal 531.
1, Y1, X0 + L0-X1 + 1, X1 + L1-X0 +
1 is output.

【0041】判定テーブル540では比較信号521,
523,525,527,529を元に6種類の条件を
設定しセレクタ514,544、メモリ546,548
の選択信号およびラン選択信号543を出力する。メモ
リ選択信号545は内部演算用のメモリ546(1ライ
ン分のラン情報を記憶するメモリ)とラベリング結果出
力用のバッファメモリ548を選択する信号で、“0”
のときメモリ546を、“1”のときメモリ548を選
択する。
In the judgment table 540, the comparison signal 521,
6 types of conditions are set based on 523, 525, 527 and 529, and selectors 514 and 544 and memories 546 and 548
And a run selection signal 543 are output. The memory selection signal 545 is a signal for selecting the memory 546 for internal calculation (memory for storing run information for one line) and the buffer memory 548 for outputting the labeling result, and is “0”.
The memory 546 is selected when, and the memory 548 is selected when "1".

【0042】また、選択信号542は4ビットの信号で
下位3ビットは以下に説明する6つの条件で決定し、上
位1ビットは比較信号529がそのまま出力される。ま
ず、第1の条件は、比較信号523が“1”の場合で、
この条件では第2ライン目のランは第1ライン目のラン
と連結しておらず、メモリ選択信号541として“0”
を、選択信号542の下位3ビットとして“000”
を、ラン選択信号543として“1”を出力する。第2
の条件は比較信号521が“1”、比較信号523が
“0”、比較信号525が“1”の場合で、この条件で
は第2ライン目のランは第1ライン目のランと連結し、
メモリ選択信号541として“0”を、選択信号542
の下位3ビットとして“001”を、ラン選択信号54
3として“1”を出力する。
The selection signal 542 is a 4-bit signal, the lower 3 bits are determined by the six conditions described below, and the upper 1 bit is the comparison signal 529 as it is. First, the first condition is that the comparison signal 523 is “1”,
Under this condition, the run of the second line is not connected to the run of the first line, and the memory select signal 541 is "0".
Is set as “000” as the lower 3 bits of the selection signal 542.
Is output as a run selection signal 543. Second
Condition is that the comparison signal 521 is “1”, the comparison signal 523 is “0”, and the comparison signal 525 is “1”. Under this condition, the run of the second line is connected to the run of the first line,
“0” is selected as the memory selection signal 541 and the selection signal 542
"001" as the lower 3 bits of the run selection signal 54
As "3", "1" is output.

【0043】第3の条件は比較信号521が“1”、比
較信号523が“0”、比較信号525が“0”の場合
で、この条件では第2ライン目のランは第1ライン目の
ランと連結し、メモリ選択信号541として“0”を、
選択信号542の下位3ビットとして“010”を、ラ
ン選択信号543として“0”を出力する。第4の条件
は比較信号521が“0”、比較信号523が“1”、
比較信号525が“1”の場合で、この条件では第2ラ
イン目のランは第1ライン目のランと連結し、メモリ選
択信号541として“0”を、選択信号542の下位3
ビットとして“011”を、ラン選択信号543として
“1”を出力する。
The third condition is that the comparison signal 521 is "1", the comparison signal 523 is "0", and the comparison signal 525 is "0". Under this condition, the run of the second line is the first line. In connection with the run, "0" is set as the memory selection signal 541,
"010" is output as the lower 3 bits of the selection signal 542 and "0" is output as the run selection signal 543. The fourth condition is that the comparison signal 521 is “0”, the comparison signal 523 is “1”,
When the comparison signal 525 is “1”, the run of the second line is connected to the run of the first line under this condition, and “0” is set as the memory selection signal 541 and the lower three bits of the selection signal 542.
"011" is output as a bit and "1" is output as a run selection signal 543.

【0044】第5の条件は比較信号521が“0”、比
較信号523が“1”、比較信号525が“0”の場合
で、この条件では第2ライン目のランは第1ライン目の
ランと連結し、メモリ選択信号541として“0”を、
選択信号542の下位3ビットとして“100”を、ラ
ン選択信号543として“0”を出力する。第6の条件
は比較信号527が“0”の場合で、この条件では第1
ライン目のランと連結が完了したことを示し、メモリ選
択信号541として“1”を、選択信号542の下位3
ビットとて“101”を、ラン選択信号543として
“0”を出力する。セレクタ544では選択信号542
によりラベル情報を出力する。
The fifth condition is that the comparison signal 521 is "0", the comparison signal 523 is "1", and the comparison signal 525 is "0". Under this condition, the run of the second line is the first line. In connection with the run, "0" is set as the memory selection signal 541,
"100" is output as the lower 3 bits of the selection signal 542 and "0" is output as the run selection signal 543. The sixth condition is that the comparison signal 527 is "0", and the first condition
It indicates that the connection with the run of the line has been completed, and “1” is set as the memory selection signal 541, and the lower three bits of the selection signal 542.
"101" is output as a bit and "0" is output as the run selection signal 543. Select signal 542 in selector 544
The label information is output by.

【0045】まず、選択信号542の下位3ビットが
“000”の場合はラベルの開始位置として(X1,Y
1)、ラベルのサイズとして(L1、Y−Y1+1(こ
こでYは処理中のライン番号とする))を出力する。選
択信号542の下位3ビットが“001”の場合はY0
とY1のうち小さい信号をY2としたときラベルの開始
位置として(X1,Y2)、ラベルのサイズとして(X
0+L0−X1+1、Y−Y2+1)を出力する。選択
信号542の下位3ビットが“010”の場合はラベル
の開始位置として(X1,Y2)、ラベルのサイズとし
て(L1、Y−Y2+1)を出力する。選択信号542
の下位3ビットが“011”の場合はラベルの開始位置
として(X0,Y2)、ラベルのサイズとして(L0、
Y−Y2+1)を出力する。
First, when the lower 3 bits of the selection signal 542 are "000", the start position of the label is (X1, Y
1), (L1, Y-Y1 + 1 (where Y is the line number being processed)) is output as the label size. Y0 when the lower 3 bits of the selection signal 542 are "001"
When the smaller signal of Y1 and Y1 is Y2, the label start position is (X1, Y2), and the label size is (X
0 + L0-X1 + 1, Y-Y2 + 1) is output. When the lower 3 bits of the selection signal 542 are "010", (X1, Y2) is output as the label start position and (L1, Y-Y2 + 1) is output as the label size. Selection signal 542
If the lower 3 bits of the label are “011”, the label start position is (X0, Y2) and the label size is (L0,
Y-Y2 + 1) is output.

【0046】選択信号542の下位3ビットが“10
0”の場合はラベルの開始位置として(X0,Y2)、
ラベルのサイズとして(X1+L1−X0+1、Y−Y
2+1)を出力する。選択信号542の下位3ビットが
“101”の場合はラベルの開始位置として(X0,Y
0)、ラベルのサイズとして(L0、Y−Y0+1)を
出力する。メモリ選択信号541によりセレクタ544
より出力したラベル情報をメモリ546またはメモリ5
48へ出力するかを選択する。
The lower 3 bits of the selection signal 542 are "10".
If it is 0 ", the label start position is (X0, Y2),
As the label size, (X1 + L1-X0 + 1, Y-Y
2 + 1) is output. When the lower 3 bits of the selection signal 542 are "101", the start position of the label is (X0, Y
0), and outputs (L0, Y-Y0 + 1) as the label size. Selector 544 according to memory selection signal 541
The label information output from the memory 546 or the memory 5
Select whether to output to 48.

【0047】さらに、ラン選択信号543により第1ラ
イン目のラン情報513および第2ライン目のラン情報
41を更新する。つまりラン選択信号543が“0”の
場合は第1ライン目のラン情報513を次のランに更新
する。また、ラン選択信号543が“1”の場合は第2
ライン目のラン情報41を次のランに更新する。以上の
処理を1ライン終了まで繰りかえす。
Further, the run selection signal 543 updates the run information 513 on the first line and the run information 41 on the second line. That is, when the run selection signal 543 is "0", the run information 513 on the first line is updated to the next run. When the run selection signal 543 is “1”, the second
The run information 41 on the line is updated to the next run. The above processing is repeated until the end of one line.

【0048】第1ラインの処理が終了すると、メモリ5
46に記憶された第2ライン目のラン情報はセレクタ5
10を介してメモリ512に記憶され、第2ライン目の
ラン情報513と第3ライン目のラン情報41とにより
上記の演算が行われる。以上を1ページ終了まで行う。
When the processing of the first line is completed, the memory 5
The run information of the second line stored in 46 is the selector 5
The data is stored in the memory 512 via 10 and the above calculation is performed by the run information 513 on the second line and the run information 41 on the third line. The above is repeated until the end of one page.

【0049】次に、罫線領域判定手段6ではこの外接矩
形情報51より罫線領域情報61を出力する。一般に罫
線の特徴として、横罫線はその画像の横幅が大きく縦幅
は小さい。また、縦罫線は画像の横幅が短く縦幅が長
い。このことを利用し、横幅閾値Th1、縦幅閾値Th
2を設定し、以下の条件を満たすものを外接矩形情報5
1から横罫線として抽出する。
Next, the ruled line area determination means 6 outputs ruled line area information 61 from the circumscribed rectangle information 51. As a characteristic of ruled lines, horizontal ruled lines generally have a large horizontal width and a small vertical width. The vertical ruled line has a short horizontal width and a long vertical width. Utilizing this, the width threshold Th1 and the width threshold Th
2 is set, and the circumscribed rectangle information 5 that satisfies the following conditions
Extract from 1 as a horizontal ruled line.

【0050】 xs>th1 かつ ys<th2 …(8) さらに、横幅閾値Th3、縦幅閾値Th4を設定し、以
下の条件を満たすものを外接矩形情報51から縦罫線と
して抽出する。
Xs> th1 and ys <th2 (8) Further, the horizontal width threshold Th3 and the vertical width threshold Th4 are set, and those satisfying the following conditions are extracted from the circumscribed rectangle information 51 as vertical ruled lines.

【0051】 xs<th3 かつ ys<th4 …(9) そして、上記式(8)、式(9)の何れをも満たさない
領域は非罫線領域とする。図12は以下の手順のフロー
を示すものである。
Xs <th3 and ys <th4 (9) Then, a region that does not satisfy any of the above formulas (8) and (9) is a non-ruled line region. FIG. 12 shows the flow of the following procedure.

【0052】図6の(c)および図7の(c)はそれぞ
れ図6の(a)および図7の(a)の文書画像を、上述
したラン除去手段4、ラベリング・外接矩形抽出手段
5、罫線領域判定手段6の各手段を通して横罫線領域お
よび縦罫線領域を抽出したものである。
FIGS. 6C and 7C show the above-described run removing means 4 and labeling / circumscribing rectangle extracting means 5 from the document images of FIGS. 6A and 7A, respectively. The horizontal ruled line area and the vertical ruled line area are extracted through the ruled line area determination means 6.

【0053】図13に罫線領域判定手段6の回路構成の
一例を示す。まず矩形信号51として矩形の開始座標
(x,y)およびサイズ(xs,ys)が入力される。
図次しないクロックによりラッチ614,612,61
0にx,y,xsがそれぞれストアされる。比較器62
0,622,624,626ではそれぞれxsとTh
1、ysとTh2、xsとTh3、ysとTh4が比較
され、xs>Th1のとき比較信号621として“1”
それ以外は“0”、ys<Th2のとき比較信号623
として、“1”、それ以外は“0”、xs<Th3のと
き比較信号625として“1”それ以外は“0”、ys
>Th4のとき比較信号627として“1”それ以外は
“0”を出力する。判定回路630では比較信号621
および623が“1”のときまたは比較信号625およ
び627が“1”のとき判定信号631として“1”を
出力しラッチ640,642,644,646にそれぞ
れx,y,xs,ysがストアされる。
FIG. 13 shows an example of the circuit configuration of the ruled line area determining means 6. First, as the rectangular signal 51, the starting coordinates (x, y) and size (xs, ys) of the rectangle are input.
Latches 614, 612, 61 by clocks not shown
X, y, and xs are stored in 0, respectively. Comparator 62
0, 622, 624, and 626 have xs and Th, respectively.
1, ys and Th2, xs and Th3, ys and Th4 are compared, and when xs> Th1, “1” is set as the comparison signal 621.
Otherwise, it is “0”, and when ys <Th2, the comparison signal 623
Is “1”, otherwise is “0”, and when xs <Th3 is “1” as the comparison signal 625, otherwise is “0”, ys
When> Th4, “1” is output as the comparison signal 627, and “0” is output otherwise. In the determination circuit 630, the comparison signal 621
And 623 are "1" or the comparison signals 625 and 627 are "1", "1" is output as the determination signal 631 and x, y, xs and ys are stored in the latches 640, 642, 644 and 646, respectively. It

【0054】また、罫線種別信号632として比較信号
621および623が“1”のとき“0”を比較信号6
25および627が“1”のときは“1”を出力する。
カウンタ650はラッチ640,642,644,64
6の情報を順次セレクタ660で選択するための選択信
号であり、罫線領域信号61として罫線と判定された矩
形信号のx,y,xs,ys、種類を順次出力するもの
である。
As the ruled line type signal 632, when the comparison signals 621 and 623 are "1", the comparison signal 6 is "0".
When 25 and 627 are "1", "1" is output.
The counter 650 is a latch 640, 642, 644, 64.
6 is a selection signal for sequentially selecting the information of No. 6 by the selector 660, and sequentially outputs x, y, xs, ys and the type of the rectangular signal determined as the ruled line as the ruled line area signal 61.

【0055】以上説明した罫線領域信号61を利用し、
画像判定手段7では画像の種類を判定する。以下に、そ
の判定方法を詳しく説明する。罫線領域信号61を用い
て、罫線の位置および長さから判定する。
Utilizing the ruled line area signal 61 described above,
The image determination means 7 determines the type of image. The determination method will be described in detail below. The ruled line area signal 61 is used to determine from the position and length of the ruled line.

【0056】まず、対象画像の横罫線の数をnlとし横
罫線の始点を(xl(i),yl(i))とし、の長さ
をll(i)とする。ただし、iは1〜nlとする。ま
た、縦罫線の数をnpとし、縦罫線の始点を(xp
(j),yp(j))とし、長さをlp(j)とする。
ただし、jは1〜npとする。
First, the number of horizontal ruled lines in the target image is nl, the starting points of the horizontal ruled lines are (xl (i), yl (i)), and the length of is 11 (i). However, i is 1 to nl. The number of vertical ruled lines is np, and the start point of the vertical ruled lines is (xp
(J), yp (j)) and the length is lp (j).
However, j is 1 to np.

【0057】ここで、すでに登録してある判定したい画
像の種類がn種あり、この中で画像mの横罫線数、縦罫
線数、横罫線の始点とその長さおよび縦罫線の始点とそ
の長さをNlm ,Npm 、(X1m (k)、Ylm
(k))、Llm (k)、(Xpm (l)、Ypm
(l))、Lpm (l)とする(ただしjは1〜n、k
は1〜Nlm 、lは1〜Npm )。
Here, there are n types of images to be judged which have already been registered. Among them, the number of horizontal ruled lines, the number of vertical ruled lines, the starting point of the horizontal ruled line and its length, and the starting point of the vertical ruled line and its The length is Nl m , Np m , (X1 m (k), Yl m
(K)), Ll m ( k), (Xp m (l), Yp m
(L)), and Lp m (l) (provided that j is 1 to n, k
Is 1~Nl m, l is 1~Np m).

【0058】まず、対象画像のnl個の横罫線の始点
(xl(1)、yl(2))〜(xl(nl),yl
(nl))それぞれに対し、(Xlm (k)、Ylm
(k))のうち最も距離の近いものを求め(このときの
kをk=oとする)、その距離および長さの差の2乗和
平均Alm を以下の式により求める。
First, the start points (xl (1), yl (2)) to (xl (nl), yl) of the nl horizontal ruled lines of the target image.
(Nl)) for each (Xl m (k), Yl m
(K)) having the shortest distance is obtained (k at this time is k = o), and the square sum average Al m of the difference in the distance and the length is obtained by the following formula.

【0059】[0059]

【数1】 同様に縦罫線に対してApm を求める。[Equation 1] Similarly, Ap m is calculated for the vertical ruled line.

【0060】[0060]

【数2】 さらにそれらの平均Am[Equation 2] Furthermore, their average A m

【0061】[0061]

【数3】 として算出する。このAm を登録済みのn種の画像全て
に対して算出し、最も小さな値Am をもつ画像を対象画
像と同じ種類であると判定する。画像判定手段7はCP
Uおよびメモリで構成される。
[Equation 3] Calculate as This A m is calculated for all n types of registered images, and the image having the smallest value A m is determined to be of the same type as the target image. Image determination means 7 is CP
It consists of U and memory.

【0062】上記したように、処理対象画像における注
目画素の画像信号を2値化手段で2値化し、この2値化
した画像信号から黒ラン長をランレングス符号化手段で
算出し、この符号化されたランレングス符号から短いラ
ンをラン除去手段で除去し、この短いランが除去された
画像信号を基に、連結するランの領域を調べ、この領域
に外接する矩形をラベリング・外接矩形抽出手段で抽出
し、この抽出された矩形の大きさにより罫線領域を罫線
領域判定手段で判定し、この判定された罫線領域から画
像の種類を画像判定手段で判別するようにしたものであ
る。
As described above, the image signal of the pixel of interest in the image to be processed is binarized by the binarizing means, the black run length is calculated from the binarized image signal by the run length encoding means, and this code is used. The short run is removed from the converted run length code by the run removing means, the area of the connected run is examined based on the image signal from which the short run is removed, and the rectangle circumscribing this area is labeled and the circumscribed rectangle is extracted. The ruled line area is determined by the ruled line area determination means based on the size of the extracted rectangle, and the type of image is determined by the image determination means from the determined ruled line area.

【0063】これにより、対象画像から抽出した罫線の
位置・長さ等の情報から対象画像の種別を判別できる。
したがって、電子ファイリング装置等、文書の種類を識
別判定することが必要な画像処理装置においては、文書
分類作業は人手に頼ることなく可能となる。この結果、
文書の登録が、効率良く、効率的に行うことが可能とな
る。なお、この発明は上記実施例に限定されるものでは
なく、発明の主旨を変えない範囲において種々の変形が
可能である。
As a result, the type of the target image can be determined from the information such as the position and length of the ruled line extracted from the target image.
Therefore, in an image processing apparatus such as an electronic filing apparatus that needs to identify and determine the type of a document, the document classification work can be performed without relying on human labor. As a result,
Documents can be registered efficiently and efficiently. The present invention is not limited to the above-mentioned embodiment, and various modifications can be made without departing from the spirit of the invention.

【0064】[0064]

【発明の効果】以上詳述したようにこの発明によれば、
対象画像から抽出した罫線の位置・長さ等の情報から対
象画像の種別を判別できる。したがって、電子ファイリ
ング装置等、文書の種類を識別判定することが必要な画
像処理装置においては、文書分類作業は人手に頼ること
なく可能となる。この結果、文書の登録が、効率良く、
効率的に行うことが可能となる。
As described above in detail, according to the present invention,
The type of the target image can be determined from the information such as the position and length of the ruled line extracted from the target image. Therefore, in an image processing apparatus such as an electronic filing apparatus that needs to identify and determine the type of a document, the document classification work can be performed without relying on human labor. As a result, document registration is efficient and
It becomes possible to carry out efficiently.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の一実施例に係わる画像処理装置を示
す全体構成ブロック図。
FIG. 1 is an overall configuration block diagram showing an image processing apparatus according to an embodiment of the present invention.

【図2】2値化手段の回路構成の一例を示すブロック
図。
FIG. 2 is a block diagram showing an example of a circuit configuration of a binarizing unit.

【図3】ランレングス符号化の処理説明図。FIG. 3 is an explanatory diagram of a process of run length encoding.

【図4】ランレングス符号化手段の回路構成の一例を示
すブロック図。
FIG. 4 is a block diagram showing an example of a circuit configuration of run-length encoding means.

【図5】ラン除去手段の説明図。FIG. 5 is an explanatory diagram of a run removing unit.

【図6】罫線領域判定の一例を示す図。FIG. 6 is a diagram showing an example of ruled line area determination.

【図7】罫線領域判定の一例を示す図。FIG. 7 is a diagram showing an example of ruled line area determination.

【図8】ラン除去手段の回路構成の一例を示すブロック
図。
FIG. 8 is a block diagram showing an example of a circuit configuration of a run removing unit.

【図9】ラベリング手段の説明図。FIG. 9 is an explanatory view of labeling means.

【図10】ラベリング手段の回路構成の一例を示すブロ
ック図。
FIG. 10 is a block diagram showing an example of a circuit configuration of labeling means.

【図11】外接矩形抽出手段の説明図。FIG. 11 is an explanatory diagram of a circumscribing rectangle extraction unit.

【図12】罫線領域判定手段の説明図。FIG. 12 is an explanatory diagram of a ruled line area determination unit.

【図13】罫線領域判定手段の回路構成の一例を示すブ
ロック図。
FIG. 13 is a block diagram showing an example of a circuit configuration of ruled line area determination means.

【符号の説明】[Explanation of symbols]

1…入力画像信号 2…2値化手段 21…2値化画像信号 3…ランレングス符号化手段 31…ランレングス信号 4…ラン除去手段 41…ラン除去後の画像信号 5…ラベリング・外接矩形抽出手段 51…矩形信号 6…罫線領域判定手段 61…罫線領域信号 7…画像判定手段 8…判定信号 DESCRIPTION OF SYMBOLS 1 ... Input image signal 2 ... Binarizing means 21 ... Binary image signal 3 ... Run length coding means 31 ... Run length signal 4 ... Run removing means 41 ... Image signal after run removing 5 ... Labeling / circumscribing rectangle extraction Means 51 ... Rectangular signal 6 ... Ruled line area judging means 61 ... Ruled line area signal 7 ... Image judging means 8 ... Judgment signal

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 処理対象画像における注目画素の画像信
号を2値化する2値化手段と、 この2値化手段により2値化した画像信号から黒ラン長
を算出するランレングス符号化手段と、 このランレングス符号化手段により符号化されたランレ
ングス符号から短いランを除去するラン除去手段と、 このラン除去手段により短いランが除去された画像信号
を基に、連結するランの領域を調べ、この領域に外接す
る矩形を求める外接矩形抽出手段と、 この外接矩形抽出手段により抽出された矩形の大きさに
より罫線領域を判定する罫線判定手段と、 この罫線判定手段により判定された罫線領域から画像の
種類を判別する画像判定手段と、 を具備したことを特徴とする画像処理装置。
1. A binarizing unit for binarizing an image signal of a pixel of interest in an image to be processed, and a run length encoding unit for calculating a black run length from the image signal binarized by the binarizing unit. , A run removing means for removing a short run from the run length code encoded by the run length encoding means, and an area of the run to be connected based on the image signal in which the short run is removed by the run removing means A circumscribing rectangle extracting means for determining a rectangle circumscribing this area, ruled line determining means for determining a ruled line area based on the size of the rectangle extracted by the circumscribing rectangle extracting means, and a ruled line area determined by the ruled line determining means An image processing apparatus comprising: an image determination unit that determines the type of image.
【請求項2】 処理対象画像における注目画素の画像信
号を2値化する2値化手段と、 この2値化手段により2値化した画像信号から黒ラン長
を算出するランレングス符号化手段と、 このランレングス符号化手段により符号化されたランレ
ングス符号から短いランを除去するラン除去手段と、 このラン除去手段により短いランが除去された画像信号
を基に、連結するランの領域を調べ、この領域に外接す
る矩形を求める外接矩形抽出手段と、 この外接矩形抽出手段により抽出された矩形の大きさに
より罫線領域を判定する罫線判定手段と、 この罫線判定手段により判定された罫線の位置・長さと
予め登録された原稿の罫線の位置・長さとの類似度によ
り画像の種類を判別する画像判定手段と、 を具備したことを特徴とする画像処理装置。
2. A binarizing unit for binarizing an image signal of a pixel of interest in an image to be processed, and a run length encoding unit for calculating a black run length from the image signal binarized by the binarizing unit. , A run removing means for removing a short run from the run length code encoded by the run length encoding means, and an area of the run to be connected based on the image signal in which the short run is removed by the run removing means A circumscribing rectangle extracting means for determining a rectangle circumscribing this area, a ruled line determining means for determining a ruled line area based on the size of the rectangle extracted by the circumscribing rectangle extracting means, and a position of the ruled line determined by the ruled line determining means An image processing apparatus comprising: an image determination unit that determines the type of image based on the degree of similarity between the length and the position / length of a ruled line of a document that is registered in advance.
JP31980193A 1993-12-20 1993-12-20 Image processing device and image type determination method Expired - Fee Related JP3253201B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31980193A JP3253201B2 (en) 1993-12-20 1993-12-20 Image processing device and image type determination method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31980193A JP3253201B2 (en) 1993-12-20 1993-12-20 Image processing device and image type determination method

Publications (2)

Publication Number Publication Date
JPH07175927A true JPH07175927A (en) 1995-07-14
JP3253201B2 JP3253201B2 (en) 2002-02-04

Family

ID=18114347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31980193A Expired - Fee Related JP3253201B2 (en) 1993-12-20 1993-12-20 Image processing device and image type determination method

Country Status (1)

Country Link
JP (1) JP3253201B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001076154A (en) * 1999-08-23 2001-03-23 Xerox Corp Method for segmenting digital image and digital image processor
CN111508017A (en) * 2020-04-08 2020-08-07 中导光电设备股份有限公司 Method and system for positioning mark center with weak contrast

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001076154A (en) * 1999-08-23 2001-03-23 Xerox Corp Method for segmenting digital image and digital image processor
JP4627845B2 (en) * 1999-08-23 2011-02-09 ゼロックス コーポレイション Digital image segmentation method and digital image processing apparatus
CN111508017A (en) * 2020-04-08 2020-08-07 中导光电设备股份有限公司 Method and system for positioning mark center with weak contrast
CN111508017B (en) * 2020-04-08 2023-11-03 中导光电设备股份有限公司 Method and system for positioning mark center with weak contrast

Also Published As

Publication number Publication date
JP3253201B2 (en) 2002-02-04

Similar Documents

Publication Publication Date Title
US5778092A (en) Method and apparatus for compressing color or gray scale documents
JP3748164B2 (en) Pattern extraction device
US7298900B2 (en) Image processing method, image processing apparatus and image processing program
JPH11338976A (en) Document image recognition device, method therefor, and recording medium
JP4077919B2 (en) Image processing method and apparatus and storage medium therefor
JP4582204B2 (en) Image processing apparatus, image conversion method, and computer program
JP4582200B2 (en) Image processing apparatus, image conversion method, and computer program
JP3514050B2 (en) Image processing device
JP4211941B2 (en) Pattern extraction device
JP3253201B2 (en) Image processing device and image type determination method
JP4928325B2 (en) Image processing method, image processing apparatus, program, and storage medium
JP3268552B2 (en) Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus
CN112040087B (en) Blank image recognition method, device, equipment and storage medium
JP2002150213A (en) Bar code reader
JPH08237404A (en) Selection of optical character recognition mode
JPH06150059A (en) Image area separator
JP2005208979A (en) Featured value extracting device and method and document filing device
JP2708604B2 (en) Character recognition method
JP2697085B2 (en) Image signal processing device
JPH04316180A (en) Method for discriminating attribute of document picture
JPH0535870A (en) Contour point extracting method using multi-valued data
JPS6331825B2 (en)
JPH08139905A (en) Image processing unit
JPH03125569A (en) Picture binarizing device
JP2001184511A (en) Device, system and method for processing image and storage medium

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071122

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131122

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees