JP3215163B2 - Ruled line identification method and area identification method - Google Patents

Ruled line identification method and area identification method

Info

Publication number
JP3215163B2
JP3215163B2 JP16086692A JP16086692A JP3215163B2 JP 3215163 B2 JP3215163 B2 JP 3215163B2 JP 16086692 A JP16086692 A JP 16086692A JP 16086692 A JP16086692 A JP 16086692A JP 3215163 B2 JP3215163 B2 JP 3215163B2
Authority
JP
Japan
Prior art keywords
rectangle
ruled line
horizontal
vertical
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP16086692A
Other languages
Japanese (ja)
Other versions
JPH064704A (en
Inventor
道義 立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP16086692A priority Critical patent/JP3215163B2/en
Publication of JPH064704A publication Critical patent/JPH064704A/en
Application granted granted Critical
Publication of JP3215163B2 publication Critical patent/JP3215163B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文書画像中の罫線や表
領域等の抽出に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to extraction of ruled lines, table areas, and the like in a document image.

【0002】[0002]

【従来の技術】図表と文字等が混在する一般文書画像の
データを記録メディアにファイリングしたりG4ファク
シミリで伝送するような場合、文書画像中の水平罫線、
垂直罫線、罫線による囲み枠領域、罫線による表領域等
を自動的に識別できると都合がよいが、このような目的
に最適な技術は未だ確立されていない。
2. Description of the Related Art In a case where data of a general document image in which figures and characters are mixed is filed on a recording medium or transmitted by a G4 facsimile, horizontal ruled lines in the document image,
It is convenient to be able to automatically identify vertical ruled lines, bounded frame regions by ruled lines, table regions by ruled lines, etc., but a technique optimal for such purpose has not yet been established.

【0003】なお、これまで知られている関連技術とし
て、原稿をスキャンし2値化した画像から黒連結の矩形
を抽出し、その大きさを閾値と比較することによって、
文字の矩形と線図形の矩形を判別する画像抽出方式(特
開昭55−162177号)、黒ランを矩形統合し、一
定以上の大きさの矩形の内部の一定以上の長さのランを
統合して水平罫線を抽出し、水平罫線の個数より、当該
矩形が表領域であるか否かを判別する表領域識別方法
(特開平3−9489号)がある。
[0003] As a related technique known so far, a black-connected rectangle is extracted from a binary image by scanning a document, and the size of the rectangle is compared with a threshold value.
An image extraction method for discriminating between a character rectangle and a line graphic rectangle (Japanese Patent Laid-Open No. 55-162177), integrating black runs into rectangles and integrating runs longer than a certain length inside a rectangle larger than a certain size. Table area identification method for extracting horizontal ruled lines and determining whether or not the rectangle is a table area based on the number of horizontal ruled lines
(JP-A-3-9489) .

【0004】[0004]

【発明が解決しようとする課題】前記画像抽出方式は、
線図形に関し水平罫線、垂直罫線、表、囲み枠等詳細
に識別するものではない。また、前記表領域識別方法も
水平罫線だけを抽出し、その個数によって表領域の判定
を行なうため、表領域の識別精度が不十分な場合があ
り、また内部に罫線のない囲み枠等の識別ができない。
SUMMARY OF THE INVENTION
It does not identify a horizontal ruled line, a vertical ruled line, a table, an enclosing frame, and the like in detail regarding a line figure. In addition, the table area identification method also extracts only horizontal ruled lines and determines the table area based on the number of horizontal ruled lines. Therefore, the identification accuracy of the table area may be insufficient. Can not.

【0005】よって本発明の目的は、水平罫線、垂直罫
線、表領域、囲み枠領域、その他領域のより高精度な識
別・抽出のための技術を提供することにある。
SUMMARY OF THE INVENTION It is therefore an object of the present invention to provide a technique for identifying and extracting a horizontal ruled line, a vertical ruled line, a table area, a frame area, and other areas with higher accuracy.

【0006】[0006]

【課題を解決するための手段】請求項1または2の発明
方法によれば、文書画像またはその縮小画像から抽出し
た黒連結成分の外接矩形の中から、水平方向及び垂直方
向の大きさに基づいて水平罫線矩形候補または垂直罫線
矩形候補を選ぶ。水平罫線の識別の場合には水平方向
に、垂直罫線の識別の場合に垂直方向に、それぞれの矩
形候補の範囲、内の文書画像またはその縮小画像をスキ
ャンすることにより、ある閾値以上の長さの黒ランから
なる水平罫線矩形または垂直罫線矩形を抽出する。そし
て、各方向罫線矩形候補と、それより抽出された各方向
罫線矩形の水平方向及び垂直方向の大きさの関係に基づ
き(請求項1の発明)、あるいは水平方向及び垂直方向
の位置関係に基づき(請求項2の発明)、該罫線矩形が
水平または垂直罫線であるか否かを判定する。
According to the first or second aspect of the present invention, based on the size in the horizontal direction and the vertical direction from the circumscribed rectangle of the black connected component extracted from the document image or its reduced image. To select a horizontal ruled line rectangle candidate or a vertical ruled line rectangle candidate. By scanning the document image or its reduced image within the range of each rectangular candidate in the horizontal direction in the case of identifying a horizontal ruled line and in the vertical direction in the case of identifying a vertical ruled line, a length equal to or greater than a certain threshold value is obtained. A horizontal ruled line rectangle or a vertical ruled line rectangle consisting of black runs is extracted. Then, based on the relationship between each direction ruled line rectangle candidate and the size of each direction ruled line rectangle extracted in the horizontal direction and the vertical direction (the invention of claim 1), or based on the positional relationship in the horizontal direction and the vertical direction. It is determined whether the ruled line rectangle is a horizontal or vertical ruled line.

【0007】請求項3の発明によれば、文書画像または
その縮小画像から抽出した黒連結成分の外接矩形の中か
ら、水平方向及び垂直方向の大きさに基づき表領域矩形
候補を選ぶ。各表領域矩形候補の範囲について、文書画
像またはその縮小画像を水平方向にスキャンすることに
よって、ある閾値以上の長さの黒ランからなる水平罫線
矩形を抽出し、該水平罫線矩形に対して水平罫線の条件
判定を行なうことによって水平罫線を抽出し、また文書
画像またはその縮小画像を垂直方向にスキャンし、ある
閾値以上の長さの黒ランからなる垂直罫線を抽出し、該
垂直罫線矩形に対して垂直罫線の条件判定を行なうこと
によって垂直罫線を抽出する。そして、表領域矩形候補
から抽出された水平罫線の本数及び垂直罫線の本数を少
なくとも含む判定条件により、表領域矩形候補を表領域
であるか否かを判定する。さらに、判定条件には表領域
矩形候補の特定範囲における水平罫線または垂直罫線の
有無も含み、該判定条件によって該表領域矩形候補が囲
み枠領域、またはその他領域のいずれであるかを判定す
る。
According to the third aspect of the present invention , a table area rectangle candidate is selected from the circumscribed rectangles of the black connected components extracted from the document image or its reduced image based on the horizontal and vertical sizes. By scanning the document image or its reduced image in the horizontal direction with respect to the range of each table region rectangle candidate, a horizontal ruled line rectangle consisting of black runs having a length equal to or more than a certain threshold value is extracted, and the horizontal ruled line rectangle is horizontally scanned. A horizontal rule is extracted by performing rule condition determination, and a document image or a reduced image thereof is vertically scanned to extract a vertical rule consisting of a black run having a length equal to or greater than a certain threshold value. On the other hand, a vertical ruled line is extracted by determining the condition of the vertical ruled line. And the table area rectangle candidate
It is determined whether or not the table area rectangle candidate is a table area, based on a determination condition including at least the number of horizontal ruled lines and the number of vertical ruled lines extracted from . Further, the determination conditions also include the presence or absence of horizontal ruled lines or vertical ruled lines in a specific range in the table region rectangular candidate, said surface region rectangular candidate enclose by the determination condition
It is determined whether the area is a frame area or another area.

【0008】[0008]

【作用】請求項1または2の発明の方法は、罫線矩形候
補の選択、罫線矩形候補内の罫線矩形の抽出、罫線矩形
の条件判定という段階を経ることによって、水平または
垂直罫線の正確な識別、抽出が可能である。
According to the first or second aspect of the present invention, accurate identification of a horizontal or vertical ruled line is performed by going through the steps of selecting a ruled line rectangle candidate, extracting a ruled line rectangle from the ruled line rectangle candidates, and determining a ruled line rectangle condition. , Extraction is possible.

【0009】請求項3の発明の領域識別方法は、表領域
矩形候補の選択、表領域矩形候補内の水平罫線と垂直罫
線の抽出、表領域矩形候補内の水平罫線及び垂直罫線の
本数に加え、表領域矩形候補の特定範囲における水平ま
たは垂直罫線の有無を含む条件の判定、という段階を経
ることによって、表領域の正確な識別が可能であり、
らに、表領域以外の囲み枠領域とその他領域の識別も可
能である。
According to a third aspect of the present invention , there is provided an area identifying method for selecting a table area rectangular candidate, extracting a horizontal ruled line and a vertical ruled line in the table area rectangular candidate, and extracting a horizontal ruled line and a vertical ruled line in the table area rectangular candidate.
In addition to the number, the determination of conditions including the presence of horizontal or vertical ruled line at a particular range of the table region rectangular candidates, by going through the steps of a possible accurate identification of the tablespace, be
La is also possible identification tablespace other surrounding frame region and other regions.

【0010】[0010]

【実施例】実施例1 本実施例は、図1に示すように、スキャナ等によって入
力された文書画像データを記憶する文書画像メモリ10
0、このメモリ100内の文書画像データの黒連結成分
の外接矩形を抽出する矩形抽出部102、これにより抽
出された矩形の情報を記録するための矩形メモリ10
4、この矩形メモリ内の矩形情報を基に、抽出された矩
形の幅、高さを予め与えられた閾値と比較することによ
り矩形の種類分けを行なう矩形分類部106、この矩形
分類部106によって水平セパレータ(水平罫線)と判
定された矩形の情報(矩形メモリ104に格納されてい
る)を参照し、この矩形の画像(文書画像メモリ100
に格納されている)に対し水平方向スキャンを行なって
水平方向の黒ランを抽出し、予め与えられた閾値以上の
長さの黒ランから矩形を生成する水平罫線抽出部10
8、これによって抽出された矩形の情報を記憶する水平
罫線矩形メモリ110、このメモリ110に格納された
矩形の情報を基に、その矩形が水平セパレータ(水平罫
線)かどうかの最終判定を行なう水平罫線検定部11
2、各処理部102,106,108,112の制御を
行なう制御部114からなる機能構成を有する。
Embodiment 1 In this embodiment, as shown in FIG. 1, a document image memory 10 for storing document image data input by a scanner or the like.
0, a rectangle extracting unit 102 for extracting a circumscribed rectangle of a black connected component of the document image data in the memory 100, and a rectangular memory 10 for recording information of the rectangle extracted by the rectangle extracting unit 102
4. Based on the rectangle information in the rectangle memory, the rectangle classification unit 106 classifies the rectangle by comparing the width and height of the extracted rectangle with a predetermined threshold value. The rectangular image (stored in the rectangular memory 104) determined as a horizontal separator (horizontal ruled line) is referred to, and the rectangular image (the document image memory 100) is referred to.
, A horizontal ruled line extracting unit 10 that performs a horizontal scan on the horizontal rule to extract a black run in the horizontal direction and generates a rectangle from a black run having a length equal to or greater than a predetermined threshold.
8. A horizontal ruled line rectangle memory 110 for storing the information of the rectangles extracted by this, based on the information of the rectangles stored in the memory 110, a horizontal line for making a final determination as to whether or not the rectangle is a horizontal separator (horizontal ruled line) Ruled line verification unit 11
2. It has a functional configuration including a control unit 114 that controls each of the processing units 102, 106, 108, and 112.

【0011】なお、矩形抽出部102の前段に画像縮小
部を設け、これによって入力文書画像を縮小した画像を
対象として矩形抽出以下の各処理を行なってもよい。ま
た、この画像縮小部を含め各処理部は、ハードウエアと
して実現されるか、あるいはコンピュータシステム上で
ソフトウエアによって実現される。
Note that an image reduction unit may be provided in a stage preceding the rectangle extraction unit 102, and the following processes may be performed on a reduced image of the input document image. Each processing unit including the image reduction unit is realized as hardware or software on a computer system.

【0012】本実施例における水平パラメータ(水平罫
線)判定処理のフローは図2のように示される。以下、
この処理の詳細について説明するが、図3は説明中で適
宜参照される処理説明図である。
FIG. 2 shows the flow of the horizontal parameter (horizontal ruled line) determination processing in this embodiment. Less than,
The details of this process will be described. FIG. 3 is an explanatory diagram of the process which is appropriately referred to in the description.

【0013】まず、入力された文書画像に対し、矩形抽
出部102において黒連結成分の外接矩形の抽出を行な
う(ステップ200)。この処理は、例えば画像をスキ
ャンしながら接続した黒ランの外接矩形を抽出し、これ
を一定距離内にあるものについて統合する操作を繰り返
すことによって行なうことができる。
First, the rectangle extracting unit 102 extracts a circumscribed rectangle of the black connected component from the input document image (step 200). This processing can be performed by, for example, repeating the operation of extracting the circumscribed rectangle of the connected black run while scanning the image, and integrating the extracted rectangles within a certain distance.

【0014】この抽出された矩形に対し、矩形分類部1
06において、矩形の水平方向の大きさW,垂直方向の
大きさHと、それぞれの閾値RLHTH,RLVTHと
の比較判定を行ない、W>RLHTH かつ H<RLVTH の条件を満たす矩形を水平罫線矩形候補たる矩形(1)
と判定する(ステップ205、210)。
For the extracted rectangle, a rectangle classification unit 1
At 06, a comparison is made between the horizontal size W and the vertical size H of the rectangle and the respective thresholds RLHTH and RLVTH, and a rectangle satisfying the conditions of W> RLHTH and H <RLVTH is determined as a candidate for a horizontal ruled line rectangle. Barrel rectangle (1)
Is determined (steps 205 and 210 ).

【0015】図3(a)において、300は矩形(1)
の例を示し、その内部の網掛け部は文字や罫線等の黒連
結成分である。なお、矩形抽出部102においては、こ
のような文字や罫線等の黒連結成分の統合を行なうこと
によって矩形を抽出するが、かかる処理ついては公知で
あるので詳細説明は省略する。
In FIG . 3A, reference numeral 300 denotes a rectangle (1).
Is shown, and the hatched portion inside is a black connected component such as a character or a ruled line. Note that the rectangle extracting unit 102 extracts a rectangle by integrating such black connected components such as characters and ruled lines, but such processing is known and will not be described in detail.

【0016】なお、本実施例では閾値RLHTH,RL
VTHを固定しているが、適応的に自動設定するように
してもよい。一例を挙げれば、矩形抽出処理200の際
に文字とみなしえる黒連結成分の垂直方向の大きさの
(横書き文書の場合)のヒストグラムを作成し、このヒ
ストグラムに基づいて標準文字サイズを決定し、この標
準文字サイズに適当な係数を掛けることによって閾値R
LHTH,RLVTHを算出する。ただし、これはあく
まで一例に過ぎない。
In this embodiment, the threshold values RLHTH, RL
Although VTH is fixed, it may be adaptively and automatically set. As an example, a histogram of the vertical size (in the case of a horizontally written document) of a black connected component that can be regarded as a character in the rectangle extraction process 200 is created, and a standard character size is determined based on the histogram. By multiplying this standard character size by an appropriate coefficient, the threshold R
LHTH and RLVTH are calculated. However, this is only an example.

【0017】次に水平罫線抽出部108において、矩形
(1)の範囲の画像を水平方向にスキャンすることによ
り、閾値RUNHTH以上の長さの黒ランを抽出し、こ
の長い黒ランのみの連結成分に外接する矩形(矩形
(2))を罫線矩形として抽出する(ステップ21
5)。図3(b)において、302は矩形(1)300
から抽出された長い黒ランのみから生成される矩形
(2)であり、H1とW1は垂直方向と水平方向の大き
さである。なお、閾値RUNHTHは、固定値として予
め与えられるが、上記RLHTH,RLVTHと同様に
適応的に自動設定するようにしてもよい。
Next, the horizontal ruled line extracting unit 108 scans the image in the range of the rectangle (1) in the horizontal direction to extract a black run having a length equal to or longer than the threshold value RUNHTH. A rectangle (rectangle (2)) circumscribing to is extracted as a ruled line rectangle (step 21).
5). In FIG. 3B, reference numeral 302 denotes a rectangle (1) 300
Is a rectangle (2) generated only from the long black run extracted from, and H1 and W1 are the sizes in the vertical and horizontal directions. Although the threshold value RUNHTH is given in advance as a fixed value, it may be adaptively and automatically set in the same manner as RLHTH and RLVTH.

【0018】このような矩形(2)に対し、水平罫線検
定部112において、W1/W>閾値(例えば0.8)
かつ H1/H<閾値(例えば0.8)の条件判定を
行ない(ステップ220,225)、この条件を満たす
ときに矩形(2)を最終的に水平罫線であると判定する
(ステップ230)。図3(b)に示した矩形(2)3
02は水平罫線と最終判定される。
For such a rectangle (2), W1 / W> threshold (for example, 0.8) in the horizontal ruled line verification section 112.
In addition, a condition determination of H1 / H < threshold (for example, 0.8) is performed (steps 220 and 225), and when this condition is satisfied, the rectangle (2) is finally determined to be a horizontal ruled line (step 230). The rectangle (2) 3 shown in FIG.
02 is finally determined to be a horizontal ruled line.

【0019】制御部114は、矩形抽出部200により
抽出された矩形に対する処理の終了判定(ステップ23
5)を行ない、未処理の矩形が残っている場合は、ステ
ップ205以下の処理を再開させる。
The control unit 114 determines the end of the processing on the rectangle extracted by the rectangle extraction unit 200 (step 23).
5) is performed, and if an unprocessed rectangle remains, the processing from step 205 onward is restarted.

【0020】実施例2 本実施例は、実施例1と同様に図1に示す機能的構成を
有する。処理内容も、水平罫線検定部112の処理を除
いて実施例1と同様である。
Embodiment 2 This embodiment has the functional configuration shown in FIG. 1 as in Embodiment 1. The processing content is the same as that of the first embodiment except for the processing of the horizontal ruled line verification unit 112.

【0021】すなわち、実施例1においては、水平罫線
検定部112は、矩形(1)と矩形(2)の水平方向及
び垂直方向の大きさの比によって水平罫線の検定を行な
った(図2のステップ220〜230)。これに対し本
実施例においては、図3(c)に示すように、矩形
(1)300と矩形(2)302の始終点の水平方向の
位置の差ΔW1,ΔW2、垂直方向の位置の差ΔH1,
ΔH2が、 ΔW1<閾値 かつ ΔW2<閾値 かつ ΔH1<閾値 かつ ΔH2<閾値 のときに、矩形(2)302を最終的に水平罫線と判定
する。
That is, in the first embodiment, the horizontal ruled line test unit 112 tests the horizontal ruled line based on the ratio between the horizontal and vertical sizes of the rectangle (1) and the rectangle (2) (see FIG. 2). Steps 220 to 230). On the other hand, in the present embodiment, as shown in FIG. 3C, the difference ΔW1, ΔW2 in the horizontal position between the start and end points of the rectangle (1) 300 and the rectangle (2) 302, and the difference in the vertical position ΔH1,
When ΔH2 is ΔW1 <threshold and ΔW2 <threshold and ΔH1 <threshold and ΔH2 <threshold, the rectangle (2) 302 is finally determined to be a horizontal ruled line.

【0022】実施例3 本実施例は図4に示すような機能的構成を有する。本実
施例は垂直罫線を抽出する関係から、実施例1と次の点
が相違する。
Embodiment 3 This embodiment has a functional configuration as shown in FIG. This embodiment is different from the first embodiment in the following point from the relation of extracting a vertical ruled line.

【0023】矩形分類部106において、矩形の水平方
向の大きさをW、垂直方向の大きさ)Hとし、W<RL
HTHかつH>RLVTHの条件が満たされる場合に、
その矩形を垂直罫線矩形候補たる矩形(1)に分類す
る。なお、垂直罫線を対象としているので、水平罫線を
対象とした実施例1,2とは閾値RLHTH,RLVT
Hの大小関係が逆になる。
In the rectangle classifying unit 106, the horizontal size of the rectangle is W and the vertical size is H, and W <RL
When the condition of HTH and H> RLVTH is satisfied,
The rectangle is classified as rectangle (1) which is a candidate for a vertical ruled line rectangle. Since the vertical ruled line is targeted, the threshold values RLHTH and RLVT are different from those of the first and second embodiments targeted at the horizontal ruled line.
The magnitude relationship of H is reversed.

【0024】垂直罫線抽出部408において、矩形
(1)の範囲の文書画像を垂直方向にスキャンして黒ラ
ンを抽出し、予め与えられた閾値RUNHTH以上の長
さの黒ランのみの連結成分からなる矩形(2)を抽出
し、その情報を垂直罫線矩形メモリ410に格納する。
The vertical ruled line extraction unit 408 vertically scans the document image in the range of the rectangle (1) to extract black runs, and extracts from the connected components of only black runs having a length equal to or longer than a predetermined threshold value RUNHTH. The rectangle (2) is extracted and the information is stored in the vertical ruled line rectangle memory 410.

【0025】垂直罫線検定部412は、矩形(2)の水
平方向の大きさW1,垂直方向の大きさH1と矩形
(1)の水平方向の大きさW,垂直方向の大きさHとの
間に、W1/W<閾値(例えば0.8) かつ H1/
H>閾値(例えば0.8)の条件が成立する場合に、矩
形(2)を垂直罫線であると最終判定する。
The vertical ruled line verification unit 412 calculates the horizontal size W1 of the rectangle (2), the vertical size H1 and the horizontal size W and the vertical size H of the rectangle (1). Where W1 / W <threshold (for example, 0.8) and H1 /
If the condition of H> threshold (for example, 0.8) is satisfied, the rectangle (2) is finally determined to be a vertical ruled line.

【0026】なお、本実施例においても、入力文書画像
を縮小した画像を処理対象として垂直罫線抽出を行なっ
てもよい。
In this embodiment, vertical ruled line extraction may be performed on an image obtained by reducing the input document image.

【0027】実施例4 本実施例は、実施例3と同様に図4に示す機能的構成を
有する。処理内容も、垂直罫線検定部412の処理を除
いて実施例3と同様である。
Embodiment 4 This embodiment has a functional configuration shown in FIG. The processing content is the same as that of the third embodiment except for the processing of the vertical ruled line verification unit 412.

【0028】すなわち、本実施例においては、垂直罫線
検定部412は、矩形(1)と矩形(2)の始終点の水
平方向の位置の差ΔW1,ΔW2、垂直方向の位置の差
ΔH1,ΔH2が、 ΔW1<閾値 かつ ΔW2<閾値 かつ ΔH1<閾値 かつ ΔH2<閾値 のときに、矩形(2)を最終的に垂直罫線と判定する。
That is, in the present embodiment, the vertical ruled line verification unit 412 determines the difference ΔW1, ΔW2 in the horizontal position between the start and end points of the rectangle (1) and the rectangle (2), and the difference ΔH1, ΔH2 in the vertical direction. When ΔW1 <threshold and ΔW2 <threshold and ΔH1 <threshold and ΔH2 <threshold, the rectangle (2) is finally determined to be a vertical ruled line.

【0029】なお、本実施例においても、入力文書画像
の縮小画像を対象として処理を行なうこともできる。
In this embodiment, the processing can be performed on a reduced image of the input document image.

【0030】実施例5 図5は本実施例の機能ブロック図である。ただし、図1
または図4の同等部分は同符号により示されている。5
06は矩形分類部であり、これは図1または図4の矩形
分類部106と分類条件が異なる。514は追加された
領域判定部である。図6は本実施例の処理フローチャー
ト、図7は処理説明用の図である。以下、処理内容を説
明する。
Embodiment 5 FIG. 5 is a functional block diagram of this embodiment. However, FIG.
Alternatively, the equivalent parts in FIG. 4 are indicated by the same reference numerals. 5
Reference numeral 06 denotes a rectangle classification unit, which is different from the rectangle classification unit 106 of FIG. 1 or 4 in classification conditions. Reference numeral 514 denotes an added area determination unit. FIG. 6 is a process flowchart of the present embodiment, and FIG. 7 is a diagram for explaining the process. Hereinafter, the processing content will be described.

【0031】矩形抽出部102において、文書画像より
黒連結成分の外接矩形を抽出し、矩形の情報を矩形メモ
リ104に格納する(ステップ600)。なお、入力文
書画像の縮小処理を行ない、縮小処理について矩形抽出
以下の処理を実行することも可能である。
The rectangle extracting unit 102 extracts a circumscribed rectangle of the black connected component from the document image, and stores information on the rectangle in the rectangle memory 104 (step 600). Note that it is also possible to perform a reduction process on the input document image, and execute the processes following the rectangle extraction for the reduction process.

【0032】矩形分類部506において、矩形の水平方
向の大きさW、垂直方向の大きさHと、水平方向の閾値
LARGEHTH、垂直方向の閾値LARGEVTHと
の比較判定を行ない、 W>LARGEHTH かつ H>LARGEVTH の条件を満たす矩形を表領域矩形候補たる矩形(1)と
判定する(ステップ605,610)。
In the rectangle classifying unit 506, a comparison is made between the horizontal size W and the vertical size H of the rectangle and the horizontal threshold value LARGEHTH and the vertical threshold value LARGEVTH, and W> LARGEHTH and H> A rectangle that satisfies the condition of LARGEVTH is determined to be a rectangle (1) that is a table region rectangle candidate (steps 605 and 610).

【0033】なお、ここでは水平方向の罫線と垂直方向
の罫線からなる、ある大きさ以上の表領域を識別するこ
とを目的としているので、閾値LARGEHTH,LA
RGEVTHは、そのような識別対象の表領域の最小サ
イズを考慮し予め決定される。ただし、これらの閾値
を、例えば矩形の高さのヒストグラム等に基づいて適応
的に自動決定するようにしてもよい。
Note that, since the purpose is to identify a table area having a certain size or more, which is composed of horizontal ruled lines and vertical ruled lines, the threshold values LARGEHTH, LA
RGEVTH is predetermined in consideration of the minimum size of such a table area to be identified. However, these thresholds may be adaptively automatically determined based on, for example, a histogram of the height of the rectangle.

【0034】次に、水平罫線抽出部108と水平罫線検
定部112により矩形(1)から水平罫線を抽出する
(ステップ615)。実施例1と同様に、水平罫線抽出
部108において表領域矩形候補たる矩形(1)の範囲
内の画像を水平スキャンし、所定値以上の長さの黒ラン
のみから生成される水平罫線矩形たる矩形(2)を抽出
する。水平罫線検定部112において、矩形(2)の水
平方向の大きさW1、垂直方向の大きさH1、矩形
(1)の水平方向の大きさWに関して、 W1/W>閾値(例えば0.8) かつ H1<RLHeightTH の条件を満たすときに、矩形(2)を水平罫線として抽
出する。なお、閾値RLHeightは固定値として
も、適応的に決定される可変値としてもよい。
Next, horizontal ruled lines are extracted from the rectangle (1) by the horizontal ruled line extraction unit 108 and the horizontal ruled line verification unit 112 (step 615). As in the first embodiment, the horizontal ruled line extraction unit 108 horizontally scans an image within the range of the rectangle (1), which is a table region rectangle candidate, and forms a horizontal ruled line rectangle generated only from black runs having a length equal to or longer than a predetermined value. Extract rectangle (2). In the horizontal ruled line verification unit 112, regarding the horizontal size W1, the vertical size H1, and the horizontal size W of the rectangle (1), W1 / W> threshold (for example, 0.8) When the condition of H1 <RLHeightTH is satisfied, the rectangle (2) is extracted as a horizontal ruled line. Note that the threshold value RLHeight may be a fixed value or a variable value determined adaptively.

【0035】また、垂直罫線抽出部408と垂直罫線検
定部412により表領域矩形候補たる矩形(1)から垂
直罫線を抽出する(ステップ620)。垂直罫線抽出部
408により、実施例3と同様に、矩形(1)の範囲の
画像を垂直スキャンし、所定値以上の長さの黒ランのみ
から生成される垂直罫線矩形たる矩形(2)を抽出し、
垂直罫線検定部412により、矩形(2)の水平方向の
大きさW1、垂直方向の大きさH1、矩形(1)の垂直
方向の大きさHに関し、 H1/H>閾値(例えば0.8) かつ W1<RLWidthTH の条件を満たすときに、矩形(2)を垂直罫線として抽
出する。なお、閾値RLwidthTHは固定値として
も、あるいは適応的に決定される可変値としてもよい。
The vertical ruled line extraction unit 408 and the vertical ruled line verification unit 412 extract a vertical ruled line from the rectangle (1) which is a table region rectangle candidate (step 620). As in the third embodiment, the vertical ruled line extraction unit 408 vertically scans the image in the range of the rectangle (1) and determines the rectangle (2) as a vertical ruled line rectangle generated only from black runs having a length equal to or more than a predetermined value. Extract,
By the vertical ruled line verification unit 412, regarding the horizontal size W1, the vertical size H1, and the vertical size H of the rectangle (1), H1 / H> threshold (for example, 0.8) When the condition of W1 <RLWidthTH is satisfied, the rectangle (2) is extracted as a vertical ruled line. Note that the threshold value RLwidthTH may be a fixed value or a variable value determined adaptively.

【0036】次に、領域判定部517において、矩形分
類部506で分類された表領域矩形候補たる矩形(1)
毎に、それより抽出された水平罫線と垂直罫線の本数と
閾値とを比較する(ステップ625,630)。ここで
は、閾値として3を用いるものとすると、3本以上の水
平罫線と3本以上の垂直罫線の両方が抽出された矩形
(1)を表領域と判定する(ステップ635)。なお、
各方向罫線検定部112,412より抽出した罫線の位
置座標が出され、領域判定部517はこの位置座標と矩
形メモリ104に格納されている矩形(1)の情報との
比較によって、各罫線がどの矩形(1)に属するもので
あるかを認識する。
Next, in the area determination section 517, the rectangle (1) which is a table area rectangle candidate classified by the rectangle classification section 506 is used.
Each time, the number of horizontal ruled lines and vertical ruled lines extracted therefrom is compared with a threshold value (steps 625 and 630). Here, assuming that 3 is used as the threshold value, the rectangle (1) from which both three or more horizontal ruled lines and three or more vertical ruled lines are extracted is determined as a table area (step 635). In addition,
The position coordinates of the ruled lines extracted from the direction ruled line verification units 112 and 412 are output, and the area determination unit 517 compares the position coordinates with the information of the rectangle (1) stored in the rectangle memory 104 to determine each ruled line. It recognizes which rectangle (1) it belongs to.

【0037】図7において、700は表領域矩形候補た
る矩形(1)の例である。この例では、矩形(1)70
0は3本の水平罫線と3本の垂直罫線からなる表領域で
ある。水平罫線は矩形(2)702a〜702cとして
抽出され、垂直罫線は矩形(2)704a〜704cと
して抽出され、それぞれ最終的に水平罫線または垂直罫
線と判定されるので、この矩形(1)700は各罫線の
本数の条件を満足し表領域と判定されることになる。
In FIG. 7, reference numeral 700 denotes an example of a rectangle (1) which is a table area rectangle candidate. In this example, the rectangle (1) 70
0 is a table area including three horizontal ruled lines and three vertical ruled lines. The horizontal ruled lines are extracted as rectangles (2) 702a to 702c, and the vertical ruled lines are extracted as rectangles (2) 704a to 704c. Each of them is finally determined as a horizontal ruled line or a vertical ruled line. The condition of the number of each ruled line is satisfied, and the area is determined as a table area.

【0038】実施例6 本実施例は実施例5と同様の機能構成を有する。本実施
例の処理内容は、領域判定部517の判定条件(図6の
ステップ625,630対応)が実施例5の場合と異な
るが、その他は同様である。
Embodiment 6 This embodiment has the same functional configuration as Embodiment 5. The processing content of the present embodiment is the same as that of the fifth embodiment except that the determination conditions (corresponding to steps 625 and 630 in FIG. 6) of the area determination unit 517 are different.

【0039】領域判定部517の処理について、図7
(b)により説明する。矩形(1)700の上辺からあ
る範囲RangeUTHにある最も上の水平罫線(70
2a)をupper、矩形(1)700の下辺からある
範囲RangeLTHにある最も下の水平罫線(702
c)をlowerとする。このようなupperとlo
werが存在し、かつ実施例5と同様に水平罫線、垂直
罫線がともに3本以上存在する場合に、矩形(1)を表
領域と判定する。
FIG. 7 shows the processing of the area determination unit 517.
This will be described with reference to FIG. The uppermost horizontal ruled line (70) in a range RangeUTH from the upper side of the rectangle (1) 700
2a) is an upper, lowermost horizontal ruled line (702) in a range RangeLTH from the lower side of the rectangle (1) 700.
Let c) be lower. Such upper and lo
If there is a wer and there are three or more horizontal ruled lines and vertical ruled lines as in the fifth embodiment, the rectangle (1) is determined as a table area.

【0040】実施例7 本実施例は実施例5と同様の機能構成を有する。本実施
例の処理内容は、領域判定部517の判定条件が実施例
5の場合と異なるが、その他は同様である。
Embodiment 7 This embodiment has the same functional configuration as Embodiment 5. The processing content of this embodiment is the same as that of the fifth embodiment except that the determination condition of the area determination unit 517 is different from that of the fifth embodiment.

【0041】領域判定部517の処理について、図7に
より説明する。実施例6の場合と同様に、upperと
lowerを求める。さらに、矩形(1)700の左辺
からRangeLFTHkの範囲と矩形(1)の右辺か
らRangeRTHの範囲を除いた中間の範囲にある垂
直罫線(704b)をmiddleとする。
The processing of the area determination unit 517 will be described with reference to FIG. As in the case of the sixth embodiment, upper and lower are obtained. Further, the vertical ruled line (704b) in the middle range excluding the range of RangeLFTHk from the left side of the rectangle (1) 700 and the range of RangeRTH from the right side of the rectangle (1) is set as middle.

【0042】そして、水平罫線が3本以上あり、かつ、
upperとlower(実施例6参照)が存在し、か
つ、middleが1本以上ある場合に矩形(1)を表
領域と判定する。
Then, there are three or more horizontal ruled lines, and
If there is an upper and a lower (see Embodiment 6) and there is at least one middle, the rectangle (1) is determined as a table area.

【0043】実施例8 本実施例は実施例5と同様の機能構成を有する。本実施
例の処理内容は、領域判定部517の判定条件が実施例
5の場合と異なるが、その他は同様である。
Embodiment 8 This embodiment has the same functional configuration as Embodiment 5. The processing content of this embodiment is the same as that of the fifth embodiment except that the determination condition of the area determination unit 517 is different from that of the fifth embodiment.

【0044】表領域判定部517の処理を図7を用いて
説明する。実施例6の場合と同様に、upperとlo
werを求める。さらに、矩形(1)700の左辺から
RangeLFTHの範囲にある最も左の垂直罫線(7
04a)をleft、矩形(1)の右辺からRange
RTHの範囲にある最も右の垂直罫線(704c)をr
ight、それらの範囲以外の中間の範囲にある垂直罫
線(704b)をmiddleとして求める。
The processing of the table area determination unit 517 will be described with reference to FIG. As in the case of the sixth embodiment, upper and lo
Find the wer. Furthermore, the leftmost vertical ruled line (7) in the range of RangeLFTH from the left side of the rectangle (1) 700
04a) is left and Range is from the right side of rectangle (1).
The rightmost vertical ruled line (704c) in the range of RTH is r
and the vertical ruled line (704b) in the middle range other than those ranges is determined as middle.

【0045】そして、領域(1)において、実施例5,
6,7のいずれかの表領域判定条件に当てはまる場合は
領域(1)を表領域と判定する。それに当てはまらない
らない場合、upper,lower,left,ri
ghtの一つ以上が存在するときは領域(1)を囲み領
域と判定するが、upper,lower,left,
rightのいずれも存在しないときは領域(1)を表
領域でも囲み枠領域でもない、その他領域(図、写真
等)と判定する。
Then, in region (1), in Example 5,
If any of the table area determination conditions 6 and 7 is satisfied, the area (1) is determined as a table area. If that is not the case, upper, lower, left, ri
When one or more of the ghts exist, the area (1) is determined to be an enclosing area, but upper, lower, left,
When neither of the right does not exist, the area (1) is determined to be neither the table area nor the surrounding frame area, but another area (figure, photograph, etc.).

【0046】[0046]

【発明の効果】以上の詳細説明から明らかなように、請
求項1または2の発明によれば、水平または垂直罫線を
正確に識別できるという効果を得られ、請求項3の発明
によれば、表領域の正確な識別と囲み枠領域、その他領
域の識別が可能になるという効果を得られる。
As is apparent from the above detailed description , according to the first or second aspect of the present invention , the effect that the horizontal or vertical ruled line can be accurately identified is obtained, and the third aspect of the present invention is achieved.
According to the above, there is an effect that accurate identification of the table region and identification of the surrounding frame region and other regions are enabled.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施例1及び実施例2の機能ブロック図であ
る。
FIG. 1 is a functional block diagram of a first embodiment and a second embodiment.

【図2】実施例1の処理フローチャートである。FIG. 2 is a processing flowchart of the first embodiment.

【図3】(a)水平罫線矩形候補の抽出例を示す図であ
る。 (b)実施例1における水平罫線判定の説明図である。 (c)実施例2における水平罫線判定の説明図である。
FIG. 3A is a diagram showing an example of extracting horizontal ruled line rectangle candidates; (B) It is explanatory drawing of a horizontal ruled line determination in Example 1. FIG. (C) It is explanatory drawing of a horizontal ruled line determination in Example 2.

【図4】実施例3及び実施例4の機能ブロック図であ
る。
FIG. 4 is a functional block diagram of a third embodiment and a fourth embodiment.

【図5】実施例5,6,7及び8の機能ブロック図であ
る。
FIG. 5 is a functional block diagram of embodiments 5, 6, 7 and 8.

【図6】実施例5の処理フローチャートである。FIG. 6 is a processing flowchart of a fifth embodiment.

【図7】(a)表領域矩形候補の例を示す図である。 (b)水平罫線に関する説明図である。 (c)垂直罫線に関する説明図である。FIG. 7A illustrates an example of a table area rectangle candidate. (B) It is explanatory drawing regarding a horizontal ruled line. (C) It is explanatory drawing regarding a vertical ruled line.

【符号の説明】[Explanation of symbols]

100 文書画像メモリ 102 矩形抽出部 104 矩形メモリ 106 矩形分類部 108 水平罫線抽出部 110 水平罫線矩形メモリ 112 水平罫線検定部 114 制御部 300 水平罫線矩形候補(矩形(1)) 302 水平罫線矩形(矩形(2)) 408 垂直罫線抽出部 410 垂直罫線矩形メモリ 412 垂直罫線検定部 506 矩形分類部 517 領域判定部 700 表領域矩形候補(矩形(1)) 702a〜702c 水平罫線矩形(矩形(2)) 704a〜704c 垂直罫線矩形(矩形(2)) REFERENCE SIGNS LIST 100 document image memory 102 rectangle extraction unit 104 rectangle memory 106 rectangle classification unit 108 horizontal ruled line extraction unit 110 horizontal ruled line rectangle memory 112 horizontal ruled line verification unit 114 control unit 300 horizontal ruled line rectangle candidate (rectangle (1)) 302 horizontal ruled line rectangle (rectangle) (2)) 408 vertical ruled line extraction unit 410 vertical ruled line rectangle memory 412 vertical ruled line verification unit 506 rectangle classification unit 517 area determination unit 700 table area rectangle candidate (rectangle (1)) 702a to 702c horizontal ruled line rectangle (rectangle (2)) 704a to 704c Vertical ruled line rectangle (rectangle (2))

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 (ア)文書画像またはその縮小画像から
黒連結成分の外接矩形を抽出し、 (イ)上記(ア)で抽出された矩形より、その水平方向
及び垂直方向の大きさに基づき、水平方向または垂直方
向いずれか特定の方向の罫線矩形候補を選び、 (ウ)上記(イ)で選ばれた罫線矩形候補の範囲につい
て文書画像またはその縮小画像を特定方向にスキャン
し、ある閾値以上の長さの黒ランから罫線矩形を生成
し、 (エ)上記(イ)で選ばれた罫線矩形候補と、上記
(ウ)で生成された罫線矩形の水平方向及び垂直方向の
大きさの関係に基づき、該罫線矩形が特定方向の罫線で
あるか否かを判定することを特徴とする罫線識別方法。
1. A circumscribed rectangle of a black connected component is extracted from a document image or a reduced image thereof. (A) The rectangle extracted in the above (a) is extracted based on the horizontal and vertical sizes thereof. Selecting a ruled line rectangle candidate in a specific direction, either the horizontal direction or the vertical direction, and (c) scanning the document image or its reduced image in the specified direction for the range of the ruled line rectangle candidate selected in (b) above, generates a ruled line rectangle from black runs of longer than, (d) and ruled line rectangle candidates selected in (b), the
A ruled line identification method characterized by determining whether or not the ruled line rectangle is a ruled line in a specific direction based on the relationship between the horizontal and vertical sizes of the ruled line rectangle generated in (c) .
【請求項2】 (ア)文書画像またはその縮小画像から
黒連結成分の外接矩形を抽出し、 (イ)上記(ア)で抽出された矩形より、その水平方向
及び垂直方向の大きさに基づき、水平方向または垂直方
向いずれか特定の方向の罫線矩形候補を選び、 (ウ)上記(イ)で選ばれた罫線矩形候補の範囲につい
て文書画像またはその縮小画像を特定方向にスキャン
し、ある閾値以上の長さの黒ランから罫線矩形を生成
し、 (エ)上記(イ)で選ばれた罫線矩形候補と、上記
(ウ)で生成された罫線矩形の水平方向及び垂直方向の
位置関係に基づき、該罫線矩形が特定方向の罫線である
か否かを判定することを特徴とする罫線識別方法。
(A) extracting a circumscribed rectangle of a black connected component from a document image or a reduced image thereof; and (a) extracting a rectangle extracted in (a) based on the horizontal and vertical sizes thereof. Selecting a ruled line rectangle candidate in a specific direction, either the horizontal direction or the vertical direction, and (c) scanning the document image or its reduced image in the specified direction for the range of the ruled line rectangle candidate selected in (b) above, generates a ruled line rectangle from black runs of longer than, (d) and ruled line rectangle candidates selected in (b), the
A ruled line identification method characterized by determining whether or not the ruled line rectangle is a ruled line in a specific direction based on the horizontal and vertical positional relationships of the ruled line rectangle generated in (c) .
【請求項3】 (ア)文書画像またはその縮小画像から
黒連結成分の外接矩形を抽出し、 (イ)上記(ア)で抽出された矩形より、その水平方向
及び垂直方向の大きさに基づき、表領域矩形候補を選
び、 (ウ)上記(イ)で選ばれた表領域矩形候補の範囲につ
いて文書画像またはその縮小画像を水平方向にスキャン
することによって、ある閾値以上の長さの黒ランからな
る水平罫線矩形を抽出し、該水平罫線矩形に対して水平
罫線の条件判定を行なうことによって水平罫線を抽出
し、 (エ)上記(イ)で選ばれた表領域矩形候補の範囲につ
いて文書画像またはその縮小画像を垂直方向にスキャン
し、ある閾値以上の長さの黒ランからなる垂直罫線を抽
出し、該垂直罫線矩形に対して垂直罫線の条件判定を行
なうことによって垂直罫線を抽出し、 (オ)上記(イ)で選ばれた表領域矩形候補から上記
(ウ)、(エ)で抽出される水平罫線及び垂直罫線の有
無、本数により、該表領域矩形候補が表領域、囲み枠領
域、またはその他領域のいずれであるかを判定すること
を特徴とする領域識別方法。
3. A circumscribing rectangle of a black connected component is extracted from a document image or a reduced image thereof. A. Based on the horizontal and vertical sizes of the rectangle extracted in the above step A. (C) by scanning a document image or its reduced image in the horizontal direction over the range of the table region rectangle candidate selected in (b) above, thereby obtaining a black run having a length equal to or longer than a certain threshold value. Is extracted by performing a horizontal ruled condition determination for the horizontal ruled line rectangle, and a horizontal ruled line is extracted. (D) The document for the range of the table area rectangle candidate selected in (b) above The image or its reduced image is scanned in the vertical direction, a vertical ruled line consisting of a black run having a length equal to or more than a certain threshold is extracted, and the vertical ruled line is extracted by performing a vertical ruled condition determination on the vertical ruled line rectangle. (E) From the table area rectangle candidate selected in (a) above,
With horizontal and vertical ruled lines extracted in (c) and (d)
None, depending on the number, the table area rectangle candidate is
Area or other area
An area identification method characterized by the following .
JP16086692A 1992-06-19 1992-06-19 Ruled line identification method and area identification method Expired - Lifetime JP3215163B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16086692A JP3215163B2 (en) 1992-06-19 1992-06-19 Ruled line identification method and area identification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16086692A JP3215163B2 (en) 1992-06-19 1992-06-19 Ruled line identification method and area identification method

Publications (2)

Publication Number Publication Date
JPH064704A JPH064704A (en) 1994-01-14
JP3215163B2 true JP3215163B2 (en) 2001-10-02

Family

ID=15724070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16086692A Expired - Lifetime JP3215163B2 (en) 1992-06-19 1992-06-19 Ruled line identification method and area identification method

Country Status (1)

Country Link
JP (1) JP3215163B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8254669B2 (en) 2007-09-19 2012-08-28 Ricoh Company, Ltd. Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4671885B2 (en) 2005-06-01 2011-04-20 株式会社リコー Image processing apparatus, program, and image processing method
JP2007299321A (en) 2006-05-02 2007-11-15 Ricoh Co Ltd Information processor, information processing method, information processing program and information storage medium
US8260057B2 (en) 2007-07-12 2012-09-04 Ricoh Company, Limited Image processing apparatus that obtains a ruled line from a multi-value image
JP5096194B2 (en) 2008-03-17 2012-12-12 株式会社リコー Data processing apparatus, program, and data processing method
EP2940199B1 (en) 2012-12-28 2017-11-08 Kuraray Co., Ltd. Drawing device and drawing method
JP6468463B2 (en) 2015-07-30 2019-02-13 京セラドキュメントソリューションズ株式会社 Image processing device
JP6810892B2 (en) 2017-06-05 2021-01-13 京セラドキュメントソリューションズ株式会社 Image processing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8254669B2 (en) 2007-09-19 2012-08-28 Ricoh Company, Ltd. Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit

Also Published As

Publication number Publication date
JPH064704A (en) 1994-01-14

Similar Documents

Publication Publication Date Title
US6512848B2 (en) Page analysis system
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
JP3904840B2 (en) Ruled line extraction device for extracting ruled lines from multi-valued images
US6674900B1 (en) Method for extracting titles from digital images
US7454060B2 (en) Image processor for character recognition
JP3278471B2 (en) Area division method
JP2002208007A (en) Automatic detection of scanned document
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP3215163B2 (en) Ruled line identification method and area identification method
JP2000207489A (en) Character extracting method and device and record medium
US6360006B1 (en) Color block selection
US6269186B1 (en) Image processing apparatus and method
JP2002015280A (en) Device and method for image recognition, and computer- readable recording medium with recorded image recognizing program
JP3285686B2 (en) Area division method
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JPH10232926A (en) Image processor and its method
JP3187895B2 (en) Character area extraction method
JPH11191135A (en) Japanese/english discriminating method for document image, document recognizing method and recording medium
JP4204185B2 (en) Character recognition device, character recognition method, and recording medium
JP4616522B2 (en) Document recognition apparatus, document image region identification method, program, and storage medium
JPH08237404A (en) Selection of optical character recognition mode
JP3220226B2 (en) Character string direction determination method
JPH08221515A (en) Image processor
JPH0535914A (en) Picture inclination detection method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070727

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080727

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090727

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090727

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 11

EXPY Cancellation because of completion of term