JP3278221B2 - Image processing method and apparatus - Google Patents

Image processing method and apparatus

Info

Publication number
JP3278221B2
JP3278221B2 JP00269693A JP269693A JP3278221B2 JP 3278221 B2 JP3278221 B2 JP 3278221B2 JP 00269693 A JP00269693 A JP 00269693A JP 269693 A JP269693 A JP 269693A JP 3278221 B2 JP3278221 B2 JP 3278221B2
Authority
JP
Japan
Prior art keywords
area
point
line segment
heading
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00269693A
Other languages
Japanese (ja)
Other versions
JPH06208651A (en
Inventor
忠則 中塚
和之 齋藤
徹 二木
昭浩 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP00269693A priority Critical patent/JP3278221B2/en
Priority to EP98203750A priority patent/EP0898240B1/en
Priority to DE69332750T priority patent/DE69332750T2/en
Priority to EP93310637A priority patent/EP0606780B1/en
Priority to DE69330423T priority patent/DE69330423T2/en
Publication of JPH06208651A publication Critical patent/JPH06208651A/en
Priority to US08/742,222 priority patent/US6125204A/en
Application granted granted Critical
Publication of JP3278221B2 publication Critical patent/JP3278221B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、OCR(光学的文字認
識装置)、複写機、ファクシミリ等の画像情報を入力
し、この画像情報から属性ごとの領域に分割処理をし得
る画像処理方法及び装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing method capable of inputting image information of an OCR (optical character recognition device), a copying machine, a facsimile or the like, and dividing the image information into regions for each attribute. It concerns the device.

【0002】[0002]

【従来の技術】従来、画像情報の中に複数の見出しが存
在する場合は、縦書き文書の場合は右から左に、横書き
文書の場合は上から下に、順に順序を付けていくものは
あった。
2. Description of the Related Art Conventionally, when a plurality of headings exist in image information, the order in which the document is sequentially arranged from right to left for a vertically written document and from top to bottom for a horizontally written document is as follows. there were.

【0003】従来、入力画像の領域分割処理において、
表と他の領域の分類はその外接矩形の面積と画素数の比
から求めるだけのものであった。
Conventionally, in an area dividing process of an input image,
The classification of the table and other regions was simply obtained from the ratio of the area of the circumscribed rectangle to the number of pixels.

【0004】[0004]

【発明が解決しようとしている課題】しかしながら、上
述の見出し順序付けの従来技術では、新聞記事等、本文
に囲まれる様にして見出しがある原稿の場合に、見出し
が本文のなかに入って認識されてしまい、本来の順位と
は異なり、本文の文章の流れを乱してしまうという問題
点があった。
However, according to the above-described conventional technique of heading ordering, in the case of a manuscript having a heading surrounded by the main body such as a newspaper article, the heading is recognized in the main body. As a result, there is a problem that, unlike the original order, the flow of text in the text is disturbed.

【0005】[0005]

【0006】[0006]

【課題を解決するための手段】上記課題を解決する為
に、請求項1に記載の画像処理方法は、入力された画像
情報において属性毎に分割された領域内の所定の点から
放射線分を伸ばし、前記放射線分と前記入力された画像
情報との関連情報を検出し、前記検出される関連情報に
したがって、前記分割された他の領域に対する、前記所
定の点を含む領域の順位を決定することを特徴とする。
According to a first aspect of the present invention, there is provided an image processing method, comprising: extracting a radiation component from a predetermined point in a region divided for each attribute in input image information; Stretching, detecting related information between the radiation component and the input image information, and determining the order of the area including the predetermined point with respect to the other divided area according to the detected related information. It is characterized by the following.

【0007】上記課題を解決する為に、請求項9に記載
の画像処理装置は、入力された画像情報において属性毎
に分割された領域内の所定の点から放射線分を伸ばす線
分放射手段と、前記放射線分と前記入力された画像情報
との関連情報を検出する関連情報検出手段と、前記検出
される関連情報にしたがって、前記分割された他の領域
に対する、前記所定の点を含む領域の順位を決定する領
域順位決定手段とを有することを特徴とする。
According to another aspect of the present invention, there is provided an image processing apparatus comprising: a line segment radiating unit for extending a radiation segment from a predetermined point in a region divided for each attribute in input image information; A related information detecting means for detecting related information between the radiation component and the input image information, and, according to the detected related information, an area including the predetermined point with respect to the other divided area. Region order determining means for determining the order.

【0008】[0008]

【0009】[0009]

【0010】[0010]

【実施例】【Example】

(実施例1)図1は、本実施例の画像処理装置の構成を
表すブロック図である。
(Embodiment 1) FIG. 1 is a block diagram showing a configuration of an image processing apparatus of the present embodiment.

【0011】同図において、101は画像データの入力
部である。102は記憶部103に記憶された制御プロ
グラムに従って装置の制御や各部処理の演算を行う演算
処理部(CPU)である。103は後述するフローチャ
ートに示す処理の制御プログラムや、各種データを記憶
しておく記憶部であり、ROM、RAMを含む。104
は演算処理結果や画像処理結果、及び画像データを出力
する出力部である。105は領域分割処理全体を行う領
域分割部である。106は入力画像を間引く、画像間引
き部である。107は間引き画素にラベル付けを行い同
時に初期矩形データを作成するラベリング部である。1
08はセパレータや表や図形等の、その領域における属
性を検出する属性検出部である。109は縦書き・横書
き等の文章の組方向を検出する組方向検出部である。1
10は見出し類を検出する見出し類検出部である。11
1は文章の段落、見出しに順序を付ける順序付け部であ
る。
In FIG. 1, reference numeral 101 denotes an image data input unit. Reference numeral 102 denotes an arithmetic processing unit (CPU) that controls the apparatus and calculates each unit according to the control program stored in the storage unit 103. A storage unit 103 stores a control program for processing shown in a flowchart described later and various data, and includes a ROM and a RAM. 104
Reference numeral denotes an output unit that outputs a calculation processing result, an image processing result, and image data. An area dividing unit 105 performs the entire area dividing process. An image thinning unit 106 thins out an input image. Reference numeral 107 denotes a labeling unit that labels the thinned pixels and simultaneously creates initial rectangular data. 1
Reference numeral 08 denotes an attribute detection unit that detects attributes in the area, such as a separator, a table, and a graphic. A combination direction detection unit 109 detects a composition direction of a sentence such as vertical writing or horizontal writing. 1
Reference numeral 10 denotes a headings detection unit that detects headings. 11
Reference numeral 1 denotes an ordering unit for ordering paragraphs and headings of a sentence.

【0012】図2は本実施例の画像処理装置における画
像処理を示すフローチャートで、この処理を実行する制
御プログラムは記憶部103に記憶され、演算処理部1
02により実行される。
FIG. 2 is a flowchart showing image processing in the image processing apparatus of the present embodiment. A control program for executing this processing is stored in the storage unit 103, and the arithmetic processing unit 1
02.

【0013】ステップS201 まず画像入力部101から元画像を入力する。Step S201 First, an original image is input from the image input unit 101.

【0014】ステップS202 次に画像間引き部106において、元画像に対し、縦m
ドット、横nドットの論理和をとって新たにm×n画素
を1画素に間引く。
Step S202 Next, in the image thinning section 106, the vertical
A logical sum of dots and horizontal n dots is taken to newly thin out m × n pixels to one pixel.

【0015】ここで、元画像のm×n画像中に1ドット
でも黒画素が有れば間引き画像は黒となる。
Here, if even one dot has a black pixel in the m × n image of the original image, the thinned image becomes black.

【0016】ステップS203 次にラベリング部107において、間引き画像の黒画素
に対し1行ずつラベルを付加し、上下・左右・斜めで連
続している画素には同一ラベルを付け、同時に矩形をか
たどっていく処理を行う。
Step S203 Next, in the labeling unit 107, a label is added to the black pixels of the thinned image one line at a time, and the same label is assigned to pixels that are continuous vertically, horizontally, and diagonally, and at the same time, a rectangle is formed. Perform the following processing.

【0017】図3を例に取ると、最初に検出される画素
Aにはラベル1が付けられ、この画素Aの座標(Xa,
Ya)を矩形の始点と終点に仮定し、画素数を1、矩形
を区別するための矩形ラベルに画素と同じラベル1を付
加して以上のデータを矩形データ(図4)として記憶部
103に記憶する。
Referring to FIG. 3 as an example, the first detected pixel A is labeled 1, and the coordinates (Xa, Xa,
Assuming that Ya) is the start point and end point of the rectangle, the number of pixels is 1, and the same label 1 as the pixel is added to the rectangle label for distinguishing the rectangle, and the above data is stored in the storage unit 103 as rectangular data (FIG. 4). Remember.

【0018】次に左方向に連続画素のない(1行目であ
るのでもちろん上からも連続画素はない)画素Bにはラ
ベル2が付けられ、この画素Bの座標(Xb、Yb)を
矩形の始点と終点と仮定し、画素数を1、矩形を区別す
るための矩形ラベルに画素と同じラベル2を付加して以
上のデータも矩形データ(図4)として記憶部103に
記憶する。
Next, a label 2 is assigned to a pixel B having no continuous pixels in the left direction (of course, there is no continuous pixel from the top because it is the first row), and the coordinates (Xb, Yb) of this pixel B are rectangular. , The number of pixels is 1, and the same label 2 as a pixel is added to a rectangular label for distinguishing a rectangle, and the above data is stored in the storage unit 103 as rectangular data (FIG. 4).

【0019】以上の様にして1行目のラベリングが終了
したら2行目に移る。
When the labeling of the first line is completed as described above, the process moves to the second line.

【0020】2行目の最初の画素Cはラベル1の画素A
と上から連続しているので画素Aと同じ画素ラベル1を
付加し、矩形ラベル1の矩形データに対し画素数は画素
Cの1を加算して計2画素となり矩形ラベルは変わらず
1のままで、矩形座標は終点のみを(Xa、Ya)から
(Xa、Yc)へと更新する(始点の座標は変わらな
い)。
The first pixel C of the second row is the pixel A of label 1
And the same pixel label 1 as the pixel A is added, and the number of pixels is added to the rectangular data of the rectangular label 1 by adding 1 of the pixel C to a total of 2 pixels, and the rectangular label remains 1 In the rectangular coordinates, only the end point is updated from (Xa, Ya) to (Xa, Yc) (the coordinates of the start point do not change).

【0021】次の画素Dは画素Cと左から連続している
ので画素Cと同じラベル1を付加し、矩形ラベル1の矩
形データに対し画素数は1加算して計3画素となり矩形
ラベルは変わらず1のままで、矩形座標は終点のみを
(Xa、Yc)から(Xd、Yc)へと更新する(終点
のY座標は変わらない)。
Since the next pixel D is continuous with the pixel C from the left, the same label 1 as that of the pixel C is added, and the number of pixels is added to the rectangular data of the rectangular label 1 by 1 to make a total of 3 pixels, and the rectangular label becomes The rectangular coordinates are updated at (Xa, Yc) from (Xa, Yc) to (Xd, Yc) with the rectangular coordinates unchanged (the Y coordinate of the end point does not change).

【0022】この時画素Dは画素Bとも斜めに連続して
おり、画素Cから連続して来ているので画素Bのラベル
をラベル2から画素Dと同じラベル1へと変更し、矩形
ラベル1の矩形データに対し、矩形ラベル2の画素数を
加算して計4画素とし矩形ラベルは変わらず1のまま
で、矩形座標は画素A、B、C、Dをすべて含むように
終点のみを(Xd、Yc)から(Xb、Yd)へと更新
する。矩形ラベル2の矩形データについては矩形ラベル
を0として無効とする。
At this time, the pixel D is also obliquely continuous with the pixel B and continues from the pixel C. Therefore, the label of the pixel B is changed from the label 2 to the same label 1 as the pixel D, and the rectangular label 1 is changed. The number of pixels of the rectangle label 2 is added to the rectangle data of 4 to make a total of 4 pixels, the rectangle label remains unchanged, and only the end point of the rectangle coordinates includes all the pixels A, B, C, and D (( Xd, Yc) is updated to (Xb, Yd). The rectangular data of the rectangular label 2 is invalidated by setting the rectangular label to 0.

【0023】以上の様にして2行目が終了したら3行目
に移る。
When the second line is completed as described above, the process moves to the third line.

【0024】3行目の最初の画素Eは画素Cと斜めに連
続しているので画素Cと同じ画素ラベル1を付加し、矩
形ラベル1の矩形データに対し画素数は1加算して計5
画素となり矩形ラベルは変わらず1のままで、矩形座標
は始点を(Xa、Ya)から(Xe、Ya)へ、および
終点を(Xb、Yd)から(Xb、Ye)へと更新す
る。
Since the first pixel E in the third row is obliquely continuous with the pixel C, the same pixel label 1 as that of the pixel C is added.
The pixel becomes a pixel, the rectangle label remains unchanged, and the rectangular coordinates are updated from (Xa, Ya) to (Xe, Ya) at the start point and from (Xb, Yd) to (Xb, Ye) at the end point.

【0025】以下同様にして全間引き画素に対しラベリ
ングと矩形のかたどりを行う。
In the same manner, labeling and rectangular shaping are performed on all thinned pixels.

【0026】ステップS204 次に属性検出部108において、ラベリングと矩形のか
たどりの後、本文に該当する矩形、図形または写真、表
等に該当する矩形、セパレータに該当する矩形等、各矩
形の属性を、矩形の幅W、高さH、面積S、面積に対す
る画素の数すなわち画素密度D(これらは矩形データの
画素数と始点、終点、座標を用いて計算する事により容
易に求まる)を用いて区別する。
Step S204 Next, in the attribute detecting unit 108, after the labeling and the rectification of the rectangle, the attributes of each rectangle such as a rectangle corresponding to the text, a rectangle corresponding to a figure or a photograph, a table, and a rectangle corresponding to a separator are determined. , The width W of the rectangle, the height H, the area S, the number of pixels with respect to the area, that is, the pixel density D (these are easily obtained by calculating using the number of pixels of the rectangular data, the start point, the end point, and the coordinates). Distinguish.

【0027】ステップS204の属性を検出する処理の
詳細は図5のフローチャートに示し、ここで説明する。
The details of the process of detecting the attribute in step S204 are shown in the flowchart of FIG. 5 and will be described here.

【0028】ラベリング処理(ステップS203)で矩
形のサーチが終了したら(ステップS502)、各デー
タを用いて以下の処理へと進む。セパレータは、幅Wが
閾値Tw1以下でかつ高さHが幅Wの閾値Tw2倍以上
(ステップS503)、もしくは幅Wが閾値Tw1より
大きくかつ高さHが幅Wの閾値Tw3倍以上(ステップ
S504)であれば縦長セパレータとして矩形ラベルを
−3として統一し、矩形を構成する画素ラベルは矩形ラ
ベルとは別にそのまま保持しておく(ステップS51
4)。
When the rectangular search is completed in the labeling process (step S203) (step S502), the process proceeds to the following process using each data. The width W of the separator is equal to or less than the threshold Tw1 and the height H is equal to or more than twice the threshold Tw of the width W (step S503), or the width W is greater than the threshold Tw1 and the height H is equal to or more than the threshold Tw3 of the width W (step S504). ), The rectangular label is unified as -3 as the vertically long separator, and the pixel labels constituting the rectangle are held as they are separately from the rectangular label (step S51).
4).

【0029】また幅と高さを入れ替えたものも上記と同
様にして(ステップS505、ステップS506)横長
セパレータとして矩形ラベルを−3に変更する。
In the case where the width and height are exchanged, the rectangular label is changed to -3 as a horizontally long separator in the same manner as above (steps S505 and S506).

【0030】次に図6に示す様に、画素密度Dが閾値T
d1以下の時(ステップS507)はカギ型などの変形
セパレータと見なして矩形ラベルを−3に変更する(ス
テップS514)。
Next, as shown in FIG.
If it is d1 or less (step S507), the rectangular label is changed to -3 (step S514) by regarding it as a key-shaped deformable separator.

【0031】また、面積Sが閾値Ts1より大きい時
(ステップS508)は画素密度Dが閾値Td2未満
(図5のステップS509)ならば表と見なして矩形ラ
ベルを−4に変更し(ステップS515)、画素密度D
が閾値Td2以上ならば図形または写真とみなして矩形
ラベルを−5に変更する(図5のステップS516)。
When the area S is larger than the threshold value Ts1 (step S508), if the pixel density D is smaller than the threshold value Td2 (step S509 in FIG. 5), it is regarded as a table and the rectangular label is changed to -4 (step S515). , Pixel density D
Is greater than or equal to the threshold value Td2, the rectangular label is changed to -5 assuming that it is a figure or a photograph (step S516 in FIG. 5).

【0032】また、面積Sが閾値Ts1以下でかつ閾値
Ts2以上の時(ステップS510)の画素密度Dが閾
値Td3以上(ステップS511)の矩形や、幅W及び
高さHが共に閾値Tw4以上でかつ画素密度DがTd5
以上の時(ステップS513)の矩形も図形または写真
とみなして矩形ラベルを−5に変更する。
When the area S is equal to or smaller than the threshold value Ts1 and equal to or larger than the threshold value Ts2 (step S510), the pixel density D is equal to or larger than the threshold value Td3 (step S511), and the width W and the height H are equal to or larger than the threshold value Tw4. And the pixel density D is Td5
At this time (step S513), the rectangle is regarded as a figure or a photograph, and the rectangle label is changed to -5.

【0033】更に、面積Sが閾値Ts1以下でかつ閾値
Ts2以上の時(ステップS510)、画素密度Dが閾
値Td4未満(ステップS512)の矩形を表とみなし
矩形ラベルを−4に変更する(ステップS515)。
Further, when the area S is equal to or smaller than the threshold value Ts1 and equal to or larger than the threshold value Ts2 (step S510), a rectangle whose pixel density D is smaller than the threshold value Td4 (step S512) is regarded as a table, and the rectangle label is changed to -4 (step S510). S515).

【0034】以上の様にして、図形または写真、表等に
該当する矩形、セパレータに該当する矩形等を検出し、
残った矩形を本文として矩形ラベルはそのまま画素ラベ
ルと同一にしておく(ステップS517)。
As described above, a rectangle corresponding to a figure, a photograph, a table, or the like, a rectangle corresponding to a separator, or the like is detected.
With the remaining rectangle as the text, the rectangle label is made the same as the pixel label as it is (step S517).

【0035】ステップS205 次に組方向検出部109において、横書き文章の場合、
本文として残った矩形は横方向に間引いた画素が連続し
て横長の矩形になりやすく、縦書き文章であれば、本文
として残った矩形は縦長になりやすい。
Step S205 Next, in the combination direction detecting unit 109, in the case of a horizontally written sentence,
In the rectangle remaining as the text, pixels thinned out in the horizontal direction tend to be a horizontally long rectangle, and in the case of a vertically written text, the rectangle remaining as the text tends to be vertically long.

【0036】そこで本文の矩形の幅と高さの平均値を算
出し(図7のステップS701)、平均幅wが平均高さ
hより大きい場合は横書きの多い章とみなし平均高さh
を1文字の文字サイズとする(図7のステップS70
2、ステップS703)。逆に平均高さhが平均幅wよ
り大きい場合は縦書きの多い文章と見なし平均幅wを1
文字の文字サイズとする(図7のステップS702、ス
テップS710)。
Then, the average value of the width and height of the rectangle of the text is calculated (step S701 in FIG. 7). If the average width w is larger than the average height h, it is regarded as a chapter with a lot of horizontal writing and the average height h
Is the character size of one character (step S70 in FIG. 7).
2. Step S703). On the other hand, if the average height h is larger than the average width w, it is regarded as a sentence with much vertical writing and the average width w is set to 1
The character size is set to the character size (steps S702 and S710 in FIG. 7).

【0037】次に、組方向とは逆方向にヒストグラムを
取り(図7のステップS704、ステップS711)、
周辺分布の形状から閾値Tk以下の場所を段落の分かれ
目とし(図7のステップS705および図8、ステップ
S712)、段落ごとに組方向と同じ方向に射影を取っ
て(図7のステップS708、ステップS715)、周
辺分布の形状から黒画素の連続の長さをその段落内文字
の文字サイズとし、白画素の連続の長さを行間として検
出する(図7のステップS709、ステップS71
6)。
Next, a histogram is taken in the direction opposite to the set direction (steps S704 and S711 in FIG. 7),
Based on the shape of the marginal distribution, a place that is equal to or smaller than the threshold value Tk is set as a paragraph break (steps S705 and 8, FIG. S712 in FIG. 7), and a projection is taken for each paragraph in the same direction as the grouping direction (step S708 in FIG. S715), the length of the continuation of the black pixels is determined as the character size of the character in the paragraph, and the length of the continuation of the white pixels is detected as the line spacing from the shape of the peripheral distribution (steps S709 and S71 in FIG. 7).
6).

【0038】なお、横書き文章か縦書き文章かは、記憶
部103に記憶する。
The horizontal writing text or the vertical writing text is stored in the storage unit 103.

【0039】ステップS206 次に見出し類検出部110において、組方向と文字サイ
ズより見出し類を検出する。
Step S206 Next, the headings detection unit 110 detects headings based on the set direction and the character size.

【0040】図9に示す様に縦書きの場合を例に取る
と、本文矩形の中から矩形の幅Wが文字サイズwよりも
閾値Tm1倍以上大きい矩形を見出し矩形の候補として
検出する(図9のステップS905)。
Taking the case of vertical writing as shown in FIG. 9 as an example, a rectangle in which the width W of the rectangle is larger than the character size w by a threshold value Tm1 or more from the body rectangle is detected as a candidate for a heading rectangle. Nine steps S905).

【0041】さらに矩形の高さHが文字サイズwのTm
2倍よりも小さい場合は(図9のステップS906)、
横書きの文字が連続したものとみなし、見出し類とする
(図9のステップS908)。
Further, the height H of the rectangle is Tm of the character size w.
If it is smaller than twice (step S906 in FIG. 9),
It is assumed that the horizontally written characters are continuous, and is set as a heading (step S908 in FIG. 9).

【0042】また、以上の様にして矩形の大きさから見
出しとした矩形の中には本文の文字が結合してしまった
ものを含む場合があるので、本文矩形と見出し矩形の距
離が閾値T1より近いもの(図9のステップS907)
では見出しから本文に訂正する(図9のステップS90
9)。
In addition, since the rectangles which are headed based on the size of the rectangles as described above may include those in which the characters of the body are combined, the distance between the body rectangle and the heading rectangle is equal to the threshold T1. Closer one (step S907 in FIG. 9)
Now, the headline is corrected to the text (step S90 in FIG. 9).
9).

【0043】さらに上記の処理によって残った本文矩形
の中で、文字サイズwの範囲に本文及び見出し類の矩形
がないものを孤立した矩形として見出しとする(図9の
ステップS910〜ステップS913)。
Further, among the text rectangles remaining after the above-described processing, a rectangle having no text and a heading class within the range of the character size w is set as an isolated rectangle as a heading (steps S910 to S913 in FIG. 9).

【0044】ステップS207 次に順序付け部111において、見出し、本文段落に順
序を付ける。
Step S207 Next, in the ordering section 111, headings and body paragraphs are ordered.

【0045】以下順序付けについて詳細に説明する。図
10はステップS207についての詳細なフローチャー
トである。まず、本文に囲まれた見出しがあるかどうか
のチェックを行い、あれば初めに順序を付ける(ステッ
プS1001)。ステップS1001については、後で
詳しく説明する。
Hereinafter, the ordering will be described in detail. FIG. 10 is a detailed flowchart of step S207. First, it is checked whether or not there is a headline surrounded by the text, and if there is, the order is assigned first (step S1001). Step S1001 will be described later in detail.

【0046】次に、縦書き文章か横書き文章か判断する
(ステップS1002)。これは前述の組方向検出(ス
テップS205)の結果を用いる。縦書きの場合は、順
序のついていない見出し・段落のなかで一番上にある領
域と水平方向にほぼ同じ位置にある見出し・段落を集め
て同一グループとする(ステップS1003)。同一高
さに属する見出し・段落が決定したら、その中で右から
順に並べて順序を付けていく(ステップS1004)。
この様にしてすべての見出し・段落に順序を付けたら、
ステップS207を終了し、ステップS208に進む
(ステップS1005)。まだ順序がついていない見出
し・段落があれば、ステップS1003に戻って同様に
して順序を付ける(ステップS1005)。
Next, it is determined whether the sentence is a vertical writing sentence or a horizontal writing sentence (step S1002). This uses the result of the above-described group direction detection (step S205). In the case of vertical writing, headings / paragraphs located at substantially the same position in the horizontal direction as the topmost region among unordered headings / paragraphs are collected into the same group (step S1003). When the headings / paragraphs belonging to the same height are determined, the headings / paragraphs are arranged in order from the right in the headings / paragraphs (step S1004).
After all headings / paragraphs are ordered in this way,
After step S207, the process proceeds to step S208 (step S1005). If there is any headline / paragraph that has not been ordered yet, the procedure returns to step S1003 and the order is similarly set (step S1005).

【0047】同じ様に、ステップS1002で横書きと
判断された場合は、順序のついていない見出し・段落の
なかで一番左にある領域と垂直方向にほぼ同じ位置にあ
る見出し・段落を集めて同一グループとする(ステップ
S1006)。同一グループに属する見出し・段落が決
定したら、その中で上から順に並べて順序を付けていく
(ステップS1007)。この様にしてすべての見出し
・段落に順序を付けたら、ステップS207を終了し、
ステップS208に進む(ステップS1008)。まだ
順序がついていない見出し・段落があれば、ステップS
1006に戻って同様にして順序を付ける(ステップS
1008)。
Similarly, if it is determined in step S1002 that horizontal writing is to be performed, heading / paragraphs located at substantially the same position in the vertical direction as the leftmost region among unordered heading / paragraphs are collected and the same. The group is set (step S1006). When the headings / paragraphs belonging to the same group are determined, the headings / paragraphs are arranged in order from the top and are ordered (step S1007). When all headings and paragraphs are ordered in this way, step S207 is terminated,
The process proceeds to step S208 (step S1008). If there is a headline / paragraph not yet ordered, step S
Returning to step 1006, the order is similarly set (step S
1008).

【0048】ここで実際例を用いて説明する。図14は
入力原稿1401である。入力原稿1401を前記領域
分割手段(ステップS202〜ステップS206)によ
って見出し・本文段落を取り出したところを示したの
が、図15である。図15において、1501は入力原
稿1401に対応する見出し・本文段落の全体を示して
いる。また、実線で示した1502、1503は見出し
を、点線で示した1504〜1507は本文段落を示し
ている。図16は、ステップS1001で見出し150
3が本文に囲まれていると判断し、1番の順序を付けた
ところを示している。
Here, a description will be given using a practical example. FIG. 14 shows an input document 1401. FIG. 15 shows a state in which the headline / text paragraph is extracted from the input document 1401 by the area dividing means (steps S202 to S206). In FIG. 15, reference numeral 1501 denotes the entire heading / body paragraph corresponding to the input document 1401. Also, 1502 and 1503 indicated by solid lines indicate headings, and 1504 to 1507 indicated by dotted lines indicate body paragraphs. FIG. 16 shows a case where the heading 150
No. 3 is determined to be surrounded by the text, and the first order is shown.

【0049】次に、ステップS1002で縦書きと判断
し、ステップS1003に進む。ステップS1003で
は、順序のついていない見出し・本文段落のなかからも
っとも上に位置するものをまず取り出す。図16のなか
で、本文段落1504がもっとも上に位置する。次に本
文段落1504と同一グループに属する見出し・本文段
落を取り出す。まず、本文段落1504と見出し150
2が同一グループに属するか判断する。それを説明する
のが図19である。図19において、H1502、H1
504はそれぞれ見出し1502、本文段落1504の
高さを示し、Hoは本文段落1504と見出し1502
の水平方向の重なりを示している。この例では、Ho=
H1502となっている。これらをもとに以下の様に同
一グループ判定を行う。 (2つの領域の水平方向の重なり長さ)÷(2つの領域
のうち高さの小さい領域の高さ)>(閾値γ) を満たす時は、2つの領域を同一グループとする。ただ
し、閾値γは0.0〜1.0の値である。ここではγ=
0.8とする。
Next, vertical writing is determined in step S1002, and the flow advances to step S1003. In step S1003, the top one is extracted from among the unordered headings and body paragraphs. In FIG. 16, the main text paragraph 1504 is located at the top. Next, a heading / body paragraph belonging to the same group as the body paragraph 1504 is extracted. First, paragraph 1504 and heading 150
It is determined whether 2 belongs to the same group. FIG. 19 illustrates this. In FIG. 19, H1502, H1
504 indicates the height of the heading 1502 and the main body paragraph 1504, respectively, and Ho indicates the main body paragraph 1504 and the heading 1502.
In the horizontal direction. In this example, Ho =
H1502. Based on these, the same group determination is performed as follows. When (horizontal overlapping length of two regions) ÷ (height of region having smaller height of two regions)> (threshold value γ), the two regions belong to the same group. However, the threshold value γ is a value of 0.0 to 1.0. Here γ =
0.8.

【0050】図19に示す例では、 Ho÷H1502>γ となるので、本文段落1504と見出し1502を同一
グループと判定する。同様に本文段落1504と本文段
落1505〜1507を判定すると、同一グループでは
ないことが分かり、ステップS1003を終了する。
In the example shown in FIG. 19, since Ho ÷ H1502> γ, the main text paragraph 1504 and the heading 1502 are determined to be the same group. Similarly, when the main body paragraph 1504 and the main body paragraphs 1505 to 1507 are determined, it is found that they are not in the same group, and the step S1003 ends.

【0051】次にステップS1004で、ステップS1
003同一グループと判断された見出し1502と本文
段落1504に右から順に順序を付けていく。右上角の
点を比較して一番右側にある見出し1502に2番の番
号をつけ、次に本文段落1504に3番の番号をつけ
る。比較するのは右上角の点に限らず、重心その他でも
かまわず、どちらの領域が右にあるか判断できれば良
い。図17は、ステップS1004で右から順に見出し
1502を2番、本文段落1504を3番に順序付けし
たところを示している。本文段落1505〜1507に
順序を付けていないので、ステップS1005でステッ
プS1003に戻って処理を続ける。
Next, in step S1004, step S1
003 The heading 1502 and the body paragraph 1504 determined to be in the same group are sequentially ordered from the right. By comparing the points in the upper right corner, the heading 1502 on the rightmost side is numbered 2, and then the main paragraph 1504 is numbered 3. The comparison is not limited to the point at the upper right corner, but may be the center of gravity or the like, as long as it can be determined which area is on the right. FIG. 17 shows the order in which the heading 1502 is numbered 2 and the body paragraph 1504 is numbered 3 from the right in step S1004. Since the body paragraphs 1505 to 1507 are not ordered, the process returns to step S1003 in step S1005 to continue the processing.

【0052】ステップS1003で本文段落1505〜
1507を同一グループとし、ステップS1004で右
から順に本文段落1505を4番、本文段落1506を
5番、本文段落1507を6番に順序付けする。
In step S1003, paragraph 1505 of the main text
1507 belong to the same group, and in step S1004, the body paragraph 1505 is numbered 4, the body paragraph 1506 is numbered 5, and the body paragraph 1507 is numbered 6 in order from the right.

【0053】すべての見出し・本文段落に順序を付けた
ので、ステップS1005から次のステップS208に
進む。ステップS207を終了し、すべての見出し・本
文段落に順序付けたところを示したのが、図18であ
る。
Since all headings and body paragraphs have been ordered, the flow advances from step S1005 to the next step S208. FIG. 18 shows a state in which step S207 is completed and all headings and body paragraphs are ordered.

【0054】次に、ステップS1001について詳細に
説明する。図11はステップS1001の処理を示すフ
ローチャートである。
Next, step S1001 will be described in detail. FIG. 11 is a flowchart showing the processing in step S1001.

【0055】まず初めにステップS1101で、ひとつ
の見出し領域に注目し、その重心を求める。入力原稿1
401の例では、図15に示す様に、見出し1502と
見出し1503の二つの見出し領域がある。ここでは、
最初に見出し1503に注目する。領域は長方形なの
で、重心は幅と高さをそれぞれ2等分したところにあ
る。図20ではこれを重心2001として示す。
First, in step S1101, attention is paid to one heading area, and its center of gravity is determined. Input manuscript 1
In the example of 401, as shown in FIG. 15, there are two heading areas, heading 1502 and heading 1503. here,
First, look at the heading 1503. Since the region is rectangular, the center of gravity is at the point where the width and height are each divided into two equal parts. This is shown as a center of gravity 2001 in FIG.

【0056】次にステップS1102で、重心2001
から上下左右方向に線分を伸ばしていき、それぞれ本文
段落と交わるかチェックする。図20では、重心200
1から上方向に伸ばした線分を線分2002で示してい
る。同様に下方向を線分2003、左方向を線分200
4、右方向を線分2005で示す。図20で明らかな様
に、線分2002は本文段落1504と交わっている。
同様に線分2003は本文段落1506と、線分200
5は本文段落1505と、線分2004は本文段落15
07と交わっている。
Next, in step S1102, the center of gravity 2001
Extend the line segment from top to bottom and right and left, and check whether each line intersects with the main paragraph. In FIG. 20, the center of gravity 200
A line segment extending upward from 1 is indicated by a line segment 2002. Similarly, the downward direction is line segment 2003, and the leftward direction is line segment 200.
4. The right direction is indicated by a line segment 2005. As is apparent from FIG. 20, the line segment 2002 intersects the paragraph 1504 of the main text.
Similarly, the line segment 2003 is composed of the main text paragraph 1506 and the line segment 200.
5 is body paragraph 1505, and line segment 2004 is body paragraph 15.
07.

【0057】ステップS1103で、この様に重心から
伸ばした線分が上下左右のうち3方向以上で本文段落と
交わるので、ステップS1104に進む。もし重心から
伸ばした線分が上下左右のうち2方向以下しか本文段落
と交わらなければ、ステップS1105に進む。
In step S1103, since the line segment extended from the center of gravity intersects the main text paragraph in at least three directions, up, down, left, and right, the flow advances to step S1104. If the line segment extending from the center of gravity only intersects with the main text paragraph in two directions or less in the upper, lower, left and right directions, the process proceeds to step S1105.

【0058】ステップS1104では、注目している見
出しに順序を付ける。ここでは、まだいずれの見出しに
も順番が付けられていないので、見出し1503に1番
の順番を付ける。
In step S1104, an order is assigned to the headline of interest. Here, since no heading has yet been assigned, the heading 1503 is assigned the first order.

【0059】次にステップS1105で、すべての見出
しをチェックしたか判断する。見出しが残っていれば、
ステップS1101に戻って同様の処理を行う。すべて
の見出しをチェックしたら、ステップS1002に進
む。入力原稿1401の例では、見出し1502をまだ
チェックしていないので、ステップS1101に戻る。
Next, in step S1105, it is determined whether all headings have been checked. If headings remain,
Returning to step S1101, the same processing is performed. After checking all the headings, the process proceeds to step S1002. In the example of the input document 1401, since the headline 1502 has not been checked yet, the process returns to step S1101.

【0060】見出し1503の場合とまったく同様に重
心を求め(ステップS1101)、重心から上下左右方
向に線分を伸ばしていき、それぞれ本文段落と交わるか
チェックする(ステップS1102)。図15でも明ら
かな様に、見出し1502の上や右方向には、本文段落
が無いので、見出し1502の重心から伸ばした上方向
と右方向の線分は本文段落と交わらない。よってステッ
プS1103からステップS1105に進む。つまり、
見出し1502には順番を付けない。ステップS110
5では、すべての見出しにチェックをしたので、ステッ
プS1001の処理をすべて終了し、ステップS100
2に進む。この段階までの結果を示したのが、図16で
ある。
The center of gravity is obtained in exactly the same way as in the case of the heading 1503 (step S1101), and a line segment is extended from the center of gravity in the up, down, left, and right directions, and it is checked whether each line intersects with the main paragraph (step S1102). As is clear from FIG. 15, since there is no body paragraph above or to the right of the heading 1502, the upward and rightward line segments extending from the center of gravity of the heading 1502 do not intersect with the body paragraph. Therefore, the process proceeds from step S1103 to step S1105. That is,
Headings 1502 are not ordered. Step S110
In step 5, all the headlines are checked, so that all the processing in step S1001 is completed and step S100
Proceed to 2. FIG. 16 shows the results up to this stage.

【0061】以上の様にステップS207ですべての見
出し・本文段落に順序付けを行う。入力原稿1401の
例で、ステップS207まで終了したところを示したの
が、図18である。
As described above, all headings and body paragraphs are ordered in step S207. FIG. 18 shows an example of the input document 1401 that has been completed up to step S207.

【0062】ステップS208 最後に、以上の様にして求めた各種領域の矩形データを
画像データと共に出力部104から出力する。
Step S208 Finally, the output unit 104 outputs the rectangular data of the various regions obtained as described above together with the image data.

【0063】図12は、本文に囲まれた見出しの順序付
け処理において、先に説明した例が(図11のフローチ
ャート)本文に囲まれた見出しかどうかの判定で重心2
001を用いた代わりに、注目見出し内の任意の点を用
いる様にした処理を示すフローチャートである。以下図
12で示すフローチャートをもとに説明する。
FIG. 12 shows that in the ordering processing of the headings surrounded by the body, the center of gravity is determined by determining whether the above-described example is the heading surrounded by the body (flowchart of FIG. 11).
It is a flowchart which shows the process which used the arbitrary point in an attention heading instead of using 001. Hereinafter, description will be made based on the flowchart shown in FIG.

【0064】まず初めに、ステップS1201で、ひと
つの見出し領域に注目し、注目見出し内の任意の点を求
める。ここでは、左上の角から高さのα%、幅のβ%に
位置する点を求めることにする。ただし、αは0〜10
0%、βは0〜100%の値を取り、予め定めてRAM
に保持している。入力原稿1401の例では、図15に
示す様に、見出し1502と見出し1503の二つの見
出し領域がある。ここでは、最初に見出し1503に注
目する。見出し1503内の任意の点を取って注目点と
する。ここでは、任意の点即ち左上角から高さのα%、
幅のβ%に位置する点を求めるところを説明したのが、
図21である。図21で、Hは見出し1503の高さ
を、Hαは左上角からの高さのα%を、Wは見出し15
03の幅を、Wβは左上角から幅のβ%を示している。
この様にして、注目点2101が求まる。ここでは、α
を40%、βを25%としている。
First, in step S1201, attention is paid to one heading area, and an arbitrary point within the attention heading is obtained. Here, a point located α% of the height and β% of the width from the upper left corner is determined. Where α is 0 to 10
0%, β takes a value of 0 to 100%, and is determined in advance in RAM
Holding. In the example of the input document 1401, as shown in FIG. 15, there are two heading areas of a heading 1502 and a heading 1503. Here, the heading 1503 is first focused. An arbitrary point in the headline 1503 is set as a point of interest. Here, an arbitrary point, that is, α% of the height from the upper left corner,
I explained how to find the point located at β% of the width,
FIG. In FIG. 21, H is the height of the heading 1503, Hα is α% of the height from the upper left corner, and W is the heading 153.
03, and Wβ represents β% of the width from the upper left corner.
In this way, the point of interest 2101 is determined. Here, α
Is 40% and β is 25%.

【0065】次にステップS1202で、注目点210
1から上下左右方向に線分を伸ばしていき、それぞれ本
文段落と交わるかチェックする。図22では、注目点2
101から上方向に伸ばした線分を線分2201で示し
ている。同様に下方向を線分2202、左方向を線分2
203、右方向を線分2204で示す。図22で明らか
な様に、線分2201は本文段落1504と交わってい
る。同様に線分2202は本文段落1506と、線分2
204は本文段落1505と、線分2203は本文段落
1507と交わっている。
Next, in step S1202, the point of interest 210
Extend lines from top to bottom, left and right, and check whether each line intersects the main text paragraph. In FIG. 22, attention point 2
A line segment extending upward from 101 is indicated by a line segment 2201. Similarly, the downward direction is line segment 2202, and the left direction is line segment 2
203, the right direction is indicated by a line segment 2204. As is apparent from FIG. 22, the line segment 2201 intersects with the paragraph 1504 of the main text. Similarly, the line segment 2202 is composed of the main text paragraph 1506 and the line segment 2.
204 intersects with the main text paragraph 1505, and the line segment 2203 intersects with the main text paragraph 1507.

【0066】ステップS1203で、この様に注目点2
101から伸ばした線分が上下左右のうち3方向以上で
本文段落と交わるので、ステップS1204に進む。も
し注目点2101から伸ばした線分が上下左右のうち2
方向以下しか本文段落と交わらなければ、ステップS1
205に進む。
In step S1203, the attention point 2
Since the line segment extended from 101 intersects with the main text paragraph in three or more directions of up, down, left, and right, the process proceeds to step S1204. If the line segment extending from the point of interest 2101 is 2
If only the direction or less intersects the body paragraph, step S1
Proceed to 205.

【0067】ステップS1204では、注目している見
出しに順序を付ける。ここでは、まだいずれの見出しに
も順番が付けられていないので、見出し1503に1番
の順番を付ける。
In step S1204, the order is assigned to the headline of interest. Here, since no heading has yet been assigned, the heading 1503 is assigned the first order.

【0068】次にステップS1205ですべての見出し
をチェックしたか判断する。見出しが残っていれば、ス
テップS1201に戻って同様の処理を行う。すべての
見出しをチェックしたら、S1002に進む。入力原稿
1401の例では、見出し1502をまだチェックして
いないので、ステップS1201に戻る。
Next, it is determined in step S1205 whether all headings have been checked. If a heading remains, the process returns to step S1201 to perform the same processing. After checking all headings, the process proceeds to S1002. In the example of the input document 1401, since the headline 1502 has not been checked yet, the process returns to step S1201.

【0069】見出し1503の場合とまったく同様に注
目点を求め(ステップS1201)、注目点から上下左
右方向に線分を伸ばしていき、それぞれ本文段落と交わ
るかチェックする(ステップS1202)。図15でも
明らかな様に、見出し1502の上や右方向には、本文
段落が無いので、見出し1502の重心から伸ばした上
方向と右方向の線分は本文段落と交わらない。よってス
テップS1203からステップS1205に進む。つま
り、見出し1502には順番を付けない。ステップS1
205では、すべての見出しにチェックをしたので、ス
テップS1001の処理をすべて終了し、ステップS1
002に進む。この段階までの結果を示したのが、図1
6である。
A point of interest is obtained in exactly the same way as in the case of the heading 1503 (step S1201), and a line segment is extended from the point of interest in the up, down, left, and right directions to check whether each intersects a main paragraph (step S1202). As is clear from FIG. 15, since there is no body paragraph above or to the right of the heading 1502, the upward and rightward line segments extending from the center of gravity of the heading 1502 do not intersect with the body paragraph. Therefore, the process proceeds from step S1203 to step S1205. That is, the heading 1502 is not ordered. Step S1
In step 205, all the headlines are checked, so that all the processing in step S1001 ends, and step S1
Proceed to 002. FIG. 1 shows the results up to this stage.
6.

【0070】以上の様にステップS207ですべての見
出し・本文段落に順序付けを行う。図14の例で、ステ
ップS207まで終了したところを示したのが、図18
である。
As described above, in step S207, all headings and body paragraphs are ordered. In the example of FIG. 14, FIG.
It is.

【0071】ステップS1001以外については、第一
の実施例と同様である。なお、第二の実施例における画
像処理装置の構成は図1に示す第一の実施例と同様であ
る。以上の説明により、前述の第一の実施例と同様の作
用、効果が得られる。
Steps other than step S1001 are the same as in the first embodiment. The configuration of the image processing apparatus according to the second embodiment is the same as that of the first embodiment shown in FIG. According to the above description, the same operation and effect as those of the first embodiment can be obtained.

【0072】図13は、図10のステップS1001
の、本文に囲まれた見出しの順序付け処理に更にステッ
プS1304、ステップS1305の処理内容を加え、
注目している見出しの上下左右の本文段落との重なり具
合を調べ、重なり具合が閾値以上となる本文段落が3方
向以上に存在すれば注目している見出しに順番を付ける
処理を示すフローチャートである。
FIG. 13 is a flowchart showing step S1001 in FIG.
To the ordering processing of the headings surrounded by the text, the processing contents of steps S1304 and S1305 are further added.
10 is a flowchart showing a process of examining the degree of overlap of the noted heading with the upper, lower, left, and right body paragraphs, and ordering the noted heading if there is a body paragraph in which the degree of overlap is equal to or greater than a threshold value in three or more directions. .

【0073】以下図13で示すフローチャートをもとに
説明する。
The following is a description based on the flowchart shown in FIG.

【0074】まず初めに、ステップS1301でひとつ
の見出し領域に注目し、その重心を求める。入力原稿1
401の例では、図15に示す様に、見出し1502と
見出し1503の二つの見出し領域がある。ここでは、
最初に見出し1503に注目する。領域は長方形なの
で、重心は幅と高さをそれぞれ2等分したところにあ
る。図20ではこれを重心2001として示す。
First, in step S1301, attention is paid to one heading area, and its center of gravity is obtained. Input manuscript 1
In the example of 401, as shown in FIG. 15, there are two heading areas, heading 1502 and heading 1503. here,
First, look at the heading 1503. Since the region is rectangular, the center of gravity is at the point where the width and height are each divided into two equal parts. This is shown as a center of gravity 2001 in FIG.

【0075】次にステップS1302で、重心2001
から上下左右方向に線分を伸ばしていき、それぞれ本文
段落と交わるかチェックする。図20では、重心200
1から上方向に伸ばした線分を線分2002で示してい
る。同様に下方向を線分2003、左方向を線分200
4、右方向を線分2005で示す。図20で明らかな様
に、線分2002は本文段落1504と交わっている。
同様に線分2003は本文段落1506と、線分200
5は本文段落1505と、線分2004は本文段落15
07と交わっている。
Next, in step S1302, the center of gravity 2001
Extend the line segment from top to bottom and right and left, and check whether each line intersects with the main paragraph. In FIG. 20, the center of gravity 200
A line segment extending upward from 1 is indicated by a line segment 2002. Similarly, the downward direction is line segment 2003, and the leftward direction is line segment 200.
4. The right direction is indicated by a line segment 2005. As is apparent from FIG. 20, the line segment 2002 intersects the paragraph 1504 of the main text.
Similarly, the line segment 2003 is composed of the main text paragraph 1506 and the line segment 200.
5 is body paragraph 1505, and line segment 2004 is body paragraph 15.
07.

【0076】ステップS1303で、この様に重心から
伸ばした線分が上下左右のうち3方向以上で本文段落と
交わるので、ステップS1304に進む。もし重心から
伸ばした線分が上下左右のうち2方向以下しか本文段落
と交わらなければ、ステップS1307に進む。
In step S1303, since the line segment extended from the center of gravity intersects the main text paragraph in at least three directions, up, down, left, and right, the flow advances to step S1304. If the line segment extending from the center of gravity intersects the main text paragraph only in two directions or less in the up, down, left, and right directions, the process proceeds to step S1307.

【0077】ステップS1304では、見出しの上下に
位置する本文段落については、見出しとの垂直方向の重
なり具合を調べ、同様に左右方向に位置する本文段落
は、見出しとの水平方向の重なり具合をそれぞれ調べ
る。見出し1503の上にある本文段落1504との重
なり具合を調べると、図23に示す通り、見出し150
3の幅W1503と本文段落1504の幅W1504と
の重なりは、Woで示される。この例では、Wo=W1
503となっている。ステップS1305でこれらをも
とに以下の様に重なり具合の判定を行う。 (2つの領域の垂直方向の重なり長さ)÷(2つの領域
のうち幅の小さい領域の幅)>(閾値γ) を満たす時は、重なり具合が閾値以上とする。ただし、
閾値γは0.0〜1.0の値である。ここではγ=0.
8とする。
In step S1304, for the text paragraphs positioned above and below the heading, the degree of overlap with the heading in the vertical direction is checked, and similarly, for the text paragraph positioned horizontally, the degree of overlap with the heading in the horizontal direction is determined. Find out. When the degree of overlap with the main text paragraph 1504 above the heading 1503 is examined, as shown in FIG.
The overlap between the width W1503 of the third paragraph and the width W1504 of the main paragraph 1504 is indicated by Wo. In this example, Wo = W1
503. In step S1305, based on these, the degree of overlap is determined as follows. When (the vertical overlapping length of the two regions) ÷ (the width of the smaller region of the two regions)> (threshold γ), the degree of overlap is equal to or greater than the threshold. However,
The threshold value γ is a value between 0.0 and 1.0. Here, γ = 0.
8 is assumed.

【0078】図23に示す例では、 Wo÷W1503>γ となるので、本文段落1504と見出し1503は、重
なり具合が閾値以上となる。
In the example shown in FIG. 23, since Wo ÷ W1503> γ, the overlap between the main paragraph 1504 and the heading 1503 is equal to or larger than the threshold.

【0079】同様に見出し1503とその下にある本文
段落1506も重なり具合が閾値以上となる。同じ様に
見出し1503の左にある本文段落1507との重なり
具合を調べると、図24に示す通り、見出し1503の
高さはH1503、本文段落1507の高さはH150
7、見出し1503と本文段落1507との重なりはH
oで示される。この例では、Ho=H1503となって
いる。ステップS1305でこれらをもとに以下の様に
重なり具合の判定を行う。 (2つの領域の水平方向の重なり長さ)÷(2つの領域
のうち高さの小さい領域の高さ)>(閾値γ) を満たす時は、重なり具合が閾値以上とする。ただし、
閾値γは0.0〜1.0の値である。ここでは0.8と
する。
Similarly, the heading 1503 and the main paragraph 1506 below the heading 1503 have an overlapping degree equal to or larger than the threshold. Similarly, when the degree of overlap with the main text paragraph 1507 on the left of the heading 1503 is checked, as shown in FIG. 24, the height of the heading 1503 is H1503, and the height of the main text paragraph 1507 is H150.
7. The overlap between heading 1503 and body paragraph 1507 is H
Indicated by o. In this example, Ho = H1503. In step S1305, based on these, the degree of overlap is determined as follows. When (the overlapping length of the two regions in the horizontal direction) ÷ (the height of the region having the smaller height of the two regions)> (threshold value γ), the degree of overlap is equal to or greater than the threshold value. However,
The threshold value γ is a value between 0.0 and 1.0. Here, it is set to 0.8.

【0080】図24に示す例では、 Ho÷H1503>γ となるので、本文段落1507と見出し1503は、重
なり具合が閾値以上となる。同様に見出し1503とそ
の右にある本文段落1505も重なり具合が閾値以上と
なる。
In the example shown in FIG. 24, Ho ÷ H1503> γ, so that the main paragraph 1507 and the heading 1503 have an overlap degree equal to or greater than the threshold. Similarly, the heading 1503 and the text paragraph 1505 to the right of the heading 1503 have a degree of overlap equal to or greater than the threshold.

【0081】以上の様に図14の例では、重なり具合が
閾値以上となる本文段落が3方向以上に存在するので、
ステップS1306に進む。
As described above, in the example of FIG. 14, there are text paragraphs in which the degree of overlap is greater than or equal to the threshold value in three or more directions.
Proceed to step S1306.

【0082】ステップS1306で注目している見出し
に順序を付ける。ここでは、まだいずれの見出しにも順
番が付けられていないので、1番の順番を見出し150
3に付ける。次にすべての見出しをチェックしたか判断
する。見出しが残っていれば、S1301に戻って同様
の処理を行う。すべての見出しをチェックしたら、S1
002に進む。
In step S1306, the order is assigned to the headline of interest. Here, since no order has been assigned to any of the headings, the first order is assigned to the heading 150.
Attach to 3. Next, it is determined whether all headings have been checked. If a heading remains, the process returns to S1301 to perform the same processing. After checking all headings, S1
Proceed to 002.

【0083】入力原稿1401の例では、見出し150
2をまだチェックしていないので、ステップS1301
に戻る。見出し1503の場合とまったく同様に重心を
求め(ステップS1301)、重心から上下左右方向に
線分を伸ばしていき、それぞれ本文段落と交わるかチェ
ックする(ステップS1302)。図15でも明らかな
様に、見出し1502の上や右方向には本文段落が無い
ので、見出し1502の重心から伸ばした上方向と右方
向の線分は本文段落と交わらない。よってステップS1
303からステップS1307に進む。つまり、見出し
1502には順番を付けない。
In the example of the input document 1401, the heading 150
2 has not yet been checked, so step S1301
Return to The center of gravity is obtained in exactly the same way as in the case of the heading 1503 (step S1301), and a line segment is extended from the center of gravity in the up, down, left, and right directions, and it is checked whether each line intersects with the main text paragraph (step S1302). As is clear from FIG. 15, there is no body paragraph above or to the right of the heading 1502, and therefore the upward and rightward line segments extending from the center of gravity of the heading 1502 do not intersect with the body paragraph. Therefore, step S1
The process proceeds from step 303 to step S1307. That is, the heading 1502 is not ordered.

【0084】ステップS1307では、すべての見出し
にチェックをしたので、ステップS1001の処理をす
べて終了し、ステップS1002に進む。この段落まで
の結果を示したのが、図16である。
In step S1307, all headlines have been checked, so that all the processing in step S1001 ends, and the flow advances to step S1002. FIG. 16 shows the results up to this paragraph.

【0085】以上の様にステップS207ですべての見
出し・本文段落に順序付けを行う。図14の例で、ステ
ップS207まで終了したところを示したのが、図18
である。
As described above, in step S207, all headings and body paragraphs are ordered. In the example of FIG. 14, FIG.
It is.

【0086】(実施例2)本実施例では、属性が表と判
断された矩形から放射線分を出して表枠との交差回数か
ら表領域を確定する例を説明する。本実施例の装置の構
成は実施例1と同様である。
(Embodiment 2) In this embodiment, an example will be described in which radiation is extracted from a rectangle whose attribute is determined to be a table and a table area is determined from the number of intersections with a table frame. The configuration of the device of the present embodiment is the same as that of the first embodiment.

【0087】図25は、本実施例の画像処理装置におけ
る画像処理を示すフローチャートで、この処理を実行す
る制御プログラムは記憶部103に記憶されている。
尚、本フローチャートにおいて、実施例1と同様の処理
ステップには同じ番号を付し、ここでの説明は省略す
る。
FIG. 25 is a flowchart showing image processing in the image processing apparatus of this embodiment. A control program for executing this processing is stored in the storage unit 103.
In the flowchart, the same processing steps as those in the first embodiment are denoted by the same reference numerals, and description thereof will be omitted.

【0088】ステップS209 次に表領域確定部112において、表領域の確定を行
う。図28はステップS209の表領域の確定処理を詳
細に説明したフローチャートである。
Step S209 Next, the table area determination section 112 determines the table area. FIG. 28 is a flowchart illustrating in detail the table area determination processing in step S209.

【0089】また図26は表の場合のステップS209
を説明する図で、2601は矩形領域、2602は表
枠、2603は表の中身の文字等、2604は矩形領域
2601の重心(注目点)、2605〜2608はそれ
ぞれ注目点2604から上下左右に伸ばした線分を表
す。
FIG. 26 shows step S209 in the case of a table.
2601 is a rectangular area, 2602 is a table frame, 2603 is a character in the contents of the table, etc., 2604 is the center of gravity (point of interest) of the rectangular area 2601, and 2605 to 2608 extend vertically, horizontally, and respectively from the point of interest 2604. Represents a line segment.

【0090】同じく図27は変形セパレータの場合のス
テップS209を説明する図で、2701は矩形領域、
2702は変形セパレータ、2703は変形セパレータ
の中身の文字等、2704は矩形領域2701の重心
(注目点)、2705〜2708はそれぞれ注目点27
04から上下左右に伸ばした線分を表す。
FIG. 27 is a view for explaining step S209 in the case of a deformed separator.
Reference numeral 2702 denotes a deformed separator, 2703 denotes characters in the contents of the deformed separator, etc., 2704 denotes the center of gravity (point of interest) of the rectangular area 2701, and 2705 to 2708 denote the points of interest 27, respectively.
It represents a line segment extending from top, bottom, left, and right.

【0091】以下図28のフローチャート及び図26に
従って表の場合について説明する。
The case of a table will be described below with reference to the flowchart of FIG. 28 and FIG.

【0092】本実施例では、表と判断された矩形領域内
の1点の任意の注目点に重心を取り、上下左右方向に合
計4本の線分を1本ずつ伸ばすことにする。また、上下
左右に伸ばした線分のうち少なくとも1本の線分が3回
以上表枠と交わるような注目点が1点(以上)存在する
場合、矩形領域を表であると確定し、そうでない場合を
変形セパレータと確定する表確定手段とする。
In this embodiment, the center of gravity is set at an arbitrary point of interest in a rectangular area determined to be a table, and a total of four line segments are extended one by one in the vertical and horizontal directions. If there is one (or more) point of interest such that at least one of the line segments extending vertically and horizontally intersects the table frame three or more times, the rectangular area is determined to be a table, and so on. If not, a table determination means for determining the deformation separator is used.

【0093】まず初めにステップS2801で矩形領域
の重心を求め注目点とする。
First, in step S2801, the center of gravity of a rectangular area is obtained and set as a point of interest.

【0094】幅と高さをそれぞれ2分の1にした所が重
心で、注目点2604が求まる。
The point where the width and height are each halved is the center of gravity, and the point of interest 2604 is obtained.

【0095】次にステップS2802で、注目点260
4から上下左右方向に線分を伸ばしていき、それぞれ表
枠と何回交わるかカウントする。図26で、注目点26
04から上に伸ばした線分が線分2605、同様に下が
線分2606、左が線分2607、右が線分2608で
ある。
Next, in step S2802, the point of interest 260
Lines are extended in the vertical and horizontal directions from 4, and the number of times each intersects the table frame is counted. In FIG. 26, attention point 26
A line segment extending upward from 04 is a line segment 2605, similarly, a line segment 2606 is on the lower side, a line segment 2607 is on the left, and a line segment 2608 is on the right.

【0096】表枠と交わった回数は、それぞれ線分26
05が3回、線分2606が3回、線分2607が2
回、線分2608が1回である。
The number of crossings with the table frame is 26
05 three times, line segment 2606 three times, line segment 2607 two
Times, the line segment 2608 is once.

【0097】ステップS2803で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。線分2605、線分2606が3回以上表枠と交わ
っているので、ステップS2804に進む。もし、3回
以上交わる線分がなければ、ステップS2805に進
む。
In step S2803, it is checked whether or not there is a line segment that intersects the table frame three or more times among the line segments extended vertically and horizontally. Since the line segments 2605 and 2606 intersect the table frame three or more times, the flow advances to step S2804. If there is no line segment that crosses three or more times, the process proceeds to step S2805.

【0098】ステップS2804では矩形領域を表領域
と確定し、ステップS210に進む。
In step S2804, the rectangular area is determined as the table area, and the flow advances to step S210.

【0099】次に、図28のフローチャート及び図27
に従って変形セパレータの場合について説明する。
Next, the flowchart of FIG.
Will be described with reference to FIG.

【0100】まず初めにステップS2801で矩形領域
の重心を求め注目点とする。幅と高さをそれぞれ2分の
1にした所が重心で、注目点2704が求まる。
First, in step S2801, the center of gravity of the rectangular area is obtained and set as a point of interest. The point where the width and height are each halved is the center of gravity, and an attention point 2704 is obtained.

【0101】次にステップS2802で、注目点270
4から上下左右方向に線分を伸ばしていき、それぞれ表
枠(変形セパレータ)と何回交わるかカウントする。図
27で、注目点2704から上に伸ばした線分が線分2
705、同様に下が線分2706、左が線分2707、
右が線分2708である。
Next, in step S2802, the point of interest 270
The line segment is extended in the up, down, left, and right directions from 4, and how many times each intersects with the front frame (deformed separator) is counted. In FIG. 27, a line segment extending upward from the point of interest 2704 is a line segment 2
705, similarly, a line segment 2706 on the lower side, a line segment 2707 on the left side,
The right is a line segment 2708.

【0102】表枠と交わった回数は、それぞれ線分27
05が1回、線分2706が1回、線分2707が1
回、線分2708が1回である。
The number of crossings with the table frame is 27
05 once, line 2706 once, line 2707 1
Times, the line segment 2708 is one time.

【0103】ステップS2803で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。いずれの線分も3回以上表枠と交わっていないの
で、ステップS2805に進む。
In step S2803, it is determined whether or not there is a line segment that intersects the table frame three or more times among the line segments extended vertically and horizontally. Since no line segment intersects the table frame three or more times, the process proceeds to step S2805.

【0104】ステップS2805では矩形領域を変形セ
パレータ領域と確定し、ステップS205に進む。
In step S2805, the rectangular area is determined as a deformed separator area, and the flow advances to step S205.

【0105】ステップS210 最後に、以上の様にして求めた各種領域の矩形データを
画像データと共に出力部104から出力する。
Step S210 Finally, the rectangular data of the various regions obtained as described above is output from the output unit 104 together with the image data.

【0106】図31はステップS209の表領域の確定
処理において、矩形領域内に取る注目点を複数取った例
を詳細に説明したフローチャートである。
FIG. 31 is a flowchart describing in detail an example in which a plurality of points of interest are taken in a rectangular area in the table area determination processing in step S209.

【0107】また、図29は表の場合のステップS20
9を説明する図で、2901は矩形領域、2902は表
枠、2903は表の中身の文字等、2904〜2906
は矩形領域内の任意の注目点、2907〜2912は注
目点2904、注目点2905、注目点2906から上
下左右に伸ばした線分を表す。
FIG. 29 shows a step S20 for a table.
9, 2901 is a rectangular area, 2902 is a table frame, 2903 is a character in the table, etc., 2904 to 2906
Denotes an arbitrary point of interest in the rectangular area, and 2907 to 2912 denote lines of interest extending from the point of interest 2904, the point of interest 2905, and the point of interest 2906 to the top, bottom, left and right.

【0108】同じく図30は変形セパレータの場合のス
テップS209を説明する図で、3001は矩形領域、
3002は変形セパレータ、3003は変形セパレータ
の中身の文字等、3004〜3006は矩形領域内の任
意の注目点、3007〜3012は注目点3004、注
目点3005、注目点3006から上下左右に伸ばした
線分を表す。
FIG. 30 is a view for explaining step S209 in the case of a deformed separator.
Reference numeral 3002 denotes a deformed separator, 3003 denotes a character or the like in the deformed separator, 3004 to 3006 denote an arbitrary point of interest in a rectangular area, 3007 to 3012 denote points of interest 3004, a point of interest 3005, and lines extending vertically and horizontally from the point of interest 3006 Represents minutes.

【0109】以下図31のフローチャート及び図29に
従って表の場合について説明する。
The case of a table will be described below with reference to the flowchart of FIG. 31 and FIG.

【0110】本実施例では、表と判断された矩形領域内
の3点の任意の注目点を取り、合計12本、注目点毎に
考えると、上下左右方向に合計4本の線分を1本ずつ伸
ばすことにする。また、上下左右に伸ばした線分のうち
少なくとも1本が3回以上表枠と交わるような注目点が
2点以上存在する場合、矩形領域を表であると確定し、
そうでない場合を変形セパレータと確定する表確定手段
とする。
In the present embodiment, three arbitrary points of interest in the rectangular area determined to be a table are taken, and a total of 12 points are considered for each point of interest. I will stretch them one by one. If there are two or more points of interest such that at least one of the line segments extending vertically and horizontally intersects the table frame three or more times, the rectangular area is determined to be a table,
If it is not the case, it is defined as a table determination means for determining the deformation separator.

【0111】まず初めにステップS3101で矩形領域
内に3点の注目点を求める。左上角の点から、幅と高さ
をそれぞれ4分の1にした点、それぞれ2分の1にした
点、それぞれ4分の3にした点を注目点2904、注目
点2905、注目点2906とする。
First, in step S3101, three points of interest are obtained in a rectangular area. From the point at the upper left corner, the point where the width and height are each reduced to そ れ ぞ れ, the point where each is reduced to 、, and the point where each is reduced to 4 are noted points 2904, 2905, and 2906. I do.

【0112】次にステップS3102で、(表領域確定
注目点数)=0とする。
Next, in step S3102, (table area fixed attention point) = 0 is set.

【0113】ステップS3103で、注目点2904か
ら上下左右方向に線分を伸ばしていき、それぞれ表枠と
何回交わるかカウントする。図29で、注目点2904
から上下に伸ばした線分が線分2907、左右に伸ばし
た線分が線分2910である。
In step S3103, a line segment is extended in the up, down, left, and right directions from the point of interest 2904, and how many times each intersects the table frame is counted. In FIG. 29, the attention point 2904
A line segment extending up and down from line 2907 is a line segment and a line segment extending right and left is line segment 2910.

【0114】表枠と交わった回数は、それぞれ上方向線
分が2回、下方向線分が4回、左方向線分が2回、右方
向線分が1回である。
The number of crossings with the table frame is two for the upward line segment, four for the downward line segment, two for the leftward line segment, and one for the rightward line segment.

【0115】ステップS3104で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。下方向線分が3回以上表枠と交わっているので、ス
テップS3105に進む。もし、3回以上交わる線分が
なければ、ステップS3106に進む。
In step S3104, it is determined whether or not there is a line segment that intersects the table frame three or more times among the line segments extended vertically and horizontally. Since the downward line segment intersects the table frame three or more times, the process proceeds to step S3105. If no line segment intersects three or more times, the process proceeds to step S3106.

【0116】ステップS3105では表領域確定注目点
数に1加え、ステップS3106に進む。 (表領域確定注目点数)=0+1=1
In step S3105, 1 is added to the number of table region fixed attention points, and the flow advances to step S3106. (Table area fixed attention points) = 0 + 1 = 1

【0117】ステップS3106では、すべての注目点
について処理したか調べる。注目点2905、注目点2
906が残っているので、ステップS3103に戻る。
注目点2905、注目点2906に対しても注目点29
04と同様に処理を行う。図29で明らかな様に、すべ
ての注目点に対して処理が終わった時に、 (表領域確定注目点数)=3 となっている。すべての注目点について処理が終わった
ので、ステップS3107に進む。
In step S3106, it is checked whether all attention points have been processed. Attention point 2905, Attention point 2
Since 906 remains, the process returns to step S3103.
Attention point 2905, attention point 2906 and attention point 29
Processing is performed in the same manner as in step S04. As is clear from FIG. 29, when the processing is completed for all the points of interest, (table area fixed number of points of interest) = 3. Since the processing has been completed for all the points of interest, the flow advances to step S3107.

【0118】ステップS3107では、(表領域確定注
目点数)が2以上かどうか調べる。2以上なのでステッ
プS3108に進む。
In step S3107, it is checked whether or not (table region fixed attention point) is 2 or more. Since it is 2 or more, the process proceeds to step S3108.

【0119】ステップS3108では矩形領域を表領域
と確定し、ステップS205に進む。
In step S3108, the rectangular area is determined as the table area, and the flow advances to step S205.

【0120】次に、図31のフローチャート及び図30
に従って変形セパレータの場合について説明する。
Next, the flowchart of FIG. 31 and the flowchart of FIG.
Will be described with reference to FIG.

【0121】まず初めにステップS3101で矩形領域
内に3点の注目点を求める。左上角の点から、幅と高さ
をそれぞれ4分の1にした点、それぞれ2分の1にした
点、それぞれ4分の3にした点を注目点3004、注目
点3005、注目点3006とする。
First, in step S3101, three points of interest are obtained in a rectangular area. From the point at the upper left corner, the point where the width and the height are respectively reduced to そ れ ぞ れ, the point where the width is reduced to 点, and the point where the height is reduced to 4 are noted points 3004, 3005, and 3006. I do.

【0122】次にステップS3102で、(表領域確定
注目点数)=0とする。
Next, in step S3102, (table area fixed point of interest) = 0 is set.

【0123】ステップS3103で、注目点3004か
ら上下左右方向に線分を伸ばしていき、それぞれ表枠と
何回交わるかカウントする。図31で、注目点3004
から上下に伸ばした線分が線分3007、左右に伸ばし
た線分が線分3010である。
In step S3103, a line segment is extended from the point of interest 3004 in the up, down, left, and right directions, and the number of times each intersects the table frame is counted. In FIG. 31, attention point 3004
A line segment extending upward and downward is a line segment 3007, and a line segment extending left and right is a line segment 3010.

【0124】表枠と交わった回数は、それぞれ上方向線
分が1回、下方向線分が1回、左方向線分が1回、右方
向線分が1回である。
The number of crossings with the table frame is one for the upward line segment, one for the downward line segment, one for the leftward line segment, and one for the rightward line segment.

【0125】ステップS3104で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。上下左右いずれの方向線分も3回以上交わらないの
で、ステップS3106に進む。
In step S3104, it is determined whether or not there is a line segment that intersects the table frame three or more times among the line segments extended vertically and horizontally. Since neither the upper, lower, left, or right direction line segment intersects three times or more, the process proceeds to step S3106.

【0126】ステップS3106では、すべての注目点
について処理したか調べる。注目点3005、注目点3
006が残っているので、ステップS3103に戻る。
注目点3005、注目点3006に対しても注目点30
04と同様に処理を行う。図30で明らかな様に、すべ
ての注目点に対して処理が終わった時に、(表領域確定
注目点数)=0となっている。すべての注目点について
処理が終わったので、ステップS3107に進む。
In step S3106, it is checked whether all attention points have been processed. Attention point 3005, Attention point 3
Since 006 remains, the process returns to step S3103.
Attention point 305 for attention point 3005 and attention point 3006
Processing is performed in the same manner as in step S04. As is clear from FIG. 30, when the processing is completed for all the points of interest, (table area fixed number of points of interest) = 0. Since the processing has been completed for all the points of interest, the flow advances to step S3107.

【0127】ステップS3107では、(表領域確定注
目点数)が2以上かどうか調べる。2以上ではないので
ステップS3109に進む。
In step S3107, it is checked whether or not (table area fixed attention point) is 2 or more. Since it is not two or more, the process proceeds to step S3109.

【0128】ステップS3109では矩形領域を変形セ
パレータ領域と確定し、ステップS210に進む。
In step S3109, the rectangular area is determined as the deformed separator area, and the flow advances to step S210.

【0129】図34はステップS209の表領域の確定
処理において、上下左右に伸ばす線分を複数取った例を
詳細に説明したフローチャートである。
FIG. 34 is a flowchart for explaining in detail an example in which a plurality of line segments extending up, down, left, and right are taken in the determination processing of the table area in step S209.

【0130】また図32は表の場合のステップS209
を説明する図で、3201は矩形領域、3202は表
枠、3203は表の中身の文字等、3204は矩形領域
内の重心(注目点)、3205〜3207は注目点32
04から上方向に伸ばした線分、3208〜3210は
注目点3204から下方向に伸ばした線分、3211〜
3213は注目点3204から左方向に伸ばした線分、
3214〜3216は注目点3204から右方向に伸ば
した線分を表す。
FIG. 32 shows step S209 in the case of a table.
Is a rectangular area, 3202 is a table frame, 3203 is a character in the table, etc., 3204 is a center of gravity (point of interest) in the rectangular area, and 3205 to 3207 are points of interest 32
Line segments extending upward from 04, 3208 to 3210 are line segments extending downward from the point of interest 3204, 3211 to
3213 is a line segment extending leftward from the point of interest 3204;
Reference numerals 3214 to 3216 denote line segments extending rightward from the attention point 3204.

【0131】同じく図33は変形セパレータの場合のス
テップS209を説明する図で、3301は矩形領域、
3302は変形セパレータ、3303は変形セパレータ
の中身の文字等、3304は矩形領域内の重心(注目
点)、3305〜3307は注目点3304から上方向
に伸ばした線分、3308〜3310は注目点3304
から下方向に伸ばした線分、3311〜3313は注目
点3304から左方向に伸ばした線分、3314〜33
16は注目点3304から右方向に伸ばした線分を表
す。
FIG. 33 is a view for explaining step S209 in the case of a deformed separator.
3302 is a deformed separator, 3303 is a character in the contents of the deformed separator, etc., 3304 is a center of gravity (point of interest) in a rectangular area, 3305 to 3307 are line segments extending upward from the point of interest 3304, and 3308 to 3310 are points of interest 3304
The line segments 331 1 to 313 extending downward from, the line segments extending leftward from the point of interest 3304, 3314 to 33
Reference numeral 16 denotes a line segment extending rightward from the point of interest 3304.

【0132】以下図34のフローチャート及び図32に
従って表の場合について説明する。
The case of a table will be described below with reference to the flowchart of FIG. 34 and FIG.

【0133】本実施例では、表と判断された矩形領域内
の1点の任意の注目点に重心を取り、合計12本の線分
を上下左右方向に3本ずつ伸ばすことにする。また、上
下左右に伸ばした線分のうち3回以上表枠と交わるよう
な注目点が1点(以上)存在する場合、矩形領域を表で
あると確定し、そうでない場合を変形セパレータと確定
する表確定手段とする。
In this embodiment, the center of gravity is set at an arbitrary point of interest in a rectangular area determined as a table, and a total of 12 line segments are extended three by three in the vertical and horizontal directions. If one (or more) point of interest that intersects the table frame three or more times exists among the line segments extended vertically and horizontally, the rectangular area is determined to be a table, and if not, a deformed separator is determined. Table determination means to be used.

【0134】まず初めにステップS3401で矩形領域
の重心を求め、注目点とする。
First, in step S3401, the center of gravity of the rectangular area is obtained and set as a point of interest.

【0135】幅と高さをそれぞれ2分の1にした所が重
心で、注目点3204が求まる。
A point where the width and the height are each halved is the center of gravity, and an attention point 3204 is obtained.

【0136】次にステップS3402で、注目点320
4から上下左右方向にそれぞれ3本ずつ合計12本の線
分を伸ばしていき、それぞれ表枠と何回交わるかカウン
トする。図32で明らかな様に、表枠と交わった回数
は、それぞれ線分3205、線分3206、線分320
7が3回、線分3208、線分3209、線分3210
が3回、線分3211、線分3212、線分3213が
2回、線分3214が2回、線分3215、線分321
6が1回である。
Next, in step S3402, the point of interest 320
A total of 12 line segments are extended from 3 to 4 in the up, down, left, and right directions, and the number of times each intersects the table frame is counted. As is apparent from FIG. 32, the number of times of intersection with the table frame is represented by the line segment 3205, the line segment 3206, and the line segment 320, respectively.
7 three times, line segment 3208, line segment 3209, line segment 3210
Three times, line 3211, line 3212, line 3213 twice, line 3214 twice, line 3215, line 321
6 is once.

【0137】ステップS3403で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。
In step S3403, it is checked whether there is a line segment that intersects the table frame three or more times among the line segments extended vertically and horizontally.

【0138】線分3205、線分3206、線分320
7、線分3208、線分3209、線分3210が3回
以上表枠と交わっているので、ステップS3404に進
む。もし、3回以上交わる線分がなければ、ステップS
3405に進む。
Line segments 3205, 3206, 320
7, the line segment 3208, the line segment 3209, and the line segment 3210 intersect with the table frame three or more times, and the process advances to step S3404. If there is no line segment that crosses three or more times, step S
Proceed to 3405.

【0139】ステップS3404では矩形領域を表領域
と確定し、ステップS210に進む。
In step S3404, the rectangular area is determined as the table area, and the flow advances to step S210.

【0140】次に図34のフローチャート及び図33に
従って変形セパレータの場合について説明する。
Next, the case of a modified separator will be described with reference to the flowchart of FIG. 34 and FIG.

【0141】まず初めにステップS3401で矩形領域
の重心を求め、注目点とする。
First, in step S3401, the center of gravity of the rectangular area is obtained and set as a point of interest.

【0142】幅と高さをそれぞれ2分の1にした所が重
心で、注目点3304が求まる。
The point where the width and height are each halved is the center of gravity, and the point of interest 3304 is obtained.

【0143】次にステップS3402で、注目点330
4から上下左右方向にそれぞれ3本ずつ合計12本の線
分を伸ばしていき、それぞれ表枠と何回交わるかカウン
トする。図33で明らかな様に、表枠と交わった回数
は、それぞれ線分3305、線分3306、線分330
7が1回、線分3308、線分3309、線分3310
が1回、線分3311、線分3312、線分3313が
1回、線分3314、線分3315、線分3316が1
回である。
Next, in step S3402, the point of interest 330
A total of 12 line segments are extended from 3 to 4 in the up, down, left, and right directions, and the number of times each intersects the table frame is counted. As is apparent from FIG. 33, the number of times of intersection with the table frame is represented by line segment 3305, line segment 3306, and line segment 330, respectively.
7 once, line segment 3308, line segment 3309, line segment 3310
Once, segment 3311, segment 3312, segment 3313 once, segment 3314, segment 3315, segment 3316 is one
Times.

【0144】ステップS3403で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。3回以上交わる線分がないので、ステップS340
5に進む。
In step S3403, it is checked whether there is a line segment that intersects the table frame at least three times among the line segments extended vertically and horizontally. Since there is no line segment that intersects three or more times, step S340
Go to 5.

【0145】ステップS3405では矩形領域を変形セ
パレータ領域と確定し、ステップS210に進む。
In step S3405, the rectangular area is determined as a deformed separator area, and the flow advances to step S210.

【0146】図36はステップS209の表領域の確定
処理を詳細に説明したフローチャートで、注目点を領域
矩形内の表枠以外に求めた(ステップS1701)例で
ある。
FIG. 36 is a flow chart for explaining in detail the table area determination processing in step S209, and is an example in which the point of interest is obtained in a region other than the table frame in the area rectangle (step S1701).

【0147】図35は表の場合のステップS209を説
明する図で、3501は矩形領域、3502は矩形領域
3501の重心、3503は重心3502の8近傍、3
504は重心3502の8近傍のうちの左上の点、35
05は重心3502の8近傍のうちの真上の点かつ注目
点、3506〜3509はそれぞれ注目点3505から
上下左右に伸ばした線分、黒丸は表枠に属する黒画素、
白丸は表枠以外の画素を表す。
FIG. 35 is a diagram for explaining step S209 in the case of a table, where 3501 is a rectangular area, 3502 is the center of gravity of the rectangular area 3501, 3503 is 8 neighborhoods of the center of gravity 3502, 3
504 is an upper left point among eight neighborhoods of the center of gravity 3502, 35
05 is a point directly above and attention point of the eight neighborhoods of the center of gravity 3502, 3506 to 3509 are line segments extending vertically, horizontally, and from the attention point 3505, black circles are black pixels belonging to the table frame,
White circles represent pixels other than the table frame.

【0148】また、表の内部の文字等を構成する黒画素
は省略している。
Also, black pixels constituting characters and the like in the table are omitted.

【0149】以下図36のフローチャート及び図35に
従って表の場合について説明する。
The case of a table will be described below with reference to the flowchart of FIG. 36 and FIG.

【0150】本実施例では、表と判断された矩形領域内
の表枠に属さない1点の任意の注目点を取り、上下左右
方向に合計4本の線分を1本ずつ伸ばすことにする。ま
た、上下左右に伸ばした線分のうち少なくとも1本の線
分が3回以上表枠と交わるような注目点が1点以上存在
する場合、前記矩形領域を表であると確定し、そうでな
い場合を変形セパレータと確定する表確定手段とする。
In this embodiment, an arbitrary point of interest that does not belong to the table frame in the rectangular area determined to be a table is taken, and a total of four line segments are extended one by one in the vertical and horizontal directions. . If there is one or more points of interest where at least one of the line segments extending vertically and horizontally intersects the table frame three or more times, the rectangular area is determined to be a table, and not so. The case is defined as table determination means for determining the deformation separator.

【0151】まず初めにステップS3601で矩形領域
内に表枠以外の注目点を求める。
First, in step S3601, a point of interest other than the table frame is obtained in the rectangular area.

【0152】ここでは注目点としてまず初めに重心を求
め、重心が表枠に属してないか調べる。属していなけれ
ば重心を注目点とする。重心が表枠に属しているなら
ば、重心の8近傍を左上から右回りにチェックしてい
き、表枠に属さない点を注目点とする。8近傍になけれ
ば、一回り外側をチェックしていくことにする。
Here, the center of gravity is first determined as a point of interest, and it is checked whether or not the center of gravity belongs to the table frame. If they do not belong, the center of gravity is taken as the point of interest. If the center of gravity belongs to the table frame, the vicinity of 8 of the center of gravity is checked clockwise from the upper left, and points not belonging to the table frame are set as points of interest. If it is not near 8, the outside will be checked once.

【0153】まず重心を求める。First, the center of gravity is determined.

【0154】幅と高さをそれぞれ2分の1にした所が重
心で、重心3502が求まる。
The place where the width and height are each halved is the center of gravity, and the center of gravity 3502 is obtained.

【0155】次に重心が表枠に属さないかチェックす
る。重心3502は、図35で明らかな様に表枠に属す
る。表枠に属するので8近傍の点を調べる。まず初めに
重心3502の左上の点3504が表枠に属さないか調
べる。近傍点3504は、図35で明らかな様に表枠に
属する。続いて、右回りに次の8近傍の点を調べる。次
の点は、近傍点3505である。
Next, it is checked whether the center of gravity does not belong to the table frame. The center of gravity 3502 belongs to the table frame as is apparent from FIG. Since it belongs to the table frame, the points near 8 are examined. First, it is checked whether or not the upper left point 3504 of the center of gravity 3502 does not belong to the table frame. The neighborhood point 3504 belongs to the table frame as is apparent from FIG. Then, the next eight points are examined clockwise. The next point is the neighborhood point 3505.

【0156】図35で明らかな様に近傍点3505は表
枠に属さないので、近傍点3505を注目点とし、ステ
ップS2802に進む。
As is clear from FIG. 35, since the neighboring point 3505 does not belong to the table frame, the neighboring point 3505 is set as a point of interest, and the flow advances to step S2802.

【0157】次にステップS2802で、注目点350
5から上下左右方向に線分を伸ばしていき、それぞれ表
枠と何回交わるかカウントする。図35で、注目点35
05から上に伸ばした線分が線分3506、同様に下が
線分3507、左が線分3508右が線分3509であ
る。
Next, in step S2802, the point of interest 350
Lines are extended in the vertical and horizontal directions from 5, and the number of times each intersects the table frame is counted. In FIG. 35, a point of interest 35
A line segment extending upward from 05 is a line segment 3506, similarly, a line segment 3507 is at the bottom, a line segment 3508 is at the left, and a line segment 3509 is at the right.

【0158】表枠と交わった回数は、それぞれ線分35
06が2回、線分3507が3回、線分3508が2
回、線分3509が1回である。
The number of crossings with the table frame is 35
06 twice, line segment 3507 three times, line segment 3508 2
Times, the line segment 3509 is one time.

【0159】ステップS2803で、上下左右に伸ばし
た線分のうち3回以上表枠と交わった線分があるか調べ
る。線分3507が3回以上表枠と交わっているので、
ステップS2805に進む。もし、3回以上交わる線分
がなければ、ステップS2806に進む。
In step S2803, it is determined whether or not there is a line segment that intersects the table frame three or more times among the line segments extended vertically and horizontally. Since the line segment 3507 intersects the table frame three or more times,
The process proceeds to step S2805. If there is no line segment that crosses three or more times, the process advances to step S2806.

【0160】ステップS2805では矩形領域を表領域
と確定し、ステップS210に進む。
In step S2805, the rectangular area is determined as the table area, and the flow advances to step S210.

【0161】ステップS2806に進んだ場合は矩形領
域を変形セパレータ領域と確定し、ステップS210に
進む。
If the processing has proceeded to step S2806, the rectangular area is determined as the deformed separator area, and the processing proceeds to step S210.

【0162】尚、ステップS201の画像入力の際に多
値であるかどうかを判断して二値画像に変換する事で、
入力画像がカラー等の多値画像であっても領域分割処理
は可能である。
It is to be noted that, at the time of image input in step S201, it is determined whether or not the image is multi-valued, and the image is converted into a binary image.
Even if the input image is a multi-valued image such as a color image, the region division processing can be performed.

【0163】また、ステップS201の画像入力の際、
入力画像の画素数が多大な処理時間を必要とするほど多
ければ、縦mドット横nドットの画像を1画素にする画
像間引き処理によって処理を高速化する事も可能であ
る。
When inputting an image in step S201,
If the number of pixels of the input image is large enough to require a great deal of processing time, the processing can be speeded up by image thinning-out processing in which an image of vertical m dots and horizontal n dots is made one pixel.

【0164】また、ステップS203のセパレータの検
出等において、セパレータの縦・横違いや、図形や表
等、求める時の閾値の違いなどで矩形ラベルを区別する
事で、更に詳細な領域属性の分類を行う事も可能であ
る。
Further, in the detection of the separator in step S203 and the like, the rectangular labels are distinguished based on the difference between the vertical and horizontal of the separator, the difference in the threshold value when obtaining the figure or the table, etc. It is also possible to do.

【0165】また、ステップS209の表領域確定の
際、上下左右方向に伸ばす線分数を上下左右に均等配分
しなくとも、表領域確定処理は可能である。
When the table area is determined in step S209, the table area determination processing can be performed without equally distributing the number of line segments extending in the up, down, left, and right directions.

【0166】また、ステップS209の表領域確定の
際、注目点が複数ある場合に、上下左右方向に伸ばす線
分数を注目点毎に均等配分しなくとも、表領域確定処理
は可能である。
When the table area is determined in step S209, when there are a plurality of points of interest, the table area determination processing can be performed without equally distributing the number of line segments extending in the up, down, left, and right directions for each point of interest.

【0167】(実施例3)本実施例では、表と判断され
た矩形領域から放射線分を出して表枠との交差回数及び
方向から表領域を確定する例を説明する。本実施例の装
置の構成は実施例1と同様である。
(Embodiment 3) In this embodiment, an example will be described in which radiation is extracted from a rectangular area determined to be a table and the table area is determined from the number of times of intersection with the table frame and the direction. The configuration of the device of the present embodiment is the same as that of the first embodiment.

【0168】本実施例の画像処理装置における画像処理
を示すフローチャートは、実施例2において説明した図
25のフローチャートと同様である。
The flowchart showing the image processing in the image processing apparatus of this embodiment is the same as the flowchart of FIG. 25 described in the second embodiment.

【0169】ステップS209 次に、表領域の確定を行う。図37はステップS209
の表領域の確定処理を詳細に説明したフローチャートで
ある。実施例2の図28と同様の処理ステップは同じ番
号を付し、ここでの説明は省略する。
Step S209 Next, the table area is determined. FIG. 37 shows step S209.
9 is a flowchart illustrating in detail a table area determination process. The same processing steps as those in FIG. 28 of the second embodiment are denoted by the same reference numerals, and description thereof will be omitted.

【0170】本実施例では、表と判断された矩形領域内
の1点の任意の注目点に重心を取り、上下左右方向に合
計4本の線分を1本ずつ伸ばすことにする。また、上下
に伸ばした線分のうち少なくとも1本が2回以上表枠と
交わり、かつ左右に伸ばした線分のうち少なくとも1本
が2回以上表枠と交わるような注目点が1点(以上)存
在する場合、前記矩形領域を表であると確定し、そうで
ない場合を変形セパレータと確定する表確定手段とす
る。
In the present embodiment, the center of gravity is set at an arbitrary point of interest in a rectangular area determined to be a table, and a total of four line segments are extended one by one in the vertical and horizontal directions. In addition, one point of interest is such that at least one of the vertically extended line segments intersects the table frame at least twice and at least one of the horizontally extended line segments intersects the table frame at least two times ( If there is), the rectangular area is determined to be a table, and if not, a table determining means is determined to determine a deformed separator.

【0171】ステップS3703で、上下に伸ばした線
分のうち少なくとも一方が2回以上表枠と交わったか調
べる。線分2605、線分2606共に2回以上表枠と
交わっているので、ステップS3704に進む。もし、
2回以上交わる線分がなければ、ステップS3706に
進む。
In step S3703, it is checked whether at least one of the vertically extended lines intersects the table frame at least twice. Since both the line segment 2605 and the line segment 2606 intersect the table frame at least twice, the process advances to step S3704. if,
If there is no line segment that intersects at least twice, the process proceeds to step S3706.

【0172】ステップS3704では、左右に伸ばした
線分のうち少なくとも一方が2回以上表枠と交わったか
調べる。線分2605が2回以上表枠と交わっているの
で、ステップS3705に進む。もし、2回以上交わる
線分がなければ、ステップS3706に進む。
In step S3704, it is checked whether at least one of the line segments extended left and right intersects the table frame at least twice. Since the line segment 2605 intersects the table frame two or more times, the flow advances to step S3705. If there is no line segment that intersects twice or more, the process proceeds to step S3706.

【0173】ステップS3705では矩形領域を表領域
と確定し、ステップS210に進む。
In step S3705, the rectangular area is determined as the table area, and the flow advances to step S210.

【0174】次に、変形セパレータの場合について説明
する。
Next, the case of a deformed separator will be described.

【0175】ステップS3703で、上下に伸ばした線
分のうち少なくとも一方が2回以上表枠と交わったか調
べる。線分2705、線分2706共に2回以上表枠と
交わっていないので、ステップS3706に進む。
In step S3703, it is checked whether at least one of the vertically extended lines intersects the table frame at least twice. Since neither the line segment 2705 nor the line segment 2706 intersects the table frame twice or more, the process proceeds to step S3706.

【0176】ステップS3706では矩形領域を変形セ
パレータ領域と確定し、ステップS210に進む。
In step S3706, the rectangular area is determined as a deformed separator area, and the flow advances to step S210.

【0177】ステップS210 最後に、以上の様にして求めた各種領域の矩形データを
画像データと共に出力部104から出力する。
Step S210 Finally, the rectangular data of the various regions obtained as described above is output from the output unit 104 together with the image data.

【0178】図38はステップS209の表領域の確定
処理において、矩形領域内に取る注目点を複数取った例
を詳細に説明したフローチャートである。
FIG. 38 is a flowchart for explaining in detail an example in which a plurality of points of interest are taken in a rectangular area in the determination processing of the table area in step S209.

【0179】図38の処理において、実施例2における
図31のフローチャートと同様の処理ステップは同じ番
号を付し、ここでの説明は省略する。
In the processing of FIG. 38, the same processing steps as those in the flowchart of FIG. 31 in the second embodiment are denoted by the same reference numerals, and description thereof will be omitted.

【0180】以下図38のフローチャート及び図29に
従って表の場合について説明する。
The case of a table will be described below with reference to the flowchart of FIG. 38 and FIG.

【0181】この処理では、表と判断された矩形領域内
の3点の任意の注目点を取り、合計12本、注目点毎に
考えると、上下左右方向に合計4本の線分を1本ずつ伸
ばすことにする。また、上下に伸ばした線分のうち少な
くとも1本が2回以上表枠と交わり、かつ左右に伸ばし
た線分のうち少なくとも1本が2回以上表枠と交わるよ
うな注目点が2点以上存在する場合、矩形領域を表であ
ると確定し、そうでない場合を変形セパレータと確定す
る表確定手段とする。
In this processing, three arbitrary points of interest in the rectangular area determined to be a table are taken, and a total of 12 points are considered for each point of interest. I will lengthen it. In addition, at least two points of interest such that at least one of the vertically extended lines intersects the table frame at least twice and at least one of the horizontally extended lines intersects the table frame at least twice. If it exists, the rectangular area is determined to be a table, and if not, the table is determined by a table determining means for determining a deformed separator.

【0182】ステップS3804で、上下に伸ばした線
分のうち少なくとも一方が2回以上表枠と交わったか調
べる。上下共に2回以上表枠と交わっているので、ステ
ップS3805に進む。もし、2回以上交わる線分がな
ければ、ステップS3106に進む。
In step S3804, it is determined whether at least one of the vertically extended lines intersects the table frame at least twice. Since the upper and lower sides intersect with the table frame at least twice, the process proceeds to step S3805. If there is no line segment that crosses twice or more, the process proceeds to step S3106.

【0183】ステップS3805では、左右に伸ばした
線分のうち少なくとも一方が2回以上表枠と交わったか
調べる。左方向線分が2回以上表枠と交わっているの
で、ステップS3806に進む。もし、2回以上交わる
線分がなければ、ステップS3106に進む。
In step S3805, it is checked whether at least one of the line segments extended left and right intersects the table frame at least twice. Since the left direction line segment intersects the table frame more than once, the process proceeds to step S3806. If there is no line segment that crosses twice or more, the process proceeds to step S3106.

【0184】ステップS3806では表領域確定注目点
数に1加える。 (表領域確定注目点数)=0+1=1
In step S3806, one is added to the table area fixed attention point. (Table area fixed attention points) = 0 + 1 = 1

【0185】ステップS3106では、すべての注目点
について処理したか調べる。注目点2905、注目点2
906が残っているので、ステップS3103に戻る。
注目点2905、注目点2906に対しても注目点29
04と同様に処理を行う。図29で明らかな様に、すべ
ての注目点に対して処理が終わった時に、 (表領域確定注目点数)=3 となっている。すべての注目点について処理が終わった
ので、ステップS3107に進む。
In step S3106, it is checked whether all attention points have been processed. Attention point 2905, Attention point 2
Since 906 remains, the process returns to step S3103.
Attention point 2905, attention point 2906 and attention point 29
Processing is performed in the same manner as in step S04. As is clear from FIG. 29, when the processing is completed for all the points of interest, (table area fixed number of points of interest) = 3. Since the processing has been completed for all the points of interest, the flow advances to step S3107.

【0186】ステップS3107では、(表領域確定注
目点数)が2以上かどうか調べる。2以上なのでステッ
プS3108に進む。
In step S3107, it is checked whether or not (table area fixed attention point) is 2 or more. Since it is 2 or more, the process proceeds to step S3108.

【0187】ステップS3108では矩形領域を表領域
と確定し、ステップS210に進む。
In step S3108, the rectangular area is determined as the table area, and the flow advances to step S210.

【0188】次に、変形セパレータの場合について説明
する。
Next, the case of a deformed separator will be described.

【0189】ステップS3804で、上下に伸ばした線
分のうち少なくとも一方が2回以上表枠と交わったか調
べる。上下共に2回以上交わらないので、ステップS3
106に進む。
In step S3804, it is determined whether at least one of the vertically extended lines intersects the table frame at least twice. Since the upper and lower sides do not intersect at least twice, step S3
Proceed to 106.

【0190】ステップS3106では、すべての注目点
について処理したか調べる。注目点3005、注目点3
006が残っているので、ステップS3103に戻る。
注目点3005、注目点3006に対しても注目点30
04と同様に処理を行う。図30で明らかな様に、すべ
ての注目点に対して処理が終わった時に、 (表領域確定注目点数)=0 となっている。すべての注目点について処理が終わった
ので、ステップS3107に進む。
In step S3106, it is checked whether all attention points have been processed. Attention point 3005, Attention point 3
Since 006 remains, the process returns to step S3103.
Attention point 305 for attention point 3005 and attention point 3006
Processing is performed in the same manner as in step S04. As is clear from FIG. 30, when the processing is completed for all the points of interest, (table area fixed number of points of interest) = 0. Since the processing has been completed for all the points of interest, the flow advances to step S3107.

【0191】ステップS3107では、(表領域確定注
目点数)が2以上かどうか調べる。2以上ではないので
ステップS3109に進む。
In step S3107, it is checked whether (table area fixed attention point) is 2 or more. Since it is not two or more, the process proceeds to step S3109.

【0192】ステップS3109では矩形領域を変形セ
パレータ領域と確定し、ステップS210に進む。
In step S3109, the rectangular area is determined as a deformed separator area, and the flow advances to step S210.

【0193】図39はステップS209の表領域の確定
処理において上下左右に伸ばす線分を複数取った例を詳
細に説明したフローチャートである。
FIG. 39 is a flowchart for explaining in detail an example in which a plurality of line segments extending in the up, down, left, and right directions are obtained in the table area determination processing in step S209.

【0194】図39の処理において、実施例2における
図34のフローチャートと同様の処理ステップは同じ番
号を付し、ここでの説明は省略する。
In the processing of FIG. 39, the same processing steps as those in the flowchart of FIG. 34 in the second embodiment are denoted by the same reference numerals, and description thereof will be omitted.

【0195】ステップS3903で、上下に伸ばした線
分のうち2回以上表枠と交わった線分があるか調べる。
すべての線分が2回以上表枠と交わっているので、ステ
ップS3904に進む。もし、2回以上交わる線分がな
ければ、ステップS3906に進む。
In step S3903, it is checked whether there is a line segment that intersects the table frame more than once among the line segments that are extended up and down.
Since all the line segments intersect the table frame twice or more, the process proceeds to step S3904. If there is no line segment that intersects at least twice, the process advances to step S3906.

【0196】ステップS3904で、左右に伸ばした線
分のうち2回以上表枠と交わった線分があるか調べる。
線分3211、線分3212、線分3213、線分32
14が2回以上表枠と交わっているので、ステップS3
905に進む。もし、2回以上交わる線分がなければ、
ステップS3906に進む。
In step S3904, it is checked whether there is a line segment that intersects the table frame more than once among the line segments extended to the left and right.
Line 3211, Line 3212, Line 3213, Line 32
Since step 14 intersects the table frame more than once, step S3
Proceed to 905. If there is no line segment that crosses more than once,
Proceed to step S3906.

【0197】ステップS3905では矩形領域を表領域
と確定し、ステップS210に進む。
In step S3905, the rectangular area is determined as a table area, and the flow advances to step S210.

【0198】次に変形セパレータの場合について説明す
る。
Next, the case of a deformed separator will be described.

【0199】ステップS3903で、上下に伸ばした線
分のうち2回以上表枠と交わった線分があるか調べる。
2回以上交わる線分がないので、ステップS3906に
進む。
In step S3903, it is checked whether or not there is a line segment that intersects the table frame at least twice among the line segments that are extended vertically.
Since there is no line segment that crosses twice or more, the process proceeds to step S3906.

【0200】ステップS3906では矩形領域を変形セ
パレータ領域と確定し、ステップS210に進む。
In step S3906, the rectangular area is determined as a deformed separator area, and the flow advances to step S210.

【0201】図40はステップS209の表領域の確定
処理を詳細に説明したフローチャートで、注目点を領域
矩形内の表枠以外に求めた(ステップS3601)例で
ある。
FIG. 40 is a flowchart for explaining in detail the table area determination processing in step S209, and is an example in which a point of interest is obtained in a region other than the table frame in the area rectangle (step S3601).

【0202】図40の処理において、実施例2の図28
のフローチャートに示した処理ステップと同様の処理ス
テップは同じ番号を付し、ここでの説明は省略する。
In the processing shown in FIG. 40, FIG.
The same processing steps as those shown in the flowchart of FIG.

【0203】本実施例では、表と判断された矩形領域内
の表枠に属さない1点の任意の注目点を取り、上下左右
方向に合計4本の線分を1本ずつ伸ばすことにする。ま
た、上下に伸ばした線分のうち少なくとも1本が2回以
上表枠と交わり、かつ左右に伸ばした線分のうち少なく
とも1本が2回以上表枠と交わるような注目点が1点以
上存在する場合、前記矩形領域を表であると確定し、そ
うでない場合を変形セパレータと確定する表確定手段と
する。
In this embodiment, an arbitrary point of interest that does not belong to the table frame in the rectangular area determined to be a table is taken, and a total of four line segments are extended one by one in the up, down, left, and right directions. . Also, at least one point of interest is such that at least one of the vertically extended lines intersects the table frame at least twice and at least one of the horizontally extended lines intersects the table frame at least twice. If it exists, the rectangular area is determined to be a table, and if not, a table determining means for determining a deformed separator.

【0204】ステップS4003で、上下に伸ばした線
分のうち少なくとも一方が2回以上表枠と交わったか調
べる。線分3506、線分3507共に2回以上表枠と
交わっているので、ステップS4004に進む。もし、
2回以上交わる線分がなければ、ステップS4006に
進む。
In step S4003, it is checked whether at least one of the vertically extended line segments intersects the table frame at least twice. Since both the line segments 3506 and 3507 intersect the table frame at least twice, the process advances to step S4004. if,
If there is no line segment that intersects at least twice, the process proceeds to step S4006.

【0205】ステップS4004では、左右に伸ばした
線分のうち少なくとも一方が2回以上表枠と交わったか
調べる。線分3507が2回以上表枠と交わっているの
で、ステップS4005に進む。もし、2回以上交わる
線分がなければ、ステップS4006に進む。
In step S4004, it is checked whether at least one of the line segments extended left and right intersects the table frame at least twice. Since the line segment 3507 intersects the table frame twice or more, the process proceeds to step S4005. If there is no line segment that crosses twice or more, the process proceeds to step S4006.

【0206】ステップS4005では矩形領域を表領域
と確定し、ステップS210に進む。
In step S4005, the rectangular area is determined as the table area, and the flow advances to step S210.

【0207】ステップS906に進んだ場合は矩形領域
を変形セパレータ領域と確定し、ステップS210に進
む。
If the processing has proceeded to step S906, the rectangular area is determined as a deformed separator area, and the processing proceeds to step S210.

【0208】尚、ステップS201の画像入力の際に多
値であるかどうかを判断して二値画像に変換する事で、
入力画像がカラー等の多値画像であっても領域分割処理
は可能である。
It should be noted that, at the time of image input in step S201, it is determined whether or not the image is multi-valued, and the image is converted into a binary image.
Even if the input image is a multi-valued image such as a color image, the region division processing can be performed.

【0209】また、ステップS201の画像入力の際、
入力画像の画素数が多大な処理時間を必要とするほど多
ければ、縦mドット横nドットの画像を1画素にする画
像間引き処理によって処理を高速化する事も可能であ
る。
When inputting an image in step S201,
If the number of pixels of the input image is large enough to require a great deal of processing time, the processing can be speeded up by image thinning-out processing in which an image of vertical m dots and horizontal n dots is made one pixel.

【0210】また、ステップS203のセパレータの検
出等において、セパレータの縦・横違いや、図形や表
等、求める時の閾値の違いなどで矩形ラベルを区別する
事で、更に詳細な領域属性の分類を行う事も可能であ
る。
Further, in the detection of the separator in step S203 and the like, the rectangular labels are distinguished based on the difference between the vertical and horizontal directions of the separator, the difference in the threshold for obtaining the figure or the table, etc. It is also possible to do.

【0211】また、ステップS209の表領域確定の
際、上下左右方向に伸ばす線分数を上下左右に均等配分
しなくとも、表領域確定処理は可能である。
When the table area is determined in step S209, the table area determination processing can be performed without equally distributing the number of line segments extending in the up, down, left, and right directions.

【0212】また、ステップS209の表領域確定の
際、注目点が複数ある場合に、上下左右方向に伸ばす線
分数を注目点毎に均等配分しなくとも、表領域確定処理
は可能である。
Further, when the table area is determined in step S209, if there are a plurality of points of interest, the table area determination processing can be performed without equally distributing the number of line segments extending in the up, down, left, and right directions for each point of interest.

【0213】また、ステップS210の最後の出力の際
に、各種領域の矩形データを参照して、必要な領域の画
像データのみを出力することも可能であり、記憶領域の
更なる縮小や、処理時間の更なる短縮がはかれる。
At the time of the last output in step S210, it is possible to output only the image data of the necessary area by referring to the rectangular data of various areas. The time can be further reduced.

【0214】[0214]

【発明の効果】以上説明した様に、本発明によれば、見
出しから放射線分を出し、見出しの上下左右のどれか3
方向以上に本文段落が存在すれば、その見出しを本文段
落より先の順位とすることにより、新聞記事等、見出し
が本文に囲まれてしまうことのある文書の場合でも正し
い順序付けが可能となり、本文の文章の流れを乱すこと
がないので、ユーザの修正の手間が不要となり、処理手
順の簡略化、処理時間の短縮ができるという効果があ
る。
As described above, according to the present invention, a radiation component is extracted from a heading and any one of the top, bottom, left and right of the heading is obtained.
If there is a body paragraph in more than the direction, the heading is placed before the body paragraph, so that even in the case of a document such as a newspaper article where the heading may be surrounded by the body, the correct ordering can be performed. Since the flow of the sentence is not disturbed, there is no need for the user to make corrections, and the processing procedure can be simplified and the processing time can be shortened.

【0215】[0215]

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例の画像処理装置の概略構成を示
すブロック図。
FIG. 1 is a block diagram illustrating a schematic configuration of an image processing apparatus according to an embodiment of the present invention.

【図2】実施例1の画像処理装置における画像処理を示
すフローチャート。
FIG. 2 is a flowchart illustrating image processing in the image processing apparatus according to the first embodiment.

【図3】実施例1のラベリング処理の例を示す図。FIG. 3 is a diagram illustrating an example of a labeling process according to the first embodiment.

【図4】実施例1の矩形データ構造を示す図。FIG. 4 is a diagram showing a rectangular data structure according to the first embodiment;

【図5】実施例1のセパレータ等検出部の処理を示すフ
ローチャート。
FIG. 5 is a flowchart illustrating processing of a separator and the like detection unit according to the first embodiment.

【図6】実施例1の矩形(領域)の属性の密度Dと面積
Sでの切り分けを示す図。
FIG. 6 is a diagram illustrating separation of attributes (density D and area S) of a rectangle (region) according to the first embodiment.

【図7】実施例1の組方向検出部の処理を示すフローチ
ャート。
FIG. 7 is a flowchart illustrating processing performed by a group direction detecting unit according to the first embodiment.

【図8】実施例1の段落の検出処理の例を示す図。FIG. 8 is a diagram illustrating an example of paragraph detection processing according to the first embodiment.

【図9】実施例1の見出し類検出部の処理を示すフロー
チャート。
FIG. 9 is a flowchart illustrating processing of a headings detection unit according to the first embodiment.

【図10】実施例1の順序付け部の処理を示すフローチ
ャート。
FIG. 10 is a flowchart illustrating processing of an ordering unit according to the first embodiment.

【図11】実施例1の順序付け部の本文に囲まれた見出
しに順序を付ける処理を示すフローチャート。
FIG. 11 is a flowchart illustrating a process of assigning an order to a headline surrounded by a text of the ordering unit according to the first embodiment.

【図12】実施例1の順序付け部の本文に囲まれた見出
しに順序を付ける処理を示すフローチャート。
FIG. 12 is a flowchart illustrating a process of assigning an order to a heading surrounded by a text in the ordering unit according to the first embodiment.

【図13】実施例1の順序付け部の本文に囲まれた見出
しに順序を付ける処理を示すフローチャート。
FIG. 13 is a flowchart illustrating a process of assigning an order to a headline surrounded by a text of the ordering unit according to the first embodiment.

【図14】実施例1の入力原稿を示す図。FIG. 14 is a diagram illustrating an input document according to the first embodiment.

【図15】実施例1の領域分割手段によって取り出され
た見出し・本文段落を示す図。
FIG. 15 is a diagram showing a heading / text paragraph extracted by the area dividing means according to the first embodiment.

【図16】実施例1の順序付け手段によって本文段落に
囲まれた見出しに順序を付けたところを示す図。
FIG. 16 is a diagram showing a state in which the ordering unit of the first embodiment has ordered the headings surrounded by the main text paragraphs.

【図17】実施例1の順序付け手段によって見出し及び
本文段落の一部に順序を付けたところを示す図。
FIG. 17 is a diagram showing a state in which a heading and a part of a text paragraph are ordered by the ordering means of the first embodiment.

【図18】実施例1の順序付け手段によってすべての見
出し及び本文段落に順序を付けたところを示す図。
FIG. 18 is a diagram showing a state where all headings and body paragraphs are ordered by the ordering means of the first embodiment.

【図19】実施例1の段落の重なり具合を示す図。FIG. 19 is a diagram illustrating how the paragraphs overlap in the first embodiment.

【図20】実施例1の注目見出しの上下左右方向に本文
段落が存在するか判定しているところを示す図。
FIG. 20 is a diagram illustrating a state in which it is determined whether a main body paragraph exists in the up, down, left, and right directions of the noted headline in the first embodiment.

【図21】実施例1の注目見出しの左上の角から高さの
α%、幅のβ%に位置する注目点を求めるところを示す
図。
FIG. 21 is a diagram illustrating a process of obtaining a point of interest located at α% of height and β% of width from the upper left corner of the target heading of Example 1.

【図22】実施例1の注目見出しの上下左右方向に本文
段落が存在するか判定しているところを示す図。
FIG. 22 is a diagram illustrating a state in which it is determined whether a main body paragraph exists in the up, down, left, and right directions of the noted headline in the first embodiment.

【図23】実施例1の垂直方向の段落の重なり具合を示
す図。
FIG. 23 is a diagram showing how the paragraphs in the vertical direction overlap in the first embodiment.

【図24】実施例1の水平方向の段落の重なり具合を示
す図。
FIG. 24 is a diagram showing how horizontal paragraphs overlap in the first embodiment.

【図25】実施例2、3の画像処理装置における画像処
理を示すフローチャート。
FIG. 25 is a flowchart illustrating image processing in the image processing apparatuses according to the second and third embodiments.

【図26】実施例2の表および表の領域を示す矩形を示
す図。
FIG. 26 is a diagram showing a table and a rectangle indicating a table area according to the second embodiment;

【図27】実施例2の変形セパレータ及び変形セパレー
タの領域を示す矩形を示す図。
FIG. 27 is a diagram illustrating a modified separator according to the second embodiment and rectangles indicating regions of the modified separator.

【図28】実施例2の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 28 is a flowchart illustrating a processing example of a table area determination unit according to the second embodiment.

【図29】実施例2の表および表の領域を示す矩形を示
す図。
FIG. 29 is a diagram showing a table and rectangles indicating table areas according to the second embodiment;

【図30】実施例2の変形セパレータおよび変形セパレ
ータの領域を示す矩形を示す図。
FIG. 30 is a view showing rectangles indicating regions of the deformed separator and the deformed separator according to the second embodiment.

【図31】実施例2の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 31 is a flowchart illustrating a processing example of a table area determining unit according to the second embodiment;

【図32】実施例2の表および表の領域を示す矩形を示
す図。
FIG. 32 is a diagram illustrating a table and rectangles indicating table areas according to the second embodiment;

【図33】実施例2の変形セパレータおよび変形セパレ
ータの領域を示す矩形を示す図。
FIG. 33 is a view showing rectangles indicating deformed separators and regions of deformed separators according to the second embodiment.

【図34】実施例2の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 34 is a flowchart illustrating a processing example of a table area determination unit according to the second embodiment.

【図35】実施例2の表および表の領域を示す矩形を示
す図。
FIG. 35 is a diagram illustrating a table and rectangles indicating table areas according to the second embodiment;

【図36】実施例2の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 36 is a flowchart illustrating a processing example of a table area determining unit according to the second embodiment;

【図37】実施例3の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 37 is a flowchart illustrating a processing example of a table area determining unit according to the third embodiment;

【図38】実施例3の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 38 is a flowchart illustrating a processing example of a table area determining unit according to the third embodiment;

【図39】実施例3の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 39 is a flowchart illustrating a processing example of a table area determining unit according to the third embodiment;

【図40】実施例3の表領域確定部の処理例を示すフロ
ーチャート。
FIG. 40 is a flowchart illustrating a processing example of a table area determination unit according to the third embodiment;

───────────────────────────────────────────────────── フロントページの続き (72)発明者 松本 昭浩 東京都大田区下丸子3丁目30番2号キヤ ノン株式会社内 (56)参考文献 特開 昭59−3692(JP,A) 特開 昭63−213093(JP,A) 特開 平2−122380(JP,A) 特開 平6−215184(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 H04N 1/40 ──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Akihiro Matsumoto 3-30-2 Shimomaruko, Ota-ku, Tokyo Inside Canon Inc. (56) References JP-A-59-3692 (JP, A) JP-A-63 -213093 (JP, A) JP-A-2-122380 (JP, A) JP-A-6-215184 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G06K 9/20 H04N 1/40

Claims (16)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力された画像情報において属性毎に分
割された領域内の所定の点から放射線分を伸ばし、 前記放射線分と前記入力された画像情報との関連情報を
検出し、 前記検出される関連情報にしたがって、前記分割された
他の領域に対する、前記所定の点を含む領域の順位を決
定することを特徴とする画像処理方法。
1. A method according to claim 1, further comprising: extending a radiation portion from a predetermined point in a region divided for each attribute in the input image information; detecting relevant information between the radiation portion and the input image information; And determining the order of the area including the predetermined point with respect to the other divided area according to related information.
【請求項2】 前記所定の点は、該領域の重心であるこ
とを特徴とする請求項1に記載の画像処理方法。
2. The image processing method according to claim 1, wherein the predetermined point is a center of gravity of the area.
【請求項3】 前記所定の点は、該領域の高さと幅にも
とづいて定められる点であることを特徴とする請求項1
に記載の画像処理方法。
3. The method according to claim 1, wherein the predetermined point is a point determined based on a height and a width of the area.
The image processing method according to 1.
【請求項4】 前記関連情報は、前記所定の点を含む領
域以外の前記分割された他の領域と前記放射線分との交
差情報を含むことを特徴とする請求項1乃至3のいずれ
かに記載の画像処理方法。
4. The apparatus according to claim 1, wherein the related information includes intersection information between the divided area other than the area including the predetermined point and the radiation. The image processing method described in the above.
【請求項5】 前記関連情報は、前記所定の点を含む領
域と前記放射線分と交差した領域との重なり情報を含む
ことを特徴とする請求項4に記載の画像処理方法。
5. The image processing method according to claim 4, wherein the related information includes overlapping information of a region including the predetermined point and a region that intersects with the radiation.
【請求項6】 前記関連情報は、前記所定の点を含む領
域と前記放射線分に交差した領域との重なり具合が所定
の閾値以上となる前記放射線分に交差した領域が存在す
る放射線分の数であることを特徴とする請求項5に記載
の画像処理方法。
6. The related information includes: a number of radiations in a region where the region intersects with the radiation component where the degree of overlap between the region including the predetermined point and the region that intersects the radiation component is equal to or greater than a predetermined threshold. The image processing method according to claim 5, wherein
【請求項7】 前記所定の点を含む領域は見出し領域で
あり、前記分割された他の領域は本文領域であることを
特徴とする請求項1に記載の画像処理方法。
7. The image processing method according to claim 1, wherein the area including the predetermined point is a heading area, and the other divided area is a text area.
【請求項8】 前記見出し領域の順位を決定した後、順
位が決定されなかった見出し領域と本文領域とを対象の
領域として、縦書き文章の場合、上から順に水平方向に
ほぼ同じ位置にある領域を同一グループとして、該グル
ープの中で右から順に各領域の順位を決定し、横書き文
章の場合、左から順に垂直方向にほぼ同じ位置にある領
域を同一グループとして、該グループの中で上から順に
各領域の順位を決定することを特徴とする請求項7に記
載の画像処理方法。
8. After the order of the heading areas is determined, in the case of a vertically written sentence, the heading area and the body area for which the order is not determined are located at substantially the same horizontal position in order from the top in the vertical direction. Assuming that the regions are the same group, the order of each region is determined in order from the right in the group, and in the case of horizontal writing, the regions located at approximately the same position in the vertical direction from the left are the same group and 8. The image processing method according to claim 7, wherein the order of each area is determined in order from.
【請求項9】 入力された画像情報において属性毎に分
割された領域内の所定の点から放射線分を伸ばす線分放
射手段と、 前記放射線分と前記入力された画像情報との関連情報を
検出する関連情報検出手段と、 前記検出される関連情報にしたがって、前記分割された
他の領域に対する、前記所定の点を含む領域の順位を決
定する領域順位決定手段とを有することを特徴とする画
像処理装置。
9. A line segment radiating means for extending a radiation component from a predetermined point in a region divided for each attribute in input image information, and detecting related information between the radiation component and the input image information. A related information detecting unit that determines the order of an area including the predetermined point with respect to the other divided area according to the detected related information. Processing equipment.
【請求項10】 前記所定の点は、該領域の重心である
ことを特徴とする請求項9に記載の画像処理装置。
10. The image processing apparatus according to claim 9, wherein the predetermined point is a center of gravity of the area.
【請求項11】 前記所定の点は、該領域の高さと幅に
もとづいて定められる点であることを特徴とする請求項
9に記載の画像処理装置。
11. The image processing apparatus according to claim 9, wherein the predetermined point is a point determined based on a height and a width of the area.
【請求項12】 前記関連情報は、前記所定の点を含む
領域以外の前記分割された他の領域と前記放射線分との
交差情報を含むことを特徴とする請求項9乃至11のい
ずれかに記載の画像処理装置。
12. The apparatus according to claim 9, wherein the related information includes intersection information between the divided area other than the area including the predetermined point and the radiation. An image processing apparatus as described in the above.
【請求項13】 前記関連情報は、前記所定の点を含む
領域と前記放射線分と交差した領域との重なり情報を含
むことを特徴とする請求項12に記載の画像処理装置。
13. The image processing apparatus according to claim 12, wherein the related information includes overlap information of a region including the predetermined point and a region that intersects with the radiation.
【請求項14】 前記関連情報は、前記所定の点を含む
領域と前記放射線分に交差した領域との重なり具合が所
定の閾値以上となる前記放射線分に交差した領域が存在
する放射線分の数であることを特徴とする請求項13に
記載の画像処理装置。
14. The related information includes: a number of radiations in an area where the area intersects with the radiation where the degree of overlap between the area including the predetermined point and the area intersecting the radiation is equal to or greater than a predetermined threshold. The image processing apparatus according to claim 13, wherein:
【請求項15】 前記所定の点を含む領域は見出し領域
であり、前記分割された他の領域は本文領域であること
を特徴とする請求項9に記載の画像処理装置。
15. The apparatus according to claim 9, wherein the area including the predetermined point is a heading area, and the other divided area is a text area.
【請求項16】 前記領域順位決定手段は、前記見出し
領域の順位を決定した後、更に、順位が決定されなかっ
た見出し領域と本文領域とを対象の領域として、縦書き
文章の場合、上から順に水平方向にほぼ同じ位置にある
領域を同一グループとして、該グループの中で右から順
に各領域の順位を決定し、横書き文章の場合、左から順
に垂直方向にほぼ同じ位置にある領域を同一グループと
して、該グループの中で上から順に各領域の順位を決定
することを特徴とする請求項15に記載の画像処理装
置。
16. The area order determination means, after determining the order of the heading area, further sets a heading area and a body area whose order is not determined as a target area, and in the case of a vertically written sentence, from the top. Regions located at substantially the same position in the horizontal direction in order are determined to be the same group, and the order of each region is determined in order from the right in the group. 16. The image processing apparatus according to claim 15, wherein the order of each area is determined as a group from the top in the group.
JP00269693A 1993-01-11 1993-01-11 Image processing method and apparatus Expired - Fee Related JP3278221B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP00269693A JP3278221B2 (en) 1993-01-11 1993-01-11 Image processing method and apparatus
EP98203750A EP0898240B1 (en) 1993-01-11 1993-12-31 Image processing method and apparatus
DE69332750T DE69332750T2 (en) 1993-01-11 1993-12-31 Image processing apparatus and method
EP93310637A EP0606780B1 (en) 1993-01-11 1993-12-31 Image processing method and apparatus
DE69330423T DE69330423T2 (en) 1993-01-11 1993-12-31 Image processing apparatus and method
US08/742,222 US6125204A (en) 1993-01-11 1996-10-23 Judging a logical relation between a plurality of areas based upon the physical relation therebetween

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00269693A JP3278221B2 (en) 1993-01-11 1993-01-11 Image processing method and apparatus

Publications (2)

Publication Number Publication Date
JPH06208651A JPH06208651A (en) 1994-07-26
JP3278221B2 true JP3278221B2 (en) 2002-04-30

Family

ID=11536447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00269693A Expired - Fee Related JP3278221B2 (en) 1993-01-11 1993-01-11 Image processing method and apparatus

Country Status (1)

Country Link
JP (1) JP3278221B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3425834B2 (en) * 1995-09-06 2003-07-14 富士通株式会社 Title extraction apparatus and method from document image

Also Published As

Publication number Publication date
JPH06208651A (en) 1994-07-26

Similar Documents

Publication Publication Date Title
US5907631A (en) Document image processing method and system having function of determining body text region reading order
US5784487A (en) System for document layout analysis
EP0854433B1 (en) Caption and photo extraction from scanned document images
US7627148B2 (en) Image data processing apparatus and method, and image data processing program
JP7132654B2 (en) LAYOUT ANALYSIS METHOD, READING AID DEVICE, CIRCUIT AND MEDIUM
EP0381773B1 (en) Character recognition apparatus
JPH10240220A (en) Information processing equipment having annotation display function
EP0692767B1 (en) Image processing apparatus and method
JPH08212298A (en) Automatic judging device for document direction and automatic correcting device for document direction
US6125204A (en) Judging a logical relation between a plurality of areas based upon the physical relation therebetween
JPH05500129A (en) Line-by-line segmentation and thresholding for optical character recognition
JP2002042143A (en) Frame recognition device and recording medium
JP3278221B2 (en) Image processing method and apparatus
JP6322086B2 (en) Display control device, display device, program, recording medium
JPH06208625A (en) Method and device for processing image
WO2021157213A1 (en) Image processing device and image processing method
JP3787377B2 (en) Document orientation determination method and apparatus, and character recognition method and apparatus
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JPH0830725A (en) Device and method for processing image
CN115497115B (en) Deep learning-based header and footer detection method and system
JPH09269970A (en) Method for recognizing character and its device
JPH09269944A (en) Picture processor and method therefor
JP3135201B2 (en) Method and apparatus for extracting human mouth region
JP3406942B2 (en) Image processing apparatus and method
JPH03268181A (en) Document reader

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080215

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090215

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100215

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100215

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120215

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees