JPH1139499A - Document processing method - Google Patents

Document processing method

Info

Publication number
JPH1139499A
JPH1139499A JP9208353A JP20835397A JPH1139499A JP H1139499 A JPH1139499 A JP H1139499A JP 9208353 A JP9208353 A JP 9208353A JP 20835397 A JP20835397 A JP 20835397A JP H1139499 A JPH1139499 A JP H1139499A
Authority
JP
Japan
Prior art keywords
document
straight
linear
component elements
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9208353A
Other languages
Japanese (ja)
Inventor
Hiroaki Takagi
宏明 高城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP9208353A priority Critical patent/JPH1139499A/en
Publication of JPH1139499A publication Critical patent/JPH1139499A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To decrease the frequency of processing for finding an overlap and to shorten the process time by making elements, classified by straight-line patterns, among component elements hierarchical and obtaining final hierarchy information from the component elements and straight-line patterns. SOLUTION: A straight-line pattern decision part 102 sends straight-line pattern information on component elements to an attribute decision part 103 to extract specific properties of the straight-line patterns by checking the straight-line directions. An outline generation part 203 generates outline information on the component elements and an overlap decision part 106 checks the overlap states of the respective elements. Then a straight-line pattern extraction part 107 for division extracts a straight-line pattern for area division by referring to the overlaps of arbitrary attributes and a length rate comparison part 110 compares the length rates of the straight-line patterns; and an object area division part 112 further divides the object area and an object area selection part 113 makes a choice. Lastly, a hierarchy integration part 115 integrates hierarchy information on the component elements and information on the straight-line pattern for division.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書を構成する部
品要素を階層的な構造に変換して、文書の作成および編
集を行う文書処理方法に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a document processing method for creating and editing a document by converting component elements constituting the document into a hierarchical structure.

【0002】[0002]

【従来の技術】パーソナルコンピュータの性能向上や低
価格化等に伴い、パーソナルコンピュータに文書作成用
のアプリケーションソフトウェアを組み込み、その文書
作成用のアプリケーションソフトウェアにより文書作成
を行うことが幅広く普及してきている。
2. Description of the Related Art With the improvement of performance and cost reduction of personal computers, it has become widespread to incorporate application software for document creation into personal computers and to create documents using the application software for document creation.

【0003】しかしながら、文書作成用のアプリケーシ
ョンソフトウェアの使用方法を熟知していないアマチュ
アレベルの一般ユーザにとっては、パーソナルコンピュ
ータの操作およびアプリケーションソフトウェアによる
文書作成の操作は難しくて時間がかかるものである。そ
れだけでなく、品質よく作成できないことも多い。
However, for an amateur-level general user who is not familiar with how to use application software for document creation, operation of a personal computer and operation of document creation by application software are difficult and time-consuming. Not only that, they often cannot be created with good quality.

【0004】このような文書作成用のアプリケーション
ソフトウェアを利用する場合においては、文書作成の効
率をあげるために、過去に作成された文書を参照または
再利用することが多くある。このようなとき、ユーザは
文書の中の任意の部分を再利用することになるが、その
場合、文書を構成する文書の要素が構造的になっていれ
ば使いやすくなる。
In the case of using such application software for document creation, in order to increase the efficiency of document creation, documents created in the past are often referred to or reused. In such a case, the user reuses an arbitrary part of the document. In this case, if the elements of the document constituting the document are structured, it becomes easy to use.

【0005】文書を構造的に扱うという考え方は既に一
般化しつつある。例えば、特開平7−104729号公
報に記されているように、文書を章や節などのまとまり
により構造化して、それらを文書の要素として任意の段
階で表示して編集できる方法がある。このような編集の
方法を用いれば、文書は再利用しやすくなるが、構造化
する情報そのものは、操作者が文書を作成するときに、
指示して生成しなければならない。
[0005] The idea of handling documents structurally is already becoming popular. For example, as described in Japanese Patent Application Laid-Open No. 7-104729, there is a method in which a document is structured by a set of chapters and sections, and these can be displayed and edited at arbitrary stages as document elements. With such an editing method, the document can be easily reused, but the information to be structured is not used when the operator creates the document.
Must be generated upon instruction.

【0006】そこで、本発明者らは、先に特願平8−2
23270号として、文書の構成要素を自動的に階層化
して文書編集を行う文書編集装置を提案した。この文書
編集装置においては、文書の構成要素を2次元の空間的
な位置の重なりによって階層化し、文書編集に利用でき
るようにしている。
Accordingly, the present inventors have previously reported in Japanese Patent Application No. Hei.
No. 23270 proposes a document editing apparatus that automatically hierarchizes document components to edit a document. In this document editing apparatus, document components are hierarchized by overlapping two-dimensional spatial positions, and can be used for document editing.

【0007】[0007]

【発明が解決しようとする課題】ところで、先に提案し
た文書編集装置による文書の構成要素の階層化の方法で
は、文書の構成要素の間の重なり状態を調べるのに、全
ての構成要素の間で総当たり的に調べている。このた
め、例えば、構成要素の数がN個であれば、重なりを調
べる回数は、N(N−1)/2回となる。このように計
算の回数は2乗で増加していくので、構成要素の数が多
くなるにしたがって、その処理には、非常に多くの時間
がかかる。このため、この文書編集装置を利用する場
合、リアルタイムでの編集操作時に支障をきたすという
問題に発展してきている。これは、早急に解決されるべ
き課題である。
By the way, according to the previously proposed method of layering document components by the document editing apparatus, it is necessary to check the overlapping state among the document components by examining all the components. The brute force investigation. Therefore, for example, if the number of components is N, the number of times of checking the overlap is N (N-1) / 2. As described above, the number of calculations increases by the square, and accordingly, as the number of components increases, the processing takes a very long time. For this reason, when using this document editing apparatus, it has developed into a problem that it hinders the editing operation in real time. This is an issue that needs to be resolved immediately.

【0008】本発明は、このような問題を解決するため
になされたものであり、本発明の目的は、文書の構成要
素をそれらの重なりにより自動的に階層化する場合に、
重なりを求める処理の回数を少しでも削減して、処理時
間を短縮した文書処理方法を提供することにある。
The present invention has been made to solve such a problem, and an object of the present invention is to provide a method for automatically hierarchizing the components of a document by their overlap.
An object of the present invention is to provide a document processing method in which the number of times of processing for obtaining an overlap is reduced as much as possible and the processing time is reduced.

【0009】[0009]

【課題を解決するための手段】上記のような目的を達成
するため、本発明の文書処理方法においては、文書を構
成する部品要素を階層的な構造に変換して文書編集を行
う場合に、部品要素の中の直線図形によって、それ以外
の部品要素を分類し、分類された部品要素を階層化し、
階層化された部品要素および分類に用いた前記直線図形
から最終的な階層情報を得ることを特徴とする。
In order to achieve the above object, in the document processing method of the present invention, when a document component is converted to a hierarchical structure and a document is edited, The other part elements are classified by the linear figure in the part element, the classified part elements are hierarchized,
The present invention is characterized in that final hierarchical information is obtained from hierarchized component elements and the linear figures used for classification.

【0010】ここで部品要素の分類に用いるの直線図形
は、例えば、2次元の空間的な位置の重なりのない水平
方向または垂直方向の直線図形であり、また、この直線
図形は、属性情報を有する直線図形であり、各々の直線
図形が属性情報により識別されることを特徴とする。
The linear figure used for classifying the component elements is, for example, a horizontal or vertical linear figure having no two-dimensional spatial position overlap, and this linear figure has attribute information. Wherein each of the linear figures is identified by attribute information.

【0011】また、部品要素を分類する分類方法とし
て、分類に用いる直線図形をその長さの文書全体の大き
さに対する割合の大きさの順番に処理する第1の処理方
法と、分類にあわせ直線図形の分類領域の大きさに対す
る割合を更新しながら大きさの順番に処理する第2の処
理方法とのいずれかの処理方法により分類することを特
徴とする。
As a classification method for classifying component elements, a first processing method for processing linear figures used for classification in the order of the ratio of the length to the size of the entire document, The graphics are classified by any one of the second processing method and the second processing method in which the processing is performed in the order of the size while updating the ratio of the figure to the size of the classification area.

【0012】このような様々な特徴を備えることによ
り、本発明による文書処理方法においては、文書を構成
する各々の部品要素を2次元の空間的な位置の重なりに
よって階層化する場合、部品要素の中から直線図形を抽
出し、それらの中から所定の属性を有する直線図形を抽
出し、更に、それらの中から水平垂直方向の直線図形を
抽出する。そして、更に、その中からその直線図形以外
の部品要素と、2次元の空間的な位置で重なりのない直
線図形を抽出する。そして、抽出された直線図形によっ
て、それ以外の部品要素を分類し、分類された部品要素
の構造を階層化する。そして、階層化された部品要素の
構造に分類に用いた直線図形を加えて、最終的な階層情
報を得る。
With such various features, in the document processing method according to the present invention, when each component element constituting a document is hierarchized by two-dimensional spatial position overlap, A linear figure is extracted from among them, a linear figure having a predetermined attribute is extracted from them, and a horizontal / vertical direction linear figure is further extracted from them. Then, a linear figure which does not overlap with a component element other than the linear figure at a two-dimensional spatial position is further extracted from among them. Then, the other component elements are classified based on the extracted linear graphic, and the structure of the classified component elements is hierarchized. Then, the linear figure used for classification is added to the hierarchized component element structure to obtain final hierarchical information.

【0013】[0013]

【発明の実施の形態】以下、本発明を実施する場合の形
態について、具体的に図面を参照して説明する。図1お
よび図2は、本発明による文書処理方法を一態様で実施
する文書処理装置の構成を示すブロック図である。図1
に、文書を構成する部品要素を階層化する処理部分のブ
ロック図を示し、図2に、文書処理全般を行う処理部分
のブロック図を示している。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 and FIG. 2 are block diagrams showing the configuration of a document processing apparatus that implements a document processing method according to one embodiment of the present invention. FIG.
FIG. 2 shows a block diagram of a processing portion for hierarchizing the component elements constituting the document, and FIG. 2 shows a block diagram of a processing portion for performing overall document processing.

【0014】図1および図2のブロック図において、1
01は描画順序判定部、102は直線図形判定部、10
3は属性判定部、104は水平垂直直線図形判定部、1
05は輪郭生成部、106は重なり判定部、107は分
割用直線図形抽出部、108は長さ比較部、109は長
さ割合算出部、110は長さ割合比較部、111は部品
要素位置判定部、112は対象領域分割部、113は対
象領域選出部、114は重なり編成部、115は階層統
合部、116は割合算出モード記憶部、201は情報入
力部、202は操作情報記憶部、203は文書情報記憶
部、204は文書情報編集部、205は文書情報表示
部、206は部品要素階層化部、207は階層情報記憶
部、208は階層情報表示部である。
In the block diagrams of FIG. 1 and FIG.
01 is a drawing order determination unit, 102 is a linear figure determination unit, 10
3 is an attribute determining unit, 104 is a horizontal / vertical straight line graphic determining unit, 1
05 is a contour generation unit, 106 is an overlap judgment unit, 107 is a division straight line figure extraction unit, 108 is a length comparison unit, 109 is a length ratio calculation unit, 110 is a length ratio comparison unit, and 111 is a component element position judgment Unit, 112 is a target region dividing unit, 113 is a target region selecting unit, 114 is an overlapping knitting unit, 115 is a hierarchy integrating unit, 116 is a ratio calculation mode storage unit, 201 is an information input unit, 202 is an operation information storage unit, 203 Is a document information storage unit, 204 is a document information editing unit, 205 is a document information display unit, 206 is a component element hierarchy unit, 207 is a hierarchy information storage unit, and 208 is a hierarchy information display unit.

【0015】まず、図2のブロック図を参照して、文書
の入力作成から部品要素の階層化までを行う文書処理全
般の方法について説明する。文書を構成する部品要素を
階層化する方法については、図1を参照して後述する。
First, with reference to the block diagram of FIG. 2, a description will be given of a general method of document processing from input creation of a document to hierarchization of component elements. A method of hierarchizing the parts constituting the document will be described later with reference to FIG.

【0016】文書処理全般を行う文書処理装置は、図2
に示すように、情報入力部201、操作情報記憶部20
2、文書情報記憶部203、文書情報編集部204、文
書情報表示部205、部品要素階層化部206、階層情
報記憶部207、および階層情報表示部208から構成
されている。
FIG. 2 is a block diagram showing a document processing apparatus for carrying out overall document processing.
As shown in the figure, the information input unit 201, the operation information storage unit 20
2, a document information storage unit 203, a document information editing unit 204, a document information display unit 205, a component element layering unit 206, a layer information storage unit 207, and a layer information display unit 208.

【0017】このような構成の文書処理装置において、
操作者による操作の操作情報や文書の素材となるような
文書要素の情報は、情報入力部201から取り込まれ
る。情報入力部201は、取り込んだ操作情報を、操作
情報記憶部202に送り、そこで記憶する。また、情報
入力部201から取り込まれた文書の素材や編集された
文書の情報は、文書情報記憶部203に送られ、そこで
記憶される。
In the document processing apparatus having such a configuration,
The operation information of the operation by the operator and the information of the document element which becomes the material of the document are taken in from the information input unit 201. The information input unit 201 sends the fetched operation information to the operation information storage unit 202 and stores it there. Further, the material of the document and the information of the edited document which are taken in from the information input unit 201 are sent to the document information storage unit 203 and stored therein.

【0018】文書作成のための編集処理は、文書情報編
集部204において行われる。作成した編集文書の表示
は、文書情報表示部205によって表示される。ここで
の文書を構成する部品要素を階層化する処理は、部品要
素階層化部206により行われる。また、階層化した文
書の部品要素の階層化情報は、階層情報記憶部207に
おいて記憶され、階層化した文書の情報の表示は、階層
情報表示部208により表示される。
An editing process for creating a document is performed in the document information editing unit 204. The display of the created edited document is displayed by the document information display unit 205. The process of hierarchizing the component elements constituting the document here is performed by the component element hierarchy unit 206. The hierarchical information of the component elements of the hierarchical document is stored in the hierarchical information storage unit 207, and the information of the hierarchical document is displayed by the hierarchical information display unit 208.

【0019】次に、簡単な文書の一例を取り上げて、文
書を構成する部品要素を階層化する処理方法について説
明する。図3は、複数の部品要素により構成される文書
の一例を示す図であり、また、図4は、図3に示す文書
を構成する各々の部品要素のリストを示す図ある。
Next, an example of a simple document will be described, and a processing method of hierarchizing the component elements constituting the document will be described. FIG. 3 is a diagram showing an example of a document composed of a plurality of component elements, and FIG. 4 is a diagram showing a list of each component element constituting the document shown in FIG.

【0020】ここでの文書は、例えば、図3に示すよう
に、文字や画像や図形からなる。これらを最も細かな単
位で扱うときのものを、ここでは部品要素としている。
例えば、図形なら直線や四角形などが部品要素となる。
図3に示す文書の例については、文書を構成する各々の
部品要素は、それぞれが、例えば、作成順に、図4に示
すように、部品番号41が付けられて、部品内容42が
部品要素リスト40に登録される。ここでの部品番号4
1とは、部品要素を入力して作成したときに、システム
(文書処理システム)から与えられる固有の番号であ
り、O1、O2、…のように与えられる。この文書の例
では、13個の部品要素から文書が構成されている。こ
の文書の部品要素の情報は、文書情報記憶部203に記
憶される。
The document here is composed of, for example, characters, images and figures as shown in FIG. Here, when these are handled in the finest unit, they are referred to as component elements.
For example, in the case of a figure, a straight line or a square is a component element.
In the example of the document shown in FIG. 3, each of the component elements constituting the document is assigned a component number 41 as shown in FIG. Registered at 40. Part number 4 here
1 is a unique number given by a system (document processing system) when a component element is input and created, and is given as O1, O2,. In the example of this document, the document is composed of 13 component elements. Information on the component elements of this document is stored in the document information storage unit 203.

【0021】次に、このように複数の部品要素で構成さ
れている文書において、その文書を構成する部品要素を
階層化する処理部分について説明する。この処理部分の
構成は、図1のブロック図に示されている。図1を参照
して説明する。前述したように、文書情報記憶部203
には、文書の素材や編集された文書の情報が記憶されて
いるので、その文書の情報から文書を構成する部品要素
を階層化する処理を行う。まず、描画順序判定部101
が、文書の情報を取り出し、部品要素の描画順序を調べ
る。直線図形判定部102は、部品要素が直線図形であ
るか否かを調べて抽出し、その情報を属性判定部103
に送出する。属性判定部103では、抽出された直線図
形の形状が所定の属性であるか(直線が矢印でないか)
否かを調べて抽出する。そして、水平垂直直線図形判定
部104により、抽出された所定の属性の直線図形が水
平方向または垂直方向の直線であるか否かを調べて抽出
する。
Next, in a document constituted by a plurality of component elements as described above, a processing portion for hierarchizing the component elements constituting the document will be described. The configuration of this processing part is shown in the block diagram of FIG. This will be described with reference to FIG. As described above, the document information storage unit 203
Stores information of the material of the document and information of the edited document, and performs a process of hierarchizing the component elements constituting the document from the information of the document. First, the drawing order determination unit 101
Extracts the document information and checks the drawing order of the component elements. The straight-line figure determining unit 102 checks whether or not the component element is a straight-line figure and extracts the information.
To send to. The attribute determination unit 103 determines whether the shape of the extracted linear graphic has a predetermined attribute (whether the straight line is not an arrow).
Check for and extract. Then, the horizontal / vertical straight-line figure determination unit 104 checks whether or not the extracted straight-line figure having a predetermined attribute is a straight line in the horizontal direction or the vertical direction, and extracts it.

【0022】一方、輪郭生成部105は、文書情報記憶
部203の文書情報から、部品要素の輪郭の情報を求め
ており、重なり判定部106において、これらの情報を
総合して、各部品要素の重なり状態を調べる。つまり、
部品要素の間の重なりを調べる。そして、分割用直線図
形抽出部107が、抽出された任意の属性の水平垂直方
向の直線図形の中から重なり判定の結果を参考にして、
領域の分割に用いる直線図形を抽出する。分割用直線図
形抽出部107により抽出された直線図形は、領域分割
のために使用する。このため、長さ比較部108によ
り、分割用直線図形の長さを比較し、また、長さ割合算
出部109により、分割用直線図形の対象領域に対する
大きさの割合を求める。
On the other hand, the contour generation unit 105 obtains the information on the outline of the component element from the document information in the document information storage unit 203. Examine the overlap condition. That is,
Check the overlap between the component elements. Then, the dividing straight-line figure extracting unit 107 refers to the result of the overlap determination from the extracted horizontal and vertical straight-line figures of any attribute, and
A linear figure used for dividing a region is extracted. The straight-line figure extracted by the straight-line figure extracting unit 107 is used for area division. For this reason, the length comparing unit 108 compares the lengths of the dividing linear figures, and the length ratio calculating unit 109 calculates the ratio of the size of the dividing linear figure to the target area.

【0023】長さ割合比較部110では、分割用直線図
形の対象領域に対する大きさの割合を比較し、部品要素
位置判定部111が、分割用直線図形に対する部品要素
の位置の種類を調べる。そして、対象領域分割部112
により、対象領域を分割用直線により更に分割する。分
割された対象領域は、対象領域選出部113により、そ
の対象領域が選出される。これまでの処理により、部品
要素を階層化するための情報が作成できたので、重なり
編成部114によって、重なりの判定の結果から階層情
報を生成する。
The length ratio comparing unit 110 compares the ratio of the size of the dividing linear figure with respect to the target area, and the component element position determining unit 111 checks the type of the position of the component element with respect to the dividing linear figure. Then, the target area dividing unit 112
, The target area is further divided by the dividing straight line. The target region is selected by the target region selection unit 113 for the divided target region. Since the information for hierarchizing the component elements has been created by the processing so far, the overlap knitting unit 114 generates the hierarchy information from the result of the overlap determination.

【0024】そして、最終的に、階層統合部115によ
って、部品要素の階層情報と分割用の直線図形の情報を
合わせる処理を行う。なお、ここでの割合算出モード記
憶部116は、分割用直線図形の長さ割合の順番に処理
するのか、あるいは更新しながら処理するのかその処理
方法を決める制御情報を記憶しており、この制御情報に
したがって、処理が進められる。
Finally, the hierarchical integration unit 115 performs a process of matching the hierarchical information of the component elements with the information of the linear graphic for division. Here, the ratio calculation mode storage unit 116 stores control information for determining whether to process in the order of the length ratio of the dividing straight figure or to perform processing while updating, and to control the processing. Processing proceeds according to the information.

【0025】このような処理部の処理動作によって、文
書を構成する部品要素の階層情報が作成されるが、この
処理について、前述した文書の例の部品要素を階層化す
る場合の処理について、フローチャートにより具体的に
説明する。
The hierarchical information of the component elements constituting the document is created by the processing operation of such a processing unit. This will be described more specifically.

【0026】図5は、文書を構成する部品要素を階層化
する処理を示すフローチャートである。図5を参照して
説明する。処理を開始すると、まず、ステップ501に
おいて、輪郭生成部105により全ての部品要素の輪郭
情報を求める処理を行う。輪郭情報は、任意形状を表現
する折れ線のベクトル情報とするが、外接矩形の情報で
も構わない。ここでは特に限定はしないが、精度を重視
する場合には、前者の方を利用し、処理のしやすさや速
度を重視する場合には、後者の方を利用すればよい。次
に、ステップ502において、描画順序判定部101に
より、全ての部品要素の描画順序を調べる。次に、ステ
ップ503において、部品要素を分割するために用いる
直線図形(分割用直線図形)を調べる処理(図6)を行
う。ここでの図3に示す文書例においては、部品番号O
3の直線1と、部品番号O6の直線2と、部品番号O8
の直線3と、部品番号O10の直線4と、部品番号O1
2の直線5とが調べられて抽出される。
FIG. 5 is a flowchart showing a process for hierarchizing the component elements constituting the document. This will be described with reference to FIG. When the process is started, first, in step 501, a process of obtaining the contour information of all the component elements by the contour generating unit 105 is performed. The contour information is vector information of a polygonal line representing an arbitrary shape, but may be information of a circumscribed rectangle. Although not particularly limited here, the former is used when importance is placed on accuracy, and the latter is used when importance is placed on ease of processing and speed. Next, in step 502, the drawing order determination unit 101 checks the drawing order of all component elements. Next, in step 503, a process (FIG. 6) for examining a linear graphic (linear graphic for division) used for dividing the component element is performed. Here, in the document example shown in FIG.
3, a straight line 2 of the part number O6, and a straight line 2 of the part number O8.
, A straight line 4 of a part number O10, and a straight line 4 of a part number O1.
The two straight lines 5 are examined and extracted.

【0027】次に、ステップ504においては、前の処
理のステップ503による調査結果を基づいて、抽出さ
れた直線図形が、全ての部品要素の中で分割用の直線図
形として利用可能であるか否かを判定する。この判定の
結果、次のステップ505の判定処理で、ステップ50
4の判定基準に合う分割用の直線図形が有るか否かの判
定を行う。分割用の直線図形がある場合には、ステップ
506に進み、無い場合にはステップ512に進む。
Next, at step 504, based on the result of the check at step 503 of the previous process, it is determined whether or not the extracted linear graphic can be used as a linear graphic for division among all the component elements. Is determined. As a result of this determination, in the next determination processing of step 505, step 50
It is determined whether or not there is a straight line graphic for division that meets the determination criterion of No. 4. If there is a linear figure for division, the process proceeds to step 506; otherwise, the process proceeds to step 512.

【0028】次のステップ506においては、割合算出
モード記憶部116から分割用直線図形の利用の仕方を
表す割合算出モードの情報を読み出す。ここでの割合算
出モードには、分割用直線図形を利用するときに、文書
の大きさに対する分割用直線図形の長さの割合を順番に
して処理するモードと、文書を分割しながら分割された
領域に対する分割用直線図形の長さの割合を更新しなが
ら順番に処理するモードとの2つのモードがある。
In the next step 506, information on the ratio calculation mode representing the way of using the dividing linear figure is read from the ratio calculation mode storage section 116. The ratio calculation mode includes a mode in which the ratio of the length of the dividing linear figure to the size of the document is processed in order when using the dividing linear figure, and a mode in which the document is divided while being divided. There are two modes: a mode in which processing is performed in order while updating the ratio of the length of the dividing linear figure to the area.

【0029】次に、ステップ507において、前のステ
ップ506の処理により読み出した割合算出モードの情
報を判定する。割合算出モードが、長さの割合を順番に
して処理するモードの場合には、ステップ508に進
み、長さ割合順序に従う分割用直線図形による部品要素
の分類処理を行う。ステップ507の判定処理で、割合
算出モードの情報が、長さの割合を更新しながら順番に
処理するモードの場合には、ステップ509に進み、長
さ割合順序更新に従う分割用直線図形による部品要素の
分類処理を行う。
Next, in step 507, the information of the ratio calculation mode read out by the processing of the previous step 506 is determined. If the ratio calculation mode is a mode in which processing is performed in order of length ratios, the process proceeds to step 508, in which component element classification processing is performed using a dividing linear figure in accordance with the length ratio order. In the determination process of step 507, if the information of the ratio calculation mode is a mode of sequentially processing while updating the length ratio, the process proceeds to step 509, where the component element using the dividing linear figure according to the length ratio order update. Is performed.

【0030】そして、次に、ステップ510において、
重なり判定部106により、ステップ508またはステ
ップ509の処理により分類された部品要素に対して、
それらの間で2次元の空間的な位置における重なりの有
無を調べ、描画順序調査部101により調べた描画順序
の結果をもあわせて部品要素を階層化する。そして、次
に、ステップ511において、階層統合部115にて、
ステップ510で得られた部品要素の階層化結果に分割
用直線図形の情報を統合して最終的な階層化情報を得し
て、処理を終了する。
Then, in step 510,
For the component elements classified by the processing of step 508 or step 509 by the overlap determination unit 106,
The presence or absence of an overlap in the two-dimensional spatial position is checked between them, and the component elements are hierarchized together with the result of the drawing order checked by the drawing order checking unit 101. Then, next, in step 511, the hierarchical integration unit 115
The information of the linear figure for division is integrated with the hierarchical result of the component elements obtained in step 510 to obtain final hierarchical information, and the process is terminated.

【0031】先のステップ505の判定処理において、
部品要素の中で、分割用の直線図形とできる直線図形が
ない場合には、ステップ512に進み、ステップ512
において、通常の階層化処理を行う。このすなわち、重
なり判定部106により、全ての部品要素の間で2次元
の空間的な位置における重なりの有無を調べ、描画順序
判定部101にて調べた描画順序の結果をもあわせて部
品要素を階層化する。ステップ510での処理とステッ
プ512での処理の内容は同じである。
In the determination processing of the previous step 505,
If there is no linear graphic that can be used as a dividing linear graphic among the component elements, the process proceeds to step 512 and proceeds to step 512.
, A normal layering process is performed. In other words, the overlap determination unit 106 checks whether or not there is an overlap in a two-dimensional spatial position among all the component elements, and determines the component elements based on the result of the drawing order checked by the drawing order determination unit 101. Hierarchy. The contents of the processing in step 510 and the processing in step 512 are the same.

【0032】このステップ512での通常の階層化処理
は、本発明においては本質的ではないため、詳細な説明
は省略するが、その概略を、図3に示す文書の例を参照
して具体例で説明する。
The ordinary layering process in step 512 is not essential in the present invention, so a detailed description will be omitted, but its outline will be described with reference to a document example shown in FIG. Will be described.

【0033】図3に示す文書例において、文書を構成す
る13個の部品要素の中で、重なりが発生するところを
調べると、部品番号O4の四角形1の枠と、部品番号O
5の文字2の文字群と、部品番号O9の楕円1と、部品
番号O10の斜め方向の直線4と、部品番号O11の三
角形1である。これらと別の部品要素は、それぞれに分
類されるため、ここでの処理には関係しない。
In the example of the document shown in FIG. 3, when the occurrence of overlap among the 13 component elements constituting the document is examined, the frame of the rectangle 1 of the component number O4 and the component number O
5, a character group of a character 2 of 5, an ellipse 1 of a part number O9, a straight line 4 in an oblique direction of a part number O10, and a triangle 1 of a part number O11. These and other component elements are categorized separately, and are not related to the processing here.

【0034】この場合の重なり関係から、例えば、部品
番号O4の四角形1の枠と、部品番号O5の文字2(枠
の中の文字)とでは、部品番号O4の四角形1の枠の方
が、描画順序が先のため、部品番号O4の四角形1の枠
の方を先にするという階層関係を形成する。なお、重な
りが無いもの同志は同じ階層に並列的に位置づけ階層化
を行う。
From the overlapping relation in this case, for example, in the rectangle 1 of the part number O4 and the character 2 of the part number O5 (the character in the frame), the rectangle of the rectangle 1 of the part number O4 is Since the drawing order is earlier, a hierarchical relationship is formed in which the frame of the rectangle 1 of the part number O4 is placed first. Those with no overlap are positioned in parallel on the same layer and hierarchized.

【0035】次に、前述したフローチャートの処理の中
のステップ503における分割用直線図形の有無を調べ
る処理について説明する。図6は、この処理を示すフロ
ーチャートである。
Next, a description will be given of a process of checking the presence or absence of a dividing linear figure in step 503 in the process of the flowchart described above. FIG. 6 is a flowchart showing this processing.

【0036】図6を参照すると、まず、ステップ601
において、直線図形判定部102により、全ての部品要
素に対して直線図形であるか否かを調べ、その結果より
直線図形を抽出する。ここでの文書を構成している部品
要素の情報には、文字や画像や図形といったデータの種
類や、図形であれば点や直線や多角形といった形状の種
類が一般的には記述されているため、その種類を調べれ
ばよい。次に、ステップ602において、属性判定部1
03により、ステップ601の処理により抽出した直線
図形に対して属性情報を調べ、その結果により所定の属
性の直線図形を抽出する。ここでの所定の属性とは、例
えば、直線の形状の種類が矢印である属性である。その
属性であるか否かを調べ、矢印の形状以外の任意の属性
の直線図形を抽出する。
Referring to FIG. 6, first, step 601 is executed.
In step (1), the linear figure determining unit 102 checks whether or not all of the component elements are linear figures, and extracts a linear figure from the result. The information of the component elements constituting the document here generally describes the types of data such as characters, images, and figures, and, in the case of figures, the types of shapes such as points, straight lines, and polygons. Therefore, the type may be checked. Next, in step 602, the attribute determining unit 1
In step 03, the attribute information is checked for the linear graphic extracted by the processing in step 601. Based on the result, a linear graphic having a predetermined attribute is extracted. The predetermined attribute here is, for example, an attribute in which the type of the shape of the straight line is an arrow. It is checked whether the attribute is the attribute, and a linear figure having an arbitrary attribute other than the arrow shape is extracted.

【0037】次に、ステップ603において、水平垂直
直線図形判定部104により、ステップ602の処理に
より抽出した属性の直線図形に対して、その方向が水平
方向であるかまたは垂直方向であるかを調べて、その結
果より水平方向または垂直方向の直線図形を抽出する。
ここまでの処理によって抽出される直線図形は、図3に
示す文書例の中では、部品番号O3の直線1、部品番号
O6の直線2、部品番号O8の直線3、部品番号O12
の直線5の4つ直線図形である。
Next, in step 603, the horizontal / vertical straight line figure judging section 104 checks whether the direction of the line figure having the attribute extracted by the process of step 602 is horizontal or vertical. Then, a horizontal or vertical straight line figure is extracted from the result.
In the example of the document shown in FIG. 3, the straight line figures extracted by the processing up to this point are the straight line 1 of the part number O3, the straight line 2 of the part number O6, the straight line 3 of the part number O8, and the part number O12.
4 is a straight line figure.

【0038】次に、ステップ604において、重なり判
定部106により、ステップ603の処理により抽出し
た属性の水平垂直直線図形に対して、それ以外の部品要
素との間で重なりが有るか否かを調べる。ここでの重な
りとは、2次元の空間的な位置における重なりであり、
これは、水平垂直直線図形の座標情報と部品要素の輪郭
情報である座標情報を用いて調べる。そして、次のステ
ップ605において、分割用直線図形抽出部107によ
り、ステップ604による判定の結果、所定の属性の水
平垂直直線図形の中で、それ以外の部品要素と重ならな
い直線図形を抽出し、分割用直線図形とする。すなわ
ち、この判定の結果、図3に示す文書例においては、部
品番号O3の直線1、部品番号O6の直線2、部品番号
O8の直線3、および部品番号O12の直線5の4つの
直線図形が、分割用直線図形として抽出される。
Next, in step 604, the overlap judging section 106 checks whether or not the horizontal / vertical straight-line figure having the attribute extracted in the processing in step 603 overlaps with other component elements. . The overlap here is an overlap at a two-dimensional spatial position,
This is checked using the coordinate information of the horizontal / vertical linear figure and the coordinate information which is the outline information of the component element. Then, in the next step 605, as a result of the determination in step 604, the straight-line figure that does not overlap with the other component elements is extracted from the horizontal-vertical straight-line figure having the predetermined attribute by the dividing straight-line figure extracting unit 107. It is a straight line figure for division. That is, as a result of this determination, in the example of the document shown in FIG. 3, four straight lines, that is, a straight line 1 of the part number O3, a straight line 2 of the part number O6, a straight line 3 of the part number O8, and a straight line 5 of the part number O12. , And are extracted as divisional linear figures.

【0039】次に、前述したフローチャート(図5)の
中のステップ508の処理について説明する。図7は、
文書の大きさに対する分割用直線図形の長さの割合を順
番にして、分割用直線図形によりそれ以外の部品要素を
分類する処理を示すフローチャートである。
Next, the processing of step 508 in the above-described flowchart (FIG. 5) will be described. FIG.
9 is a flowchart illustrating a process of sequentially classifying the ratio of the length of a dividing linear graphic to the size of a document and classifying other component elements by the dividing linear graphic.

【0040】図7を参照する。まず、ステップ701に
おいて、長さ割合算出部109により、全ての分割用直
線図形について、それぞれの長さの文書全体の大きさに
対する割合を求める。次に、ステップ702において、
求められた全ての分割用の直線図形における長さの割合
の値を互いに比較し、その大きい方からの順番を求め
る。これは、長さ割合比較部110を用いて行う。次
に、ステップ703の処理において、分割用直線図形以
外の全ての部品要素を1つにグループとみなし、グルー
プ化する。
Referring to FIG. First, in step 701, the length ratio calculation unit 109 obtains the ratio of each length to the size of the entire document for all of the dividing linear figures. Next, in step 702,
The calculated values of the ratios of the lengths in all the linear figures for division are compared with each other, and the order from the larger one is obtained. This is performed using the length ratio comparison unit 110. Next, in the process of step 703, all the component elements other than the dividing linear figure are regarded as one group and are grouped.

【0041】そして、次のステップ704において、長
さ割合の最も大きい分割用直線図形から読み出しを行
い、次のステップ705において、読み出した1つの分
割用直線図形に対して、分割用直線図形以外の部品要素
のそれぞれの位置がその直線に対してどちら側にあるか
という位置の関係を調べる。この処理は、部品要素位置
判定部111により行われる。そして、ステップ706
において、ステップ705の処理により調べた結果に従
って部品要素を2つのグループに分類する。
Then, in the next step 704, reading is performed from the dividing linear graphic having the largest length ratio, and in the next step 705, the read one dividing linear graphic is The positional relationship between the position of each component element and the straight line is examined. This process is performed by the component element position determination unit 111. Then, step 706
In, the component elements are classified into two groups according to the result checked by the processing in step 705.

【0042】次に、ステップ707において、ステップ
704の処理により読み出した分割用直線図形により、
選定した対象領域を分割する。この分割は、更に部品要
素の分類を続けていく際に、対象領域を更新していくた
めのものである。そして、次のステップ708におい
て、全ての分割用直線図形について読み出して分類処理
を行ったか否かを調べ、終わっていれば、このフローチ
ャートの処理を終了し、終わっていなければ、ステップ
704に戻り、ステップ704からの処理を繰り返し行
う。
Next, in step 707, the dividing straight line figure read out in the processing of step 704 is used.
Divide the selected target area. This division is for updating the target area when the component elements are further classified. Then, in the next step 708, it is checked whether or not the classification processing has been performed by reading out all the linear figures for division. If the processing has been completed, the processing of this flowchart is terminated. If not, the processing returns to step 704. The processing from step 704 is repeated.

【0043】図8は、前述したステップ702の処理に
おける直線図形の長さの割合を求める処理を具体例で説
明する図である。図8に示すように、文書の大きさを基
準として、直線図形の長さの割合を求める。水平方向の
大きさである幅は、L(H)とし、垂直方向の大きさで
ある高さは、L(V)とする。例えば、前述したよう
に、図3に示す文書例の文書から抽出された4つの分割
用直線図形の中で、図8においては、部品番号O3の直
線1の図形を示している。この分割用の直線図形の長さ
をl(H)とする。この直線図形は、水平方向であるた
め、その長さの文書全体の大きさに対する割合はl
(H)/L(H)によって求められる。また、ここでの
分割用の直線図形が、垂直方向であれば、垂直方向の長
さを用いて求める。
FIG. 8 is a view for explaining a specific example of the process of obtaining the ratio of the length of the linear figure in the process of step 702 described above. As shown in FIG. 8, the ratio of the length of the linear figure is calculated based on the size of the document. The width which is the size in the horizontal direction is L (H), and the height which is the size in the vertical direction is L (V). For example, as described above, among the four divisional linear figures extracted from the document of the document example shown in FIG. 3, FIG. 8 shows a figure of a straight line 1 with a part number O3. The length of the linear figure for division is assumed to be l (H). Since this linear figure is horizontal, the ratio of its length to the size of the entire document is l.
(H) / L (H). If the dividing straight figure is in the vertical direction, it is obtained by using the length in the vertical direction.

【0044】ここで求められた全ての分割用直線図形に
おける長さの割合の値は、長さ割合比較部110によ
り、互いに比較され大きい方からの順番が求められる
(ステップ702)。図9は、この長さの割合の順番が
示された様子を示している。
The length ratio values of all the divided linear figures obtained here are compared with each other by the length ratio comparing unit 110, and the order from the larger one is obtained (step 702). FIG. 9 shows a state in which the order of the length ratio is shown.

【0045】4つの分割用直線図形についての長さの割
合の値の大きさの順番は、部品番号O3の直線1、部品
番号O6の直線2、部品番号O12の直線5、部品番号
O8の直線3の順番となっており、したがって、この場
合には、図9に示すように、直線1,直線2,直線5,
および直線3がその順番である。そして、この分割用の
直線図形(直線1,直線2,直線3,および直線5)以
外の全ての部品要素を1つにグループとみなしておく。
The order of the magnitudes of the values of the length ratios for the four dividing linear figures is as follows: the straight line 1 of the part number O3, the straight line 2 of the part number O6, the straight line 5 of the part number O12, and the straight line of the part number O8. 3, so in this case, as shown in FIG.
And line 3 is in that order. Then, all the component elements other than the dividing straight line graphic (straight line 1, straight line 2, straight line 3, and straight line 5) are regarded as one group.

【0046】また、ここでは、分割用の直線図形によ
り、文書の中の部品要素を階層化するための判定の領域
を分割するが、これは、長さの割合が大きい順に行う
(ステップ704)。この場合、4つの分割用直線図形
の中では、部品番号O3の直線1が長さの割合が最も大
きいため、それから読み出しを開始し、部品要素位置判
定部111により、読み出した1つの分割用直線図形に
対して、分割用直線図形以外の部品要素のそれぞれの位
置がその直線に対してどちら側にあるかという位置の関
係を調べ、調べた結果に従って部品要素を2つのグルー
プに分類する。
In this case, the area for determination for hierarchizing the component elements in the document is divided by the dividing linear figure, and this is performed in the order of increasing length (step 704). . In this case, the straight line 1 of the part number O3 has the largest proportion of the length among the four divisional straight line figures, so reading is started from that, and the one divisional straight line read out by the component element position determination unit 111 is read. With respect to the figure, the relationship of the position of each part element other than the dividing straight figure with respect to the straight line is checked, and the part elements are classified into two groups according to the check result.

【0047】具体的に文書例の部品要素について説明す
る。図10は、部品要素を分類する様子を説明する図で
ある。図10を参照すると、一番初めに読み出した長さ
の割合が最も大きい部品番号O3の直線1は、水平方向
であるので、この直線に対する部品要素の垂直方向の位
置を調べ、2つのグループに分類する。この部品番号O
3の直線1により、部品要素を分類する位置は、その直
線1のあったところとなり、その位置を図10において
は、一点鎖線で示している。
The component elements of the document example will be specifically described. FIG. 10 is a diagram for explaining how to classify component elements. Referring to FIG. 10, since the straight line 1 of the part number O3 having the largest ratio of the length read first is in the horizontal direction, the position of the component element with respect to this straight line in the vertical direction is checked, and the two groups are divided into two groups. Classify. This part number O
The position where the component element is classified by the straight line 1 of No. 3 is where the straight line 1 is located, and the position is indicated by a dashed line in FIG.

【0048】この分類の結果、分割用の直線図形(直線
1)以外の9つの部品要素は、部品番号O3の分割用直
線図形の上側に位置する部品番号O1の部品要素および
部品番号O2の部品要素からなるグループと、下側に位
置する部品番号O4の部品要素、部品番号O5の部品要
素、部品番号O7の部品要素、部品番号O9の部品要
素、部品番号O10の部品要素、部品番号O11の部品
要素および部品番号O13の部品要素からなるグループ
に分類される。
As a result of this classification, the nine component elements other than the dividing linear graphic (straight line 1) are the component element of the component number O1 and the component of the component number O2 located above the dividing linear graphic of the component number O3. A group consisting of elements, a part element of part number O4, a part element of part number O5, a part element of part number O7, a part element of part number O9, a part element of part number O10, and a part element of part number O11 located below. It is classified into a group consisting of a component element and a component element with a component number O13.

【0049】次に、分割用直線図形により選定した対象
領域を分割し(ステップ707)、分割した領域毎にこ
れまでの処理と同じ処理を繰り返し行う。つまり、この
分割とは、さらに部品要素の分類を続けていく際に、対
象領域を更新していくためのものである。そして、全て
の分割用直線図形について読み出して分類処理を行った
かを調べ、終わっていれば処理を終了する。この結果、
部品要素をすべて分類し終えたとき、文書上での各々の
部品要素は、図11に示すように、6つの分割領域に分
割される。それぞれの分割領域の中に部品要素が含まれ
る。この各々の分割領域に基づいて、その分割領域毎の
部品要素の階層化を行うと、分割用直線図形以外の部品
要素について、図12に記すような階層化情報が得られ
る。
Next, the target area selected by the dividing linear figure is divided (step 707), and the same processing as described above is repeated for each divided area. That is, this division is for updating the target area when the component elements are further classified. Then, it is checked whether or not the classification processing has been performed by reading out all the divisional straight-line figures. If the processing has been completed, the processing ends. As a result,
When all the component elements have been classified, each component element on the document is divided into six divided areas as shown in FIG. Each divided area includes a component element. When the layering of the component elements for each of the divided regions is performed based on each of the divided regions, the layering information as shown in FIG. 12 is obtained for the component elements other than the dividing linear figure.

【0050】また、次に、前述したフローチャート(図
5)の中のステップ509の処理について説明する。図
13は、文書の大きさに対する分割用直線図形の長さの
割合を更新しながら、その順番に分割用直線図形により
それ以外の部品要素を分類する処理を示すフローチャー
トである。
Next, the processing of step 509 in the above-described flowchart (FIG. 5) will be described. FIG. 13 is a flowchart showing a process of classifying the other component elements by the dividing linear graphic in that order while updating the ratio of the length of the dividing linear graphic to the size of the document.

【0051】図13を参照して説明する。まず、ステッ
プ801において、分割用直線図形以外の全ての部品要
素を1つにグループ化する。つまり、分割用直線図形以
外の全ての部品要素を1つにグループとみなしておく。
次に、ステップ802において、分割用直線図形以外の
全ての部品要素を分類する処理対象として、その領域を
選定する。一番初めのときは文書全体が対象領域とな
る。
A description will be given with reference to FIG. First, in step 801, all the component elements other than the dividing linear figure are grouped into one. That is, all the component elements other than the dividing linear figure are regarded as one group.
Next, in step 802, the area is selected as a processing target for classifying all the component elements other than the dividing linear figure. At the very beginning, the entire document is the target area.

【0052】次のステップ803において、先のステッ
プ802の処理により選定した対象領域の大きさを算出
する。ここでの対象領域の大きさとは、水平方向と垂直
方向の長さである。そして、次のステップ804におい
て、選定した対象領域の中に含まれる分割用直線図形を
抽出する。次に、ステップ805において、長さ比較部
108により、ステップ804の処理により抽出した分
割用直線図形の中の水平方向の分割用直線図形について
長さを調べ、一番長い分割用直線図形を抽出する。
In the next step 803, the size of the target area selected by the processing in the previous step 802 is calculated. Here, the size of the target region is the length in the horizontal direction and the vertical direction. Then, in the next step 804, a dividing linear figure included in the selected target area is extracted. Next, in step 805, the length comparing unit 108 checks the length of the horizontal dividing linear figure among the dividing linear figures extracted by the processing in step 804, and extracts the longest dividing linear figure. I do.

【0053】次のステップ806において、長さ割合算
出部109により、選定した対象領域の水平方向の長さ
に対して、先のステップ805にて抽出した分割用水平
直線図形の長さの割合を求める。次のステップ807に
おいて、長さ比較部108により、先のステップ804
の抽出処理によって、抽出した分割用直線図形の中の垂
直方向の分割用直線図形について長さを調べて一番長い
分割用直線図形を抽出する。
In the next step 806, the length ratio calculation unit 109 calculates the ratio of the length of the horizontal line graphic for division extracted in the previous step 805 to the horizontal length of the selected target area. Ask. In the next step 807, the length comparing unit 108 makes the previous step 804
, The length of the vertical dividing straight-line figure in the extracted dividing straight-line figures is checked, and the longest dividing straight-line figure is extracted.

【0054】次のステップ808において、長さ割合算
出部109により、選定した対象領域の垂直方向の長さ
に対して、先のステップ807の処理により抽出した分
割用垂直直線図形の長さの割合を求め、次に、ステップ
809において、ステップ806の処理により求めた割
合とステップ808にて求めた割合とを比べて、値の大
きい方の分割用直線図形を抽出する。
In the next step 808, the length ratio calculating unit 109 calculates the ratio of the length of the dividing vertical straight line figure extracted in the previous step 807 to the vertical length of the selected target area. Then, in step 809, the ratio obtained by the processing in step 806 is compared with the ratio obtained in step 808, and the linear graphic for division having a larger value is extracted.

【0055】次に、ステップ810において、部品要素
位置判定部111により、ステップ809にて抽出した
1つの分割用直線図形に対して、選定した対象領域の中
に含まれる分割用直線図形以外の部品要素の位置がその
直線に対してどちらにあるかの位置の関係を調べる。ス
テップ810の処理は、前述したステップ705の処理
と同様である。そして、次のステップ811において、
ステップ810の処理で調べた結果に従って、部品要素
を2つのグループに分類する。また、このステップ81
1の処理は、前述したステップ706の処理と同様であ
る。
Next, in step 810, the component element position determining unit 111 compares the one divided linear figure extracted in step 809 with a part other than the divided linear figure included in the selected target area. Examine the position relationship of the position of the element with respect to the straight line. The processing in step 810 is the same as the processing in step 705 described above. Then, in the next step 811,
The component elements are classified into two groups according to the result checked in the process of step 810. This step 81
Step 1 is the same as step 706 described above.

【0056】続いて、次のステップ812において、先
のステップ809の処理により抽出した分割用直線図形
によって、選定した対象領域を分割する。そして、ステ
ップ813において、全ての分割用直線図形について、
読み出して分類処理を行ったかを調べ、処理が終わって
いれば、ここでの処理を終了とする。また、全ての分割
用直線図形について、処理が終わっていなければ、ステ
ップ802に戻り、ステップ802からの処理を繰り返
し行う。
Subsequently, in the next step 812, the selected target area is divided by the dividing linear figure extracted in the processing of the previous step 809. Then, in step 813, for all the dividing straight line figures,
It is checked whether or not the reading process has been performed, and if the process has been completed, the process is terminated here. If the processing has not been completed for all the linear figures for division, the process returns to step 802, and the processing from step 802 is repeated.

【0057】このようにして、ここでの処理では、始め
に選択した分割用直線図形(最も長い直線図形)から処
理を初めて、その分割用直線図形により、対象領域を分
割するとともに、分割用直線図形の長さの割合を更新し
ながら分類を進めていく。このため、前述したように、
図3に示す文書例の部品要素の場合、その分割用直線図
形の長さの割合の順番は、図14に示すようになる。つ
まり、部品番号O3の直線1、部品番号O6の直線2、
部品番号O8の直線3、部品番号O12の直線5の順番
となっており、したがって、この場合には、直線1,直
線2,直線3,および直線5がその順番となる。この領
域分割の処理によって、各々の領域の部品要素の階層化
を行うために、部品要素をすべて分類し終えたとき、そ
の文書上では、図15に示すようになる。
As described above, in the processing here, the processing is first started from the first selected straight line graphic for division (the longest straight line graphic), and the target area is divided by the straight line graphic for division. The classification is advanced while updating the ratio of the figure length. Therefore, as described above,
In the case of the component element of the document example shown in FIG. 3, the order of the length ratio of the dividing straight figure is as shown in FIG. That is, a straight line 1 of the part number O3, a straight line 2 of the part number O6,
The straight line 3 of the part number O8 and the straight line 5 of the part number O12 are arranged in this order. Therefore, in this case, the straight line 1, the straight line 2, the straight line 3, and the straight line 5 are in that order. When all the component elements have been classified in order to perform the layering of the component elements in each area by this area division processing, the document becomes as shown in FIG.

【0058】つまり、部品要素をすべて分類し終えたと
き、文書上での各々の部品要素は、図15に示すよう
に、5つの領域に分割される。それぞれの領域の中に部
品要素が含まれる。この各々の領域に基づいて、その領
域毎の部品要素の階層化を行うと、分割用直線図形以外
の部品要素について、同じく、図12に記すような階層
化情報が得られる。
That is, when all the component elements have been classified, each component element on the document is divided into five areas as shown in FIG. Each area includes a component element. When the component elements of each area are hierarchized based on each area, hierarchical information as shown in FIG. 12 is similarly obtained for the component elements other than the dividing linear figure.

【0059】そして、図12のように分類された文書を
構成する部品要素に対して、それぞれの部品要素をを階
層化して、分類用直線図形の情報をも統合して、最終的
に階層化を行うと、図16に示すようになり、各々の部
品要素が階層化された情報が得られる。
Then, with respect to the component elements constituting the document classified as shown in FIG. 12, the respective component elements are hierarchized, the information of the classification linear figure is also integrated, and finally the hierarchization is performed. Is performed, the result is as shown in FIG. 16, and information in which each component element is hierarchized is obtained.

【0060】[0060]

【発明の効果】以上説明したように、本発明の文書処理
方法においては、文書を構成する部品要素を階層的にす
るため、2次元の空間的な位置の重なりによって階層化
する場合に、部品要素の中の重なりをもたない水平また
は垂直方向の所定の属性を有する直線図形により領域を
分割して、それぞれの部品要素を分類し、部品要素を階
層化するので、データ処理量を削減でき、結果として処
理時間が短くなるという効果を奏する。
As described above, in the document processing method of the present invention, in order to hierarchically arrange the component elements constituting a document, when the hierarchical structure is formed by overlapping two-dimensional spatial positions, The area is divided by a linear figure having a predetermined attribute in the horizontal or vertical direction that has no overlap among the elements, and the respective component elements are classified and the component elements are hierarchized, so that the data processing amount can be reduced. As a result, the processing time is shortened.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 文書を構成する部品要素を階層化する処理部
分のブロック図である。
FIG. 1 is a block diagram of a processing portion for hierarchizing component elements constituting a document.

【図2】 文書処理全般を行う処理部分のブロック図で
ある。
FIG. 2 is a block diagram of a processing portion that performs overall document processing.

【図3】 文書の一例を示す図である。FIG. 3 is a diagram illustrating an example of a document.

【図4】 部品要素の内容を表した図である。FIG. 4 is a diagram showing the contents of a component element.

【図5】 部品要素を階層化する処理のフローチャート
である。
FIG. 5 is a flowchart of a process of hierarchizing component elements.

【図6】 分割用直線図形の有無を調べる処理のフロー
チャートである。
FIG. 6 is a flowchart of a process for checking the presence / absence of a dividing linear figure.

【図7】 分割用直線図形の長さの割合を順番にして、
部品要素を分類する処理のフローチャートである。
FIG. 7 shows the order of the length of the straight line graphic for division in order,
It is a flowchart of a process of classifying a component element.

【図8】 分割用直線図形の長さの割合を順番にしたと
きの長さの順番を示す様子を示す図である。
FIG. 8 is a diagram illustrating a state of showing the order of lengths when the ratio of the length of the straight line graphic for division is made in order.

【図9】 長さの割合の順番を示す様子を示す図であ
る。
FIG. 9 is a diagram showing a state in which the order of length ratios is shown.

【図10】 部品要素を分類する様子を説明する図であ
る。
FIG. 10 is a diagram illustrating a manner of classifying component elements.

【図11】 長さの割合を順番にしての文書上での分類
の仕方を示す様子を示す図である。
FIG. 11 is a diagram showing a manner of classifying on a document in order of length ratio.

【図12】 長さの割合を順番にしての文書の分類の情
報の内容を示す図である。
FIG. 12 is a diagram showing the contents of document classification information in order of length ratio.

【図13】 分割用直線図形の長さの割合を更新しなが
ら順番に部品要素を分類する処理のフローチャートであ
る。
FIG. 13 is a flowchart of a process of sequentially classifying component elements while updating the ratio of the length of the dividing linear graphic.

【図14】 長さの割合を更新しての長さの割合の順番
を示す様子を示す図である。
FIG. 14 is a diagram showing a state in which the length ratio is updated and the order of the length ratio is shown.

【図15】 長さの割合を更新しての文書上での分類の
仕方を示す様子を示す図である。
FIG. 15 is a diagram showing a manner of classifying a document after updating the length ratio.

【図16】 最終的に階層化された情報の内容を示す図
である。
FIG. 16 is a diagram illustrating the content of information that is finally hierarchized.

【符号の説明】[Explanation of symbols]

101…描画順序判定部、102…直線図形判定部、1
03…属性判定部、104…水平垂直直線図形判定部、
105…輪郭生成部、106…重なり判定部、107…
分割用直線図形抽出部、108…長さ比較部、109…
長さ割合算出部、110…長さ割合比較部、111…部
品要素位置判定部、112…対象領域分割部、113…
対象領域選出部、114…重なり編成部、115…階層
統合部、116…割合算出モード記憶部、201…情報
入力部、202…操作情報記憶部、203…文書情報記
憶部、204…文書情報編集部、205…文書情報表示
部、206…部品要素階層化部、207…階層情報記憶
部、208…階層情報表示部
101: drawing order determination unit, 102: linear figure determination unit, 1
03: attribute determination unit; 104: horizontal / vertical straight line graphic determination unit;
105: contour generation unit, 106: overlap determination unit, 107 ...
Linear figure extracting unit for division, 108... Length comparing unit, 109.
Length ratio calculation unit, 110: length ratio comparison unit, 111: component element position determination unit, 112: target area division unit, 113 ...
Target area selection unit, 114: overlapping knitting unit, 115: hierarchical integration unit, 116: ratio calculation mode storage unit, 201: information input unit, 202: operation information storage unit, 203: document information storage unit, 204: document information editing Unit, 205: document information display unit, 206: component element hierarchy unit, 207: hierarchy information storage unit, 208: hierarchy information display unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 文書を構成する部品要素を階層的な構造
に変換して、文書編集を行う文書処理方法において、 部品要素の中の直線図形によりそれ以外の部品要素を分
類し、 分類された部品要素を階層化し、 階層化された部品要素および分類に用いた前記直線図形
から最終的な階層情報を得ることを特徴とする文書処理
方法。
In a document processing method for converting a component element constituting a document into a hierarchical structure and editing a document, other component elements are classified by a linear figure in the component element. A document processing method, wherein component elements are hierarchized, and final hierarchical information is obtained from the hierarchized component elements and the linear figure used for classification.
【請求項2】 請求項1に記載の文書処理方法におい
て、 前記直線図形は、2次元の空間的な位置の重なりのない
水平方向または垂直方向の直線図形であることを特徴と
する文書処理方法。
2. The document processing method according to claim 1, wherein the linear graphic is a horizontal or vertical linear graphic having no two-dimensional spatial position overlap. .
【請求項3】 請求項2に記載の文書処理方法におい
て、 前記直線図形は、属性情報を有する直線図形であり、各
々の直線図形が属性情報により識別されることを特徴と
する文書処理方法。
3. The document processing method according to claim 2, wherein the linear graphic is a linear graphic having attribute information, and each linear graphic is identified by the attribute information.
【請求項4】 請求項1に記載の文書処理方法におい
て、 部品要素を分類する分類方法として、分類に用いる直線
図形をその長さの文書全体の大きさに対する割合の大き
さの順番に処理する第1の処理方法と、 分類にあわせ直線図形の分類領域の大きさに対する割合
を更新しながら大きさの順番に処理する第2の処理方法
とのいずれかの処理方法により分類することを特徴とす
る文書処理方法。
4. The document processing method according to claim 1, wherein, as the classification method for classifying the component elements, the linear figures used for the classification are processed in the order of the ratio of the length to the size of the entire document. Classification is performed by one of a first processing method and a second processing method of processing the linear figure in the order of the size while updating the ratio of the linear figure to the size of the area according to the classification. Document processing method to be performed.
JP9208353A 1997-07-18 1997-07-18 Document processing method Pending JPH1139499A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9208353A JPH1139499A (en) 1997-07-18 1997-07-18 Document processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9208353A JPH1139499A (en) 1997-07-18 1997-07-18 Document processing method

Publications (1)

Publication Number Publication Date
JPH1139499A true JPH1139499A (en) 1999-02-12

Family

ID=16554889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9208353A Pending JPH1139499A (en) 1997-07-18 1997-07-18 Document processing method

Country Status (1)

Country Link
JP (1) JPH1139499A (en)

Similar Documents

Publication Publication Date Title
US6934052B2 (en) Method for image layout using energy minimization
US5701500A (en) Document processor
US6466694B2 (en) Document image processing device and method thereof
JP2004240750A (en) Picture retrieval device
US4817187A (en) Apparatus and method for vectorization of incoming scanned image data
JPH0634231B2 (en) How to create mold piece data
US7395190B2 (en) Analytical model producing method and analytical model producing apparatus
JP2007012074A (en) White space graph and tree for content-adaptive scaling of document image
JP2004303197A (en) Template generating system, layout system, template generating program, layout program, layout template data structure, and template generating method and layout method
JPH06236367A (en) Control method for word processor
US5736991A (en) Animation editing apparatus
US20090157211A1 (en) Producing a locally optimal path through a lattice by overlapping search
US7336825B2 (en) Segmenting a composite image via minimum areas
JPH1139499A (en) Document processing method
US6538756B1 (en) Information processing apparatus and recording medium with pattern generation programs recorded thereon
JPH0612540B2 (en) Document creation support device
JP2845107B2 (en) Image processing device
JP2004240751A (en) Picture retrieval device
JP4585742B2 (en) Image display device, image display method, program, and recording medium
JP3070801B2 (en) Drawing management method
JP3490703B2 (en) Character processing method based on outline font information and computer-readable recording medium storing computer program for causing a computer system to execute the method
EP1439485B1 (en) Segmenting a composite image via basic rectangles
JPH10111879A (en) Cad/cae device and analysis model generation method
JPH07107711B2 (en) Document image processing device
JPH1185428A (en) Method and device for forming image