JPH10187725A - Document editing system - Google Patents
Document editing systemInfo
- Publication number
- JPH10187725A JPH10187725A JP8348586A JP34858696A JPH10187725A JP H10187725 A JPH10187725 A JP H10187725A JP 8348586 A JP8348586 A JP 8348586A JP 34858696 A JP34858696 A JP 34858696A JP H10187725 A JPH10187725 A JP H10187725A
- Authority
- JP
- Japan
- Prior art keywords
- document
- description
- processing
- partial structure
- edit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は文書編集方式に関
し、特に、例えば、個人単位で作成した作業進捗報告な
どの報告書をまとめてグループ全体の報告書や一覧表を
作成する際に、各人の「目標」や「進捗」や「成果」な
どの部分構造を抽出して、それぞれまとめる作業を自動
的に行うための文書編集方式に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document editing system, and more particularly to, for example, compiling reports such as work progress reports prepared on an individual basis to prepare a report or list of the entire group. The present invention relates to a document editing method for extracting partial structures such as "goals", "progresses", and "results", and automatically performing a work of summarizing them.
【0002】また、例えば、ある1つの製品の各部分を
別々の拠点もしくは別々のグループが設計、作成する分
散開発において、各拠点もしくは各グループが設計、作
成した部分に関する仕様書などのドキュメントをまとめ
て、製品の仕様書を作成する際の作業を自動化するため
の文書編集方式に関するものである。Further, for example, in distributed development in which parts of a certain product are designed and created by different sites or groups, documents such as specifications relating to the parts designed and created by each site or group are collected. In addition, the present invention relates to a document editing method for automating a task of creating a product specification.
【0003】さらに、例えば、前記作業進捗報告の例や
前記製品仕様書作成の例において、各人、各拠点もしく
は各グループが作成した文書が、電子メイルなどによっ
てある一箇所に送付される場合に、電子メイルが到着す
る度に、それまで到着した文書とともに構造毎にまとめ
あげて出力文書を自動的に更新する処理や、以前に送付
したメイルに対する削除要求を処理して出力文書を自動
的に更新するための文書編集方式に関するものである。[0003] Further, for example, in the example of the work progress report and the example of the product specification creation, when a document created by each person, each base or each group is sent to a certain place by electronic mail or the like. , Every time an e-mail arrives, automatically updates the output document by grouping together the documents that have arrived by structure, and automatically updates the output document by processing a previously sent mail deletion request This is related to a document editing method for performing the operation.
【0004】なお、前記報告書や仕様書など、本発明の
文書編集方式の入力となる文書は、あらかじめ決められ
た記号等で文書構造を明確に表したSGML(Standard
Generalized Markup Language)に代表される構造化文書
であることを前提としており、特に以降の具体的説明で
は、SGML形式の文書を扱う例を用いる。SGMLに
関しては、例えば、オーム社刊、吉岡誠 編著の”SG
MLのススメ"などの書籍に詳述されている。[0004] It is to be noted that a document such as the report or the specification, which is an input of the document editing method of the present invention, is a SGML (Standard) in which the document structure is clearly represented by predetermined symbols or the like.
It is assumed that the document is a structured document typified by Generalized Markup Language). In the following specific description, an example in which a document in the SGML format is used will be used. Regarding SGML, see, for example, “SG,” edited by Makoto Yoshioka, published by Ohmsha.
It is detailed in books such as "Recommended by ML".
【0005】[0005]
【従来の技術】従来の文書編集方式は、複数の文書の必
要箇所を抽出し加工し1つの文書にまとめるための技術
には、次の2種類があった。 (1)例えばUNIXオペレーティングシステムに搭載
されたsedコマンドやawkコマンドなどのように、
文書を構造のない文字列の集合と見なして、文字パター
ンとのマッチングによって文書の必要箇所を抽出する文
書編集方式があった。 (2)特開平6−259421号公報などに代表され
る、”節”、”表題”などの単純文字列パターン(本明
細書の請求項2での「文書タグ」に相当する)と、包含
関係を表す”/”(本明細書の請求項2での「階層接続
子」に相当する)や順序関係を表す”#”(本明細書の
請求項2での「順序接続子」に相当する)などの接続表
現記号、”(”や”)”などの括弧(本明細書の請求項
2での「括弧」に相当する)、等の構文要素からなる文
書構造パターンを用いて、文書構造を保って必要箇所を
抽出・加工する文書編集方式があった。2. Description of the Related Art In a conventional document editing system, there are the following two types of techniques for extracting necessary portions of a plurality of documents, processing them, and combining them into one document. (1) For example, like the sed command and the awk command mounted on the UNIX operating system,
There has been a document editing method in which a document is regarded as a set of character strings having no structure, and a necessary portion of the document is extracted by matching with a character pattern. (2) A simple character string pattern (corresponding to “document tag” in claim 2 of the present specification) such as “section” and “title” represented by JP-A-6-259421 and the like is included. “/” (Corresponding to “hierarchical connector” in claim 2 of this specification) and “#” (corresponding to “order connector” in claim 2 of this specification) Using a document structure pattern composed of syntactic elements such as connection expression symbols such as "do"), parentheses such as "(" and ")" (corresponding to "parentheses" in claim 2 of the present specification). There was a document editing system that extracts and processes necessary parts while maintaining the structure.
【0006】[0006]
【発明が解決しようとする課題】上述した従来の文書編
集方式は、 (1)前記文書を構造のない文字列の集合と見なして処
理する従来の文書編集方式には、例えば、特開平6−2
59421号公報の「従来の技術」の(6)および「発
明が解決しようとする課題」などでも指摘している通
り、文書の構造の意味を解釈せずに文字列単位で照合し
ているため、文書の部分構造のマッチングや抽出といっ
た文書構造単位での処理が困難であるという問題点があ
り、文書の構造を単位としてパターン記述し、文書編集
するための手段が必要となった。The above-mentioned conventional document editing method includes the following: (1) The conventional document editing method for processing the document by regarding the document as a set of character strings having no structure includes, for example, 2
As pointed out in (6) of "Prior Art" and "Problems to be Solved by the Invention" in Japanese Patent No. 59421, collation is performed in units of character strings without interpreting the meaning of the structure of the document. However, there is a problem that it is difficult to perform processing in units of a document structure such as matching and extraction of a partial structure of a document, and a means for performing pattern description in units of the document structure and editing the document is required.
【0007】(2)また、特開平6−259421号公
報に代表される従来の文書編集方式には、以降に述べる
(2−1)および(2−2)および(2−3)のような
問題点があった。(2) Conventional document editing methods represented by Japanese Patent Application Laid-Open No. 6-259421 include the following (2-1), (2-2) and (2-3). There was a problem.
【0008】(2−1)特開平6−259421号公報
に代表される従来の文書編集方式のパターン記述では、
パターン記述の構文要素に、文書の抽出箇所を示す引用
指定子がないため、1つのパターンによって抽出するこ
とのできる部分構造は1種類に限られる。すなわち、1
つの文書から複数種類の部分構造を抽出したい場合に
は、抽出したい部分構造の種類だけパターン記述を用意
して、別々に部分構造を抽出することになる。しかしな
がら、各パターン記述の間の関係までは規定できないた
め、例えば、各パターン記述から抽出した部分構造か
ら、部分構造間の関係を問わずに部分構造の組を作成し
て出力文書を作成するような文書編集には適用できる
が、ある位置関係を満たす部分構造の組を抽出して出力
文書を作成するような文書編集には適用できない、とい
った問題があった。(2-1) In the pattern description of the conventional document editing method represented by Japanese Patent Laid-Open No. 6-259421,
Since the syntax element of the pattern description does not include a citation specifier indicating a document extraction location, only one type of partial structure can be extracted by one pattern. That is, 1
When it is desired to extract a plurality of types of partial structures from one document, a pattern description is prepared for only the type of the partial structure to be extracted, and the partial structures are separately extracted. However, since the relationship between the pattern descriptions cannot be defined, for example, it is necessary to create an output document by creating a set of partial structures from the partial structures extracted from each pattern description regardless of the relationship between the partial structures. However, this method cannot be applied to document editing in which a set of partial structures satisfying a certain positional relationship is extracted to create an output document.
【0009】例を用いて前記(2−1)の問題点を説明
する。例えば、各個人や小グループから文書として送ら
れてくる発表論文情報をまとめ、著者氏名毎に論文の題
名を整理した一覧表(以降、一覧表Aと呼ぶ)を作成し
たいとする。共著者が存在する場合には、著者の数だけ
同じ論文の題名を重複して一覧表Aに掲載する。具体例
を図8に示す。図8において、入力文書801、802は送ら
れてくる発表論文情報であり、出力文書804は作成した
い一覧表Aである。The problem (2-1) will be described with reference to an example. For example, suppose that one wants to summarize the published paper information sent as a document from each individual or small group, and create a list (hereinafter referred to as List A) in which the titles of the papers are arranged for each author name. If there are co-authors, the title of the same paper is duplicated in List A by the number of authors. A specific example is shown in FIG. In FIG. 8, input documents 801 and 802 are sent paper information, and an output document 804 is a list A to be created.
【0010】このとき、前記発表論文情報は、著者氏名
や論文の題名の他に、投稿先学会名や論文概要などの情
報を含む、SGML形式で記述された構造化文書である
とする。すなわち、前記発表論文情報は、 1.<学会名>および</学会名>というタグで囲まれ
た投稿先学会名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 3.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造の繰り返し 4.<概要>および</概要>というタグで囲まれた論
文概要を表す部分構造 をこの順序で並べて、全体を<論文情報>および</論
文情報>というタグで囲んだ形式で表現する。ただし、
著者氏名を表す部分構造は、共著者が存在する場合に繰
り返される。例えば、図8の入力文書801、802をSGM
L形式で記述した例を図9に示す。図9において、符号
901は入力文書801をSGML形式で記述した構造化文
書、符号902は入力文書802をSGML形式で記述した構
造化文書である。At this time, it is assumed that the published paper information is a structured document described in the SGML format, which includes information such as the name of the society to which the paper is to be submitted and the outline of the paper, in addition to the author's name and the title of the paper. That is, the published paper information includes: 1. Partial structure indicating the name of the destination society enclosed by tags <Society name> and </ Society name> 2. Partial structure representing the title of the paper surrounded by tags <title> and </ title> 3. Repetition of the partial structure representing the author name surrounded by the tags <name> and </ name> The substructures representing the article outlines enclosed by the tags <Outline> and </ Outline> are arranged in this order, and the entire structure is expressed in a format enclosed by the tags <Article Information> and </ Article Information>. However,
The substructure representing the author's name is repeated if there is a co-author. For example, the input documents 801 and 802 in FIG.
FIG. 9 shows an example described in the L format. In FIG.
Reference numeral 901 denotes a structured document in which the input document 801 is described in the SGML format, and reference numeral 902 denotes a structured document in which the input document 802 is described in the SGML format.
【0011】また、前記作成したい一覧表Aは、 1.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 をこの順序で並べて全体を<表要素>および</表要素
>というタグで囲んだ部分構造を、さらに複数並べて、
全体を<一覧表A>および</一覧表A>というタグで
囲んだ形式で表現する。例えば、図8の出力文書804を
SGML形式で記述した例を図10に示す。The list A to be created is as follows: 1. A partial structure representing the author's name surrounded by tags <name> and </ name> The substructures representing the titles of the papers enclosed by the tags <title> and </ title> are arranged in this order, and the entire substructure enclosed by the tags <table element> and </ table element> is further arranged. ,
The whole is expressed in a format surrounded by tags of <list A> and </ list A>. For example, FIG. 10 shows an example in which the output document 804 in FIG. 8 is described in the SGML format.
【0012】以上の前提のもとで、前記特開平6−25
9421号公報に代表されるパターン記述を用いて、前
記一覧表Aを作成する処理例を説明する。Under the above-mentioned premise, the above-mentioned Japanese Patent Laid-Open Publication No.
An example of processing for creating the list A will be described using a pattern description typified by No. 9421.
【0013】まず、従来の方式で扱うことのできる例と
して、入力となる前記発表論文情報には共著者がないと
仮定する。すなわち、前記発表論文情報は、 1.<学会名>および</学会名>というタグで囲まれ
た投稿先学会名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 3.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造 4.<概要>および</概要>というタグで囲まれた論
文概要を表す部分構造 をこの順序で並べて、全体を<論文情報>および</論
文情報>というタグで囲んだ形式で表現するとする。First, as an example that can be handled by the conventional method, it is assumed that there is no co-author in the published paper information to be input. That is, the published paper information includes: 1. Partial structure indicating the name of the destination society enclosed by tags <Society name> and </ Society name> 2. Partial structure representing the title of the paper surrounded by tags <title> and </ title> 3. A partial structure representing the author's name surrounded by tags <name> and </ name> Suppose that the substructures representing the article outline enclosed by the tags <summary> and </ summary> are arranged in this order, and the entire structure is expressed in the format enclosed by the tags <article information> and </ article information>.
【0014】1つのパターンによって抽出できる部分構
造が1つに限られる従来の方式では、抽出したい部分構
造毎に用意したパターン記述を用いて、前記発表論文情
報から部分構造を抽出する。すなわち、 a.前記論文の題名を抽出するパターンを用いて、前記
発表論文情報から、前記論文の題名を表す部分構造を抽
出し、 b.前記著者氏名を抽出するパターンを用いて、前記発
表論文情報から、前記著者氏名を表す部分構造を抽出す
る。 そして、抽出した各部分構造の組を作り、前記一覧表A
にまとめあげる。すなわち、 c.前記a.で抽出した部分構造を、抽出した順に1つ
取り出し、前記b.で抽出した部分構造を、抽出した順
に1つ取り出して、前記2つの部分構造を並べて<表要
素>および</表要素>というタグで囲む、という処理
を、前記a.および b.で抽出した全ての部分構造に対して順に行う。In the conventional method in which only one partial structure can be extracted by one pattern, a partial structure is extracted from the published paper information by using a pattern description prepared for each partial structure to be extracted. That is, a. Extracting a partial structure representing the title of the paper from the published paper information using a pattern for extracting the title of the paper; b. A partial structure representing the author name is extracted from the published paper information using the pattern for extracting the author name. Then, a set of each extracted partial structure is created, and the list A
I will put it together. That is, c. A. Out of the partial structure extracted in step b. The process of taking out one of the partial structures extracted in the order of extraction and arranging the two partial structures and enclosing them with tags of <table element> and </ table element> is performed in the a. And b. Are performed in order for all the partial structures extracted in step (1).
【0015】d.前記c.の処理によって得られた部分
構造を並べて、全体を<一覧表A>および</一覧表A
>というタグで囲む。 以上の処理により、共著者がない発表論文情報から一覧
表Aを作成することはできる。D. Said c. The partial structures obtained by the above processing are arranged, and the whole is described in <List A> and </ List A
Surround with> tags. With the above processing, it is possible to create the list A from the published paper information having no co-author.
【0016】次に、入力となる前記発表論文情報には共
著者がないという仮定をなくし、共著者の存在する発表
論文情報が入力文書に含まれる場合を考える。入力文書
に、共著者の存在する発表論文情報が含まれている場合
には、前記c.の処理は、 c’.同じ発表論文情報の中にあって、論文の題名、著
者氏名の順で並んでいる全ての組合せを求め、それぞれ
を、<表要素>および</表要素>というタグで囲む。
としなければならない。しかしながら、従来の方式で
は、論文の題名と著者氏名は、それぞれ別々のパターン
で抽出するため、前記c’.の処理で必要となる「同じ
発表論文情報の中に並んでいる」という関係を規定する
ことができない。例えば、図9の構造化文書901および9
02から、図10のような出力文書を作成したい場合でも、
図11に示すように、構造化文書901および902から抽出し
た論文の題名を表す部分構造1102と著者氏名を表す部分
構造1103とをどのように組み合わせたらよいかが分から
ないため、出力文書1101を作成することができない。従
って、従来の方式では、上記例で、共著者の存在する発
表論文情報から一覧表を作成する場合などのように、抽
出した部分構造間の関係が指定される文書編集処理はで
きないという問題点があった。Next, it is assumed that there is no co-author in the published paper information to be input, and that the published document information in which the co-author exists is included in the input document. If the input document includes published paper information in which a co-author exists, the above c. The processing of c ′. In the same published paper information, all combinations arranged in the order of the title of the paper and the name of the author are obtained, and each combination is surrounded by tags of <table element> and </ table element>.
And must be. However, in the conventional method, the title of the paper and the name of the author are extracted in different patterns, respectively. It is not possible to define the relationship that "they are arranged in the same published dissertation information", which is required in the processing of. For example, structured documents 901 and 9 in FIG.
From 02, even if you want to create an output document like Figure 10,
As shown in FIG. 11, since it is not known how to combine the substructure 1102 representing the title of the paper extracted from the structured documents 901 and 902 and the substructure 1103 representing the author's name, the output document 1101 is created. Can not do it. Therefore, the conventional method cannot perform the document editing process in which the relationship between the extracted partial structures is specified, such as in the case of creating a list from the published paper information in which the co-author exists in the above example. was there.
【0017】よって、抽出箇所間のつながりを維持して
部分構造を抽出することのできる編集箇所記述要素、お
よび前記編集箇所記述要素を解釈して部分構造の抽出処
理を実行する手段が必要となった。Therefore, it is necessary to provide an edit location description element capable of extracting a partial structure while maintaining the connection between the extraction locations, and a means for interpreting the edit location description element and executing a partial structure extraction process. Was.
【0018】(2−2)特開平6−259421号公報
に代表される従来の文書編集方式のパターン記述におい
て、複数の抽出箇所から部分構造を同時に1つのかたま
りとして抽出するパターンが記述できるとした場合で
も、抽出した部分構造のかたまりを利用する際に、部分
構造のかたまりから個々の部分構造を取り出す処理、あ
るいは、部分構造のかたまりの中の部分構造の並んでい
る順番を変えるための処理などが別途必要となるという
問題点があった。(2-2) In a pattern description of a conventional document editing method represented by Japanese Patent Application Laid-Open No. 6-259421, a pattern in which a partial structure is simultaneously extracted from a plurality of extraction locations as one block can be described. Even in this case, when using the extracted cluster of substructures, processing to extract individual substructures from the cluster of substructures, or processing to change the order in which substructures are arranged in the cluster of substructures However, there is a problem in that a separate is required.
【0019】例を用いて前記(2−2)の問題点を説明
する。例えば、図9の構造化文書901および902から前記
方式により一覧表Aを作成した例を図12に示す。図12に
おいて、構造化文書901および902から、題名、氏名の並
びからなる部分文書のかたまりを抽出することができた
とする。このとき、前記抽出した部分文書1202をそのま
ま用いて一覧表Aを作成した場合には、図12の出力文書
1201のように、著者氏名、論文の題名の順に並ぶべきな
のに対し、論文の題名、著者氏名の順となってしまう。The problem (2-2) will be described using an example. For example, FIG. 12 shows an example in which the list A is created from the structured documents 901 and 902 in FIG. In FIG. 12, it is assumed that a chunk of a partial document composed of a sequence of titles and names can be extracted from the structured documents 901 and 902. At this time, when the list A is created using the extracted partial document 1202 as it is, the output document of FIG.
As shown in 1201, the author's name and the title of the paper should be arranged in this order, but the title of the paper and the author's name are in that order.
【0020】よって、抽出箇所間のつながりを維持して
部分構造を抽出し、かつ、パターン上の抽出箇所毎に別
々に扱うことのできる編集箇所記述要素、および前記編
集箇所記述要素を解釈して部分構造の抽出処理を実行す
る手段が必要となった。Therefore, the editing part description element which can extract the partial structure while maintaining the connection between the extraction parts, and which can be separately handled for each extraction part on the pattern, and interprets the editing part description element A means for executing a partial structure extraction process is required.
【0021】(2−3)特開平6−259421号公報
に代表される従来の文書編集方式のパターン記述の構文
要素には、順序関係を表す記号はあるが、順不同の並列
関係を表す記号はない。特にSGML形式で記述された
構造化文書を扱う場合などは、複数種類の部分構造を任
意の順序で並べて記述することも可能であるため、前記
任意の順序で並べて記述された部分構造とマッチするパ
ターンを、順序関係を表す記号を用いて記述すると、記
述が繁雑になるという問題点があった。(2-3) The syntax elements of the pattern description of the conventional document editing method represented by JP-A-6-259421 include symbols indicating an order relation, but symbols indicating an unordered parallel relation include: Absent. In particular, when dealing with a structured document described in the SGML format, since a plurality of types of partial structures can be described in any order, it is possible to match the partial structure described in the arbitrary order. When a pattern is described using a symbol indicating an order relation, there is a problem that the description becomes complicated.
【0022】例を用いて前記(2−3)の問題点を説明
する。例えば、前記発表論文情報の表現形式のうち、投
稿先学会名を表す部分構造と、論文の題名を表す部分構
造との記述順序は問わない記述形式の発表論文情報(以
降、発表論文情報2と呼ぶ)から、投稿先学会名と論文
の題名との対応を整理した一覧表(以降、一覧表Bと呼
ぶ)を作成したいとする。The problem (2-3) will be described using an example. For example, in the presentation format of the published paper information, the published paper information in a description format (hereinafter referred to as published paper information 2 in which the substructure representing the name of the contributing society and the substructure representing the title of the paper are not specified. Call), it is assumed that the user wants to create a list (hereinafter, referred to as list B) in which the correspondence between the destination academic society name and the title of the paper is arranged.
【0023】すなわち、 1.次の2種類の部分構造を、任意の順序で両方とも記
述 1−1.<学会名>および</学会名>というタグで囲
まれた投稿先学会名を表す部分構造 1−2.<題名>および</題名>というタグで囲まれ
た論文の題名を表す部分構造 2.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造の繰り返し 3.<概要>および</概要>というタグで囲まれた論
文概要を表す部分構造 をこの順序で並べ、全体を<論文情報2>および</論
文情報2>というタグで囲んだ形式で表現したものが発
表論文情報2であり、また、 1.<学会名>および</学会名>というタグで囲まれ
た投稿先学会名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 をこの順序で並べて全体を<表要素>および</表要素
>というタグで囲んだ部分構造を、さらに複数並べて、
全体を<一覧表B>および</一覧表B>というタグで
囲んだ形式で表現したものが作成したい一覧表Bである
とする。That is, 1. Both of the following two types of partial structures are described in an arbitrary order 1-1. Partial structure that represents the name of the post-destination society enclosed by tags <society name> and </ society name> 1-2. 1. Partial structure representing the title of the paper enclosed by tags <title> and </ title> 2. Repetition of a partial structure representing the author's name surrounded by tags <name> and </ name> The substructures that represent the abstract of the paper enclosed by the tags <Summary> and </ Outline> are arranged in this order, and the entire structure is expressed in the format enclosed by the tags <Article Information 2> and </ Article Information 2> Is the published paper information 2; 1. Partial structure indicating the name of the destination society enclosed by tags <Society name> and </ Society name> The substructures representing the titles of the papers enclosed by the tags <title> and </ title> are arranged in this order, and the entire substructure enclosed by the tags <table element> and </ table element> is further arranged. ,
It is assumed that a list B to be created is expressed in a format surrounded by tags of <list B> and </ list B>.
【0024】論文情報2のSGML形式による記述例を
図27の入力文書2701および入力文書2702に、また、一覧
表BのSGML形式による記述例を図27の出力文書2703
に示す。The description example of the dissertation information 2 in the SGML format is shown in the input document 2701 and the input document 2702 of FIG. 27, and the description example of the list B in the SGML format is the output document 2703 of FIG.
Shown in
【0025】以上の前提のもとで、前記特開平6−25
9421号公報に代表されるパターン記述を用いて、前
記発表論文情報2を表す入力文書2601と入力文書2602か
ら前記一覧表Bを表す出力文書2604を文書編集方式2603
により作成することを考える(図26参照)。On the basis of the above assumptions, Japanese Patent Laid-Open Publication No.
Utilizing a pattern description represented by U.S. Pat. No. 9421, an output document 2604 representing the list B is converted from the input document 2601 and the input document 2602 representing the published paper information 2 into a document editing method 2603.
(See FIG. 26).
【0026】前記投稿先学会名を表す部分構造および論
文の題名を表す部分構造を抽出するためのパターン記述
は、 1.投稿先学会名を表す部分構造、論文の題名を表す部
分構造の順で記述された場合 2.論文の題名を表す部分構造、投稿先学会名を表す部
分構造の順で記述された場合 の2通りを考慮する必要があるため、前記特開平6−2
59421号公報では、 1.投稿先学会名を表す部分構造、論文の題名を表す部
分構造の順で記述された場合のパターン記述 論文情報/(学会名#題名) 2.論文の題名を表す部分構造、投稿先学会名を表す部
分構造の順で記述された場合のパターン記述 論文情報/(題名#学会名) の2通りのパターンを記述する必要が生じる。The pattern description for extracting the partial structure representing the name of the destination society and the partial structure representing the title of the paper are as follows: 1. When the structure is described in the order of the substructure indicating the name of the society to which the post is submitted and the substructure indicating the title of the paper Since it is necessary to consider two cases, that is, a partial structure representing the title of the paper and a partial structure representing the name of the contributing society, the above-mentioned Japanese Patent Laid-Open Publication No.
No. 59421 discloses: 1. Pattern description when the partial structure representing the name of the contributing society and the partial structure representing the title of the paper are described in this order. Paper information / (conference name # title) Pattern description when the partial structure representing the title of the dissertation and the partial structure representing the contributing society name are described in this order. It is necessary to describe two patterns: dissertation information / (title #society name).
【0027】前記例では、記述順序を問わない部分構造
は2つであるためパターンを2通り用意すれば十分であ
ったが、一般に、記述順序を問わない部分構造がn個あ
った場合には、パターンをn!通り用意する必要がある
(!は階乗計算)。例えば、記述順序を問わない部分構
造が5個あった場合には、120通りのパターンを用意し
なければならず、前記特開平6−259421号公報に
代表される従来の文書編集方式では、パターン記述が非
常に繁雑となる。In the above example, since there are two partial structures irrespective of the description order, it is sufficient to prepare two patterns, but in general, when there are n partial structures irrespective of the description order, , Pattern n! It is necessary to prepare as follows (! Is factorial calculation). For example, when there are five partial structures irrespective of the description order, 120 patterns must be prepared. In the conventional document editing method represented by the above-mentioned JP-A-6-259421, the pattern Description becomes very complicated.
【0028】よって、順不同の並列関係を記述すること
のできる編集箇所記述要素、および前記編集箇所記述要
素を解釈して部分構造の抽出処理を実行する手段が必要
となった。Therefore, an edit location description element capable of describing an unordered parallel relationship, and a means for interpreting the edit location description element and executing a partial structure extraction process are required.
【0029】[0029]
【課題を解決するための手段】本発明の文書編集方式
は、複数の構造化文書を読み込み、文書の構造を単位と
して複数の抽出箇所を指定するパターン記述に従って、
抽出箇所間のつながりを維持しながら、前記構造化文書
から部分構造を抽出するようにしている。According to the document editing method of the present invention, a plurality of structured documents are read, and a plurality of extraction locations are specified in units of the document structure according to a pattern description.
The partial structure is extracted from the structured document while maintaining the connection between the extraction locations.
【0030】本発明の文書編集方式は、1つ以上の構造
化文書を順次読み込む構造化文書入力手段と、前記構造
化文書入力手段の読み込んだ入力文書の一部分である部
分構造を指定する、文書タグ、文書文字パターン、ワイ
ルドカードタグ、否定指定子、引用指定子、順序接続
子、階層接続子、括弧によって構成される編集箇所記述
要素を、AND接続子、OR接続子、括弧で結合した編
集箇所記述が1つ以上記述されている文書処理記述手段
と、前記部分構造を、前記文書処理記述手段に記述され
た編集箇所記述中の引用指定子毎に分け、かつ、前記入
力文書と前記編集箇所記述とのマッチが成立した順に蓄
積する文書蓄積手段と、前記文書処理記述手段から編集
箇所記述を取り出し、前記編集箇所記述を構成する各編
集箇所記述要素と入力文書とのマッチを試み、マッチが
成立した前記編集箇所記述中に記述された引用指定子に
対応する部分構造を前記文書蓄積手段に蓄積し、また、
前記編集箇所記述中のAND接続子で結合された編集箇
所記述要素の少なくとも1つのマッチが成立しない場合
には、前記AND接続子で結合された各編集箇所記述要
素に対応する部分構造を前記文書蓄積手段から削除し、
また、前記編集箇所記述中のOR接続子で結合された編
集箇所記述要素のどのマッチも成立しない場合には、前
記OR接続子で結合された各編集箇所記述要素に対応す
る部分構造を前記文書蓄積手段から削除して抽出処理を
行う文書編集処理実行手段と、前記文書蓄積手段に蓄積
された文書をそのまま、あるいは加工して出力する文書
出力手段とから構成されるようにしてもよい。According to the document editing method of the present invention, there is provided a structured document input means for sequentially reading one or more structured documents, and a document designating a partial structure which is a part of the input document read by the structured document input means. Editing that combines edit location description elements consisting of tags, document character patterns, wildcard tags, negation specifiers, quote specifiers, sequence connectors, hierarchical connectors, and parentheses with AND connectors, OR connectors, and parentheses Document processing description means in which one or more location descriptions are described, and the partial structure is divided for each citation specifier in the edit location description described in the document processing description means, and the input document and the editing A document storage unit that accumulates data in the order in which a match with the location description is established; an edit location description extracted from the document processing description means; Attempts to match with the document, and storing the corresponding partial structure match is described in the editing location description established cited specifier in the document storage means,
If at least one match of the edit location description elements connected by the AND connector in the edit location description does not hold, the partial structure corresponding to each edit location description element connected by the AND connector is converted into the document. Delete from storage means,
If none of the edit location description elements connected by the OR connector in the edit location description match, no partial structure corresponding to each edit location description element connected by the OR connector is written in the document. It may be configured to include a document editing process executing unit that deletes the document from the storage unit and performs an extraction process, and a document output unit that outputs the document stored in the document storage unit as it is or after processing.
【0031】[作用]本発明の文書編集方式は、文書の
構造を単位として編集箇所を指定する編集箇所記述を解
釈し、部分構造を抽出する文書編集処理実行手段を備え
る。これにより、文書の構造を単位としてパターン記述
し、また、文書編集処理を行うことが可能となり、前記
「発明が解決しようとする課題」の(1)の問題点が解
決する。[Operation] The document editing method according to the present invention includes a document editing process executing means for interpreting an editing portion description specifying an editing portion in units of a document structure and extracting a partial structure. This makes it possible to describe a pattern in units of the structure of a document and to perform a document editing process, thereby solving the problem (1) of the “problem to be solved by the invention”.
【0032】また、本発明の文書編集方式は、編集箇所
記述中に複数の引用指定子(抽出箇所を指定する記号)
が記述でき、かつ、文書編集処理実行手段のマッチ処理
によって抽出された部分構造は、マッチが成立した順
に、引用指定子毎に分けて文書蓄積手段に蓄積されてい
る。これにより、1つの編集箇所記述によって複数の部
分構造を同時に抽出し、かつ、抽出した部分構造を、抽
出箇所間のつながりを維持しつつ、編集箇所記述中の引
用指定子毎に別々に扱うことができ、前記「発明が解決
しようとする課題」の(2−1)および(2−2)の問
題点が解決する。Further, according to the document editing method of the present invention, a plurality of citation specifiers (symbols for specifying extraction locations) are described in the editing location description
Can be described, and the partial structures extracted by the matching process of the document editing process executing means are stored in the document storing means for each citation specifier in the order in which the match is established. As a result, a plurality of partial structures are simultaneously extracted by one edit location description, and the extracted partial structures are separately handled for each citation specifier in the edit location description while maintaining the connection between the extracted locations. Thus, the problems (2-1) and (2-2) of the "problems to be solved by the invention" can be solved.
【0033】また、本発明の文書編集方式は、編集箇所
記述中に順不同の並列関係を表すAND接続子が記述で
き、前記編集箇所記述を解釈し、部分構造を抽出する文
書編集処理実行手段を備える。これにより、SGML形
式など、複数種類の部分構造を任意の順序で並べて記述
することが可能な形式で記述された構造化文書を扱う場
合でも、記述が簡潔となり、前記「発明が解決しようと
する課題」の(2−3)の問題点が解決する。Further, according to the document editing method of the present invention, an AND connector representing an out-of-order parallel relationship can be described in the edit location description, and the document edit processing execution means for interpreting the edit location description and extracting a partial structure is provided. Prepare. As a result, even when a structured document described in a format in which a plurality of types of partial structures can be described in an arbitrary order, such as an SGML format, is described, the description is simplified, and the above-mentioned “Invention is to be solved” The problem (2-3) of the “problem” is solved.
【0034】[0034]
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。Next, embodiments of the present invention will be described in detail with reference to the drawings.
【0035】以降では、入力文書、出力文書とも、SG
ML形式である例について説明する。Hereinafter, both the input document and the output document will be referred to as SG.
An example in the ML format will be described.
【0036】まず、本発明における編集箇所記述の各構
成要素の定義と、表記形式の一例を説明する。なお、編
集箇所記述の各構成要素は、一般に、構造化文書中の複
数の部分構造とマッチする。どの部分構造を選択してマ
ッチ処理を進めるかは、マッチ処理を実行する文書編集
処理実行手段の処理方式に依存する(例えば、任意の部
分構造を始点として編集箇所記述要素とマッチする全て
の部分構造を求める方式もしくは、任意の部分構造を始
点として編集箇所記述要素とマッチする最初の部分構造
を求める方式もしくは、任意の部分構造を始点として編
集箇所記述要素とマッチする最後の部分構造を求める方
式もしくは、任意の部分構造を始点として編集箇所記述
要素とマッチする部分構造のうち、包含関係にある部分
構造は最も外側の部分構造を選択する方式もしくは、任
意の部分構造を始点として編集箇所記述要素とマッチす
る部分構造のうち、包含関係にある部分構造は最も内側
の部分構造を選択する方式などの処理方式がある)。First, the definition of each component of the edit location description and an example of the notation format in the present invention will be described. Note that each component of the edit location description generally matches a plurality of partial structures in the structured document. Which partial structure is selected to proceed with the matching process depends on the processing method of the document editing process executing means for executing the matching process (for example, all the portions that match the edit location description element starting from an arbitrary substructure) A method for obtaining the structure, or a method for obtaining the first substructure that matches the edit location description element starting from an arbitrary substructure, or a method for obtaining the last partial structure that matches the edit location description element starting from an arbitrary substructure Alternatively, among the substructures that match the edit location description element with an arbitrary substructure as the starting point, the substructure that has an inclusive relation selects the outermost substructure, or the edit location description element with the arbitrary substructure as the start point Among the substructures that match with, the processing method such as the method of selecting the innermost substructure is used for the substructure that has an inclusive relation. ).
【0037】(a)文書タグ:部分構造に付けられた名
前を<と>とで囲んで表記する マッチさせたい部分構造を特定する名前を文書タグとし
て指定することにより、名前の合致する部分構造とマッ
チする。例えば、SGML形式では、部分構造に付けら
れた名前として、タグ名を利用することが考えられる。(A) Document tag: A name given to a partial structure is described by enclosing it with <and> By specifying a name specifying a partial structure to be matched as a document tag, a partial structure whose name matches Matches For example, in the SGML format, a tag name may be used as a name given to a partial structure.
【0038】例として、図13を用いて説明する。符号13
01は編集箇所記述、符号1302はSGML形式の構造化文
書である。図13の例では、編集箇所記述1301中には、文
書タグ<注意事項>が記述されている。編集箇所記述13
01と構造化文書1302とのマッチ処理の過程において、前
記文書タグは、図13に示す通り、構造化文書1302の現在
着目している部分構造中に並んでいる部分構造のう
ち、”注意事項”という名前のタグによって囲まれた部
分構造とマッチする。An example will be described with reference to FIG. Code 13
01 is an edit location description, and reference numeral 1302 is a structured document in the SGML format. In the example of FIG. 13, a document tag <notes> is described in the edit location description 1301. Edit location description 13
In the process of matching between 01 and the structured document 1302, as shown in FIG. 13, the document tag includes, among the substructures currently arranged in the focused structure of the structured document 1302, Matches a substructure enclosed by tags named "".
【0039】(b)文書文字パターン:正規表現記号を
含む文字列からなる文字パターンを”と”とで囲んで表
記する 文字列、もしくは、文字列に加えてsedなどのUNI
Xコマンドで一般的な正規表現記号を文書文字パターン
として指定することにより、合致する文字パターンの出
現する文書データとマッチする。なお、文書データと
は、例えば、SGML形式の構造化文書では、タグを除
く文章部分のことである。(B) Document character pattern: A character string consisting of a character string containing a regular expression symbol enclosed in "and", or a UNI such as sed in addition to the character string.
By specifying a general regular expression symbol as a document character pattern with the X command, the document data matches the document data in which the matching character pattern appears. Note that, for example, in a structured document in the SGML format, the document data is a text portion excluding a tag.
【0040】例として、図14を用いて説明する。図14の
符号1401は編集箇所記述、符号1402はSGML形式の構
造化文書である。図14の例では、編集箇所記述1401中に
は、文書文字パターン”the”が記述されている。編集
箇所記述1401と構造化文書1402とのマッチ処理の過程に
おいて、前記文書文字パターンは、図14に示す通り、構
造化文書1402の現在着目している部分構造中に並んでい
る文書データのうち、”the”という文字列を含んだ文
書データとマッチする。An example will be described with reference to FIG. Reference numeral 1401 in FIG. 14 denotes an edit location description, and reference numeral 1402 denotes a structured document in the SGML format. In the example of FIG. 14, the edit character description 1401 describes the document character pattern “the”. In the process of matching between the edited portion description 1401 and the structured document 1402, as shown in FIG. 14, the document character pattern is one of the document data arranged in the currently focused partial structure of the structured document 1402. , "The" and the document data containing the character string.
【0041】(c)ワイルドカードタグ:<*>と表記
する 後述する階層関係にある任意個の任意の名前の文書タグ
とマッチする。(C) Wildcard tag: expressed as <*> Matches with a document tag having an arbitrary name and an arbitrary name in a hierarchical relationship described later.
【0042】例として、図15を用いて説明する。図15の
符号1501は編集箇所記述、符号1502はSGML形式の構
造化文書である。図15の例では、編集箇所記述1501中に
は、ワイルドカードタグ<*>が記述されており、ま
た、構造化文書1502は、”本文”の中に”章”があ
り、”章”の中に”節”があり、”節”の中に”項”が
あり、”項”の中は文書データのみ、という文書構造で
ある。編集箇所記述1501と構造化文書1502とのマッチ処
理の過程において、図15に示す通り、構造化文書1502の
現在着目している部分構造が"章"である場合には、前記
ワイルドカードタグは、 1.「空」の構造とマッチ(0個の階層とマッチ) 2.”節”の構造とマッチ 3.”節”の中に”項”がある構造とマッチ の3通りの部分構造とマッチする。An example will be described with reference to FIG. In FIG. 15, reference numeral 1501 denotes an edit location description, and reference numeral 1502 denotes an SGML structured document. In the example of FIG. 15, a wildcard tag <*> is described in the edit location description 1501, and the structured document 1502 has a “chapter” in the “body” and a “chapter” The document structure has a “section” in it, a “section” in the “section”, and only the document data in the “section”. In the process of the matching process between the edited portion description 1501 and the structured document 1502, as shown in FIG. 15, when the currently focused partial structure of the structured document 1502 is a “chapter”, the wildcard tag is , 1. 1. Match "empty" structure (match 0 layers) 2. Match the structure of the “section” Matches three types of substructures: "structure" with "term" in "section" and match.
【0043】(d)否定指定子:!で表記する 否定指定子の直後の記述とのマッチが成り立たない部分
構造とマッチする。(D) Negative specifier:! Matches a substructure that does not match the description immediately following the negation specifier.
【0044】例として、図16を用いて説明する。図16の
符号1601は編集箇所記述、符号1602はSGML形式の構
造化文書である。図16の例では、編集箇所記述1601中に
は、否定指定子!の直後に文書文字パターン”this”が
記述されている。編集箇所記述1601と構造化文書1602と
のマッチ処理の過程において、前記否定指定子および前
記否定指定子の直後の文書文字パターンは、図16に示す
通り、構造化文書1602の現在着目している部分構造中に
並んでいる文書データのうち、”this”という文字列を
含まない文書データとマッチする。An example will be described with reference to FIG. Reference numeral 1601 in FIG. 16 denotes an edit location description, and reference numeral 1602 denotes an SGML structured document. In the example of FIG. 16, the negative designator! Is immediately followed by the document character pattern "this". In the process of matching between the edited portion description 1601 and the structured document 1602, the negative specifier and the document character pattern immediately after the negative specifier are currently focused on the structured document 1602 as shown in FIG. Matches document data that does not include the character string “this” among the document data arranged in the partial structure.
【0045】(e)引用指定子:%で表記する 引用指定子の直後の記述とマッチした部分構造を抽出す
る。(E) Quotation specifier: expressed in% A partial structure that matches the description immediately after the quote specifier is extracted.
【0046】例として、図17を用いて説明する。図17の
符号1701は編集箇所記述、符号1702はSGML形式の構
造化文書である。図17の例では、編集箇所記述1701中に
は、引用指定子%の直後に文書タグ<注意事項>が記述
されている。編集箇所記述1701と構造化文書1702とのマ
ッチ処理の過程において、前記文書タグは、図17に示す
通り、構造化文書1702の現在着目している部分構造中に
並んでいる部分構造のうち、”注意事項”という名前の
タグによって囲まれた部分構造とマッチするため、編集
箇所記述1701によって、前記マッチした部分構造が抽出
される。An example will be described with reference to FIG. Reference numeral 1701 in FIG. 17 denotes an edit location description, and reference numeral 1702 denotes a structured document in the SGML format. In the example of FIG. 17, in the edit location description 1701, a document tag <notes> is described immediately after the quote specifier%. In the process of the matching process between the edited portion description 1701 and the structured document 1702, the document tag is, as shown in FIG. 17, among the partial structures that are currently lined up in the currently focused partial structure of the structured document 1702, Since the substructure is matched with a substructure surrounded by a tag named "Notes", the matched substructure is extracted by the edit location description 1701.
【0047】(f)順序接続子:,で表記する 順序接続子の直前の記述にマッチする部分構造(部分構
造Aとする)と、前記順序接続子の直後の記述にマッチ
する部分構造(部分構造Bとする)とが、同じ部分構造
の中に部分構造A、部分構造Bの順序で並んでいる場合
にマッチが成立する。部分構造Aと部分構造Bとの間に
他の部分構造が存在していてもマッチが成立する。(F) Order connector: A partial structure (partial structure A) that matches the description immediately before the order connector, and a partial structure (part) that matches the description immediately after the order connector A match is established when the same partial structure is arranged in the same partial structure in the order of partial structure A and partial structure B. A match is established even if another partial structure exists between the partial structure A and the partial structure B.
【0048】例として、図18を用いて説明する。図18の
符号1801は編集箇所記述、符号1802はSGML形式の構
造化文書である。図18の例では、編集箇所記述1801中に
は、順序接続子,の直前に文書タグ<はじめに>が記述
されており、かつ、前記順序接続子の直後に文書タグ<
おわりに>が記述されている。編集箇所記述1801と構造
化文書1802とのマッチ処理の過程において、図18に示す
通り、順序接続子の直前の文書タグと、構造化文書1802
の現在着目している部分構造中に並んでいる”はじめ
に”という名前のタグによって囲まれた部分構造とがマ
ッチし、さらに、前記順序接続子の直後の文書タグと、
前記マッチした部分構造より後方に並んでいる”おわり
に”という名前のタグによって囲まれた部分構造とがマ
ッチするため、前記順序接続子と、前記順序接続子の前
後の文書タグとで構成された記述のマッチが成立する。An example will be described with reference to FIG. In FIG. 18, reference numeral 1801 denotes an edit location description, and reference numeral 1802 denotes an SGML structured document. In the example of FIG. 18, in the edit location description 1801, a document tag <introduction> is described immediately before the sequence connector, and a document tag <
Conclusion> is described. In the process of matching between the edit location description 1801 and the structured document 1802, as shown in FIG. 18, the document tag immediately before the sequence connector and the structured document 1802
Matches the substructure surrounded by the tag named “Introduction” in the substructure currently focused on, and further, a document tag immediately after the order connector,
Since the partial structure surrounded by a tag named “conclusion” arranged rearward from the matched partial structure matches, it is composed of the sequential connector and the document tags before and after the sequential connector. The description matches.
【0049】(g)階層接続子:2つの記述の間に何も
文字を入れないことで表記する 階層接続子の直前の記述にマッチする部分構造(部分構
造Cとする)の中に、前記階層接続子の直後の記述にマ
ッチする部分構造(部分構造Dとする)がある場合にの
みマッチが成立する。なお、部分構造Cの中で、部分構
造Dの前に他の部分構造が並んでいてもマッチは成立す
る。(G) Hierarchical connector: expressed by inserting no characters between two descriptions In a partial structure (partial structure C) that matches the description immediately before the hierarchical connector, A match is established only when there is a substructure (substructure D) that matches the description immediately after the hierarchical connector. Note that, even if another partial structure is arranged before the partial structure D in the partial structure C, a match is established.
【0050】例として、図19を用いて説明する。図19の
符号1901は編集箇所記述、符号1902はSGML形式の構
造化文書である。図19の例では、編集箇所記述1901中に
は、階層接続子の直前に文書タグ<節>が記述されてお
り、かつ、前記並列接続子の直後に文書タグ<項>が記
述されている。また、構造化文書1902は、”本文”の中
に”章”があり、”章”の中に”節”があり、”節”の
中に”項”があり、”項”の中は文書データのみ、とい
う文書構造である。編集箇所記述1901と構造化文書1902
とのマッチ処理の過程において、図19に示す通り、階層
接続子の直前の文書タグと、構造化文書1902の現在着目
している部分構造中に並んでいる”節”という名前のタ
グによって囲まれた部分構造とがマッチし、さらに、前
記階層接続子の直後の文書タグと、前記マッチした部分
構造の中に並んでいる”項”という名前のタグによって
囲まれた部分構造とがマッチするため、前記階層接続子
と、前記階層接続子の前後の文書タグとで構成された記
述のマッチが成立する。An example will be described with reference to FIG. In FIG. 19, reference numeral 1901 denotes an edit location description, and reference numeral 1902 denotes an SGML structured document. In the example of FIG. 19, in the edit location description 1901, a document tag <section> is described immediately before the hierarchical connector, and a document tag <item> is described immediately after the parallel connector. . In the structured document 1902, the “body” includes “chapter”, the “chapter” includes “section”, the “section” includes “section”, and the “section” includes The document structure has only document data. Edit location description 1901 and structured document 1902
As shown in FIG. 19, in the process of the matching process with the document tag, the document tag immediately before the hierarchical connector and the tag named “section” arranged in the currently focused partial structure of the structured document 1902 Matches with the document tag immediately after the hierarchical connector and the substructure surrounded by tags named “parameters” arranged in the matched substructure. Therefore, a match of the description composed of the hierarchical connector and the document tags before and after the hierarchical connector is established.
【0051】(h)括弧:(および)で表記する 括弧によって囲まれた記述のマッチが優先処理される。(H) Parentheses: Notation expressed by (and) Matching of the description enclosed in parentheses is preferentially processed.
【0052】(i)AND接続子:&で表記する AND接続子の直前の記述にマッチする部分構造(部分
構造Eとする)と、前記AND接続子の直後の記述にマ
ッチする部分構造(部分構造Fとする)とが、同じ部分
構造中に並んでいる場合にマッチが成立する。部分構造
Eと部分構造Fとが並んでいる順序は問わず、また、2
つの部分構造の間に他の部分構造が存在していてもマッ
チが成立する。(I) AND connector: A partial structure (partial structure E) matching the description immediately before the AND connector expressed by & and a partial structure (partial structure) matching the description immediately after the AND connector Are matched in the same partial structure. The order in which the partial structures E and F are arranged is not limited.
A match is established even if another substructure exists between one substructure.
【0053】例として、図20を用いて説明する。図20の
符号2001は編集箇所記述、符号2002はSGML形式の構
造化文書である。図20の例では、編集箇所記述2001中に
は、AND接続子&の直前に文書タグ<おわりに>が記
述されており、かつ、前記AND接続子の直後に文書タ
グ<はじめに>が記述されている。編集箇所記述2001と
構造化文書2002とのマッチ処理の過程において、図20に
示す通り、AND接続子の直前の文書タグと、構造化文
書2002の現在着目している部分構造中に並んでいる”お
わりに”という名前のタグによって囲まれた部分構造と
がマッチし、さらに、AND接続子の直後の文書タグ
と、前記現在着目している部分構造中に並んでいる”は
じめに”という名前のタグによって囲まれた部分構造と
がマッチするため、前記AND接続子と、前記AND接
続子の前後の文書タグとで構成された記述のマッチが成
立する。An example will be described with reference to FIG. Reference numeral 2001 in FIG. 20 denotes an edit location description, and reference numeral 2002 denotes a structured document in the SGML format. In the example of FIG. 20, a document tag <conclusion> is described immediately before the AND connector & in the edit location description 2001, and a document tag <beginning> is described immediately after the AND connector. ing. In the process of matching the edited portion description 2001 with the structured document 2002, as shown in FIG. 20, the document tag immediately before the AND connector is arranged in the partial structure of interest of the structured document 2002. The partial structure surrounded by the tag named “conclusion” matches, and further, the document tag immediately after the AND connector and the “initial” named “introduction” arranged in the partial structure of interest currently Since the partial structure enclosed by the tags matches, the description formed by the AND connector and the document tags before and after the AND connector is matched.
【0054】(j)OR接続子:|で表記する OR接続子の直前の記述にマッチする部分構造(部分構
造Gとする)と、前記OR接続子の直後の記述にマッチ
する部分構造(部分構造Hとする)の、少なくとも一方
の部分構造が存在する場合にマッチが成立する。(J) OR connector: A partial structure (partial structure G) matching the description immediately before the OR connector and a partial structure (partial structure) matching the description immediately after the OR connector The structure H) is matched when at least one of the partial structures exists.
【0055】例として、図21を用いて説明する。図21の
符号2101は編集箇所記述、符号2102はSGML形式の構
造化文書である。図21の例では、編集箇所記述2101中に
は、OR接続子|の直前に文書タグ<おわりに>が記述
されており、かつ、前記OR接続子の直後に文書タグ<
はじめに>が記述されている。編集箇所記述2101と構造
化文書2102とのマッチ処理の過程において、図21に示す
通り、OR接続子の直前の文書タグとマッチする部分構
造が、構造化文書2102の現在着目している部分構造中に
並んでいるかを調べ、さらに、OR接続子の直後の文書
タグとマッチする部分構造が、構造化文書2102の現在着
目している部分構造中に並んでいるかを調べる。OR接
続子の直後の文書タグとマッチする部分構造が存在する
ため、前記OR接続子と、前記OR接続子の前後の文書
タグとで構成された記述のマッチが成立する。An example will be described with reference to FIG. In FIG. 21, reference numeral 2101 denotes an edit location description, and reference numeral 2102 denotes an SGML structured document. In the example of FIG. 21, a document tag <conclusion> is described immediately before the OR connector | in the edit location description 2101, and a document tag <
First,> is described. In the process of matching between the edit location description 2101 and the structured document 2102, as shown in FIG. 21, the partial structure that matches the document tag immediately before the OR connector is the current partial structure of the structured document 2102. It is checked whether the partial structure that matches the document tag immediately after the OR connector is arranged in the currently focused partial structure of the structured document 2102. Since there is a partial structure that matches the document tag immediately after the OR connector, the description formed by the OR connector and the document tags before and after the OR connector matches.
【0056】図1は本発明の第1の実施の形態の構成図
である。図1を参照すると、本実施の形態の文書編集方
式は、構造化文書を順次読み込む構造化文書入力手段10
1と、前記構造化文書入力手段の読み込んだ入力文書の
部分構造を指定する編集箇所記述が1つ以上記述されて
いる文書処理記述手段102と、前記部分構造を、前記文
書処理記述手段に記述された編集箇所記述中の引用指定
子毎に分け、かつ、前記入力文書と前記編集箇所記述と
のマッチが成立した順に蓄積する文書蓄積手段103と、
前記文書処理記述手段から編集箇所記述を取り出し、前
記編集箇所記述を構成する各編集箇所記述要素と入力文
書とのマッチを試み、マッチが成立した前記編集箇所記
述中に記述された引用指定子に対応する部分構造を前記
文書蓄積手段に蓄積し、また、前記編集箇所記述中のA
ND接続子で結合された編集箇所記述要素の少なくとも
1つのマッチが成立しない場合には、前記AND接続子
で結合された各編集箇所記述要素に対応する部分構造を
前記文書蓄積手段から削除し、また、前記編集箇所記述
中のOR接続子で結合された編集箇所記述要素のどのマ
ッチも成立しない場合には、前記OR接続子で結合され
た各編集箇所記述要素に対応する部分構造を前記文書蓄
積手段から削除して抽出処理を行う文書編集処理実行手
段104と、前記文書蓄積手段に蓄積された文書をそのま
ま、あるいは加工して出力する文書出力手段105とを有
する。FIG. 1 is a configuration diagram of the first embodiment of the present invention. Referring to FIG. 1, the document editing method according to the present embodiment employs a structured document input means 10 for sequentially reading structured documents.
1, a document processing description means 102 in which one or more edit location descriptions specifying a partial structure of the input document read by the structured document input means are described, and the partial structure is described in the document processing description means. Document accumulating means 103 that divides each citation specifier in the edited edit location description, and accumulates in the order in which a match between the input document and the edit location description is established.
Extracting the edit location description from the document processing description means, trying to match each edit location description element that constitutes the edit location description with the input document, and adding a citation specifier described in the edit location description in which a match was established. The corresponding partial structure is stored in the document storage unit, and A
When at least one match of the edit location description elements connected by the ND connector does not hold, the partial structure corresponding to each edit location description element connected by the AND connector is deleted from the document storage means, If none of the edit location description elements connected by the OR connector in the edit location description match, no partial structure corresponding to each edit location description element connected by the OR connector is written in the document. It has a document editing process executing unit 104 for performing an extraction process by deleting the document from the storage unit, and a document output unit 105 for outputting the document stored in the document storage unit as it is or after processing.
【0057】次に、動作について図22、図23、図24、図
25を参照して説明する。Next, the operation will be described with reference to FIGS.
This will be described with reference to FIG.
【0058】図22は、第1の実施の形態の全体処理動作
を示す流れ図である。FIG. 22 is a flowchart showing the overall processing operation of the first embodiment.
【0059】文書編集の対象となる複数の構造化文書が
与えられると、構造化文書入力手段101は前記複数の構
造化文書を1つ読み込む(ステップ2201)。文書編集処理
実行手段104は、文書処理記述手段102から編集箇所記述
を1つ取り出して(ステップ2202)抽出処理を実行する
(ステップ2203)。抽出処理2203の実行が終ると、次に処
理すべき編集箇所記述がある場合(ステップ2204)には、
編集箇所記述を1つ取り出す処理に戻り、また、処理す
べき編集箇所記述がない場合には、次に処理すべき構造
化文書があるかを調べる(ステップ2205)。全ての構造化
文書に対する処理がまだ完了していない場合には、ステ
ップ2201の文書を1つ読み込む処理に戻り、また、全て
の構造化文書に対する処理が完了した場合には、文書出
力手段105が、文書蓄積手段103に蓄積された部分構造を
そのまま、あるいは加工して出力する(ステップ2206)。When a plurality of structured documents to be edited are provided, the structured document input means 101 reads one of the plurality of structured documents (step 2201). The document editing processing executing means 104 extracts one edit location description from the document processing description means 102 (step 2202) and executes the extraction processing.
(Step 2203). When the execution of the extraction process 2203 is completed, if there is an edit portion description to be processed next (step 2204),
Returning to the process of extracting one edit portion description, if there is no edit portion description to be processed, it is checked whether there is a structured document to be processed next (step 2205). If the processing for all structured documents has not been completed yet, the process returns to the processing of reading one document in step 2201. If the processing for all structured documents has been completed, the document output unit 105 Then, the partial structure stored in the document storage unit 103 is output as it is or after being processed (step 2206).
【0060】前記抽出処理における動作フローを、図23
を用いて説明する。The operation flow in the extraction process is shown in FIG.
This will be described with reference to FIG.
【0061】抽出処理では、文書編集処理実行手段104
が、OR接続子を区切りとして編集箇所記述を複数の記
述に分解し(ステップ2301)、前記分解した編集箇所記述
の1つを選び(ステップ2302)AND接続子の処理を実行
する(ステップ2303)。前記ステップ2303のAND接続子
の処理の実行が終ると、文書編集処理実行手段104は、
前記分解した編集箇所記述の中で未処理のものがある場
合(ステップ2304)には、ステップ2302の分解した編集箇
所記述の1つを選ぶ処理に戻り、また、前記分解した編
集箇所記述全てに対する処理が完了した場合には、前記
分解した各記述のマッチの状況を調べて、分解したどの
記述もマッチが成立していない場合(ステップ2305)に
は、対応する部分構造を文書蓄積手段103から削除する
(ステップ2306)。In the extraction process, the document editing process executing means 104
Divides the edit location description into a plurality of descriptions using the OR connector as a separator (step 2301), selects one of the decomposed edit location descriptions (step 2302), and executes the AND connector process (step 2303). . When the execution of the processing of the AND connector in the step 2303 is completed, the document editing processing execution means 104
If there is an unprocessed edit portion description among the decomposed edit portion descriptions (step 2304), the process returns to the process of selecting one of the decomposed edit portion descriptions in step 2302. When the processing is completed, the state of the match of each of the decomposed descriptions is checked, and if no match is established for any of the decomposed descriptions (step 2305), the corresponding partial structure is stored in the document storage unit 103. delete
(Step 2306).
【0062】前記AND接続子の処理における動作フロ
ーを、図24を用いて説明する。An operation flow in the processing of the AND connector will be described with reference to FIG.
【0063】AND接続子の処理では、文書編集処理実
行手段104が、AND接続子を区切りとして編集箇所記
述を複数の記述に分解し(ステップ2401)、前記分解した
編集箇所記述の1つを選び(ステップ2402)マッチ処理を
実行する(ステップ2403)。ステップ2403のマッチ処理実
行が終ると、文書編集処理実行手段104は、前記分解し
た編集箇所記述の中で未処理のものがある場合(ステッ
プ2404)には、ステップ2402の分解した編集箇所記述の
1つを選ぶ処理に戻り、また、前記分解した記述全てに
対する処理が完了した場合には、前記分解した各記述の
マッチの状況を調べて、マッチが不成立の記述が1つで
もある場合(ステップ2405)には、対応する部分構造を文
書蓄積手段103から削除する(ステップ2406)。In the processing of the AND connector, the document editing processing executing means 104 decomposes the edit location description into a plurality of descriptions using the AND connector as a separator (step 2401), and selects one of the decomposed edit location descriptions. (Step 2402) Match processing is executed (Step 2403). When the execution of the match process in step 2403 is completed, the document editing process execution unit 104 determines whether there is an unprocessed edit portion description among the decomposed edit portion descriptions (step 2404), Returning to the process of selecting one, and when the processes for all of the decomposed descriptions are completed, the state of the match of each of the decomposed descriptions is checked, and if there is at least one description in which no match is found (step 2405), the corresponding partial structure is deleted from the document storage means 103 (step 2406).
【0064】前記マッチ処理における動作フローを、図
25を用いて説明する。マッチ処理では、文書編集処理実
行手段104が、処理対象となる編集箇所記述の先頭要素
を着目点とし(ステップ2501)、前記編集箇所記述の着目
点における要素が括弧で囲まれている場合(ステップ250
2)には、前後の括弧をはずして(ステップ2503)抽出処理
を実行し(ステップ2504)、また、前記編集箇所記述の着
目点における要素が括弧で囲まれていない場合には、前
記要素と、入力文書中の現在着目している部分構造との
マッチを試みる(ステップ2505)。ステップ2504の抽出処
理もしくはステップ2505のマッチ完了後、文書編集処理
実行手段104は、前記編集箇所記述の着目点が記述の末
尾に達していない場合(ステップ2506)には、前記編集箇
所記述の着目点の要素と前記着目点の次の要素との間に
ある接続子に応じて入力文書中の現在着目している部分
構造を変え(ステップ2507)、編集箇所記述の着目点を次
の要素に移して(ステップ2508)、ステップ2502の編集箇
所記述の着目点の要素が括弧で囲まれているか判定する
処理へ戻る。また、前記編集箇所記述の着目点が記述の
末尾に達した場合には、前記編集箇所記述と入力文書と
のマッチの結果を調べてマッチが成立した場合には(ス
テップ2509)、さらに、前記編集箇所記を調べて引用指
定子があった場合には(ステップ2510)、前記引用指定子
に対応する部分構造を前記入力文書から抽出し、引用指
定子毎に分けて文書蓄積手段103に蓄積する(ステップ25
11)。The operation flow in the match process is shown in FIG.
This will be described using 25. In the matching process, the document editing process executing unit 104 sets the first element of the edit location description to be processed as the point of interest (step 2501), and the element at the point of interest of the edit location description is enclosed in parentheses (step 2501). 250
2), remove the parentheses before and after (Step 2503) and execute the extraction process (Step 2504) .If the element at the point of interest in the edit location description is not enclosed in parentheses, Then, an attempt is made to match with the currently focused partial structure in the input document (step 2505). After the extraction processing in step 2504 or the completion of the match in step 2505, if the point of interest in the edit location description does not reach the end of the description (step 2506), the document editing processing execution unit 104 Change the partial structure currently focused on in the input document according to the connector between the element of the point and the element next to the point of interest (step 2507), and change the point of interest of the edited portion description to the next element The process then moves on (step 2508), and the process returns to step 2502 to determine whether or not the element at the point of interest in the edit location description is enclosed in parentheses. If the point of interest of the edited portion description reaches the end of the description, the result of matching between the edited portion description and the input document is checked, and if a match is established (step 2509), If the citation specifier is found by checking the edit location notation (step 2510), a partial structure corresponding to the citation specifier is extracted from the input document, and divided in the citation specifier and stored in the document storage unit 103. (Step 25
11).
【0065】[0065]
【実施例】次に、本発明の第1の実施の形態の実施例を
3つの具体例を用いて動作を詳細に説明する。Next, the operation of the first embodiment of the present invention will be described in detail using three specific examples.
【0066】まず、実施例1を、図8の、発表論文情報
から文書編集方式803により論文の題名と著者氏名を抽
出して一覧表Aを作成する例を用いて説明し、発明が解
決しようとする課題の(2−1)および(2−2)が解
決することを示す。First, the first embodiment will be described with reference to FIG. 8, which is an example in which the title and author of a paper are extracted from the published paper information by the document editing method 803 to create a list A, and the invention will be solved. (2-1) and (2-2) will be solved.
【0067】入力文書として、図9の構造化文書901お
よび構造化文書902の2つが与えられている例を説明す
る。An example in which two structured documents 901 and 902 in FIG. 9 are given as input documents will be described.
【0068】また、発表論文情報から一覧表Aの作成に
必要な部分構造を抽出するための編集箇所記述として、 %<題名>,%<氏名> が文書処理記述手段に記述されているとする。なお、以
降では、前記編集箇所記述を編集箇所記述Aと呼ぶこと
にする。Further, it is assumed that% <title> and% <name> are described in the document processing description means as the edit location description for extracting the partial structure necessary for preparing the list A from the published paper information. . Hereinafter, the edit location description is referred to as edit location description A.
【0069】また、文書出力手段による加工方法は、次
の通りであるとする。なお、以降では、下記加工方法
を、加工方法Aと呼ぶことにする。The processing method by the document output means is as follows. Hereinafter, the following processing method is referred to as processing method A.
【0070】1.編集箇所記述Aの2つめの引用指定子
と対応する部分構造 2.編集箇所記述Aの1つめの引用指定子と対応する部
分構造 を文書蓄積手段からそれぞれ1つずつ抽出して前記順番
に並べたものを<表要素>というタグで囲んで表要素を
作り、文書蓄積手段中の全ての部分構造に対して前記処
理を実行して得られた表要素を並べて、全体を<一覧表
A>というタグで囲んで出力する。以上の条件の下での
動作を説明する。構造化文書入力手段101が、1つめの
入力文書として、構造化文書901を読み込む(ステップ22
01)。文書編集処理実行手段104は、文書処理記述手段10
2から前記編集箇所記述Aを取り出して(ステップ220
2)、構造化文書901に対する抽出処理を実行する(ステッ
プ2203)。1. 1. A partial structure corresponding to the second citation specifier in the edit location description A A partial element corresponding to the first citation specifier of the edited portion description A is extracted one by one from the document storage means and arranged in the above-mentioned order and enclosed in a tag <table element> to form a table element. The table elements obtained by executing the above processing for all the partial structures in the storage means are arranged, and the whole is enclosed in a tag <list A> and output. The operation under the above conditions will be described. The structured document input means 101 reads the structured document 901 as the first input document (step 22).
01). The document editing processing executing means 104
Extract the edit location description A from 2 (step 220).
2), an extraction process is performed on the structured document 901 (step 2203).
【0071】抽出処理では、OR接続子を区切りとし
て、編集箇所記述Aを複数の記述に分解する(ステップ2
301)。編集箇所記述A中にはOR接続子はないため、分
解された記述は、編集箇所記述A全体からなるもの1つ
だけとなる。前記編集箇所記述Aを処理対象として(ス
テップ2302)、AND接続子の処理を実行する(ステップ
2303)。In the extraction process, the edit location description A is decomposed into a plurality of descriptions using the OR connector as a delimiter (step 2).
301). Since there is no OR connector in the edit location description A, there is only one decomposed description consisting of the entire edit location description A. The edit location description A is processed (step 2302), and the processing of the AND connector is executed (step 2302).
2303).
【0072】AND接続子の処理では、AND接続子を
区切りとして編集箇所記述Aを複数の記述に分解する
(ステップ2401)。編集箇所記述A中にはAND接続子は
ないため、分解された記述は、編集箇所記述A全体から
なるもの1つだけとなる。前記編集箇所記述Aを処理対
象として(ステップ2402)、マッチ処理を実行する(ステ
ップ2403)。In the processing of the AND connector, the edit location description A is decomposed into a plurality of descriptions using the AND connector as a delimiter.
(Step 2401). Since there is no AND connector in the edit location description A, there is only one decomposed description consisting of the entire edit location description A. With the edit location description A as a processing target (step 2402), a match process is executed (step 2403).
【0073】マッチ処理では、まず、編集箇所記述Aの
先頭要素である%<題名>を着目点とする(ステップ250
1)。前記着目点の要素と入力文書とのマッチの実行方式
には何通りかあるが、ここでは、文書の任意の部分構造
を始点として編集箇所記述要素とマッチする全ての部分
構造を求める方式を用いて、 1.編集箇所記述の先頭要素に限っては、入力文書中の
全ての部分構造を対象としてマッチを開始し、かつ、 2.マッチする全ての部分構造を求める方式とする。前
記マッチの実行方式の1.より、前記着目点の要素%<
題名>と、構造化文書901中の全ての部分構造とのマッ
チを試み、 <題名> ××に関する研究 </題名>とマッチする(ステップ2505)。また、前記着
目点の要素と前記着目点の次の要素との間には順序接続
子があるため、前記マッチした部分構造の後に並んでい
る構造が、構造化文書901の現在着目している部分構造
となる(ステップ2507)。In the matching process, first,% <title>, which is the first element of the edit location description A, is set as the point of interest (step 250).
1). There are several methods for executing matching between the element at the point of interest and the input document.Here, a method is used in which an arbitrary partial structure of the document is used as a starting point to find all partial structures that match the edit location description element. And 1. For only the first element of the edit location description, matching is started for all partial structures in the input document, and It is a method to find all matching partial structures. 1. Method of executing the match Thus, the element% of the point of interest <
Attempts to match the title> with all the substructures in the structured document 901, and matches with the <title> XX study </ title> (step 2505). In addition, since there is an order connector between the element of the point of interest and the element next to the point of interest, the structures arranged after the matched partial structure are currently focused on in the structured document 901. It becomes a partial structure (step 2507).
【0074】前記編集箇所記述Aの着目点が次の要素%<
氏名>に移され(ステップ2508)、前記構造化文書901中の
現在着目している部分構造とのマッチが試みられる。前
記マッチの実行方式の2.に従ってマッチする全ての部
分構造を求めるため、前記着目点の要素%<氏名>は、 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> の2通りの部分構造とマッチする(ステップ2505)。The point of interest of the edit location description A is the following element% <
(Step 2508), and an attempt is made to match with the currently focused partial structure in the structured document 901. 1. Match execution method In order to find all the partial structures that match in accordance with the above, the element% <name> of the point of interest matches the two partial structures of <name> XX Taro </ name><name> XX Hanako </ name> (Step 2505).
【0075】着目点は前記編集箇所記述Aの末尾に達し
たため(ステップ2506)、編集箇所記述Aの各要素と構造
化文書901とのマッチを終え、各引用指定子に対応する
部分構造を抽出する。この際、抽出箇所間のつながりを
維持するため、例えば、編集箇所記述Aの要素%<題名
>と構造化文書901とマッチした部分構造と、編集箇所
記述Aの要素%<氏名>と構造化文書901とマッチした
2つの部分構造との組合せを求めて、文書蓄積手段103
に蓄積する(ステップ2511)。すなわち、例えば、次のよ
うな情報を文書蓄積手段103に蓄積してマッチ処理を終
了する。Since the point of interest has reached the end of the edit location description A (step 2506), the matching of each element of the edit location description A with the structured document 901 is completed, and the partial structure corresponding to each citation designator is extracted. I do. At this time, in order to maintain the connection between the extracted parts, for example, the element% <title> of the edited part description A and the partial structure that matches the structured document 901 and the element% <name> of the edited part description A and the structured The combination of the document 901 and the two partial structures that match the document 901 is obtained, and the document storage unit 103
(Step 2511). That is, for example, the following information is stored in the document storage unit 103, and the matching process ends.
【0076】編集箇所記述Aの1つめの引用指定子に対
応する 部分構造 <題名> ××に関する研究 </題名> <題名> ××に関する研究 </題名> 編集箇所記述Aの2つめの引用指定子に対応する 部分構造 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> 編集箇所記述Aを処理対象としたマッチ処理が完了する
と、AND接続子の処理に戻る。AND接続子の処理で
は、分解した記述に対する処理は全て完了したため(ス
テップ2404)、前記編集箇所記述Aと入力文書とのマッ
チの状況を調べる(ステップ2405)。前記編集箇所記述A
はマッチが成立したため、文書蓄積手段の削除は行わ
ず、AND接続子の処理を終了する。Partial structure corresponding to the first citation specifier of edited part description A <title> Study on XX </ title><title> Study on XX </ title> Second citation of edited part description A Partial structure corresponding to the specifier <name> XX Taro </ name><name> XX Hanako </ name> When the matching process for the edit location description A is completed, the process returns to the AND connector process. In the processing of the AND connector, since all the processing for the decomposed description has been completed (step 2404), the matching status between the edit location description A and the input document is checked (step 2405). Edit location description A
Since the match has been established, the document storage means is not deleted, and the processing of the AND connector ends.
【0077】AND接続子の処理が完了すると、抽出処
理に戻る。抽出処理では、分解した記述に対する処理は
全て完了したため(ステップ2304)、前記編集箇所記述A
と入力文書とのマッチの状況を調べる(ステップ2305)。
前記編集箇所記述Aはマッチが成立したため、文書蓄積
手段の削除は行わず、抽出処理を終了する。When the processing of the AND connector is completed, the process returns to the extraction processing. In the extraction process, since all the processes for the decomposed description have been completed (step 2304), the editing location description A
The state of the match between the input document and the input document is checked (step 2305).
Since the edit location description A has a match, the document storage unit is not deleted, and the extraction process ends.
【0078】抽出処理を完了すると、全体の処理に戻
る。全体の処理では、構造化文書901に対して処理すべ
き編集箇所記述はもうないため(ステップ2204)、構造化
文書入力手段101が、2つめの入力文書として、構造化
文書902を読み込む(ステップ2201)。文書編集処理実行
手段104は、文書処理記述手段102から前記編集箇所記述
Aを取り出して(ステップ2202)、構造化文書902に対す
る抽出処理を実行する(ステップ2203)。When the extraction process is completed, the process returns to the whole process. In the entire process, there is no more edit portion description to be processed for the structured document 901 (step 2204), so the structured document input means 101 reads the structured document 902 as the second input document (step 2204). 2201). The document editing process executing means 104 extracts the editing location description A from the document processing description means 102 (step 2202), and executes an extraction process for the structured document 902 (step 2203).
【0079】構造化文書902に対する抽出処理は、前記
構造化文書901に対する抽出処理とほぼ同じであるた
め、詳細な説明は省き、結果だけを示す。処理の結果、
前記編集箇所記述Aの1つめの引用指定子に対応する部
分構造として、構造化文書902から、 <題名> ○○に関する研究 </題名> が抽出され、また、前記編集箇所記述Aの2つめの引用
指定子に対応する部分構造として、構造化文書902か
ら、 <氏名> ○○ 次郎 </氏名> が抽出され、文書蓄積手段103に蓄積される。Since the extraction process for the structured document 902 is almost the same as the extraction process for the structured document 901, detailed description is omitted, and only the result is shown. As a result of processing,
As the partial structure corresponding to the first citation specifier of the edited portion description A, <title> Research on XX </ title> is extracted from the structured document 902, and the second portion of the edited portion description A is extracted. <Name> XX Jiro </ name> is extracted from the structured document 902 as a partial structure corresponding to the citation specifier of
【0080】構造化文書902に対する抽出処理が終了す
ると、全体の処理に戻る。全体の処理では、構造化文書
902に対して処理すべき編集箇所記述はもうなく(ステッ
プ2204)、また、全ての構造化文書に対しての抽出処理
が完了したため(ステップ2205)、文書出力手段105が、
文書蓄積手段103に蓄積された部分構造を加工する(ステ
ップ2206)。When the extraction process for the structured document 902 ends, the process returns to the whole process. The whole process is a structured document
There is no more edit portion description to be processed for 902 (step 2204), and since the extraction process for all structured documents has been completed (step 2205), the document output means 105
The partial structure stored in the document storage unit 103 is processed (Step 2206).
【0081】この時点で文書蓄積手段103に蓄積されて
いる部分構造を、文書蓄積手段103の格納形式の一例を
用いて以下に示す。The partial structure stored in the document storage means 103 at this time will be described below using an example of the storage format of the document storage means 103.
【0082】編集箇所記述Aの1つめの引用指定子に対
応する 部分構造 <題名> ××に関する研究 </題名> <題名> ××に関する研究 </題名> <題名> ○○に関する研究 </題名> 編集箇所記述Aの2つめの引用指定子に対応する 部分構造 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> <氏名> ○○ 次郎 </氏名> このように、文書蓄積手段103には、引用指定子毎に対
応する部分構造が、部分構造の並びとして蓄積されてい
る。しかも、それぞれの部分構造の並びの先頭の部分構
造は、最初にマッチが成立した際に抽出したものであ
り、それぞれの部分構造の並びの2番目の部分構造は、
2番目にマッチが成立した際に抽出したものである、と
いったように、並びの順番という形で、各引用指定子に
対応する部分構造の間のつながりを維持している。Partial structure corresponding to the first citation specifier of edit location description A <Title> Study on XX </ title><Title> Study on XX </ title><Title> Study on XX <// Title> Partial structure corresponding to the second citation specifier in edit location description A <Name> ○ × Taro </ Name><Name> XX Hanako </ Name><Name> XX Jiro </ Name> In the document storage unit 103, partial structures corresponding to each citation designator are stored as a sequence of partial structures. Moreover, the first partial structure in the list of each partial structure is extracted when a match is first established, and the second partial structure in each partial structure list is
The connection between the substructures corresponding to each citation designator is maintained in the order of arrangement, such as being extracted when the second match is made.
【0083】文書出力手段105は、これらの部分構造か
ら、前記加工方法Aにより、図10のような一覧表Aを作
成し、出力する(ステップ2206)。The document output means 105 creates a list A as shown in FIG. 10 from the partial structure by the processing method A, and outputs it (step 2206).
【0084】以上のように、本発明では、例えば前記編
集箇所記述Aのように、1つのパターンに複数の抽出箇
所を指定することができ、しかも、例えば、文書蓄積手
段103に蓄積された部分構造の並びの順番という形で、
各引用指定子に対応する部分構造の間のつながりを維持
して部分構造を抽出することができ、さらに、前記加工
方法Aのように、構造を分解する処理と特別に用意する
ことなく、抽出した部分構造を、引用指定子毎に別々に
扱うことができる。As described above, according to the present invention, it is possible to specify a plurality of extraction locations in one pattern, for example, as in the editing location description A. In the form of the order of the structure,
The partial structure can be extracted while maintaining the connection between the partial structures corresponding to each citation designator. Further, as in the processing method A, the extraction can be performed without specially preparing the processing for decomposing the structure. Can be handled separately for each citation specifier.
【0085】なお、前記マッチ処理におけるマッチの実
行方式として文書の任意の部分構造を始点として編集箇
所記述要素とマッチする全ての部分構造を求める方式を
用いたが、用途や処理速度、使用する作業領域の大きさ
などに応じて、任意の部分構造を始点として編集箇所記
述要素とマッチする最初の部分構造を求める方式もしく
は、任意の部分構造を始点として編集箇所記述要素とマ
ッチする最後の部分構造を求める方式もしくは、任意の
部分構造を始点として編集箇所記述要素とマッチする部
分構造のうち、包含関係にある部分構造は最も外側の部
分構造を選択する方式もしくは、任意の部分構造を始点
として編集箇所記述要素とマッチする部分構造のうち、
包含関係にある部分構造は最も内側の部分構造を選択す
る方式もしくは、最も外側の構造を始点として前記編集
箇所記述要素とマッチする全ての部分構造を求める方式
のいずれの方式、もしくはその他の方式を用いても良
い。例えば、任意の部分構造を始点として編集箇所記述
要素とマッチする最初の部分構造を求める方式もしく
は、任意の部分構造を始点として編集箇所記述要素とマ
ッチする最後の部分構造を求める方式は、マッチする組
合せの1つを求めれば十分である場合などに適用するこ
とができ、任意の部分構造を始点として編集箇所記述要
素とマッチする全ての部分構造を求める方式などと比較
して処理速度が早く、使用する作業領域の大きさも小さ
いという利点がある。また、例えば、入力文書中に、 <itemize> <item> 選択枝1 </item> <itemize> <item> 副選択枝A </item> <item> 副選択枝B </item> </itemize> <item> 選択枝2 </item> <item> 選択枝3 </item> </itemize> など、<itemize>の内側にさらに<itemize>が含まれ
ているといったように同種の構造がネストしている場合
において、一番外側の<itemize>とマッチさせたい場
合、あるいは、一番内側の<itemize>とマッチさせた
い場合には、前述した、任意の部分構造を始点として編
集箇所記述要素とマッチする部分構造のうち、包含関係
にある部分構造は最も外側の部分構造を選択する方式も
しくは、任意の部分構造を始点として編集箇所記述要素
とマッチする部分構造のうち、包含関係にある部分構造
は最も内側の部分構造を選択する方式を適用することが
できる。また、文書の最も外側の構造を始点として編集
箇所記述要素とマッチする全ての部分構造を求める方式
は、例えば、マッチする全ての組合せを求めたいが、処
理の高速化も狙いたい場合などに適用することができ
る。例えば前記発表論文情報から一覧表Aの作成に必要
な部分構造を抽出する例では、編集箇所記述として、 <論文情報>(%<題名>,%<氏名>) といったように、編集箇所記述を、入力文書の最も外側
のタグから順に記述することにより、編集箇所記述の先
頭要素を、入力文書中の全ての部分構造を対象としてマ
ッチを試みる処理などを省くことができ、高速化が図れ
る。In the above-described match processing, a method of obtaining all partial structures that match an edit location description element starting from an arbitrary partial structure of a document is used as a match execution method. Method of finding the first substructure that matches the edit location description element starting from an arbitrary substructure according to the size of the area, or the last substructure that matches the edit location description element starting from an arbitrary substructure Of the substructures that match the edit location description element starting from an arbitrary substructure, or selecting the outermost substructure from among the substructures that are inclusive, or editing starting from an arbitrary substructure Of the substructures that match the location description element,
The substructures in the inclusion relationship may be selected from the method of selecting the innermost substructure, the method of obtaining all substructures that match the edit location description element starting from the outermost structure, or any other method. May be used. For example, the method of finding the first substructure that matches an edit location description element starting from an arbitrary substructure or the method of finding the last partial structure that matches an edit location description element starting from an arbitrary substructure is matched It can be applied when it is sufficient to find one of the combinations, and the processing speed is faster compared to a method of obtaining all the substructures that match the edit location description element with an arbitrary substructure as a starting point, There is an advantage that the size of the working area used is small. Also, for example, in the input document, <itemize><item> option 1 </ item><itemize><item> sub-selection A </ item><item> sub-selection B </ item></ itemize ><Item> Option 2 </ item><item> Option 3 </ item></itemize>, etc. The same kind of structure is nested such that <itemize> is further included inside <itemize> If you want to match the outermost <itemize> or match the innermost <itemize> in the above case, the edit part description element starting from an arbitrary substructure described above Among the substructures that match with, the substructure that is in the inclusion relationship is the method that selects the outermost substructure, or the substructure that has the inclusion relationship among the substructures that match the edit location description element starting from any substructure Select the innermost substructure Method can be applied to that. The method of finding all partial structures that match the edit location description element starting from the outermost structure of the document is used, for example, when you want to find all matching combinations but also want to speed up processing. can do. For example, in the example of extracting the partial structure necessary for creating the list A from the published paper information, the editing location description is described as <article information> (% <title>,% <name>). By describing in order from the outermost tag of the input document, it is possible to omit a process of trying to match the first element of the edit location description with respect to all the partial structures in the input document, thereby achieving high speed.
【0086】次に、実施例2を、図26のように、発表論
文情報2から投稿先学会名と論文の題名を抽出して、一
覧表Bを作成する例を用いて説明し、発明が解決しよう
とする課題の(2−3)が解決することを示す。Next, a second embodiment will be described with reference to FIG. 26, in which a list B is created by extracting the name of the contributing society and the title of the paper from the published paper information 2. This shows that the problem (2-3) to be solved is solved.
【0087】図26において、入力文書2601、入力文書26
02は発表論文情報2であり、出力文書2604が作成したい
一覧表Bである。また、図26の入力文書2601をSGML
形式で記述した例が図27の構造化文書2701であり、図26
の入力文書2602をSGML形式で記述した例が図27の構
造化文書2702であり、図26の出力文書2604をSGML形
式で記述した例が図27の出力文書2703である。In FIG. 26, the input document 2601, the input document 26
02 is presentation paper information 2, which is a list B to be created by the output document 2604. Also, the input document 2601 in FIG.
The example described in the format is the structured document 2701 in FIG. 27, and FIG.
27 is an structured document 2702 in FIG. 27, and an example in which the output document 2604 in FIG. 26 is described in the SGML format is an output document 2703 in FIG.
【0088】入力文書として図27の構造化文書2701およ
び構造化文書2702の2つが与えられている例を説明す
る。An example in which two structured documents 2701 and 2702 shown in FIG. 27 are given as input documents will be described.
【0089】また、発表論文情報2から一覧表Bの作成
に必要な部分構造を抽出するための編集箇所記述とし
て、 %<学会名>&%<題名> が文書処理記述手段に記述されているとする。なお、以
降では、前記編集箇所記述を編集箇所記述Bと呼ぶこと
にする。Further,% <society name>&%<title> is described in the document processing description means as an edit location description for extracting a partial structure necessary for preparing the list B from the published paper information 2. And Hereinafter, the edit location description is referred to as edit location description B.
【0090】また、文書出力手段による加工方法は、次
の通りであるとする。なお、以降では、下記文書出力手
段の加工方法を、加工方法Bと呼ぶことにする。The processing method by the document output means is as follows. Hereinafter, the processing method of the following document output means will be referred to as processing method B.
【0091】1.編集箇所記述Bの1つめの引用指定子
と対応する部分構造 2.編集箇所記述Bの2つめの引用指定子と対応する部
分構造 を文書蓄積手段からそれぞれ1つずつ抽出して前記順番
に並べたものを<表要素>というタグで囲んで表要素を
作り、文書蓄積手段中の全ての部分構造に対して前記処
理を実行して得られた表要素を並べて、全体を<一覧表
B>というタグで囲んで出力する。1. 1. A partial structure corresponding to the first citation specifier of the edit location description B The substructure corresponding to the second citation specifier of the edited portion description B is extracted one by one from the document storage means and arranged in the above order and enclosed in a <table element> tag to form a table element. The table elements obtained by executing the above processing for all the partial structures in the storage means are arranged, and the whole is enclosed in a tag <list B> and output.
【0092】以上の条件の下での動作を説明する。The operation under the above conditions will be described.
【0093】構造化文書入力手段101が、1つめの入力
文書として、構造化文書2701を読み込む(ステップ220
1)。文書編集処理実行手段104は、文書処理記述手段102
から前記編集箇所記述Bを取り出して(ステップ2202)、
構造化文書2701に対する抽出処理を実行する(ステップ2
203)。The structured document input means 101 reads the structured document 2701 as the first input document (step 220).
1). The document editing processing executing means 104 is
From the editing location description B (step 2202),
Execute extraction processing for structured document 2701 (step 2
203).
【0094】抽出処理では、OR接続子を区切りとし
て、編集箇所記述Bを複数の記述に分解する(ステップ2
301)。編集箇所記述B中にはOR接続子はないため、分
解された記述は、編集箇所記述B全体からなるもの1つ
だけとなる。前記編集箇所記述Bを処理対象として(ス
テップ2302)、AND接続子の処理を実行する(ステップ
2303)。In the extraction process, the edit location description B is decomposed into a plurality of descriptions using the OR connector as a delimiter (step 2).
301). Since there is no OR connector in the edit location description B, there is only one decomposed description consisting of the entire edit location description B. With the edit location description B as a processing target (step 2302), an AND connector process is executed (step
2303).
【0095】AND接続子の処理では、AND接続子を
区切りとして編集箇所記述Bを複数の記述に分解する
(ステップ2401)。まず、区切った記述の1つ%<学会名
>を処理対象として選び(ステップ2402)、マッチ処理を
実行する(ステップ2403)。In the processing of the AND connector, the edit location description B is decomposed into a plurality of descriptions using the AND connector as a delimiter.
(Step 2401). First, one% <society> of the divided descriptions is selected as a processing target (step 2402), and a matching process is executed (step 2403).
【0096】マッチ処理は、前述の第1の実施の形態の
実施例1で詳細に説明したため、要点のみ示す。マッチ
処理では、編集箇所記述の先頭要素である%<学会名>
と構造化文書2701の全ての部分構造とのマッチを試み、
結果として、マッチは成立し、編集箇所記述Bの1つめ
の引用指定子に対応する部分構造として、 <学会名> 知能研究会 </学会名> が抽出され、文書蓄積手段103に蓄積される。Since the matching process has been described in detail in the first embodiment of the first embodiment, only the essential points will be described. In the match processing,% <Society name> which is the first element of the edit location description
And all substructures of structured document 2701
As a result, a match is established, and <Society name> Intelligent Study Group </ Society name> is extracted as a partial structure corresponding to the first citation specifier of the edited portion description B, and is stored in the document storage unit 103. .
【0097】構造化文書2701と%<学会名>とのマッチ
処理が完了すると、AND接続子の処理に戻る。AND
接続子の処理では、処理すべき記述%<題名>が残って
いるため(ステップ2404)、次に、%<題名>を処理対象
として選び(ステップ2402)、マッチ処理を実行する(ス
テップ2403)。When the matching process between the structured document 2701 and% <conference name> is completed, the process returns to the AND connector process. AND
In the processing of the connector, the description% <title> to be processed remains (step 2404). Next,% <title> is selected as a processing target (step 2402), and a matching process is executed (step 2403). .
【0098】マッチ処理は、前述の第1の実施の形態の
実施例1で詳細に説明したため、要点のみ示す。%<題
名>を処理対象としたマッチ処理では、前述の%<学会
名>を処理対象としたマッチ処理を実行した時とは別
に、新たに、編集箇所記述の先頭要素である%<題名>
と構造化文書2701の全ての部分構造とのマッチを試み
る。その結果、マッチは成立し、編集箇所記述Bの2つ
めの引用指定子に対応する部分構造として、 <題名> ××に関する研究 </題名> が抽出され、文書蓄積手段103に蓄積される。Since the matching process has been described in detail in the first embodiment of the first embodiment, only the essential points will be described. In the matching process targeting% <title>, a new head element% <title> of the edit location description is newly added, separately from the above-described execution of the matching process targeting% <society name>.
And all the substructures of the structured document 2701 are attempted. As a result, a match is established, and <title> XX research </ title> is extracted as a partial structure corresponding to the second citation designator of the edit location description B, and is stored in the document storage unit 103.
【0099】構造化文書2701と%<題名>とのマッチ処
理が完了すると、AND接続子の処理に戻る。AND接
続子の処理では、分解した記述に対する処理は全て完了
したため(ステップ2404)、前記編集箇所記述Bと入力文
書とのマッチの状況を調べる(ステップ2405)。前記編集
箇所記述BのAND接続子で区切られた各記述は全てマ
ッチが成立したため、文書蓄積手段の削除は行わず、A
ND接続子の処理を終了する。When the matching process between the structured document 2701 and% <title> is completed, the process returns to the AND connector process. In the processing of the AND connector, since all the processing for the decomposed description has been completed (step 2404), the matching status between the edit location description B and the input document is checked (step 2405). Since all of the descriptions separated by the AND connector of the edit location description B match, the document storage unit is not deleted.
The processing of the ND connector ends.
【0100】AND接続子の処理が完了すると、抽出処
理に戻る。抽出処理では、分解した記述に対する処理は
全て完了したため(ステップ2304)、前記編集箇所記述B
と入力文書とのマッチの状況を調べる(ステップ2305)。
前記編集箇所記述Bはマッチが成立したため、文書蓄積
手段の削除は行わず、抽出処理を終了する。When the processing of the AND connector is completed, the flow returns to the extraction processing. In the extraction process, since all the processes for the decomposed description have been completed (step 2304), the edit location description B
The state of the match between the input document and the input document is checked (step 2305).
Since the edit location description B has a match, the document storage means is not deleted, and the extraction process ends.
【0101】抽出処理が完了すると、全体の処理に戻
る。全体の処理では、構造化文書2701に対して処理すべ
き編集箇所記述はもうないため(ステップ2204)、構造化
文書入力手段101が、2つめの入力文書として、構造化
文書2702を読み込む(ステップ2201)。文書編集処理実行
手段104は、文書処理記述手段102から前記編集箇所記述
Bを取り出して(ステップ2202)、構造化文書2702に対す
る抽出処理を実行する(ステップ2203)。When the extraction process is completed, the process returns to the whole process. In the whole process, since there is no more edit portion description to be processed for the structured document 2701 (step 2204), the structured document input means 101 reads the structured document 2702 as the second input document (step 2204). 2201). The document editing process executing means 104 extracts the editing location description B from the document processing description means 102 (step 2202), and executes an extraction process for the structured document 2702 (step 2203).
【0102】構造化文書2702に対する抽出処理は、前記
構造化文書2701に対する抽出処理とほぼ同じであるた
め、詳細な説明は省き、結果だけを示す。処理の結果、
前記編集箇所記述Bの1つめの引用指定子に対応する部
分構造として、 <学会名> 情報研究会 </学会名> が抽出され、また、前記編集箇所記述Aの2つめの引用
指定子に対応する部分構造として、 <題名> ○○に関する研究 </題名> が抽出され、文書蓄積手段103に蓄積され、抽出処理を
終了する。Since the extraction processing for the structured document 2702 is almost the same as the extraction processing for the structured document 2701, detailed description is omitted, and only the result is shown. As a result of processing,
As a partial structure corresponding to the first citation designator of the edit location description B, <Society name> Information Technical Society </ Society name> is extracted, and as the second citation designator of the edit location description A, As the corresponding partial structure, <title> Research on XX is extracted and stored in the document storage unit 103, and the extraction process ends.
【0103】抽出処理が完了すると、全体の処理に戻
る。全体の処理では、構造化文書902に対して処理すべ
き編集箇所記述はもうなく(ステップ2204)、また、全て
の構造化文書に対しての抽出処理が完了したため(ステ
ップ2205)、文書出力手段105が、文書蓄積手段103に蓄
積された部分構造を加工する(ステップ2206)。When the extraction process is completed, the process returns to the whole process. In the whole process, there is no more edit portion description to be processed for the structured document 902 (step 2204), and since the extraction process has been completed for all structured documents (step 2205), the document output means 105 processes the partial structure stored in the document storage unit 103 (step 2206).
【0104】この時点で文書蓄積手段103に蓄積されて
いる部分構造を、文書蓄積手段103の格納形式の一例を
用いて以下に示す。The partial structure stored in the document storage means 103 at this time will be described below using an example of the storage format of the document storage means 103.
【0105】編集箇所記述Aの1つめの引用指定子に対
応する 部分構造 <学会名> 知能研究会 </学会名> <学会名> 情報研究会 </学会名> 編集箇所記述Aの2つめの引用指定子に対応する 部分構造 <題名> ××に関する研究 </題名> <題名> ○○に関する研究 </題名> 文書出力手段105は、これらの部分構造から、前記加工
方法Bにより、図27の出力文書2703のような一覧表Bを
作成し、出力する(ステップ2206)。Partial structure corresponding to the first citation specifier in edited part description A <Society name> Intelligence Research Group </ Sociation name><Societyname> Information Research Group </ Sociation name> Second edited part description A <Title><title><title> Research on XX </ title> The document output unit 105 derives the figure from these partial structures using the processing method B described above. A list B such as 27 output documents 2703 is created and output (step 2206).
【0106】以上のように、本発明では、順不同の並列
関係を表すAND接続子を記述することができ、また、
例えば前記例でのマッチ処理における、編集箇所記述の
先頭要素の処理のように、AND接続子で区切られた各
記述は、それぞれ、構造化文書の全ての部分構造を開始
点としてマッチが試みられ、AND接続子の処理のステ
ップ2405、ステップ2406のように、区切った記述の全て
のマッチが成功した組合せのみ、文書蓄積手段103に保
持されるため、AND接続子の前後の記述が順不同でマ
ッチして部分構造の抽出を実行することができる。As described above, according to the present invention, an AND connector representing an unordered parallel relationship can be described.
For example, like the processing of the first element of the edit location description in the matching processing in the above example, each description separated by an AND connector is attempted to be matched starting from all the substructures of the structured document. As shown in steps 2405 and 2406 of the processing of the AND connector, only the combinations in which all the matches of the separated descriptions succeeded are stored in the document storage unit 103, so that the descriptions before and after the AND connector are matched in random order. To extract the partial structure.
【0107】次に、実施例3として、括弧、および、O
R接続子の解釈動作について示す。Next, as Example 3, parentheses and O
The interpretation operation of the R connector will be described.
【0108】例えば図28のようにSGML記述された論
文、すなわち、 1.<図>および</図>というタグで囲まれた図を表
す部分構造と文書データとが、<第一章>および</第
一章>というタグで囲まれた第一章を表す部分構造 2.<図>および</図>というタグで囲まれた図を表
す部分構造と文書データとが、<第二章>および</第
二章>というタグで囲まれた第二章を表す部分構造 をこの順序で並べて全体を<論文>および</論文>と
いうタグで囲んで表現したものから、第一章の図および
第二章の図を抽出する動作を説明する。For example, a paper described in SGML as shown in FIG. A partial structure representing a figure surrounded by tags <figure> and </ figure> and a document data, and a partial structure representing a first figure surrounded by tags <chapter 1> and </ chapter 1> 2. A partial structure representing a diagram surrounded by tags <figure> and </ figure> and a document data and a partial structure representing a second chapter surrounded by tags <chapter 2> and </ chapter 2> Are extracted in this order, and the whole is surrounded by tags of <paper> and </ paper>, and the operation of extracting the figure of the first chapter and the figure of the second chapter will be described.
【0109】入力文書として、図28の構造化文書2801が
与えられている例を説明する。また、論文から第一章の
図および第二章の図を抽出するための編集箇所記述とし
て、 (<第一章>|<第二章>)%<図> が文書処理記述手段に記述されているとする。なお、以
降では、前記編集箇所記述を編集箇所記述Cと呼ぶこと
にする。An example in which the structured document 2801 shown in FIG. 28 is given as an input document will be described. Also, (<Chapter 1> | <Chapter 2>)% <Figure> is described in the document processing description means as the edit location description for extracting the figures of Chapter 1 and the figures of Chapter 2 from the paper. Suppose Hereinafter, the edit location description is referred to as edit location description C.
【0110】また、文書出力手段は、文書蓄積手段103
の内容をそのまま出力するとする。The document output means is the document storage means 103
Is output as is.
【0111】以上の条件の下での動作を簡単に説明す
る。The operation under the above conditions will be briefly described.
【0112】構造化文書入力手段101が構造化文書2801
を読み込み(ステップ2201)、文書編集処理実行手段104
が文書処理記述手段102から前記編集箇所記述Cを取り
出して(ステップ2202)、構造化文書2801に対する抽出処
理を実行する(ステップ2203)。When the structured document input means 101 receives the structured document 2801
Is read (step 2201), and the document editing
Extracts the edit location description C from the document processing description means 102 (step 2202) and executes an extraction process on the structured document 2801 (step 2203).
【0113】抽出処理では、編集箇所記述CにはOR接
続子があるが、括弧で囲まれているため、編集箇所記述
Cを複数の記述に分解することができず、前記編集箇所
記述Cを処理対象として(ステップ2302)、AND接続子
の処理を実行する(ステップ2303)。In the extraction processing, the edit location description C has an OR connector. However, since the edit location description C is enclosed in parentheses, the edit location description C cannot be decomposed into a plurality of descriptions. As a processing target (step 2302), the processing of the AND connector is executed (step 2303).
【0114】AND接続子の処理では、編集箇所記述C
にはAND接続子が含まれていないため、前記編集箇所
記述Cを処理対象として(ステップ2402)、マッチ処理を
実行する(ステップ2403)。In the processing of the AND connector, the edit location description C
Does not include an AND connector, the edit location description C is processed (step 2402), and a match process is executed (step 2403).
【0115】マッチ処理では、前記編集箇所記述Cの先
頭要素(<第一章>|<第二章>)に着目し(250
1)、(<第一章>|<第二章>)の前後の括弧をはず
して(ステップ2503)、<第一章>|<第二章>に対する
抽出処理を実行する(ステップ2504)。In the matching process, the head element (<Chapter 1> | <Chapter 2>) of the edit location description C is noted (250).
1) Remove parentheses before and after (<first chapter> | <second chapter>) (step 2503), and execute an extraction process for <first chapter> | <second chapter> (step 2504).
【0116】抽出処理では、<第一章>|<第二章>を
OR接続子で分解し(ステップ2301)、<第一章>を処理対
象として(ステップ2302)、AND接続子の処理を実行す
る(ステップ2303)。In the extraction process, <Chapter 1> | <Chapter 2> is decomposed by an OR connector (step 2301), and <Chapter 1> is processed (step 2302), and the processing of the AND connector is performed. Execute (step 2303).
【0117】以降のAND接続子の処理の詳細は省略
し、結果として、 a.<第一章>と構造化文書2801とのマッチは成立 a−1.抽出した部分構造はなし a−2.構造化文書2801の着目している部分構造は<第
一章> となり、AND接続子の処理を終了して、抽出処理に戻
る。Details of the subsequent processing of the AND connector are omitted, and as a result, a. <Chapter 1> matches structured document 2801 a-1. No extracted partial structure a-2. The focused partial structure of the structured document 2801 is <Chapter 1>, and the processing of the AND connector is terminated, and the process returns to the extraction processing.
【0118】抽出処理では、分解した2つめの記述<第
二章>を処理対象として、AND接続子の処理を実行す
る。<第二章>を処理対象としたAND接続子の処理結
果は、 b.<第二章>と構造化文書2801とのマッチは成立 b−1.抽出した部分構造はなし b−2.構造化文書2801の着目している部分構造は<第
二章> となり、抽出処理へ戻る。In the extraction processing, the processing of the AND connector is executed with the second decomposed description <Chapter 2> as the processing target. The processing result of the AND connector for <Chapter 2> is b. Match between <Chapter 2> and structured document 2801 is established b-1. No extracted partial structure b-2. The focused partial structure of the structured document 2801 is <Chapter 2>, and the process returns to the extraction processing.
【0119】抽出処理では、ORで区切った記述の少な
くとも1つのマッチが成立しているため(ステップ230
5)、<第一章>|<第二章>のマッチが成立したとし
て、抽出処理を終了し、マッチ処理へ戻る。In the extraction processing, at least one match of the description delimited by OR is satisfied (step 230).
5) Assuming that the match of <Chapter 1> | <Chapter 2> has been established, the extraction process is terminated, and the process returns to the match process.
【0120】マッチ処理では、着目点の要素(<第一章
>|<第二章>)と、次の要素%<図>との間の接続子
が階層接続子であるため、前記AND接続子の処理結果
a−2.およびb−2.より、前記a.のマッチに対し
ては、<第一章>の内側が構造化文書2801の現在着目し
ている部分構造となり、前記b.のマッチに対しては、
<第二章>の内側が構造化文書2801の現在着目している
部分構造となる(ステップ2507)。In the matching process, since the connector between the element of interest (<Chapter 1> | <Chapter 2>) and the next element% <Figure> is a hierarchical connector, the AND connection Processing result of child a-2. And b-2. From the above a. For the match, the inside of <Chapter 1> is the partial structure of interest of the structured document 2801 at present, and b. For a match of
The inside of <Chapter 2> is the partial structure of the structured document 2801 that is currently focused on (step 2507).
【0121】前記編集箇所記述Cの着目点が次の要素%
<図>に移され(ステップ2508)、前記構造化文書2801中
の現在着目している2箇所の部分構造とのマッチが試み
られる(ステップ2505)。The point of interest of the edit location description C is the next element%
The process is moved to <FIG> (step 2508), and a match is attempted with the two partial structures of interest in the structured document 2801 (step 2505).
【0122】その結果、前記a.のマッチに対しては、 <図> 図1 </図> が抽出され、また、前記b.のマッチに対しては、 <図> 図2 </図> が抽出され、文書蓄積手段103に蓄積される(ステップ25
11)。As a result, a. For the match, <figure> FIG. 1 </ figure> is extracted, and b. For the match, <figure> FIG. 2 </ figure> is extracted and stored in the document storage means 103 (step 25).
11).
【0123】最後に、文書出力手段105が、前記抽出さ
れた部分構造を出力し(ステップ2206)、全体の処理が終
了する。Finally, the document output means 105 outputs the extracted partial structure (step 2206), and the entire process ends.
【0124】図2は本発明の第2の実施の形態の構成図
である。図2を参照すると、本実施の形態の文書編集方
式は、第1の実施の形態の構成に加えて、構造化文書や
部分構造を蓄積する出力文書蓄積手段106と、動作記述
を解釈し、文書の追加、文書の結合、文書数のカウント
などの編集処理を実行して、構造化文書や部分構造を前
記出力文書蓄積手段に蓄積する動作記述解釈手段107
と、読み込まれた各文書に対しての抽出処理を開始する
前に実行する動作を記述した文書毎前処理記述手段108
と、読み込まれた各文書に対しての前記抽出処理が完了
する毎に実行する動作を記述した文書毎後処理記述手段
109と、読み込まれた各文書に対しての前記抽出処理が
行われる前に、前記文書毎前処理記述手段に記述された
動作記述を前記動作記述解釈手段へ通知する文書毎前処
理実行手段110と、読み込まれた各文書に対しての前記
抽出処理が完了する毎に、前記文書毎後処理記述手段に
記述された動作記述を前記動作記述解釈手段へ通知する
文書毎後処理実行手段111と、読み込まれた文書の最初
の文書に対する前記抽出処理を開始する前に実行する動
作を記述した初期処理記述手段112と、読み込まれた全
ての文書に対する前記抽出処理が完了した後に実行する
動作を記述した終了時処理記述手段113と、読み込まれ
た文書の最初の文書に対する前記抽出処理が行われる前
に、前記初期処理記述手段に記述された動作記述を前記
動作記述解釈手段へ通知する初期処理実行手段114と、
読み込まれた全ての文書に対する前記抽出処理が完了し
た後に、前記終了処理記述手段に記述された動作記述を
前記動作記述解釈手段へ通知する終了時処理実行手段11
5と、タグ名変更指示や構造削除指示や文字列変更指示
や文字列削除指示を受け付けて各処理を実行する文書修
正手段116と、構造化文書や部分構造を指定されたキー
に従ってソートする文書ソート手段117とをさらに有す
る。FIG. 2 is a configuration diagram of a second embodiment of the present invention. Referring to FIG. 2, in addition to the configuration of the first embodiment, the document editing method of the present embodiment interprets an operation description by an output document storage unit 106 that stores a structured document and a partial structure, Action description interpreting means 107 for executing editing processes such as adding documents, combining documents, and counting the number of documents, and accumulating structured documents and partial structures in the output document accumulating means 107.
And a document-specific preprocessing description unit 108 that describes an operation to be performed before starting the extraction process for each read document.
Document-specific post-processing description means for describing an operation to be executed each time the extraction processing is completed for each read document
109, a document-specific pre-processing execution unit 110 that notifies the operation description interpreting unit of the operation description described in the document-specific pre-processing description unit before the extraction process is performed on each read document. And a post-document post-processing execution unit 111 for notifying the operation description interpretation unit of the operation description described in the post-document post-processing description unit every time the extraction process is completed for each of the read documents. An initial processing description unit 112 describing an operation to be executed before starting the extraction process on the first document of the read documents, and an operation to be executed after the extraction process is completed on all the read documents. Before performing the extraction processing on the first document of the read document, and notifying the behavior description described in the initial processing description means to the behavior description interpretation means. The period processing execution means 114,
After the extraction process for all the read documents is completed, the end-time process executing unit 11 for notifying the operation description interpreting unit of the operation description described in the end process description unit 11
5, a document correcting unit 116 that receives a tag name change instruction, a structure deletion instruction, a character string change instruction, or a character string deletion instruction and executes each process, and a document that sorts a structured document or a partial structure according to a specified key. And sorting means 117.
【0125】次に、動作について図23、図29、図30、図
31、図32、図33、図34、図35を参照して説明する。Next, the operation will be described with reference to FIGS.
Description will be made with reference to FIGS. 31, 32, 33, 34, and 35.
【0126】図29は、第2の実施の形態の全体処理動作
を示す流れ図である。FIG. 29 is a flow chart showing the overall processing operation of the second embodiment.
【0127】初期処理実行手段114が初期処理を実行(ス
テップ2901)後、構造化文書入力手段101は文書編集の対
象となる複数の構造化文書を1つ読み込む(ステップ290
2)。さらに、文書毎前処理実行手段110が文書毎前処理
を実行(ステップ2903)後、文書編集処理実行手段104
は、文書処理記述手段102から編集処理記述を1つ取り
出して(ステップ2904)、抽出・動作記述解釈処理を実行
し(ステップ2905)、次に処理すべき編集処理記述がある
場合(ステップ2906)には、編集処理記述を1つ取り出す
処理2904に戻り、また、処理すべき編集処理記述がない
場合には、文書毎後処理実行手段111が文書毎後処理を
実行(ステップ2907)後、次に処理すべき構造化文書があ
るかを調べる(ステップ2908)。全ての構造化文書に対す
る処理がまだ完了していない場合には、ステップ2902の
文書を1つ読み込む処理に戻り、また、全ての構造化文
書に対する処理が完了した場合には、終了時処理実行手
段115が終了時処理を実行(ステップ2909)後、文書出力
手段105が、出力文書蓄積手段106に蓄積された部分構造
をそのまま、あるいは加工して出力する(ステップ291
0)。After the initial processing execution means 114 executes the initial processing (step 2901), the structured document input means 101 reads one of a plurality of structured documents to be edited (step 290).
2). Further, after the document-specific preprocessing executing means 110 executes the document-specific preprocessing (step 2903), the document editing processing executing means 104
Retrieves one edit processing description from the document processing description means 102 (step 2904), executes extraction / behavior description interpretation processing (step 2905), and when there is an edit processing description to be processed next (step 2906) Returns to the processing 2904 for extracting one editing processing description. If there is no editing processing description to be processed, the post-processing unit 111 executes the post-processing for each document (step 2907). It is checked whether there is a structured document to be processed (step 2908). If the processing for all the structured documents has not been completed yet, the process returns to the processing of reading one document in step 2902, and if the processing for all the structured documents has been completed, the end-time processing execution means After the terminal 115 executes the end processing (step 2909), the document output unit 105 outputs the partial structure stored in the output document storage unit 106 as it is or after processing (step 291).
0).
【0128】前記初期処理における動作フローを、図30
を用いて説明する。The operation flow in the initial processing is shown in FIG.
This will be described with reference to FIG.
【0129】初期処理では、初期処理実行手段114が、
初期処理記述手段112から初期処理記述を読み込み(ステ
ップ3001)、前記読み込んだ初期処理記述を動作記述解
釈手段107に通知して、動作記述解釈処理を実行する(ス
テップ3002)。In the initial processing, the initial processing executing means 114
The initial process description is read from the initial process description unit 112 (step 3001), the read initial process description is notified to the operation description interpretation unit 107, and the operation description interpretation process is executed (step 3002).
【0130】前記文書毎前処理における動作フローを、
図31を用いて説明する。The operation flow in the document pre-processing is as follows.
This will be described with reference to FIG.
【0131】文書毎前処理では、文書毎前処理実行手段
110が、文書毎前処理記述手段108から文書毎前処理記述
を読み込み(ステップ3101)、前記読み込んだ文書毎前処
理記述を動作記述解釈手段107に通知して、動作記述解
釈処理を実行する(ステップ3102)。In the document-based pre-processing, the document-based pre-processing executing means
110 reads the document-specific preprocessing description from the document-specific preprocessing description means 108 (step 3101), notifies the behavior description interpretation means 107 of the read document-specific preprocessing description, and executes the behavior description interpretation processing (step 3101). Step 3102).
【0132】前記文書毎後処理における動作フローを、
図32を用いて説明する。The operation flow in the post-document post-processing is as follows:
This will be described with reference to FIG.
【0133】文書毎後処理では、文書毎後処理実行手段
111が、文書毎後処理記述手段109から文書毎後処理記述
を読み込み(ステップ3201)、前記読み込んだ文書毎後処
理記述を動作記述解釈手段107に通知して、動作記述解
釈処理を実行する(ステップ3202)。In the post-processing for each document, the post-processing execution means for each document
111 reads the document-specific post-processing description from the document-specific post-processing description means 109 (step 3201), notifies the read document-specific post-processing description to the behavior description interpretation means 107, and executes the behavior description interpretation processing (step 3201). Step 3202).
【0134】前記終了時処理における動作フローを、図
33を用いて説明する。The operation flow in the end-time processing is shown in FIG.
This will be described using 33.
【0135】終了時処理では、終了時処理実行手段115
が、終了時処理記述手段113から終了時処理記述を読み
込み(ステップ3301)、前記読み込んだ終了時処理記述を
動作記述解釈手段107に通知して、動作記述解釈処理を
実行する(ステップ3302)。In the end-time processing, the end-time processing executing means 115
Reads the end-time process description from the end-time process description unit 113 (step 3301), notifies the read-out end-time process description to the behavior description interpretation unit 107, and executes the behavior description interpretation process (step 3302).
【0136】前記抽出・動作記述解釈処理における動作
フローを、図34を用いて説明する。The operation flow in the extraction and operation description interpretation processing will be described with reference to FIG.
【0137】抽出・動作記述解釈処理では、文書編集処
理実行手段104が、前記ステップ2904の編集処理記述を
1つ取り出す処理で取り出された編集処理記述の編集箇
所記述を用いて抽出処理を実行(ステップ3401)し、その
結果、マッチが成立した場合(ステップ3402)には、前記
抽出処理によって抽出された部分構造を文書蓄積手段10
3より取り出して、前記取り出した編集処理記述中の動
作記述とともに動作記述解釈手段107に通知して、動作
記述解釈処理を実行する(ステップ3403)。また、前記抽
出処理を実行した結果、マッチが成立しなかった場合に
は、動作記述解釈処理を実行せず、抽出・動作記述解釈
処理を終了する。In the extraction / behavior description interpretation process, the document editing process executing means 104 executes the extraction process using the editing location description of the editing process description extracted in the process of extracting one editing process description in the step 2904 ( Step 3401), and as a result, if a match is established (step 3402), the partial structure extracted by the extraction processing is stored in the document storage unit 10
3 and notifies the action description interpreting means 107 together with the action description in the extracted edit processing description to execute the action description interpretation processing (step 3403). If no match is found as a result of executing the extraction process, the operation description interpretation process is not executed, and the extraction / operation description interpretation process ends.
【0138】前記動作記述解釈処理における動作フロー
を、図35を用いて説明する。An operation flow in the operation description interpretation processing will be described with reference to FIG.
【0139】動作記述解釈処理では、動作記述解釈手段
107が、前記通知された動作記述を解釈して、タグ名変
更指示、構造削除指示、文字列変更指示、あるいは、文
字列削除指示などの文書修正指示であった場合(ステッ
プ3501)には、前記文書修正指示と、指定された部分構
造とを、文書修正手段116に通知し、修正結果を得る(ス
テップ3502)。また、前記通知された動作記述が文書ソ
ート指示であった場合(ステップ3503)には、前記文書ソ
ート指示と、指定された部分構造とを、文書ソート手段
117に通知し、ソートした結果を得る(ステップ3504)。
また、前記通知された動作記述が、文書修正指示でも文
書ソート指示でもなかった場合には、前記動作記述に従
い、一時変数への格納や演算、出力文書蓄積手段106へ
の部分構造の格納などの動作実行処理を実行する(ステ
ップ3505)。前記ステップ3502の文書修正処理、もしく
は、前記ステップ3504の文書ソート処理、もしくは、前
記ステップ3505の動作実行処理の実行後、まだ処理すべ
き動作記述がある場合(ステップ3506)には、動作記述解
釈処理の先頭に戻る。また、処理すべき動作記述がもう
ない場合には、動作記述解釈処理を終了する。In the operation description interpretation processing, the operation description interpretation means
107, interpreting the notified operation description, if a tag name change instruction, structure deletion instruction, character string change instruction, or a document correction instruction such as a character string deletion instruction, (step 3501) The document modification instruction and the designated partial structure are notified to the document modification means 116, and a modification result is obtained (step 3502). If the notified operation description is a document sort instruction (step 3503), the document sort instruction and the specified partial structure
Notification is made to 117 to obtain a sorted result (step 3504).
If the notified operation description is neither a document correction instruction nor a document sorting instruction, the operation description is stored in a temporary variable, calculated, or stored in the output document storage unit 106 in accordance with the operation description. An operation execution process is executed (step 3505). After performing the document correction process in step 3502, the document sorting process in step 3504, or the operation execution process in step 3505, if there is still an operation description to be processed (step 3506), the operation description interpretation Return to the beginning of the process. If there is no more operation description to be processed, the operation description interpretation process ends.
【0140】なお、図34における抽出処理は、前記図23
を用いて説明した抽出処理と同一である。Note that the extraction process in FIG.
Is the same as the extraction process described with reference to FIG.
【0141】[0141]
【実施例】次に、本発明の第2の実施の形態の実施例と
して、図2および図23、図29、図30、図31、図32、図3
3、図34、図35の構成による方式の動作を、具体例を用
いて説明する。Next, examples of the second embodiment of the present invention will be described with reference to FIGS. 2, 23, 29, 30, 31, 32, and 3.
3, the operation of the system according to the configuration of FIGS. 34 and 35 will be described using a specific example.
【0142】例えば、図37のように、入力文書3701や入
力文書3702の論文情報から文書編集方式3703により題名
を抽出し、また、各題名の著者数を数えて、題名と著者
人数とからなり、かつ、各著者人数を全て合計した合計
人数が最後に添付された一覧表(以降、一覧表Cと呼ぶ)
を出力文書3704として作成したいとする。For example, as shown in FIG. 37, the title is extracted from the paper information of the input document 3701 and the input document 3702 by the document editing method 3703, and the number of authors of each title is counted. And a list attached to the total number of all authors at the end (hereinafter referred to as List C)
As an output document 3704.
【0143】入力文書3701、3702は、図9の構造化文書
901、902のようなSGML形式であるとする。Input documents 3701 and 3702 are structured documents shown in FIG.
It is assumed that the format is an SGML format such as 901 and 902.
【0144】また、作成したい一覧表Cは、図38のよう
なSGML形式、すなわち、 1.<論文題名>および</論文題名>というタグで囲
まれた論文の題名を表す部分構造 2.<著者人数>および</著者人数>というタグで囲
まれた著者の人数を表す部分構造 をこの順序で並べて全体を<表要素>および</表要素
>というタグで囲んだ部分構造を、さらに複数並べて、
最後に、部分構造 3.<合計人数>および</合計人数>というタグで囲
まれた著者の合計人数を表す部分構造 が追加された部分構造の並びの全体を、<一覧表C>お
よび</一覧表C>というタグで囲んだ形式で表現す
る。The list C to be created is in the SGML format as shown in FIG. 1. Partial structure representing the title of the paper enclosed by tags <paper title> and </ paper title> The substructures that represent the number of authors enclosed by the tags <number of authors> and </ number of authors> are arranged in this order, and the entire substructure that is enclosed by the tags <table element> and </ table element> Arrange multiple,
Finally, the partial structure <List C> and </ List C> are the entire sequence of substructures with the added substructure indicating the total number of authors enclosed by the tags <total number> and </ total number>. Expressed in the format enclosed by.
【0145】また、文書処理記述手段には、次の編集処
理記述D−1および編集処理記述D−2の2つの編集処
理記述が格納されている。なお、変数daimei、および、
変数countは、動作記述解釈手段107が内部で管理する変
数である。変数daimeiは、部分構造を格納することので
きる変数であり、ここでは、抽出した部分構造を格納す
るために用いている。また、変数countは、整数値を格
納することのできる変数であり、ここでは、各論文毎の
著者人数をカウントするために用いている。 編集処理記述D−1:次の編集箇所記述1と動作記述1
の組から成る 編集箇所記述1:%<題名> 動作記述1 :編集箇所記述1の1つめの引用指定子
と対応する部分構造中の<題名>タグを<論文題名>タ
グに変更したものを、変数daimeiに格納する。 編集処理記述D−2:次の編集箇所記述2と動作記述2
の組から成る 編集箇所記述2:%<人数> 動作記述2 :編集箇所記述2の1つめの引用指定子
と対応する部分構造の数を数え、変数countにその値を
格納する。The document processing description means stores the following two editing processing descriptions: an editing processing description D-1 and an editing processing description D-2. Note that the variables daimei and
The variable count is a variable internally managed by the behavioral description interpreting means 107. The variable daimei is a variable that can store a partial structure, and is used here to store the extracted partial structure. The variable count is a variable that can store an integer value, and is used here to count the number of authors for each paper. Edit processing description D-1: Next edit location description 1 and operation description 1
Edited part description 1:% <title> Behavioral description 1: Changed the <title> tag in the substructure corresponding to the first citation specifier of edited part description 1 to <article title> tag , Stored in the variable daimei. Editing process description D-2: Next editing location description 2 and operation description 2
Edited part description 2:% <number of people> Action description 2: The number of partial structures corresponding to the first citation specifier of edited part description 2 is counted, and the value is stored in a variable count.
【0146】また、初期処理記述手段には、次の初期処
理記述1および初期処理記述2の2つのステップが格納
されている。なお、変数total、および、変数tableは、
動作記述解釈手段107が内部で管理する変数である。変
数totalは、整数値を格納することのできる変数であ
り、ここでは、著者人数の合計をカウントするために用
いている。また、変数tableは、部分構造を格納するこ
とのできる変数であり、ここでは、表要素の並びを作成
するために用いている。 初期処理記述1:変数totalに0を代入する 初期処理記述2:変数tableの内容を空にする。The initial processing description means stores the following two steps of initial processing description 1 and initial processing description 2. Note that the variable total and the variable table are
These are variables managed internally by the operation description interpreting means 107. The variable total is a variable that can store an integer value, and is used here to count the total number of authors. The variable table is a variable that can store a partial structure, and is used here to create a sequence of table elements. Initial processing description 1: Assign 0 to variable total Initial processing description 2: Empty the contents of variable table.
【0147】また、文書毎前処理記述手段には、次の文
書毎前処理記述1が格納されている。 文書毎前処理記述1:変数countに0を代入する。The document-specific pre-processing description means stores the following document-specific pre-processing description 1. Preprocessing description for each document 1: 0 is substituted for the variable count.
【0148】また、文書毎後処理記述手段には、次の文
書毎後処理記述1および文書毎後処理記述2の2つのス
テップが格納されている。 文書毎後処理記述1:変数totalの値を、変数countの値
だけ増やす。 文書毎後処理記述2: <表要素> 変数daimeiの内容 <著者人数> 変数countの内容 </著者人数> </表要素> の部分構造を構成し、変数tableに追加する また、終了時処理記述手段には、次の終了時処理記述1
が格納されている。 終了時処理記述1: <一覧表C> 変数tableの内容 <合計人数> 変数totalの内容 </合計人数> </一覧表C> の部分構造を構成し、出力文書蓄積手段へ格納する。The document-specific post-processing description means stores the following two steps: the following document-specific post-processing description 1 and the following document-specific post-processing description 2. Post-processing description for each document 1: Increase the value of variable total by the value of variable count. Document-specific post-processing description 2: <table element> Contents of variable daimei <number of authors> Contents of variable count </ number of authors> Configure partial structure of <table element> and add it to variable table. The description means includes the following end processing description 1
Is stored. End-time process description 1: <List C> Contents of variable table <Total number of people> Contents of variable total </ Total number of people></ List C> A partial structure is configured and stored in the output document storage means.
【0149】また、文書出力手段は、出力文書蓄積手段
に格納された文書をそのまま出力する。Further, the document output means outputs the document stored in the output document storage means as it is.
【0150】以上の条件の下での動作を説明する。The operation under the above conditions will be described.
【0151】初期処理実行手段114が初期処理を実行し
(ステップ2901)、初期処理記述手段112から、前記初期
処理記述1および前記初期処理記述2を読み込み(ステ
ップ3001)、動作記述解釈手段107へ通知して動作記述解
釈処理を実行させる(ステップ3002)。The initial processing execution means 114 executes the initial processing.
(Step 2901) The initial processing description 1 and the initial processing description 2 are read from the initial processing description means 112 (Step 3001), and the operation description interpretation means 107 is notified to execute the operation description interpretation processing (Step 3002). .
【0152】動作記述解釈手段107は、まず、初期処理
記述1を解釈して動作実行処理を実行(ステップ3505)す
る。これにより、動作記述解釈手段107が内部で管理す
る変数totalの内容が0に初期化される。次に、動作記
述解釈手段107は、初期処理記述2を解釈して動作実行処
理を実行(ステップ3505)する。これにより、動作記述解
釈手段107が内部で管理する変数tableの内容が空に初期
化される。The operation description interpreting means 107 first executes the operation execution processing by interpreting the initial processing description 1 (step 3505). As a result, the content of the variable total managed internally by the behavioral description interpreting means 107 is initialized to zero. Next, the behavior description interpreting means 107 interprets the initial processing description 2 and executes the behavior execution processing (step 3505). As a result, the contents of the variable table internally managed by the operation description interpretation means 107 are initialized to empty.
【0153】初期処理の実行が完了すると、全体の処理
に戻り、、構造化文書入力手段101が、1つめの入力文
書として、構造化文書901を読み込む(ステップ2902)。When the execution of the initial processing is completed, the process returns to the whole processing, and the structured document input means 101 reads the structured document 901 as the first input document (step 2902).
【0154】文書毎前処理実行手段110が文書毎前処理
を実行し(ステップ2903)、文書毎前処理記述手段108か
ら、前記文書毎前処理記述1を読み込み(ステップ310
1)、動作記述解釈手段107へ通知して動作記述解釈処理
を実行させる(ステップ3102)。The document-specific preprocessing execution means 110 executes the document-specific preprocessing (step 2903), and reads the document-specific preprocessing description 1 from the document-specific preprocessing description means 108 (step 310).
1) Notify the operation description interpretation means 107 to execute the operation description interpretation processing (step 3102).
【0155】動作記述解釈手段107は、前記文書毎前処
理記述1を解釈して動作実行処理を実行する(ステップ3
505)。これにより、動作記述解釈手段107が内部で管理
する変数countの内容が0に初期化される。The operation description interpreting means 107 executes the operation execution processing by interpreting the document-specific preprocessing description 1 (step 3).
505). As a result, the contents of the variable count internally managed by the operation description interpretation means 107 are initialized to zero.
【0156】文書毎前処理の実行が完了すると、全体の
処理に戻り、文書編集処理手段104が、文書処理記述手
段102から、前記編集処理記述D−1を取り出し(ステッ
プ2904)、抽出・動作記述解釈処理を実行する(ステップ
2905)。When the execution of the pre-processing for each document is completed, the process returns to the whole processing, and the document editing processing means 104 extracts the editing processing description D-1 from the document processing description means 102 (step 2904), and extracts and operates. Execute description interpretation processing (step
2905).
【0157】抽出・動作記述解釈処理では、文書編集処
理実行手段104が、前記取り出した編集処理記述D−1
の編集箇所記述1を用いて、構造化文書901の抽出処理
を実行する(ステップ3401)。抽出処理の実行の結果、マ
ッチが成立し、編集箇所記述1の1つめの引用指定子に
対応する部分構造として、 <題名> ××に関する研究 </題名> が抽出される。マッチが成立したため(ステップ3402)、
文書編集処理実行手段104は、前記取り出した編集処理
記述D−1の動作記述1と前記抽出した部分構造とを動
作記述解釈手段107に通知し、動作記述解釈処理を実行
させる(ステップ3403)。In the extraction / behavior description interpretation processing, the document editing processing executing means 104 executes the extracted editing processing description D-1.
The extraction processing of the structured document 901 is executed by using the edit location description 1 of (1) (step 3401). As a result of the execution of the extraction process, a match is established, and a study on <title> XX is extracted as a partial structure corresponding to the first citation specifier of the edit location description 1. Because a match was made (step 3402)
The document editing process executing unit 104 notifies the operation description interpreting unit 107 of the operation description 1 of the extracted editing process description D-1 and the extracted partial structure, and causes the operation description interpretation process to be executed (step 3403).
【0158】動作記述解釈処理では、動作記述解釈手段
107が、与えられた動作記述1を解釈する。動作記述1
には文書修正指示が含まれているため(ステップ3501)、
動作記述解釈手段107は、文書修正手段116に、前記抽出
した文書と、「<題名>を<論文題名>に変える」とい
う修正指示とを通知し、文書修正処理を実行させる。文
書修正処理の実行結果として、動作記述解釈手段107
は、部分文書 <論文題名> ××に関する研究 </論文題名> を受けとる。さらに、動作記述解釈手段107は、動作記
述1の残りの処理を解釈して、動作実行処理を行い(ス
テップ3505)、前記受けとった部分文書を、動作記述解
釈手段107が内部で管理する変数daimeiに格納する。In the operation description interpretation processing, the operation description interpretation means
107 interprets the given action description 1. Behavior description 1
Contains a document correction instruction (step 3501),
The operation description interpreting means 107 notifies the document correcting means 116 of the extracted document and a correction instruction of “change <title> to <article title>”, and causes the document correcting processing to be executed. As the execution result of the document correction processing, the behavioral description interpreting means 107
Receives the subdocument <Research title> XX Research << Research title>. Further, the action description interpreting means 107 interprets the remaining processing of the action description 1 and performs an action execution process (step 3505), and converts the received partial document into a variable daimei which is internally managed by the action description interpreting means 107. To be stored.
【0159】動作記述解釈処理が完了し、さらに、抽出
・動作記述解釈処理が完了して、全体の処理に戻り、次
の編集処理記述D−2を用いた抽出・動作記述解釈処理
が同様に実行される。[0159] The action description interpretation processing is completed, and further, the extraction / action description interpretation processing is completed, the process returns to the overall processing, and the extraction / action description interpretation processing using the next editing processing description D-2 is similarly performed. Be executed.
【0160】編集処理記述D−2を用いた抽出・動作記
述解釈処理では、編集箇所記述2とのマッチにより、 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> の2つの部分構造が抽出され、動作記述2の解釈によっ
て、動作記述解釈手段107が内部で管理する変数countに
2が代入される。In the extraction / behavior description interpretation process using the edit process description D-2, the match with the edit location description 2 causes the <name> ○ × Taro </ name><name> XX Hanako </ name> The two partial structures are extracted, and by interpreting the behavioral description 2, 2 is substituted for a variable count internally managed by the behavioral description interpreting means 107.
【0161】文書処理記述手段102の全ての編集処理記
述の処理が完了したため(ステップ2906)、文書毎後処理
実行手段111が文書毎後処理を実行し(ステップ2907)、
動作記述解釈手段107が内部で管理する変数totalの値が
2となり、また、動作記述解釈手段107が内部で管理す
る変数tableの内容が、 <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> となる。Since all the editing process descriptions of the document process description unit 102 have been completed (step 2906), the post-processing unit 111 executes post-processing for each document (step 2907).
The value of the variable “total” internally managed by the behavioral description interpreting means 107 is 2, and the contents of the variable “table” internally managed by the behavioral description interpreting means 107 are <table element><title of the article> Study on XX << / Title><Number of authors> 2 </ Number of authors></ Table element>
【0162】同様に、構造化文書902の処理が行われ、
その結果、動作記述解釈手段107が内部で管理する変数t
otalの値に1が加えられて3となり、また、動作記述解
釈手段107が内部で管理する変数tableに新たな部分構造
が追加され、変数tableの内容は、 <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> となる。Similarly, the processing of the structured document 902 is performed,
As a result, the variable t managed internally by the operation description
The value of otal is incremented by 1 to become 3, and a new partial structure is added to the variable table internally managed by the behavioral description interpreting means 107. The contents of the variable table are <table elements><title of article> × Research on × 〈Thesis title〉 < Number of authors > 2 〈Number of authors〉 〈/ Table elements〉 < Table elements > < Article title > Research on ○○ 〈Article title〉 < Number of authors > 1 〈/ Number of authors〉 </ Table element>.
【0163】全ての入力文書に対する処理が完了したた
め(ステップ2908)、終了時処理実行手段115が終了時処
理を実行し(ステップ2909)、その結果、 <一覧表C> <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> <合計人数> 3 </合計人数> <一覧表C> という一覧表Cが完成し、出力文書蓄積手段106に格納
される。Since the processing for all the input documents has been completed (step 2908), the ending processing execution means 115 executes the ending processing (step 2909). As a result, <list C><tableelement><articletitle>> Research on XX </ title><number of authors> 2 </ number of authors></ table element><tableelement><title of the article> Study on XX </ title of the article><number of authors> 1 </ author The number of persons></ table element><total number of persons> 3 </ total number of persons><listC> is completed and stored in the output document storage means 106.
【0164】最後に、文書出力手段105が、前記出力文
書蓄積手段106に格納された一覧表Cを出力する(ステッ
プ2910)。Finally, the document output means 105 outputs the list C stored in the output document storage means 106 (step 2910).
【0165】なお、前記例では、動作記述解釈手段107
は、動作記述1の文書修正指示を解釈して、文書修正手
段116に文書修正処理を実行させたが、文書修正手段116
を用意せずに、動作記述解釈手段107がステップ3505の
動作実行処理の中で文書修正処理を行ってもよい。In the above example, the operation description interpreting means 107
Interprets the document correction instruction in the operation description 1 and causes the document correction means 116 to execute the document correction processing.
, The action description interpreting means 107 may perform the document correction processing in the action execution processing of step 3505.
【0166】また、前記例にはなかったが、同様に、動
作記述解釈手段107に通知された動作記述に文書ソート
指示が含まれていた場合には、文書ソート手段117を用
意して、動作記述解釈手段107が文書ソート手段117に、
文書ソート処理を実行させる他に、文書ソート手段117
を用意せず、動作記述解釈手段107が、ステップ3505の
動作実行処理の中で文書ソート処理を行ってもよい。Although not described in the above example, similarly, if the action description notified to the action description interpreting means 107 includes a document sort instruction, the document sort means 117 is prepared. The description interpreting means 107 makes the document sorting means 117
In addition to executing the document sorting process, the document sorting unit 117
May not be prepared, and the operation description interpreting means 107 may perform the document sorting process in the operation execution process of step 3505.
【0167】図3は本発明の第3の実施の形態の構成図
である。図3を参照すると、本実施の形態の文書編集方
式は、第2の実施の形態の構成に加えて、前記読み込ま
れた文書に対する削除要求を受け付け、前記削除要求を
前記文書編集処理実行手段および前記動作記述解釈手段
に通知する入力文書削除要求受信手段118をさらに有す
る。FIG. 3 is a configuration diagram of a third embodiment of the present invention. Referring to FIG. 3, the document editing method according to the present embodiment, in addition to the configuration of the second embodiment, receives a deletion request for the read document, and transmits the deletion request to the document editing processing execution unit. An input document deletion request receiving unit 118 for notifying the operation description interpreting unit is further provided.
【0168】次に、動作について図23、図30、図31、図
32、図33、図34、図36を参照して説明する。Next, the operation will be described with reference to FIGS.
This will be described with reference to FIGS. 32, 33, 34, and 36.
【0169】図36は、第3の実施の形態の全体処理動作
を示す流れ図である。FIG. 36 is a flowchart showing the overall processing operation of the third embodiment.
【0170】初期処理実行手段114が初期処理を実行(ス
テップ3601)後、構造化文書入力手段101は文書編集の対
象となる構造化文書の到着を待つ(ステップ3602)。ま
た、入力文書削除要求受信手段118は入力文書削除要求
を待つ(ステップ3603)。After the initial processing execution means 114 executes the initial processing (step 3601), the structured document input means 101 waits for the arrival of a structured document to be edited (step 3602). Also, the input document deletion request receiving means 118 waits for an input document deletion request (step 3603).
【0171】構造化文書が到着した場合には、構造化文
書入力手段101が到着した構造化文書を1つ読み込む(ス
テップ3604)。さらに、文書毎前処理実行手段110が文書
毎前処理を実行(ステップ3605)後、文書編集処理実行手
段104は、文書処理記述手段102から編集処理記述を1つ
取り出して(ステップ3606)、抽出・動作記述解釈処理を
実行し(ステップ3607)、次に処理すべき編集処理記述が
ある場合(ステップ3608)には、ステップ3606の編集処理
記述を1つ取り出す処理に戻り、また、処理すべき編集
処理記述がない場合には、文書毎後処理実行手段110が
文書毎後処理を実行(ステップ3609)後、まだ構造化文書
の到着を待つべきかを判定する(ステップ3610)。まだ構
造化文書の到着を待つべきと判断した場合には、構造化
文書の到着を待つ処理に戻り、また、全ての構造化文書
に対する処理が完了したと判断した場合には、終了時処
理実行手段115が終了時処理を実行(ステップ3611)後、
文書出力手段105が、出力文書蓄積手段106に蓄積された
部分構造をそのまま、あるいは加工して出力する(ステ
ップ3612)。When a structured document has arrived, the structured document input means 101 reads one of the arrived structured documents (step 3604). Furthermore, after the document-specific preprocessing execution means 110 executes the document-specific preprocessing (step 3605), the document editing processing executing means 104 extracts one editing processing description from the document processing description means 102 (step 3606) and extracts The action description interpretation process is executed (step 3607), and if there is an edit process description to be processed next (step 3608), the process returns to the process of extracting one edit process description in step 3606, and the process should be further processed. If there is no edit processing description, the post-document post-processing execution unit 110 executes post-document post-processing (step 3609), and then determines whether to wait for the arrival of the structured document (step 3610). If it is determined that the structured document should still be waited for, the process returns to the process of waiting for the arrival of the structured document. If it is determined that the processing for all structured documents has been completed, the process at the end is executed. After the means 115 executes the termination processing (step 3611),
The document output means 105 outputs the partial structure stored in the output document storage means 106 as it is or after processing (step 3612).
【0172】また、入力文書削除要求受信手段118が入
力文書削除要求を受信した場合には、文書編集処理実行
手段104および動作記述解釈手段107へ削除要求を通知す
る。入力文書削除要求受信手段118から削除要求を通知
された文書編集処理実行手段104は、削除要求のあった
文書に関する部分構造を文書蓄積手段103から削除し(ス
テップ3613)、また、削除した部分構造を動作記述解釈
手段107へ通知する。入力文書削除要求受信手段118から
削除要求を通知され、また、文書編集処理実行手段104
から削除した部分構造を通知された動作記述解釈手段10
7は、削除要求された文書名や削除した部分構造などの
情報をもとに、動作記述解釈手段107の内部情報や出力
文書蓄積手段106の内容を変更して、削除要求された文
書が到着していない場合と等しい状態にする(ステップ3
614)。When the input document deletion request receiving means 118 receives the input document deletion request, the input document deletion request receiving means 118 notifies the document editing processing execution means 104 and the operation description interpretation means 107 of the deletion request. The document editing process executing means 104, which has been notified of the deletion request from the input document deletion request receiving means 118, deletes the partial structure relating to the document for which the deletion request has been made from the document storage means 103 (step 3613). To the operation description interpreting means 107. The deletion request is notified from the input document deletion request receiving means 118, and the document editing processing execution means 104
Behavior description interpreting means 10 notified of the partial structure deleted from
7 changes the internal information of the operation description interpretation means 107 and the contents of the output document storage means 106 based on the information such as the name of the document requested to be deleted and the deleted partial structure, so that the requested document arrives. State (step 3
614).
【0173】なお、図36における初期処理は、前記図30
を用いて説明した初期処理と同一である。Note that the initial processing in FIG.
This is the same as the initial processing described with reference to FIG.
【0174】また、図36における文書毎前処理は、前記
図31を用いて説明した文書毎前処理と同一である。The pre-processing for each document in FIG. 36 is the same as the pre-processing for each document described with reference to FIG.
【0175】また、図36における抽出・動作記述解釈処
理は、前記図34を用いて説明した抽出・動作記述解釈処
理と同一である。The extraction / behavior description interpretation process in FIG. 36 is the same as the extraction / behavior description interpretation process described with reference to FIG.
【0176】また、図36における文書毎後処理は、前記
図32を用いて説明した文書毎後処理と同一である。The post-processing for each document in FIG. 36 is the same as the post-processing for each document described with reference to FIG.
【0177】また、図36における終了時処理は、前記図
33を用いて説明した終了時処理と同一である。The processing at the end in FIG.
This is the same as the termination process described with reference to FIG.
【0178】[0178]
【実施例】次に、本発明の第3の実施の形態の実施例と
して、図3および図23、図30、図31、図32、図33、図3
4、図36の構成による方式の動作を、第2の形態の実施
例に用いた例と同様の例で説明する。FIG. 3 and FIGS. 23, 30, 31, 32, 33, and 33 are examples of the third embodiment of the present invention.
4. The operation of the system according to the configuration of FIG. 36 will be described using an example similar to the example used in the example of the second embodiment.
【0179】ただし、 1.構造化文書901が到着 2.構造化文書902が到着 3.構造化文書901の削除要求が到着 4.さらに別の構造化文書が到着 の順番で、入力文書や要求が到着するものとする。However, 1. 1. Structured document 901 arrives 2. Structured document 902 arrives 3. A request to delete structured document 901 arrives. It is assumed that input documents and requests arrive in the order of arrival of another structured document.
【0180】まず、構造化文書901および構造化文書902
が順次到着すると、第2の実施の形態の説明の場合と同
様に処理が行われ、その結果、動作記述解釈手段107が
内部で管理する変数totalの値は3となり、また、動作
記述解釈手段107が内部で管理する変数tableの内容は、 <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> となる。また、文書蓄積手段103には、部分構造が、抽
出した構造化文書毎に格納されており、 構造化文書901から抽出した部分構造 編集箇所記述1の1つめの引用指定子と対応する 部分構造 <題名> ××に関する研究 </題名> 編集箇所記述2の1つめの引用指定子と対応する 部分構造 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> 構造化文書902から抽出した部分構造 編集箇所記述1の1つめの引用指定子と対応する 部分構造 <題名> ○○に関する研究 </題名> 編集箇所記述2の1つめの引用指定子と対応する 部分構造 <氏名> ○○ 次郎 </氏名> となっている。First, structured document 901 and structured document 902
Sequentially arrives, processing is performed in the same manner as in the description of the second embodiment. As a result, the value of the variable total managed internally by the operation description interpretation means 107 becomes 3, and The contents of the variable table internally managed by 107 are as follows: <Table element><Articletitle> Study on XX </ Article title><Number of authors> 2 </ Number of authors></ Table element><Tableelement><ArticleTitle> Study on XX </ Thesis title><Number of authors> 1 </ Number of authors></ Table element> Further, the document storage unit 103 stores a partial structure for each extracted structured document. The partial structure extracted from the structured document 901 and the partial structure corresponding to the first citation specifier of the edit location description 1 <Title> Study on XX </ Title> Partial structure corresponding to the first citation specifier in Edited Description 2 <Name> ○ × Taro </ Name><Name> XX Hanako </ Name> Structured document Substructure extracted from 902 Substructure corresponding to the first citation specifier in edit location description 1 <Title> Study on XX </ title> Substructure corresponding to the first citation specifier in edit location description 2 <Name> XX Jiro </ name>
【0181】次に、構造化文書901の削除要求が到着す
ると(ステップ3603)、入力文書削除要求受信手段118が
文書編集処理実行手段104および動作記述解釈手段107
に、前記削除要求を通知する。前記削除要求を受けとっ
た文書編集処理実行手段104は、前記文書蓄積手段103か
ら、入力文書901に関する部分構造を削除し、文書蓄積
手段103の内容は、 構造化文書902から抽出した部分構造 編集箇所記述1の1つめの引用指定子と対応する 部分構造 <題名> ○○に関する研究 </題名> 編集箇所記述2の1つめの引用指定子と対応する 部分構造 <氏名> ○○ 次郎 </氏名> となる。また、動作記述解釈手段107は、入力文書削除
要求受信手段118から削除要求を受けとり、かつ、文書
編集処理実行手段104から前記部分構造の削除を通知さ
れると、削除された文書が到着していない場合と等しい
状態とするため、動作記述解釈手段107が内部で管理す
る変数totalの値から2を減じて1とし、また、動作記
述解釈手段107が内部で管理する変数tableの内容の一部
を削除して、変数tableの内容を、 <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> とする。Next, when a request to delete the structured document 901 arrives (step 3603), the input document deletion request receiving means 118 causes the document editing processing executing means 104 and the operation description interpreting means 107 to execute.
The deletion request. Upon receiving the deletion request, the document editing process executing means 104 deletes the partial structure related to the input document 901 from the document storing means 103, and the content of the document storing means 103 is the partial structure extracted from the structured document 902. Substructure corresponding to the first citation specifier in Description 1 <Title> Study on XX </ Title> Substructure corresponding to the first citation specifier in Edited Description 2 <Name> XX Jiro </ Name > When the operation description interpreting unit 107 receives the deletion request from the input document deletion request receiving unit 118 and is notified of the deletion of the partial structure from the document editing process executing unit 104, the deleted document has arrived. In order to make the state equal to the case where there is no data, the operation description interpreting means 107 subtracts 2 from the value of the variable "total" internally managed to obtain 1, and a part of the contents of the variable table internally managed by the operation description interpreting means 107. Is deleted, and the content of the variable table is changed to <table element><thesistitle> Research on XX </ title of the article><number of authors> 1 </ number of authors></ table element>.
【0182】以後、さらに別の入力文書が到着する度
に、第2の実施の形態の説明の場合と同様の処理が行わ
れ、全ての入力文書が到着すると、終了時処理が実行さ
れて(ステップ3611)、出力文書蓄積手段106に一覧表C
が格納され、文書出力手段105が、前記一覧表Cを出力
する(ステップ3612)。Thereafter, every time another input document arrives, the same processing as in the description of the second embodiment is performed, and when all the input documents arrive, the end-time processing is executed ( Step 3611), list C is output to output document storage means 106.
Is stored, and the document output means 105 outputs the list C (step 3612).
【0183】なお、前記例では、構造化文書の到着を待
つべきと判断した場合には、終了時処理の実行(ステッ
プ3611)および文書出力処理の実行(ステップ3612)は行
われないが、1つの文書に対する処理が完了する度に、
文書毎後処理(ステップ3610)の後で、毎回、終了時処理
の実行(ステップ3611)および文書出力処理の実行(ステ
ップ3612)を行ってもよい。この場合には、それまでに
到着した文書に関して集計した結果が一覧表Cとして毎
回出力される。例えば、前記の例で、 1.構造化文書901が到着 2.構造化文書902が到着 3.構造化文書901の削除要求が到着 の順番に入力文書や要求が到着した場合には、図39に示
すような一覧表Cが、出力文書3901、3902、3903の順に
得られる。In the above example, if it is determined that the arrival of the structured document should be waited, the execution of the termination processing (step 3611) and the execution of the document output processing (step 3612) are not performed. Each time one document is processed,
After the post-document processing (step 3610), the execution of the end processing (step 3611) and the execution of the document output processing (step 3612) may be performed each time. In this case, the totalized results of the documents that have arrived so far are output as the list C every time. For example, in the above example: 1. Structured document 901 arrives 2. Structured document 902 arrives When an input document or a request arrives in the order of arrival of the structured document 901 deletion request, a list C as shown in FIG. 39 is obtained in the order of the output documents 3901, 3902, and 3903.
【0184】また、前記削除要求を受けとった場合の動
作記述解釈手段107の処理は、動作記述解釈手段107が内
部で管理する変数などから、削除要求された文書に関す
る部分を削除する方法の他に、動作記述解釈手段107が
内部で管理する変数などの内容を全て破棄した上で、削
除要求のあった文書に関する部分構造の削除された文書
蓄積手段103をもとに、今まで到着した文書が再び同一
順序で到着したかのように全体処理を実行して、削除要
求された文書が到着していない場合と等しい状態にして
もよい。The processing of the operation description interpreting means 107 when the deletion request is received includes a method other than the method of deleting a portion related to the document requested to be deleted from the variables managed internally by the operation description interpreting means 107. After discarding all contents such as variables managed internally by the operation description interpreting means 107, based on the document storage means 103 in which the partial structure related to the document requested to be deleted has been deleted, The entire process may be executed as if the documents arrived in the same order again, and may be in the same state as when the document requested to be deleted has not arrived.
【0185】なお、以上の実施例で説明した例におい
て、文書蓄積手段103は、例えば、図4に示すように、
各引用指定子に対応する部分構造が、引用指定子毎に、
マッチが成立した順に並べたデータをメモリ上もしくは
ディスク上などに蓄積したデータベースとして実現す
る。もしくは、文書蓄積手段103は、例えば、図5に示
すように、抽出した構造化文書毎に部分構造を分け、さ
らに、引用指定子毎に分けて格納されていてもよい。In the example described in the above embodiment, for example, as shown in FIG.
The substructure corresponding to each quote specifier is
This is realized as a database in which data arranged in the order in which matches are established is stored on a memory or a disk. Alternatively, for example, as shown in FIG. 5, the document storage unit 103 may store a partial structure for each extracted structured document, and further store the partial structure for each citation designator.
【0186】また、文書処理記述手段102は、例えば、
図6に示すように、編集箇所記述1つ1つを別々の格納
領域に格納し、メモリ上もしくはディスク上などに蓄積
したデータベースとして実現する。もしくは、文書処理
記述手段102は、例えば、図7に示すように、編集箇所
記述と動作記述の組からなる編集処理記述1つ1つを別
々の格納領域に格納して構成してもよい。The document processing description means 102 includes, for example,
As shown in FIG. 6, each edit location description is stored in a separate storage area, and is realized as a database stored on a memory or a disk. Alternatively, as shown in FIG. 7, for example, the document processing description means 102 may store each editing processing description including a set of an editing location description and an operation description in a separate storage area.
【0187】また、動作記述解釈手段107は、独自の動
作記述を解釈して実行する構成の他に、一般に良く知ら
れているプログラミング言語を動作記述とし、前記プロ
グラミング言語のインタプリタを利用することも可能で
ある。The operation description interpreting means 107 may use a generally well-known programming language as an operation description and use an interpreter of the programming language in addition to a configuration for interpreting and executing an original operation description. It is possible.
【0188】また、編集箇所記述は、実施例で用いた記
号によって記述したものでなくとも、記号と編集箇所記
述の各構成要素との対応が明確であれば、本発明は適用
可能である。さらに、実施例では、編集箇所記述を記号
を用いて表現したが、編集箇所記述を図形によって表現
することもでき、この場合も、本発明は適用可能であ
る。Also, the present invention is applicable to the editing location description, which is not described by the symbols used in the embodiments, as long as the correspondence between the symbols and each component of the editing location description is clear. Furthermore, in the embodiment, the edit location description is represented by using a symbol, but the edit location description can be represented by a graphic. In this case, the present invention is applicable.
【0189】また、本実施の形態では、SGML形式の
構造化文書を例として用いたが、本発明は、他の形式の
構造化文書に対しても適用可能である。文書の構造を表
現する手段は、SGML形式などのように、特殊な意味
を持たせた文字列(タグ)でなく、四角などの図形や色
などでもよい。さらに、本発明は、入力文書が、特別な
文字や記号で構造が表現されている文書でなくとも、例
えば、記述内容などから構造化できる文書であれば、入
力手段が文書の構造を解釈して、前記例と同様に編集処
理することができる。出力文書も、特別な文字や記号で
構造が表現されている文書に限られているわけではな
く、例えば、「文書修正手段によって全てのタグを削除
してから出力文書蓄積手段に出力文書を格納する」とい
った動作記述を与えることにより、構造を表現する特別
な文字や記号のない文書を出力することができる。さら
に、構造化文書が、参照ポインタによってネットワーク
状に接続された複数の構造体の集合、あるいは、参照ポ
インタによってネットワーク状に接続された複数の文書
の集合として構成されていても、本発明は適用可能であ
る。In the present embodiment, a structured document in the SGML format is used as an example, but the present invention can be applied to structured documents in other formats. The means for expressing the structure of the document may be a figure or color such as a square instead of a character string (tag) having a special meaning, such as in the SGML format. Further, according to the present invention, even if the input document is not a document whose structure is represented by special characters or symbols, for example, if the document can be structured based on the description contents, the input means interprets the structure of the document. Thus, editing processing can be performed in the same manner as in the above example. The output document is not limited to a document whose structure is represented by special characters or symbols.For example, "The output document is stored in the output document storage unit after all tags are deleted by the document correction unit. By giving an operation description such as "do", a document without special characters or symbols expressing the structure can be output. Further, the present invention is applicable even if the structured document is configured as a set of a plurality of structures connected in a network by a reference pointer or a set of a plurality of documents connected in a network by a reference pointer. It is possible.
【0190】また、実施例では、読み込む文書も出力す
る文書も同一のSGML形式である例を用いたが、本発
明は、入力文書と出力文書の記述形式が異なる場合でも
適用可能である。In the embodiment, the example in which the document to be read and the document to be output are in the same SGML format is used. However, the present invention can be applied even when the input document and the output document have different description formats.
【0191】また、本発明では、入力文書の構造を表現
する手段(タグなど)を識別するための最小限の規約
(例えば、SGML形式の場合には、構造は開始タグと
終了タグで囲むことによって表現し、開始タグは<で始
まり>で終る文字列であり、終了タグは</で始まり>
で終る文字列である、といった文書構造の表現形式や、
省略可能なタグなど)が与えられていれば十分であり、
本発明を構成するいずれの処理も、構造化文書を解釈す
るための構造定義(タグの意味のある構成を表す文法定
義など)を必要としない。すなわち、(1)構造定義が
あいまいな構造化文書を入力あるいは出力とする場合
や、(2)構造定義が繁雑に変更される構造化文書を入
力あるいは出力とする場合、あるいは、前記「発明の属
する技術分野」で説明した利用を目的とするシステムを
設計あるいは作成あるいは運用する際に、(3)構造定
義を設計する作業や、作成する作業や、保守する作業を
省くと、システム構築や運用のための工数が著しく効率
化される場合、などにおいて、本発明の文書編集方式
は、構造定義の設計や作成や保守などの作業負担を減ら
すことができるという効果もある。Also, in the present invention, the minimum rules for identifying means (tags and the like) for expressing the structure of the input document (for example, in the case of the SGML format, the structure must be surrounded by a start tag and an end tag). The start tag is a character string that ends with <begins with>, and the end tag is with </ begins with>
Expression of the document structure, such as a character string ending with
Optional tags) are sufficient.
Neither process constituting the present invention requires a structure definition (such as a grammar definition indicating a meaningful configuration of a tag) for interpreting a structured document. That is, (1) a case where a structured document whose structure definition is ambiguous is input or output, (2) a case where a structured document whose structure definition is frequently changed is input or output, or (3) When designing, creating, or operating a system for the purpose of use described in “Technical field to which the system belongs,” (3) if the work of designing, creating, and maintaining the structure definition is omitted, the system is constructed and operated. In a case where the number of steps for the document editing is significantly improved, the document editing method of the present invention has an effect that the work load such as design, creation, and maintenance of the structure definition can be reduced.
【0192】また逆に、構造化文書入力手段101や文書
出力手段105で、入力文書や出力文書の文書構造のチェ
ックを行ってもよい。Conversely, the structured document input means 101 and the document output means 105 may check the document structure of the input document and the output document.
【0193】[0193]
【発明の効果】以上述べたように、本発明には、例えば
前記編集箇所記述Aのように、1つのパターンに複数の
抽出箇所を指定することができ、しかも、例えば、部分
構造の並びの順番という形で、各引用指定子に対応する
部分構造の間のつながりを維持して部分構造を抽出する
ことができ、さらに、構造を分解する処理を特別に用意
することなく、例えば前記加工方法Aのように、抽出し
た部分構造を、引用指定子毎に別々に扱うことができる
という効果がある。As described above, according to the present invention, it is possible to specify a plurality of extraction locations in one pattern as in the editing location description A, for example. In the form of an order, a partial structure can be extracted while maintaining the connection between the partial structures corresponding to each citation specifier, and further, without specially preparing a processing for decomposing the structure, for example, the processing method As in A, there is an effect that the extracted partial structure can be handled separately for each citation designator.
【0194】また、例えば、第1の実施の形態の実施例
2として示したように、本発明には、順不同の並列関係
を表すAND接続子を記述し、また、処理することがで
きるため、SGMLなどの形式で記述された構造化文書
を扱う場合には、入力文書から抽出する部分構造を指定
する編集箇所記述が簡潔に記述できるという効果があ
る。Also, for example, as shown in Example 2 of the first embodiment, the present invention can describe and process AND connectors representing an unordered parallel relationship. When a structured document described in a format such as SGML is handled, there is an effect that an edited portion description for specifying a partial structure to be extracted from an input document can be simply described.
【0195】また、本発明には、用途や要求に応じたマ
ッチの実行方式を選択することにより、処理速度の高速
化、使用する作業領域の大きさなどの要求にこたえるこ
とができるという効果もある。The present invention also has an effect that by selecting a match execution method according to a use or a request, it is possible to respond to requests such as an increase in processing speed and a size of a work area to be used. is there.
【図1】本発明の第1の実施の形態の構成図である。FIG. 1 is a configuration diagram of a first embodiment of the present invention.
【図2】本発明の第2の実施の形態の構成図である。FIG. 2 is a configuration diagram of a second embodiment of the present invention.
【図3】本発明の第3の実施の形態の構成図である。FIG. 3 is a configuration diagram of a third embodiment of the present invention.
【図4】本発明の文書蓄積手段の構成の1つを示す説明
図である。FIG. 4 is an explanatory diagram showing one configuration of the document storage means of the present invention.
【図5】本発明の文書蓄積手段の構成の1つを示す説明
図である。FIG. 5 is an explanatory diagram showing one configuration of the document storage means of the present invention.
【図6】本発明の文書処理記述手段の構成の1つを示す
説明図である。FIG. 6 is an explanatory diagram showing one configuration of the document processing description means of the present invention.
【図7】本発明の文書処理記述手段の構成の1つを示す
説明図である。FIG. 7 is an explanatory diagram showing one configuration of the document processing description means of the present invention.
【図8】本発明の文書編集方式の利用例の1つを示す説
明図である。FIG. 8 is an explanatory diagram showing one example of use of the document editing method of the present invention.
【図9】本発明の文書編集方式の入力文書の一例を示す
説明図である。FIG. 9 is an explanatory diagram showing an example of an input document of the document editing method according to the present invention.
【図10】本発明の文書編集方式の出力文書の一例を示
す説明図である。FIG. 10 is an explanatory diagram showing an example of an output document of the document editing method according to the present invention.
【図11】従来の文書編集方式の動作の一例を示す説明
図である。FIG. 11 is an explanatory diagram showing an example of an operation of a conventional document editing method.
【図12】従来の文書編集方式の動作の一例を示す説明
図である。FIG. 12 is an explanatory diagram showing an example of an operation of a conventional document editing method.
【図13】本発明の文書タグのマッチの一例を示す説明
図である。FIG. 13 is an explanatory diagram showing an example of a document tag match according to the present invention.
【図14】本発明の文書文字パターンのマッチの一例を
示す説明図である。FIG. 14 is an explanatory diagram showing an example of a document character pattern match according to the present invention.
【図15】本発明のワイルドカードタグのマッチの一例
を示す説明図である。FIG. 15 is an explanatory diagram showing an example of a wildcard tag match according to the present invention.
【図16】本発明の否定指定子の一例を示す説明図であ
る。FIG. 16 is an explanatory diagram showing an example of a negative designator of the present invention.
【図17】本発明の引用指定子の一例を示す説明図であ
る。FIG. 17 is an explanatory diagram showing an example of a quote specifier according to the present invention.
【図18】本発明の順序接続子の一例を示す説明図であ
る。FIG. 18 is an explanatory view showing an example of a sequential connector of the present invention.
【図19】本発明の階層接続子の一例を示す説明図であ
る。FIG. 19 is an explanatory diagram showing an example of a hierarchical connector of the present invention.
【図20】本発明のAND接続子の一例を示す説明図で
ある。FIG. 20 is an explanatory diagram showing an example of an AND connector according to the present invention.
【図21】本発明のOR接続子の一例を示す説明図であ
る。FIG. 21 is an explanatory diagram showing an example of an OR connector of the present invention.
【図22】本発明の第1の実施の形態の全体処理動作を
示す流れ図である。FIG. 22 is a flowchart showing an overall processing operation according to the first embodiment of the present invention.
【図23】本発明の方式の抽出処理の一例を示す流れ図
である。FIG. 23 is a flowchart showing an example of an extraction process according to the method of the present invention.
【図24】本発明の方式の抽出処理の一例を示す流れ図
である。FIG. 24 is a flowchart showing an example of extraction processing according to the method of the present invention.
【図25】本発明の方式のマッチ処理の一例を示す流れ
図である。FIG. 25 is a flowchart showing an example of a matching process according to the method of the present invention.
【図26】本発明の文書編集方式の利用例の1つを示す
説明図である。FIG. 26 is an explanatory diagram showing one example of use of the document editing method of the present invention.
【図27】本発明の文書編集方式の入力文書および出力
文書の一例を示す説明図である。FIG. 27 is an explanatory diagram showing an example of an input document and an output document of the document editing method according to the present invention.
【図28】本発明の文書編集方式の入力文書の一例を示
す説明図である。FIG. 28 is an explanatory diagram showing an example of an input document of the document editing method according to the present invention.
【図29】本発明の第2の実施の形態の全体処理動作を
示す流れ図である。FIG. 29 is a flowchart illustrating an overall processing operation according to the second embodiment of this invention.
【図30】本発明の方式の初期処理の一例を示す流れ図
である。FIG. 30 is a flowchart showing an example of an initial process of the method of the present invention.
【図31】本発明の方式の文書毎前処理の一例を示す流
れ図である。FIG. 31 is a flowchart showing an example of document-based preprocessing according to the method of the present invention.
【図32】本発明の方式の文書毎後処理の一例を示す流
れ図である。FIG. 32 is a flowchart showing an example of post-processing for each document according to the method of the present invention.
【図33】本発明の方式の終了時処理の一例を示す流れ
図である。FIG. 33 is a flowchart showing an example of an end process of the method of the present invention.
【図34】本発明の方式の抽出・動作記述解釈処理の一
例を示す流れ図である。FIG. 34 is a flowchart showing an example of extraction / behavioral description interpretation processing according to the method of the present invention.
【図35】本発明の方式の動作記述解釈処理の一例を示
す流れ図である。FIG. 35 is a flowchart showing an example of an operation description interpretation process according to the method of the present invention.
【図36】本発明の第3の実施の形態の全体処理動作を
示す流れ図である。FIG. 36 is a flowchart showing an overall processing operation according to the third embodiment of the present invention.
【図37】本発明の文書編集方式の利用例の1つを示す
説明図である。FIG. 37 is an explanatory diagram showing one example of use of the document editing method of the present invention.
【図38】本発明の文書編集方式の出力文書の一例を示
す説明図である。FIG. 38 is an explanatory diagram showing an example of an output document of the document editing method according to the present invention.
【図39】本発明の文書編集方式の出力文書の一例を示
す説明図である。FIG. 39 is an explanatory diagram illustrating an example of an output document of the document editing method according to the present invention.
101 構造化文書入力手段 102 文書処理記述手段 103 文書蓄積手段 104 文書編集処理実行手段 105 文書出力手段 106 出力文書蓄積手段 107 動作記述解釈手段 108 文書毎前処理記述手段 109 文書毎後処理記述手段 110 文書毎前処理実行手段 111 文書毎後処理実行手段 112 初期処理記述手段 113 終了時処理記述手段 114 初期処理実行手段 115 終了時処理実行手段 116 文書修正手段 117 文書ソート手段 118 入力文書削除要求受信手段 801、802、2601、2602、3701、3702 入力文書 901、902、1302、1402、1502、1602、1702、1802、190
2、2002、2102、2701、2702、2801 構造化文書 803、2603、3703 文書編集方式 804、1101、1201、2604、2703、3704、3901、3902、390
3 出力文書 1102、1103 部分構造 1202 部分文書 1301、1401、1501、1601、1701、1801、1901、2001、21
01 編集箇所記述101 structured document input means 102 document processing description means 103 document storage means 104 document editing processing execution means 105 document output means 106 output document storage means 107 action description interpretation means 108 document-specific preprocessing description means 109 document-specific post-processing description means 110 Document-based pre-processing execution means 111 Document-based post-processing execution means 112 Initial processing description means 113 End-time processing description means 114 Initial processing execution means 115 End-time processing execution means 116 Document correction means 117 Document sorting means 118 Input document deletion request receiving means 801, 802, 2601, 2602, 3701, 3702 Input documents 901, 902, 1302, 1402, 1502, 1602, 1702, 1802, 190
2, 2002, 2102, 2701, 2702, 2801 Structured document 803, 2603, 3703 Document editing method 804, 1101, 1201, 2604, 2703, 3704, 3901, 3902, 390
3 Output documents 1102, 1103 Substructure 1202 Subdocuments 1301, 1401, 1501, 1601, 1701, 1801, 1901, 2001, 21
01 Edit location description
Claims (19)
造を単位として複数の抽出箇所を指定するパターン記述
に従って、抽出箇所間のつながりを維持しながら、前記
構造化文書から部分構造を抽出することを特徴とする文
書編集方式。1. A method for reading a plurality of structured documents and extracting a partial structure from the structured document according to a pattern description designating a plurality of extraction locations in units of a document structure while maintaining a connection between the extraction locations. A document editing method characterized by the following.
造化文書入力手段と、前記構造化文書入力手段の読み込
んだ入力文書の一部分である部分構造を指定する、文書
タグ、文書文字パターン、否定指定子、引用指定子、順
序接続子、階層接続子、括弧によって構成される編集箇
所記述要素を、AND接続子、OR接続子、括弧で結合
した編集箇所記述が1つ以上記述されている文書処理記
述手段と、前記部分構造を、前記文書処理記述手段に記
述された編集箇所記述中の引用指定子毎に分け、かつ、
前記入力文書と前記編集箇所記述とのマッチが成立した
順に蓄積する文書蓄積手段と、前記文書処理記述手段か
ら編集箇所記述を取り出し、前記編集箇所記述を構成す
る各編集箇所記述要素と入力文書とのマッチを試み、マ
ッチが成立した前記編集箇所記述中に記述された引用指
定子に対応する部分構造を前記文書蓄積手段に蓄積し、
また、前記編集箇所記述中のAND接続子で結合された
編集箇所記述要素の少なくとも1つのマッチが成立しな
い場合には、前記AND接続子で結合された各編集箇所
記述要素に対応する部分構造を前記文書蓄積手段から削
除し、また、前記編集箇所記述中のOR接続子で結合さ
れた編集箇所記述要素のどのマッチも成立しない場合に
は、前記OR接続子で結合された各編集箇所記述要素に
対応する部分構造を前記文書蓄積手段から削除して抽出
処理を行う文書編集処理実行手段と、前記文書蓄積手段
に蓄積された文書をそのまま、あるいは加工して出力す
る文書出力手段とを有することを特徴とする文書編集方
式。2. A structured document input means for sequentially reading one or more structured documents, and a document tag, a document character pattern, a document tag for designating a partial structure which is a part of the input document read by the structured document input means. At least one edit location description is formed by combining an edit location description element composed of a negation specifier, a quote specifier, an order connector, a hierarchical connector, and parentheses with an AND connector, an OR connector, and parentheses. Document processing description means, and the partial structure is divided for each citation specifier in the edit location description described in the document processing description means, and
A document accumulation unit that accumulates in the order in which a match between the input document and the edit location description is established; an edit location description extracted from the document processing description means; and each edit location description element and the input document constituting the edit location description And accumulates a partial structure corresponding to the citation specifier described in the edited portion description in which the match has been established in the document storage means,
When at least one match of the edit location description elements connected by the AND connector in the edit location description does not hold, the partial structure corresponding to each edit location description element connected by the AND connector is changed. If no match is found between the edit location description elements connected by OR connectors in the edit location description and the edit location description elements are deleted from the document storage means, each edit location description element Document edit processing executing means for deleting a partial structure corresponding to the document from the document storage means and performing extraction processing, and document output means for outputting the document stored in the document storage means as it is or after processing. Document editing method characterized by the following.
造化文書入力手段と、前記構造化文書入力手段の読み込
んだ入力文書の一部分である部分構造を指定する、文書
タグ、文書文字パターン、ワイルドカードタグ、否定指
定子、引用指定子、順序接続子、階層接続子、括弧によ
って構成される編集箇所記述要素を、AND接続子、O
R接続子、括弧で結合した編集箇所記述が1つ以上記述
されている文書処理記述手段と、前記部分構造を、前記
文書処理記述手段に記述された編集箇所記述中の引用指
定子毎に分け、かつ、前記入力文書と前記編集箇所記述
とのマッチが成立した順に蓄積する文書蓄積手段と、前
記文書処理記述手段から編集箇所記述を取り出し、前記
編集箇所記述を構成する各編集箇所記述要素と入力文書
とのマッチを試み、マッチが成立した前記編集箇所記述
中に記述された引用指定子に対応する部分構造を前記文
書蓄積手段に蓄積し、また、前記編集箇所記述中のAN
D接続子で結合された編集箇所記述要素の少なくとも1
つのマッチが成立しない場合には、前記AND接続子で
結合された各編集箇所記述要素に対応する部分構造を前
記文書蓄積手段から削除し、また、前記編集箇所記述中
のOR接続子で結合された編集箇所記述要素のどのマッ
チも成立しない場合には、前記OR接続子で結合された
各編集箇所記述要素に対応する部分構造を前記文書蓄積
手段から削除して抽出処理を行う文書編集処理実行手段
と、前記文書蓄積手段に蓄積された文書をそのまま、あ
るいは加工して出力する文書出力手段とを有することを
特徴とする文書編集方式。3. A structured document input means for sequentially reading one or more structured documents, and a document tag, a document character pattern, a document tag for designating a partial structure which is a part of the input document read by the structured document input means. An edit part description element composed of a wild card tag, a negation specifier, a quotation specifier, an order connector, a hierarchical connector, and parentheses,
An R connector, a document processing description unit in which one or more edit portion descriptions connected by parentheses are described, and the partial structure is divided for each citation specifier in the edit portion description described in the document process description unit. And, a document storage means for storing in the order in which a match between the input document and the edit location description is established, and an edit location description element which extracts the edit location description from the document processing description means and configures the edit location description, Attempts to match the input document, accumulates a partial structure corresponding to the citation specifier described in the edited location description in which the match has been established, in the document storage means,
At least one of the edit location description elements connected by the D connector
If no match is found, the partial structure corresponding to each edit location description element connected by the AND connector is deleted from the document storage means, and the partial structure is connected by the OR connector in the edit location description. If none of the edit location description elements match, the document edit processing is executed to delete the partial structure corresponding to each edit location description element connected by the OR connector from the document storage unit and perform the extraction processing. And a document output unit that outputs the document stored in the document storage unit as it is or after processing.
処理実行手段の前記抽出処理の際に実行する動作を記述
した動作記述を前記編集箇所記述に対応付けて記述した
編集処理記述が1つ以上記述され、前記文書編集処理実
行手段は、前記抽出処理を実行して、前記文書蓄積手段
中に残った抽出した部分構造と前記動作記述とを前記動
作記述解釈手段へ通知し、前記文書出力手段は、出力文
書蓄積手段に蓄積された構造化文書や部分構造をそのま
ま、あるいは加工して出力し、構造化文書や部分構造を
蓄積する出力文書蓄積手段と、前記動作記述を解釈し、
文書の追加、文書の結合、文書数のカウントなどの編集
処理を実行して、構造化文書や部分構造を前記出力文書
蓄積手段に蓄積する動作記述解釈手段とをさらに有する
ことを特徴とする請求項2または3記載の文書編集方
式。4. The document processing description unit includes one editing process description in which an operation description describing an operation to be executed at the time of the extraction processing by the document editing process executing unit is described in association with the editing location description. The document editing process executing means described above executes the extracting process, notifies the action description interpreting means of the extracted partial structure remaining in the document storage means and the action description, and outputs the document output. Means for outputting the structured document or partial structure stored in the output document storage means as is, or processing the output, and interpreting the operation description with an output document storage means for storing the structured document or partial structure;
An operation description interpreting means for executing an editing process such as adding a document, combining documents, counting the number of documents, and accumulating a structured document or a partial structure in the output document accumulating means. Item 2. The document editing method according to item 2 or 3.
抽出処理を開始する前に毎回実行する動作を記述した文
書毎前処理記述手段と、前記読み込まれた各文書に対し
ての前記編集処理が完了する度に毎回実行する動作を記
述した文書毎後処理記述手段と、前記読み込まれた各文
書に対しての前記抽出処理が行われる前に、毎回、前記
文書毎前処理記述手段に記述された動作記述を前記動作
記述解釈手段へ通知する文書毎前処理実行手段と、前記
読み込まれた各文書に対しての前記編集処理が完了する
度に、毎回、前記文書毎後処理記述手段に記述された動
作記述を前記動作記述解釈手段へ通知する文書毎後処理
実行手段とをさらに有することを特徴とする請求項4記
載の文書編集方式。5. A document-specific pre-processing description unit that describes an operation to be executed each time before starting the extraction process on each of the read documents, and the editing for each of the read documents. Document-specific post-processing description means describing an operation to be executed each time processing is completed, and document-specific pre-processing description means each time before the extraction processing is performed on each of the read documents. A document-based pre-processing execution unit that notifies the described operation description to the operation description interpretation unit; and a document-specific post-processing description unit each time the editing process for each of the read documents is completed. 5. The document editing method according to claim 4, further comprising: a post-processing unit for each document for notifying the behavior description described in (1) to the behavior description interpretation unit.
読み込む前に実行する動作を記述した初期処理記述手段
と、前記読み込まれた全ての文書に対する前記抽出処理
および前記編集処理が完了した後に実行する動作を記述
した終了時処理記述手段と、前記構造化文書入力手段が
最初の文書を読み込む前に、前記初期処理記述手段に記
述された動作記述を前記動作記述解釈手段へ通知する初
期処理実行手段と、前記読み込まれた全ての文書に対す
る前記抽出処理および前記編集処理が完了した後に、前
記終了処理記述手段に記述された動作記述を前記動作記
述解釈手段へ通知する終了時処理実行手段とをさらに有
することを特徴とする請求項4または5記載の文書編集
方式。6. An initial processing description unit that describes an operation to be executed before the structured document input unit reads the first document, and after the extraction process and the editing process for all the read documents are completed. An end process description unit describing an operation to be executed; and an initial process for notifying the operation description interpretation unit of the operation description described in the initial process description unit before the structured document input unit reads the first document. Execution means; and end-time processing execution means for notifying the operation description interpretation means of the operation description described in the end processing description means after the extraction processing and the editing processing for all the read documents are completed. 6. The document editing method according to claim 4, further comprising:
ぶ)変更指示を受けた場合には、指定された文書中の指
定されたタグ名を指定された別のタグ名に置き換え、ま
た、構造削除指示を受けた場合には、指定された文書中
の指定されたタグ名から始まる構造を削除し、また、文
字列変更指示を受けた場合には、指定された文書中の指
定された文字列を指定された別の文字列に置き換え、ま
た、文字列削除指示を受けた場合には、指定された文書
中の指定された文字列を削除する文書修正手段をさらに
有し、前記動作記述解釈手段は、動作記述の解釈に応じ
て文書修正手段への指示を含む編集処理を実行すること
を特徴とする請求項4、5または6記載の文書編集方
式。7. When a structure name (hereinafter, referred to as a tag name) change instruction of a structured document is received, a specified tag name in a specified document is replaced with another specified tag name, Also, when a structure deletion instruction is received, a structure starting with a specified tag name in a specified document is deleted. When a character string change instruction is received, a specification in a specified document is deleted. Replacing the specified character string with another specified character string, and further comprising a document correcting unit for deleting the specified character string in the specified document when a character string deletion instruction is received, 7. The document editing method according to claim 4, wherein the behavior description interpreting means executes an editing process including an instruction to the document correcting means according to the interpretation of the behavior description.
されたキーに従ってソートする文書ソート手段をさらに
有し、前記動作記述解釈手段は、動作記述の解釈に応じ
て文書ソート手段への指示を含む編集処理を実行するこ
とを特徴とする請求項4、5、6または7記載の文書編
集方式。8. A document sorting unit for sorting a designated structured document or partial structure according to a designated key, wherein the operation description interpreting unit instructs the document sorting unit according to the interpretation of the operation description. 8. The document editing method according to claim 4, wherein an editing process including the following is executed.
を読み込む際に文書構造をチェックし、前記文書出力手
段は、文書を出力する際に文書構造をチェックすること
を特徴とする請求項4、5、6、7または8記載の文書
編集方式。9. The structured document input unit checks a document structure when reading a structured document, and the document output unit checks a document structure when outputting a document. Document editing method described in 4, 5, 6, 7 or 8.
文書毎に部分構造を分け、さらに前記文書処理記述手段
に記述された編集箇所記述中の引用指定子毎に分けて蓄
積することを特徴とする請求項4、5、6、7、8また
は9記載の文書編集方式。10. The document accumulating means divides a partial structure for each extracted structured document, and further accumulates the partial structure for each citation designator in the edit location description described in the document processing description means. The document editing method according to claim 4, 5, 6, 7, 8, or 9.
くは複数の文書に対する削除要求を受け付け、前記削除
要求を前記文書編集処理実行手段および前記動作記述解
釈手段に通知する入力文書削除要求受信手段をさらに有
し、前記文書編集処理実行手段は、前記入力文書削除要
求受信手段から削除要求があった場合には、前記削除要
求によって指定された入力文書に関する部分構造を前記
文書蓄積手段から削除し、前記動作記述解釈手段は、前
記入力文書削除要求受信手段から削除要求があった場合
には、前記削除要求によって指定された入力文書に関す
る部分構造を前記出力文書蓄積手段から削除することを
特徴とする請求項10記載の文書編集方式。11. An input document deletion request receiving means for receiving a deletion request for one or a plurality of documents among the read documents and notifying the deletion request to the document editing processing execution means and the operation description interpretation means. The document editing process executing unit, when receiving a deletion request from the input document deletion request receiving unit, deletes a partial structure related to the input document specified by the deletion request from the document storage unit. The operation description interpreting means, when receiving a deletion request from the input document deletion request receiving means, deletes a partial structure related to the input document specified by the deletion request from the output document storage means. The document editing method according to claim 10, wherein
み込まれた各文書と前記各編集箇所記述要素とのマッチ
処理を行う際に、前記文書の任意の部分構造を始点とし
て前記編集箇所記述要素とマッチする全ての部分構造を
求めて前記抽出処理を実行することを特徴とする請求項
2、3、4、5、6、7、8、9、10または11記載
の文書編集方式。12. The document editing process executing means, when performing a matching process between each of the read documents and each of the editing portion description elements, starting from an arbitrary partial structure of the document as a starting point. 12. The document editing method according to claim 2, wherein the extraction processing is executed by obtaining all partial structures that match the following.
み込まれた各文書と前記各編集箇所記述要素とのマッチ
処理を行う際に、前記文書の任意の部分構造を始点とし
て前記編集箇所記述要素とマッチする最初の部分構造を
求めて前記抽出処理を実行することを特徴とする請求項
2、3、4、5、6、7、8、9、10または11記載
の文書編集方式。13. The document edit processing execution means, when performing a matching process between each of the read documents and each of the edit location description elements, starts the edit location description element with an arbitrary partial structure of the document as a starting point. 12. The document editing method according to claim 2, wherein the extraction processing is executed by obtaining a first partial structure that matches the following.
み込まれた各文書と前記各編集箇所記述要素とのマッチ
処理を行う際に、前記文書の任意の部分構造を始点とし
て前記編集箇所記述要素とマッチする最後の部分構造を
求めて前記抽出処理を実行することを特徴とする請求項
2、3、4、5、6、7、8、9、10または11記載
の文書編集方式。14. The document edit processing execution means, when performing a matching process between each of the read documents and each of the edit location description elements, starts the edit location description element with an arbitrary partial structure of the document as a starting point. 12. The document editing method according to claim 2, wherein the extraction process is executed by finding a last partial structure that matches the following.
み込まれた各文書と前記各編集箇所記述要素とのマッチ
処理を行う際に、前記文書の任意の部分構造を始点とし
て前記編集箇所記述要素とマッチする部分構造のうち、
包含関係にある部分構造は最も外側の部分構造を選択し
て前記抽出処理を実行することを特徴とする請求項2、
3、4、5、6、7、8、9、10または11記載の文
書編集方式。15. The document edit processing execution means, when performing a matching process between each of the read documents and each of the edit location description elements, starts with an arbitrary partial structure of the document as a starting point. Of the substructures that match
The partial structure having an inclusive relation selects the outermost partial structure and executes the extraction processing.
The document editing method described in 3, 4, 5, 6, 7, 8, 9, 10 or 11.
み込まれた各文書と前記各編集箇所記述要素とのマッチ
処理を行う際に、前記文書の任意の部分構造を始点とし
て前記編集箇所記述要素とマッチする部分構造のうち、
包含関係にある部分構造は最も内側の部分構造を選択し
て前記抽出処理を実行することを特徴とする請求項2、
3、4、5、6、7、8、9、10または11記載の文
書編集方式。16. The document edit processing execution means, when performing a matching process between each of the read documents and each of the edit location description elements, starts the edit location description element with an arbitrary partial structure of the document as a starting point. Of the substructures that match
The partial structure having an inclusive relation selects an innermost partial structure and executes the extraction processing.
The document editing method described in 3, 4, 5, 6, 7, 8, 9, 10 or 11.
が与えられる度に読み込むことを特徴とする請求項2、
3、4、5、6、7、8、9、10、11、12、1
3、14、15または16記載の文書編集方式。17. The apparatus according to claim 2, wherein said structured document input means reads each time an input document is provided.
3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 1
Document editing method described in 3, 14, 15 or 16.
に対する文書編集処理が完了した後に出力処理を行うこ
とを特徴とする請求項2、3、4、5、6、7、8、
9、10、11、12、13、14、15、16または
17記載の文書編集方式。18. The apparatus according to claim 2, wherein said document output means performs output processing after completion of document editing processing for all input documents.
9, 10, 11, 12, 13, 14, 15, 16 or 17;
に対する文書編集処理が完了する度に出力処理を行うこ
とを特徴とする請求項2、3、4、5、6、7、8、
9、10、11、12、13、14、15、16または
17記載の文書編集方式。19. The apparatus according to claim 2, wherein said document output means performs an output process each time a document editing process for one input document is completed.
9, 10, 11, 12, 13, 14, 15, 16 or 17;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34858696A JP3156613B2 (en) | 1996-12-26 | 1996-12-26 | Document editing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34858696A JP3156613B2 (en) | 1996-12-26 | 1996-12-26 | Document editing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10187725A true JPH10187725A (en) | 1998-07-21 |
JP3156613B2 JP3156613B2 (en) | 2001-04-16 |
Family
ID=18398019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP34858696A Expired - Fee Related JP3156613B2 (en) | 1996-12-26 | 1996-12-26 | Document editing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3156613B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148876A (en) * | 1998-10-29 | 2000-05-30 | Dell Usa Lp | Automatic customer identifier incorporated upon being connected to vendor web site |
JP2001249928A (en) * | 2000-03-03 | 2001-09-14 | Nec Corp | Simple input system and method for hierarchical structure data with identifier and recording medium |
WO2005109241A1 (en) * | 2004-05-11 | 2005-11-17 | Atl Systems, Inc. | Data structure, structured data management system, structured data management method, and structured data management program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02130673A (en) * | 1988-11-10 | 1990-05-18 | Chubu Nippon Denki Software Kk | Data retrieving system |
JPH06309365A (en) * | 1993-04-20 | 1994-11-04 | Fuji Xerox Co Ltd | Document processor |
JPH0756908A (en) * | 1993-08-09 | 1995-03-03 | Fuji Xerox Co Ltd | Document processor |
JPH08339370A (en) * | 1995-06-14 | 1996-12-24 | Fuji Xerox Co Ltd | Method and device for document display |
-
1996
- 1996-12-26 JP JP34858696A patent/JP3156613B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02130673A (en) * | 1988-11-10 | 1990-05-18 | Chubu Nippon Denki Software Kk | Data retrieving system |
JPH06309365A (en) * | 1993-04-20 | 1994-11-04 | Fuji Xerox Co Ltd | Document processor |
JPH0756908A (en) * | 1993-08-09 | 1995-03-03 | Fuji Xerox Co Ltd | Document processor |
JPH08339370A (en) * | 1995-06-14 | 1996-12-24 | Fuji Xerox Co Ltd | Method and device for document display |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148876A (en) * | 1998-10-29 | 2000-05-30 | Dell Usa Lp | Automatic customer identifier incorporated upon being connected to vendor web site |
JP2001249928A (en) * | 2000-03-03 | 2001-09-14 | Nec Corp | Simple input system and method for hierarchical structure data with identifier and recording medium |
WO2005109241A1 (en) * | 2004-05-11 | 2005-11-17 | Atl Systems, Inc. | Data structure, structured data management system, structured data management method, and structured data management program |
JPWO2005109241A1 (en) * | 2004-05-11 | 2008-07-31 | 株式会社エーティーエルシステムズ | Data structure, structured data management system, structured data management method, and structured data management program |
Also Published As
Publication number | Publication date |
---|---|
JP3156613B2 (en) | 2001-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Green et al. | Processing XML streams with deterministic automata and stream indexes | |
US6745202B2 (en) | Structured-text cataloging method, structured-text searching method, and portable medium used in the methods | |
US6853992B2 (en) | Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents | |
Agichtein et al. | Mining reference tables for automatic text segmentation | |
JP4141556B2 (en) | Structured document management method, apparatus for implementing the method, and medium storing the processing program | |
JP3692054B2 (en) | Document structure conversion method, document structure conversion apparatus, and program | |
US6377946B1 (en) | Document search method and apparatus and portable medium used therefor | |
JP5376163B2 (en) | Document management / retrieval system and document management / retrieval method | |
US5752021A (en) | Document database management apparatus capable of conversion between retrieval formulae for different schemata | |
WO2006036487A2 (en) | System and method for management of data repositories | |
US20090138470A1 (en) | Method of pattern searching | |
Avila-Campillo et al. | XMLTK: An XML toolkit for scalable XML stream processing | |
JP2003203067A (en) | Structured document converting method and data converting method | |
Hogue | Tree pattern inference and matching for wrapper induction on the World Wide Web | |
JPH08190542A (en) | Management device and method for document data base | |
JPH0830620A (en) | Structure retrieving device | |
CN103440233A (en) | Automatic sScientific paper standardization automatic detecting and editing system | |
CN111339042A (en) | Data operation processing method and system and scheduling server | |
Ramesh et al. | Automata-driven indexing of Prolog clauses | |
JP3156613B2 (en) | Document editing method | |
JP4348357B2 (en) | Related document display device | |
CA2422490C (en) | Method and apparatus for extracting structured data from html pages | |
Chen et al. | Combining pat-trees and signature files for query evaluation in document databases | |
JP2002202973A (en) | Structured document management device | |
JP3842574B2 (en) | Information extraction method, structured document management apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080209 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090209 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100209 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100209 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110209 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120209 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130209 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140209 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |