JP3156613B2 - 文書編集方式 - Google Patents

文書編集方式

Info

Publication number
JP3156613B2
JP3156613B2 JP34858696A JP34858696A JP3156613B2 JP 3156613 B2 JP3156613 B2 JP 3156613B2 JP 34858696 A JP34858696 A JP 34858696A JP 34858696 A JP34858696 A JP 34858696A JP 3156613 B2 JP3156613 B2 JP 3156613B2
Authority
JP
Japan
Prior art keywords
document
description
processing
partial structure
edit location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34858696A
Other languages
English (en)
Other versions
JPH10187725A (ja
Inventor
基秀 大坪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP34858696A priority Critical patent/JP3156613B2/ja
Publication of JPH10187725A publication Critical patent/JPH10187725A/ja
Application granted granted Critical
Publication of JP3156613B2 publication Critical patent/JP3156613B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書編集方式に関
し、特に、例えば、個人単位で作成した作業進捗報告な
どの報告書をまとめてグループ全体の報告書や一覧表を
作成する際に、各人の「目標」や「進捗」や「成果」な
どの部分構造を抽出して、それぞれまとめる作業を自動
的に行うための文書編集方式に関するものである。
【0002】また、例えば、ある1つの製品の各部分を
別々の拠点もしくは別々のグループが設計、作成する分
散開発において、各拠点もしくは各グループが設計、作
成した部分に関する仕様書などのドキュメントをまとめ
て、製品の仕様書を作成する際の作業を自動化するため
の文書編集方式に関するものである。
【0003】さらに、例えば、前記作業進捗報告の例や
前記製品仕様書作成の例において、各人、各拠点もしく
は各グループが作成した文書が、電子メイルなどによっ
てある一箇所に送付される場合に、電子メイルが到着す
る度に、それまで到着した文書とともに構造毎にまとめ
あげて出力文書を自動的に更新する処理や、以前に送付
したメイルに対する削除要求を処理して出力文書を自動
的に更新するための文書編集方式に関するものである。
【0004】なお、前記報告書や仕様書など、本発明の
文書編集方式の入力となる文書は、あらかじめ決められ
た記号等で文書構造を明確に表したSGML(Standard
Generalized Markup Language)に代表される構造化文書
であることを前提としており、特に以降の具体的説明で
は、SGML形式の文書を扱う例を用いる。SGMLに
関しては、例えば、オーム社刊、吉岡誠 編著の”SG
MLのススメ"などの書籍に詳述されている。
【0005】
【従来の技術】従来の文書編集方式は、複数の文書の必
要箇所を抽出し加工し1つの文書にまとめるための技術
には、次の2種類があった。 (1)例えばUNIXオペレーティングシステムに搭載
されたsedコマンドやawkコマンドなどのように、
文書を構造のない文字列の集合と見なして、文字パター
ンとのマッチングによって文書の必要箇所を抽出する文
書編集方式があった。 (2)特開平6−259421号公報などに代表され
る、”節”、”表題”などの単純文字列パターン(本明
細書の請求項2での「文書タグ」に相当する)と、包含
関係を表す”/”(本明細書の請求項2での「階層接続
子」に相当する)や順序関係を表す”#”(本明細書の
請求項2での「順序接続子」に相当する)などの接続表
現記号、”(”や”)”などの括弧(本明細書の請求項
2での「括弧」に相当する)、等の構文要素からなる文
書構造パターンを用いて、文書構造を保って必要箇所を
抽出・加工する文書編集方式があった。
【0006】
【発明が解決しようとする課題】上述した従来の文書編
集方式は、 (1)前記文書を構造のない文字列の集合と見なして処
理する従来の文書編集方式には、例えば、特開平6−2
59421号公報の「従来の技術」の(6)および「発
明が解決しようとする課題」などでも指摘している通
り、文書の構造の意味を解釈せずに文字列単位で照合し
ているため、文書の部分構造のマッチングや抽出といっ
た文書構造単位での処理が困難であるという問題点があ
り、文書の構造を単位としてパターン記述し、文書編集
するための手段が必要となった。
【0007】(2)また、特開平6−259421号公
報に代表される従来の文書編集方式には、以降に述べる
(2−1)および(2−2)および(2−3)のような
問題点があった。
【0008】(2−1)特開平6−259421号公報
に代表される従来の文書編集方式のパターン記述では、
パターン記述の構文要素に、文書の抽出箇所を示す引用
指定子がないため、1つのパターンによって抽出するこ
とのできる部分構造は1種類に限られる。すなわち、1
つの文書から複数種類の部分構造を抽出したい場合に
は、抽出したい部分構造の種類だけパターン記述を用意
して、別々に部分構造を抽出することになる。しかしな
がら、各パターン記述の間の関係までは規定できないた
め、例えば、各パターン記述から抽出した部分構造か
ら、部分構造間の関係を問わずに部分構造の組を作成し
て出力文書を作成するような文書編集には適用できる
が、ある位置関係を満たす部分構造の組を抽出して出力
文書を作成するような文書編集には適用できない、とい
った問題があった。
【0009】例を用いて前記(2−1)の問題点を説明
する。例えば、各個人や小グループから文書として送ら
れてくる発表論文情報をまとめ、著者氏名毎に論文の題
名を整理した一覧表(以降、一覧表Aと呼ぶ)を作成し
たいとする。共著者が存在する場合には、著者の数だけ
同じ論文の題名を重複して一覧表Aに掲載する。具体例
を図8に示す。図8において、入力文書801、802は送ら
れてくる発表論文情報であり、出力文書804は作成した
い一覧表Aである。
【0010】このとき、前記発表論文情報は、著者氏名
や論文の題名の他に、投稿先学会名や論文概要などの情
報を含む、SGML形式で記述された構造化文書である
とする。すなわち、前記発表論文情報は、 1.<学会名>および</学会名>というタグで囲まれ
た投稿先学会名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 3.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造の繰り返し 4.<概要>および</概要>というタグで囲まれた論
文概要を表す部分構造 をこの順序で並べて、全体を<論文情報>および</論
文情報>というタグで囲んだ形式で表現する。ただし、
著者氏名を表す部分構造は、共著者が存在する場合に繰
り返される。例えば、図8の入力文書801、802をSGM
L形式で記述した例を図9に示す。図9において、符号
901は入力文書801をSGML形式で記述した構造化文
書、符号902は入力文書802をSGML形式で記述した構
造化文書である。
【0011】また、前記作成したい一覧表Aは、 1.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 をこの順序で並べて全体を<表要素>および</表要素
>というタグで囲んだ部分構造を、さらに複数並べて、
全体を<一覧表A>および</一覧表A>というタグで
囲んだ形式で表現する。例えば、図8の出力文書804を
SGML形式で記述した例を図10に示す。
【0012】以上の前提のもとで、前記特開平6−25
9421号公報に代表されるパターン記述を用いて、前
記一覧表Aを作成する処理例を説明する。
【0013】まず、従来の方式で扱うことのできる例と
して、入力となる前記発表論文情報には共著者がないと
仮定する。すなわち、前記発表論文情報は、 1.<学会名>および</学会名>というタグで囲まれ
た投稿先学会名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 3.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造 4.<概要>および</概要>というタグで囲まれた論
文概要を表す部分構造 をこの順序で並べて、全体を<論文情報>および</論
文情報>というタグで囲んだ形式で表現するとする。
【0014】1つのパターンによって抽出できる部分構
造が1つに限られる従来の方式では、抽出したい部分構
造毎に用意したパターン記述を用いて、前記発表論文情
報から部分構造を抽出する。すなわち、 a.前記論文の題名を抽出するパターンを用いて、前記
発表論文情報から、前記論文の題名を表す部分構造を抽
出し、 b.前記著者氏名を抽出するパターンを用いて、前記発
表論文情報から、前記著者氏名を表す部分構造を抽出す
る。 そして、抽出した各部分構造の組を作り、前記一覧表A
にまとめあげる。すなわち、 c.前記a.で抽出した部分構造を、抽出した順に1つ
取り出し、前記b.で抽出した部分構造を、抽出した順
に1つ取り出して、前記2つの部分構造を並べて<表要
素>および</表要素>というタグで囲む、という処理
を、前記a.および b.で抽出した全ての部分構造に対して順に行う。
【0015】d.前記c.の処理によって得られた部分
構造を並べて、全体を<一覧表A>および</一覧表A
>というタグで囲む。 以上の処理により、共著者がない発表論文情報から一覧
表Aを作成することはできる。
【0016】次に、入力となる前記発表論文情報には共
著者がないという仮定をなくし、共著者の存在する発表
論文情報が入力文書に含まれる場合を考える。入力文書
に、共著者の存在する発表論文情報が含まれている場合
には、前記c.の処理は、 c’.同じ発表論文情報の中にあって、論文の題名、著
者氏名の順で並んでいる全ての組合せを求め、それぞれ
を、<表要素>および</表要素>というタグで囲む。
としなければならない。しかしながら、従来の方式で
は、論文の題名と著者氏名は、それぞれ別々のパターン
で抽出するため、前記c’.の処理で必要となる「同じ
発表論文情報の中に並んでいる」という関係を規定する
ことができない。例えば、図9の構造化文書901および9
02から、図10のような出力文書を作成したい場合でも、
図11に示すように、構造化文書901および902から抽出し
た論文の題名を表す部分構造1102と著者氏名を表す部分
構造1103とをどのように組み合わせたらよいかが分から
ないため、出力文書1101を作成することができない。従
って、従来の方式では、上記例で、共著者の存在する発
表論文情報から一覧表を作成する場合などのように、抽
出した部分構造間の関係が指定される文書編集処理はで
きないという問題点があった。
【0017】よって、抽出箇所間のつながりを維持して
部分構造を抽出することのできる編集箇所記述要素、お
よび前記編集箇所記述要素を解釈して部分構造の抽出処
理を実行する手段が必要となった。
【0018】(2−2)特開平6−259421号公報
に代表される従来の文書編集方式のパターン記述におい
て、複数の抽出箇所から部分構造を同時に1つのかたま
りとして抽出するパターンが記述できるとした場合で
も、抽出した部分構造のかたまりを利用する際に、部分
構造のかたまりから個々の部分構造を取り出す処理、あ
るいは、部分構造のかたまりの中の部分構造の並んでい
る順番を変えるための処理などが別途必要となるという
問題点があった。
【0019】例を用いて前記(2−2)の問題点を説明
する。例えば、図9の構造化文書901および902から前記
方式により一覧表Aを作成した例を図12に示す。図12に
おいて、構造化文書901および902から、題名、氏名の並
びからなる部分文書のかたまりを抽出することができた
とする。このとき、前記抽出した部分文書1202をそのま
ま用いて一覧表Aを作成した場合には、図12の出力文書
1201のように、著者氏名、論文の題名の順に並ぶべきな
のに対し、論文の題名、著者氏名の順となってしまう。
【0020】よって、抽出箇所間のつながりを維持して
部分構造を抽出し、かつ、パターン上の抽出箇所毎に別
々に扱うことのできる編集箇所記述要素、および前記編
集箇所記述要素を解釈して部分構造の抽出処理を実行す
る手段が必要となった。
【0021】(2−3)特開平6−259421号公報
に代表される従来の文書編集方式のパターン記述の構文
要素には、順序関係を表す記号はあるが、順不同の並列
関係を表す記号はない。特にSGML形式で記述された
構造化文書を扱う場合などは、複数種類の部分構造を任
意の順序で並べて記述することも可能であるため、前記
任意の順序で並べて記述された部分構造とマッチするパ
ターンを、順序関係を表す記号を用いて記述すると、記
述が繁雑になるという問題点があった。
【0022】例を用いて前記(2−3)の問題点を説明
する。例えば、前記発表論文情報の表現形式のうち、投
稿先学会名を表す部分構造と、論文の題名を表す部分構
造との記述順序は問わない記述形式の発表論文情報(以
降、発表論文情報2と呼ぶ)から、投稿先学会名と論文
の題名との対応を整理した一覧表(以降、一覧表Bと呼
ぶ)を作成したいとする。
【0023】すなわち、 1.次の2種類の部分構造を、任意の順序で両方とも記
述 1−1.<学会名>および</学会名>というタグで囲
まれた投稿先学会名を表す部分構造 1−2.<題名>および</題名>というタグで囲まれ
た論文の題名を表す部分構造 2.<氏名>および</氏名>というタグで囲まれた著
者氏名を表す部分構造の繰り返し 3.<概要>および</概要>というタグで囲まれた論
文概要を表す部分構造 をこの順序で並べ、全体を<論文情報2>および</論
文情報2>というタグで囲んだ形式で表現したものが発
表論文情報2であり、また、 1.<学会名>および</学会名>というタグで囲まれ
た投稿先学会名を表す部分構造 2.<題名>および</題名>というタグで囲まれた論
文の題名を表す部分構造 をこの順序で並べて全体を<表要素>および</表要素
>というタグで囲んだ部分構造を、さらに複数並べて、
全体を<一覧表B>および</一覧表B>というタグで
囲んだ形式で表現したものが作成したい一覧表Bである
とする。
【0024】論文情報2のSGML形式による記述例を
図27の入力文書2701および入力文書2702に、また、一覧
表BのSGML形式による記述例を図27の出力文書2703
に示す。
【0025】以上の前提のもとで、前記特開平6−25
9421号公報に代表されるパターン記述を用いて、前
記発表論文情報2を表す入力文書2601と入力文書2602か
ら前記一覧表Bを表す出力文書2604を文書編集方式2603
により作成することを考える(図26参照)。
【0026】前記投稿先学会名を表す部分構造および論
文の題名を表す部分構造を抽出するためのパターン記述
は、 1.投稿先学会名を表す部分構造、論文の題名を表す部
分構造の順で記述された場合 2.論文の題名を表す部分構造、投稿先学会名を表す部
分構造の順で記述された場合 の2通りを考慮する必要があるため、前記特開平6−2
59421号公報では、 1.投稿先学会名を表す部分構造、論文の題名を表す部
分構造の順で記述された場合のパターン記述 論文情報/(学会名#題名) 2.論文の題名を表す部分構造、投稿先学会名を表す部
分構造の順で記述された場合のパターン記述 論文情報/(題名#学会名) の2通りのパターンを記述する必要が生じる。
【0027】前記例では、記述順序を問わない部分構造
は2つであるためパターンを2通り用意すれば十分であ
ったが、一般に、記述順序を問わない部分構造がn個あ
った場合には、パターンをn!通り用意する必要がある
(!は階乗計算)。例えば、記述順序を問わない部分構
造が5個あった場合には、120通りのパターンを用意し
なければならず、前記特開平6−259421号公報に
代表される従来の文書編集方式では、パターン記述が非
常に繁雑となる。
【0028】よって、順不同の並列関係を記述すること
のできる編集箇所記述要素、および前記編集箇所記述要
素を解釈して部分構造の抽出処理を実行する手段が必要
となった。
【0029】
【0030】
【課題を解決するための手段】 本発明の文書編集方式
は、1つ以上の構造化文書を順次読み込む構造化文書入
力手段と、前記構造化文書入力手段の読み込んだ入力文
書の一部分である部分構造を指定する、文書タグ、文書
文字パターン、否定指定子、引用指定子、順序接続子、
階層接続子、括弧によって構成される編集箇所記述要素
を、AND接続子、OR接続子、括弧で結合した編集箇
所記述が1つ以上記述されている文書処理記述手段と、
前記部分構造を、前記文書処理記述手段に記述された編
集箇所記述中の引用指定子毎に分け、かつ、前記入力文
書と前記編集箇所記述とのマッチが成立した順に蓄積す
る文書蓄積手段と、前記文書処理記述手段から編集箇所
記述を取り出し、入力文書中の着目する部分構造を切り
替えながら、前記編集箇所記述を構成する各編集箇所記
述要素と入力文書とのマッチを試み、前記編集箇所記述
中に順序接続子がある場合には、順序接続子の直前の編
集箇所記述要素とマッチした、前記入力文書中の文書構
造の後に並んでいる構造を新たに着目する部分構造とし
て、前記順序接続子の次以降に並んでいる編集箇所記述
要素とのマッチを試み、前記編集箇所記述中に階層接続
子がある場合には、階層接続子の直前の編集箇所記述要
素とマッチした、前記入力文書中の文書構造の内側の部
分構造を新たに着目する部分構造として、前記階層接続
子の次以降に並んでいる編集箇所記述要素とのマッチを
試み、さらに、マッチが成立した前記編集箇所記述中に
引用指定子が記述されている場合には、前記引用指定子
に対応する部分構造を前記文書蓄積手段に蓄積し、ま
た、前記編集箇所記述中のAND接続子で結合された編
集箇所記述要素の少なくとも1つのマッチが成立しない
場合には、前記AND接続子で結合された各編集箇所記
述要素に対応する部分構造を前記文書蓄積手段から削除
し、また、前記編集箇所記述中のOR接続子で結合され
た編集箇所記述要素のどのマッチも成立しない場合に
は、前記OR接続子で結合された各編集箇所記述要素に
対応する部分構造を前記文書蓄積手段から削除して抽出
処理を行う文書編集処理実行手段と、前記文書蓄積手段
に蓄積された文書をそのまま、あるいは加工して出力す
る文書出力手段とを有するようにしている。
【0031】[作用]本発明の文書編集方式は、文書の
構造を単位として編集箇所を指定する編集箇所記述を解
釈し、部分構造を抽出する文書編集処理実行手段を備え
る。これにより、文書の構造を単位としてパターン記述
し、また、文書編集処理を行うことが可能となり、前記
「発明が解決しようとする課題」の(1)の問題点が解
決する。
【0032】また、本発明の文書編集方式は、編集箇所
記述中に複数の引用指定子(抽出箇所を指定する記号)
が記述でき、かつ、文書編集処理実行手段のマッチ処理
によって抽出された部分構造は、マッチが成立した順
に、引用指定子毎に分けて文書蓄積手段に蓄積されてい
る。これにより、1つの編集箇所記述によって複数の部
分構造を同時に抽出し、かつ、抽出した部分構造を、抽
出箇所間のつながりを維持しつつ、編集箇所記述中の引
用指定子毎に別々に扱うことができ、前記「発明が解決
しようとする課題」の(2−1)および(2−2)の問
題点が解決する。
【0033】また、本発明の文書編集方式は、編集箇所
記述中に順不同の並列関係を表すAND接続子が記述で
き、前記編集箇所記述を解釈し、部分構造を抽出する文
書編集処理実行手段を備える。これにより、SGML形
式など、複数種類の部分構造を任意の順序で並べて記述
することが可能な形式で記述された構造化文書を扱う場
合でも、記述が簡潔となり、前記「発明が解決しようと
する課題」の(2−3)の問題点が解決する。
【0034】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0035】以降では、入力文書、出力文書とも、SG
ML形式である例について説明する。
【0036】まず、本発明における編集箇所記述の各構
成要素の定義と、表記形式の一例を説明する。なお、編
集箇所記述の各構成要素は、一般に、構造化文書中の複
数の部分構造とマッチする。どの部分構造を選択してマ
ッチ処理を進めるかは、マッチ処理を実行する文書編集
処理実行手段の処理方式に依存する(例えば、任意の部
分構造を始点として編集箇所記述要素とマッチする全て
の部分構造を求める方式もしくは、任意の部分構造を始
点として編集箇所記述要素とマッチする最初の部分構造
を求める方式もしくは、任意の部分構造を始点として編
集箇所記述要素とマッチする最後の部分構造を求める方
式もしくは、任意の部分構造を始点として編集箇所記述
要素とマッチする部分構造のうち、包含関係にある部分
構造は最も外側の部分構造を選択する方式もしくは、任
意の部分構造を始点として編集箇所記述要素とマッチす
る部分構造のうち、包含関係にある部分構造は最も内側
の部分構造を選択する方式などの処理方式がある)。
【0037】(a)文書タグ:部分構造に付けられた名
前を<と>とで囲んで表記する マッチさせたい部分構造を特定する名前を文書タグとし
て指定することにより、名前の合致する部分構造とマッ
チする。例えば、SGML形式では、部分構造に付けら
れた名前として、タグ名を利用することが考えられる。
【0038】例として、図13を用いて説明する。符号13
01は編集箇所記述、符号1302はSGML形式の構造化文
書である。図13の例では、編集箇所記述1301中には、文
書タグ<注意事項>が記述されている。編集箇所記述13
01と構造化文書1302とのマッチ処理の過程において、前
記文書タグは、図13に示す通り、構造化文書1302の現在
着目している部分構造中に並んでいる部分構造のう
ち、”注意事項”という名前のタグによって囲まれた部
分構造とマッチする。
【0039】(b)文書文字パターン:正規表現記号を
含む文字列からなる文字パターンを”と”とで囲んで表
記する 文字列、もしくは、文字列に加えてsedなどのUNI
Xコマンドで一般的な正規表現記号を文書文字パターン
として指定することにより、合致する文字パターンの出
現する文書データとマッチする。なお、文書データと
は、例えば、SGML形式の構造化文書では、タグを除
く文章部分のことである。
【0040】例として、図14を用いて説明する。図14の
符号1401は編集箇所記述、符号1402はSGML形式の構
造化文書である。図14の例では、編集箇所記述1401中に
は、文書文字パターン”the”が記述されている。編集
箇所記述1401と構造化文書1402とのマッチ処理の過程に
おいて、前記文書文字パターンは、図14に示す通り、構
造化文書1402の現在着目している部分構造中に並んでい
る文書データのうち、”the”という文字列を含んだ文
書データとマッチする。
【0041】(c)ワイルドカードタグ:<*>と表記
する 後述する階層関係にある任意個の任意の名前の文書タグ
とマッチする。
【0042】例として、図15を用いて説明する。図15の
符号1501は編集箇所記述、符号1502はSGML形式の構
造化文書である。図15の例では、編集箇所記述1501中に
は、ワイルドカードタグ<*>が記述されており、ま
た、構造化文書1502は、”本文”の中に”章”があ
り、”章”の中に”節”があり、”節”の中に”項”が
あり、”項”の中は文書データのみ、という文書構造で
ある。編集箇所記述1501と構造化文書1502とのマッチ処
理の過程において、図15に示す通り、構造化文書1502の
現在着目している部分構造が"章"である場合には、前記
ワイルドカードタグは、 1.「空」の構造とマッチ(0個の階層とマッチ) 2.”節”の構造とマッチ 3.”節”の中に”項”がある構造とマッチ の3通りの部分構造とマッチする。
【0043】(d)否定指定子:!で表記する 否定指定子の直後の記述とのマッチが成り立たない部分
構造とマッチする。
【0044】例として、図16を用いて説明する。図16の
符号1601は編集箇所記述、符号1602はSGML形式の構
造化文書である。図16の例では、編集箇所記述1601中に
は、否定指定子!の直後に文書文字パターン”this”が
記述されている。編集箇所記述1601と構造化文書1602と
のマッチ処理の過程において、前記否定指定子および前
記否定指定子の直後の文書文字パターンは、図16に示す
通り、構造化文書1602の現在着目している部分構造中に
並んでいる文書データのうち、”this”という文字列を
含まない文書データとマッチする。
【0045】(e)引用指定子:%で表記する 引用指定子の直後の記述とマッチした部分構造を抽出す
る。
【0046】例として、図17を用いて説明する。図17の
符号1701は編集箇所記述、符号1702はSGML形式の構
造化文書である。図17の例では、編集箇所記述1701中に
は、引用指定子%の直後に文書タグ<注意事項>が記述
されている。編集箇所記述1701と構造化文書1702とのマ
ッチ処理の過程において、前記文書タグは、図17に示す
通り、構造化文書1702の現在着目している部分構造中に
並んでいる部分構造のうち、”注意事項”という名前の
タグによって囲まれた部分構造とマッチするため、編集
箇所記述1701によって、前記マッチした部分構造が抽出
される。
【0047】(f)順序接続子:,で表記する 順序接続子の直前の記述にマッチする部分構造(部分構
造Aとする)と、前記順序接続子の直後の記述にマッチ
する部分構造(部分構造Bとする)とが、同じ部分構造
の中に部分構造A、部分構造Bの順序で並んでいる場合
にマッチが成立する。部分構造Aと部分構造Bとの間に
他の部分構造が存在していてもマッチが成立する。
【0048】例として、図18を用いて説明する。図18の
符号1801は編集箇所記述、符号1802はSGML形式の構
造化文書である。図18の例では、編集箇所記述1801中に
は、順序接続子,の直前に文書タグ<はじめに>が記述
されており、かつ、前記順序接続子の直後に文書タグ<
おわりに>が記述されている。編集箇所記述1801と構造
化文書1802とのマッチ処理の過程において、図18に示す
通り、順序接続子の直前の文書タグと、構造化文書1802
の現在着目している部分構造中に並んでいる”はじめ
に”という名前のタグによって囲まれた部分構造とがマ
ッチし、さらに、前記順序接続子の直後の文書タグと、
前記マッチした部分構造より後方に並んでいる”おわり
に”という名前のタグによって囲まれた部分構造とがマ
ッチするため、前記順序接続子と、前記順序接続子の前
後の文書タグとで構成された記述のマッチが成立する。
【0049】(g)階層接続子:2つの記述の間に何も
文字を入れないことで表記する 階層接続子の直前の記述にマッチする部分構造(部分構
造Cとする)の中に、前記階層接続子の直後の記述にマ
ッチする部分構造(部分構造Dとする)がある場合にの
みマッチが成立する。なお、部分構造Cの中で、部分構
造Dの前に他の部分構造が並んでいてもマッチは成立す
る。
【0050】例として、図19を用いて説明する。図19の
符号1901は編集箇所記述、符号1902はSGML形式の構
造化文書である。図19の例では、編集箇所記述1901中に
は、階層接続子の直前に文書タグ<節>が記述されてお
り、かつ、前記並列接続子の直後に文書タグ<項>が記
述されている。また、構造化文書1902は、”本文”の中
に”章”があり、”章”の中に”節”があり、”節”の
中に”項”があり、”項”の中は文書データのみ、とい
う文書構造である。編集箇所記述1901と構造化文書1902
とのマッチ処理の過程において、図19に示す通り、階層
接続子の直前の文書タグと、構造化文書1902の現在着目
している部分構造中に並んでいる”節”という名前のタ
グによって囲まれた部分構造とがマッチし、さらに、前
記階層接続子の直後の文書タグと、前記マッチした部分
構造の中に並んでいる”項”という名前のタグによって
囲まれた部分構造とがマッチするため、前記階層接続子
と、前記階層接続子の前後の文書タグとで構成された記
述のマッチが成立する。
【0051】(h)括弧:(および)で表記する 括弧によって囲まれた記述のマッチが優先処理される。
【0052】(i)AND接続子:&で表記する AND接続子の直前の記述にマッチする部分構造(部分
構造Eとする)と、前記AND接続子の直後の記述にマ
ッチする部分構造(部分構造Fとする)とが、同じ部分
構造中に並んでいる場合にマッチが成立する。部分構造
Eと部分構造Fとが並んでいる順序は問わず、また、2
つの部分構造の間に他の部分構造が存在していてもマッ
チが成立する。
【0053】例として、図20を用いて説明する。図20の
符号2001は編集箇所記述、符号2002はSGML形式の構
造化文書である。図20の例では、編集箇所記述2001中に
は、AND接続子&の直前に文書タグ<おわりに>が記
述されており、かつ、前記AND接続子の直後に文書タ
グ<はじめに>が記述されている。編集箇所記述2001と
構造化文書2002とのマッチ処理の過程において、図20に
示す通り、AND接続子の直前の文書タグと、構造化文
書2002の現在着目している部分構造中に並んでいる”お
わりに”という名前のタグによって囲まれた部分構造と
がマッチし、さらに、AND接続子の直後の文書タグ
と、前記現在着目している部分構造中に並んでいる”は
じめに”という名前のタグによって囲まれた部分構造と
がマッチするため、前記AND接続子と、前記AND接
続子の前後の文書タグとで構成された記述のマッチが成
立する。
【0054】(j)OR接続子:|で表記する OR接続子の直前の記述にマッチする部分構造(部分構
造Gとする)と、前記OR接続子の直後の記述にマッチ
する部分構造(部分構造Hとする)の、少なくとも一方
の部分構造が存在する場合にマッチが成立する。
【0055】例として、図21を用いて説明する。図21の
符号2101は編集箇所記述、符号2102はSGML形式の構
造化文書である。図21の例では、編集箇所記述2101中に
は、OR接続子|の直前に文書タグ<おわりに>が記述
されており、かつ、前記OR接続子の直後に文書タグ<
はじめに>が記述されている。編集箇所記述2101と構造
化文書2102とのマッチ処理の過程において、図21に示す
通り、OR接続子の直前の文書タグとマッチする部分構
造が、構造化文書2102の現在着目している部分構造中に
並んでいるかを調べ、さらに、OR接続子の直後の文書
タグとマッチする部分構造が、構造化文書2102の現在着
目している部分構造中に並んでいるかを調べる。OR接
続子の直後の文書タグとマッチする部分構造が存在する
ため、前記OR接続子と、前記OR接続子の前後の文書
タグとで構成された記述のマッチが成立する。
【0056】図1は本発明の第1の実施の形態の構成図
である。図1を参照すると、本実施の形態の文書編集方
式は、構造化文書を順次読み込む構造化文書入力手段10
1と、前記構造化文書入力手段の読み込んだ入力文書の
部分構造を指定する編集箇所記述が1つ以上記述されて
いる文書処理記述手段102と、前記部分構造を、前記文
書処理記述手段に記述された編集箇所記述中の引用指定
子毎に分け、かつ、前記入力文書と前記編集箇所記述と
のマッチが成立した順に蓄積する文書蓄積手段103と、
前記文書処理記述手段から編集箇所記述を取り出し、前
記編集箇所記述を構成する各編集箇所記述要素と入力文
書とのマッチを試み、マッチが成立した前記編集箇所記
述中に記述された引用指定子に対応する部分構造を前記
文書蓄積手段に蓄積し、また、前記編集箇所記述中のA
ND接続子で結合された編集箇所記述要素の少なくとも
1つのマッチが成立しない場合には、前記AND接続子
で結合された各編集箇所記述要素に対応する部分構造を
前記文書蓄積手段から削除し、また、前記編集箇所記述
中のOR接続子で結合された編集箇所記述要素のどのマ
ッチも成立しない場合には、前記OR接続子で結合され
た各編集箇所記述要素に対応する部分構造を前記文書蓄
積手段から削除して抽出処理を行う文書編集処理実行手
段104と、前記文書蓄積手段に蓄積された文書をそのま
ま、あるいは加工して出力する文書出力手段105とを有
する。
【0057】次に、動作について図22、図23、図24、図
25を参照して説明する。
【0058】図22は、第1の実施の形態の全体処理動作
を示す流れ図である。
【0059】文書編集の対象となる複数の構造化文書が
与えられると、構造化文書入力手段101は前記複数の構
造化文書を1つ読み込む(ステップ2201)。文書編集処理
実行手段104は、文書処理記述手段102から編集箇所記述
を1つ取り出して(ステップ2202)抽出処理を実行する
(ステップ2203)。抽出処理2203の実行が終ると、次に処
理すべき編集箇所記述がある場合(ステップ2204)には、
編集箇所記述を1つ取り出す処理に戻り、また、処理す
べき編集箇所記述がない場合には、次に処理すべき構造
化文書があるかを調べる(ステップ2205)。全ての構造化
文書に対する処理がまだ完了していない場合には、ステ
ップ2201の文書を1つ読み込む処理に戻り、また、全て
の構造化文書に対する処理が完了した場合には、文書出
力手段105が、文書蓄積手段103に蓄積された部分構造を
そのまま、あるいは加工して出力する(ステップ2206)。
【0060】前記抽出処理における動作フローを、図23
を用いて説明する。
【0061】抽出処理では、文書編集処理実行手段104
が、OR接続子を区切りとして編集箇所記述を複数の記
述に分解し(ステップ2301)、前記分解した編集箇所記述
の1つを選び(ステップ2302)AND接続子の処理を実行
する(ステップ2303)。前記ステップ2303のAND接続子
の処理の実行が終ると、文書編集処理実行手段104は、
前記分解した編集箇所記述の中で未処理のものがある場
合(ステップ2304)には、ステップ2302の分解した編集箇
所記述の1つを選ぶ処理に戻り、また、前記分解した編
集箇所記述全てに対する処理が完了した場合には、前記
分解した各記述のマッチの状況を調べて、分解したどの
記述もマッチが成立していない場合(ステップ2305)に
は、対応する部分構造を文書蓄積手段103から削除する
(ステップ2306)。
【0062】前記AND接続子の処理における動作フロ
ーを、図24を用いて説明する。
【0063】AND接続子の処理では、文書編集処理実
行手段104が、AND接続子を区切りとして編集箇所記
述を複数の記述に分解し(ステップ2401)、前記分解した
編集箇所記述の1つを選び(ステップ2402)マッチ処理を
実行する(ステップ2403)。ステップ2403のマッチ処理実
行が終ると、文書編集処理実行手段104は、前記分解し
た編集箇所記述の中で未処理のものがある場合(ステッ
プ2404)には、ステップ2402の分解した編集箇所記述の
1つを選ぶ処理に戻り、また、前記分解した記述全てに
対する処理が完了した場合には、前記分解した各記述の
マッチの状況を調べて、マッチが不成立の記述が1つで
もある場合(ステップ2405)には、対応する部分構造を文
書蓄積手段103から削除する(ステップ2406)。
【0064】前記マッチ処理における動作フローを、図
25を用いて説明する。マッチ処理では、文書編集処理実
行手段104が、処理対象となる編集箇所記述の先頭要素
を着目点とし(ステップ2501)、前記編集箇所記述の着目
点における要素が括弧で囲まれている場合(ステップ250
2)には、前後の括弧をはずして(ステップ2503)抽出処理
を実行し(ステップ2504)、また、前記編集箇所記述の着
目点における要素が括弧で囲まれていない場合には、前
記要素と、入力文書中の現在着目している部分構造との
マッチを試みる(ステップ2505)。ステップ2504の抽出処
理もしくはステップ2505のマッチ完了後、文書編集処理
実行手段104は、前記編集箇所記述の着目点が記述の末
尾に達していない場合(ステップ2506)には、前記編集箇
所記述の着目点の要素と前記着目点の次の要素との間に
ある接続子に応じて入力文書中の現在着目している部分
構造を変え(ステップ2507)、編集箇所記述の着目点を次
の要素に移して(ステップ2508)、ステップ2502の編集箇
所記述の着目点の要素が括弧で囲まれているか判定する
処理へ戻る。また、前記編集箇所記述の着目点が記述の
末尾に達した場合には、前記編集箇所記述と入力文書と
のマッチの結果を調べてマッチが成立した場合には(ス
テップ2509)、さらに、前記編集箇所記を調べて引用指
定子があった場合には(ステップ2510)、前記引用指定子
に対応する部分構造を前記入力文書から抽出し、引用指
定子毎に分けて文書蓄積手段103に蓄積する(ステップ25
11)。
【0065】
【実施例】次に、本発明の第1の実施の形態の実施例を
3つの具体例を用いて動作を詳細に説明する。
【0066】まず、実施例1を、図8の、発表論文情報
から文書編集方式803により論文の題名と著者氏名を抽
出して一覧表Aを作成する例を用いて説明し、発明が解
決しようとする課題の(2−1)および(2−2)が解
決することを示す。
【0067】入力文書として、図9の構造化文書901お
よび構造化文書902の2つが与えられている例を説明す
る。
【0068】また、発表論文情報から一覧表Aの作成に
必要な部分構造を抽出するための編集箇所記述として、 %<題名>,%<氏名> が文書処理記述手段に記述されているとする。なお、以
降では、前記編集箇所記述を編集箇所記述Aと呼ぶこと
にする。
【0069】また、文書出力手段による加工方法は、次
の通りであるとする。なお、以降では、下記加工方法
を、加工方法Aと呼ぶことにする。
【0070】1.編集箇所記述Aの2つめの引用指定子
と対応する部分構造 2.編集箇所記述Aの1つめの引用指定子と対応する部
分構造 を文書蓄積手段からそれぞれ1つずつ抽出して前記順番
に並べたものを<表要素>というタグで囲んで表要素を
作り、文書蓄積手段中の全ての部分構造に対して前記処
理を実行して得られた表要素を並べて、全体を<一覧表
A>というタグで囲んで出力する。以上の条件の下での
動作を説明する。構造化文書入力手段101が、1つめの
入力文書として、構造化文書901を読み込む(ステップ22
01)。文書編集処理実行手段104は、文書処理記述手段10
2から前記編集箇所記述Aを取り出して(ステップ220
2)、構造化文書901に対する抽出処理を実行する(ステッ
プ2203)。
【0071】抽出処理では、OR接続子を区切りとし
て、編集箇所記述Aを複数の記述に分解する(ステップ2
301)。編集箇所記述A中にはOR接続子はないため、分
解された記述は、編集箇所記述A全体からなるもの1つ
だけとなる。前記編集箇所記述Aを処理対象として(ス
テップ2302)、AND接続子の処理を実行する(ステップ
2303)。
【0072】AND接続子の処理では、AND接続子を
区切りとして編集箇所記述Aを複数の記述に分解する
(ステップ2401)。編集箇所記述A中にはAND接続子は
ないため、分解された記述は、編集箇所記述A全体から
なるもの1つだけとなる。前記編集箇所記述Aを処理対
象として(ステップ2402)、マッチ処理を実行する(ステ
ップ2403)。
【0073】マッチ処理では、まず、編集箇所記述Aの
先頭要素である%<題名>を着目点とする(ステップ250
1)。前記着目点の要素と入力文書とのマッチの実行方式
には何通りかあるが、ここでは、文書の任意の部分構造
を始点として編集箇所記述要素とマッチする全ての部分
構造を求める方式を用いて、 1.編集箇所記述の先頭要素に限っては、入力文書中の
全ての部分構造を対象としてマッチを開始し、かつ、 2.マッチする全ての部分構造を求める方式とする。前
記マッチの実行方式の1.より、前記着目点の要素%<
題名>と、構造化文書901中の全ての部分構造とのマッ
チを試み、 <題名> ××に関する研究 </題名>とマッチする(ステップ2505)。また、前記着
目点の要素と前記着目点の次の要素との間には順序接続
子があるため、前記マッチした部分構造の後に並んでい
る構造が、構造化文書901の現在着目している部分構造
となる(ステップ2507)。
【0074】前記編集箇所記述Aの着目点が次の要素%<
氏名>に移され(ステップ2508)、前記構造化文書901中の
現在着目している部分構造とのマッチが試みられる。前
記マッチの実行方式の2.に従ってマッチする全ての部
分構造を求めるため、前記着目点の要素%<氏名>は、 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> の2通りの部分構造とマッチする(ステップ2505)。
【0075】着目点は前記編集箇所記述Aの末尾に達し
たため(ステップ2506)、編集箇所記述Aの各要素と構造
化文書901とのマッチを終え、各引用指定子に対応する
部分構造を抽出する。この際、抽出箇所間のつながりを
維持するため、例えば、編集箇所記述Aの要素%<題名
>と構造化文書901とマッチした部分構造と、編集箇所
記述Aの要素%<氏名>と構造化文書901とマッチした
2つの部分構造との組合せを求めて、文書蓄積手段103
に蓄積する(ステップ2511)。すなわち、例えば、次のよ
うな情報を文書蓄積手段103に蓄積してマッチ処理を終
了する。
【0076】編集箇所記述Aの1つめの引用指定子に対
応する 部分構造 <題名> ××に関する研究 </題名> <題名> ××に関する研究 </題名> 編集箇所記述Aの2つめの引用指定子に対応する 部分構造 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> 編集箇所記述Aを処理対象としたマッチ処理が完了する
と、AND接続子の処理に戻る。AND接続子の処理で
は、分解した記述に対する処理は全て完了したため(ス
テップ2404)、前記編集箇所記述Aと入力文書とのマッ
チの状況を調べる(ステップ2405)。前記編集箇所記述A
はマッチが成立したため、文書蓄積手段の削除は行わ
ず、AND接続子の処理を終了する。
【0077】AND接続子の処理が完了すると、抽出処
理に戻る。抽出処理では、分解した記述に対する処理は
全て完了したため(ステップ2304)、前記編集箇所記述A
と入力文書とのマッチの状況を調べる(ステップ2305)。
前記編集箇所記述Aはマッチが成立したため、文書蓄積
手段の削除は行わず、抽出処理を終了する。
【0078】抽出処理を完了すると、全体の処理に戻
る。全体の処理では、構造化文書901に対して処理すべ
き編集箇所記述はもうないため(ステップ2204)、構造化
文書入力手段101が、2つめの入力文書として、構造化
文書902を読み込む(ステップ2201)。文書編集処理実行
手段104は、文書処理記述手段102から前記編集箇所記述
Aを取り出して(ステップ2202)、構造化文書902に対す
る抽出処理を実行する(ステップ2203)。
【0079】構造化文書902に対する抽出処理は、前記
構造化文書901に対する抽出処理とほぼ同じであるた
め、詳細な説明は省き、結果だけを示す。処理の結果、
前記編集箇所記述Aの1つめの引用指定子に対応する部
分構造として、構造化文書902から、 <題名> ○○に関する研究 </題名> が抽出され、また、前記編集箇所記述Aの2つめの引用
指定子に対応する部分構造として、構造化文書902か
ら、 <氏名> ○○ 次郎 </氏名> が抽出され、文書蓄積手段103に蓄積される。
【0080】構造化文書902に対する抽出処理が終了す
ると、全体の処理に戻る。全体の処理では、構造化文書
902に対して処理すべき編集箇所記述はもうなく(ステッ
プ2204)、また、全ての構造化文書に対しての抽出処理
が完了したため(ステップ2205)、文書出力手段105が、
文書蓄積手段103に蓄積された部分構造を加工する(ステ
ップ2206)。
【0081】この時点で文書蓄積手段103に蓄積されて
いる部分構造を、文書蓄積手段103の格納形式の一例を
用いて以下に示す。
【0082】編集箇所記述Aの1つめの引用指定子に対
応する 部分構造 <題名> ××に関する研究 </題名> <題名> ××に関する研究 </題名> <題名> ○○に関する研究 </題名> 編集箇所記述Aの2つめの引用指定子に対応する 部分構造 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> <氏名> ○○ 次郎 </氏名> このように、文書蓄積手段103には、引用指定子毎に対
応する部分構造が、部分構造の並びとして蓄積されてい
る。しかも、それぞれの部分構造の並びの先頭の部分構
造は、最初にマッチが成立した際に抽出したものであ
り、それぞれの部分構造の並びの2番目の部分構造は、
2番目にマッチが成立した際に抽出したものである、と
いったように、並びの順番という形で、各引用指定子に
対応する部分構造の間のつながりを維持している。
【0083】文書出力手段105は、これらの部分構造か
ら、前記加工方法Aにより、図10のような一覧表Aを作
成し、出力する(ステップ2206)。
【0084】以上のように、本発明では、例えば前記編
集箇所記述Aのように、1つのパターンに複数の抽出箇
所を指定することができ、しかも、例えば、文書蓄積手
段103に蓄積された部分構造の並びの順番という形で、
各引用指定子に対応する部分構造の間のつながりを維持
して部分構造を抽出することができ、さらに、前記加工
方法Aのように、構造を分解する処理と特別に用意する
ことなく、抽出した部分構造を、引用指定子毎に別々に
扱うことができる。
【0085】なお、前記マッチ処理におけるマッチの実
行方式として文書の任意の部分構造を始点として編集箇
所記述要素とマッチする全ての部分構造を求める方式を
用いたが、用途や処理速度、使用する作業領域の大きさ
などに応じて、任意の部分構造を始点として編集箇所記
述要素とマッチする最初の部分構造を求める方式もしく
は、任意の部分構造を始点として編集箇所記述要素とマ
ッチする最後の部分構造を求める方式もしくは、任意の
部分構造を始点として編集箇所記述要素とマッチする部
分構造のうち、包含関係にある部分構造は最も外側の部
分構造を選択する方式もしくは、任意の部分構造を始点
として編集箇所記述要素とマッチする部分構造のうち、
包含関係にある部分構造は最も内側の部分構造を選択す
る方式もしくは、最も外側の構造を始点として前記編集
箇所記述要素とマッチする全ての部分構造を求める方式
のいずれの方式、もしくはその他の方式を用いても良
い。例えば、任意の部分構造を始点として編集箇所記述
要素とマッチする最初の部分構造を求める方式もしく
は、任意の部分構造を始点として編集箇所記述要素とマ
ッチする最後の部分構造を求める方式は、マッチする組
合せの1つを求めれば十分である場合などに適用するこ
とができ、任意の部分構造を始点として編集箇所記述要
素とマッチする全ての部分構造を求める方式などと比較
して処理速度が早く、使用する作業領域の大きさも小さ
いという利点がある。また、例えば、入力文書中に、 <itemize> <item> 選択枝1 </item> <itemize> <item> 副選択枝A </item> <item> 副選択枝B </item> </itemize> <item> 選択枝2 </item> <item> 選択枝3 </item> </itemize> など、<itemize>の内側にさらに<itemize>が含まれ
ているといったように同種の構造がネストしている場合
において、一番外側の<itemize>とマッチさせたい場
合、あるいは、一番内側の<itemize>とマッチさせた
い場合には、前述した、任意の部分構造を始点として編
集箇所記述要素とマッチする部分構造のうち、包含関係
にある部分構造は最も外側の部分構造を選択する方式も
しくは、任意の部分構造を始点として編集箇所記述要素
とマッチする部分構造のうち、包含関係にある部分構造
は最も内側の部分構造を選択する方式を適用することが
できる。また、文書の最も外側の構造を始点として編集
箇所記述要素とマッチする全ての部分構造を求める方式
は、例えば、マッチする全ての組合せを求めたいが、処
理の高速化も狙いたい場合などに適用することができ
る。例えば前記発表論文情報から一覧表Aの作成に必要
な部分構造を抽出する例では、編集箇所記述として、 <論文情報>(%<題名>,%<氏名>) といったように、編集箇所記述を、入力文書の最も外側
のタグから順に記述することにより、編集箇所記述の先
頭要素を、入力文書中の全ての部分構造を対象としてマ
ッチを試みる処理などを省くことができ、高速化が図れ
る。
【0086】次に、実施例2を、図26のように、発表論
文情報2から投稿先学会名と論文の題名を抽出して、一
覧表Bを作成する例を用いて説明し、発明が解決しよう
とする課題の(2−3)が解決することを示す。
【0087】図26において、入力文書2601、入力文書26
02は発表論文情報2であり、出力文書2604が作成したい
一覧表Bである。また、図26の入力文書2601をSGML
形式で記述した例が図27の構造化文書2701であり、図26
の入力文書2602をSGML形式で記述した例が図27の構
造化文書2702であり、図26の出力文書2604をSGML形
式で記述した例が図27の出力文書2703である。
【0088】入力文書として図27の構造化文書2701およ
び構造化文書2702の2つが与えられている例を説明す
る。
【0089】また、発表論文情報2から一覧表Bの作成
に必要な部分構造を抽出するための編集箇所記述とし
て、 %<学会名>&%<題名> が文書処理記述手段に記述されているとする。なお、以
降では、前記編集箇所記述を編集箇所記述Bと呼ぶこと
にする。
【0090】また、文書出力手段による加工方法は、次
の通りであるとする。なお、以降では、下記文書出力手
段の加工方法を、加工方法Bと呼ぶことにする。
【0091】1.編集箇所記述Bの1つめの引用指定子
と対応する部分構造 2.編集箇所記述Bの2つめの引用指定子と対応する部
分構造 を文書蓄積手段からそれぞれ1つずつ抽出して前記順番
に並べたものを<表要素>というタグで囲んで表要素を
作り、文書蓄積手段中の全ての部分構造に対して前記処
理を実行して得られた表要素を並べて、全体を<一覧表
B>というタグで囲んで出力する。
【0092】以上の条件の下での動作を説明する。
【0093】構造化文書入力手段101が、1つめの入力
文書として、構造化文書2701を読み込む(ステップ220
1)。文書編集処理実行手段104は、文書処理記述手段102
から前記編集箇所記述Bを取り出して(ステップ2202)、
構造化文書2701に対する抽出処理を実行する(ステップ2
203)。
【0094】抽出処理では、OR接続子を区切りとし
て、編集箇所記述Bを複数の記述に分解する(ステップ2
301)。編集箇所記述B中にはOR接続子はないため、分
解された記述は、編集箇所記述B全体からなるもの1つ
だけとなる。前記編集箇所記述Bを処理対象として(ス
テップ2302)、AND接続子の処理を実行する(ステップ
2303)。
【0095】AND接続子の処理では、AND接続子を
区切りとして編集箇所記述Bを複数の記述に分解する
(ステップ2401)。まず、区切った記述の1つ%<学会名
>を処理対象として選び(ステップ2402)、マッチ処理を
実行する(ステップ2403)。
【0096】マッチ処理は、前述の第1の実施の形態の
実施例1で詳細に説明したため、要点のみ示す。マッチ
処理では、編集箇所記述の先頭要素である%<学会名>
と構造化文書2701の全ての部分構造とのマッチを試み、
結果として、マッチは成立し、編集箇所記述Bの1つめ
の引用指定子に対応する部分構造として、 <学会名> 知能研究会 </学会名> が抽出され、文書蓄積手段103に蓄積される。
【0097】構造化文書2701と%<学会名>とのマッチ
処理が完了すると、AND接続子の処理に戻る。AND
接続子の処理では、処理すべき記述%<題名>が残って
いるため(ステップ2404)、次に、%<題名>を処理対象
として選び(ステップ2402)、マッチ処理を実行する(ス
テップ2403)。
【0098】マッチ処理は、前述の第1の実施の形態の
実施例1で詳細に説明したため、要点のみ示す。%<題
名>を処理対象としたマッチ処理では、前述の%<学会
名>を処理対象としたマッチ処理を実行した時とは別
に、新たに、編集箇所記述の先頭要素である%<題名>
と構造化文書2701の全ての部分構造とのマッチを試み
る。その結果、マッチは成立し、編集箇所記述Bの2つ
めの引用指定子に対応する部分構造として、 <題名> ××に関する研究 </題名> が抽出され、文書蓄積手段103に蓄積される。
【0099】構造化文書2701と%<題名>とのマッチ処
理が完了すると、AND接続子の処理に戻る。AND接
続子の処理では、分解した記述に対する処理は全て完了
したため(ステップ2404)、前記編集箇所記述Bと入力文
書とのマッチの状況を調べる(ステップ2405)。前記編集
箇所記述BのAND接続子で区切られた各記述は全てマ
ッチが成立したため、文書蓄積手段の削除は行わず、A
ND接続子の処理を終了する。
【0100】AND接続子の処理が完了すると、抽出処
理に戻る。抽出処理では、分解した記述に対する処理は
全て完了したため(ステップ2304)、前記編集箇所記述B
と入力文書とのマッチの状況を調べる(ステップ2305)。
前記編集箇所記述Bはマッチが成立したため、文書蓄積
手段の削除は行わず、抽出処理を終了する。
【0101】抽出処理が完了すると、全体の処理に戻
る。全体の処理では、構造化文書2701に対して処理すべ
き編集箇所記述はもうないため(ステップ2204)、構造化
文書入力手段101が、2つめの入力文書として、構造化
文書2702を読み込む(ステップ2201)。文書編集処理実行
手段104は、文書処理記述手段102から前記編集箇所記述
Bを取り出して(ステップ2202)、構造化文書2702に対す
る抽出処理を実行する(ステップ2203)。
【0102】構造化文書2702に対する抽出処理は、前記
構造化文書2701に対する抽出処理とほぼ同じであるた
め、詳細な説明は省き、結果だけを示す。処理の結果、
前記編集箇所記述Bの1つめの引用指定子に対応する部
分構造として、 <学会名> 情報研究会 </学会名> が抽出され、また、前記編集箇所記述Aの2つめの引用
指定子に対応する部分構造として、 <題名> ○○に関する研究 </題名> が抽出され、文書蓄積手段103に蓄積され、抽出処理を
終了する。
【0103】抽出処理が完了すると、全体の処理に戻
る。全体の処理では、構造化文書902に対して処理すべ
き編集箇所記述はもうなく(ステップ2204)、また、全て
の構造化文書に対しての抽出処理が完了したため(ステ
ップ2205)、文書出力手段105が、文書蓄積手段103に蓄
積された部分構造を加工する(ステップ2206)。
【0104】この時点で文書蓄積手段103に蓄積されて
いる部分構造を、文書蓄積手段103の格納形式の一例を
用いて以下に示す。
【0105】編集箇所記述Aの1つめの引用指定子に対
応する 部分構造 <学会名> 知能研究会 </学会名> <学会名> 情報研究会 </学会名> 編集箇所記述Aの2つめの引用指定子に対応する 部分構造 <題名> ××に関する研究 </題名> <題名> ○○に関する研究 </題名> 文書出力手段105は、これらの部分構造から、前記加工
方法Bにより、図27の出力文書2703のような一覧表Bを
作成し、出力する(ステップ2206)。
【0106】以上のように、本発明では、順不同の並列
関係を表すAND接続子を記述することができ、また、
例えば前記例でのマッチ処理における、編集箇所記述の
先頭要素の処理のように、AND接続子で区切られた各
記述は、それぞれ、構造化文書の全ての部分構造を開始
点としてマッチが試みられ、AND接続子の処理のステ
ップ2405、ステップ2406のように、区切った記述の全て
のマッチが成功した組合せのみ、文書蓄積手段103に保
持されるため、AND接続子の前後の記述が順不同でマ
ッチして部分構造の抽出を実行することができる。
【0107】次に、実施例3として、括弧、および、O
R接続子の解釈動作について示す。
【0108】例えば図28のようにSGML記述された論
文、すなわち、 1.<図>および</図>というタグで囲まれた図を表
す部分構造と文書データとが、<第一章>および</第
一章>というタグで囲まれた第一章を表す部分構造 2.<図>および</図>というタグで囲まれた図を表
す部分構造と文書データとが、<第二章>および</第
二章>というタグで囲まれた第二章を表す部分構造 をこの順序で並べて全体を<論文>および</論文>と
いうタグで囲んで表現したものから、第一章の図および
第二章の図を抽出する動作を説明する。
【0109】入力文書として、図28の構造化文書2801が
与えられている例を説明する。また、論文から第一章の
図および第二章の図を抽出するための編集箇所記述とし
て、 (<第一章>|<第二章>)%<図> が文書処理記述手段に記述されているとする。なお、以
降では、前記編集箇所記述を編集箇所記述Cと呼ぶこと
にする。
【0110】また、文書出力手段は、文書蓄積手段103
の内容をそのまま出力するとする。
【0111】以上の条件の下での動作を簡単に説明す
る。
【0112】構造化文書入力手段101が構造化文書2801
を読み込み(ステップ2201)、文書編集処理実行手段104
が文書処理記述手段102から前記編集箇所記述Cを取り
出して(ステップ2202)、構造化文書2801に対する抽出処
理を実行する(ステップ2203)。
【0113】抽出処理では、編集箇所記述CにはOR接
続子があるが、括弧で囲まれているため、編集箇所記述
Cを複数の記述に分解することができず、前記編集箇所
記述Cを処理対象として(ステップ2302)、AND接続子
の処理を実行する(ステップ2303)。
【0114】AND接続子の処理では、編集箇所記述C
にはAND接続子が含まれていないため、前記編集箇所
記述Cを処理対象として(ステップ2402)、マッチ処理を
実行する(ステップ2403)。
【0115】マッチ処理では、前記編集箇所記述Cの先
頭要素(<第一章>|<第二章>)に着目し(250
1)、(<第一章>|<第二章>)の前後の括弧をはず
して(ステップ2503)、<第一章>|<第二章>に対する
抽出処理を実行する(ステップ2504)。
【0116】抽出処理では、<第一章>|<第二章>を
OR接続子で分解し(ステップ2301)、<第一章>を処理対
象として(ステップ2302)、AND接続子の処理を実行す
る(ステップ2303)。
【0117】以降のAND接続子の処理の詳細は省略
し、結果として、 a.<第一章>と構造化文書2801とのマッチは成立 a−1.抽出した部分構造はなし a−2.構造化文書2801の着目している部分構造は<第
一章> となり、AND接続子の処理を終了して、抽出処理に戻
る。
【0118】抽出処理では、分解した2つめの記述<第
二章>を処理対象として、AND接続子の処理を実行す
る。<第二章>を処理対象としたAND接続子の処理結
果は、 b.<第二章>と構造化文書2801とのマッチは成立 b−1.抽出した部分構造はなし b−2.構造化文書2801の着目している部分構造は<第
二章> となり、抽出処理へ戻る。
【0119】抽出処理では、ORで区切った記述の少な
くとも1つのマッチが成立しているため(ステップ230
5)、<第一章>|<第二章>のマッチが成立したとし
て、抽出処理を終了し、マッチ処理へ戻る。
【0120】マッチ処理では、着目点の要素(<第一章
>|<第二章>)と、次の要素%<図>との間の接続子
が階層接続子であるため、前記AND接続子の処理結果
a−2.およびb−2.より、前記a.のマッチに対し
ては、<第一章>の内側が構造化文書2801の現在着目し
ている部分構造となり、前記b.のマッチに対しては、
<第二章>の内側が構造化文書2801の現在着目している
部分構造となる(ステップ2507)。
【0121】前記編集箇所記述Cの着目点が次の要素%
<図>に移され(ステップ2508)、前記構造化文書2801中
の現在着目している2箇所の部分構造とのマッチが試み
られる(ステップ2505)。
【0122】その結果、前記a.のマッチに対しては、 <図> 図1 </図> が抽出され、また、前記b.のマッチに対しては、 <図> 図2 </図> が抽出され、文書蓄積手段103に蓄積される(ステップ25
11)。
【0123】最後に、文書出力手段105が、前記抽出さ
れた部分構造を出力し(ステップ2206)、全体の処理が終
了する。
【0124】図2は本発明の第2の実施の形態の構成図
である。図2を参照すると、本実施の形態の文書編集方
式は、第1の実施の形態の構成に加えて、構造化文書や
部分構造を蓄積する出力文書蓄積手段106と、動作記述
を解釈し、文書の追加、文書の結合、文書数のカウント
などの編集処理を実行して、構造化文書や部分構造を前
記出力文書蓄積手段に蓄積する動作記述解釈手段107
と、読み込まれた各文書に対しての抽出処理を開始する
前に実行する動作を記述した文書毎前処理記述手段108
と、読み込まれた各文書に対しての前記抽出処理が完了
する毎に実行する動作を記述した文書毎後処理記述手段
109と、読み込まれた各文書に対しての前記抽出処理が
行われる前に、前記文書毎前処理記述手段に記述された
動作記述を前記動作記述解釈手段へ通知する文書毎前処
理実行手段110と、読み込まれた各文書に対しての前記
抽出処理が完了する毎に、前記文書毎後処理記述手段に
記述された動作記述を前記動作記述解釈手段へ通知する
文書毎後処理実行手段111と、読み込まれた文書の最初
の文書に対する前記抽出処理を開始する前に実行する動
作を記述した初期処理記述手段112と、読み込まれた全
ての文書に対する前記抽出処理が完了した後に実行する
動作を記述した終了時処理記述手段113と、読み込まれ
た文書の最初の文書に対する前記抽出処理が行われる前
に、前記初期処理記述手段に記述された動作記述を前記
動作記述解釈手段へ通知する初期処理実行手段114と、
読み込まれた全ての文書に対する前記抽出処理が完了し
た後に、前記終了処理記述手段に記述された動作記述を
前記動作記述解釈手段へ通知する終了時処理実行手段11
5と、タグ名変更指示や構造削除指示や文字列変更指示
や文字列削除指示を受け付けて各処理を実行する文書修
正手段116と、構造化文書や部分構造を指定されたキー
に従ってソートする文書ソート手段117とをさらに有す
る。
【0125】次に、動作について図23、図29、図30、図
31、図32、図33、図34、図35を参照して説明する。
【0126】図29は、第2の実施の形態の全体処理動作
を示す流れ図である。
【0127】初期処理実行手段114が初期処理を実行(ス
テップ2901)後、構造化文書入力手段101は文書編集の対
象となる複数の構造化文書を1つ読み込む(ステップ290
2)。さらに、文書毎前処理実行手段110が文書毎前処理
を実行(ステップ2903)後、文書編集処理実行手段104
は、文書処理記述手段102から編集処理記述を1つ取り
出して(ステップ2904)、抽出・動作記述解釈処理を実行
し(ステップ2905)、次に処理すべき編集処理記述がある
場合(ステップ2906)には、編集処理記述を1つ取り出す
処理2904に戻り、また、処理すべき編集処理記述がない
場合には、文書毎後処理実行手段111が文書毎後処理を
実行(ステップ2907)後、次に処理すべき構造化文書があ
るかを調べる(ステップ2908)。全ての構造化文書に対す
る処理がまだ完了していない場合には、ステップ2902の
文書を1つ読み込む処理に戻り、また、全ての構造化文
書に対する処理が完了した場合には、終了時処理実行手
段115が終了時処理を実行(ステップ2909)後、文書出力
手段105が、出力文書蓄積手段106に蓄積された部分構造
をそのまま、あるいは加工して出力する(ステップ291
0)。
【0128】前記初期処理における動作フローを、図30
を用いて説明する。
【0129】初期処理では、初期処理実行手段114が、
初期処理記述手段112から初期処理記述を読み込み(ステ
ップ3001)、前記読み込んだ初期処理記述を動作記述解
釈手段107に通知して、動作記述解釈処理を実行する(ス
テップ3002)。
【0130】前記文書毎前処理における動作フローを、
図31を用いて説明する。
【0131】文書毎前処理では、文書毎前処理実行手段
110が、文書毎前処理記述手段108から文書毎前処理記述
を読み込み(ステップ3101)、前記読み込んだ文書毎前処
理記述を動作記述解釈手段107に通知して、動作記述解
釈処理を実行する(ステップ3102)。
【0132】前記文書毎後処理における動作フローを、
図32を用いて説明する。
【0133】文書毎後処理では、文書毎後処理実行手段
111が、文書毎後処理記述手段109から文書毎後処理記述
を読み込み(ステップ3201)、前記読み込んだ文書毎後処
理記述を動作記述解釈手段107に通知して、動作記述解
釈処理を実行する(ステップ3202)。
【0134】前記終了時処理における動作フローを、図
33を用いて説明する。
【0135】終了時処理では、終了時処理実行手段115
が、終了時処理記述手段113から終了時処理記述を読み
込み(ステップ3301)、前記読み込んだ終了時処理記述を
動作記述解釈手段107に通知して、動作記述解釈処理を
実行する(ステップ3302)。
【0136】前記抽出・動作記述解釈処理における動作
フローを、図34を用いて説明する。
【0137】抽出・動作記述解釈処理では、文書編集処
理実行手段104が、前記ステップ2904の編集処理記述を
1つ取り出す処理で取り出された編集処理記述の編集箇
所記述を用いて抽出処理を実行(ステップ3401)し、その
結果、マッチが成立した場合(ステップ3402)には、前記
抽出処理によって抽出された部分構造を文書蓄積手段10
3より取り出して、前記取り出した編集処理記述中の動
作記述とともに動作記述解釈手段107に通知して、動作
記述解釈処理を実行する(ステップ3403)。また、前記抽
出処理を実行した結果、マッチが成立しなかった場合に
は、動作記述解釈処理を実行せず、抽出・動作記述解釈
処理を終了する。
【0138】前記動作記述解釈処理における動作フロー
を、図35を用いて説明する。
【0139】動作記述解釈処理では、動作記述解釈手段
107が、前記通知された動作記述を解釈して、タグ名変
更指示、構造削除指示、文字列変更指示、あるいは、文
字列削除指示などの文書修正指示であった場合(ステッ
プ3501)には、前記文書修正指示と、指定された部分構
造とを、文書修正手段116に通知し、修正結果を得る(ス
テップ3502)。また、前記通知された動作記述が文書ソ
ート指示であった場合(ステップ3503)には、前記文書ソ
ート指示と、指定された部分構造とを、文書ソート手段
117に通知し、ソートした結果を得る(ステップ3504)。
また、前記通知された動作記述が、文書修正指示でも文
書ソート指示でもなかった場合には、前記動作記述に従
い、一時変数への格納や演算、出力文書蓄積手段106へ
の部分構造の格納などの動作実行処理を実行する(ステ
ップ3505)。前記ステップ3502の文書修正処理、もしく
は、前記ステップ3504の文書ソート処理、もしくは、前
記ステップ3505の動作実行処理の実行後、まだ処理すべ
き動作記述がある場合(ステップ3506)には、動作記述解
釈処理の先頭に戻る。また、処理すべき動作記述がもう
ない場合には、動作記述解釈処理を終了する。
【0140】なお、図34における抽出処理は、前記図23
を用いて説明した抽出処理と同一である。
【0141】
【実施例】次に、本発明の第2の実施の形態の実施例と
して、図2および図23、図29、図30、図31、図32、図3
3、図34、図35の構成による方式の動作を、具体例を用
いて説明する。
【0142】例えば、図37のように、入力文書3701や入
力文書3702の論文情報から文書編集方式3703により題名
を抽出し、また、各題名の著者数を数えて、題名と著者
人数とからなり、かつ、各著者人数を全て合計した合計
人数が最後に添付された一覧表(以降、一覧表Cと呼ぶ)
を出力文書3704として作成したいとする。
【0143】入力文書3701、3702は、図9の構造化文書
901、902のようなSGML形式であるとする。
【0144】また、作成したい一覧表Cは、図38のよう
なSGML形式、すなわち、 1.<論文題名>および</論文題名>というタグで囲
まれた論文の題名を表す部分構造 2.<著者人数>および</著者人数>というタグで囲
まれた著者の人数を表す部分構造 をこの順序で並べて全体を<表要素>および</表要素
>というタグで囲んだ部分構造を、さらに複数並べて、
最後に、部分構造 3.<合計人数>および</合計人数>というタグで囲
まれた著者の合計人数を表す部分構造 が追加された部分構造の並びの全体を、<一覧表C>お
よび</一覧表C>というタグで囲んだ形式で表現す
る。
【0145】また、文書処理記述手段には、次の編集処
理記述D−1および編集処理記述D−2の2つの編集処
理記述が格納されている。なお、変数daimei、および、
変数countは、動作記述解釈手段107が内部で管理する変
数である。変数daimeiは、部分構造を格納することので
きる変数であり、ここでは、抽出した部分構造を格納す
るために用いている。また、変数countは、整数値を格
納することのできる変数であり、ここでは、各論文毎の
著者人数をカウントするために用いている。 編集処理記述D−1:次の編集箇所記述1と動作記述1
の組から成る 編集箇所記述1:%<題名> 動作記述1 :編集箇所記述1の1つめの引用指定子
と対応する部分構造中の<題名>タグを<論文題名>タ
グに変更したものを、変数daimeiに格納する。 編集処理記述D−2:次の編集箇所記述2と動作記述2
の組から成る 編集箇所記述2:%<人数> 動作記述2 :編集箇所記述2の1つめの引用指定子
と対応する部分構造の数を数え、変数countにその値を
格納する。
【0146】また、初期処理記述手段には、次の初期処
理記述1および初期処理記述2の2つのステップが格納
されている。なお、変数total、および、変数tableは、
動作記述解釈手段107が内部で管理する変数である。変
数totalは、整数値を格納することのできる変数であ
り、ここでは、著者人数の合計をカウントするために用
いている。また、変数tableは、部分構造を格納するこ
とのできる変数であり、ここでは、表要素の並びを作成
するために用いている。 初期処理記述1:変数totalに0を代入する 初期処理記述2:変数tableの内容を空にする。
【0147】また、文書毎前処理記述手段には、次の文
書毎前処理記述1が格納されている。 文書毎前処理記述1:変数countに0を代入する。
【0148】また、文書毎後処理記述手段には、次の文
書毎後処理記述1および文書毎後処理記述2の2つのス
テップが格納されている。 文書毎後処理記述1:変数totalの値を、変数countの値
だけ増やす。 文書毎後処理記述2: <表要素> 変数daimeiの内容 <著者人数> 変数countの内容 </著者人数> </表要素> の部分構造を構成し、変数tableに追加する また、終了時処理記述手段には、次の終了時処理記述1
が格納されている。 終了時処理記述1: <一覧表C> 変数tableの内容 <合計人数> 変数totalの内容 </合計人数> </一覧表C> の部分構造を構成し、出力文書蓄積手段へ格納する。
【0149】また、文書出力手段は、出力文書蓄積手段
に格納された文書をそのまま出力する。
【0150】以上の条件の下での動作を説明する。
【0151】初期処理実行手段114が初期処理を実行し
(ステップ2901)、初期処理記述手段112から、前記初期
処理記述1および前記初期処理記述2を読み込み(ステ
ップ3001)、動作記述解釈手段107へ通知して動作記述解
釈処理を実行させる(ステップ3002)。
【0152】動作記述解釈手段107は、まず、初期処理
記述1を解釈して動作実行処理を実行(ステップ3505)す
る。これにより、動作記述解釈手段107が内部で管理す
る変数totalの内容が0に初期化される。次に、動作記
述解釈手段107は、初期処理記述2を解釈して動作実行処
理を実行(ステップ3505)する。これにより、動作記述解
釈手段107が内部で管理する変数tableの内容が空に初期
化される。
【0153】初期処理の実行が完了すると、全体の処理
に戻り、、構造化文書入力手段101が、1つめの入力文
書として、構造化文書901を読み込む(ステップ2902)。
【0154】文書毎前処理実行手段110が文書毎前処理
を実行し(ステップ2903)、文書毎前処理記述手段108か
ら、前記文書毎前処理記述1を読み込み(ステップ310
1)、動作記述解釈手段107へ通知して動作記述解釈処理
を実行させる(ステップ3102)。
【0155】動作記述解釈手段107は、前記文書毎前処
理記述1を解釈して動作実行処理を実行する(ステップ3
505)。これにより、動作記述解釈手段107が内部で管理
する変数countの内容が0に初期化される。
【0156】文書毎前処理の実行が完了すると、全体の
処理に戻り、文書編集処理手段104が、文書処理記述手
段102から、前記編集処理記述D−1を取り出し(ステッ
プ2904)、抽出・動作記述解釈処理を実行する(ステップ
2905)。
【0157】抽出・動作記述解釈処理では、文書編集処
理実行手段104が、前記取り出した編集処理記述D−1
の編集箇所記述1を用いて、構造化文書901の抽出処理
を実行する(ステップ3401)。抽出処理の実行の結果、マ
ッチが成立し、編集箇所記述1の1つめの引用指定子に
対応する部分構造として、 <題名> ××に関する研究 </題名> が抽出される。マッチが成立したため(ステップ3402)、
文書編集処理実行手段104は、前記取り出した編集処理
記述D−1の動作記述1と前記抽出した部分構造とを動
作記述解釈手段107に通知し、動作記述解釈処理を実行
させる(ステップ3403)。
【0158】動作記述解釈処理では、動作記述解釈手段
107が、与えられた動作記述1を解釈する。動作記述1
には文書修正指示が含まれているため(ステップ3501)、
動作記述解釈手段107は、文書修正手段116に、前記抽出
した文書と、「<題名>を<論文題名>に変える」とい
う修正指示とを通知し、文書修正処理を実行させる。文
書修正処理の実行結果として、動作記述解釈手段107
は、部分文書 <論文題名> ××に関する研究 </論文題名> を受けとる。さらに、動作記述解釈手段107は、動作記
述1の残りの処理を解釈して、動作実行処理を行い(ス
テップ3505)、前記受けとった部分文書を、動作記述解
釈手段107が内部で管理する変数daimeiに格納する。
【0159】動作記述解釈処理が完了し、さらに、抽出
・動作記述解釈処理が完了して、全体の処理に戻り、次
の編集処理記述D−2を用いた抽出・動作記述解釈処理
が同様に実行される。
【0160】編集処理記述D−2を用いた抽出・動作記
述解釈処理では、編集箇所記述2とのマッチにより、 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> の2つの部分構造が抽出され、動作記述2の解釈によっ
て、動作記述解釈手段107が内部で管理する変数countに
2が代入される。
【0161】文書処理記述手段102の全ての編集処理記
述の処理が完了したため(ステップ2906)、文書毎後処理
実行手段111が文書毎後処理を実行し(ステップ2907)、
動作記述解釈手段107が内部で管理する変数totalの値が
2となり、また、動作記述解釈手段107が内部で管理す
る変数tableの内容が、 <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> となる。
【0162】同様に、構造化文書902の処理が行われ、
その結果、動作記述解釈手段107が内部で管理する変数t
otalの値に1が加えられて3となり、また、動作記述解
釈手段107が内部で管理する変数tableに新たな部分構造
が追加され、変数tableの内容は、 <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> となる。
【0163】全ての入力文書に対する処理が完了したた
め(ステップ2908)、終了時処理実行手段115が終了時処
理を実行し(ステップ2909)、その結果、 <一覧表C> <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> <合計人数> 3 </合計人数> <一覧表C> という一覧表Cが完成し、出力文書蓄積手段106に格納
される。
【0164】最後に、文書出力手段105が、前記出力文
書蓄積手段106に格納された一覧表Cを出力する(ステッ
プ2910)。
【0165】なお、前記例では、動作記述解釈手段107
は、動作記述1の文書修正指示を解釈して、文書修正手
段116に文書修正処理を実行させたが、文書修正手段116
を用意せずに、動作記述解釈手段107がステップ3505の
動作実行処理の中で文書修正処理を行ってもよい。
【0166】また、前記例にはなかったが、同様に、動
作記述解釈手段107に通知された動作記述に文書ソート
指示が含まれていた場合には、文書ソート手段117を用
意して、動作記述解釈手段107が文書ソート手段117に、
文書ソート処理を実行させる他に、文書ソート手段117
を用意せず、動作記述解釈手段107が、ステップ3505の
動作実行処理の中で文書ソート処理を行ってもよい。
【0167】図3は本発明の第3の実施の形態の構成図
である。図3を参照すると、本実施の形態の文書編集方
式は、第2の実施の形態の構成に加えて、前記読み込ま
れた文書に対する削除要求を受け付け、前記削除要求を
前記文書編集処理実行手段および前記動作記述解釈手段
に通知する入力文書削除要求受信手段118をさらに有す
る。
【0168】次に、動作について図23、図30、図31、図
32、図33、図34、図36を参照して説明する。
【0169】図36は、第3の実施の形態の全体処理動作
を示す流れ図である。
【0170】初期処理実行手段114が初期処理を実行(ス
テップ3601)後、構造化文書入力手段101は文書編集の対
象となる構造化文書の到着を待つ(ステップ3602)。ま
た、入力文書削除要求受信手段118は入力文書削除要求
を待つ(ステップ3603)。
【0171】構造化文書が到着した場合には、構造化文
書入力手段101が到着した構造化文書を1つ読み込む(ス
テップ3604)。さらに、文書毎前処理実行手段110が文書
毎前処理を実行(ステップ3605)後、文書編集処理実行手
段104は、文書処理記述手段102から編集処理記述を1つ
取り出して(ステップ3606)、抽出・動作記述解釈処理を
実行し(ステップ3607)、次に処理すべき編集処理記述が
ある場合(ステップ3608)には、ステップ3606の編集処理
記述を1つ取り出す処理に戻り、また、処理すべき編集
処理記述がない場合には、文書毎後処理実行手段110が
文書毎後処理を実行(ステップ3609)後、まだ構造化文書
の到着を待つべきかを判定する(ステップ3610)。まだ構
造化文書の到着を待つべきと判断した場合には、構造化
文書の到着を待つ処理に戻り、また、全ての構造化文書
に対する処理が完了したと判断した場合には、終了時処
理実行手段115が終了時処理を実行(ステップ3611)後、
文書出力手段105が、出力文書蓄積手段106に蓄積された
部分構造をそのまま、あるいは加工して出力する(ステ
ップ3612)。
【0172】また、入力文書削除要求受信手段118が入
力文書削除要求を受信した場合には、文書編集処理実行
手段104および動作記述解釈手段107へ削除要求を通知す
る。入力文書削除要求受信手段118から削除要求を通知
された文書編集処理実行手段104は、削除要求のあった
文書に関する部分構造を文書蓄積手段103から削除し(ス
テップ3613)、また、削除した部分構造を動作記述解釈
手段107へ通知する。入力文書削除要求受信手段118から
削除要求を通知され、また、文書編集処理実行手段104
から削除した部分構造を通知された動作記述解釈手段10
7は、削除要求された文書名や削除した部分構造などの
情報をもとに、動作記述解釈手段107の内部情報や出力
文書蓄積手段106の内容を変更して、削除要求された文
書が到着していない場合と等しい状態にする(ステップ3
614)。
【0173】なお、図36における初期処理は、前記図30
を用いて説明した初期処理と同一である。
【0174】また、図36における文書毎前処理は、前記
図31を用いて説明した文書毎前処理と同一である。
【0175】また、図36における抽出・動作記述解釈処
理は、前記図34を用いて説明した抽出・動作記述解釈処
理と同一である。
【0176】また、図36における文書毎後処理は、前記
図32を用いて説明した文書毎後処理と同一である。
【0177】また、図36における終了時処理は、前記図
33を用いて説明した終了時処理と同一である。
【0178】
【実施例】次に、本発明の第3の実施の形態の実施例と
して、図3および図23、図30、図31、図32、図33、図3
4、図36の構成による方式の動作を、第2の形態の実施
例に用いた例と同様の例で説明する。
【0179】ただし、 1.構造化文書901が到着 2.構造化文書902が到着 3.構造化文書901の削除要求が到着 4.さらに別の構造化文書が到着 の順番で、入力文書や要求が到着するものとする。
【0180】まず、構造化文書901および構造化文書902
が順次到着すると、第2の実施の形態の説明の場合と同
様に処理が行われ、その結果、動作記述解釈手段107が
内部で管理する変数totalの値は3となり、また、動作
記述解釈手段107が内部で管理する変数tableの内容は、 <表要素> <論文題名> ××に関する研究 </論文題名> <著者人数> 2 </著者人数> </表要素> <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> となる。また、文書蓄積手段103には、部分構造が、抽
出した構造化文書毎に格納されており、 構造化文書901から抽出した部分構造 編集箇所記述1の1つめの引用指定子と対応する 部分構造 <題名> ××に関する研究 </題名> 編集箇所記述2の1つめの引用指定子と対応する 部分構造 <氏名> ○× 太郎 </氏名> <氏名> ×○ 花子 </氏名> 構造化文書902から抽出した部分構造 編集箇所記述1の1つめの引用指定子と対応する 部分構造 <題名> ○○に関する研究 </題名> 編集箇所記述2の1つめの引用指定子と対応する 部分構造 <氏名> ○○ 次郎 </氏名> となっている。
【0181】次に、構造化文書901の削除要求が到着す
ると(ステップ3603)、入力文書削除要求受信手段118が
文書編集処理実行手段104および動作記述解釈手段107
に、前記削除要求を通知する。前記削除要求を受けとっ
た文書編集処理実行手段104は、前記文書蓄積手段103か
ら、入力文書901に関する部分構造を削除し、文書蓄積
手段103の内容は、 構造化文書902から抽出した部分構造 編集箇所記述1の1つめの引用指定子と対応する 部分構造 <題名> ○○に関する研究 </題名> 編集箇所記述2の1つめの引用指定子と対応する 部分構造 <氏名> ○○ 次郎 </氏名> となる。また、動作記述解釈手段107は、入力文書削除
要求受信手段118から削除要求を受けとり、かつ、文書
編集処理実行手段104から前記部分構造の削除を通知さ
れると、削除された文書が到着していない場合と等しい
状態とするため、動作記述解釈手段107が内部で管理す
る変数totalの値から2を減じて1とし、また、動作記
述解釈手段107が内部で管理する変数tableの内容の一部
を削除して、変数tableの内容を、 <表要素> <論文題名> ○○に関する研究 </論文題名> <著者人数> 1 </著者人数> </表要素> とする。
【0182】以後、さらに別の入力文書が到着する度
に、第2の実施の形態の説明の場合と同様の処理が行わ
れ、全ての入力文書が到着すると、終了時処理が実行さ
れて(ステップ3611)、出力文書蓄積手段106に一覧表C
が格納され、文書出力手段105が、前記一覧表Cを出力
する(ステップ3612)。
【0183】なお、前記例では、構造化文書の到着を待
つべきと判断した場合には、終了時処理の実行(ステッ
プ3611)および文書出力処理の実行(ステップ3612)は行
われないが、1つの文書に対する処理が完了する度に、
文書毎後処理(ステップ3610)の後で、毎回、終了時処理
の実行(ステップ3611)および文書出力処理の実行(ステ
ップ3612)を行ってもよい。この場合には、それまでに
到着した文書に関して集計した結果が一覧表Cとして毎
回出力される。例えば、前記の例で、 1.構造化文書901が到着 2.構造化文書902が到着 3.構造化文書901の削除要求が到着 の順番に入力文書や要求が到着した場合には、図39に示
すような一覧表Cが、出力文書3901、3902、3903の順に
得られる。
【0184】また、前記削除要求を受けとった場合の動
作記述解釈手段107の処理は、動作記述解釈手段107が内
部で管理する変数などから、削除要求された文書に関す
る部分を削除する方法の他に、動作記述解釈手段107が
内部で管理する変数などの内容を全て破棄した上で、削
除要求のあった文書に関する部分構造の削除された文書
蓄積手段103をもとに、今まで到着した文書が再び同一
順序で到着したかのように全体処理を実行して、削除要
求された文書が到着していない場合と等しい状態にして
もよい。
【0185】なお、以上の実施例で説明した例におい
て、文書蓄積手段103は、例えば、図4に示すように、
各引用指定子に対応する部分構造が、引用指定子毎に、
マッチが成立した順に並べたデータをメモリ上もしくは
ディスク上などに蓄積したデータベースとして実現す
る。もしくは、文書蓄積手段103は、例えば、図5に示
すように、抽出した構造化文書毎に部分構造を分け、さ
らに、引用指定子毎に分けて格納されていてもよい。
【0186】また、文書処理記述手段102は、例えば、
図6に示すように、編集箇所記述1つ1つを別々の格納
領域に格納し、メモリ上もしくはディスク上などに蓄積
したデータベースとして実現する。もしくは、文書処理
記述手段102は、例えば、図7に示すように、編集箇所
記述と動作記述の組からなる編集処理記述1つ1つを別
々の格納領域に格納して構成してもよい。
【0187】また、動作記述解釈手段107は、独自の動
作記述を解釈して実行する構成の他に、一般に良く知ら
れているプログラミング言語を動作記述とし、前記プロ
グラミング言語のインタプリタを利用することも可能で
ある。
【0188】また、編集箇所記述は、実施例で用いた記
号によって記述したものでなくとも、記号と編集箇所記
述の各構成要素との対応が明確であれば、本発明は適用
可能である。さらに、実施例では、編集箇所記述を記号
を用いて表現したが、編集箇所記述を図形によって表現
することもでき、この場合も、本発明は適用可能であ
る。
【0189】また、本実施の形態では、SGML形式の
構造化文書を例として用いたが、本発明は、他の形式の
構造化文書に対しても適用可能である。文書の構造を表
現する手段は、SGML形式などのように、特殊な意味
を持たせた文字列(タグ)でなく、四角などの図形や色
などでもよい。さらに、本発明は、入力文書が、特別な
文字や記号で構造が表現されている文書でなくとも、例
えば、記述内容などから構造化できる文書であれば、入
力手段が文書の構造を解釈して、前記例と同様に編集処
理することができる。出力文書も、特別な文字や記号で
構造が表現されている文書に限られているわけではな
く、例えば、「文書修正手段によって全てのタグを削除
してから出力文書蓄積手段に出力文書を格納する」とい
った動作記述を与えることにより、構造を表現する特別
な文字や記号のない文書を出力することができる。さら
に、構造化文書が、参照ポインタによってネットワーク
状に接続された複数の構造体の集合、あるいは、参照ポ
インタによってネットワーク状に接続された複数の文書
の集合として構成されていても、本発明は適用可能であ
る。
【0190】また、実施例では、読み込む文書も出力す
る文書も同一のSGML形式である例を用いたが、本発
明は、入力文書と出力文書の記述形式が異なる場合でも
適用可能である。
【0191】また、本発明では、入力文書の構造を表現
する手段(タグなど)を識別するための最小限の規約
(例えば、SGML形式の場合には、構造は開始タグと
終了タグで囲むことによって表現し、開始タグは<で始
まり>で終る文字列であり、終了タグは</で始まり>
で終る文字列である、といった文書構造の表現形式や、
省略可能なタグなど)が与えられていれば十分であり、
本発明を構成するいずれの処理も、構造化文書を解釈す
るための構造定義(タグの意味のある構成を表す文法定
義など)を必要としない。すなわち、(1)構造定義が
あいまいな構造化文書を入力あるいは出力とする場合
や、(2)構造定義が繁雑に変更される構造化文書を入
力あるいは出力とする場合、あるいは、前記「発明の属
する技術分野」で説明した利用を目的とするシステムを
設計あるいは作成あるいは運用する際に、(3)構造定
義を設計する作業や、作成する作業や、保守する作業を
省くと、システム構築や運用のための工数が著しく効率
化される場合、などにおいて、本発明の文書編集方式
は、構造定義の設計や作成や保守などの作業負担を減ら
すことができるという効果もある。
【0192】また逆に、構造化文書入力手段101や文書
出力手段105で、入力文書や出力文書の文書構造のチェ
ックを行ってもよい。
【0193】
【発明の効果】以上述べたように、本発明には、例えば
前記編集箇所記述Aのように、1つのパターンに複数の
抽出箇所を指定することができ、しかも、例えば、部分
構造の並びの順番という形で、各引用指定子に対応する
部分構造の間のつながりを維持して部分構造を抽出する
ことができ、さらに、構造を分解する処理を特別に用意
することなく、例えば前記加工方法Aのように、抽出し
た部分構造を、引用指定子毎に別々に扱うことができる
という効果がある。
【0194】また、例えば、第1の実施の形態の実施例
2として示したように、本発明には、順不同の並列関係
を表すAND接続子を記述し、また、処理することがで
きるため、SGMLなどの形式で記述された構造化文書
を扱う場合には、入力文書から抽出する部分構造を指定
する編集箇所記述が簡潔に記述できるという効果があ
る。
【0195】また、本発明には、用途や要求に応じたマ
ッチの実行方式を選択することにより、処理速度の高速
化、使用する作業領域の大きさなどの要求にこたえるこ
とができるという効果もある。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成図である。
【図2】本発明の第2の実施の形態の構成図である。
【図3】本発明の第3の実施の形態の構成図である。
【図4】本発明の文書蓄積手段の構成の1つを示す説明
図である。
【図5】本発明の文書蓄積手段の構成の1つを示す説明
図である。
【図6】本発明の文書処理記述手段の構成の1つを示す
説明図である。
【図7】本発明の文書処理記述手段の構成の1つを示す
説明図である。
【図8】本発明の文書編集方式の利用例の1つを示す説
明図である。
【図9】本発明の文書編集方式の入力文書の一例を示す
説明図である。
【図10】本発明の文書編集方式の出力文書の一例を示
す説明図である。
【図11】従来の文書編集方式の動作の一例を示す説明
図である。
【図12】従来の文書編集方式の動作の一例を示す説明
図である。
【図13】本発明の文書タグのマッチの一例を示す説明
図である。
【図14】本発明の文書文字パターンのマッチの一例を
示す説明図である。
【図15】本発明のワイルドカードタグのマッチの一例
を示す説明図である。
【図16】本発明の否定指定子の一例を示す説明図であ
る。
【図17】本発明の引用指定子の一例を示す説明図であ
る。
【図18】本発明の順序接続子の一例を示す説明図であ
る。
【図19】本発明の階層接続子の一例を示す説明図であ
る。
【図20】本発明のAND接続子の一例を示す説明図で
ある。
【図21】本発明のOR接続子の一例を示す説明図であ
る。
【図22】本発明の第1の実施の形態の全体処理動作を
示す流れ図である。
【図23】本発明の方式の抽出処理の一例を示す流れ図
である。
【図24】本発明の方式の抽出処理の一例を示す流れ図
である。
【図25】本発明の方式のマッチ処理の一例を示す流れ
図である。
【図26】本発明の文書編集方式の利用例の1つを示す
説明図である。
【図27】本発明の文書編集方式の入力文書および出力
文書の一例を示す説明図である。
【図28】本発明の文書編集方式の入力文書の一例を示
す説明図である。
【図29】本発明の第2の実施の形態の全体処理動作を
示す流れ図である。
【図30】本発明の方式の初期処理の一例を示す流れ図
である。
【図31】本発明の方式の文書毎前処理の一例を示す流
れ図である。
【図32】本発明の方式の文書毎後処理の一例を示す流
れ図である。
【図33】本発明の方式の終了時処理の一例を示す流れ
図である。
【図34】本発明の方式の抽出・動作記述解釈処理の一
例を示す流れ図である。
【図35】本発明の方式の動作記述解釈処理の一例を示
す流れ図である。
【図36】本発明の第3の実施の形態の全体処理動作を
示す流れ図である。
【図37】本発明の文書編集方式の利用例の1つを示す
説明図である。
【図38】本発明の文書編集方式の出力文書の一例を示
す説明図である。
【図39】本発明の文書編集方式の出力文書の一例を示
す説明図である。
【符号の説明】
101 構造化文書入力手段 102 文書処理記述手段 103 文書蓄積手段 104 文書編集処理実行手段 105 文書出力手段 106 出力文書蓄積手段 107 動作記述解釈手段 108 文書毎前処理記述手段 109 文書毎後処理記述手段 110 文書毎前処理実行手段 111 文書毎後処理実行手段 112 初期処理記述手段 113 終了時処理記述手段 114 初期処理実行手段 115 終了時処理実行手段 116 文書修正手段 117 文書ソート手段 118 入力文書削除要求受信手段 801、802、2601、2602、3701、3702 入力文書 901、902、1302、1402、1502、1602、1702、1802、190
2、2002、2102、2701、2702、2801 構造化文書 803、2603、3703 文書編集方式 804、1101、1201、2604、2703、3704、3901、3902、390
3 出力文書 1102、1103 部分構造 1202 部分文書 1301、1401、1501、1601、1701、1801、1901、2001、21
01 編集箇所記述
フロントページの続き (56)参考文献 特開 平7−56908(JP,A) 特開 平5−135054(JP,A) 原、宮澤、根岸,「学術情報センター における全文データベース検索サービ ス」,情報処理学会研究報告,Vol. 91,No.41,1991年5月21日,91−I S−34−2 (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/30 JICSTファイル(JOIS)

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】 1つ以上の構造化文書を順次読み込む構
    造化文書入力手段と、 前記構造化文書入力手段の読み込んだ入力文書の一部分
    である部分構造を指定する、文書タグ、文書文字パター
    ン、否定指定子、引用指定子、順序接続子、階層接続
    子、括弧によって構成される編集箇所記述要素を、AN
    D接続子、OR接続子、括弧で結合した編集箇所記述が
    1つ以上記述されている文書処理記述手段と、 前記部分構造を、前記文書処理記述手段に記述された編
    集箇所記述中の引用指定子毎に分け、かつ、前記入力文
    書と前記編集箇所記述とのマッチが成立した順に蓄積す
    る文書蓄積手段と、 前記文書処理記述手段から編集箇所記述を取り出し、入
    力文書中の着目する部分構造を切り替えながら、前記編
    集箇所記述を構成する各編集箇所記述要素と入力文書と
    のマッチを試み、前記編集箇所記述中に順序接続子があ
    る場合には、順序接続子の直前の編集箇所記述要素とマ
    ッチした、前記入力文書中の文書構造の後に並んでいる
    構造を新たに着目する部分構造として、前記順序接続子
    の次以降に並んでいる編集箇所記述要素とのマッチを試
    み、前記編集箇所記述中に階層接続子がある場合には、
    階層接続子の直前の編集箇所記述要素とマッチした、前
    記入力文書中の文書構造の内側の部分構造を新たに着目
    する部分構造として、前記階層接続子の次以降に並んで
    いる編集箇所記述要素とのマッチを試み、さらに、マッ
    チが成立した前記編集箇所記述中に引用指定子が記述さ
    れている場合には、前記引用指定子に対応する部分構造
    を前記文書蓄積手段に蓄積し、また、前記編集箇所記述
    中のAND接続子で結合された編集箇所記述要素の少な
    くとも1つのマッチが成立しない場合には、前記AND
    接続子で結合された各編集箇所記述要素に対応する部分
    構造を前記文書蓄積手段から削除し、また、前記編集箇
    所記述中のOR接続子で結合された編集箇所記述要素の
    どのマッチも成立しない場合には、前記OR接続子で結
    合された各編集箇所記述要素に対応する部分構造を前記
    文書蓄積手段から削除して抽出処理を行う文書編集処理
    実行手段と、 前記文書蓄積手段に蓄積された文書をそのまま、あるい
    は加工して出力する文書出力手段とを有することを特徴
    とする文書編集方式。
  2. 【請求項2】 1つ以上の構造化文書を順次読み込む構
    造化文書入力手段と、 前記構造化文書入力手段の読み込んだ入力文書の一部分
    である部分構造を指定する、文書タグ、文書文字パター
    ン、ワイルドカードタグ、否定指定子、引用指定子、順
    序接続子、階層接続子、括弧によって構成される編集箇
    所記述要素を、AND接続子、OR接続子、括弧で結合
    した編集箇所記述が1つ以上記述されている文書処理記
    述手段と、 前記部分構造を、前記文書処理記述手段に記述された編
    集箇所記述中の引用指定子毎に分け、かつ、前記入力文
    書と前記編集箇所記述とのマッチが成立した順に蓄積す
    る文書蓄積手段と、 前記文書処理記述手段から編集箇所記述を取り出し、入
    力文書中の着目する部分構造を切り替えながら、前記編
    集箇所記述を構成する各編集箇所記述要素と入力文書と
    のマッチを試み、前記編集箇所記述中に順序接続子があ
    る場合には、順序接続子の直前の編集箇所記述要素とマ
    ッチした、前記入力文書中の文書構造の後に並んでいる
    構造を新たに着目する部分構造として、前記順序接続子
    の次以降に並んでいる編集箇所記述要素とのマッチを試
    み、前記編集箇所記述中に階層接続子がある場合には、
    階層接続子の直前の編集箇所記述要素とマッチした、前
    記入力文書中の文書構造の内側の部分構造を新たに着目
    する部分構造として、前記階層接続子の次以降に並んで
    いる編集箇所記述要素とのマッチを試み、さらに、マッ
    チが成立した前記編集箇所記述中に引用指定子が記述さ
    れている場合には、前記引用指定子に対応する部分構造
    を前記文書蓄積手段に蓄積し、また、前記編集箇所記述
    中のAND接続子で結合された編集箇所記述要素の少な
    くとも1つのマッチが成立しない場合には、前記AND
    接続子で結合された各編集箇所記述要素に対応する部分
    構造を前記文書蓄積手段から削除し、また、前記編集箇
    所記述中のOR接続子で結合された編集箇所記述要素の
    どのマッチも成立しない場合には、前記OR接続子で結
    合された各編集箇所記述要素に対応する部分構造を前記
    文書蓄積手段から削除して抽出処理を行う文書編集処理
    実行手段と、 前記文書蓄積手段に蓄積された文書をそのまま、あるい
    は加工して出力する文書出力手段とを有することを特徴
    とする文書編集方式。
  3. 【請求項3】 前記文書処理記述手段は、前記文書編集
    処理実行手段の前記抽出処理の際に実行する動作を記述
    した動作記述を前記編集箇所記述に対応付けて記述した
    編集処理記述が1つ以上記述され、 前記文書編集処理実行手段は、前記抽出処理を実行し
    て、前記文書蓄積手段中に残った抽出した部分構造と前
    記動作記述とを動作記述解釈手段へ通知し、 前記文書出力手段は、出力文書蓄積手段に蓄積された構
    造化文書や部分構造をそのまま、あるいは加工して出力
    し、 構造化文書や部分構造を蓄積する出力文書蓄積手段と、 前記文書編集処理実行手段から通知された前記動作記述
    を解釈し、文書の追加、文書の結合、文書数のカウント
    などの編集処理を実行して、構造化文書や部分構造を前
    記出力文書蓄積手段に蓄積する動作記述解釈手段とをさ
    らに有することを特徴とする請求項1または2記載の文
    書編集方式。
  4. 【請求項4】 前記読み込まれた各文書に対しての前記
    抽出処理を開始する前に毎回実行する動作を記述した文
    書毎前処理記述手段と、 前記読み込まれた各文書に対しての前記編集処理が完了
    する度に毎回実行する動作を記述した文書毎後処理記述
    手段と、 前記読み込まれた各文書に対しての前記抽出処理が行わ
    れる前に、毎回、前記文書毎前処理記述手段に記述され
    た動作記述を前記動作記述解釈手段へ通知する文書毎前
    処理実行手段と、 前記読み込まれた各文書に対しての前記編集処理が完了
    する度に、毎回、前記文書毎後処理記述手段に記述され
    た動作記述を前記動作記述解釈手段へ通知する文書毎後
    処理実行手段とをさらに有することを特徴とする請求項
    記載の文書編集方式。
  5. 【請求項5】 前記構造化文書入力手段が最初の文書を
    読み込む前に実行する動作を記述した初期処理記述手段
    と、 前記読み込まれた全ての文書に対する前記抽出処理およ
    び前記編集処理が完了した後に実行する動作を記述した
    終了時処理記述手段と、 前記構造化文書入力手段が最初の文書を読み込む前に、
    前記初期処理記述手段に記述された動作記述を前記動作
    記述解釈手段へ通知する初期処理実行手段と、 前記読み込まれた全ての文書に対する前記抽出処理およ
    び前記編集処理が完了した後に、前記終了処理記述手段
    に記述された動作記述を前記動作記述解釈手段へ通知す
    る終了時処理実行手段とをさらに有することを特徴とす
    請求項3または4記載の文書編集方式。
  6. 【請求項6】 構造化文書の構造名(以降、タグ名と呼
    ぶ)変更指示を受けた場合には、指定された文書中の指
    定されたタグ名を指定された別のタグ名に置き換え、ま
    た、構造削除指示を受けた場合には、指定された文書中
    の指定されたタグ名から始まる構造を削除し、また、文
    字列変更指示を受けた場合には、指定された文書中の指
    定された文字列を指定された別の文字列に置き換え、ま
    た、文字列削除指示を受けた場合には、指定された文書
    中の指定された文字列を削除する文書修正手段をさらに
    有し、 前記動作記述解釈手段は、動作記述の解釈に応じて文書
    修正手段への指示を含む編集処理を実行することを特徴
    とする請求項3、4または5記載の文書編集方式。
  7. 【請求項7】 指定された構造化文書や部分構造を指定
    されたキーに従ってソートする文書ソート手段をさらに
    有し、 前記動作記述解釈手段は、動作記述の解釈に応じて文書
    ソート手段への指示を含む編集処理を実行することを特
    徴とする請求項3、4、5または6記載の文書編集方
    式。
  8. 【請求項8】 前記構造化文書入力手段は、構造化文書
    を読み込む際に文書構造をチェックし、 前記文書出力手段は、文書を出力する際に文書構造をチ
    ェックすることを特徴とする請求項3、4、5、6また
    は7記載の文書編集方式。
  9. 【請求項9】 前記文書蓄積手段は、抽出した構造化文
    書毎に部分構造を分け、さらに前記文書処理記述手段に
    記述された編集箇所記述中の引用指定子毎に分けて蓄積
    することを特徴とする請求項3、4、5、6、7または
    記載の文書編集方式。
  10. 【請求項10】 前記読み込まれた文書の中の1つもし
    くは複数の文書に対する削除要求を受け付け、前記削除
    要求を前記文書編集処理実行手段および前記動作記述解
    釈手段に通知する入力文書削除要求受信手段をさらに有
    し、 前記文書編集処理実行手段は、前記入力文書削除要求受
    信手段から削除要求があった場合には、前記削除要求に
    よって指定された入力文書に関する部分構造を前記文書
    蓄積手段から削除し、 前記動作記述解釈手段は、前記入力文書削除要求受信手
    段から削除要求があった場合には、前記削除要求によっ
    て指定された入力文書に関する部分構造を前記出力文書
    蓄積手段から削除することを特徴とする請求項9記載の
    文書編集方式。
  11. 【請求項11】 前記文書編集処理実行手段は、前記読
    み込まれた各文書と前記各編集箇所記述要素とのマッチ
    処理を行う際に、前記文書の任意の部分構造を始点とし
    て前記編集箇所記述要素とマッチする全ての部分構造を
    求めて前記抽出処理を実行することを特徴とする請求項
    1、2、3、4、5、6、7、8、9または10記載の
    文書編集方式。
  12. 【請求項12】 前記文書編集処理実行手段は、前記読
    み込まれた各文書と前記各編集箇所記述要素とのマッチ
    処理を行う際に、前記文書の任意の部分構造を始点とし
    て前記編集箇所記述要素とマッチする最初の部分構造を
    求めて前記抽出処理を実行することを特徴とする請求項
    1、2、3、4、5、6、7、8、9または10記載の
    文書編集方式。
  13. 【請求項13】 前記文書編集処理実行手段は、前記読
    み込まれた各文書と前記各編集箇所記述要素とのマッチ
    処理を行う際に、前記文書の任意の部分構造を始点とし
    て前記編集箇所記述要素とマッチする最後の部分構造を
    求めて前記抽出処理を実行することを特徴とする請求項
    1、2、3、4、5、6、7、8、9または10記載の
    文書編集方式。
  14. 【請求項14】 前記文書編集処理実行手段は、前記読
    み込まれた各文書と前記各編集箇所記述要素とのマッチ
    処理を行う際に、前記文書の任意の部分構造を始点とし
    て前記編集箇所記述要素とマッチする部分構造のうち、
    包含関係にある部分構造は最も外側の部分構造を選択し
    て前記抽出処理を実行することを特徴とする請求項1、
    2、3、4、5、6、7、8、9または10記載の文書
    編集方式。
  15. 【請求項15】 前記文書編集処理実行手段は、前記読
    み込まれた各文書と前記各編集箇所記述要素とのマッチ
    処理を行う際に、前記文書の任意の部分構造を始点とし
    て前記編集箇所記述要素とマッチする部分構造のうち、
    包含関係にある部分構造は最も内側の部分構造を選択し
    て前記抽出処理を実行することを特徴とする請求項1、
    2、3、4、5、6、7、8、9または10記載の文書
    編集方式。
  16. 【請求項16】 前記構造化文書入力手段は、入力文書
    が与えられる度に読み込むことを特徴とする請求項1、
    2、3、4、5、6、7、8、9、10、11、12、
    13、14または15記載の文書編集方式。
  17. 【請求項17】 前記文書出力手段は、全ての入力文書
    に対する文書編集処理が完了した後に出力処理を行うこ
    とを特徴とする請求項1、2、3、4、5、6、7、
    8、9、10、11、12、13、14、15または1
    記載の文書編集方式。
  18. 【請求項18】 前記文書出力手段は、1つの入力文書
    に対する文書編集処理が完了する度に出力処理を行うこ
    とを特徴とする請求項1、2、3、4、5、6、7、
    8、9、10、11、12、13、14、15または1
    記載の文書編集方式。
JP34858696A 1996-12-26 1996-12-26 文書編集方式 Expired - Fee Related JP3156613B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34858696A JP3156613B2 (ja) 1996-12-26 1996-12-26 文書編集方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34858696A JP3156613B2 (ja) 1996-12-26 1996-12-26 文書編集方式

Publications (2)

Publication Number Publication Date
JPH10187725A JPH10187725A (ja) 1998-07-21
JP3156613B2 true JP3156613B2 (ja) 2001-04-16

Family

ID=18398019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34858696A Expired - Fee Related JP3156613B2 (ja) 1996-12-26 1996-12-26 文書編集方式

Country Status (1)

Country Link
JP (1) JP3156613B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6647532B1 (en) * 1998-10-29 2003-11-11 Dell Usa L.P. Built-in automatic customer identifier when connecting to a vendor website
JP2001249928A (ja) * 2000-03-03 2001-09-14 Nec Corp 識別子付き階層構造データの簡易入力システム及び方法並びに記録媒体
WO2005109241A1 (ja) * 2004-05-11 2005-11-17 Atl Systems, Inc. データ構造、構造化データ管理システム及び構造化データ管理方法並びに構造化データ管理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02130673A (ja) * 1988-11-10 1990-05-18 Chubu Nippon Denki Software Kk データ検索方式
JPH06309365A (ja) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd 文書処理装置
JPH0756908A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 文書処理装置
JPH08339370A (ja) * 1995-06-14 1996-12-24 Fuji Xerox Co Ltd 文書表示装置および文書表示方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
原、宮澤、根岸,「学術情報センターにおける全文データベース検索サービス」,情報処理学会研究報告,Vol.91,No.41,1991年5月21日,91−IS−34−2

Also Published As

Publication number Publication date
JPH10187725A (ja) 1998-07-21

Similar Documents

Publication Publication Date Title
Green et al. Processing XML streams with deterministic automata and stream indexes
US6853992B2 (en) Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents
US6745202B2 (en) Structured-text cataloging method, structured-text searching method, and portable medium used in the methods
JP4657432B2 (ja) 階層構造の構造化文書を変換する装置
JP3842577B2 (ja) 構造化文書検索方法および構造化文書検索装置およびプログラム
JP4141556B2 (ja) 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
US5752021A (en) Document database management apparatus capable of conversion between retrieval formulae for different schemata
WO2009063925A1 (ja) 文書管理・検索システムおよび文書の管理・検索方法
WO2006036487A2 (en) System and method for management of data repositories
Hogue Tree pattern inference and matching for wrapper induction on the World Wide Web
JPH11242676A (ja) 構造化文書登録方法、検索方法、およびそれに用いられる可搬型媒体
JP2008052662A (ja) 構造化文書管理システム及びプログラム
JPH08190542A (ja) 文書データベース管理装置及び方法
JP3156613B2 (ja) 文書編集方式
JP4348357B2 (ja) 関連文書表示装置
CN111339042A (zh) 数据的操作处理方法、系统及调度服务器
JP3842576B2 (ja) 構造化文書編集方法及び構造化文書編集システム
JP2002202973A (ja) 構造化文書管理装置
JP3427679B2 (ja) 単語検索装置及び単語検索プログラムを記録したコンピュータ読取り可能な記録媒体
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
Enhong et al. Semi-structured data extraction and schema knowledge mining
JP3842574B2 (ja) 情報抽出方法および構造化文書管理装置およびプログラム
JP4242701B2 (ja) 格納検索装置、格納検索プログラム、および格納検索プログラム記録媒体
LU et al. TJFast: Efficient processing of XML twig pattern matching
JPH09305619A (ja) 階層インデックス検索装置、及び文書検索方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080209

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090209

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100209

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100209

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120209

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120209

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130209

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130209

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140209

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees