JP2991142B2 - 動的部品化機能付き構造化文書データベースシステム - Google Patents

動的部品化機能付き構造化文書データベースシステム

Info

Publication number
JP2991142B2
JP2991142B2 JP8352636A JP35263696A JP2991142B2 JP 2991142 B2 JP2991142 B2 JP 2991142B2 JP 8352636 A JP8352636 A JP 8352636A JP 35263696 A JP35263696 A JP 35263696A JP 2991142 B2 JP2991142 B2 JP 2991142B2
Authority
JP
Japan
Prior art keywords
document
database
structured
component
structured document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8352636A
Other languages
English (en)
Other versions
JPH10171794A (ja
Inventor
みさ 波内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP8352636A priority Critical patent/JP2991142B2/ja
Publication of JPH10171794A publication Critical patent/JPH10171794A/ja
Application granted granted Critical
Publication of JP2991142B2 publication Critical patent/JP2991142B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、構造化文書データ
ベースシステムに関し、特に、動的に構造化文書の文書
要素を部品としてデータベースに登録するシステムに関
する。
【0002】
【従来の技術】従来、SGML(Standard Generalize
d Markup Language)などの規格に則った構造化文書
を蓄積し、その構造情報を利用して、任意の文書の一部
分を検索する機能を備えた構造化文書データベースが提
案され、且つ実現されている。
【0003】このような機能を持つ構造化文書データベ
ースを実現するための方法の一つとして、文書中の全て
の文字列に対してインデックスを作成し、複数の文書中
から与えられた文字列を含む文書、および、当該文字列
の出現位置を高速に検索可能とする全文検索エンジンを
用いる方法が知られている。
【0004】この従来の方法では、構造化文書全体が、
一つのまとまりとして、データベースあるいは文書リポ
ジトリに蓄積される。そして、文書中のある文書要素に
対して検索要求が発行されると、構造化文書中に埋め込
まれた構造情報を表すタグをインデックス・キーとし
て、文書およびその文書の出現位置を検索し、検索され
たタグの出現位置を起点として、文書要素を切り出すこ
とにより、目的の文書要素を提供する。
【0005】しかし、この従来の方法においては、デー
タベースあるいは文書リポジトリ中には、文書全体のみ
が蓄積されており、このため、検索要求が発行される度
に、文書要素を切り出す処理が行われることになり、例
えば特定の文書要素が頻繁に検索される場合には、逆に
効率が悪くなる。また、特定の文書要素を複数の文書で
共有し、文書部品としての再利用性を高めることも困難
である。
【0006】文書要素を検索する別の従来の方法とし
て、例えば特開平5−101054号公報には、文書を
部品化してデータベースに格納し、文書作成時に部品化
された文書より文書を自動的に生成できるようにした文
書作成支援システムが提案されている。この従来のシス
テムは、構造化文書を予め文書要素単位に分解して蓄積
するものであり、文書要素は汎用のリレーショナル・デ
ータベースやオブジェクト指向データベース中の一デー
タとして格納され、データベースにおいて定義されてい
るフィールド名(オブジェクト指向データベースの場合
は、メンバ変数名)により、目的の文書要素を検索する
ことができる。また、文書要素を単位としてそれぞれ独
立して格納されるため、文書部品として複数の文書間で
共有し、再利用することも可能である。
【0007】しかしながら、ある文書要素の内側に他の
文書要素が含まれる場合、すなわち文書要素間に包含関
係を持つ場合には、これらに対応する文書部品が保持す
るテキスト内容が重複し、文書データベースで文書を格
納するために必要なメモリ容量が元の文書サイズよりも
大きくなってしまう。
【0008】また、文書要素がばらばらに分解されて格
納されているため、元の文書を取り出す場合や、複数の
文書要素をまとめて取り出す場合には、複数の文書要素
を再合成し、一つの文書にまとめ上げなければならな
い。
【0009】さらに、すべての文書要素を部品化した場
合、部品として再利用される可能性の低い、単語単位の
文書要素も部品として登録されることになり、その結
果、データベース中の部品の数が膨大になるばかりでな
く、本当に必要な文書部品を検索する際、不必要な部品
が多数存在することによって、検索効率が低下するとい
う可能性もある。
【0010】これに対して、文書要素の中で部品化する
ものを予め利用者が選択し、指定された文書要素だけを
部品化することにより、特定の文書部品だけを含んだデ
ータベースを構築するという方法も考えられる。この方
法によれば、ユーザが不必要と考える文書部品を排除す
ることができるので、文書部品の検索効率は良好とさ
れ、また元文書を復元する際にも、必要以上の再合成処
理を行わなくても済むことになる。
【0011】しかしながら、この方法では、構造化文書
データベースに対して文書を登録する場合に生成された
文書部品しか利用することができず、新たに文書部品と
しての必要性が認識された文書要素を部品化するために
は、データベースへの登録を手作業で行わなければなら
ず、最悪の場合には、文書全体を、再登録し直さなけれ
ばならない。
【0012】その他に、文書要素の部品化を行う処理
は、データベース中に格納されている文書の構造情報な
どを変更するなどの処理実行の負荷や、データベースの
内容変更のためのアクセス制限を伴う。このため、部品
化処理の実行中は、データベースに対する他の検索要求
が受け付けられなかったり、受け付けられた場合でも応
答時間が通常に比べて長くなることがある。
【0013】また、構造化文書データベースを運用して
いる計算機上で他のアプリケーションが実行される場
合、部品化処理の負荷の影響でそのアプリケーションの
実行が円滑に行われない場合もある。
【0014】
【発明が解決しようとする課題】このように、上記従来
の方法の問題点をまとめると下記記載のようなものとな
る。
【0015】第1の問題点は、構造化文書をデータベー
スに格納した時点で、全ての文書要素を部品として分解
して登録すると、利用者が必要としない部品が多数生成
される可能性があり、これにより、データベース・サイ
ズの増大、元文書の復元処理の繁雑化、更に検索効率低
下などという各種問題が生じる、ということである。
【0016】第2の問題点は、データベースへの登録時
にのみ文書要素の部品化処理を行うと、データベースを
利用している途中に、部品化の必要性が認識された文書
要素を部品化するためには、その文書全体の再登録が必
要になる場合がある、ということである。
【0017】第3の問題点は、文書要素の部品化を行う
処理が、他のデータベース・アクセス処理や他のアプリ
ケーションの実行を阻害する可能性がある、ということ
である。
【0018】したがって、本発明は、上記事情に鑑みて
なされたものであって、その目的は、文書要素の検索を
行う過程で再利用の可能性があるものを利用者が指定
し、これを分解してデータベース中に格納することによ
って文書部品としての柔軟な再利用を可能とし、それ以
外の文書要素は分解せずに保持することによって、上記
のような従来の構造化文書データベースの問題点を全て
解消するようにした構造化文書データベースシステムを
提供することにある。
【0019】本発明の別の目的は、文書要素が検索され
た時点で文書の部品化を行うかどうかの判断をユーザに
委ね、ユーザが部品化の必要性を認識した文書要素を動
的に部品化するようにした構造化文書データベースシス
テムを提供することにある。
【0020】本発明の更に別の目的は、文書要素の部品
化を実行する時刻を、ユーザの判断により、好ましくは
構造化文書データベースへのアクセスや他のアプリケー
ション実行の頻度が低い時間帯に設定することにより、
これらを阻害する可能性を可能な限り回避することがで
きる構造化文書データベースシステムを提供することに
ある。
【0021】
【課題を解決するための手段】前記目的を達成するた
め、本発明は、構造化文章の構造を解析した結果である
構造情報と、前記構造化文書本体と、前記構造化文書を
構成する文書要素を取り出した文書部品と、を格納する
構造化文書データベースと、利用者(ユーザ)がある文
書要素を検索するための条件を入力するためのユーザイ
ンタフェースと、前記構造化文書データベースに格納さ
れている構造情報を基に、ある文書要素を文書本体から
取り出す文書DB生成手段と、前記構造情報を基に、利
用者が指定した文書要素を検索し、目的の文書要素を、
前記文書部品、もしくは前記文書DB生成手段を利用し
て、前記構造化文書本体から所定の記憶領域に取り出す
文書部品アクセス手段と、を備え、目的の文書要素が前
記構造化文書データベース中に部品化されている場合に
は、部品中から迅速に文書要素を取り出す、ことを特徴
とする。
【0022】本発明の概要を以下に説明する。本発明
は、構造化文書をデータベースに登録した時点では文書
要素の部品化を行わず、データベースに対して検索要求
が発行された文書要素に対して、構造化文書データベー
スのユーザ自身がその文書要素の部品化を行うかどうか
を指定するための手段を備える。
【0023】また、本発明は、文書要素が検索された時
点でその文書要素の部品化を行うかどうかの判断をユー
ザから得、この判断を基に、動的に部品化処理を行う手
段を備えている。
【0024】さらに、本発明は、文書要素の部品化を行
う時刻をユーザ自身が指定することができる手段を有す
る。
【0025】
【発明の実施の形態】本発明の実施の形態について図面
を参照して以下に詳細に説明する。
【0026】
【実施の形態1】図1は、本発明の第1の実施の形態の
構成を機能ブロック図にて示したものである。図1を参
照すると、この実施の形態は、文書部品アクセス手段1
06と、文書DB(データベース)生成手段105と、
部品化方針定義手段102と、構造化文書データベース
107と、構造化文書データベース107にアクセスす
るためのユーザインタフェース101と、を含む。
【0027】文書部品アクセス手段106は、ユーザイ
ンタフェース101を通して利用者から要求された文書
部品110を構造化文書データベース107から検索
し、ユーザインタフェース101を通して返却する。
【0028】文書DB生成手段105は、部品化方針定
義手段102によって与えられる方針に従い、構造化文
書の構造情報109、構造化文書本体108、および、
文書要素を切り出して生成された文書部品110を、構
造化文書データベース107中に生成する。また文書D
B生成手段105は、文書部品アクセス手段106から
要求された文書要素を、構造化文書本体108より計算
機のメモリ111中に取り出し、これを、利用者からの
要求に対する処理結果として、ユーザインタフェース1
01を通して返却する。
【0029】部品化方針定義手段102は、部品化指定
手段103と、部品化処理実行時刻定義手段104と、
を有し、構造化文書の文書部品の生成方法を利用者が指
定するための手段を与えるものである。すなわち、利用
者は、検索した文書要素を部品としてデータベースに格
納するか否かについて、部品化指定手段103を利用し
て指定し、また部品化する場合には、その処理をいつ行
うかについて部品化処理実行時刻定義手段104を利用
して指定することができる。
【0030】構造化文書データベース107は、構造化
文書を構成する文書要素の順序関係、包含関係などの情
報を含む構造情報109と、構造化文書本体108、お
よび、文書部品110を蓄積する。
【0031】構造情報109は、文書要素ごとに生成さ
れ、構造を示すタグ名や、「章」、「節」などの文書構
造に対応する文書要素の場合には、好ましくは、その
「章名」、「節名」など、文書の内容のうち検索条件と
なり易いものを付随情報として格納する。また、文書要
素の構造情報として、対応する文書要素の、元の文書の
先頭からの開始位置のバイト数値を保持する。さらに、
文書要素が部品化されている場合、これに対応する構造
情報に部品が関連付けられる。
【0032】ユーザインタフェース101は、ディスプ
レイ、キーボード、マウスなどを持ち、利用者からデー
タベースへの検索要求を受け取ったり、データベースの
検索結果を利用者に提示する。
【0033】図2は、本発明の第1の実施の形態の処理
フローを説明するための流れ図である。図1および図2
を参照して、本発明の第1の実施の形態の動作について
以下に説明する。
【0034】ユーザインタフェース101を通して与え
られた利用者からのある文書要素の検索要求は、文書部
品アクセス手段106に伝達される。
【0035】文書部品アクセス手段106では、まず構
造化文書データベース107中の構造情報109を調
べ、目的の文書要素が既に部品化されているか否かの確
認を行う(ステップ202)。目的の文書要素が既に部
品として存在する場合には(ステップ202のYe
s)、構造化文書データベース107中の対応する部品
110を検索し、これをユーザインタフェース101を
通して利用者に返却する(ステップ207)。
【0036】一方、ステップ202において、目的の文
書要素の構造情報から対応する文書部品110が検索で
きなかった場合、文書部品アクセス手段106は、文書
DB生成手段105に対して文書要素の切り出しを要求
する。
【0037】文書DB生成手段105は、構造情報10
9中に保持されている、文書の先頭からの文書要素の位
置を示すバイト値を取り出し、構造化文書データベース
107中の構造化文書本体108の先頭からその値分を
計数して、目的の文書要素を取り出してメモリ111上
に格納し、ユーザインタフェース101を通して利用者
に返却する(ステップ203)。
【0038】次に文書DB生成手段105は、部品化方
針定義手段102を参照して、取り出された文書要素
を、部品として新たに構造化文書データベース107に
蓄積するかどうかの判断を行う(ステップ204)。
【0039】利用者によって部品化しないと定義されて
いる場合には、メモリ111に取り出されている文書要
素は廃棄する。
【0040】一方、メモリ111上に取り出された文書
要素を新たに部品として格納する旨が部品化指定手段1
03に定義されている場合には(ステップ204のYe
s)、さらに、どの時点で部品化処理を行うかを部品化
方針定義手段104に確認する(ステップ205)。
【0041】文書要素が検索され取り出されたその時点
で、部品化するよう定義されている場合には(ステップ
205のYes)、メモリ111に取り出されている文
書要素を基に、新たな部品を構造化文書データベース1
07中に生成し、これを文書の構造情報109中の対応
する文書要素の情報に関連付ける(ステップ206)。
【0042】一方、部品化処理を実行する時刻を指定さ
れている場合には(ステップ205のNo)、メモリ中
111に取り出された文書要素を、他のアプリケーショ
ンの負荷とならないように、一旦解放し、構造化文書デ
ータベース107の対応する構造情報109中に、部品
化予定である旨の印を付ける(ステップ209)。
【0043】そして文書DB生成手段105は、指定さ
れた時刻になると、構造情報109中に、部品化予定で
ある旨の印が付けられている文書要素を、再び構造化文
書本体108から切り出し、文書部品110として、構
造化文書データベース107中に生成して、構造化文書
データベース107を更新する(ステップ206)。
【0044】
【実施例】上記した実施の形態について更に詳細に説明
すべく、本発明の一実施例の動作を、図3、図4、図
5、及び図6を参照して詳細に説明する。
【0045】図3は、本発明の一実施例の動作の一例を
模式的に説明するための図である。なお、図3におい
て、ユーザインタフェース301、部品化方針定義手段
302、部品化指定手段303、部品化処理実行時刻定
義手段304、文書DB生成手段305、文書部品アク
セス手段306、構造化文書データベース307、メモ
リ311は、それぞれ、図1に示した要素(参照番号1
00番台)に対応したものであり、説明の重複を避ける
ため、上記実施の形態で既に説明した内容は省略する。
【0046】図3を参照すると、構造化文書データベー
ス307には、その文書要素が未だ1つも部品化されて
いない文書(構造化文書308)が登録されている。
【0047】このデータベース307に対して、「『S
GMLの歴史』という題名を持つsectionを検索せよ」
という命令がユーザインタフェース301を通して発行
されたとする。
【0048】まず文書部品アクセス手段306は、デー
タベース中の構造情報309を参照して、「section」
に該当する構造を検索し、対応する文書要素が「SGM
Lの歴史」という題名(<title>タグと</ti
tle>タグの間の題名)を持つものを確定する。
【0049】このとき、該当する文書要素が複数個あっ
ても構わない。複数個検索された場合には、以下の処理
を各々の文書要素に対して実施する。
【0050】図4は、本発明の一実施例における構造化
文書データベース中の構造情報の内容の一例を説明する
ための図である。図4を参照すると、この構造情報は、
「section」というタグ名に対応する文書要素に対して
生成されるもので、その文書要素固有の番号を、「要素
番号」欄に、その文書要素が他の文書要素中に包含され
ている場合には、含む側の文書要素の番号を「親要素」
欄に、反対に他の文書要素を包含する場合には、含まれ
る側の文書要素の番号を「子要素」欄に保持する。
【0051】図4に示す例では、番号「4」の文書要素
が番号「3」の文書要素に含まれ、さらに番号「4」の
文書要素は、番号「7」および「8」の2つの文書要素
を含むことを示している。
【0052】また、構造情報には、付随情報として、文
書要素の持つ題名「SGMLの歴史」を「題名」の欄に
持ち、元文書(構造化文書308参照)の先頭からのそ
の文書要素の開始位置を示す値「3,452バイト目」
を「開始位置」の欄に持つ。
【0053】文書部品アクセス手段306は、このよう
な情報を基に、該当する構造情報と対応する文書要素を
検索する。
【0054】次に、文書部品アクセス手段306は、検
索した構造情報から、それに対応する文書部品が既にデ
ータベース307中に存在するかどうかを確認する。
【0055】図3に示した例では、データベース307
中には、文書部品がまだ一つも生成されていないので、
この確認は失敗する。
【0056】その結果、文書部品アクセス手段306は
文書DB生成手段305を使って、該当する文書要素を
文書本体308からメモリ311中に切り出し、これを
ユーザインタフェース301を通してユーザに提示す
る。これで、ユーザの検索命令に対する処理は終了す
る。
【0057】その後、要求された文書要素をメモリ31
1に取り出した文書DB生成手段305では、当該文書
要素を文書部品としてデータベース307に新たに登録
するかどうかについて、部品化方針定義手段302に確
認する。
【0058】図5は、本発明の一実施例として、部品化
方針定義手段302のうち、部品化指定手段303およ
び部品化処理実行時刻定義手段30を使ってユーザによ
って設定された部品化方針の内容の一例を示す説明図で
ある。
【0059】図5に示す部品化方針の例では、「検索さ
れた文書要素を部品化する」(すなわち「部品化」が
「yes」)、および、「部品化は今すぐ行う」(すな
わち「時刻処理」が「now」)ことが設定されてい
る。
【0060】本発明の一実施例において、図5に示すよ
うな部品化方針が設定されている場合には、文書DB生
成手段305によってメモリ311中に取り出した文書
要素を部品としてデータベース307中に新規に登録
し、さらに構造情報309中の対応する箇所に部品情報
を登録する。
【0061】図6は、本発明の一実施例として、部品化
方針定義手段302の、図5とは異なる一例を示す説明
図である。図6に示す部品化方針では、「検索された文
書要素の部品化は、検索された時点でユーザに確認す
る」(「部品化」は「askuser」)、および、
「部品化時刻は、検索された時点でユーザに確認する」
(「時刻処理」は「ask user」)、ことが設定
されている。
【0062】この場合、システムは、ユーザインタフェ
ース301を通してユーザに部品化を行うかどうか、お
よび、部品化する場合それをいつ行うかの指定を要求す
る。
【0063】ユーザがこれらの値を入力すると、この設
定値に従い文書DB生成手段305が部品化処理を実行
する。
【0064】図10は、本発明の一実施例として、部品
化方針定義手段302にユーザによって設定された部品
化方針の内容の別の例を示す説明図である。図10に示
す部品化方針では、「検索された文書要素を部品化す
る」(すなわち「部品化」は「yes」)、および、
「部品化は1996年10月30日 23:00」に行
う(「処理時刻」は「1996/10/30 23:00」)、ことが
設定されている。
【0065】図11は、図10に示した部品化方針が与
えられた場合に、上記の同じ文書要素(「SGMLの歴
史」)に対するユーザからの要求に対し、該当する文書
要素を取り出してユーザに提示した後の、データベース
307中の構造情報309の中の対応する情報の一例を
示す図である。
【0066】図4に示した場合と比較し、図11に示す
構造情報においては、「部品化予定」の欄に印「○」が
付けられ、この文書要素が部品化予定であることを示し
ている点で異なる。この場合、指定された時刻「199
6年10月30日 23:00」(図10参照)になっ
た時点で、文書DB生成手段305により、構造情報3
09が参照され、「部品化予定」の欄に印が付けられて
いるものが検索される。
【0067】文書DB生成手段305では、検索された
構造情報に対応する文書要素を構造化文書本体308か
ら取り出し、それを基にデータベースに新たに部品を生
成する。
【0068】
【実施の形態2】次に、本発明の第2の実施の形態につ
いて説明する。図7は、本発明の第2の実施の形態の構
成をブロック図にて示したものである。
【0069】図7を参照すると、本発明の第2の実施の
形態は、図1と比較して、データベース中に部品化する
前の文書要素を格納する仮部品蓄積部712を有する点
で異なる。
【0070】仮部品蓄積部712は、ある文書要素に対
して検索が行われた時、文書DB生成手段705によっ
て元の文書中から切り出され、さらに部品化方針定義手
段702によって、文書部品として新たに構造化文書デ
ータベース中に生成されることが決定しているが、未だ
その部品化処理がなされていない文書要素を格納する。
【0071】図8は、本発明の第2の実施の形態の処理
フローを説明するための流れ図である。図7、及び図8
を参照して、本発明の第2の実施の形態の動作について
説明する。
【0072】図8において、ステップ801から80
5、807、808までに各処理は、図2に示した前記
第1の実施の形態の各ステップの動作と同一であるた
め、説明は省略する。
【0073】図1を参照して説明した前記第1の実施の
形態では、検索により取り出した文書要素を部品化する
ように設定されている場合でも(部品化方針の内容とし
て「部品化」が「yes」)、検索処理の行った直後に
は部品化処理は行わずに設定時刻になるまで待って処理
を行うよう指定されている場合には、文書DB生成手段
105において、一旦メモリ111に切り出された文書
要素は、そのまま解放され、指定された時刻に部品化処
理を行う時点で、再び元の文書から対応する文書要素を
メモリ111に切り出さなければならなかった。
【0074】本発明の第2の実施の形態では、部品化処
理を行う時刻が現在よりも後の場合、メモリ711中に
取り出されている文書要素を仮部品蓄積部712に移動
し(ステップ809)、部品として一時的に利用できる
ようにする。
【0075】そして、文書DB生成手段705は、指定
された部品化処理開始時刻になると(ステップ81
0)、仮部品蓄積部712から文書要素を取り出し、こ
れを基に文書部品をデータベース707中に生成して、
データベースを更新する。
【0076】
【実施例】上記した本発明の第2の実施の形態を更に詳
細に説明すべく、本発明の第2の実施例について以下に
詳細に説明する。
【0077】図9は、本発明の第2の実施例の動作の一
例を模式的に示す図である。図9を参照して、前記した
実施例の動作の説明と同様の状況を想定し、部品化方針
定義手段902において、図10に示すような設定がな
されているものとする。このとき、ユーザから指定され
た文書部品をユーザインタフェース901を使って返却
する処理までは、前記実施例の動作と同一であるので、
説明は省略する。
【0078】本発明の第2の実施例では、文書DB生成
手段905によって切り出された文書要素は、部品化処
理が実行される時刻「1996年10月30日 23:
00」まで仮部品蓄積部912に保持される。
【0079】そして、指定された時刻になり部品化処理
が開始されると、仮部品蓄積部912から既に切り出さ
れている文書要素を取り出し、これを基に部品をデータ
ベース中に生成する。
【0080】生成された文書部品910は、データベー
ス907中の対応する構造情報と関連付けられ、同じ文
書要素に対して、再び検索要求が発行された場合には、
部品化された文書要素910を迅速に取り出し、ユーザ
に提示することができるようになる。
【0081】本発明の第2の実施例は、部品化が決定し
ても設定された時刻までその部品化処理が行われない場
合に、文書DB生成手段905によって切り出された文
書要素を一時的に保存しておくことによって、部品化が
まだ行われていない時点で既に切り出されている文書要
素を利用することができる。
【0082】また、部品化処理を実行する場合に、仮部
品蓄積部912中に既に取り出されている文書要素を利
用することによって、長大な文書本体から文書要素を再
度切り出す処理を省略することができる。
【0083】
【発明の効果】以上説明したように、本発明によれば、
下記記載の効果を奏する。
【0084】本発明の第1の効果は、文書要素の検索を
行いながら、その中で再利用の可能性があるものを利用
者が指定し、これを分解してデータベース中に格納する
ことによって、文書部品としての柔軟な再利用性を可能
とし、指定された以外の文書要素は分解せずに保持する
ことによって、データベース・サイズの増大、元文書の
復元処理の繁雑化、検索効率低下などといった問題を、
利用者が予測可能な限り、回避できる、ということであ
る。
【0085】本発明の第2の効果は、文書要素の部品化
を実行する時刻を、ユーザの判断により、構造化文書デ
ータベースへのアクセスや他のアプリケーション実行の
頻度が低い時間帯に設定することを可能としたことによ
り、文書要素の部品化を行う処理が、データベースアク
セスを制限したり、他のアプリケーションの実行障害と
なる可能性を、利用者が予測可能な限り、回避できる、
ということである。
【図面の簡単な説明】
【図1】本発明の実施の形態の構成を示す機能ブロック
図である。
【図2】本発明の実施の形態の処理動作を説明するため
のフローチャートである。
【図3】本発明の一実施例を模式的に説明するための図
である。
【図4】本発明の一実施例を説明するための図であり、
構造化文書データベース中の構造情報の内容の一例を示
す説明図である。
【図5】本発明の一実施例を説明するための図であり、
部品化方針定義部中の設定の内容の一例を示す説明図で
ある。
【図6】本発明の一実施例を説明するための図であり、
部品化方針定義部中の設定の内容の一例を示す説明図で
ある。
【図7】本発明の別の実施の形態の構成を示す機能ブロ
ック図である。
【図8】本発明の別の実施の形態の処理動作を説明する
ためのフローチャートである。
【図9】本発明の別の実施例を模式的に説明するための
図である。
【図10】本発明の一実施例を説明するための図であ
り、部品化方針定義部中の設定の内容の一例を示す説明
図である。
【図11】本発明の一実施例を説明するための図であ
り、構造化文書データベース中の構造情報の内容の一例
を示す説明図である。
【符号の説明】
101、301、701、901 ユーザインタフェー
ス 102、302、702、902 部品化方針定義手段 103、303、703、903 部品化指定手段 104、304、704、904 部品化処理実行時刻
定義手段 105、305、705、905 文書DB生成手段 106、306、706、906 文書部品アクセス手
段 107、307、707、907 構造化文書データベ
ース 109、309、709、909 構造情報 110、310、710、910 文書部品 111、311、711、911 メモリ 712、912 仮部品蓄積部

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】構造化文章の構造を解析した結果である構
    造情報と、前記構造化文書本体と、前記構造化文書を構
    成する文書要素を取り出した文書部品と、を格納する構
    造化文書データベースと、 利用者(ユーザ)がある文書要素を検索するための条件
    を入力するためのユーザインタフェースと、 前記構造化文書データベースに格納されている構造情報
    を基に、ある文書要素を文書本体から取り出す文書DB
    生成手段と、 前記構造情報を基に、利用者が指定した文書要素を検索
    し、目的の文書要素を、前記文書部品、もしくは前記文
    書DB生成手段を利用して、前記構造化文書本体から所
    定の記憶領域に取り出す文書部品アクセス手段と、 を備え、 目的の文書要素が前記構造化文書データベース中に部品
    化されている場合には、部品中から迅速に文書要素を取
    り出す、ことを特徴とする構造化文書データベースシス
    テム。
  2. 【請求項2】請求項1記載の前記構造化文書データベー
    スシステムにおいて、 前記構造化文書の構成要素である文書要素を部品化する
    かどうかを利用者が設定するための部品化指定手段を備
    え、 ある文書要素にアクセスした後に、前記部品化指定手段
    を介して予め設定されている部品化方針に従って文書部
    品を部品化するかどうかを判定し、 部品化が指定されている場合にのみ、文書要素の部品化
    処理を実行する、ことを特徴とする構造化文書データベ
    ースシステム。
  3. 【請求項3】請求項2記載の構造化文書データベースシ
    ステムにおいて、 ある文書要素を部品化する時刻をユーザが設定する部品
    化処理実行時刻定義手段を備え、設定された時刻に前記
    文書DB生成手段によって文書要素の部品化処理を実行
    することにより、ユーザが設定した任意の時刻に部品化
    処理を行うことを可能としたことを特徴とする構造化文
    書データベースシステム。
  4. 【請求項4】構造化文書データベースに構造化文書の構
    成要素である文書要素を分解して部品として格納するに
    あたって、前記構造化文書の前記構造化文書データベー
    スへの登録時点での文書要素の部品化は行わず、前記構
    造化文書データベースに対して検索要求が発行された文
    書要素について、設定された部品化方針に基づき部品化
    の実行/非実行を制御する、ことを特徴とする構造化文
    書データベースシステム。
JP8352636A 1996-12-13 1996-12-13 動的部品化機能付き構造化文書データベースシステム Expired - Fee Related JP2991142B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8352636A JP2991142B2 (ja) 1996-12-13 1996-12-13 動的部品化機能付き構造化文書データベースシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8352636A JP2991142B2 (ja) 1996-12-13 1996-12-13 動的部品化機能付き構造化文書データベースシステム

Publications (2)

Publication Number Publication Date
JPH10171794A JPH10171794A (ja) 1998-06-26
JP2991142B2 true JP2991142B2 (ja) 1999-12-20

Family

ID=18425406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8352636A Expired - Fee Related JP2991142B2 (ja) 1996-12-13 1996-12-13 動的部品化機能付き構造化文書データベースシステム

Country Status (1)

Country Link
JP (1) JP2991142B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369268B (zh) * 2007-08-15 2011-08-24 北京书生国际信息技术有限公司 一种文档库系统中文档数据的存储方法
JP6084527B2 (ja) * 2013-06-26 2017-02-22 株式会社東芝 Webページ作成装置
KR102322786B1 (ko) * 2018-03-30 2021-11-09 조영화 전자문서의 관계기반 저작관리방법 및 저작관리시스템
KR102331047B1 (ko) * 2019-09-28 2021-11-29 조영화 전자저작물의 관계기반 저작관리방법 및 저작관리시스템

Also Published As

Publication number Publication date
JPH10171794A (ja) 1998-06-26

Similar Documents

Publication Publication Date Title
US5873660A (en) Morphological search and replace
JPH11110415A (ja) 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体
JPH08255172A (ja) 文書検索システム
JPH0567144A (ja) 前編集支援方法およびその装置
JP2008084070A (ja) 構造化文書検索装置およびプログラム
JP2991142B2 (ja) 動的部品化機能付き構造化文書データベースシステム
JP2001117934A (ja) 電子文書管理方法及びシステム並びに記録媒体
JP4439496B2 (ja) 検索処理装置及びプログラム
JP2008234049A (ja) 要約文生成装置及び要約文生成プログラム
JPH05204983A (ja) リレーショナルデータベース処理装置および処理方法
JPH1055372A (ja) オンデマンド・インターフェース装置及びコンピュータ読み取り可能な記録媒体
JP2008026964A (ja) 検索処理装置及びプログラム
US20040054677A1 (en) Method for processing text in a computer and a computer
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4283038B2 (ja) 文書登録装置、文書検索装置、プログラム及び記憶媒体
JP3714723B2 (ja) 文書表示システム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002132789A (ja) 文書検索方法
JP2967275B2 (ja) 仮名漢字変換装置
JP2000322442A (ja) データベース検索装置およびデータベース検索プログラム記憶媒体
JP2002245062A (ja) 文書検索装置、文書検索方法、プログラムおよび記録媒体
JP3637606B2 (ja) データ処理装置
JP2006106907A (ja) 構造化文書管理システム、索引構築方法及びプログラム
JP2000242534A (ja) 間接ファイルアクセス方法、該方法を実施する情報処理装置及び間接ファイルアクセス処理プログラムを記録した記録媒体
JP2002269136A (ja) 文書検索システム及びプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121015

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees