JPH09204442A - ドキュメントデータ検索システム - Google Patents

ドキュメントデータ検索システム

Info

Publication number
JPH09204442A
JPH09204442A JP8031466A JP3146696A JPH09204442A JP H09204442 A JPH09204442 A JP H09204442A JP 8031466 A JP8031466 A JP 8031466A JP 3146696 A JP3146696 A JP 3146696A JP H09204442 A JPH09204442 A JP H09204442A
Authority
JP
Japan
Prior art keywords
document
data
document data
server
update
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8031466A
Other languages
English (en)
Inventor
Daiki Kurihara
大樹 栗原
Hisaaki Kadoma
央章 角間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dainippon Screen Manufacturing Co Ltd
Original Assignee
Dainippon Screen Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dainippon Screen Manufacturing Co Ltd filed Critical Dainippon Screen Manufacturing Co Ltd
Priority to JP8031466A priority Critical patent/JPH09204442A/ja
Publication of JPH09204442A publication Critical patent/JPH09204442A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 更新されたドキュメントデータに対する検索
を適正に行なうことができ、不要なドキュメントサーバ
内のドキュメントデータを検索対象とすることなく、ま
た、ネットワークの渋滞やドキュメントサーバ,検索サ
ーバの負荷の増加を招くことのないようにする。 【解決手段】 データベースサーバ100において、ド
キュメントデータベース120内のドキュメントデータ
が更新されたら、データベースサーバプログラム111
はデータ更新トリガを発生して検索エージェントプログ
ラム115に送信する。検索エージェントプログラム1
15はそのトリガを受信すると、更新されたドキュメン
トデータに基づいてドキュメント索引を生成し、検索サ
ーバ300に転送する。検索サーバ300において、検
索サーバプログラム311は、転送されたドキュメント
索引に基づいてドキュメント索引情報320を更新す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、多数のドキュメン
トデータを1つ以上のドキュメントサーバに分散して格
納している場合に、各ドキュメントサーバに通信回線を
介して接続される検索サーバによって、所望のドキュメ
ントデータの格納場所をドキュメント索引情報に基づい
て検索するドキュメントデータ検索システムに関するも
のである。
【0002】
【従来の技術】ドキュメントデータを効率よく検索する
ためには、すべてのドキュメントデータを1つのドキュ
メントサーバに格納し、集中的に管理するのがよい。し
かし、ドキュメントデータを扱う組織の規模が大きくな
ると、大量のドキュメントデータを扱わなければならな
くなるため、1つのドキュメントサーバだけでは管理し
きれず、それゆえ、大量のドキュメントデータを複数の
ドキュメントサーバなどに分散して格納する必要があ
る。
【0003】このとき、或るドキュメントデータを必要
とするユーザ(検索者)が、そのドキュメントデータが
どのドキュメントサーバに格納されているかを知らない
場合、検索者はクライアントを使って、書誌情報やキー
ワードなどに基づき、ドキュメントサーバ毎に、目的の
ドキュメントデータが格納されているか否かを検索しな
ければならない。これは検索者にとって大変負担が大き
い。
【0004】そこで、この問題を解決するために、ドキ
ュメント索引情報を格納した検索サーバを用いた検索シ
ステムが提案されている。このような検索システムとし
ては、例えば、WWW(World Wide Web)により提供さ
れるドキュメントデータを対象とした検索システムがあ
る。WWWは、ハイパーテキスト形式のドキュメントデ
ータを提供する仕組みである。WWWでは、このような
ハイパーテキスト形式のドキュメントデータをWWWサ
ーバに格納しており、一つのドキュメントデータから他
のドキュメントデータへはリンクを張ることができる。
検索者は、そのリンクをたどることによって、目的とす
るドキュメントデータを得る。しかし、WWWでは、こ
のようなリンクをたどること以外には、ドキュメントデ
ータを検索する手段が提供されていない。そこで、これ
を補うために、前述した検索サーバを用いた検索システ
ムが種々提案されている。例えば、「情報処理学会、第
2回、テクニカルコミュニケーションシンポジウム予稿
集」(’95.7)の第24頁〜第31頁に掲載されて
いる「SGML文書管理システム実現における課題」
(井上直樹:NTTデータ通信株式会社)や、或いは
「情報処理学会、第51回、全国大会」(’95.9)
の論文集の1−169〜170に掲載されている「WW
Wにおける広域検索システム」(田村健人,村岡洋一:
早稲田大学理工学部)においては、WWWを対象とした
実際の検索サーバの例が開示されている。
【0005】この検索サーバは、ネットワーク上の全て
のWWWサーバに対して、自ら定期的にアクセスして、
各WWWサーバに格納されている全ドキュメントデータ
(全ページの全テキスト)をそれぞれ取得して、その取
得したデータを基にドキュメント索引情報を生成し、そ
のドキュメント索引情報を格納している。そして、検索
者がクライアントを使って、その検索サーバにアクセス
すると、検索サーバは格納しているドキュメント索引情
報を用いて、目的とするドキュメントデータの格納場所
を検索し、その検索結果を検索者に知らせる。
【0006】
【発明が解決しようとする課題】このような従来におけ
る検索サーバを用いた検索システムにおいては、次のよ
うな問題があった。
【0007】或るWWWサーバ内のドキュメントデー
タが更新されても、その後、検索サーバが、そのWWW
サーバに対してアクセスしてその更新されたドキュメン
トデータを取得した上で、それらデータに基づいて検索
サーバ内のドキュメント索引情報が更新されるまでの間
は、上記ドキュメントデータの更新がドキュメント索引
情報に反映されないため、そのドキュメントデータに対
する検索が適正に行なわれない。
【0008】検索サーバは、ネットワーク上の全ての
WWWサーバからデータを収集してドキュメント索引情
報を生成しているため、不要なWWWサーバ内のドキュ
メントデータまでもが、検索対象となる可能性がある。
【0009】検索サーバは、WWWサーバに定期的に
アクセスして全ドキュメントデータを取得するようにし
ているため、そのWWWサーバ内のドキュメントデータ
に一切更新が生じていない場合には、そのようなアクセ
スやデータの取得は無駄であって、ネットワークの渋滞
やWWWサーバへの負荷の増加を招く原因となりかねな
い。
【0010】従って、本発明の目的は、上記した従来技
術の問題点を解決し、更新されたドキュメントデータに
対する検索を適正に行なうことができ、不要なドキュメ
ントサーバ内のドキュメントデータを検索対象とするこ
となく、また、ネットワークの渋滞やドキュメントサー
バ,検索サーバの負荷の増加を招くことのないドキュメ
ントデータ検索システムを提供することにある。
【0011】
【課題を解決するための手段およびその作用・効果】上
記した目的の少なくとも一部を達成するために、第1の
発明は、クライアントと、複数のドキュメントデータを
格納し、前記クライアントからの要求に応じて所望のド
キュメントデータを提供する1つ以上のドキュメントサ
ーバと、各ドキュメントデータのサマリー情報によって
構成されるドキュメント索引情報を格納し、前記クライ
アントからの要求に応じて、前記ドキュメント索引情報
を参照しつつ、所望のドキュメントデータの格納場所を
検索し、検索結果を提供する検索サーバと、を通信回線
を介して接続して成るドキュメントデータ検索システム
であって、前記ドキュメントサーバは、格納する前記ド
キュメントデータが更新されたか否かを検出する検出手
段と、該検出手段によって前記ドキュメントデータの更
新が検出されたら、更新された該ドキュメントデータか
ら得られる該ドキュメントデータのサマリー情報に基づ
いて、更新情報を生成する生成手段と、生成した前記更
新情報を前記通信回線を介して前記検索サーバに転送す
る転送手段と、を備え、前記検索サーバは、転送された
前記更新情報に基づいて、格納する前記ドキュメント索
引情報を更新する更新手段を備えることを要旨とする。
【0012】ここで、ドキュメントデータとしては、テ
キストデータ(HTMLデータなども含む)や、画像デ
ータや音声データなどのバイナリデータなどが挙げられ
る。また、ドキュメントデータのサマリー情報として
は、ドキュメント名や作者名などの書誌情報や、キーワ
ードや、ドキュメント種別や、ドキュメントデータの格
納場所などが挙げられる。
【0013】このように、本発明では、ドキュメントサ
ーバ側において、検出手段が、格納するドキュメントデ
ータの更新を検出したら、生成手段が、更新されたドキ
ュメントデータから得られるサマリー情報に基づいて更
新情報を生成し、転送手段が、その更新情報を通信回線
を介して検索サーバに転送する。一方、検索サーバ側に
おいては、更新手段が、転送された更新情報に基づい
て、格納するドキュメント索引情報を更新する。
【0014】従って、本発明によれば、以下に掲げる効
果を奏する。 ドキュメントサーバに格納されたドキュメントデータ
が更新されても、その更新情報はすぐに検索サーバに転
送され、それに基づいて、格納するドキュメント索引情
報が更新されるので、ドキュメントデータの更新は直ち
にドキュメント索引情報に反映され、そのドキュメント
索引情報を基にして、その更新されたドキュメントデー
タに対する検索を適正に行なうことができる。
【0015】検索サーバは、ネットワーク上の全ての
ドキュメントサーバを相手とするのではなく、上記した
検出手段,生成手段及び転送手段を備えたドキュメント
サーバのみを相手として、ドキュメント索引情報を得て
いるため、不要なドキュメントサーバ内のドキュメント
データは一切検索対象とならない。
【0016】ドキュメントサーバは、格納しているド
キュメントデータが更新された場合、格納する全てのド
キュメントデータについて更新情報を生成するのではな
く、更新されたドキュメントデータについてのみ更新情
報を生成して、検索サーバに転送するため、ネットワー
クの渋滞やドキュメントサーバ,検索サーバの負荷の増
加を招く恐れがない。
【0017】本発明のドキュメントデータ検索システム
において、前記ドキュメントサーバは、格納している前
記ドキュメントデータを、データベース管理システムに
よって管理する手段をさらに備えると共に、前記検出手
段は、前記ドキュメントデータの更新を検出すると、デ
ータ更新トリガを発生する手段を備え、前記生成手段
は、前記データ更新トリガの発生に応じて前記更新情報
の生成を開始する手段を備えるようにしても良い。
【0018】このように、ドキュメントサーバにおい
て、格納するドキュメントデータをデータベース管理シ
ステムによって管理する場合、データ更新トリガを発生
する手段を備えることができる。即ち、この発生手段
は、ドキュメントデータの更新があった場合に、データ
更新トリガを発生するため、生成手段では、これを利用
して、更新情報の生成を開始させることができる。
【0019】また、本発明のドキュメントデータ検索シ
ステムにおいて、前記ドキュメントサーバは、格納して
いる前記ドキュメントデータを、オペレーティングシス
テムにおけるファイル管理システムによって管理する手
段をさらに備えると共に、前記検出手段は、管理してい
るファイルを順次チェックして、格納する前記ドキュメ
ントデータが更新されたか否かを検出する手段を備える
ようにしても良い。
【0020】このように、ドキュメントサーバにおい
て、格納するドキュメントデータをオペレーティングシ
ステムにおけるファイル管理システムによって管理する
場合、データベース管理システムによって管理する場合
のように、データ更新トリガを発生する手段を備えるこ
とはできない。そのため、管理しているファイルを順次
チェックして更新の有無を検出する手段を備えるように
する。このような手段を用いれば、ファイル管理されて
いるドキュメントデータについても、漏れなくドキュメ
ントデータの更新を検出することができる。
【0021】
【発明の実施の形態】以下、本発明の実施の形態を実施
例に基づいて説明する。図1は本発明の一実施例として
ドキュメントデータ検索システムの概要を示す説明図で
あり、図2は図1のドキュメントデータ検索システムの
詳細な構成を示すブロック図である。
【0022】図1または図2に示すように、このドキュ
メントデータ検索システムは、データベースサーバワー
クステーション100と、WWWサーバワークステーシ
ョン200と、検索サーバワークステーション300
と、クライアントワークステーション400と、を備え
ており、それらは互いにネットワーク上の通信回線50
0,520,540,560,580によって接続され
ている。
【0023】データベースサーバワークステーション
(以下、データベースサーバと略す。)100は、図2
に示すように、各種プログラムを記憶するプログラムメ
モリ110と、複数のドキュメントデータによって構成
されるドキュメントデータベース120と、プログラム
メモリ110内のプログラムに従って各種処理動作を行
なうCPU130と、ネットワークを介して他のワーク
ステーションと通信を行なうためのネットワークインタ
フェース140と、更新レコードを一時的に記憶する更
新バッファ150を備えている。ここで、ドキュメント
データベース120を構成する各ドキュメントデータ
は、データベース管理システム(Data BaseManagement
System)によって管理されている。
【0024】プログラムメモリ110には、プログラム
として、ドキュメントデータを参照したり、更新したり
するためのデータベースサーバプログラム111や、ド
キュメント索引情報を生成し、転送するための検索エー
ジェントプログラム115が記憶されている。
【0025】図3はこのようなデータベースサーバプロ
グラム111及び検索エージェントプログラム115に
よる機能を説明するための説明図である。CPU130
は、データベースサーバプログラム111に従って処理
動作をすることによって、図3(a)に示すように、ド
キュメントデータ参照手段112や、ドキュメントデー
タ更新手段113や、データ更新トリガ送信手段114
として機能し、また、検索エージェントプログラム11
5に従って処理動作をすることによって、図3(b)に
示すように、データ更新トリガ受信手段116や、ドキ
ュメント索引生成手段117と、ドキュメント索引転送
手段118として機能する。
【0026】また、WWWサーバワークステーション
(以下、WWWサーバと略す。)200は、図2に示す
ように、プログラムメモリ210と、複数のHTML
(HyperText Mark-up Language)データによって構成さ
れるHTMLデータファイル群220と、CPU230
と、ネットワークインタフェース240と、バッファ群
250を備えている。バッファ群250は、ファイル一
覧バッファ252と、前回ファイル一覧バッファ254
と、更新バッファ256を備えている。ここで、各HT
MLデータは、オペレーティングシステムにおけるファ
イル管理システムによって管理されている。
【0027】プログラムメモリ210には、プログラム
として、HTMLデータを参照するためのWWWサーバ
プログラム211と、HTMLデータの更新を検知して
ドキュメント索引情報を生成し、転送するための検索エ
ージェントプログラム215が記憶されている。
【0028】図4はこのようなWWWサーバプログラム
211及び検索エージェントプログラム215による機
能を説明するための説明図である。CPU230は、W
WWサーバプログラム211に従って処理動作をするこ
とによって、図4(a)に示すように、HTMLデータ
参照手段212として機能し、また、検索エージェント
プログラム215に従って処理動作をすることによっ
て、図4(b)に示すように、データ更新検知手段21
6や、ドキュメント索引生成手段217や、ドキュメン
ト索引転送手段218として機能する。
【0029】また、検索サーバワークステーション(以
下、検索サーバと略す。)300は、図2に示すよう
に、プログラムメモリ310と、ドキュメント索引情報
320と、CPU330と、ネットワークインタフェー
ス340を備えている。
【0030】プログラムメモリ310には、プログラム
として、ドキュメント索引情報320を検索したり、更
新したりするための検索サーバプログラム311が記憶
されている。
【0031】図5はこのような検索サーバプログラム3
11による機能を説明するための説明図である。CPU
330は、検索サーバプログラム311に従って処理動
作をすることによって、図5に示すように、ドキュメン
ト索引検索手段312や、ドキュメント索引更新手段3
13として機能する。
【0032】クライアントワークステーション(以下、
クライアントと略す。)400は、図2に示すように、
プログラムメモリ410と、CPU430と、ネットワ
ークインタフェース440を備えている。プログラムメ
モリ410には、プログラムとして、データベースサー
バ100やWWWサーバ200或いは検索サーバ300
にアクセスするためのクライアントプログラム411が
記憶されている。
【0033】さて、検索サーバ300が初めて運用する
場合、ドキュメント索引情報320は無の状態であるの
で、データベースサーバ100やWWWサーバ200で
は、それぞれ、検索エージェントプログラム115,2
15が起動し、格納している全ドキュメントデータにつ
いて、それぞれ、ドキュメントデータの書誌情報やキー
ワードやデータ格納場所などを含むサマリー情報(ドキ
ュメント索引)を生成し、検索サーバ300に転送す
る。検索サーバ300では、検索サーバプログラム31
1が起動して、転送された複数のドキュメント索引を受
け取って、ドキュメント索引情報320として格納す
る。
【0034】次に、データベースサーバ100におい
て、ドキュメントデータベース120内のドキュメント
データを更新(即ち、追加,変更,削除)する場合の動
作について説明する。
【0035】図6は図2のデータベースサーバプログラ
ム111の処理内容を示すフローチャート、図7は図2
のドキュメントデータベース120内のドキュメントデ
ータを更新する場合の一例を示すフローチャート、図8
は図2のドキュメントデータベース120の内容と更新
バッファ150の内容の一例を示す説明図、図9はドキ
ュメントデータのデータ構造の一例を示す説明図であ
る。
【0036】ドキュメントデータベース120は、例え
ば、複数のドキュメントデータファイルによって構成さ
れ、さらに、各ドキュメントデータファイルは図8
(a)に示すように複数のドキュメントデータによって
構成されている。また、各ドキュメントデータは、それ
ぞれ、図9に示すように、本文の他、ドキュメント名
や、作者名などによって構成されている。
【0037】さて、図2に示すデータベースサーバプロ
グラム111が起動されると、図6に示すように、ま
ず、コマンド待ちの状態となり(ステップS102)、
その後、コマンドが入力されると、入力されたコマンド
に応じて処理が分かれる(ステップS104)。
【0038】ドキュメントデータベース120内のドキ
ュメントデータを更新する場合、その更新はトランザク
ション単位毎に行なわれる。例えば、図7に示すよう
に、トランザクションが開始されると(ステップS20
2)、データベースサーバプログラム111には、図6
に示すように、コマンドとしてトランザクション開始が
入力されるので、ステップS124に進んで更新行数を
0にすると共に、更新バッファ150をクリアする(ス
テップS126)。
【0039】次に、図8(a)に示すドキュメントデー
タベース120に格納されたファイル1について、図7
に示すように、ドキュメントデータ1を追加する場合
(ステップS204)、データベースサーバプログラム
111には、図6に示すように、コマンドとしてデータ
追加が入力されるので、ドキュメントデータベース12
0にドキュメントデータ1を1行追加し(ステップS1
10)、更新バッファ150にも、図8(b)に示すよ
うにその追加行(即ち、ドキュメントデータ1)をその
種別(この場合、「追加」)と共に追加して(ステップ
S112)、更新レコード151とする。そして、更新
行数に1を加える(ステップS122)。
【0040】次に、図7に示すように、ドキュメントデ
ータ2を変更する場合(ステップS206)、データベ
ースサーバプログラム111には、図6に示すように、
コマンドとしてデータ変更が入力されるので、ドキュメ
ントデータベース120の該当行のドキュメントデータ
2を変更し(ステップS114)、更新バッファ150
にも、図8(b)に示すようにその変更行(即ち、ドキ
ュメントデータ2)をその種別(この場合、「変更」)
と共に追加して(ステップS116)、更新レコード1
52とする。そして、更新行数に1を加える(ステップ
S122)。
【0041】さらに、図7に示すように、ドキュメント
データ3を削除する場合(ステップS208)、データ
ベースサーバプログラム111には、図6に示すよう
に、コマンドとしてデータ削除が入力されるので、ドキ
ュメントデータベース120から該当行のドキュメント
データ3を削除し(ステップS118)、更新バッファ
150にも、図8(b)に示すようにその削除行(即
ち、ドキュメントデータ3)をその種別(この場合、
「削除」)と共に追加して(ステップS116)、更新
レコード153とする。そして、更新行数に1を加える
(ステップS122)。
【0042】そして、図7に示すように、トランザクシ
ョンが終了すると(ステップS210)、データベース
サーバプログラム111には、図6に示すように、コマ
ンドとしてトランザクション終了が入力されるので、デ
ータ更新トリガを発生して検索エージェントプログラム
115に送る(ステップS128)。
【0043】以上のようなドキュメントデータの更新と
データ更新トリガの発生・送信は図3(a)に示すドキ
ュメントデータ更新手段113とデータ更新トリガ送信
手段114がそれぞれ行なうことになる。なお、図6に
おいて、データ参照については、後ほど説明する。
【0044】以上のように、ドキュメントデータベース
120内の1トランザクション分のドキュメントデータ
の更新が終了すると、更新バッファ150には、図8
(b)に示すように、更新されたドキュメントデータと
その種別(「追加」,「変更」,「削除」)から成る更
新レコード151〜153が1トランザクション分記憶
された状態となる。
【0045】次に、データベースサーバ100におい
て、更新されたドキュメントデータに基づいてドキュメ
ント索引を生成する場合の動作について説明する。
【0046】図10は図2の検索エージェントプログラ
ム115の処理内容を示すフローチャート、図11は通
信回線500を介してデータベースサーバ100から検
索サーバ300へ転送される転送データの一例を示す説
明図、図12はドキュメント索引のデータ構造の一例を
示す説明図である。
【0047】図2に示す検索エージェントプログラム1
15が起動されると、図10に示すように、まず、イベ
ント待ちの状態となり(ステップS302)、その後、
イベントが入力されると、そのイベントがデータ更新ト
リガイベントか否かが判定される(ステップS30
4)。即ち、データベースサーバプログラム111から
送信されたデータ更新トリガを受信したか否かが判定さ
れる。判定の結果、データ更新トリガイベントでなく、
別のイベントであれば、ステップS314に進んでその
イベントに応じた処理を行なう。
【0048】一方、データ更新トリガイベントであれ
ば、図8(b)に示す更新バッファ150より更新レコ
ードを一つ取り出す(ステップS306)。そして、そ
の更新レコードのドキュメントデータに基づいてドキュ
メント索引を生成し、種別と共に転送レコードを構成さ
せる(ステップS308)。例えば、取り出した更新レ
コードが図8(b)に示す更新レコード151であると
すると、その更新レコード151内のドキュメントデー
タ1からドキュメント索引1を生成し、更新レコード1
51内の種別(この場合、「追加」)と共に、図11に
示す転送レコード504を構成させる。
【0049】ここで、生成されるドキュメント索引は、
図12に示すように、ドキュメント名や作者名などの書
誌情報の他、キーワードや、ドキュメント種別や、ドキ
ュメントデータの格納場所などによって構成される。こ
のうち、書誌情報やキーワードは、図9に示したドキュ
メントデータの中から、それぞれ抽出される。また、ド
キュメント種別としては、テキストデータ、バイナリデ
ータの別や、さらに細かく画像データや、HTMLデー
タの別などが付される。また、ドキュメントデータの格
納場所としては、データベースサーバ内のドキュメント
データベースに格納されたドキュメントデータの場合、
データベースサーバ名、データベース名、ファイル名、
主キー値(データベース内のドキュメントを一意的に区
別するための識別番号のようなもの)などが付される。
また、後述するようなWWWサーバ内のファイルに格納
されたHTMLデータの場合は、情報資源のアクセス方
法と存在場所を指定するためのURL(Uniform Resour
ce Locator)などが付される。
【0050】なお、更新レコード内の種別が「変更」や
「削除」である場合、生成するドキュメント索引として
は、図12に示すような情報を全て有する必要はない。
即ち、「変更」の場合は少なくとも変更された部分の情
報(例えば、作者名が変更されている場合は、その作者
名)とドキュメントデータの格納場所を有していれば良
い。また、「削除」の場合は少なくともドキュメントデ
ータの格納場所を有していれば良い。
【0051】また、ドキュメントデータの種類によって
は、図12に示す情報の全てが得られるとは限らない
し、異なる情報が得られる場合もある。従って、そのよ
うな場合には、得られる情報によってドキュメント索引
を構成すればよい。
【0052】次に、ステップS306で取り出した更新
レコードが最後のレコードであるか否かを判定する(ス
テップS310)。判定の結果、最後のレコードでなけ
れば、ステップS306に戻って、更新バッファ150
より次の更新レコードを一つ取り出し、同様の処理を繰
り返す。最後のレコードであれば、1トランザクション
分の更新レコードについて、ドキュメント索引生成の処
理が終了したことになるので、図11に示すように1ト
ランザクション分の転送レコード504〜508が得ら
れたことになる。
【0053】次に、こうして得られた1トランザクショ
ン分の転送レコード504〜508をドキュメント索引
更新要求502と共に、通信回線500を介して検索サ
ーバ300の検索サーバプログラム311に転送する
(ステップS312)。即ち、検索サーバプログラム3
11へは、図11に示すように、先頭から、ドキュメン
ト索引更新要求502、転送レコード504〜508の
順に順次転送される。
【0054】以上のようなデータ更新トリガの受信とド
キュメント索引の生成とドキュメント索引の転送は、図
3(b)に示すデータ更新トリガ受信手段116とドキ
ュメント索引生成手段117とドキュメント索引転送手
段118がそれぞれ行なうことになる。
【0055】次に、検索サーバ300において、転送さ
れたドキュメント索引を基に、格納されているドキュメ
ント索引情報を更新する場合の動作について説明する。
【0056】図13は図2の検索サーバプログラム31
1の処理内容の一部を示すフローチャート、図14は図
2の検索サーバプログラム311の処理内容の残りの部
分を示すフローチャート、図15は図2のドキュメント
索引情報320の内容の一例を示す説明図である。
【0057】図2に示す検索サーバプログラム311が
起動されると、図13に示すように、まず、イベント待
ちの状態となり(ステップS402)、その後、イベン
トが入力されると、そのイベントが検索エージェントプ
ログラムからのイベントかクライアントプログラムから
のイベントかが判定される(ステップS404)。判定
の結果、クライアントプログラムからのイベントである
場合には、図14のAに進む。
【0058】一方、検索エージェントプログラムからの
イベントである場合には、さらに、そのイベントがドキ
ュメント索引更新要求イベントであるか否かが判定され
る(ステップS408)。即ち、検索エージェントプロ
グラムから転送されてきた図11に示すドキュメント索
引更新要求502を受信したか否かが判定される。判定
の結果、ドキュメント索引更新要求イベントでなく、別
のイベントであれば、ステップS422に進んで、その
イベントに応じた処理を行なう。
【0059】ドキュメント索引更新要求イベントであれ
ば、図11に示す次に転送されてくる転送レコードを1
つ受信する(ステップS410)。そして、その転送レ
コードの種別が何かを判定し(ステップS412)、そ
の判定結果に応じた処理を行なう。例えば、図11に示
すように、ドキュメント索引更新要求502に続く転送
レコードが504である場合、その種別は「追加」であ
るので、ステップS414に進み、図15に示すよう
に、ドキュメント索引情報320の最後尾に、転送レコ
ード504内のドキュメント索引1を1行追加する。
【0060】次に、ステップS410で受信した転送レ
コードが最後のレコードであるか否かを判定する(ステ
ップS420)。判定の結果、最後のレコードでなけれ
ば、ステップS410に戻って、次に転送されてくる転
送レコードを1つ受信する。図11に示すように、次に
続く転送レコードは506であり、その種別は「変更」
であるので、ステップS416に進み、図15に示すよ
うに、ドキュメント索引情報320内の該当行のドキュ
メント索引2を、転送レコード内の新たなドキュメント
索引2に変更する。このとき、ドキュメント索引情報3
20内の該当行のドキュメント索引は、ドキュメント索
引情報320内の複数のドキュメント索引の中から、ド
キュメントデータの格納場所が、転送レコード内のドキ
ュメント索引と一致するものを探し出すことによって、
容易に見つけ出すことができる。
【0061】さらに、ステップS410に戻って、次に
転送されてくる転送レコードを1つ受信した場合、図1
1に示すように、次に続く転送レコードは508であ
り、その種別は「削除」であるので、ステップS418
に進み、図15に示すように、ドキュメント索引情報3
20内の該当行のドキュメント索引3を削除する。
【0062】一方、ステップS420において、最後の
レコードであると判定された場合には、検索エージェン
トプログラムから転送されてきた全ての転送レコードを
受信したことになるので、ドキュメント索引情報320
の更新処理を終了して、再びイベント待ち(ステップS
402)の状態に戻る。以上のようなドキュメント索引
情報320の更新は図5に示すドキュメント索引更新手
段313が行なうことになる。
【0063】次に、検索者が目的とするドキュメントデ
ータを検索し、そのドキュメントデータを得る場合の動
作について説明する。まず、クライアント400におい
て、クライアントプログラム411を起動する。そし
て、検索者が、検索したいドキュメントデータのドキュ
メント名,作者名などの書誌情報の一部やキーワードな
どを、検索条件としてクライアント400に入力する
と、クライアントプログラム411は、検索要求と検索
条件を、通信回線540を介して検索サーバ300の検
索サーバプログラム311に転送する。
【0064】一方、検索サーバプログラム311では、
図13において既に説明したように、イベントが入力さ
れると、そのイベントが検索エージェントプログラムか
らのイベントかクライアントプログラムからのイベント
かを判定し(ステップS404)、クライアントプログ
ラムからのイベントである場合には、図14のAに進
む。図14では、まず、そのイベントが検索要求イベン
トであるか否かを判定する(ステップS424)。即
ち、クライアントプログラムから転送されてきた検索要
求を受信したか否かを判定する。判定の結果、検索要求
イベントでなく、別のイベントであれば、ステップS4
32に進んで、そのイベントに応じた処理を行なう。
【0065】検索要求イベントであれば、次に転送され
てくる検索条件を受信し(ステップS426)、格納す
るドキュメント索引情報320からその検索条件を満た
す行、即ち、ドキュメント索引を抽出する(ステップS
428)。そして、その抽出結果を通信回線540を介
してクライアント400のクライアントプログラム41
1に送信する(ステップS430)。このようなドキュ
メント索引情報320に対する検索は図5に示すドキュ
メント索引検索手段312が行なうことになる。
【0066】クライアントプログラム411は、送信さ
れた検索結果を受信すると、それを検索者に対して提示
し、それにより、検索者は目的とするドキュメントデー
タの格納場所や、その他必要な情報を知ることができ
る。
【0067】次に、検索者がそのドキュメントデータの
取得をクライアントプログラム411に要求すると、ク
ライアントプログラム411は、そのドキュメントデー
タの格納されているサーバにアクセスを開始する。例え
ば、そのサーバがデータベースサーバ100である場
合、クライアントプログラム411は通信回線560を
介してデータベースサーバ100にアクセスして、デー
タベースサーバプログラム111に対しデータ参照コマ
ンドを送出する。
【0068】クライアントプログラム411は、図6に
示したように、ステップS104において、入力された
コマンドがデータ参照コマンドであると判定すると、ス
テップS106に進んで、ドキュメントデータベース1
20の中から、該当行のドキュメントデータを読み出し
て(ステップS106)、読み出したその行、即ち、目
的とするドキュメントデータを出力媒体(この場合、ク
ライアント400)に対して転送する。このような目的
とするドキュメントデータの読み出しは、図3(a)の
ドキュメントデータ参照手段112によって行なわれ
る。
【0069】このようにして転送されたドキュメントデ
ータを、クライアント400のクライアントプログラム
411が受信することによって、検索者は目的とするド
キュメントデータを得ることができる。
【0070】次に、WWWサーバ200において、HT
MLデータファイル群220内のHTMLデータを更新
(即ち、追加,変更,削除)した場合の動作について説
明する。
【0071】前述したように、データベースサーバ10
0では、格納しているドキュメントデータの管理をデー
タベース管理システムによって行なっているが、WWW
サーバ200では、格納しているHTMLデータの管理
を、オペレーティングシステムにおけるファイル管理シ
ステムによって行なっている。そのため、WWWサーバ
200のWWWサーバプログラム211には、図4
(a)に示すように、データベースサーバ100のデー
タベースサーバプログラム111のようなデータ更新ト
リガ送信手段114は存在しない。そのため、HTML
データファイル群220内のHTMLデータが更新(即
ち、追加,変更,削除)されても、WWWサーバプログ
ラム211から検索エージェントプログラム215へは
データ更新トリガが送られないため、検索エージェント
プログラム215では、HTMLデータが更新されたど
うかを知ることができない。そこで、本実施例において
は、図4(b)に示すように検索エージェントプログラ
ム215にデータ更新検知手段216を設けている。
【0072】図16は図2の検索エージェントプログラ
ム215におけるデータ更新検知手段216の処理内容
の前半部分を示すフローチャート、図17は図2の検索
エージェントプログラム215におけるデータ更新検知
手段216の処理内容の後半部分を示すフローチャー
ト、図18は図2のファイル一覧バッファ252,前回
ファイル一覧バッファ254,更新バッファ256の記
憶内容の一例を示す説明図である。
【0073】図16に示すように、処理が開始される
と、まず、一定時間スリープした後(ステップS50
2)、HTMLデータファイル群220内のHTMLデ
ータの格納されているファイルを一つ選択する(ステッ
プS504)。即ち、HTMLデータファイル群220
では、各ファイルはそれぞれディレクトリで階層に分類
されて収容されており、ここでは、WWWサーバプログ
ラム211が管理する特定のディレクトリ以下のHTM
Lデータの格納されているファイルが全て選択の対象と
なる。
【0074】なお、この段階において、図18に示す3
つのバッファのうち、ファイル一覧バッファ252と更
新バッファ256については記憶内容が全てクリアされ
ているが、前回ファイル一覧バッファ254について
は、前回格納したファイルのパス名やタイムスタンプが
そのままとなっており、「処理済み」の欄のみがクリア
されているものとする。
【0075】次に、選択したファイルから、そのファイ
ルのパス名とタイムスタンプを取り込んで、図18
(a)に示すファイル一覧バッファ252にそれぞれ格
納する(ステップS506)。そして、取得したパス名
及びタイムスタンプを、図18(b)に示す前回ファイ
ル一覧バッファ254内に格納されている複数のパス名
及びタイムスタンプと順次比較して、前回ファイル一覧
バッファ254内に、取得したパス名とタイムスタンプ
の両方と一致するパス名及びタイムスタンプがあるか否
かを判定する(ステップS508)。一致するパス名及
びタイムスタンプがある場合にはステップS516に進
むが、ない場合には、今度は、前回ファイル一覧バッフ
ァ254内に、取得したパス名と一致するパス名がある
か否かを判定する(ステップS510)。一致するパス
名がある場合にはステップS514に進み、ない場合に
はステップS512に進む。
【0076】即ち、ステップS512に進んだ場合は、
前回ファイル一覧バッファ254内に、取得したパス名
と同じものがない場合であって、これは、ステップS5
04で選択したファイルが新たに追加されたファイルで
あることを示している。従って、ステップS512で
は、図18(c)に示す更新バッファ256に、取得し
たパス名と、種別として、追加されたファイルであるこ
とを示す「追加」を格納する。
【0077】また、ステップS514に進んだ場合は、
前回ファイル一覧バッファ254内に、取得したパス名
と同じものはあるが、タイムスタンプは異なっている場
合であって、これは、選択したファイルが前回のファイ
ルに変更を加えたファイルであることを示している。従
って、ステップS514では、図18(c)に示す更新
バッファ256に、取得したパス名と、種別として、変
更されたファイルであることを示す「変更」を格納す
る。そして、前回ファイル一覧バッファ254内の一致
したパス名について、「処理済み」の欄にチェックを付
す(ステップS516)。
【0078】一方、ステップS508からステップS5
16に進んだ場合は、前回ファイル一覧バッファ254
内に、取得したパス名と同じものがあり、タイムスタン
プも同じである場合であって、これは、選択したファイ
ルが、前回のファイルと全く同じであり、何ら変更が加
えられていないことを示している。従って、この場合
は、前回ファイル一覧バッファ254内の一致したパス
名について、「処理済み」の欄にチェックを付す(ステ
ップS516)ことだけを行なう。
【0079】次に、ステップS518では、ステップS
504で選択したファイルが、選択対象となっているフ
ァイルの中で、最後のファイルであるか否か判定し、最
後のファイルでなければ、ステップS504に戻って、
次のファイルを1つ選択し、以下同様の処理を行なう。
最後のファイルであれば、図17のCに進む。
【0080】なお、前回ファイル一覧バッファ254内
にパス名がある場合であっても、そのパス名に該当する
ファイルが、選択対象となっているファイルの中にない
場合がある。即ち、前回存在していたファイルが削除さ
れた場合である。そのような削除されたファイルは図1
6に示した処理の中では見い出すことができない。
【0081】そこで、図17では、まず、前回ファイル
一覧バッファ254内において、「処理済み」の欄がチ
ェックされていないパス名を探し出す。即ち、前回存在
していたが、その後、削除されたファイルは、図16に
示した処理がなされないため、前回ファイル一覧バッフ
ァ254内のそのファイルに該当するパス名について、
「処理済み」の欄にチェックが付されないからである。
従って、そのようなパス名を探し出したら、図18
(c)に示す更新バッファ256に、そのパス名と、種
別として、削除されたファイルであることを示す「削
除」を格納する(ステップS520)。
【0082】次に、更新バッファ256に記憶されてい
る内容(即ち、パス名と種別)を図4(b)に示すドキ
ュメント索引生成手段217に転送する(ステップS5
22)。そして、更新バッファ256と前回ファイル一
覧バッファ254の記憶内容をクリアした後(ステップ
S524)、ステップS506で格納したファイル一覧
バッファ252の記憶内容を前回ファイル一覧バッファ
254に複写し(ステップS526)、その後、ファイ
ル一覧バッファ252の記憶内容をクリアする(ステッ
プS528)。以上の処理が終了したら、図16のDに
進んで、再び、一定時間のスリープ状態(ステップS5
02)に戻る。こうして、検索エージェントプログラム
215におけるデータ変更検知手段216によって、H
TMLデータファイル群220内におけるHTMLデー
タの更新の有無を検知することができる。
【0083】なお、検索エージェントプログラム215
(即ち、ドキュメント索引生成手段217,ドキュメン
ト索引転送手段218)によるドキュメント索引の生成
やドキュメント索引の転送は、データベースサーバ10
0における検索エージェントプログラム115と処理内
容はほぼ同じなので、説明は省略する。
【0084】以上のように、本実施例によれば、データ
ベースサーバ100やWWWサーバ200に格納された
ドキュメントデータ(HTMLデータも含む)が更新さ
れても、その更新情報はドキュメント索引としてすぐに
検索サーバ300に転送され、それに基づいて、格納す
るドキュメント索引情報320が更新されるので、ドキ
ュメントデータの更新は直ちにドキュメント索引情報3
20に反映され、そのドキュメント索引情報320を基
にして、その更新されたドキュメントデータに対する検
索を適正に行なうことができる。
【0085】また、検索サーバ300は、ネットワーク
上の全てのドキュメントサーバを相手とするのではな
く、検索エージェントプログラムの稼働するドキュメン
トサーバ(即ち、データベースサーバ100及びWWW
サーバ200)のみを相手として、ドキュメント索引情
報320を得ているため、不要なドキュメントサーバ内
のドキュメントデータは一切検索対象とならない。
【0086】さらにまた、データベースサーバ100及
びWWWサーバ200は、格納しているドキュメントデ
ータが更新された場合、格納する全てのドキュメントデ
ータについてドキュメント索引を生成するのではなく、
更新されたドキュメントデータについてのみ、ドキュメ
ント索引を生成して、検索サーバ300に転送するた
め、ネットワークの渋滞やデータベースサーバ100,
WWWサーバ200及び検索サーバ300の負荷の増加
を最小限におさえることができる。
【0087】なお、本発明は上記した実施例や実施形態
に限られるものではなく、その要旨を逸脱しない範囲に
おいて種々の態様にて実施することが可能である。
【0088】上記した実施例においては、ネットワーク
に接続されているドキュメントサーバは、データベース
サーバ100とWWWサーバ200の2つであったが、
1つであっても良いし、3つ以上であっても良い。同じ
く、クライアントもネットワーク上にクライアント40
0が1つあるだけであり、検索サーバも検索サーバ30
0が1つだけであったが、これらについても、2つ以上
あって差し支えない。
【0089】また、上記した実施例では、検索サーバ3
00はドキュメントサーバと独立した構成となっている
が、一つのドキュメントサーバの中に、検索サーバの機
能を持たせて、そのドキュメントサーバに検索サーバを
兼ねさせるようにしても良い。
【0090】また、上記した実施例では、オペレーティ
ングシステムにおけるファイル管理システムによって、
HTMLデータを管理している例を挙げたが、HTML
データに限らず、他のドキュメントデータを管理するよ
うにしても良く、その場合にも、図16に示したような
検索エージェントプログラム215におけるデータ変更
検知手段216による処理を適用することができる。
【図面の簡単な説明】
【図1】本発明の一実施例としてドキュメントデータ検
索システムの概要を示す説明図である。
【図2】図1のドキュメントデータ検索システムの詳細
な構成を示すブロック図である。
【図3】図2のデータベースサーバプログラム111及
び検索エージェントプログラム115による機能を説明
するための説明図である。
【図4】図2のWWWサーバプログラム211及び検索
エージェントプログラム215による機能を説明するた
めの説明図である。
【図5】図2の検索サーバプログラム311による機能
を説明するための説明図である。
【図6】図2のデータベースサーバプログラム111の
処理内容を示すフローチャートである。
【図7】図2のドキュメントデータベース120内のド
キュメントデータを更新する場合の一例を示すフローチ
ャートである。
【図8】図2のドキュメントデータベース120の内容
と更新バッファ150の内容の一例を示す説明図であ
る。
【図9】ドキュメントデータのデータ構造の一例を示す
説明図である。
【図10】図2の検索エージェントプログラム115の
処理内容を示すフローチャートである。
【図11】通信回線500を介してデータベースサーバ
100から検索サーバ300へ転送される転送データの
一例を示す説明図である。
【図12】ドキュメント索引のデータ構造の一例を示す
説明図である。
【図13】図2の検索サーバプログラム311の処理内
容の一部を示すフローチャートである。
【図14】図2の検索サーバプログラム311の処理内
容の残りの部分を示すフローチャートである。
【図15】図2のドキュメント索引情報320の内容の
一例を示す説明図である。
【図16】図2の検索エージェントプログラム215に
おけるデータ更新検知手段216の処理内容の前半部分
を示すフローチャートである。
【図17】図2の検索エージェントプログラム215に
おけるデータ更新検知手段216の処理内容の後半部分
を示すフローチャートである。
【図18】図2のファイル一覧バッファ252,前回フ
ァイル一覧バッファ254,更新バッファ256の記憶
内容の一例を示す説明図である。
【符号の説明】
100…データベースサーバ 110…プログラムメモリ 111…データベースサーバプログラム 112…ドキュメントデータ参照手段 113…ドキュメントデータ更新手段 114…データ更新トリガ送信手段 115…検索エージェントプログラム 116…データ更新トリガ受信手段 117…ドキュメント索引生成手段 118…ドキュメント索引転送手段 120…ドキュメントデータベース 130…CPU 140…ネットワークインタフェース 150…更新バッファ 151〜153…更新レコード 200…WWWサーバ 210…プログラムメモリ 211…WWWサーバプログラム 212…HTMLデータ参照手段 215…検索エージェントプログラム 216…データ更新検知手段 217…ドキュメント索引生成手段 218…ドキュメント索引転送手段 220…HTMLデータファイル群 230…CPU 240…ネットワークインタフェース 250…バッファ群 252…ファイル一覧バッファ 254…前回ファイル一覧バッファ 256…更新バッファ 300…検索サーバ 310…プログラムメモリ 311…検索サーバプログラム 312…ドキュメント索引検索手段 313…ドキュメント索引更新手段 320…ドキュメント索引情報 330…CPU 340…ネットワークインタフェース 400…クライアント 410…プログラムメモリ 411…クライアントプログラム 430…CPU 440…ネットワークインタフェース 500,520,540,560,580…通信回線 502…ドキュメント索引更新要求 504〜508…転送レコード

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 クライアントと、 複数のドキュメントデータを格納し、前記クライアント
    からの要求に応じて所望のドキュメントデータを提供す
    る1つ以上のドキュメントサーバと、 各ドキュメントデータのサマリー情報によって構成され
    るドキュメント索引情報を格納し、前記クライアントか
    らの要求に応じて、前記ドキュメント索引情報を参照し
    つつ、所望のドキュメントデータの格納場所を検索し、
    検索結果を提供する検索サーバと、 を通信回線を介して接続して成るドキュメントデータ検
    索システムであって、 前記ドキュメントサーバは、格納する前記ドキュメント
    データが更新されたか否かを検出する検出手段と、 該検出手段によって前記ドキュメントデータの更新が検
    出されたら、更新された該ドキュメントデータから得ら
    れる該ドキュメントデータのサマリー情報に基づいて、
    更新情報を生成する生成手段と、 生成した前記更新情報を前記通信回線を介して前記検索
    サーバに転送する転送手段と、を備え、 前記検索サーバは、転送された前記更新情報に基づい
    て、格納する前記ドキュメント索引情報を更新する更新
    手段を備えるドキュメントデータ検索システム。
  2. 【請求項2】 請求項1に記載のドキュメントデータ検
    索システムにおいて、 前記ドキュメントサーバは、 格納している前記ドキュメントデータを、データベース
    管理システムによって管理する手段をさらに備えると共
    に、 前記検出手段は、前記ドキュメントデータの更新を検出
    すると、データ更新トリガを発生する手段を備え、 前記生成手段は、前記データ更新トリガの発生に応じて
    前記更新情報の生成を開始する手段を備えるドキュメン
    トデータ検索システム。
  3. 【請求項3】 請求項1に記載のドキュメントデータ検
    索システムにおいて、 前記ドキュメントサーバは、 格納している前記ドキュメントデータを、オペレーティ
    ングシステムにおけるファイル管理システムによって管
    理する手段をさらに備えると共に、 前記検出手段は、管理しているファイルを順次チェック
    して、格納する前記ドキュメントデータが更新されたか
    否かを検出する手段を備えるドキュメントデータ検索シ
    ステム。
JP8031466A 1996-01-24 1996-01-24 ドキュメントデータ検索システム Pending JPH09204442A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8031466A JPH09204442A (ja) 1996-01-24 1996-01-24 ドキュメントデータ検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8031466A JPH09204442A (ja) 1996-01-24 1996-01-24 ドキュメントデータ検索システム

Publications (1)

Publication Number Publication Date
JPH09204442A true JPH09204442A (ja) 1997-08-05

Family

ID=12332046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8031466A Pending JPH09204442A (ja) 1996-01-24 1996-01-24 ドキュメントデータ検索システム

Country Status (1)

Country Link
JP (1) JPH09204442A (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10161962A (ja) * 1996-03-05 1998-06-19 Digital Vision Lab:Kk マルチメディアネットワークシステムおよびその通信方法
JPH11252525A (ja) * 1998-02-27 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 映像配信サービス処理システム、そのための装置、および当該処理システムに用いるプログラムを記録した記録媒体
JP2001155022A (ja) * 1999-11-25 2001-06-08 Nec Corp 分散コンテンツ管理システム
JP2001516928A (ja) * 1997-09-17 2001-10-02 マイクロソフト コーポレイション 永続的更新シーケンス番号を使用してドキュメント変更をモニタリングする方法およびシステム
JP2001350778A (ja) * 2000-06-09 2001-12-21 Canon Inc 文書管理システム、情報処理装置、文書管理方法および記憶媒体
JP2003518293A (ja) * 1999-12-20 2003-06-03 ユアアミーゴ・プロプライエタリー・リミテッド インデクシングシステムおよび方法
JP2005122702A (ja) * 2003-10-16 2005-05-12 Hitachi Ltd 検索エンジンと一式以上のファイルサーバ間の結合を改善する方法及び装置
JP2006092515A (ja) * 2004-09-27 2006-04-06 Microsoft Corp 索引キーを使用して検索を絞込むシステムおよび方法
JP2006107434A (ja) * 2004-09-30 2006-04-20 Microsoft Corp インデックス付与強制クエリ
JP2007109133A (ja) * 2005-10-17 2007-04-26 Ntt-It Corp 検索インデクス生成方法およびプログラムおよびプログラムを記録した記録媒体
US7225221B2 (en) 2000-10-02 2007-05-29 Fujitsu Limited Method and system for retrieving information, and computer product
JP2007265384A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265383A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265387A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10161962A (ja) * 1996-03-05 1998-06-19 Digital Vision Lab:Kk マルチメディアネットワークシステムおよびその通信方法
JP2001516928A (ja) * 1997-09-17 2001-10-02 マイクロソフト コーポレイション 永続的更新シーケンス番号を使用してドキュメント変更をモニタリングする方法およびシステム
JPH11252525A (ja) * 1998-02-27 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 映像配信サービス処理システム、そのための装置、および当該処理システムに用いるプログラムを記録した記録媒体
JP2001155022A (ja) * 1999-11-25 2001-06-08 Nec Corp 分散コンテンツ管理システム
US7293084B1 (en) 1999-11-25 2007-11-06 Nec Corporation Network contents managing system
JP4873813B2 (ja) * 1999-12-20 2012-02-08 ユアアミーゴ・リミテッド インデクシングシステムおよび方法
JP2003518293A (ja) * 1999-12-20 2003-06-03 ユアアミーゴ・プロプライエタリー・リミテッド インデクシングシステムおよび方法
US7987165B2 (en) 1999-12-20 2011-07-26 Youramigo Limited Indexing system and method
JP2001350778A (ja) * 2000-06-09 2001-12-21 Canon Inc 文書管理システム、情報処理装置、文書管理方法および記憶媒体
US7225221B2 (en) 2000-10-02 2007-05-29 Fujitsu Limited Method and system for retrieving information, and computer product
JP2005122702A (ja) * 2003-10-16 2005-05-12 Hitachi Ltd 検索エンジンと一式以上のファイルサーバ間の結合を改善する方法及び装置
JP4559158B2 (ja) * 2003-10-16 2010-10-06 株式会社日立製作所 データにアクセスするための方法及びシステム
JP2006092515A (ja) * 2004-09-27 2006-04-06 Microsoft Corp 索引キーを使用して検索を絞込むシステムおよび方法
JP2006107434A (ja) * 2004-09-30 2006-04-20 Microsoft Corp インデックス付与強制クエリ
JP2007109133A (ja) * 2005-10-17 2007-04-26 Ntt-It Corp 検索インデクス生成方法およびプログラムおよびプログラムを記録した記録媒体
JP2007265387A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265383A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法
JP2007265384A (ja) * 2006-01-31 2007-10-11 Victor Co Of Japan Ltd 構造化データ格納装置、構造化データ格納プログラム、及び構造化データ格納方法

Similar Documents

Publication Publication Date Title
US10275434B1 (en) Identifying a primary version of a document
JP4318741B2 (ja) データベースシステム、データベース検索方法及び記録媒体
JP6006267B2 (ja) 索引キーを使用して検索を絞込むシステムおよび方法
US9767108B2 (en) Retrieval device, method for controlling retrieval device, and recording medium
US6094649A (en) Keyword searches of structured databases
US7788253B2 (en) Global anchor text processing
US8959062B2 (en) Data storage device with duplicate elimination function and control device for creating search index for the data storage device
JP5008748B2 (ja) 検索方法、統合検索サーバ及びコンピュータプログラム
JP2003150594A (ja) データウェアハウスシステム
US6938034B1 (en) System and method for comparing and representing similarity between documents using a drag and drop GUI within a dynamically generated list of document identifiers
JPH09204442A (ja) ドキュメントデータ検索システム
US20130124503A1 (en) Delta indexing method for hierarchy file storage
JPH11213014A (ja) データベースシステム、データベース検索方法及び記録媒体
JPWO2004111876A1 (ja) 検索条件を再利用する検索システムおよび方法
JP5352712B2 (ja) 検索方法、統合検索サーバ及びコンピュータプログラム
JP2993434B2 (ja) 分散ハイパーメディアシステム
JP2001184355A (ja) 情報収集システム、コンテンツサーバ、情報収集装置及び記録媒体
JP2004206629A (ja) 異種データソース統合検索サーバシステム
JPH09218880A (ja) ドキュメントデータ検索システム
JPH10111821A (ja) クライアント・サーバー・システム
JP4393498B2 (ja) 構造化文書管理システム及びプログラム
JP2000235514A (ja) 情報検索方法及び情報検索システム並びに情報検索処理プログラムを記録した記録媒体
CN101840401A (zh) 词典辅助查询系统及其方法
US8166018B2 (en) Browsing a list of data items
JP4009342B2 (ja) 情報提供要求方法,情報提供要求プログラムを記憶した記憶媒体およびサーバコンピュータ