JP2000172680A - 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム - Google Patents

文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム

Info

Publication number
JP2000172680A
JP2000172680A JP10348299A JP34829998A JP2000172680A JP 2000172680 A JP2000172680 A JP 2000172680A JP 10348299 A JP10348299 A JP 10348299A JP 34829998 A JP34829998 A JP 34829998A JP 2000172680 A JP2000172680 A JP 2000172680A
Authority
JP
Japan
Prior art keywords
document
link information
link
registered
browsing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10348299A
Other languages
English (en)
Inventor
Sho Imasato
詔 今郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10348299A priority Critical patent/JP2000172680A/ja
Publication of JP2000172680A publication Critical patent/JP2000172680A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文書データベースへ登録する文書情報を変更
せずに、データベースへ登録した後でもそのままリンク
を辿ることができるハイパー文書を登録・閲覧・取出し
ができるシステムを提供することを目的とする。 【解決手段】 文書登録システムは、登録すべき文書を
指定する登録文書指定手段(110)と、前記登録文書
指定手段(110)で指定された文書を解析しリンク情
報を検出するリンク情報検出手段(130)と、文書デ
ータベースへ前記リンク情報検出手段(130)で対象
となった文書を登録する文書登録手段(120)と、前
記リンク情報検出手段(130)で検出したリンク情報
と前記文書登録手段(120)で登録した文書とを関連
付けて管理するリンク情報登録手段(140)とを備え
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書データベース
への登録、閲覧および取出しシステムに関し、特にリン
ク情報をもつ文書の管理をするための技術に関する。
【0002】
【従来の技術】現在、インターネット等のコンピュータ
ネットワークにおいて流通する文書はHTML、SGM
L、XML等のハイパーテキストを使用して作成されて
いる。このようなハイパーテキストによって作成された
文書では、論理的には一つの文書が物理的には複数のフ
ァイルで構成される文書要素(ノード) に分割されてい
る。このように複数の文書要素間の関係付けを行うこと
をリンクと言い、リンクによって複数の文書要素を統合
した文書をハイパー文書という。あるノードから他のノ
ードへの関係付け(リンク)を表現するには、参照先ノ
ードのファイル名などを、そのノードが従う文書フォー
マット固有の方法で指定する。例えば、HTMLでは、
特定のタグの中のHREF属性等の値としてファイル名
等(図13参照)を指定する。図13でのハイパー文書
のリンクは、hub.html,node.html,/i
mage/img1.gifの3つのファイルから構成
されており、hub.htmlからnode.htmlと/
image/img1.gifという2つのファイルへ
なされており、更に、node.htmlからhub.ht
mlへリンクされている。
【0003】一方、文書データベースなどを使った文書
管理システムでは、文書を元のファイル名だけで特定す
ることはできない。複数の異なる文書が、元は同じファ
イル名だったということもありうるためである。通常
は、一つの文書には一つの一意な文書識別子(ID)が
与えられ、その文書IDを指定すれば対応する文書が一
つだけ定まるように管理されている。例えば、図14
は、図13のハイパー文書を文書データベースへ登録し
たときの様子を示しており、元のhub.htmlとい
うファイルはdoc0001という文書IDで管理され
ることになる。ところが、登録されたノードの文書(d
oc0001)の中では、元のファイル名node.htm
lが記されたままである。
【0004】
【発明が解決しようとする課題】一般には、このような
ハイパー文書を文書データベースへ格納するとき、リン
ク情報は (1)そのまま変更せずに格納されるか(図14参照) (2)リンク情報を書き換えてから格納する(図15参
照) という2つの方法がとられている。
【0005】(1)の方法では、元のファイル名で文書
データベースから文書を取出すことができないので、リ
ンクが付いている文書のリンクを辿って別のノードをア
クセスすることができなくなるという問題点がある。こ
の方法である文書を閲覧するときには、これに関連した
文書を文書データベースの中からすべて取出してから閲
覧することになって2重手間となってしまうので効率が
良くないし、ハイパー文書の構成要素を単独で利用する
こともできない。
【0006】又、(2)の方法では、相互にリンクされ
た一連の文書すべての登録が確定しないと文書IDが確
定しないため、2パス処理となり、効率が悪くなるし、
また、元文書にデジタル署名が付随している場合、文書
内容を変更するとその署名が無効となってしまうという
問題点がある。
【0007】このような問題点を解決するために本発明
では、 ・文書データベースへ登録する文書情報を変更せずに、 ・データベースへ登録した後でもそのままリンクを辿る
ことができる ハイパー文書を登録・閲覧・取出しができるシステムを
提供することを目的とする。
【0008】
【課題を解決するための手段】請求項1の文書登録シス
テムは、登録すべき文書を指定する登録文書指定手段
と、前記登録文書指定手段で指定された文書を解析しリ
ンク情報を検出するリンク情報検出手段と、文書データ
ベースへ前記リンク情報検出手段で対象となった文書を
登録する文書登録手段と、前記リンク情報検出手段で検
出したリンク情報と前記文書登録手段で登録した文書と
を関連付けて管理するリンク情報登録手段とを備えた。
【0009】請求項2の文書登録システムは、請求項1
記載の文書登録システムにおいて、前記リンク情報検出
手段で検出したリンク情報をもとにリンク先の文書を取
寄せる文書取寄手段を備え、前記リンク情報検出手段
は、前記文書取寄手段で取寄せた文書も対象としてリン
ク情報を検出し、前記文書登録手段は、前記文書取寄手
段で取寄せた文書も登録し、前記リンク情報登録手段
は、前記文書取寄手段で取寄せた文書も対象として関連
付けて登録するようにした。
【0010】請求項3の文書登録システムは、請求項1
記載の文書登録システムにおいて、前記リンク情報検出
手段は、指定されたリンク情報の表現パターンについて
はリンク情報の検出対象から除外するようにした。
【0011】請求項4の文書登録システムは、請求項1
記載の文書登録システムにおいて、前記リンク情報検出
手段は、指定されたリンク情報の表現パターンについて
のみリンク情報の検出対象とするようにした。
【0012】請求項5の文書閲覧システムは、閲覧した
い文書を指定する閲覧文書指定手段と、前記閲覧文書指
定手段で指定された文書を検索して取出す文書検索手段
と、リンク情報を文書データベースの検索情報へ変換す
るリンク情報変換手段と、前記文書検索手段で取出した
文書に存在するリンク情報を前記リンク情報変換手段に
よって得られる対応した文書の検索情報へ書換えて文書
を作成する文書書換手段と、前記文書書換手段で書換え
た文書を閲覧中に該文書中のリンク情報を参照した場
合、該リンク情報に対応する文書を取出すように指示す
るリンク閲覧文書指定手段とを備えた。
【0013】請求項6の文書閲覧システムは、請求項5
記載の文書閲覧システムにおいて、前記文書書換手段は
書換えた文書をキャッシュしておき、次回からの閲覧時
にはキャッシュから取り出すようにした。
【0014】請求項7の文書閲覧システムは、請求項6
記載の文書閲覧システムにおいて、前記文書書換手段で
のキャッシュは一定数又は一定期間保持するようにし
た。
【0015】請求項8の文書取出しシステムは、取出し
たい文書を指定する取出文書指定手段と、文書中にリン
ク情報がある場合、該リンク情報を文書データベースの
検索情報へ変換するリンク情報変換手段と、前記リンク
情報変換手段で得た検索情報によって文書を検索して取
出す文書検索手段と、前記取出文書指定手段で指定され
た文書を前記文書検索手段で取出し、その内容にリンク
情報が存在する場合、該リンク情報を前記リンク情報変
換手段で得た検索情報によって該リンク情報に対応した
文書を取出す関連文書取出手段とを備えた。
【0016】請求項9の文書登録方法は、登録すべき文
書を指定し、この文書と該文書中のリンク先の文書を解
析しリンク情報を検出し、検出したリンク情報と対応す
る文書とを関連付けて管理することを特徴とする文書登
録方法。
【0017】請求項10のコンピュータ読み取り可能な
記録媒体は、登録すべき文書を指定し、この文書と該文
書中のリンク先の文書を解析しリンク情報を検出し、検
出したリンク情報と対応する文書とを関連付けて管理す
るプログラムを記録した。
【0018】請求項11の文書閲覧方法は、閲覧したい
文書を指定し、指定された文書を検索して取出し、この
文書に存在するリンク情報を文書データベースの検索情
報へ書換えて文書を作成し、この書換えた文書を閲覧中
に該文書中のリンク情報を参照した場合、該リンク情報
に対応する文書を取出すように指示してリンク先の閲覧
文書を指定する。
【0019】請求項12のコンピュータ読み取り可能な
記録媒体は、閲覧したい文書を指定し、指定された文書
を検索して取出し、この文書に存在するリンク情報を文
書データベースの検索情報へ書換えて文書を作成し、こ
の書換えた文書を閲覧中に該文書中のリンク情報を参照
した場合、該リンク情報に対応する文書を取出すように
指示してリンク先の閲覧文書を指定するようにしたプロ
グラムを記録した。
【0020】
【発明の実施の形態】以下、4つの実施例を用いて、本
発明の構成および動作原理について説明する。
【0021】1.第1の実施例 本発明の第1の実施例について図1〜8を用いて説明す
る。 (1)全体の環境 図1は、文書登録システム、文書閲覧システムおよび文
書取出しシステムの稼働環境を示す図である。リンクサ
ーバー1は、本発明の文書登録システム、文書閲覧シス
テムおよび文書取出しシステムが稼動するコンピュータ
である。文書サーバー2は、ユーザーからの登録・閲覧
・取出し要求に応ずるための文書(リンク付き文書も含
む)を保持しておく文書データベースが稼動するコンピ
ュータであり、リンクサーバー1からの要求に応じて動
作する。クライアント3は、ネットワーク上のデータソ
ース5や自分のコンピュータ上にあるリンク付きの文書
を文書サーバー2の文書データベースへ登録・閲覧・取
出しの指示をするユーザーのコンピュータである。クラ
イアント3は、単独でも複数あっても良い。ネットワー
ク4は、リンクサーバー1、文書サーバー2、複数のク
ライアント3と複数のデータソース5とを結合するネッ
トワークであり、LAN(Local Area Ne
twork)であっても、WAN(Wide Area
Network)であっても、インターネットのよう
なものであっても良い。データソース5は、ユーザーが
文書サーバー2の文書データベースへ登録したいリンク
付きの文書が存在するネットワーク上のコンピュータで
ある。データソース5は、クライアント3自身であって
も良い。
【0022】図2は、本発明が稼動するリンクサーバー
1、文書サーバー2およびクライアント3のコンピュー
タハードウェア構成を示す図である。入力手段10はキ
ーボード、マウス、タッチパネル等により構成され、情
報の入力に使用される。出力手段20は、種々の出力情
報や入力手段10からの入力された情報などを出力させ
るものであって、表示装置やプリンタ等から構成され
る。CPU30は、種々のプログラムを動作させる。メ
モリ40は、プログラムがCPU30によって実行され
るときに一時的に作成される情報やプログラム等を保持
する。記憶手段50は、文書データベース、プログラム
やプログラムの実行時の一時的な情報等を保持する。媒
体駆動装置60は、プログラムやデータ等を記憶した記
録媒体を装着してそれらを読み込み、メモリ40または
記憶手段50へ格納するのに用いられる。ネットワーク
インタフェース(I/F)70は、コンピュータとネット
ワーク4とのインタフェースをとって、ネットワーク上
の情報の送受信を行うためのインタフェース装置であ
る。
【0023】(2)リンク情報を管理する表のデータ構
造 図3は、ユーザーが登録したいリンク付きの文書に含ま
れているリンク情報が文書サーバー2の文書データベー
スへ登録されたときの文書識別子(ここでは文書IDを
識別子とする)にどのように対応するかを管理するリン
ク情報対応表80のデータ構造を表現したものである。
このリンク情報対応表80は、文書名リスト81および
1文書に対応したリンク情報リスト82からなってい
る。文書名リスト81は、リンク付きの文書とその文書
からリンクされた文書を1つにまとめて文書名を付けて
文書データベースに登録し、その各まとまりである文書
名に何があるかを列挙しており、次の2つの項目があ
る。 ・まとまりとしての文書名 ・この文書に対するリンク情報リスト82へのポインタ また、リンク情報リスト82は1つの文書ごとに次の項
目がある。 ・文書データベースに登録したときの文書識別子(文書
ID) ・この文書のもとのファイル名(リンク位置があるとき
には未定義) ・リンク位置(これは次の3つの情報からなる) ・リンク情報があるファイルの先頭からの文字位置 ・リンク情報の文字数 ・リンク情報の文字列 ・対応文書の識別子(対応文書の文書ID)
【0024】例えば、図3を例にとると、文書名リスト
81には次のものが設定される。 ・「ハブ文書」という文書名 ・この「ハブ文書」に対するリンク情報リスト82への
ポインタ
【0025】リンク情報リスト82の各項目は、次のよ
うに設定される。文書データベースに登録された文書自
身に関しては、上記の項目のうち最初の2つについての
み登録される。例えば、図13のhub.htmlとい
うファイルが識別子doc0001として文書データベ
ースに登録されたとすると、この文書の項目は次のよう
になる。 ・文書データベースに登録したときの文書識別子→do
c0001 ・この文書のもとのファイル名→hub.html ・リンク位置→未定義 ・対応文書の識別子→未定義
【0026】また、文書の中にリンク情報があるときは
それぞれについてすべての情報が設定される。例えば、
図8のhub.htmlというファイルにある2つのリ
ンク情報は、それぞれ次のように設定される。ファイル
node.htmlが識別子doc0002、ファイル/image/im
g1.gifが識別子doc0003として文書データベース
へ登録されたとする。 (a) ファイルnode.htmlへのリンク情報 ・文書データベースに登録したときの文書識別子→do
c0001 ・この文書のもとのファイル名→未定義 ・リンク位置(これは次の3つの情報からなる) ・リンク情報があるファイルの先頭からの文字位置→4
9 ・リンク情報の文字数→9 ・リンク情報の文字列→node.html ・対応文書の識別子→doc0002 (b) ファイル/image/img1.gifへのリンク情報 ・文書データベースに登録したときの文書識別子→do
c0001 ・この文書のもとのファイル名→未定義 ・リンク位置(これは次の3つの情報からなる) ・リンク情報があるファイルの先頭からの文字位置→1
9 ・リンク情報の文字数→15 ・リンク情報の文字列→/image/img1.gif ・対応文書の識別子→doc0003
【0027】(3)本発明を含めた文書の登録から閲覧
・取出しの全体の流れ 本発明を説明する前に、クライアントからの要求がどの
ように処理されていくかを図4を用いて概括する。 (A)ユーザーは、文書管理システム(図示されていな
い)をクライアント3で起動する。文書管理システム
は、文書サーバー2の文書データベースに登録されてい
る文書の一覧をリンクサーバー1から得て出力手段20
へ出力する。ユーザーは出力結果からこれから登録する
リンク付きの文書が登録されていないことを確かめてか
ら、入力手段10から登録のボタンを押す。 (B)クライアント3の記憶手段50に格納されている
ファイルを表示させてその中から登録したいファイルを
選択する。(ここでは、hub.htmlを選択し
た。) (C)文書サーバー2の文書データベースへ登録する文
書名(「ハブ文書」とする)と書誌事項等を入力する。
この入力によってクライアント3は、リンクサーバー1
へここで指定したファイルを指定した文書名で登録作業
を行う。この登録作業が本発明の文書登録システムであ
る。 (D)この登録作業が終了すると、リンクサーバー1は
指定通りに文書サーバー2へ登録したことをクライアン
ト3の文書管理システムへ戻す。文書管理システムは、
登録された文書名を出力手段20へ出力する。
【0028】又、このようにして登録された文書を閲覧
するには、(A)と同様にして文書管理システムを起動
して、リンクサーバー1(文書サーバー2の文書データ
ベース)に登録された文書の一覧を表示させる。この中
から例えば今登録した「ハブ文書」を選択する。 (E)選択された「ハブ文書」の中の構成要素が表示さ
れる。この中のファイルで自分のコンピュータ上へコピ
ーしたいときには閲覧ボタン又は保存ボタンを押す。 (F)閲覧ボタンを押したときには、指定された構成要
素のファイル名をリンクサーバー1へ送り、文書サーバ
ー2の文書データベースから指定した文書を取出して、
クライアント3へ送り返してくる。その後、送り返され
た文書を閲覧中にリンク情報を参照すると、この参照さ
れたリンク情報をリンクサーバー1へ送り、文書サーバ
ー2の文書データベースから対応する文書を取出してク
ライアント3へ送り返してくれる。この閲覧作業が本発
明の文書閲覧システムである。
【0029】(G)また、(E)で保存ボタンを押した
ときには、クライアント3の保存先のフォルダ名を入力
すると、文書サーバー2の文書データベースから対応す
る文書をすべて取出してクライアント3へ送り返し、文
書管理システムはそれを格納する。この取出し作業が本
発明の文書取出しシステムである。
【0030】図5は、リンクサーバー1で稼動する各シ
ステム(文書登録システム100、文書閲覧システム2
00および文書取出しシステム300)およびその制御
手段400からなる機能構成図である。図6は、リンク
サーバー1で稼動する3つのシステムを統合的に制御す
る制御手段400の処理の流れを説明するフローチャー
トである。
【0031】ステップS1:クライアント3のユーザー
からの指示を受信する。 ステップS2:受信した指示が「ファイルの登録」であ
れば、ステップS3へ、そうでなければステップS4へ
分岐する。 ステップS3:受信したユーザーの指定したファイルを
登録するために「文書登録システム」を呼び出す。 この結果の状態をもって、ステップS11へ進む。この
処理状態には、次のようなものがある。 ・正常に終了した場合、登録された文書名とその構成要
素の文書IDを戻す。 ・異常終了した場合、その理由を戻す。 ステップS4:受信した指示が「ファイルの閲覧」であ
れば、ステップS5へ、そうでなければステップS6へ
分岐する。 ステップS5:受信したユーザーの指定したファイルを
閲覧するために「文書閲覧システム」を呼び出す。取出
された閲覧文書をもって、ステップS11へ進む。 ステップS6:受信した指示が「リンク情報から示され
たファイルの閲覧」であれば、ステップS7へ、そうで
なければステップS8へ分岐する。 ステップS7:受信したユーザーの指定したリンクファ
イルを閲覧するために「文書閲覧システム」を呼び出
す。取出された閲覧文書をもって、ステップS11へ進
む。 ステップS8:受信した指示が「ファイルの取出し」で
あれば、ステップS9へ、そうでなければステップS1
0へ分岐する。 ステップS9:受信したユーザーの指定したファイルに
従属したファイル全部を取出すために「文書取出しシス
テム」を呼び出す。取出された文書をもって、ステップ
S11へ進む。 ステップS10:ここは例えば、クライアント3のユー
ザーから指定されたリンクサーバー1内で管理されてい
るすべての文書名とその文書を構成するリンク文書およ
びそれらの文書IDとをリンク情報対応表80から抽出
する。これをもって、ステップS11へ進む。 ステップS11:クライアント3のユーザーへ要求され
た処理結果を送信し、次の受信を待つ。
【0032】これら3つのシステムについて、以下に詳
細な説明をする。 (4)文書登録システム100 図5のリンクサーバー1の機能構成図が示すように文書
登録システム100は、登録文書指示手段110、文書
登録手段120、リンク情報検出手段130、リンク情
報登録手段140、文書取寄手段150とから構成され
る。登録文書指示手段110は、クライアント3のユー
ザーが指定した登録する文書名と登録する文書の内容を
受け取る。
【0033】文書登録手段120は、登録文書指示手段
110が受け取った登録文書の内容を文書サーバー2へ
送信して文書データベースへ登録してもらい、その文書
IDを受け取り、リンク情報登録手段140へ送る。リ
ンク情報検出手段130は、指定された文書の内容にリ
ンク情報があるかどうかを調べる。検出された場合、も
とになった文書と検出されたリンク情報とを対応させて
リンク情報対応表80へ登録するようにリンク情報登録
手段140へ依頼する。また、リンク情報に記述された
文書を文書取寄手段150に依頼して取寄せる。取寄せ
られた文書に対して、文書登録手段120で文書サーバ
ー2へ登録するとともに、リンク情報を検出しリンク情
報対応表80へ登録するようにリンク情報登録手段14
0へ依頼する。なお、リンク情報検出手段130は、検
出すべきでないリンク情報の表現パターンを用意してお
き、そのパターンにマッチするリンクは検出しないよう
にすることもできる。例えば、 "http://x/y/*" という
パターンにマッチ("*" は任意の文字列)するリンクは
検出しない。逆に、検出すべきリンク情報の表現パター
ンを用意しておき、それにマッチしたリンクだけを検出
するように構成することもできる。例えば、"file://*"
というパターンにマッチするリンクだけを検出する。
【0034】リンク情報登録手段140は、文書登録さ
れた文書をリンク情報対応表80へ登録する。またリン
ク情報検出手段130から検出されたリンク情報も呼び
出しもとの文書とリンク先の文書とを関連付けてリンク
情報対応表80へ登録する。文書取寄手段150は、リ
ンク情報検出手段130で検出された新たな文書に対し
てクライアント3のコンピュータ又はネットワーク4上
のデータソース5から取寄せる。この取寄せられた文書
はまた、リンク情報検出手段130によってリンク情報
を検出される。
【0035】文書登録システムの処理の流れを図7のフ
ローチャートを用いて説明する。 ステップS21:ユーザーから指定されたファイルを登
録する場合は、この指定されたファイルを文書サーバー
2へ送信し、文書データベースへ登録してもらう。この
登録したときの「文書ID」を文書サーバー2から受信
する。ファイルの中にあったリンク情報によって取り寄
せられたファイルについても同様に処理する。
【0036】ステップS22:この「文書ID」と「フ
ァイルの名前」をリンク情報情報対応表80へ次のよう
にして登録する。先ず、ユーザーによって指定された
「文書名」によって文書名リスト81を探し、登録され
ていないときには「文書名」を登録し、リンク情報リス
ト82へのポインタを設定する。文書名リスト81に登
録されていれば、リンク情報リスト82へのポインタを
取出す。このリンク情報リスト82へ、文書サーバー2
から得た「文書ID」と「そのファイルの名前」を登録
する。例えば、図13のhub.htmlファイルの場
合、図8の第1エントリーのように、文書IDをdoc
0001、元のファイルの名前をhub.htmlとし
て登録される。更に、この登録したファイルがすでに処
理されているリンク情報リスト82の中のリンク情報の
うち対応文書IDが未定義となっているものを見つけて
「文書ID」を設定する。図13のhub.htmlフ
ァイルの場合、図8の第3エントリーの対応文書ID
は、第4エントリーの"node.html"が文書サーバー2へ
登録されたとき文書ID(doc0002)を得てこれ
を設定する。
【0037】ステップS23:今登録したファイルの内
容からリンク情報を検出する。リンク情報は、例えばH
TML文書の場合、図13のように<a>タグ、<img>タグ
等にあるので、このパターンについて分析することによ
って得られる。図13のHhub.htmlファイルの
場合には、リンク情報として次の2つが得られる。 ・ファイルの先頭より49文字目から9文字長の長さ
で、"node.html"という文字列と、 ・ファイルの先頭より19文字目から15文字長の長さ
で、"/image/img1.gif"という文字列。 なお、検出すべきでないリンク情報の表現パターンを用
意しておき、そのパターンにマッチするリンクは検出し
ないようにすることもできる。例えば、 "http://x/y/
*" というパターンにマッチ("*" は任意の文字列)す
るリンクは検出しない。逆に、検出すべきリンク情報の
表現パターンを用意しておき、それにマッチしたリンク
だけを検出するように構成することもできる。例え
ば、"file://*"というパターンにマッチするリンクだけ
を検出する。
【0038】ステップS24:上記のステップで検出さ
れたものをすべてリンク情報リスト82へ登録する。登
録は、リンク情報が記述されているファイルの「文書I
D」と検出したリンク情報とを登録する。図13のhu
b.htmlの場合は、図8の第2、第3エントリーの
ように登録する。一般に対応文書IDは、この時点では
未定義であるが、すでに文書サーバー2へ登録されてい
れば、リンク情報リスト82に定義されているので、そ
れを設定する。
【0039】ステップS25:上記のステップで登録さ
れたリンク情報のそれぞれがサーバー2へ登録されてい
るかどうかをチェックする。すべて登録されていれば終
了する。登録されていないものがあれば、ステップS2
6へ進む。 ステップS26:まだリンク情報リスト82のリンク情
報に対して文書サーバー2に登録されていないリンク文
書名をリンク位置の文字列から取出して、そのファイル
の内容を取寄せる。例えば、図8の第3エントリーのよ
うに"node.html"となっているときにはユーザーのクラ
イアント3のコンピュータから対応するファイルの内容
を送ってもらう。又、"http://www.xyz.co.jp/node.htm
l"のようになっている場合は、ネットワーク4上のデー
タソース5から取寄せる。 ステップS27:今取寄せたファイルに対して、再帰的
にこの「文書登録」の処理を実行する。この再帰的な処
理から戻ったときには、次の未処理のリンク情報の処理
のためにステップS25へ戻る。
【0040】(5)文書閲覧システム200 図5のリンクサーバー1の機能構成図が示すように文書
閲覧システム200は、閲覧文書指示手段210、文書
検索手段220、文書書換手段230、リンク情報変換
手段240、リンク閲覧文書指示手段250とから構成
される。閲覧文書指示手段210は、クライアント3の
ユーザーが指定した閲覧したいファイルの文書IDを受
け取る。ここではクライアント3のユーザーインタフェ
ースによってリンクサーバー1中に登録されている文書
一覧の中から選択された文書を構成するファイルを選択
したときに特定されたファイルの文書IDを指定して閲
覧を申し込んでくるものと仮定した。閲覧したい文書名
とその構成要素のファイル名とを指定するようにしても
良い。このときはこれらの情報からリンク情報対応表8
0を検索することによって文書IDを得ることができ
る。文書検索手段220は、閲覧文書指示手段210が
受け取った閲覧したいファイルの文書IDを文書サーバ
ー2へ送信して文書データベースからファイルの内容を
受け取る。閲覧文書指示手段210へ送る。
【0041】文書書換手段230は、受理したファイル
の内容にリンク情報があるかどうかリンク情報対応表8
0を使って調べる。例えば、「file://foo.html」とい
うようなリンク情報があると、クライアント3はリンク
サーバー1を経由することなく、クライアント3上のフ
ァイル「foo.html」を探そうとするから、ファイルをク
ライアント3へ送信する前に、ファイルの内容のリンク
情報を書き換える。例えばクライアント3をユーザーの
コンピュータ上で動作するWebブラウザー、リンクサ
ーバー1(リンクサーバーのホスト名を「linkserver」
とする)の制御手段400にWWWサーバーを利用した
として、リンク閲覧文書指示手段250をcgi(co
mmon gateway interface)プロ
グラム「getdoc」によって構成したとすると、図13の
hub.htmlファイルのは、図8からファイル"/im
age/img.gif"の文書IDはdoc0003、ファイル"n
ode.html"の文書IDはdoc0002であるので次の
ように書換えられる。 <html> <img src="http://linkserver/getdoc?doc0003"> See <a href="http://linkserver/getdoc?doc0002">the
node</a>for details. </html> このように書換えると、クライアント3上のWWWブラウ
ザーで、リンクサーバー1から返された文書を表示し、
リンク個所をクリックすると、リンクサーバー1のCGI
プログラムを呼び出すことになるので、文書サーバー2
上の該当ファイルを得ることができることになる。
【0042】リンク情報変換手段240は、文書検索手
段230で得たファイルの内容にあるリンク情報をリン
ク情報対応表80から見つけ、リンク先のファイルの代
わりに対応文書IDを知らせる。これをもとに上記のよ
うなリンク先の書換えを行う。リンク閲覧文書指示手段
250は、文書書換手段230で書換えたリンクを選択
したときに動作し、この書換えによって埋め込まれた文
書IDをもとに文書検索手段220へ送る。
【0043】又、文書書換手段230は、書換え後の文
書を一定数あるいは一定時間キャッシュしておき、キャ
ッシュされている文書に対してはこの書換え処理を省略
するように構成することもできる。
【0044】文書閲覧システムの処理の流れを図9のフ
ローチャートを用いて説明する。 ステップS31:ユーザーがクライアント3から閲覧し
たい文書の中の構成要素のファイルの文書IDを指定し
て閲覧を指示してくる。この閲覧したいファイルの文書
IDを文書サーバー2へ送信して文書データベースから
ファイルの内容を受け取る。 ステップS32:受理したファイルの内容にリンク情報
があるかどうかリンク情報対応表80を使って調べる。
リンク情報を持っている場合、リンク情報リスト82か
ら分かるリンク情報の位置の文字列を「対応文書ID」
によって上記の文書書換手段230で説明したように書
換え、処理を終了する。 ステップS33:上記のように書換えた後、クライアン
ト3上の表示されたリンク情報を参照するとこの書換え
情報によりリンク文書閲覧の指示がリンクサーバー1へ
なされる。書換え情報にもとづいて文書サーバー2から
ファイルを得るためにステップS31へ進む。
【0045】(6)文書取出しシステム300 図5のリンクサーバー1の機能構成図が示すように文書
取出しシステム300は、取出文書指示手段310、関
連文書取出手段320、文書検索手段220、リンク情
報変換手段240とから構成される。取出文書指示手段
310は、クライアント3のユーザーが指定した取出し
たいファイルの文書IDを受け取る。ここではクライア
ント3のユーザーインタフェースによってリンクサーバ
ー1中に登録されている文書一覧の中から選択された文
書を構成するファイルを選択したときに特定されたファ
イルの文書IDを指定して取出しを申し込んでくるもの
と仮定した。取出したい文書名とその構成要素のファイ
ル名とを指定するようにしても良い。このときはこれら
の情報からリンク情報対応表80を検索することによっ
て文書IDを得ることができる。
【0046】関連文書取出手段320は、取出文書指示
手段310が受け取った取出したいファイルの文書ID
を文書サーバー2へ送信して文書データベースからファ
イルの内容を受け取る。この受け取ったファイルをクラ
イアント3へ送信したあと次のことを行う。この受け取
ったファイルにリンク情報があるかをリンク情報対応表
80によって探し、そのリンク情報にある対応文書ID
をリンク情報変換手段240によって取出す。次に、こ
の取出した対応文書IDのファイルを文書検索手段22
0を使って取出し、クライアント3へ送信する。この2
つのステップをリンク情報対応表80に登録されている
関連文書が無くなるまで繰り返す。
【0047】文書取出しシステムの処理の流れを図10
のフローチャートを用いて説明する。 ステップS41:クライアント3のユーザーが指定した
取出したいファイルの文書IDを受け取り、ファイルの
文書IDを文書サーバー2へ送信して文書データベース
からファイルの内容を受け取る。 ステップS42:この受け取ったファイルをそのまま
(書き換えもせずに)クライアント3へ送信する。 ステップS43:この受け取ったファイルに未処理のリ
ンク情報があるかをリンク情報対応表80によって探
し、なければ終了する。あればステップS44へ進む。 ステップS44:この受け取ったファイルのリンク情報
にある対応文書IDを1つリンク情報リスト82から取
出し、再帰的にこの「関連文書取出し」の処理を実行す
る。この再帰的な処理から戻ったときには、次の未処理
のリンク情報の処理のためにステップS43へ戻る。
【0048】2.その他の実施例 本発明は上記のように各サーバーを独立のコンピュータ
として実現したものに限定されたものではなく、図11
や図12に示したようにサーバーを統合して扱っても良
い。図11は、本発明の稼働環境をリンクサーバー1と
文書サーバー2とを同一のコンピューターで実現したも
のである。又、図12は、本発明の稼働環境をリンクサ
ーバー1、文書サーバー2およびクライアント3とを同
一のコンピューターで実現したものである。
【0049】3.プログラムとしての実施例 更に、本発明は上記の実施形態のみに限定されたもので
はない。例えば、図5に示した各システム(文書登録シ
ステム、文書閲覧システム、文書取出しシステム)を構
成する各手段の各機能をプログラム化し、予めCD−R
OM等の記録媒体に書き込んでおき、このCD−ROM
をCD−ROMドライブを搭載したコンピュータに装着
して、コンピュータへそのプログラムをロードすること
によって、実施例の実施形態と同様な機能を実現するこ
とができる。ここで各システムを1つの統合されたプロ
グラムとしても良いし、又はそれぞれ個々の単独のプロ
グラムとしても良い。
【0050】尚、記録媒体としては半導体媒体(例え
ば、ROM、ICメモリカード等)、光媒体(例えば、
DVD−ROM,MO,MD,CD−R等)、磁気媒体
(例えば、磁気テープ、フレキシブルディスク等)のい
ずれであってもよい。
【0051】また、本発明の機能を実現するプログラム
は、媒体の形で提供されるのみならず、通信によって提
供されるものであっても良い。
【0052】
【発明の効果】以上説明したように特許請求の範囲の発
明によれば、リンク情報が変更せずに文書データベース
に保持されるので、文書データベース内のリンク付き文
書のリンクも辿ることが可能になる。
【0053】又、文書データベース内での元の文書内容
自体は変わらないので、デジタル署名が付いていても、
その署名の有効性を正しく検証することができる。
【0054】又、文書データベース内の文書を閲覧時に
閲覧結果をキャッシュするので、アクセスが頻繁な文書
の処理速度が向上し、ユーザに待ち時間を与えない。
【0055】又、リンク付きの文書の構成文書のなか
で、他のコンピュータシステムで管理されていたり、更
新が激しい場合などで、登録すべきでない文書へのリン
ク情報のパターンを指定できるので、常に適切な構成文
書だけを文書データベースとして管理することができ
る。
【図面の簡単な説明】
【図1】 本発明の文書登録システム、文書閲覧システ
ムおよび文書取出しシステムの稼働環境を示す図であ
る。
【図2】 本発明が稼動するコンピュータ環境を示すコ
ンピュータハードウェア構成を示す図である。
【図3】 登録したいリンク付きの文書とリンク情報の
対応を管理するリンク情報対応表のデータ構造を示す図
である。
【図4】 文書の登録から閲覧・取出しの要求がどのよ
うに処理されていくかを説明するための画面例である。
【図5】 リンクサーバーで稼動する本発明の文書登録
システム、文書閲覧システムおよび文書取出しシステム
およびその制御手段からなる機能構成図である。
【図6】 リンクサーバーで稼動する3つのシステムを
統合的に制御する制御手段の処理の流れを説明するフロ
ーチャートである。
【図7】 本発明の文書登録システムの処理の流れを説
明するフローチャートである。
【図8】 リンク情報リストの格納例を説明するための
図である。
【図9】 本発明の文書閲覧システムの処理の流れをて
説明するフローチャートである。
【図10】 本発明の文書取出しシステムの処理の流れ
を説明するフローチャートである。
【図11】 本発明の第2のシステム環境を示す図であ
る。
【図12】 本発明の第3のシステム環境を示す図であ
る。
【図13】 リンク付きの文書の例である。
【図14】 リンク付きの文書を文書データベースへそ
のまま格納した例をである。
【図15】 リンク付きの文書の望ましい登録例を示す
図である。
【符号の説明】
1…リンクサーバー、2…文書サーバー、3…クライア
ント、4…ネットワーク、5…データソース、10…入
力手段、20…出力手段、30…CPU、40…メモ
リ、50…記憶手段、60…媒体駆動装置、70…イン
ターフェース、80…リンク情報対応表、81…文書名
リスト、82…リンク情報リスト、100…文書登録シ
ステム、110…登録文書指定手段、120…文書登録
手段、130…リンク情報検出手段、140…リンク情
報登録手段、150…文書取寄手段、200…文書閲覧
システム、210…閲覧文書指定手段、220…文書検
索手段、230…文書書換手段、240…リンク情報変
換手段、250…リンク閲覧文書指定手段、300…文
書取出しシステム、310…取出文書指定手段、320
…関連文書取出手段、400…制御手段。

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 登録すべき文書を指定する登録文書指定
    手段と、前記登録文書指定手段で指定された文書を解析
    しリンク情報を検出するリンク情報検出手段と、文書デ
    ータベースへ前記リンク情報検出手段で対象となった文
    書を登録する文書登録手段と、前記リンク情報検出手段
    で検出したリンク情報と前記文書登録手段で登録した文
    書とを関連付けて管理するリンク情報登録手段とを備え
    たことを特徴とする文書登録システム。
  2. 【請求項2】 請求項1記載の文書登録システムにおい
    て、前記リンク情報検出手段で検出したリンク情報をも
    とにリンク先の文書を取寄せる文書取寄手段を備え、前
    記リンク情報検出手段は、前記文書取寄手段で取寄せた
    文書も対象としてリンク情報を検出し、前記文書登録手
    段は、前記文書取寄手段で取寄せた文書も登録し、前記
    リンク情報登録手段は、前記文書取寄手段で取寄せた文
    書も対象として関連付けて登録するようにしたことを特
    徴とする文書登録システム。
  3. 【請求項3】 請求項1記載の文書登録システムにおい
    て、前記リンク情報検出手段は、指定されたリンク情報
    の表現パターンについてはリンク情報の検出対象から除
    外することを特徴とする文書登録システム。
  4. 【請求項4】 請求項1記載の文書登録システムにおい
    て、前記リンク情報検出手段は、指定されたリンク情報
    の表現パターンについてのみリンク情報の検出対象とす
    ることを特徴とする文書登録システム。
  5. 【請求項5】 閲覧したい文書を指定する閲覧文書指定
    手段と、前記閲覧文書指定手段で指定された文書を検索
    して取出す文書検索手段と、リンク情報を文書データベ
    ースの検索情報へ変換するリンク情報変換手段と、前記
    文書検索手段で取出した文書に存在するリンク情報を前
    記リンク情報変換手段によって得られる対応した文書の
    検索情報へ書換えて文書を作成する文書書換手段と、前
    記文書書換手段で書換えた文書を閲覧中に該文書中のリ
    ンク情報を参照した場合、該リンク情報に対応する文書
    を取出すように指示するリンク閲覧文書指定手段とを備
    えたことを特徴とする文書閲覧システム。
  6. 【請求項6】 請求項5記載の文書閲覧システムにおい
    て、前記文書書換手段は書換えた文書をキャッシュして
    おき、次回からの閲覧時にはキャッシュから取り出すよ
    うにしたことを特徴とする文書閲覧システム。
  7. 【請求項7】 請求項6記載の文書閲覧システムにおい
    て、前記文書書換手段でのキャッシュは一定数又は一定
    期間保持するようにしたことを特徴とする文書閲覧シス
    テム。
  8. 【請求項8】 取出したい文書を指定する取出文書指定
    手段と、文書中にリンク情報がある場合、該リンク情報
    を文書データベースの検索情報へ変換するリンク情報変
    換手段と、前記リンク情報変換手段で得た検索情報によ
    って文書を検索して取出す文書検索手段と、前記取出文
    書指定手段で指定された文書を前記文書検索手段で取出
    し、その内容にリンク情報が存在する場合、該リンク情
    報を前記リンク情報変換手段で得た検索情報によって該
    リンク情報に対応した文書を取出す関連文書取出手段と
    を備えたことを特徴とする文書取出しシステム。
  9. 【請求項9】 登録すべき文書を指定し、この文書と該
    文書中のリンク先の文書を解析しリンク情報を検出し、
    検出したリンク情報と対応する文書とを関連付けて管理
    することを特徴とする文書登録方法。
  10. 【請求項10】 登録すべき文書を指定し、この文書と
    該文書中のリンク先の文書を解析しリンク情報を検出
    し、検出したリンク情報と対応する文書とを関連付けて
    管理するプログラムを記録したコンピュータ読み取り可
    能な記録媒体。
  11. 【請求項11】 閲覧したい文書を指定し、指定された
    文書を検索して取出し、この文書に存在するリンク情報
    を文書データベースの検索情報へ書換えて文書を作成
    し、この書換えた文書を閲覧中に該文書中のリンク情報
    を参照した場合、該リンク情報に対応する文書を取出す
    ように指示してリンク先の閲覧文書を指定するようにし
    たことを特徴とする文書閲覧方法。
  12. 【請求項12】 閲覧したい文書を指定し、指定された
    文書を検索して取出し、この文書に存在するリンク情報
    を文書データベースの検索情報へ書換えて文書を作成
    し、この書換えた文書を閲覧中に該文書中のリンク情報
    を参照した場合、該リンク情報に対応する文書を取出す
    ように指示してリンク先の閲覧文書を指定するようにし
    たプログラムを記録したコンピュータ読み取り可能な記
    録媒体。
JP10348299A 1998-12-08 1998-12-08 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム Pending JP2000172680A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10348299A JP2000172680A (ja) 1998-12-08 1998-12-08 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10348299A JP2000172680A (ja) 1998-12-08 1998-12-08 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム

Publications (1)

Publication Number Publication Date
JP2000172680A true JP2000172680A (ja) 2000-06-23

Family

ID=18396108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10348299A Pending JP2000172680A (ja) 1998-12-08 1998-12-08 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム

Country Status (1)

Country Link
JP (1) JP2000172680A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149553A (ja) * 2000-11-07 2002-05-24 Sumisho Computer Systems Corp ウェブコンテンツ公開管理装置および方法、記録媒体
JP2002169800A (ja) * 2000-12-04 2002-06-14 Fuji Xerox Co Ltd 文書管理装置及び文書管理方法
JP2002288020A (ja) * 2000-11-21 2002-10-04 Matsushita Electric Ind Co Ltd ファイル管理方法及びコンテンツ記録/再生装置
US6922707B2 (en) 2000-11-21 2005-07-26 Matsushita Electric Industrial Co., Ltd. File management method and content recording/playback apparatus
US6993525B1 (en) 1999-09-10 2006-01-31 Ricoh Company, Ltd. Document-database access device
WO2006046523A1 (ja) * 2004-10-25 2006-05-04 Nec Corporation 文書解析システム、及び文書適応システム
JP2006195818A (ja) * 2005-01-14 2006-07-27 Canon Inc 画像処理装置およびその方法、および画像処理システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993525B1 (en) 1999-09-10 2006-01-31 Ricoh Company, Ltd. Document-database access device
JP2002149553A (ja) * 2000-11-07 2002-05-24 Sumisho Computer Systems Corp ウェブコンテンツ公開管理装置および方法、記録媒体
JP2002288020A (ja) * 2000-11-21 2002-10-04 Matsushita Electric Ind Co Ltd ファイル管理方法及びコンテンツ記録/再生装置
US6922707B2 (en) 2000-11-21 2005-07-26 Matsushita Electric Industrial Co., Ltd. File management method and content recording/playback apparatus
JP2002169800A (ja) * 2000-12-04 2002-06-14 Fuji Xerox Co Ltd 文書管理装置及び文書管理方法
WO2006046523A1 (ja) * 2004-10-25 2006-05-04 Nec Corporation 文書解析システム、及び文書適応システム
US8051371B2 (en) 2004-10-25 2011-11-01 Nec Corporation Document analysis system and document adaptation system
JP2006195818A (ja) * 2005-01-14 2006-07-27 Canon Inc 画像処理装置およびその方法、および画像処理システム

Similar Documents

Publication Publication Date Title
KR101120301B1 (ko) 지속 저장 포탈
US8554800B2 (en) System, methods and applications for structured document indexing
US7246170B2 (en) Scheme for systematically registering meta-data with respect to various types of data
CA2462415C (en) Computer searching with associations
US6564254B1 (en) System and a process for specifying a location on a network
JP2009020901A (ja) データベースシステム、データベース検索方法及び記録媒体
WO2008069125A1 (ja) データ管理装置
US20030018669A1 (en) System and method for associating a destination document to a source document during a save process
US20060149767A1 (en) Searching for data objects
JP2008090404A (ja) 文書検索装置、文書検索方法および文書検索プログラム
US20040139200A1 (en) Systems and methods of generating a content aware interface
JP2003141155A (ja) Webページ検索システムおよびWebページ検索プログラム
JP2000172680A (ja) 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム
JPH1115724A (ja) 文書管理方法および装置
JP2000285052A (ja) Url変換方法および装置
JP3999093B2 (ja) 構造化文書検索方法及び構造化文書検索システム
JP4480353B2 (ja) リンク情報配送システムおよびリンク情報配送方法
JP2007087241A (ja) 多言語複層サイト作成システムおよび多言語複層サイト作成プログラム
JPH11265402A (ja) データ処理システム及びデータ処理システムを制御するプログラムを記録した記録媒体
JP2001084169A (ja) 文書データベースアクセス装置
JP2006244256A (ja) 情報管理装置
EP1677208A1 (en) Method and system for searching for data objects
JP2002351900A (ja) インターネット上での情報検索システム
JPH11149480A (ja) イメージ情報管理システム、イメージ情報検索装置、イメージ情報管理プログラムを記録した媒体及びイメージ情報検索プログラムを記録した媒体
JP3725835B2 (ja) 知識情報収集システムおよび知識情報収集方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060502