JP4539151B2 - Tree structure differential data creation device - Google Patents

Tree structure differential data creation device Download PDF

Info

Publication number
JP4539151B2
JP4539151B2 JP2004123428A JP2004123428A JP4539151B2 JP 4539151 B2 JP4539151 B2 JP 4539151B2 JP 2004123428 A JP2004123428 A JP 2004123428A JP 2004123428 A JP2004123428 A JP 2004123428A JP 4539151 B2 JP4539151 B2 JP 4539151B2
Authority
JP
Japan
Prior art keywords
document
link
change
tree structure
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004123428A
Other languages
Japanese (ja)
Other versions
JP2005100331A (en
Inventor
明 鈴木
惠久 川邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2004123428A priority Critical patent/JP4539151B2/en
Publication of JP2005100331A publication Critical patent/JP2005100331A/en
Application granted granted Critical
Publication of JP4539151B2 publication Critical patent/JP4539151B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、ハイパーテキスト構造をなす文書群の関係を木構造で表現するための装置に関し、特にハイパーテキスト構造の更新による木構造の変化を示す差分データの作成に関する。   The present invention relates to a device for expressing a relationship between a group of documents having a hypertext structure in a tree structure, and more particularly to creation of difference data indicating a change in the tree structure by updating the hypertext structure.

WWW(ワールド・ワイド・ウェブ)上の文書群は、文書をノードとし、文書間のリンクをアークとするハイパーテキスト構造(ハイパーリンク構造とも呼ばれる)をなしている。このハイパーテキスト構造は、リンクにより任意の文書を容易に結びつけることができるという利点があるが、基本的にネットワーク構造であるため、文書数が増えて文書間の関係が複雑になると、人間が文書間の関係を把握することが困難となる。   A document group on the WWW (World Wide Web) has a hypertext structure (also called a hyperlink structure) in which a document is a node and a link between documents is an arc. This hypertext structure has the advantage that any document can be easily linked by a link. However, since it is basically a network structure, when the number of documents increases and the relationship between documents becomes complicated, humans can create documents. It becomes difficult to grasp the relationship between them.

これに対し、ハイパーテキスト構造を木(ツリー)構造に簡素化して表示する方法が従来より用いられている。ハイパーテキスト構造を木構造に変換するには、先頭文書から順に文書中に記述されるリンクを辿り、リンク先の文書を見つけるとそれをリンク元の文書の子ノードとして木構造に組み込む、という処理を繰り返せばよい。   On the other hand, a method of displaying the hypertext structure in a simplified tree structure is conventionally used. To convert a hypertext structure to a tree structure, follow the links described in the document in order from the first document, and if a linked document is found, incorporate it into the tree structure as a child node of the link source document. Can be repeated.

このような木構造表示の1つとして特許文献1に示されるものがある。この方法では、ハイパーテキスト構造において1つのノード(仮に「A」とする)に対して複数のノードからリンクが張られている場合、これを木構造に変換する際には、それら複数のノードのうちの1つを選び、ノードAをその選んだノードの子として配置し、ノードAへとリンクしている他のノードには、ノードAを示す参照用のノード(ショートカット・ノードともいう)を子として配置する。この処理では、ハイパーテキスト構造のリンクをたどっていく際、最初にノードAに到達した時のリンク元ノードを木構造上での実ノードAの親とする。参照用のノードは、木構造を構成する実ノードとは異なる表示をする。これら参照用のノードは実ノードAと同じ文書を指すものであるが、木構造上での関係は実ノードAに代表して示すので、参照用のノードは子ノードを持たない。   One such tree structure display is disclosed in Patent Document 1. In this method, when a link is extended from a plurality of nodes to one node (assumed to be “A”) in the hypertext structure, when converting this to a tree structure, Select one of them, place node A as a child of the selected node, and other nodes linked to node A include a reference node (also referred to as a shortcut node) indicating node A. Place as a child. In this process, when following a hypertext structure link, the link source node when the node A is first reached is the parent of the real node A on the tree structure. The reference node is displayed differently from the real nodes constituting the tree structure. These reference nodes point to the same document as the real node A. However, since the relationship on the tree structure is representatively shown by the real node A, the reference node has no child nodes.

また、アドビシステムズ社のウェブサイト管理ツールである「GoLive」は、WWW上で始点文書を指定すると、その文書から順にリンクをたどって行くことでハイパーテキスト構造を調べ、そのハイパーテキスト構造中の1文書を指定すると、そのハイパーテキスト構造からその文書を根ノードとする木構造を作成して表示する機能を備えている。   In addition, “GoLive”, a website management tool of Adobe Systems, Inc., when specifying a starting document on the WWW, examines the hypertext structure by following links in order from that document, and 1 in the hypertext structure. When a document is specified, it has a function of creating and displaying a tree structure having the document as a root node from the hypertext structure.

さて、WWW上ではウェブページの生成、消滅、内容の更新が頻繁に行われている。これらによりウェブページ群がなすハイパーテキスト構造が変化するため、これに対応する木構造の情報も更新する必要がある。このような木構造の更新は、再度リンクを辿ってウェブページ群を巡回すればよい。   On the WWW, web pages are frequently generated, deleted, and updated. As a result, the hypertext structure formed by the web page group changes, and it is necessary to update the tree structure information corresponding thereto. Such updating of the tree structure may be performed by following the links again and visiting the web page group.

ところで、このように作成・更新した木構造の情報を複数の装置で共有したい場合がある。このような場合、ある装置が作成・更新した木構造の情報を他の装置に送信すればよいが、木構造を構成する文書の数が多い場合、送信すべき木構造のデータ量は膨大なものになる。このような問題に対し、特許文献2には、送信側の装置が、前回作成した木構造と今回作成した木構造の差分情報を作成し、受信側の装置に送信するシステムが開示されている。   By the way, there is a case where it is desired to share information of the tree structure created / updated in this way by a plurality of devices. In such a case, information on the tree structure created and updated by a certain device may be transmitted to another device. However, when the number of documents constituting the tree structure is large, the amount of data of the tree structure to be transmitted is enormous. Become a thing. For such a problem, Patent Document 2 discloses a system in which a transmission-side apparatus creates difference information between a tree structure created last time and a tree structure created this time and transmits the difference information to the reception-side apparatus. .

この特許文献2の方法は、送信データ量を低減するという点で有効であるが、次のような問題がある。すなわち、特許文献2の方法では、送信側装置が差分情報を作成するのに、前回作成した木構造と今回新たに作成した木構造との差分を抽出する処理を行っている。この処理のためには、第1に、前回作成した木構造全体を示す膨大なデータを保持しておかねばならないという問題がある。また第2に、この処理では、今回木構造を作成する際と、作成した木構造を前回の木構造と比較する際と、の合計2回、今回の木構造を辿らなければならないので、計算処理の負荷が大きい。   The method of Patent Document 2 is effective in reducing the amount of transmission data, but has the following problems. That is, in the method of Patent Document 2, the transmission side apparatus performs a process of extracting the difference between the tree structure created last time and the tree structure newly created this time, in order to create difference information. For this process, first, there is a problem that a huge amount of data indicating the entire tree structure created last time must be held. Second, in this process, the current tree structure must be traced twice, that is, when the current tree structure is created and when the created tree structure is compared with the previous tree structure. Processing load is heavy.

特開平6−35657号公報JP-A-6-35657 特開2001−67260号公報JP 2001-67260 A

本発明は、文書群が構成するハイパーテキスト構造の変化に応じ、そのハイパーテキスト構造を表現する木構造データの差分を効率よく作成するための装置を提供することを目的とする。   An object of the present invention is to provide an apparatus for efficiently creating a difference in tree structure data representing a hypertext structure in accordance with a change in the hypertext structure formed by a document group.

本発明に係る装置は、ネットワーク上の文書群が構成するハイパーテキスト構造の変化に応じて該ハイパーテキスト構造を表現する木構造データを更新するために、前記ハイパーテキスト構造の変化に対応する木構造データの変化を示す木構造差分データを作成する装置であって、前記ハイパーテキスト構造の変化の前の時点で各文書が前記ハイパーテキスト構造上に存在するか否かを表す情報が登録された更新前文書テーブルと、前記ハイパーテキスト構造の変化の前の時点で前記ハイパーテキスト構造上に存在する各文書間リンクが登録された更新前リンクテーブルと、前記更新前文書テーブル及び前記更新前リンクテーブルを参照しつつ前記変化の後の文書群を調査することにより、前記変化により前記ハイパーテキスト構造に対し追加及び削除された文書及びリンクを検出し、この検出結果を参照しつつ所定の先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿ることにより、前記木構造データの変化を示す木構造差分データを作成する差分処理部と、を備え、前記差分処理部は、前記更新前文書テーブルに登録された文書群、及びそれら各文書のリンク先の文書群を前記ネットワーク上から収集し、それら各文書が取得できたか否かに基づき、それら各文書が前記変化の前から存在し且つ文書内容が更新されていないもの、前記変化の前から存在し且つ文書内容が更新されたもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後文書テーブルを作成する第1の処理と、前記ネットワーク上から収集した各文書に含まれる文書間リンク群と、前記更新前リンクテーブルに登録されている文書間リンク群との比較に基づき、各文書間リンクが前記変化の前から存在するもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後リンクテーブルを作成する第2の処理と、前記先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿る際、該文書間リンクの状態及びこの文書間リンクが示すリンク先の文書の状態を前記収集後文書テーブル及び前記収集後リンクテーブルから検索し、検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに基づき、(a)前記木構造データにおいて前記文書間リンクの示すリンク元の文書に対応するノードの子として前記文書間リンクの示すリンク先の文書に対応するノードが追加されるという変更内容、(b)前記木構造データにおいて前記文書間リンクの示すリンク先の文書に対応するノードが前記文書間リンクの示すリンク元の文書に対応するノードの子から削除されるという変更内容、及び(c)前記木構造データにおいて前記文書間リンクの示すリンク先の文書に対応するノードに関して前記リンク先の文書の内容が更新されるという変更内容、のうちのいずれかに該当する変更が前記木構造データに加えられたと判定される場合にその変更内容を示すデータを木構造差分データに追加する第3の処理と、を実行すると共に、前記差分処理部は、前記文書間リンクの状態と前記リンク先の文書の状態との組合せと、該組合せに対応する木構造データの変更の有無及び変更がある場合の変更内容と、を示す変更規則テーブルを有し、前記変更内容には、前記(a)、前記(b)、及び前記(c)の少なくとも3種類が含まれ、前記第3の処理において前記変化の後のハイパーテキスト構造の文書間リンクを辿る際に、前記収集後文書テーブル及び前記収集後リンクテーブルからの検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに対応する変更内容が該変更規則テーブルから求められた場合には求められた変更内容に該当する変更が前記木構造データに加えられたと判定する、ことを特徴とする。 Tree apparatus according to the present invention, in response to changes in the hypertext structure documents on the network is configured, in order to update the tree structure data representing the hypertext structure, corresponding to a change in the hypertext structure An apparatus for creating tree structure difference data indicating a change in structure data, in which information indicating whether each document exists on the hypertext structure at a time before the change in the hypertext structure is registered A pre-update document table, a pre-update link table in which links between documents existing on the hypertext structure at the time before the change of the hypertext structure are registered, the pre-update document table, and the pre-update link table By examining the document group after the change while referring to the The change of the tree structure data is shown by detecting the added and deleted documents and links and tracing the inter-document links of the hypertext structure after the change in order from the predetermined first document while referring to the detection result. A difference processing unit for creating tree structure difference data, wherein the difference processing unit collects document groups registered in the pre-update document table and link destination document groups of the respective documents from the network. , based on whether they each document is acquired, as they each document, those present and document content from before the change is not updated, the present and document content from before the change is updated , A first process for creating a post-collection document table that indicates which one of the one added by the change and the one deleted by the change; The links between documents exist from before the change based on the comparison between the links between documents included in each document collected from the document and the links between documents registered in the pre-update link table. , A second process of creating a post-collection link table that indicates which one of the one added by the change and the one deleted by the change, and after the change in order from the top document When tracing an inter-document link having a hypertext structure, the state of the inter-document link and the state of the link destination indicated by the inter-document link are retrieved from the post-collection document table and the post-collection link table, and obtained by retrieval. was based on a combination of the states of the state and the linked document of the document links, (a) the link source of the statements listed in the tree structure data of link between the document (B) Corresponding to the link destination document indicated by the inter-document link in the tree structure data, in which the node corresponding to the link destination document indicated by the inter-document link is added as a child of the node corresponding to A change that a node is deleted from a child of a node corresponding to the link source document indicated by the inter-document link, and (c) a node corresponding to the link destination document indicated by the inter-document link in the tree structure data When it is determined that a change corresponding to any one of the change contents in which the contents of the linked document are updated is added to the tree structure data, the data indicating the change contents is changed to tree structure difference data. And the difference processing unit includes a combination of the state of the inter-document link and the state of the link-destination document, A change rule table indicating whether or not the tree structure data corresponding to the combination is changed and the change contents when there is a change, and the change contents include (a), (b), and (c ) And is obtained by a search from the post-collection document table and the post-collection link table when tracing the inter-document link of the hypertext structure after the change in the third process. If the changes corresponding to the combination of the states of the state and the linked document links between the documents is determined from the change rule table, the changes corresponding to the changes that were required the tree structure data It is determined that it has been added .

本発明の好適な態様では、前記差分処理部は、前記更新前文書テーブルに登録された文書群、及びそれら各文書のリンク先の文書群を前記ネットワーク上から収集し、それら各文書が取得できたか否かに基づき、それら各文書が前記変化の前から存在するもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後文書テーブルを作成し、前記ネットワーク上から収集した各文書に含まれるリンク群と、前記更新前リンクテーブルに登録されているリンク群との比較に基づき、各リンクが前記変化の前から存在するもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後リンクテーブルを作成し、前記先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿る際、該文書間リンク及びこの文書間リンクが示すリンク先の文書の状態を前記収集後文書テーブル及び前記収集後リンクテーブルから検索し、検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに基づき、前記リンク先の文書に関して前記木構造データに変更があるか否かを判定し、変更がある場合にその変更内容を示すデータを木構造差分データに追加する。-   In a preferred aspect of the present invention, the difference processing unit collects the document group registered in the pre-update document table and the link destination document group of each document from the network, and can acquire each document. A post-collection document table indicating whether each of these documents exists before the change, has been added by the change, or has been deleted by the change. Based on a comparison between a link group included in each document created and collected from the network and a link group registered in the pre-update link table, each link exists before the change, the change A post-collection link table is created to indicate which one is added by (1) or deleted by the change, and the change is made in order from the first document. When following the inter-document link of the hypertext structure, the inter-document link and the link destination document indicated by the inter-document link are searched from the post-collection document table and the post-collection link table and obtained by the search. It is determined whether or not the tree structure data is changed with respect to the linked document based on the combination of the link state between the documents and the linked document state. Data indicating the contents is added to the tree structure difference data. -

更に好適な態様では、前記差分処理部は、前記文書間リンクの状態と前記リンク先の文書の状態との組合せと、該組合せに対応する木構造データの変更の有無及び変更がある場合の変更内容と、を示す変更規則テーブルを有し、前記変化の後のハイパーテキスト構造の文書間リンクを辿る際に該変更規則テーブルを検索する。   In a further preferred aspect, the difference processing unit changes the combination of the inter-document link state and the link-destination document state, whether or not the tree structure data corresponding to the combination is changed, and when there is a change. And a change rule table indicating the contents, and the change rule table is searched when tracing the inter-document link of the hypertext structure after the change.

以下、図面を参照して、本発明を実施するための最良の形態(以下「実施形態」と呼ぶ)を説明する。   The best mode for carrying out the present invention (hereinafter referred to as “embodiment”) will be described below with reference to the drawings.

図1は、本発明が適用されるシステムの全体構成の一例を示す図である。   FIG. 1 is a diagram showing an example of the overall configuration of a system to which the present invention is applied.

このシステムにおいて、各企業企業A,B及びCは社内ネットワーク14a,14b及び14cをそれぞれ有しており、パーソナルコンピュータや各種サーバなどの多数のコンピュータがそれら社内ネットワーク14a,14b及び14cに接続されている。社内ネットワーク14a,14b及び14cには、それぞれファイアウォールが設けられており、インターネット10上の装置から社内ネットワーク内に不正アクセスができないようになっている。社内ネットワーク14a,14b及び14c上には多くの文書がウェブページとして存在している。それらウェブページ群は、リンク記述によって相互にリンクされ、ハイパーテキスト構造を形成している。各企業内のユーザは、パーソナルコンピュータ上のウェブブラウザを用い、インターネット10上のサーバが公開している文書と共に、自社の社内ネットワーク14a,14b又は14c上に存在する文書を閲覧することができる。   In this system, each company A, B, and C has in-house networks 14a, 14b, and 14c, and a large number of computers such as personal computers and various servers are connected to the in-house networks 14a, 14b, and 14c. Yes. The in-house networks 14a, 14b, and 14c are respectively provided with firewalls so that unauthorized access to the in-house network from devices on the Internet 10 is prevented. Many documents exist as web pages on the in-house networks 14a, 14b and 14c. These web pages are linked together by a link description to form a hypertext structure. A user in each company can browse a document existing on the company's in-house network 14a, 14b or 14c together with a document published by a server on the Internet 10 using a web browser on a personal computer.

ここで、文書群が構成するハイパーテキスト構造は人間にとって理解が難しいので、これを人間に理解しやすい木構造に変換してユーザに提示することができれば、ユーザは所望の文書を探しやすくなる。インターネット10に接続された木構造情報提供サーバ12は、このような木構造情報の提供を行うサーバである。木構造情報提供サーバ12は、例えばASP(アプリケーションサービスプロバイダ)のサーバである。この場合、企業A,B及びCがASPの顧客である。木構造情報提供サーバ12は、企業A,B及びCに対し、各々の社内ネットワーク14a,14b及び14c内の文書群のリンク関係を木構造で表した木構造データを提供する。   Here, since the hypertext structure formed by the document group is difficult for humans to understand, if this can be converted into a tree structure easy to understand for humans and presented to the user, the user can easily find a desired document. The tree structure information providing server 12 connected to the Internet 10 is a server that provides such tree structure information. The tree structure information providing server 12 is an ASP (Application Service Provider) server, for example. In this case, companies A, B and C are ASP customers. The tree structure information providing server 12 provides the company A, B, and C with tree structure data that represents the link relationship of the document groups in each of the in-house networks 14a, 14b, and 14c in a tree structure.

ここで、社内ネットワーク14a,14b及び14c内では、随時文書の新規生成、削除、内容変更が行われており、これらに応じて文書群が構成するリンク構造(ハイパーテキスト構造)は変化する。このような状況で顧客企業内のユーザにできるかぎり最新の木構造データを提供するために、木構造情報サーバ12は、各社内ネットワーク14a,14b及び14c内の文書群の変化に応じて、該サーバ12自身が保持している木構造データを更新する必要がある。   Here, in the in-house networks 14a, 14b and 14c, documents are newly created, deleted, and contents are changed as needed, and the link structure (hypertext structure) formed by the document group changes accordingly. In order to provide the latest tree structure data as much as possible to the users in the client company in such a situation, the tree structure information server 12 responds to the change of the document group in each in-house network 14a, 14b and 14c. It is necessary to update the tree structure data held by the server 12 itself.

ところが、一般に各社内ネットワーク14a,14b及び14cはそれぞれファイアウォールで保護されているため、木構造情報提供サーバ12がそれら社内ネットワーク14a,14b及び14c上の文書(ウェブページ)を取得出来ない。   However, since the in-house networks 14a, 14b and 14c are generally protected by firewalls, the tree structure information providing server 12 cannot acquire documents (web pages) on the in-house networks 14a, 14b and 14c.

そこで、本実施形態では、各企業の社内ネットワーク14a,14b及び14cのファイアウォール内にそれぞれ木構造情報収集装置16を設ける。木構造情報収集装置16は、自社の社内ネットワーク14a,14b又は14cに存在する文書群を調査し、それら文書群が構成する木構造が前回調査時からどのように変わったかを示す差分データを作成し、木構造情報提供サーバ12に送信する。これにより木構造情報提供サーバ12は、ファイアウォール内の文書群がなす木構造についての差分データを得ることができる。   Therefore, in this embodiment, the tree structure information collection device 16 is provided in the firewall of each company's internal networks 14a, 14b and 14c. The tree structure information collecting device 16 investigates a document group existing in the company's in-house network 14a, 14b or 14c, and creates difference data indicating how the tree structure constituted by the document group has changed since the previous survey. And transmitted to the tree structure information providing server 12. Thereby, the tree structure information providing server 12 can obtain difference data regarding the tree structure formed by the document group in the firewall.

図2は、木構造情報提供サーバ12及び木構造情報収集装置16の機能モジュール構成の一例を示す図である。   FIG. 2 is a diagram illustrating an example of functional module configurations of the tree structure information providing server 12 and the tree structure information collection device 16.

木構造情報提供サーバ12は、記憶装置122と、クライアント要求処理部126と、木構造更新部128を有している。記憶装置122には、各顧客企業の社内ネットワーク14a,14b及び14c内の文書群が構成する木構造を示す木構造データ124が記憶されている。   The tree structure information providing server 12 includes a storage device 122, a client request processing unit 126, and a tree structure updating unit 128. The storage device 122 stores tree structure data 124 indicating a tree structure formed by a document group in the in-house networks 14a, 14b and 14c of each customer company.

クライアント要求処理部126は、インターネット10上に接続されたクライアント装置18(典型的には各顧客企業内のユーザのPC)から木構造要求180を受け取り、その要求180に対応する木構造データ182を作成し、クライアント装置18に提供する。ここで、記憶装置122内の木構造データ124は、全ての顧客企業の社内ネットワーク上の文書群やインターネット上に公開されている文書群が構成する木構造群を含んでいる。クライアント要求処理部126は、そのような大規模な木構造データ124の中から、木構造要求180を発したユーザが指示した木構造閲覧範囲、及び該ユーザの閲覧権限の範囲に属する木構造を抽出し、これを木構造データ182としてクライアント装置18に送信する。   The client request processing unit 126 receives a tree structure request 180 from a client device 18 (typically a user's PC in each customer company) connected on the Internet 10 and receives tree structure data 182 corresponding to the request 180. Created and provided to the client device 18. Here, the tree structure data 124 in the storage device 122 includes a tree structure group constituted by a document group on an in-house network of all customer companies and a document group disclosed on the Internet. The client request processing unit 126 selects, from such large-scale tree structure data 124, the tree structure browsing range designated by the user who issued the tree structure request 180, and the tree structure belonging to the range of the user's browsing authority. The data is extracted and transmitted as tree structure data 182 to the client device 18.

木構造更新部128は、記憶装置122内の木構造データ124を更新するための機能モジュールである。木構造更新部128は、各顧客企業の木構造情報収集装置16から送られてくる木構造差分データ220に基づき、現在記憶装置122に保存されている木構造データ124を最新のハイパーテキスト構造を反映したものに更新する。   The tree structure update unit 128 is a functional module for updating the tree structure data 124 in the storage device 122. The tree structure update unit 128 converts the tree structure data 124 currently stored in the storage device 122 into the latest hypertext structure based on the tree structure difference data 220 sent from the tree structure information collection device 16 of each customer company. Update to reflect.

各顧客企業内に設けられる木構造情報収集装置16は、記憶装置200と、収集部162と、差分データ作成部164とを有している。   The tree structure information collection device 16 provided in each customer company has a storage device 200, a collection unit 162, and a difference data creation unit 164.

記憶装置200には、巡回リスト202,前回文書テーブル204,前回リンクテーブル206及び差分情報判定テーブル208が記憶される。巡回リスト202は、木構造の更新タイミングが来た時に、その更新のために取得すべき文書を示したリストである。前回文書テーブル204は、前回の木構造更新タイミングでの収集処理で求めた、社内ネットワーク上の各文書の存在・非存在の状態を示すテーブルである。前回リンクテーブル206は、前回の木構造更新タイミングでの収集処理で求めた、社内ネットワーク上の各文書間のリンクの存在・非存在の状態を示すテーブルである。差分情報判定テーブル208は、更新タイミングの前後での文書及びリンクの状態変化の組合せから、木構造の差分を求めるための規則を示したテーブルである。   The storage device 200 stores a circulation list 202, a previous document table 204, a previous link table 206, and a difference information determination table 208. The circulation list 202 is a list showing documents to be acquired for the update when the update timing of the tree structure comes. The previous document table 204 is a table indicating the presence / absence state of each document on the in-house network obtained by the collection process at the previous tree structure update timing. The previous link table 206 is a table showing the existence / non-existence state of links between documents on the in-house network obtained by the collection processing at the previous tree structure update timing. The difference information determination table 208 is a table showing a rule for obtaining a tree structure difference from a combination of document and link state changes before and after the update timing.

また、記憶装置200上には、収集部162による文書及びリンク情報の収集に応じ、収集後文書テーブル210及び収集後リンクテーブル212が作成される。収集後文書テーブル210は、収集部162の収集処理の結果判明した各文書の状態を示すテーブルである。また、収集後リンクテーブル212は、収集部162の収集処理の結果判明した各リンクの状態を示すテーブルである。これらのリスト及びテーブルの詳細な内容やその利用の仕方については、後に具体例を挙げて説明する。   Further, a post-collection document table 210 and a post-collection link table 212 are created on the storage device 200 in accordance with the collection of the document and link information by the collection unit 162. The post-collection document table 210 is a table indicating the state of each document that has been found as a result of the collection process of the collection unit 162. Further, the post-collection link table 212 is a table showing the state of each link that has been found as a result of the collection process of the collection unit 162. The detailed contents of these lists and tables and how to use them will be described later with specific examples.

収集部162は、木構造情報収集装置16が設けられた社内ネットワーク14上に存在する文書群や、それら文書に記述されたリンクを収集する機能モジュールである。この収集により、収集後文書テーブル210及び収集後リンクテーブル212が作成される。   The collection unit 162 is a functional module that collects a document group existing on the in-house network 14 provided with the tree structure information collection device 16 and links described in the document. By this collection, a post-collection document table 210 and a post-collection link table 212 are created.

差分データ作成部164は、収集部162による収集の結果である収集後文書テーブル210及び収集後リンクテーブル212と、記憶装置200内に記憶された他の情報を利用して、木構造差分データ220を作成する機能モジュールである。   The difference data creation unit 164 uses the post-collection document table 210 and post-collection link table 212, which are the results of collection by the collection unit 162, and other information stored in the storage device 200, and uses the tree structure difference data 220. Is a functional module that creates

これら収集部162及び差分データ作成部164が行う処理の詳細は、後に具体例を挙げて説明する。   Details of the processing performed by the collection unit 162 and the difference data creation unit 164 will be described later with specific examples.

木構造情報収集装置16は、所定の規則によって定まる木構造更新タイミングが到来する毎に、収集部162及び差分データ作成部164を動作させて木構造差分データ220を作成し、木構造情報提供サーバ12に送信する。   The tree structure information collection device 16 operates the collection unit 162 and the difference data creation unit 164 to create the tree structure difference data 220 every time the tree structure update timing determined by a predetermined rule arrives, and the tree structure information providing server 12 to send.

次に、具体例を挙げて本実施形態のシステムの動作を説明する。   Next, the operation of the system of this embodiment will be described with a specific example.

図3Aは、ある社内ネットワーク内の文書群が、前回の木構造更新タイミングにおいて構成していたハイパーテキスト構造を示す図である。図3Bは同じ社内ネットワーク内の文書群が、今回の木構造更新タイミングにおいて構成しているハイパーテキスト構造を示す図である。図3A及びBにおいて、丸印で示したノード300はハイパーテキスト構造を構成する個々の文書を示し、丸印の中に示した数字は当該文書に付与された文書IDを示す。また、矢印で示したアーク302はそれら文書間のリンクを示す。矢印の根もとのノードがリンク元の文書を、矢印の先端(矢じり側)のノードがリンク先の文書を示す。   FIG. 3A is a diagram showing a hypertext structure formed by a group of documents in a certain in-house network at the previous tree structure update timing. FIG. 3B is a diagram showing a hypertext structure formed by a group of documents in the same in-house network at the current tree structure update timing. 3A and 3B, nodes 300 indicated by circles indicate individual documents constituting the hypertext structure, and the numbers indicated in the circles indicate document IDs assigned to the documents. An arc 302 indicated by an arrow indicates a link between the documents. The node at the base of the arrow indicates the link source document, and the node at the tip (arrowhead side) of the arrow indicates the link destination document.

図3Aにおいて、文書ID「7」のノードの枠線が点線で示されているのは、そのノードに対応する文書の実体データが社内ネットワーク上に存在しないことを意味する。すなわち、文書ID「3」の文書には、文書ID「7」の文書へのリンクが記述されているにもかかわらず、文書ID「7」の文書自体は存在していない。なお、以下では記述を簡明にするため、『文書ID「n」(nは自然数)の文書』と記述する代わりに、単に『文書n』と記述することとする。   In FIG. 3A, the frame line of the node with the document ID “7” is indicated by a dotted line, which means that the actual data of the document corresponding to the node does not exist on the in-house network. That is, in the document with the document ID “3”, although the link to the document with the document ID “7” is described, the document with the document ID “7” does not exist. In the following description, in order to simplify the description, “document n” is simply described instead of “document ID“ n ”(n is a natural number)”.

図3Aと図3Bを比較すれば、前回の更新タイミングと今回の更新タイミングとで、ハイパーテキスト構造に以下のような変化があることが分かる。   Comparing FIG. 3A and FIG. 3B, it can be seen that there is the following change in the hypertext structure between the previous update timing and the current update timing.

(1)文書2から文書4へのリンクが削除された
(2)文書4から文書1へのリンクが新たに生成された
(3)文書5の内容(コンテンツ)が更新された
(4)文書6が削除された(付随的に文書6から8へのリンクも削除)
(5)文書7が新たに生成された
(6)文書7から文書8へのリンクが新たに生成された。
(1) The link from document 2 to document 4 is deleted (2) The link from document 4 to document 1 is newly generated (3) The content (content) of document 5 is updated (4) Document 6 was deleted (the link from document 6 to document 8 was also deleted)
(5) Document 7 is newly generated (6) A link from document 7 to document 8 is newly generated.

大まかに言えば、木構造情報収集装置16から木構造情報提供サーバ12へは、このような変化を示す情報を木構造差分データ220として送信すればよい。   Roughly speaking, information indicating such a change may be transmitted as the tree structure difference data 220 from the tree structure information collecting apparatus 16 to the tree structure information providing server 12.

図3Aや図3Bは説明のために作成した非常に簡単な例なので差分データを簡単に求めることができるが、実際の社内ネットワークでは、数千、数万、或いはそれ以上の文書がハイパーテキスト構造を構成しており、そのような膨大な文書群が構成する構造に対応する木構造の差分データを求めるのは容易ではない。そこで、本実施形態の木構造情報収集装置16は、以下のような処理により、木構造差分データを効率的に作成する。   3A and 3B are very simple examples created for the purpose of explanation, so the difference data can be easily obtained. However, in an actual in-house network, thousands, tens of thousands, or more documents have a hypertext structure. It is not easy to obtain tree-structured difference data corresponding to the structure formed by such an enormous document group. Therefore, the tree structure information collection apparatus 16 of this embodiment efficiently creates tree structure difference data by the following processing.

図4は、本実施形態のシステムにおける木構造データの更新処理の流れを示す図である。   FIG. 4 is a diagram showing the flow of the tree structure data update process in the system of this embodiment.

この処理では、木構造データの更新タイミングが到来すると、まず社内ネットワーク内に設けられた木構造情報収集装置16の収集部162が、巡回リスト202を参照して文書群の取得処理を実行する。そして収集部162は、その取得処理の結果と前回文書テーブル204と前回リンクテーブル206とを比較することにより、更新タイミングの前後での各文書及び各リンクの状態変化を示した収集後文書テーブル210及び収集後リンクテーブル212を作成する(S10)。   In this process, when the update timing of the tree structure data arrives, the collection unit 162 of the tree structure information collection apparatus 16 provided in the in-house network first executes the document group acquisition process with reference to the circulation list 202. Then, the collection unit 162 compares the result of the acquisition process with the previous document table 204 and the previous link table 206, thereby indicating the post-collection document table 210 indicating the state change of each document and each link before and after the update timing. Then, the post-collection link table 212 is created (S10).

図5は、巡回リスト202のデータ内容の一例を示す図である。図5に示すように、巡回リスト202には、木構造情報収集装置16が設置された社内ネットワーク内でハイパーテキスト構造を構成する各文書毎に、その文書に付与した文書IDとその文書のURL(Uniform Resource Locator)とが登録されている。文書IDは、社内ネットワーク上で一意なものでよいが、複数の社内ネットワークを含むシステム全体で一意なものとしてももちろんよい。巡回リスト202には、社内ネットワーク内でハイパーテキスト構造を構成する文書のうち、前回の木構造更新タイミングでの処理により、存在することが確認された文書(すなわち取得出来た文書)についての情報が記憶されている。なお、図5の例は、図3Aに示したハイパーテキスト構造に対応しているので、文書ID「7」の文書に対応するエントリはない。もっとも、これはあくまで一例であり、この代わりに、取得出来なかった文書でも、その文書を指すリンクが他の文書に記述されていれば、これを巡回リスト202に登録しておくこともできる。   FIG. 5 is a diagram illustrating an example of data contents of the circulation list 202. As shown in FIG. 5, the circulation list 202 includes a document ID assigned to each document and a URL of the document for each document constituting the hypertext structure in the in-house network where the tree structure information collection device 16 is installed. (Uniform Resource Locator) is registered. The document ID may be unique on the in-house network, but of course may be unique in the entire system including a plurality of in-house networks. In the circulation list 202, information on documents that have been confirmed to exist by processing at the previous tree structure update timing (ie, documents that can be acquired) among the documents constituting the hypertext structure in the in-house network. It is remembered. Note that the example of FIG. 5 corresponds to the hypertext structure shown in FIG. 3A, so there is no entry corresponding to the document with the document ID “7”. However, this is merely an example, and instead of a document that could not be acquired, if a link pointing to the document is described in another document, it can be registered in the circulation list 202.

S10では、まず収集部162は、HTTP(ハイパーテキスト・トランスファ・プロトコル)のGETメソッドを用い、巡回リスト202に登録されている各文書のURLに示される文書の取得を試みる。また、この取得処理により取得した文書の内容に、巡回リスト202に含まれていないURLを示すリンク記述があれば、収集部162はそのリンク記述が示す文書に対し新たな文書IDを付与して巡回リスト202に登録し、その文書の取得を試みる。この取得要求に対し、取得対象の文書のURLが示すサーバは、要求されたURLが示す文書を持っていればその文書を木構造情報収集装置16へと送信し、そのURLが示す文書を持っていなければ「その文書が存在しない」旨を示すデータを木構造情報収集装置16へと送信する。なお、この取得処理では、例えばIf-modified-sinceヘッダを用いることで、取得対象の文書が更新されている場合にのみ、その文書の実体データが木構造情報収集装置16に送られるようにすることもできる。この場合、取得対象の文書が更新されていない場合は、更新がない旨を示すデータが木構造情報収集装置16に返される。このような取得処理により、取得しようとした各文書が存在するかしないかが分かる。また、If-modified-sinceヘッダを用いれば、存在する文書の内容が前回取得時から更新されているか否かを判別することもできる。なお、木構造の差分を求めるのみならば、文書の内容が更新されているか否かまでは調べる必要はないが、If-modified-sinceヘッダを用いれば既に木構造情報収集装置16に取得済みの文書を再度取得することを避けることができるというメリットがある。   In S <b> 10, the collection unit 162 first tries to acquire a document indicated by the URL of each document registered in the circulation list 202 using an HTTP (Hypertext Transfer Protocol) GET method. If the content of the document acquired by this acquisition processing includes a link description indicating a URL that is not included in the circulation list 202, the collection unit 162 assigns a new document ID to the document indicated by the link description. It registers in the circulation list 202 and tries to acquire the document. In response to this acquisition request, if the server indicated by the URL of the acquisition target document has the document indicated by the requested URL, the server transmits the document to the tree structure information collection device 16 and has the document indicated by the URL. If not, data indicating that the document does not exist is transmitted to the tree structure information collecting device 16. In this acquisition process, for example, by using an If-modified-since header, the entity data of the document is sent to the tree structure information collection device 16 only when the document to be acquired is updated. You can also In this case, when the document to be acquired has not been updated, data indicating that there is no update is returned to the tree structure information collection device 16. With such an acquisition process, it can be determined whether or not each document to be acquired exists. If the If-modified-since header is used, it can be determined whether or not the content of the existing document has been updated since the previous acquisition. Note that if only the difference between the tree structures is obtained, it is not necessary to check whether or not the contents of the document have been updated. However, if the If-modified-since header is used, the tree structure information collection device 16 has already acquired the difference. There is an advantage that it is possible to avoid obtaining the document again.

収集部162は、この取得結果と前回文書テーブル204とを比較することにより、各文書の状態が前回の更新タイミングからどのように変化したか求め、その状態変化を示す収集後文書テーブル210を作成する。   The collection unit 162 compares the obtained result with the previous document table 204 to determine how the state of each document has changed from the previous update timing, and creates a post-collection document table 210 indicating the state change. To do.

図6Aは、図3Aのハイパーテキスト構造に対応した前回文書テーブル204のデータ内容の一例を示す図である。この図では、各文書ごとに、その文書IDとその文書の状態が登録されている。登録される文書の「状態」は、「存在」か「非存在」のいずれかである。すなわち、前回文書テーブル204には、前回の木構造更新タイミングの時点で、各文書IDに対応する文書がネットワーク上に存在していたか否かが登録される。なお、図6Aの例は、「非存在」の文書は前回文書テーブル204に登録しないという方式に従ったものであるため、文書ID「7」のエントリは存在しない。しかしながら、これは一例であり、この代わりに、いずれかの文書のリンク記述に示される文書であれば前回文書テーブル204に登録するという方式も考えられる。この場合、前回文書テーブル204には、文書ID「7」が「非存在」であるとして登録されることになる。   FIG. 6A is a diagram showing an example of data contents of the previous document table 204 corresponding to the hypertext structure of FIG. 3A. In this figure, the document ID and the state of the document are registered for each document. The “state” of the registered document is “present” or “non-existent”. That is, the previous document table 204 registers whether or not a document corresponding to each document ID exists on the network at the time of the previous tree structure update timing. Note that the example of FIG. 6A follows a method in which a “non-existent” document is not registered in the previous document table 204, and thus an entry with a document ID “7” does not exist. However, this is only an example, and instead of this, a method of registering in the previous document table 204 can be considered if the document is shown in the link description of any document. In this case, the document ID “7” is registered as “non-existing” in the previous document table 204.

図6Bは、図3Aのハイパーテキスト構造が図3Bの構造へと変化した場合に、収集部162により作成される収集後文書テーブル210のデータ内容の一例を示す図である。収集後文書テーブル210には、収集の前後での各文書の状態の変化が示される。収集前の各文書の状態は前回文書テーブル204に示されており、収集後の文書の状態は収集部162による文書取得処理により求められる。収集前後の文書状態の変化には、(1)「新規」(収集前になかった文書が収集時に新たに検出された)、(2)「削除」(収集前に存在した文書が収集時には存在しなかった)、(3)「更新」(収集前に存在した文書の内容が更新されたことが収集時に分かった)、の3種類がある。また、文字通りの意味では「変化」とは言えないが、収集前後の文書の状態同士の関係を示す広義の「変化」として、(4)「存在」(収集前に存在した文書が内容更新されないまま収集時にも存在している)、及び(5)「非存在」(収集前になかった文書が収集時にも存在しなかった)がある。なお、収集前に存在せず、且つ収集時にも存在しない文書(「非存在」)は、木構造上には現れないので、テーブル204に登録しなくてもよい。また、木構造の変化のみを知りたい場合は、「更新」は「存在」と同様に扱えばよい。   FIG. 6B is a diagram illustrating an example of data contents of the post-collection document table 210 created by the collection unit 162 when the hypertext structure of FIG. 3A is changed to the structure of FIG. 3B. The post-collection document table 210 shows changes in the state of each document before and after collection. The state of each document before collection is shown in the previous document table 204, and the state of the document after collection is obtained by document acquisition processing by the collection unit 162. Changes in the document status before and after collection include (1) “New” (documents that were not collected before are newly detected at the time of collection), (2) “Delete” (documents that existed before collection are present at the time of collection) (3) “Update” (it was found at the time of collection that the contents of the document that existed before the collection were updated). Moreover, although it cannot be said to be “change” in the literal sense, (4) “existence” (contents existing before collection are not updated as “change” in a broad sense indicating the relationship between the states of the documents before and after collection. And (5) “Non-existent” (documents that were not present before collection were not present at the time of collection). A document that does not exist before collection and does not exist at the time of collection (“non-existence”) does not appear on the tree structure, and thus does not need to be registered in the table 204. Further, when only the change in the tree structure is desired, “update” may be handled in the same manner as “existence”.

収集部162は、前回文書テーブル202と今回の取得処理結果とをつき合わせることで、取得を試みた各文書の状態変化を求め、収集後文書テーブル210に登録する。図6Bの例では、例えば文書5は「更新」、文書6は「削除」、文書7は「新規」となっている。   The collection unit 162 matches the previous document table 202 and the current acquisition processing result to obtain a change in the state of each document attempted to be acquired, and registers it in the post-collection document table 210. In the example of FIG. 6B, for example, the document 5 is “update”, the document 6 is “deleted”, and the document 7 is “new”.

収集部162は、以上の処理を、巡回リスト202に登録された全てのURL、及びこの処理で新たに検出した全てのURLの取得結果が判明するまで繰り返すことで、収集後文書テーブル210を完成させる。   The collection unit 162 completes the post-collection document table 210 by repeating the above processing until all URLs registered in the circulation list 202 and acquisition results of all URLs newly detected in this processing are found. Let

またS10では、収集部162は、今回の更新タイミングの前後でのリンクの状態変化を検出する。更新タイミング到来前のリンク群の状態は前回リンクテーブル206に示されている。   In S10, the collection unit 162 detects link state changes before and after the current update timing. The state of the link group before the update timing arrives is shown in the previous link table 206.

図7Aは前回リンクテーブル206のデータ内容の一例を示す図である。この図に示すように、リンクテーブル206で1つのリンクを示すエントリは、リンク元ID、リンク先ID、状態、及び最短パスフラグ、の4つの項目から構成される。リンク元IDは、当該リンクのリンク元文書(すなわちそのリンクの記述を含んでいる文書)の文書IDである。リンク先IDは、当該リンクのリンク先文書(すなわちそのリンクが指す文書)の文書IDである。   FIG. 7A is a diagram showing an example of the data contents of the previous link table 206. As shown in this figure, an entry indicating one link in the link table 206 is composed of four items: a link source ID, a link destination ID, a state, and a shortest path flag. The link source ID is the document ID of the link source document of the link (that is, the document including the description of the link). The link destination ID is the document ID of the link destination document of the link (that is, the document pointed to by the link).

状態は、当該リンクが存在しているか否かを示す情報である。前回更新タイミングで取得した文書群のいずれかにリンク記述があれば、そのリンク記述が示すリンクの状態は「存在」となる。図7Aの例では、存在しないリンクをテーブルに登録しない方式をとっているため、全てのリンクの状態が「存在」となっている。   The state is information indicating whether or not the link exists. If there is a link description in any of the document groups acquired at the previous update timing, the link state indicated by the link description is “existing”. In the example of FIG. 7A, since a method of not registering links that do not exist in the table is used, the state of all links is “present”.

そして、最短パスフラグは、当該リンクが木構造作成時に当該リンク先の文書に到達する最短パスであるか否かを示すフラグである。本実施形態では、木構造の差分データを作成するために、更新タイミングにおけるハイパーテキスト構造を、木構造作成の際のリンク探索の規則に従って探索していく。一般に、木構造作成の際の探索規則の一つとして幅優先探索規則が知られている。ここで、本実施形態における幅優先探索による木構造の作成処理を説明する。この処理では、木構造の作成のために、収集後文書テーブル210に示される各文書の情報と、収集後リンクテーブル212に示されるそれら文書間のリンクの情報とを調査する。   The shortest path flag is a flag indicating whether or not the link is the shortest path that reaches the link destination document when the tree structure is created. In this embodiment, in order to create differential data of a tree structure, a hypertext structure at the update timing is searched according to a link search rule at the time of tree structure creation. In general, a breadth-first search rule is known as one of search rules for creating a tree structure. Here, the creation process of the tree structure by the breadth-first search in the present embodiment will be described. In this process, in order to create a tree structure, the information of each document shown in the post-collection document table 210 and the link information between the documents shown in the post-collection link table 212 are examined.

ハイパーテキスト構造の幅優先探索を行うために、リンクを格納するキューを一つと、各文書に対応する探索フラグを用意する。木構造作成の開始時に、すべての文書の探索フラグをリセットし、所定の先頭文書(例えば企業Webページのトップページ)から探索を開始する。すなわち、まずその先頭文書の探索フラグを立て、先頭文書に示される1以上のリンクを所定の順序(例えばその文書の記述中での各リンクの出現順序)でキューに追加したものを初期状態とする。そして、「キューから一つリンクを取得し、そのリンク先の文書へ探索を行い、この探索により到達した文書(「探索文書」と呼ぶ)の探索フラグを立て、探索文書に示されるリンクをキューに追加する」ことを、キューが空になるまで繰り返す。探索の過程で、既に一度探索した文書に再度到達することもあるが、このときは探索フラグは既に立てられており、その探索フラグの状態はこのまま変化させない。ここで、この探索においてリンクを取得してくる収集後文書テーブル210や収集後リンクテーブル212には、現時点ではWWW上には存在しない文書やリンクも入っているので、このような不在の文書やリンクは木構造に組み込まないようにする必要がある。このため、収集後文書テーブル210に示されるその探索文書の状態変化が「削除」もしくは「非存在」である場合にはその探索文書に示されるリンクをキューに追加しないようにする。また、キューから取り出したリンクの状態変化(これは収集後リンクテーブル212に示される。詳細は後述)が「削除」もしくは「非存在」である場合にはリンク先の文書の探索フラグは立てず、探索文書に示されるリンクをキューに追加することも行わないこととする。この探索の過程で辿った文書及びリンクの系列は木構造を示す。但し木構造では、1つのノード(「注目ノード」と呼ぶ)が複数の親ノードの子となることはできないので、木構造の生成では、ある注目ノード(文書)は、その注目ノードに最初に到達した時(つまり注目ノードの探索フラグが立っていない時)に辿ったリンクのリンク元文書のノードの子とする。そして、次以降、別のノードから注目ノードに到達した場合(つまり注目ノードの探索フラグが立っている場合)は、その「別のノード」には、その注目ノードを指す参照ノード(ショートカット・ノード)を子として付加する。これに対し、最初に注目ノードに到達した時のリンクに対応する子ノードは、実ノードとして取り扱う。リンク先の文書を参照ノードとした場合、そのリンク先文書に記述されたリンクの探索は中止する(つまり文書に示されているリンクをキューに追加しない)。これは、リンク先文書に記述されたリンクから先は、そのリンク先文書に対応する実ノードのルートで探索できるため、重複探索を避けているからである。なお、木構造データを表示する場合、実ノードと参照ノードを異なる表示形態で表示することができる。   In order to perform a breadth-first search of a hypertext structure, one queue for storing links and a search flag corresponding to each document are prepared. At the start of creating a tree structure, the search flags of all documents are reset, and the search is started from a predetermined top document (for example, the top page of a company Web page). That is, first, a search flag for the first document is set, and one or more links indicated in the first document are added to the queue in a predetermined order (for example, the appearance order of each link in the description of the document). To do. Then, “acquires one link from the queue, searches the linked document, sets a search flag for the document reached by this search (referred to as“ search document ”), and queues the link indicated in the search document. "Add to" until the queue is empty. In the search process, the document that has already been searched once may be reached again. At this time, the search flag is already set, and the state of the search flag remains unchanged. Here, since the post-collection document table 210 and post-collection link table 212 that acquire links in this search also contain documents and links that do not exist on the WWW at this time, such absent documents and links Links should not be built into the tree structure. Therefore, when the state change of the search document shown in the post-collection document table 210 is “deleted” or “non-existing”, the link shown in the search document is not added to the queue. In addition, when the state change of the link taken out from the queue (this is shown in the post-collection link table 212. Details will be described later) is “deleted” or “non-existent”, the search flag for the linked document is not set. The link indicated in the search document is not added to the queue. A series of documents and links traced in the search process shows a tree structure. However, in a tree structure, one node (referred to as “attention node”) cannot be a child of multiple parent nodes, so when generating a tree structure, a certain attention node (document) It is a child of the node of the link source document of the link traced when it arrives (that is, when the search flag for the node of interest is not set). Then, when the node of interest is reached from another node after that (that is, when the search flag for the node of interest is set), the reference node (shortcut node) indicating the node of interest is included in the “other node”. ) As a child. On the other hand, the child node corresponding to the link when the node of interest is first reached is handled as a real node. When the link destination document is a reference node, the search for the link described in the link destination document is stopped (that is, the link indicated in the document is not added to the queue). This is because the search from the link described in the link destination document can be performed by the route of the real node corresponding to the link destination document, and therefore, a duplicate search is avoided. When displaying the tree structure data, the real node and the reference node can be displayed in different display forms.

最短パスフラグは、このようなハイパーテキスト構造の探索において、「リンク先ID」が示す文書に最も早く到達したか、否かを示す。以上の説明から分かるように、最短パスフラグが「○」、すなわち「最短パスである」ことを示す場合は、木構造データにおいて、リンク先IDのノードはリンク元IDのノードの子であり、かつ実ノードとなる。これに対し、最短パスフラグが「×」、すなわち「最短パスでない」ことを示す場合は、木構造データにおいて、リンク先IDのノードはリンク元IDのノードの子ではあるが、参照ノードであることを意味する。   The shortest path flag indicates whether or not the document indicated by the “link destination ID” has reached the earliest in such a hypertext structure search. As can be seen from the above description, when the shortest path flag indicates “O”, that is, “is the shortest path”, in the tree structure data, the node of the link destination ID is a child of the node of the link source ID, and Become a real node. On the other hand, when the shortest path flag indicates “x”, that is, “not the shortest path”, in the tree structure data, the node of the link destination ID is a child of the node of the link source ID, but is a reference node Means.

図3Aのネットワーク構造では、文書4へは文書2と文書5の両方の経路から到達できるが、文書1を起点に探索すると文書2を通る経路の方が先に到達することができるので、図7Aのテーブルでは、文書2から4へのリンクが最短パスであり、文書5から4へのリンクが最短パスでない、となっている。   In the network structure of FIG. 3A, the document 4 can be reached from both the document 2 and the document 5 paths. However, when searching for the document 1 as a starting point, the route passing through the document 2 can reach the document 1 earlier. In the table 7A, the link from documents 2 to 4 is the shortest path, and the link from documents 5 to 4 is not the shortest path.

なお、図3Aのネットワーク構造では、文書7は存在しない。存在しない文書については、その文書に到達するリンクそれぞれについて最短パスかどうかを決定することができないので、最短パスフラグは「不明」としている。   Note that the document 7 does not exist in the network structure of FIG. 3A. For a document that does not exist, it is impossible to determine whether the shortest path for each link that reaches the document, so the shortest path flag is set to “unknown”.

以上、更新タイミング到来前のリンク群の状態を示す前回リンクテーブル206について説明した。収集部162は、このテーブル206と、今回収集した各文書に記述されたリンク記述とをつき合わせることで、収集の前後での各リンクの状態変化を求め、この状態変化を示した収集後リンクテーブル212を作成する。   The previous link table 206 indicating the state of the link group before the update timing has been described above. The collection unit 162 associates the table 206 with the link description described in each document collected this time to obtain the state change of each link before and after the collection, and the post-collection link indicating this state change. A table 212 is created.

リンクの状態変化には、(1)「新規」、(2)「削除」、(3)「存在」、(4)「非存在」の4種がある。それら4種の状態変化が示す意味は、上述した文書の状態変化の場合と同じである。   There are four types of link status changes: (1) “new”, (2) “deleted”, (3) “existing”, and (4) “non-existing”. The meanings indicated by these four kinds of state changes are the same as in the case of the state changes of the document described above.

図3Aから図3Bへのハイパーテキスト構造の変化に対応する、収集後リンクテーブル212の例を図7Bに示す。収集後リンクテーブル212は、前回リンクテーブル206に登録された各リンク、及び今回の収集により新たに検出された各リンクについて、それぞれエントリを有する。1つのエントリは、リンクを特定するリンク元ID及びリンク先IDのペア、当該リンクの状態変化、及び最短パスフラグを含んでいる。リンクの状態変化は、前回リンクテーブル206と、今回の収集により判明した各リンクの有無との比較により、求めることができる。例えば、文書2から4へのリンクは、前回リンクテーブル206では「存在」するのに、図3Bのハイパーテキスト構造の探索時には検出出来ないので、状態変化が「削除」となる。また、文書4から1へのリンクは、前回リンクテーブル206では存在しないのに、図3Bのハイパーテキスト構造の探索時には検出されるので、状態変化が「新規」となる。また、最短パスフラグは、今回「新規」に検出されたリンクについては「不明」とし、その他の状態変化(「存在」及び「削除」)に該当するリンクについては、前回リンクテーブル206の最短パスフラグの値を引き継ぐ。   FIG. 7B shows an example of the post-collection link table 212 corresponding to the change in the hypertext structure from FIG. 3A to FIG. 3B. The post-collection link table 212 has an entry for each link registered in the previous link table 206 and each link newly detected by the current collection. One entry includes a pair of a link source ID and a link destination ID that specify a link, a state change of the link, and a shortest path flag. The link state change can be obtained by comparing the previous link table 206 with the presence / absence of each link found by the current collection. For example, the link from the document 2 to the document 4 is “existing” in the previous link table 206 but cannot be detected when searching the hypertext structure in FIG. Further, the link from document 4 to 1 does not exist in the previous link table 206, but is detected when searching the hypertext structure in FIG. 3B, so the state change becomes “new”. The shortest path flag is “unknown” for the link detected as “new” this time, and the shortest path flag of the previous link table 206 for the link corresponding to other state changes (“exist” and “deleted”). Take over the value.

以上、収集部162による収集処理(S10)について説明した。この収集処理が完了し、収集後文書テーブル210及び収集後リンクテーブル212が完成すると、次に差分データ作成部164による処理が実行される(再び図4参照)。   The collection process (S10) by the collection unit 162 has been described above. When this collection process is completed and the post-collection document table 210 and the post-collection link table 212 are completed, the process by the differential data creation unit 164 is executed (see FIG. 4 again).

すなわち、差分データ作成部164は、収集後文書テーブル210及び収集後リンクテーブル212と差分情報判定テーブル208とを用いて、木構造の差分データを作成する(S12)。この作成処理では、差分データ作成部164が、ハイパーテキスト構造上のリンクを、所定の先頭文書から順に、木構造作成のための幅優先探索の順序に従って辿ることにより、該ハイパーテキスト構造上の文書を巡回していく。収集後リンクテーブル212には、今回の更新タイミングにおいて存在するリンクが全て網羅されているので、このテーブル212を参照することでその探索を実行できる。差分データ作成部164は、その幅方向優先探索の際に新たにリンクを見つける(このリンクを注目リンクと呼ぶ)毎に、その注目リンクの状態変化とその注目リンクが指すリンク先文書の状態変化を収集後文書テーブル210及び収集後リンクテーブル212からそれぞれ求める。そして、その注目リンクとリンク先文書の状態変化の組合せを判定テーブル208にて検索し、この検索により差分情報が求められれば、それを木構造差分データに追加する。S12では、このリンクの探索、判定テーブル208の検索、及びその検索結果に基づく差分情報の追加を、ハイパーテキスト構造の全てのリンクを辿り終えるまで繰り返す。   That is, the difference data creation unit 164 creates tree-structured difference data using the collected document table 210, the collected link table 212, and the difference information determination table 208 (S12). In this creation processing, the difference data creation unit 164 traces the document on the hypertext structure by following the links on the hypertext structure in order from a predetermined first document in the order of breadth-first search for creating a tree structure. I will go around. Since the post-collection link table 212 covers all the links existing at the current update timing, the search can be executed by referring to this table 212. Each time the difference data creation unit 164 finds a new link in the width direction priority search (this link is referred to as an attention link), the state change of the attention link and the state change of the link destination document indicated by the attention link Are obtained from the post-collection document table 210 and the post-collection link table 212, respectively. Then, the combination of the link of interest and the state change of the linked document is searched in the determination table 208, and if difference information is obtained by this search, it is added to the tree structure difference data. In S12, the search for the link, the search of the determination table 208, and the addition of difference information based on the search result are repeated until all links in the hypertext structure are traced.

図8A〜Dに、差分情報判定テーブル208の具体例を示す。これら4つのテーブルでは、注目リンクの状態変化と該注目リンクが示すリンク先文書の状態変化との組合せが示すセルには、その組合せに対応する木構造の変化の内容が登録されている。これらのテーブルにおいて斜線が示されたセルは、そのセルが示す組合せが起こりえないか、又はそのセルが示す組合せについては木構造に変化がないか、のいずれかであることを示している。   A specific example of the difference information determination table 208 is shown in FIGS. In these four tables, the contents of the change in the tree structure corresponding to the combination are registered in the cell indicated by the combination of the state change of the target link and the state change of the linked document indicated by the target link. In these tables, a hatched cell indicates that the combination indicated by the cell cannot occur or the tree structure does not change for the combination indicated by the cell.

また、これら4つのテーブルは、幅優先探索を開始する前と後との間での注目リンクの最短パス状態の変化に応じて、用意したものである。ここで、探索を開始する前の各リンクの最短パス状態は、収集後リンクテーブル212に「最短パスフラグ」として示されている。また、探索後のリンクの状態は、リンク先文書の探索フラグにて決定することができる。すなわち、注目リンクを辿って到達したリンク先の文書の探索フラグが立っていなければ(これは探索の過程でその文書に初めて到達したことを示す)、その注目リンクは最短パスであり、探索フラグが立っていれば最短パスではない。したがって、ある注目リンクを辿った時点では、その注目リンクの状態変化は確定している。この状態変化に応じて、図8A〜Dの中から適切なテーブルを選択し、利用する。   These four tables are prepared according to changes in the shortest path state of the link of interest before and after the breadth-first search is started. Here, the shortest path state of each link before the search is started is shown as a “shortest path flag” in the post-collection link table 212. Further, the state of the link after the search can be determined by the search flag of the link destination document. That is, if the search flag of the linked document reached by following the attention link is not set (this indicates that the document has been reached for the first time in the search process), the attention link is the shortest path, and the search flag If is standing, it is not the shortest path. Therefore, when a certain attention link is traced, the state change of the attention link is fixed. In response to this state change, an appropriate table is selected from FIGS.

図8Aは、注目リンクが幅優先探索開始前(以下、簡単のため「過去」という)に最短パスで、今回の幅優先探索が完了した時点(以下、簡単のため「現在」という)でも最短パスである場合の、差分情報判定テーブル208Aの一例を示している。   FIG. 8A shows that the link of interest is the shortest path before the start of breadth-first search (hereinafter referred to as “past” for simplicity), and the shortest path even when the current breadth-first search is completed (hereinafter referred to as “present” for simplicity). An example of the difference information determination table 208A in a case is shown.

このテーブル208Aでは、文書の状態変化が「削除」でリンクの状態変化が「削除」又は「存在」である場合、木構造の差分情報は「削除」となる。この差分情報の「削除」は、木構造において、注目リンクのリンク先文書を示す実ノードを、該リンクのリンク元文書を示すノードの子から「削除」することを意味している。すなわちこの場合、注目リンクを辿って到達したリンク先文書は、前回更新タイミングにはリンク元文書の子の実ノードとして存在したものであるが、今回の更新タイミングではその文書自体が削除されていることが判明したので、その実ノードを削除するというわけである。この場合、注目リンクのリンク元を親とするリンク先の実ノードが削除された旨を示す差分情報を木構造差分データ220に追加する。図9に示す木構造差分データ220のうち、末尾の文書6に対応するエントリが、この差分情報の一例である。ここで、リンクの状態変化が「存在」である場合は、更新後もハイパーテキスト上の注目リンクだけは残る(ただしこれは木構造とは関係がない)。   In this table 208A, when the document state change is “delete” and the link state change is “delete” or “exist”, the difference information of the tree structure is “delete”. This “deletion” of the difference information means that, in the tree structure, the real node indicating the link destination document of the target link is “deleted” from the child of the node indicating the link source document of the link. That is, in this case, the linked document that arrived by following the attention link exists as a child real node of the link source document at the previous update timing, but the document itself is deleted at the current update timing. It turns out that the real node is deleted. In this case, difference information indicating that the link-destination real node whose parent is the link source of the target link has been deleted is added to the tree structure difference data 220. Of the tree structure difference data 220 shown in FIG. 9, the entry corresponding to the last document 6 is an example of the difference information. Here, when the link state change is “existing”, only the attention link on the hypertext remains after updating (however, this is not related to the tree structure).

また、文書の状態変化が「更新」でリンクの状態変化が「存在」の場合は、差分情報が「更新」となる。すなわち、リンクの状態変化が「存在」で文書の状態変化が「更新」ということは、探索前も後も「最短パス」であることを考慮すると、当該文書は前回の更新タイミングでも今回の更新タイミングでもリンク元文書の子の実ノードであり、且つその文書の内容が更新されたことを意味する。したがって、木構造差分データ220には、木構造において、注目リンクのリンク元文書の子であるリンク先文書が内容更新された旨を示す差分情報を追加する。図9の木構造差分データ220のうち、先頭の文書5に対応するエントリが、この差分情報の一例である。なお、純粋に木構造の変化だけ分かればよい(すなわち文書内容の更新まではクライアント装置18に渡す木構造データ182に表現しない)場合は、この組合せに対しては木構造が変化無しとすればよい。 Also, when the document state change is “update” and the link state change is “exist”, the difference information is “update”. In other words, considering that the link state change is “existing” and the document state change is “update”, the document is updated this time even at the previous update timing, considering that it is the “shortest path” before and after the search. This means that it is a real node that is a child of the link source document at the timing, and the content of the document has been updated. Therefore, the tree structure the difference data 220, in the tree structure, add the difference information indicating that Oh lapis lazuli link destination document a child of the link source document of attention link is content update. The entry corresponding to the first document 5 in the tree structure difference data 220 in FIG. 9 is an example of the difference information. If it is sufficient to know only the change in the tree structure (that is, it is not expressed in the tree structure data 182 to be passed to the client device 18 until the document content is updated), it is assumed that the tree structure does not change for this combination. Good.

なお、リンクの状態変化が「新規」という状況は、リンクが過去に最短パスであったことと矛盾するので、起こりえない。また、リンクの状態変化が「非存在」である場合は、過去も現在も注目リンクがないので、木構造上にその注目リンクに対応する親子関係は過去も現在も存在しないことになり、結局過去と現在とで変化がないことになる。したがって、この場合はその注目リンクについての情報は木構造差分データ220に組み込む必要がない。また、文書の状態変化が「非存在」の場合も、その文書自体が過去も現在も存在しないので、木構造でも過去も現在もその文書が存在しない。すなわち、結局木構造に変化はない。   It should be noted that the situation where the link state change is “new” is inconsistent with the fact that the link was the shortest path in the past, and thus cannot occur. Also, if the link status change is “non-existent”, there is no link of interest in the past or present, so the parent-child relationship corresponding to the link of interest on the tree structure does not exist in the past or present. There will be no change between the past and the present. Therefore, in this case, it is not necessary to incorporate information about the target link into the tree structure difference data 220. Even when the state change of a document is “non-existing”, the document itself does not exist in the past or the present, and therefore the document does not exist in the tree structure or in the past or the present. That is, there is no change in the tree structure after all.

また、文書及び注目リンクの状態変化が共に「存在」である場合は、該注目リンクが過去も現在も最短パスであるという状況下では、過去も現在も該リンクのリンク先文書がリンク元文書の子の実ノードであることを示すので、木構造上での変化は無い。   Further, when the state change of both the document and the target link is “existing”, the link destination document of the link is the link source document in both the past and the current in the situation where the target link is the shortest path both in the past and the present. This indicates that this is a real node of the child, so there is no change in the tree structure.

また、文書の状態変化が「新規」という状況は、リンクが過去に最短パスであったことと矛盾するので、起こりえない。   Also, the situation where the state change of the document is “new” cannot occur because the link contradicts the shortest path in the past.

なお、注目リンクの状態変化が「削除」で、リンク先の文書の状態変化が「存在」又は「更新」の場合は、前回の更新タイミングでは該リンク先文書は木構造上でリンク元文書の子である実ノードとして存在していたが、今回のタイミングでは注目リンクが削除されたため、その親子関係がなくなっている。したがって、1つの考え方では、この差分情報テーブル208Aでは、それら2つの組合せに対応する差分情報を「削除」とすればよい。しかし、この場合、木構造情報提供サーバ12が木構造差分データ220を先頭から順に1差分情報ずつ処理していくタイプのものであった場合、この「削除」という差分情報を木構造差分データ220において該注目リンクの巡回順序の位置に組み込んでしまうと、木構造情報提供サーバ12はその差分情報を読み取った時、その注目リンクが示すリンク先文書を示す実ノードを削除してしまうため、次のような問題がある。   When the state change of the target link is “deleted” and the state change of the link destination document is “exist” or “update”, the link destination document is the link source document on the tree structure at the previous update timing. Although it exists as a real node that is a child, the parent-child relationship is lost because the link of interest is deleted at this timing. Therefore, according to one idea, in the difference information table 208A, the difference information corresponding to the two combinations may be “deleted”. However, in this case, if the tree structure information providing server 12 is of a type in which the tree structure difference data 220 is processed one difference information at a time from the top, the difference information “deleted” is used as the tree structure difference data 220. If the tree structure information providing server 12 reads the difference information, it deletes the actual node indicating the link destination document indicated by the attention link. There is a problem like this.

すなわちこの場合、その実ノードの削除により、木構造におけるその実ノードの子孫のノード群も削除されてしまうことになる(木構造だから、このような扱いが一般的である)。しかし、その実ノード及びその子孫ノード(以下、これらを「子孫ノード」と総称する)のいずれかは、後で別の文書からリンクされていると判明することもある。このような場合、別文書からリンクされていると判明した子孫ノードについては親が変わるだけで他の属性は変わらない。またその子孫ノードの子孫については親も他の属性もいっさい変化がない。このような場合、もっとも簡潔には、その子孫ノードの新たな親を示す差分情報をサーバ12に送ればよい。その子孫ノードの子孫については、親も他の属性も変化していないので、差分情報を送る必要はない。   That is, in this case, the deletion of the real node also deletes the node group of descendants of the real node in the tree structure (this kind of treatment is common because of the tree structure). However, either the real node or its descendant nodes (hereinafter collectively referred to as “descendant nodes”) may later be found to be linked from another document. In such a case, for a descendant node that has been found to be linked from another document, only the parent changes and other attributes do not change. Also, the descendants of the descendant node have no change in the parent or other attributes. In such a case, most simply, the difference information indicating the new parent of the descendant node may be sent to the server 12. For the descendants of the descendant node, there is no need to send difference information because neither the parent nor other attributes have changed.

ところが、いったん注目リンクのリンク先文書を示す実ノードを削除してしまうと、子孫ノードが別ノードの子であることが判明した場合、その実ノードを削除することを示す差分情報と、子孫ノードを新たに別ノードの子として「新規」に追加することを示す差分情報とをサーバ12に送る必要が出てくる。またその子孫ノードの子孫についても、直接の親ノードに変化がなくても、いったん削除されてしまっているので、「新規」に追加することを示す差分情報を送る必要が出てくる。これでは、上述した簡潔な差分情報に比べ、データ量が大きくなる。親の情報以外の属性も差分情報に含める場合は、差分情報の量はさらに大きくなってしまう。   However, once the real node indicating the link destination document of the link of interest is deleted, if it turns out that the descendant node is a child of another node, the difference information indicating that the real node is deleted and the descendant node are It becomes necessary to send to the server 12 difference information indicating that it is newly added as a child of another node. In addition, since the descendants of the descendant nodes have been deleted even if there is no change in the direct parent node, it is necessary to send difference information indicating that they are added to “new”. This increases the amount of data compared to the simple difference information described above. When attributes other than the parent information are also included in the difference information, the amount of difference information is further increased.

そこで、本実施形態では、図8Aのケースでは、注目リンクの状態変化が「削除」で、そのリンク先の文書の状態変化が「更新」又は「存在」である場合は、その注目リンクを辿った時点では、リンク先文書の実ノードを「削除」する旨の差分情報を木構造差分データ220に組み込まない。この代わりにこの時点では、該リンク先文書の実ノードについて、削除される可能性がある旨を示すフラグをオンにして、残りの探索を続行する。残りの探索で、その実ノード又はその子孫を指すリンクが見つかれば、そのフラグをオフにし、そのリンクに応じた差分情報を作成する。これにより、上述の問題が回避される。また、探索を最後まで行った段階で、その実ノードが一度も巡回されなかった場合は、削除を示すフラグがオンのままなので、その実ノードを削除する旨の差分情報を作成し、木構造差分データ220に追加する。このように、リンクが削除されても文書自体が存在し続ける場合は、木構造上でその文書に対応するノードを最終的に削除するかどうかが、ハイパーテキスト構造の探索が終了して初めて決定されるので、無駄な差分情報の発生を低減し、木構造差分データ220のデータ量を小さくすることができる。   Therefore, in the present embodiment, in the case of FIG. 8A, when the state change of the target link is “deleted” and the state change of the link destination document is “update” or “exist”, the target link is traced. At this time, the difference information indicating that the real node of the link destination document is “deleted” is not incorporated in the tree structure difference data 220. Instead, at this point, a flag indicating that there is a possibility that the actual node of the linked document may be deleted is turned on, and the remaining search is continued. If a link pointing to the real node or its descendants is found in the remaining search, the flag is turned off and difference information corresponding to the link is created. Thereby, the above-mentioned problem is avoided. Also, if the real node has never been visited at the end of the search, the deletion flag remains on, so the difference information to delete the real node is created and the tree structure difference data Add to 220. In this way, if the document itself continues to exist even after the link is deleted, whether or not the node corresponding to the document is finally deleted on the tree structure is determined only after the search of the hypertext structure is completed. Therefore, generation of useless difference information can be reduced, and the data amount of the tree structure difference data 220 can be reduced.

なお、以上は注目リンクの状態変化が「削除」で、そのリンク先の文書の状態変化が「更新」又は「存在」である場合の処理であったが、一般に実ノードを削除する旨の差分情報は、木構造差分データ220の末尾に組み込むようにすることで、木構造差分データ220のデータ量を小さくすることができる。   The above is processing when the state change of the target link is “deletion” and the state change of the link destination document is “update” or “existence”. By incorporating information at the end of the tree structure difference data 220, the data amount of the tree structure difference data 220 can be reduced.

図8Bは、注目リンクが、過去には最短パスであったが、現在は最短パスでないと判明した場合の、差分情報判定テーブル208Bの一例を示している。   FIG. 8B shows an example of the difference information determination table 208B when it is determined that the link of interest has been the shortest path in the past but is not currently the shortest path.

このテーブル208Bにおいて、リンクの状態変化が「新規」及び「非存在」の場合に該当する各縦列、及び文書の状態変化が「新規」及び「非存在」の場合に該当する各横行の内容は、上述のテーブル208Aの場合と同じ考え方である。   In this table 208B, the contents of each column corresponding to the case where the link state change is “new” and “non-existing” and the row corresponding to the case where the state change of the document is “new” and “non-existence” are as follows: This is the same idea as in the case of the table 208A described above.

また、文書の状態変化が「削除」でリンクの状態変化が「削除」又は「存在」である場合、木構造の差分情報は「削除」となる点も、テーブル208Aの場合と同様の考え方である。   Further, when the document state change is “delete” and the link state change is “delete” or “exist”, the difference information of the tree structure is “deleted”. is there.

また注目リンクの状態変化が「削除」で、リンク先文書の状態変化が「更新」又は「存在」の場合に、ノードの状態を変化させないのも、テーブル208Aの場合と同様の考え方である。   Further, when the state change of the link of interest is “deleted” and the state change of the link destination document is “update” or “exist”, the node state is not changed in the same way as in the case of the table 208A.

これに対し、注目リンクの状態変化が「存在」で、リンク先文書の状態変化が「更新」又は「存在」となるセルは、テーブル208Aの場合とは内容が異なる。このような状態変化の組合せは、そのリンク先文書は過去の時点では木構造上での実ノードであり、それが現時点では参照ノードに変わったことを意味する。したがって、これらの組合せでは、差分情報を「新規」且つ「最短パスでない」とする。この差分情報は、木構造において、注目リンクのリンク元の文書のノードに、リンク先の文書を示す参照(ショートカット)ノードを子として追加することを意味する。   On the other hand, the cell in which the state change of the target link is “existing” and the state change of the link destination document is “update” or “existing” is different from the case of the table 208A. Such a combination of state changes means that the linked document is a real node on the tree structure at the past time point, and has changed to a reference node at the present time point. Therefore, in these combinations, the difference information is “new” and “not the shortest path”. This difference information means that, in the tree structure, a reference (shortcut) node indicating the link destination document is added as a child to the link source document node of the target link.

図8Cは、注目リンクが、過去には最短パスでなかったが、現在は最短パスであると判明した場合の、差分情報判定テーブル208Cの一例を示している。   FIG. 8C shows an example of the difference information determination table 208C in the case where the link of interest has not been the shortest path in the past but is now found to be the shortest path.

このテーブル208Cにおいて、リンクの状態変化が「非存在」の場合に該当する縦列、及び文書の状態変化が「非存在」の場合に該当する横行の内容は、上述のテーブル208Aの場合と同じ考え方である。   In this table 208C, the contents corresponding to the column corresponding to the case where the link state change is “non-existing” and the row corresponding to the case where the document state change is “non-existing” are the same as those in the case of the above-described table 208A. It is.

リンクの状態変化が「新規」でかつ文書の状態変化が「新規」の場合は、文書もリンクも新規に出現したものである。ここで、そのリンクは最短パスなので、その組合せに対応する差分情報は、「新規」かつ「最短パスである」とする。この差分情報は、木構造において、注目リンクのリンク元の文書のノードに、リンク先の文書を示す実ノードを子として追加することを意味する。図9の例では、2行目の文書7に対応するエントリが、この場合の差分情報に該当する。   When the link state change is “new” and the document state change is “new”, both the document and the link appear newly. Here, since the link is the shortest path, the difference information corresponding to the combination is “new” and “is the shortest path”. This difference information means that, in the tree structure, a real node indicating the link destination document is added as a child to the link source document node of the link of interest. In the example of FIG. 9, the entry corresponding to the document 7 on the second line corresponds to the difference information in this case.

リンクの状態変化が「新規」でかつ文書の状態変化が「更新」及び「存在」の場合は、過去にその文書は存在していたがそのリンクは最短パスでなかった、すなわちその文書は実ノードではなかったところが、現在は最短パスになったのでその文書は実ノードになったことを意味する。このような組合せに対応するセルには「更新」かつ「最短パスである」の旨を示す情報が登録されている。図9に示す木構造差分データ220のうち、6行目の文書8に対応するエントリが、この情報から作成される差分情報の一例である。この差分情報は、文書8は実ノードであること、および文書7の子となるように「更新」されたことを示しているので、サーバ12は、木構造において文書8の実ノードを文書7を示す実ノードの子とする。   If the link status change is “new” and the document status changes are “update” and “exist”, the document existed in the past, but the link was not the shortest path. Although it was not a node, it is now the shortest path, meaning that the document has become a real node. Information indicating “update” and “is the shortest path” is registered in the cell corresponding to such a combination. In the tree structure difference data 220 shown in FIG. 9, the entry corresponding to the document 8 on the sixth line is an example of difference information created from this information. Since this difference information indicates that the document 8 is a real node and has been “updated” to be a child of the document 7, the server 12 changes the real node of the document 8 to the document 7 in the tree structure. Is a child of the real node that indicates

注目リンクの状態変化が「新規」でリンク先文書の状態変化が「削除」となる組合せでは、木構造に変化はないので差分情報を作成しなくてよい。   In the combination in which the state change of the target link is “new” and the state change of the linked document is “deleted”, there is no change in the tree structure, so it is not necessary to create difference information.

注目リンクの状態変化が「削除」であり、かつリンク先文書の状態変化が「更新」、「削除」、「存在」のいずれかである場合に対応するセルの内容は「削除」となる。この場合、過去に存在したリンク先文書を示すノードを削除する旨の差分情報が作成される。   If the state change of the link of interest is “deleted” and the state change of the link destination document is “update”, “delete”, or “exist”, the content of the corresponding cell is “deleted”. In this case, difference information indicating that a node indicating a link destination document existing in the past is deleted is created.

注目リンクの状態変化が「存在」であり、かつリンク先文書の状態変化が「新規」である組合せに対応するセルの内容は「新規」かつ「最短パスである」となる。この場合、リンク先文書を示す実ノードを、リンク元文書の子として追加する旨の差分情報が作成される。   The contents of the cell corresponding to the combination in which the state change of the target link is “existing” and the state change of the link destination document is “new” are “new” and “is the shortest path”. In this case, difference information indicating that the real node indicating the link destination document is added as a child of the link source document is created.

注目リンクの状態変化が「存在」であり、かつリンク先文書の状態変化が「更新」又は「存在」のいずれかである場合に対応するセルの内容は「本体更新」かつ「ショートカット削除」かつ「最短パスである」である。「本体更新」とは、過去には注目リンクのリンク先ノードの親が、リンク元ノード以外のノードであったものを、リンク元ノードへと更新することを意味する。また「ショートカット削除」とは、その更新に伴い、そのリンク元ノードの子として存在したリンク先ノードの参照ノード(ショートカット)を削除することを意味する。したがって、この場合、図9の例では、4及び5行目に示す、文書4及び文書4のショートカットに対応する2つのエントリが、差分情報として作成されることになる。   When the state change of the link of interest is “existing” and the state change of the linked document is “update” or “exist”, the contents of the corresponding cell are “main body update”, “shortcut deletion” and “It is the shortest path”. “Main body update” means that, in the past, the parent of the link destination node of the link of interest is a node other than the link source node, and is updated to the link source node. Also, “shortcut deletion” means that the reference node (shortcut) of the link destination node existing as a child of the link source node is deleted along with the update. Accordingly, in this case, in the example of FIG. 9, two entries corresponding to the shortcuts of the document 4 and the document 4 shown in the fourth and fifth lines are created as difference information.

注目リンクの状態変化が「存在」であり、かつリンク先文書の状態変化が「削除」である組合せに対応するセルの内容は「削除」となる。この場合、リンク先文書を示す参照ノードを、リンク元文書の子から削除する旨の差分情報が作成される。   The contents of the cell corresponding to the combination in which the state change of the target link is “existing” and the state change of the link destination document is “deletion” is “deletion”. In this case, difference information indicating that the reference node indicating the link destination document is deleted from the child of the link source document is created.

図8Dは、注目リンクが、過去には最短パスでなく、現在も最短パスでないと判明した場合の、差分情報判定テーブル208Dの一例を示している。   FIG. 8D shows an example of the difference information determination table 208D when it is determined that the link of interest is not the shortest path in the past and is not the shortest path at present.

このテーブル208Dにおいて、リンクの状態変化が「非存在」の場合に該当する縦列、及び文書の状態変化が「非存在」の場合に該当する横行の内容は、上述のテーブル208Aの場合と同じ考え方である。   In this table 208D, the column corresponding to the case where the link state change is “non-existing” and the content of the horizontal row corresponding to the case where the document state change is “non-existing” are the same as in the case of the above-described table 208A. It is.

注目リンクの状態変化が「新規」でかつリンク先文書の状態変化が「新規」、「更新」、又は「存在」のいずれかである場合、過去では注目リンクが存在しなかったので、木構造中にはそのリンク先文書に対応するノードもなかった。これに対し、現在ではその注目リンクが新規に生成され、かつ現在はリンク先文書の存在しているので、木構造に新たなノードを加えることになる。ただし、その注目リンクは最短パスではないので、新規追加するノードは参照ノードである。このようなことから、それらの組合せに対応するセルの内容は、「新規」かつ「最短パスでない」となる。図9の例では、3行目の文書1のショートカットに対応するエントリが、このような差分情報の一例となる。   If the status change of the attention link is “new” and the status change of the linked document is “new”, “update”, or “existence”, the attention link did not exist in the past, so the tree structure There was no node corresponding to the linked document. On the other hand, since the attention link is newly generated and the link destination document currently exists, a new node is added to the tree structure. However, since the link of interest is not the shortest path, the newly added node is a reference node. For this reason, the contents of the cells corresponding to these combinations are “new” and “not the shortest path”. In the example of FIG. 9, the entry corresponding to the shortcut of the document 1 on the third line is an example of such difference information.

注目リンクの状態変化が「新規」でリンク先文書の状態変化が「削除」となる組合せでは、木構造に変化はないので差分情報を作成しなくてよい。   In the combination in which the state change of the target link is “new” and the state change of the linked document is “deleted”, there is no change in the tree structure, so it is not necessary to create difference information.

注目リンクの状態変化が「削除」であり、かつリンク先文書の状態変化が「更新」、「削除」、「存在」のいずれかである場合に対応するセルの内容は「削除」となる。この場合、注目リンク自身が削除されるのでそのリンクのリンク先に該当する木構造のノードは消滅する。したがって、過去に存在したリンク先文書を示すノードを削除する旨の差分情報が作成される。   If the state change of the link of interest is “deleted” and the state change of the link destination document is “update”, “delete”, or “exist”, the content of the corresponding cell is “deleted”. In this case, since the target link itself is deleted, the tree-structured node corresponding to the link destination of the link disappears. Therefore, difference information indicating that a node indicating a linked document existing in the past is deleted is created.

注目リンクの状態変化が「存在」であり、かつリンク先文書の状態変化が「新規」である組合せに対応するセルの内容は「新規」となる。この場合、リンク先文書を示す参照ノードを、リンク元文書の子として追加する旨の差分情報が作成される。   The content of the cell corresponding to the combination in which the state change of the target link is “existing” and the state change of the link destination document is “new” is “new”. In this case, difference information indicating that the reference node indicating the link destination document is added as a child of the link source document is created.

注目リンクの状態変化が「存在」であり、かつリンク先文書の状態変化が「更新」又は「存在」のいずれかである場合は、該リンク先文書は過去には参照ノード(過去最短パスでないから)であり、現在も参照ノードのまま(現在も最短パスでないから)であるので、木構造には変化が起こらない。このため、差分情報を作成する必要がない。   When the state change of the target link is “existing” and the state change of the link destination document is “update” or “exist”, the link destination document is not a reference node (not a past shortest path) in the past. Since the current node is still a reference node (since it is not the shortest path at present), the tree structure does not change. For this reason, it is not necessary to create difference information.

注目リンクの状態変化が「存在」であり、かつリンク先文書の状態変化が「削除」である組合せに対応するセルの内容は「削除」となる。この場合、リンク先文書を示す実ノードを、リンク元文書の子として追加する旨の差分情報が作成される。   The contents of the cell corresponding to the combination in which the state change of the target link is “existing” and the state change of the link destination document is “deletion” is “deletion”. In this case, difference information indicating that the real node indicating the link destination document is added as a child of the link source document is created.

以上に説明した差分情報判定テーブル208A〜Dと図7Bの収集後リンクテーブル212とを用い、ハイパーテキスト構造の幅優先探索によって作成された木構造差分データ220の一例が図9に示される。   FIG. 9 shows an example of the tree structure difference data 220 created by the breadth-first search of the hypertext structure using the difference information determination tables 208A to 208D described above and the post-collection link table 212 of FIG. 7B.

この差分データ220の各行は、それぞれ1つの差分情報に該当する。1つの差分情報は、「文書ID」、「操作」、「親文書ID」及び「他の属性」から構成される。「文書ID」と「親文書ID」の組は、木構造において前者が後者の子であることを示す。「操作」は、木構造の更新のための操作内容を示している。   Each row of the difference data 220 corresponds to one difference information. One difference information includes “document ID”, “operation”, “parent document ID”, and “other attributes”. A set of “document ID” and “parent document ID” indicates that the former is the latter child in the tree structure. “Operation” indicates an operation content for updating the tree structure.

「操作」の内容が「新規」である場合、「親文書ID」の子として「文書ID」のノードを木構造に新規に追加する。   When the content of “operation” is “new”, a node of “document ID” is newly added to the tree structure as a child of “parent document ID”.

「操作」の内容が「更新」である場合は、木構造において「文書ID」が示す実ノードの親を「親文書ID」のノードへと変更する。これは、同時に、その「文書ID」の実ノードと、前回更新タイミングでの親との親子関係を削除することを含意している。例えば、図9の4行目には、文書4の実ノードを文書5の子へと変える「更新」処理が示されているが、これには、前回更新タイミング(図3A)に存在した文書2と文書4の親子関係の削除を伴っている。サーバ12は、差分情報の「操作」内容が「更新」である場合、その差分情報に示される文書の実ノードの親が、前回更新タイミングでのその文書の実ノードの親と異なっていれば、上記のような親子関係の変更を行う。   When the content of “operation” is “update”, the parent of the real node indicated by “document ID” in the tree structure is changed to the node of “parent document ID”. This implies that the parent-child relationship between the real node of the “document ID” and the parent at the previous update timing is deleted at the same time. For example, the fourth line in FIG. 9 shows an “update” process for changing the real node of the document 4 to a child of the document 5, which includes the document that existed at the previous update timing (FIG. 3A). 2 and document 4 are deleted. When the “operation” content of the difference information is “update”, the server 12 determines that the parent of the actual node of the document indicated in the difference information is different from the parent of the actual node of the document at the previous update timing. The parent-child relationship is changed as described above.

なお、差分情報の「操作」内容が「更新」である場合には、文書の内容が変更された場合も含まれる。サーバ12は、差分情報の「操作」内容が「更新」である場合、差分情報が示す文書の実ノードに親子関係が変更されたか否かを判定し、変更されていなければ、その文書の内容が更新されたものと判断する。   Note that when the “operation” content of the difference information is “update”, the case where the content of the document is changed is also included. If the “operation” content of the difference information is “update”, the server 12 determines whether or not the parent-child relationship has been changed to the actual node of the document indicated by the difference information, and if not, the content of the document Is determined to have been updated.

「操作」の内容が「削除」である場合は、「親文書ID」の子である「文書ID」のノードを木構造から削除する。   When the content of “operation” is “delete”, the node of “document ID” that is a child of “parent document ID” is deleted from the tree structure.

なお、この差分データの各行のエントリと、図3A及びBに示した構造変化との関係は既に説明したのでここでは省略する。   Since the relationship between the entry of each row of the difference data and the structural change shown in FIGS. 3A and 3B has already been described, the description is omitted here.

このように、図9のような木構造差分データ220を作成し、サーバ12に送信すれば、サーバ12は木構造を更新することが可能となる。   In this way, if the tree structure difference data 220 as shown in FIG. 9 is created and transmitted to the server 12, the server 12 can update the tree structure.

再び図4に戻り、木構造情報収集装置16は、このように作成された木構造差分データ220を木構造情報提供サーバ12に送信する(S14)。   Returning to FIG. 4 again, the tree structure information collection device 16 transmits the tree structure difference data 220 created in this way to the tree structure information providing server 12 (S14).

木構造情報提供サーバ12は、その木構造差分データ220を受信し(S20)、そのデータ220に従って、記憶装置122に記憶された、差分データ送信元の木構造情報収集装置16に対応する木構造データを更新する(S22)。   The tree structure information providing server 12 receives the tree structure difference data 220 (S20), and in accordance with the data 220, the tree structure corresponding to the tree structure information collecting apparatus 16 of the difference data transmission source stored in the storage device 122. Data is updated (S22).

なお、木構造情報収集装置16は、木構造差分データ220をサーバ12に送信すると、収集後文書テーブル210及び収集後リンクテーブル212から、次の更新タイミングにおける「前回」文書テーブル204及び「前回」リンクテーブル206を作成する。すなわち、収集後文書テーブル210及び収集後リンクテーブル212は、文書及びリンクの過渡的な「状態変化」を示したものなので、その「状態変化」を「状態」へと書き換える。図10は、その書換の規則を示したものである。図10の規則では、状態変化が「新規」、「更新」及び「存在」である場合、それを「存在」という状態に変換する。また、状態変化が「削除」又は「非存在」であった場合は、それを「非存在」という状態に変換する。   When the tree structure information collection device 16 transmits the tree structure difference data 220 to the server 12, the “previous” document table 204 and “previous” at the next update timing are retrieved from the post-collection document table 210 and post-collection link table 212. A link table 206 is created. That is, since the post-collection document table 210 and the post-collection link table 212 indicate the transient “state change” of the document and link, the “state change” is rewritten to “state”. FIG. 10 shows the rewriting rules. In the rule of FIG. 10, when the state changes are “new”, “update”, and “exist”, they are converted into a state of “exist”. If the state change is “deleted” or “non-existing”, it is converted into a state of “non-existing”.

また、この変換ではハイパーテキスト構造を幅優先探索で探索した時に求めた最短パスか否かの情報を、リンクテーブルに反映させる。   In this conversion, information on whether or not the shortest path is obtained when the hypertext structure is searched by the breadth-first search is reflected in the link table.

以上のような書換により得られた文書テーブル204’及びリンクテーブル206’は、図11及び図12に示すようなものとなる。これらは、図6B及び図7Bのテーブルをそれぞれ書き換えることで作成される。   The document table 204 ′ and the link table 206 ′ obtained by the rewriting as described above are as shown in FIGS. 11 and 12. These are created by rewriting the tables in FIGS. 6B and 7B, respectively.

以上、本発明の実施形態を説明した。以上の説明から分かるように、本実施形態によれば、木構造情報収集装置16による木構造差分データ220の作成処理の際、木構造の探索に該当する処理としては、ハイパーテキスト構造の幅優先探索を1度行うだけでよいので、木構造を2回探索していた従来技術よりも処理負荷が軽減される。また、前回の木構造データという膨大なデータを保存しておかなくてよいので、装置16の記憶容量も節約できる。   The embodiments of the present invention have been described above. As can be seen from the above description, according to the present embodiment, when the tree structure information collection device 16 creates the tree structure difference data 220, the process corresponding to the tree structure search includes a hypertext structure breadth-first search. Therefore, the processing load is reduced as compared with the conventional technique in which the tree structure is searched twice. Further, since it is not necessary to save a huge amount of data such as the previous tree structure data, the storage capacity of the device 16 can be saved.

以上に説明した木構造情報提供サーバ12及び木構造情報収集装置16は、一般的なコンピュータシステムのハードウエアを用いて、本明細書中で説明した各機能モジュールの処理内容を記述したプログラムを実行することで、実現することができる。   The tree structure information providing server 12 and the tree structure information collecting apparatus 16 described above execute a program describing the processing contents of each functional module described in this specification using hardware of a general computer system. This can be realized.

以上に説明した実施形態は、あくまで例示のためのものであり、本発明の範囲内で様々な変形が可能である。例えば、以上の例では、木構造情報提供サーバ12は、ある顧客企業に対してはその企業の社内ネットワーク内の文書の木構造情報を提供したが、社内文書の木構造をインターネット10上に公開されている文書群の木構造にマージし、そのマージ結果を提供することもできる。また、以上の例では、木構造差分データ220を作成するのに、ハイパーテキスト構造を幅優先探索の規則に従って巡回したが、この代わりに、深さ優先探索規則など他の探索規則を利用した方式でもよい。   The embodiments described above are merely examples, and various modifications can be made within the scope of the present invention. For example, in the above example, the tree structure information providing server 12 provided the tree structure information of a document in the company's internal network to a certain customer company, but the tree structure of the company document is disclosed on the Internet 10. It can also be merged into the tree structure of the existing documents and provide the merge result. In the above example, the hypertext structure is circulated according to the breadth-first search rule to create the tree structure difference data 220. Alternatively, a method using another search rule such as a depth-first search rule may be used. Good.

また、以上の説明は、木構造差分データを取得したクライアント装置側での木構造の表示には特に詳しくは触れなかったが、実際にはクライアント装置側での木構造の表示では、木構造を構成する個々の文書の識別のために、木構造表示(ツリー表示)上の各文書のアイコンに対し文書名を表示する。この文書名の表示において注意すべき点がある。   In addition, the above explanation did not touch on the display of the tree structure on the client device side that acquired the tree structure difference data in detail, but actually the tree structure is not displayed on the client device side. In order to identify individual documents constituting the document, a document name is displayed for each document icon on the tree structure display (tree display). There are some points to be noted when displaying this document name.

すなわち、ウェブ文書の文書名としてまず考えられるのが該文書のファイル名或いはURLであるが、これでは見る人が文書を識別しづらいという問題がある。これに対する解決としては、ウェブ文書のHTML記述に含まれるタイトル(<TITLE>タグで示される)を文書名として表示するという方法がある。タイトルは、一般に見る人に分かりやすいフレーズであることが多いため、これはこれで一つのよい解決策である。しかしながら、この方法には欠点がある。これを、図13を参照して説明する。   That is, the file name or URL of the document is first considered as the document name of the web document. However, there is a problem that it is difficult for the viewer to identify the document. As a solution to this, there is a method of displaying a title (indicated by a <TITLE> tag) included in an HTML description of a web document as a document name. This is a good solution because the title is often a phrase that is generally easy for the viewer to understand. However, this method has drawbacks. This will be described with reference to FIG.

図13は、クライアント装置の表示装置に表示されるブラウザ画面400の一例を示す図である。このブラウザ画面400には、ウェブ文書を表示する文書表示画面410と、ナビゲーションのために文書群の木構造を表示するツリー表示画面420を含んでいる。ツリー表示画面420には、木構造情報提供サーバ12が提供する木構造のデータとその差分データに基づき構成された文書の木構造が、ファイルシステムにおけるフォルダやファイルがなす木構造と同様の表示方式で示されている。ファイルシステムのツリーの方はフォルダとファイルとの包含関係を示すのに対し、文書の木構造の場合は文書間のリンク元とリンク先の関係を示すところが違うだけである。このツリー表示画面420では、個々の文書はHTML記述中のタイトル文字列を示したアイコン422で示される。   FIG. 13 is a diagram illustrating an example of the browser screen 400 displayed on the display device of the client device. The browser screen 400 includes a document display screen 410 that displays a web document and a tree display screen 420 that displays a tree structure of a document group for navigation. In the tree display screen 420, the tree structure data provided by the tree structure information providing server 12 and the tree structure of the document configured based on the difference data are displayed in the same manner as the tree structure formed by folders and files in the file system. It is shown in The file system tree shows the inclusion relationship between folders and files, whereas the document tree structure is different only in the relationship between the link source and link destination between documents. In the tree display screen 420, each document is indicated by an icon 422 indicating a title character string in the HTML description.

ここで問題になるのは、ツリー表示中の文書としてタイトル文字列を表示したアイコン422を表示すると、ウェブ文書表示中でのリンク記述412と文言上の食い違いが生じるという点である。ウェブ文書中では、リンク先の文書は、アンカーテキスト(アンカータグ<A href=URL>と</A>との間に挟まれた文字列。表示上では一般に下線などで他と区別される)として示されるが、このアンカーテキストはリンク元の文書の作成者が自由に記述するものであり、そのリンク先文書中に記述されたタイトルとは独立にしているので、両者は一般に一致しない。ツリー表示上の文書名と、実際のウェブ文書に現れるリンク記述が異なると、ユーザはツリー表示上の文書が実際のどのウェブ文書を指しているのかが把握しづらい。   The problem here is that, when the icon 422 displaying the title character string is displayed as a document being displayed in the tree, there is a discrepancy in wording with the link description 412 in the Web document display. In a web document, the linked document is an anchor text (a character string sandwiched between anchor tags <A href=URL> and </A>. On the display, it is generally distinguished from others by an underline) However, since the anchor text is freely described by the creator of the link source document and is independent of the title described in the link destination document, they generally do not match. If the document name on the tree display is different from the link description appearing on the actual web document, it is difficult for the user to grasp which actual web document the document on the tree display indicates.

これはツリー表示の文書名としてタイトルを表示した場合のことであるが、ファイル名を文書名とした場合も同様か、それ以上にユーザにとって分かりづらくなると考えられる。   This is the case where the title is displayed as the document name in the tree display. However, it is considered that the file name is the same as the document name, or it becomes more difficult for the user to understand.

これに対し、図14に示すように、ツリー表示画面420A中の各文書のアイコン422Aに示される文書名が、ウェブ文書中のリンク記述412と一致していると、ユーザにとってツリー表示画面420に示される個々の文書がどの文書であるかを把握しやすいという利点がある。   On the other hand, as shown in FIG. 14, when the document name indicated by the icon 422A of each document in the tree display screen 420A matches the link description 412 in the web document, the tree display screen 420 is displayed to the user. There is an advantage that it is easy to grasp which document is an individual document to be displayed.

ここで、本実施形態のように個々の木構造情報収集装置16から中央の木構造情報提供サーバ12に対し木構造の差分データを送信するシステムの場合、図14のような表示を実現するためには、収集装置15がウェブ文書中でのリンク記述のアンカーテキストの変化を検出し、その変化をサーバ12に伝える仕組みが必要となる。このような仕組みについての変形例を以下に説明する。   Here, in the case of the system that transmits the differential data of the tree structure from the individual tree structure information collecting device 16 to the central tree structure information providing server 12 as in the present embodiment, the display as shown in FIG. 14 is realized. Requires a mechanism in which the collection device 15 detects a change in the anchor text of the link description in the web document and transmits the change to the server 12. A modified example of such a mechanism will be described below.

なお、この変形例は、システム及び装置の構成は図1及び2に示した上記実施形態のものと同様でよく、収集部162や差分データ作成部164,木構造更新部128の処理内容が異なるだけである。   In this modification, the configuration of the system and apparatus may be the same as that of the above embodiment shown in FIGS. 1 and 2, and the processing contents of the collection unit 162, the difference data creation unit 164, and the tree structure update unit 128 are different. Only.

この変形例では、ウェブの巡回によるリンク収集の際に収集部162が、リンクのURLだけでなく、それに伴うアンカーテキストも同時に収集し、これをリンクの属性の1つとしてリンクテーブルに記録する。ウェブのサーフィングにおけるユーザにとっては、アンカーテキストは、当該リンクのリンク先の文書を識別するための識別名として機能しているので、この例ではアンカーテキストを当該リンク先文書の「参照名」として取り扱う。すなわち、リンクテーブルには、リンクのアンカーテキストを当該リンクの属性の一つである参照名の値として登録する。そして、差分データ作成部164が、前回リンクテーブル206中の各リンクの参照名(アンカーテキスト)と、収集によって得られた収集後リンクテーブル212中の各リンクの参照名とを比較し、同一のリンクに対する参照名が更新の前後で変化している場合に、この変化を示す情報を木構造差分データ220に組み込んで木構造情報提供サーバ12に送る。   In this modification, the collecting unit 162 collects not only the URL of the link but also the accompanying anchor text at the time of collecting the link by visiting the web, and records this in the link table as one of the link attributes. For users in web surfing, the anchor text functions as an identification name for identifying the link destination document of the link. In this example, the anchor text is used as the “reference name” of the link destination document. handle. That is, the link anchor text is registered in the link table as the value of the reference name, which is one of the link attributes. Then, the difference data creation unit 164 compares the reference name (anchor text) of each link in the previous link table 206 with the reference name of each link in the post-collection link table 212 obtained by the collection, and the same When the reference name for the link changes before and after the update, information indicating this change is incorporated into the tree structure difference data 220 and sent to the tree structure information providing server 12.

木構造情報提供サーバ12は、ユーザに分かりやすいツリー表示を提供するために、各文書の文書名としてその文書へと至るリンクの参照名を示した木構造データ124をクライアント装置18に提供する。ここでは、ハイパーテキスト構造を木構造に展開したため、同一の文書に対し複数の文書からリンクが張られている場合、木構造上にはそれら各リンクに応じた複数のノード(上記実施形態ではそのうち初出のものが実ノード、残りが参照用ノード)ができるが、この変形例では、それら各ノードに対し、それぞれそのノードへのリンクが示すアンカーテキストが参照名として登録されることになる。このような木構造データ124を保守するために、木構造更新部128は、木構造収集装置16から受け取った木構造差分データ220に基づき木構造データ124を更新する際、差分データ220中に示される参照名の変更の情報に応じ、木構造データ124中の文書の参照名を変更する。   In order to provide a user-friendly tree display, the tree structure information providing server 12 provides the client device 18 with tree structure data 124 indicating the reference name of the link leading to the document as the document name of each document. Here, since the hypertext structure is expanded into a tree structure, when links are made from a plurality of documents to the same document, a plurality of nodes corresponding to each link on the tree structure (in the above embodiment, of which In this modification, the anchor text indicated by the link to each node is registered as a reference name for each of these nodes. In order to maintain such tree structure data 124, the tree structure update unit 128 updates the tree structure data 124 based on the tree structure difference data 220 received from the tree structure collection device 16. The reference name of the document in the tree structure data 124 is changed according to the reference name change information.

以上の処理を、例を用いて説明する。ある更新タイミングで図15Aに示すような状態であったハイパーテキスト構造が、次の更新タイミングで図15Bに示すようになった場合を例にとる。本変形例ではリンクテーブル210に各リンクのアンカーテキストを参照名として登録するので、図15Aの状態に対応する前回リンクテーブル206a(図16A参照)、及び図15Bの状態に対応する収集後リンクテーブル212a(図16B参照)には「参照名」のデータ項目が設けられている。図15A及び図15Bの例は、図3A及び図3Bの例に対し文書ID「9」の文書を加えたものであり、前回と今回との差分では、文書ID「5」の文書から文書ID「9」のリンクの参照名が更新されている点以外は図3A及び図3Bの例と同じである。同様に図16A及び図16Bに示した各リンクテーブルは、図7A及び図7Bの各リンクテーブルに対し、文書ID「9」の文書へのリンクについてのレコードを追加したものである。なお、図15A及び図15B、図16A及び図16Bでは、それぞれ図3A及び図3B、図7A及び図7Bとそれぞれ同内容の部分には薄墨を付すことで差を明示している。   The above process will be described using an example. For example, assume that the hypertext structure in the state shown in FIG. 15A at a certain update timing becomes as shown in FIG. 15B at the next update timing. In this modification, the anchor text of each link is registered as a reference name in the link table 210, so the previous link table 206a (see FIG. 16A) corresponding to the state of FIG. 15A and the post-collection link table corresponding to the state of FIG. 15B. A data item “reference name” is provided in 212a (see FIG. 16B). The example of FIGS. 15A and 15B is obtained by adding the document with the document ID “9” to the example of FIGS. 3A and 3B. The difference between the previous time and the current time indicates that the document ID has the document ID “5”. It is the same as the example of FIG. 3A and FIG. 3B except that the reference name of the link “9” is updated. Similarly, each link table shown in FIGS. 16A and 16B is obtained by adding a record about a link to the document with the document ID “9” to each link table in FIGS. 7A and 7B. In FIGS. 15A and 15B, and FIGS. 16A and 16B, the difference is clearly shown by attaching a thin ink to the same contents as FIGS. 3A and 3B, and FIGS. 7A and 7B, respectively.

この例では、図16A及び図16Bから分かるように、文書ID「5」の文書から「9」の文書へのリンクに対する参照名が、前回の更新タイミングで収集した際は「提案書書式」であったのに対し、今回の収集タイミングで収集した際は「アイデアシート」に変わっている。差分データ作成部164は、前回リンクテーブル206aと収集後リンクテーブル212aの比較から、そのように参照名が変化している文書「5」から「9」へのリンクを探し出す。そして差分データ作成部164は、この参照名の変化の情報を、図17に示すように、当該リンクのリンク先文書である文書「9」についての差分情報(図17のテーブルの最下行)として木構造差分データ220aに組み込む。この木構造差分データ220aには、図9に示した木構造差分データ220の各データ項目に加え、「参照名」のデータ項目が設けられており、自分に対するリンクの参照名に変化のあった文書の差分情報レコードには、「操作」の値として「更新」が、「参照名」の値として変更後の参照名「アイデアシート」が組み込まれる。   In this example, as can be seen from FIGS. 16A and 16B, when the reference names for the link from the document with the document ID “5” to the document with the document “9” are collected at the previous update timing, the “proposal form” is used. In contrast, when it was collected at this collection timing, it changed to an “idea sheet”. The difference data creation unit 164 finds a link from the document “5” to “9” whose reference name has changed as described above, by comparing the previous link table 206a and the post-collection link table 212a. Then, as shown in FIG. 17, the difference data creation unit 164 uses the change information of the reference name as difference information (the bottom row of the table of FIG. 17) regarding the document “9” that is the link destination document of the link. It is incorporated in the tree structure difference data 220a. In this tree structure difference data 220a, in addition to the data items of the tree structure difference data 220 shown in FIG. 9, a data item of “reference name” is provided, and the reference name of the link to itself has changed. In the difference information record of the document, “update” is incorporated as the value of “operation”, and the changed reference name “idea sheet” is incorporated as the value of “reference name”.

なお、図17の例では、煩雑さを避けるために省略したが、木構造差分データ220aのある文書の差分情報の「操作」の値が「新規」である場合には、その文書(または参照用のショートカット・ノード)が新たに木構造に加わったことを意味するので、今回の収集により得たその文書の参照名(アンカーテキスト)をその差分情報レコードに組み込む。また、ある文書の「操作」の値がアンカーテキストの変更以外の理由で「更新」となる場合には、親文書の変更による場合があり、親文書が変われば一般に当該文書を指すアンカーテキストの内容も変わる。したがって、「操作」の値が「更新」となるケース一般で、差分情報レコードに対して今回の収集時に得た当該文書の参照名を組み込むようにする。また、図9の例では、「操作」が「更新」となるのは実ノードに該当する文書の差分情報レコードであったが、この変形例ではアンカーテキストの変更でも「操作」を「更新」とするため、参照用のショートカット・ノードに対応する差分情報レコードについても「操作」が「更新」となる場合が出てくる。   Although omitted in the example of FIG. 17 to avoid complication, if the “operation” value of the difference information of a document having the tree structure difference data 220a is “new”, the document (or reference) This means that the reference name (anchor text) of the document obtained by the current collection is included in the difference information record. Also, if the value of “Operation” of a document is “update” for reasons other than the change of the anchor text, it may be due to the change of the parent document, and if the parent document changes, the anchor text that generally points to the document is changed. The contents also change. Therefore, in general cases where the value of “operation” is “update”, the reference name of the document obtained at the time of the current collection is incorporated into the difference information record. In the example of FIG. 9, “operation” is “update” in the difference information record of the document corresponding to the real node. However, in this modification, “operation” is “update” even when the anchor text is changed. Therefore, the “operation” may be “update” for the difference information record corresponding to the reference shortcut node.

このような木構造差分データ220aを木構造情報収集装置16から受信した木構造情報提供サーバ12は、該差分データ220aに含まれる各文書の差分情報レコードの参照名の値(もしあれば)を、現在の木構造データ124中の当該文書のノードの参照名と比較し、両者が相違していれば、木構造データ124中の参照名を差分情報レコード中の参照に変更する。なお、木構造差分データ220a中の「新規」の文書については、その文書を示すノードを「親文書ID」が示すノードの子ノードとして木構造データ124中に作成し、当該文書のノードに対し、木構造差分データ220a中に示された参照名を設定する。   The tree structure information providing server 12 that has received the tree structure difference data 220a from the tree structure information collection device 16 uses the value of the reference name (if any) of the difference information record of each document included in the difference data 220a. Compared with the reference name of the node of the document in the current tree structure data 124, if both are different, the reference name in the tree structure data 124 is changed to the reference in the difference information record. For a “new” document in the tree structure difference data 220a, a node indicating the document is created in the tree structure data 124 as a child node of the node indicated by the “parent document ID”, and the node of the document is determined. The reference name shown in the tree structure difference data 220a is set.

このように、本変形例では、木構造情報収集装置16が文書中のリンクに設定されたアンカーテキストの変化をハイパーテキストのリンク構造の変化と同様に検知し、この変化の情報を木構造差分データ220aに組み込んで木構造情報提供サーバ12に送信するようにしたので、木構造情報提供サーバ12は、クライアント装置18に対し、ウェブ・サーフィングの際のリンクの表示(アンカーテキスト)との整合性の高い文書名を示したツリー表示を提供することができる(図14参照)。   As described above, in this modification, the tree structure information collection device 16 detects a change in the anchor text set for the link in the document in the same manner as the change in the link structure of the hypertext, and detects the change information as a tree structure difference. Since it is incorporated in the data 220a and transmitted to the tree structure information providing server 12, the tree structure information providing server 12 matches the display of the link (anchor text) during web surfing to the client device 18. A tree display showing highly likely document names can be provided (see FIG. 14).

なお、この変形例では、木構造の各ノード(文書)に対しアンカーテキストを参照名として表示するので、ウェブ・サーフィングとの整合性が分かりやすい反面、実ノードと参照用のショートカット・ノードとの間で、それらノードが指している文書が同一の実体であるのか否かが分かりにくくなるというデメリットがある。これに対しては、木構造中の文書のノードに対し、アンカーテキストに加え、当該文書のファイル名(或いはURL)及び当該文書のHTML記述中のタイトルのうちの少なくとも一方を、参照名として設定し、ツリー表示中では1つの文書に対するそれら複数種類の名称を並べて表示する方法が好適である。このように並べて表示するモードと、アンカーテキストのみを表示するモードの両方をクライアント装置18のブラウザに設け、モード選択できるようにすることも好適である。なお、この場合、木構造情報収集装置16は、アンカーテキストの場合と同様の方法で、文書中のリンクのリンク先文書のタイトルを収集し、タイトルに変化がある場合には変化後のタイトルを属性として含んだ当該リンクの差分情報レコードを木構造差分データ220aに組み込むようにすればよい。なお、リンク先の文書のファイル名(或いはURL)の方は、巡回リスト202を参照して付加すればよい。すなわち、更新タイミングごとに、前回の更新タイミングからの巡回リスト202の差分(初回タイミングのみ巡回リスト202全体)又は、巡回リスト202を木構造情報収集装置16から木構造情報提供サーバ12へ提供すれば、木構造データ124の各文書のノードに対し、ファイル名やURLの情報を付加することができる。   In this modification, the anchor text is displayed as a reference name for each node (document) in the tree structure, so that the consistency with the web surfing is easy to understand, but the real node and the reference shortcut node There is a demerit that it becomes difficult to understand whether or not the documents pointed to by these nodes are the same entity. For this, in addition to the anchor text, at least one of the file name (or URL) of the document and the title in the HTML description of the document is set as a reference name for the document node in the tree structure. In the tree display, it is preferable to display the plural types of names for one document side by side. It is also preferable to provide both a mode for displaying side by side and a mode for displaying only anchor text in the browser of the client device 18 so that the mode can be selected. In this case, the tree structure information collecting device 16 collects the titles of the linked documents of the links in the document in the same manner as in the case of the anchor text, and if there is a change in the title, the changed title is displayed. The difference information record of the link included as an attribute may be incorporated into the tree structure difference data 220a. The file name (or URL) of the linked document may be added by referring to the circulation list 202. That is, for each update timing, if the difference of the circulation list 202 from the previous update timing (only the first timing is the entire circulation list 202) or the circulation list 202 is provided from the tree structure information collecting device 16 to the tree structure information providing server 12. The file name and URL information can be added to each document node of the tree structure data 124.

なお、この変形例は、以上に示した処理手順の他に次のような処理手順でも実現可能である。   This modified example can also be realized by the following processing procedure in addition to the processing procedure described above.

この処理手順では、リンクの状態として新たに「更新」という状態を導入し、リンク状態が「更新」の場合についての規定を含んだ差分情報判定テーブルを用いて、木構造差分データを作成する。   In this processing procedure, a state of “update” is newly introduced as a link state, and tree structure difference data is created using a difference information determination table including a rule for a case where the link state is “update”.

このため木構造情報収集装置16の収集部162は、収集した文書中のリンク記述のアンカーテキストと、これに対応する前回リンクテーブル206aに示されたリンクの参照名との比較に基づき、リンクの参照名が更新されたことを検知すると、図18に示すように収集後リンクテーブル212aの該当するリンクの状態変化欄に「更新」と設定する。   Therefore, the collection unit 162 of the tree structure information collection device 16 determines the link based on the comparison between the link description anchor text in the collected document and the link reference name shown in the previous link table 206a corresponding to the link description. When it is detected that the reference name is updated, “update” is set in the state change column of the corresponding link in the post-collection link table 212a as shown in FIG.

このようにして収集部162により収集後リンクテーブル212a等の作成が終わると、次に差分データ作成部164が、図19A〜図19Dに示すような差分情報判定テーブル208E〜208Hを用いて、差分データを作成する。差分情報判定テーブル208E〜208Hは、図8A〜Dに示した差分情報判定テーブル208A〜208Dにそれぞれ順に対応するものである。図8A〜Dの場合と異なるのは、リンク状態変化が「更新」に該当する列だけなので、以下ではその列のケースに該当する場合についてのみ説明する。   When the collection unit 162 finishes creating the post-collection link table 212a and the like in this way, the difference data creation unit 164 then uses the difference information determination tables 208E to 208H as shown in FIGS. Create data. The difference information determination tables 208E to 208H correspond to the difference information determination tables 208A to 208D shown in FIGS. 8A to 8D are different from the case where the link state change corresponds to “update”, only the case corresponding to the case of that column will be described below.

木構造差分データの作成の際のリンク探索において、注目リンクが過去に最短パスであり現在も最短パスの場合は、図19Aの差分情報判定テーブル208Eが参照される。このとき、注目リンクの状態変化が「更新」の場合を考える。この場合、リンク先の文書の状態変化が「新規」や「非存在」となることはあり得ない。一方、リンク先の文書の状態変化が「更新」の場合は、注目リンクの状態変化が「存在」の場合と同様、当該文書の内容が更新されたことを意味すると共に、当該文書の参照名も更新されたことを意味する。そこで、この注目リンクについては、木構造差分データに対し、「操作」の値が「更新」で、参照名が更新後の値となった差分情報を組み込む(図17参照)。更新後の参照名は、収集後リンクテーブル212aから検索すればよい。また、リンク先の文書の状態変化が「削除」の場合は、文書自体が削除されるので木構造の差分情報は「削除」となる。また、リンク先文書の状態変化が「存在」の場合は、当該文書自体に変化はないが参照名は変更されたと言うことであり、この場合、「操作」が「更新」となり、収集後リンクテーブル212aから検索した当該リンクの参照名を含んだ差分情報を作成する。   In the link search when creating the tree structure difference data, if the target link is the shortest path in the past and is still the shortest path, the difference information determination table 208E in FIG. 19A is referred to. At this time, let us consider a case where the state change of the attention link is “update”. In this case, the state change of the linked document cannot be “new” or “non-existent”. On the other hand, if the status change of the linked document is “updated”, it means that the content of the document has been updated and the reference name of the document is the same as when the status change of the target link is “exist”. Also means it has been updated. Therefore, for this attention link, the difference information in which the value of “operation” is “update” and the reference name is the updated value is incorporated into the tree structure difference data (see FIG. 17). The updated reference name may be retrieved from the post-collection link table 212a. Further, when the state change of the linked document is “deleted”, the document itself is deleted, and thus the difference information of the tree structure is “deleted”. Also, if the status change of the linked document is “existing”, it means that the document itself has not changed, but the reference name has been changed. In this case, “operation” becomes “update”, and the link after collection Difference information including the reference name of the link retrieved from the table 212a is created.

次に、注目リンクが過去に最短パスであったが、現在は最短パスでない場合は、図19Bの差分情報判定テーブル208Fが参照される。このとき、注目リンクの状態変化が「更新」の場合を考える。この場合、リンク先の文書の状態変化が「新規」や「非存在」となることはあり得ない。一方、リンク先の文書の状態変化が「削除」の場合は、文書自体が削除されるので木構造の差分情報は「削除」となる。また、リンク先の文書の状態変化が「更新」又は「存在」の場合は、注目リンクの状態変化が「存在」の場合と同様、当該文書は参照(ショートカット)ノードとなり、そのリンクは最短パスではなくなる。したがって、操作が「新規」であり、かつ「最短パスでない」という情報を含み、かつ収集後リンクテーブル212aから求めた参照名を含んだ差分情報を作成する。   Next, when the link of interest has been the shortest path in the past, but is not currently the shortest path, the difference information determination table 208F in FIG. 19B is referred to. At this time, let us consider a case where the state change of the attention link is “update”. In this case, the state change of the linked document cannot be “new” or “non-existent”. On the other hand, when the state change of the linked document is “deleted”, the document itself is deleted, and thus the difference information of the tree structure is “deleted”. In addition, when the state change of the link destination document is “update” or “exist”, the document becomes a reference (shortcut) node as in the case where the state change of the target link is “exist”, and the link has the shortest path. Is not. Therefore, difference information including the information that the operation is “new” and “not the shortest path” and including the reference name obtained from the post-collection link table 212a is created.

次に、注目リンクが過去に最短パスでなかったが、現在は最短パスである場合は、図19Cの差分情報判定テーブル208Gが参照される。このとき、注目リンクの状態変化が「更新」の場合を考えると、リンク先の文書の状態変化が「非存在」となることはあり得ない。一方、リンク先の文書の状態変化が「削除」の場合は、文書自体が削除されるので木構造の差分情報は「削除」となる。また、リンク先の文書の状態変化が「新規」の場合は、その文書が新たに実ノードとなり、かつ参照名が更新されたということなので、差分情報としては操作が「新規」でかつ「最短パスである」という情報と、更新後の参照名を含んだレコードを作成し木構造差分データに組み込む。また、リンク先の文書の状態変化が「更新」又は「存在」の場合は、参照(ショートカット)ノードであったものが実ノードになったということなので、操作が「更新」であり、かつ「最短パスである」という情報を含み、かつ収集後リンクテーブル212aから求めた参照名を含んだ差分情報を作成する。   Next, when the link of interest has not been the shortest path in the past, but is currently the shortest path, the difference information determination table 208G in FIG. 19C is referred to. At this time, if the state change of the target link is “update”, the state change of the linked document cannot be “non-existent”. On the other hand, when the state change of the linked document is “deleted”, the document itself is deleted, and thus the difference information of the tree structure is “deleted”. Also, if the status change of the linked document is “new”, it means that the document has become a new real node and the reference name has been updated. Therefore, as the difference information, the operation is “new” and “shortest” A record including the information “is a path” and the updated reference name is created and incorporated in the tree structure difference data. Further, when the state change of the linked document is “update” or “exist”, it means that the reference (shortcut) node has become a real node, so the operation is “update” and “ Difference information including the information “is the shortest path” and including the reference name obtained from the post-collection link table 212a is created.

最後に、注目リンクが過去に最短パスでなく、現在も最短パスでない場合は、図19Dの差分情報判定テーブル208Gが参照される。このとき、注目リンクの状態変化が「更新」の場合を考えると、リンク先の文書の状態変化が「非存在」となることはあり得ない。一方、リンク先の文書の状態変化が「削除」の場合は、文書自体が削除されるので木構造の差分情報は「削除」となる。また、リンク先の文書の状態変化が「新規」の場合は、テーブル208Gにおけるその組合せに対応するセルの内容は「新規」となる。この場合、リンク先文書を示す参照ノードを、リンク元文書の子として追加する旨と、その参照名とを含んだ差分情報が作成される。また、リンク先の文書の状態変化が「更新」又は「存在」の場合は、リンク先の文書は参照(ショートカット)ノードのままであり、参照名が変化したと言うことなので、操作が「更新」であり、かつ収集後リンクテーブル212aから求めた参照名を含んだ差分情報が作成され、木構造差分データに組み込まれる。   Finally, when the link of interest is not the shortest path in the past and is not the shortest path at present, the difference information determination table 208G in FIG. 19D is referred to. At this time, if the state change of the target link is “update”, the state change of the linked document cannot be “non-existent”. On the other hand, when the state change of the linked document is “deleted”, the document itself is deleted, and thus the difference information of the tree structure is “deleted”. If the status change of the linked document is “new”, the contents of the cell corresponding to the combination in the table 208G are “new”. In this case, difference information including the fact that the reference node indicating the link destination document is added as a child of the link source document and the reference name is created. If the status change of the linked document is “update” or “exist”, the linked document remains the reference (shortcut) node and the reference name has changed, so the operation is “update”. And the difference information including the reference name obtained from the post-collection link table 212a is created and incorporated in the tree structure difference data.

以上説明した処理により、参照名の変更の情報を含んだ木構造差分データを作成することができる。   Through the processing described above, tree structure difference data including information on changing a reference name can be created.

本発明が適用されるシステムの全体構成の一例を示す図である。It is a figure which shows an example of the whole structure of the system with which this invention is applied. 木構造情報提供サーバ12及び木構造情報収集装置16の機能モジュール構成の一例を示す図である。It is a figure which shows an example of a functional module structure of the tree structure information provision server 12 and the tree structure information collection device 16. ある社内ネットワーク内の文書群が、前回の木構造更新タイミングにおいて構成していたハイパーテキスト構造を示す図である。It is a figure which shows the hypertext structure which the document group in a certain internal network comprised at the last tree structure update timing. 同じ社内ネットワーク内の文書群が、今回の木構造更新タイミングにおいて構成しているハイパーテキスト構造を示す図である。It is a figure which shows the hypertext structure which the document group in the same company network comprises at this tree structure update timing. 本実施形態のシステムにおける木構造データの更新処理の流れを示す図である。It is a figure which shows the flow of the update process of the tree structure data in the system of this embodiment. 巡回リストのデータ内容の一例を示す図であるIt is a figure which shows an example of the data content of a circulation list. 前回文書テーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the last document table. 収集後文書テーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the document table after collection. 前回リンクテーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the last time link table. 収集後リンクテーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the link table after collection. 差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of a difference information determination table. 差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of a difference information determination table. 差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of a difference information determination table. 差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of a difference information determination table. 木構造差分データの一例を示す図である。It is a figure which shows an example of tree structure difference data. 収集後文書テーブル及び収集後リンクテーブルの書換規則を示す図である。It is a figure which shows the rewriting rule of the post-collection document table and the post-collection link table. 書換により得られた、次回更新タイミングで用いる「前回文書テーブル」のデータ内容に一例を示す図である。It is a figure which shows an example in the data content of the "previous document table" used at the next update timing obtained by rewriting. 書換により得られた、次回更新タイミングで用いる「前回リンクテーブル」のデータ内容に一例を示す図である。It is a figure which shows an example in the data content of the "previous link table" used at the next update timing obtained by rewriting. 木構造を用いた文書ナビゲーションにおける文書名表示の問題を説明するための図である。It is a figure for demonstrating the problem of the document name display in the document navigation using a tree structure. ユーザにとって分かりやすい文書名表示の例を示す図である。It is a figure which shows the example of a document name display easy for a user to understand. ある時点でのハイパーテキスト構造を示す図である。It is a figure which shows the hypertext structure in a certain time. 図15Aのハイパーテキスト構造が変更(文書内のアンカーテキストの変更を含む)された後の構造を示す図である。FIG. 15B is a diagram showing the structure after the hypertext structure of FIG. 15A has been changed (including change of anchor text in the document). ユーザにとって分かりやすい文書名表示を実現するための変形例における前回リンクテーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the last link table in the modification for implement | achieving a document name display easy for a user. ユーザにとって分かりやすい文書名表示を実現するための変形例における収集後リンクテーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the link table after collection in the modification for implement | achieving a document name display easy for a user. ユーザにとって分かりやすい文書名表示を実現するための変形例において作成される木構造差分データの一例を示す図である。It is a figure which shows an example of the tree structure difference data produced in the modification for implement | achieving a document name display easy for a user. 変形例の別の処理手順で生成される収集後リンクテーブルのデータ内容の一例を示す図である。It is a figure which shows an example of the data content of the post-collection link table produced | generated in another process sequence of a modification. 変形例の別の処理手順で用いる差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of the difference information determination table used in another process procedure of a modification. 変形例の別の処理手順で用いる差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of the difference information determination table used in another process procedure of a modification. 変形例の別の処理手順で用いる差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of the difference information determination table used in another process procedure of a modification. 変形例の別の処理手順で用いる差分情報判定テーブルの一例を示す図である。It is a figure which shows an example of the difference information determination table used in another process procedure of a modification.

符号の説明Explanation of symbols

10 インターネット、12 木構造情報提供サーバ、14a,14b,14c 社内ネットワーク、16 木構造情報収集装置、162 収集部、164 差分データ作成部、200 記憶装置、202 巡回リスト、204 前回文書テーブル、206 前回リンクテーブル、208 差分情報判定テーブル、210 収集後文書テーブル、212 収集後リンクテーブル。   10 Internet, 12 Tree structure information providing server, 14a, 14b, 14c Internal network, 16 Tree structure information collection device, 162 Collection unit, 164 Difference data creation unit, 200 Storage device, 202 Travel list, 204 Previous document table, 206 Previous time Link table, 208 difference information determination table, 210 post-collection document table, 212 post-collection link table.

Claims (5)

ネットワーク上の文書群が構成するハイパーテキスト構造の変化に応じて該ハイパーテキスト構造を表現する木構造データを更新するために、前記ハイパーテキスト構造の変化に対応する木構造データの変化を示す木構造差分データを作成する装置であって、
前記ハイパーテキスト構造の変化の前の時点で各文書が前記ハイパーテキスト構造上に存在するか否かを表す情報が登録された更新前文書テーブルと、
前記ハイパーテキスト構造の変化の前の時点で前記ハイパーテキスト構造上に存在する各文書間リンクが登録された更新前リンクテーブルと、
前記更新前文書テーブル及び前記更新前リンクテーブルを参照しつつ前記変化の後の文書群を調査することにより、前記変化により前記ハイパーテキスト構造に対し追加及び削除された文書及びリンクを検出し、この検出結果を参照しつつ所定の先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿ることにより、前記木構造データの変化を示す木構造差分データを作成する差分処理部と、
を備え、
前記差分処理部は、
前記更新前文書テーブルに登録された文書群、及びそれら各文書のリンク先の文書群を前記ネットワーク上から収集し、それら各文書が取得できたか否かに基づき、それら各文書が前記変化の前から存在し且つ文書内容が更新されていないもの、前記変化の前から存在し且つ文書内容が更新されたもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後文書テーブルを作成する第1の処理と、
前記ネットワーク上から収集した各文書に含まれる文書間リンク群と、前記更新前リンクテーブルに登録されている文書間リンク群との比較に基づき、各文書間リンクが前記変化の前から存在するもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後リンクテーブルを作成する第2の処理と、
前記先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿る際、該文書間リンクの状態及びこの文書間リンクが示すリンク先の文書の状態を前記収集後文書テーブル及び前記収集後リンクテーブルから検索し、検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに基づき、(a)前記木構造データにおいて前記文書間リンクの示すリンク元の文書に対応するノードの子として前記文書間リンクの示すリンク先の文書に対応するノードが追加されるという変更内容、(b)前記木構造データにおいて前記文書間リンクの示すリンク先の文書に対応するノードが前記文書間リンクの示すリンク元の文書に対応するノードの子から削除されるという変更内容、及び(c)前記木構造データにおいて前記文書間リンクの示すリンク先の文書に対応するノードに関して前記リンク先の文書の内容が更新されるという変更内容、のうちのいずれかに該当する変更が前記木構造データに加えられたと判定される場合にその変更内容を示すデータを木構造差分データに追加する第3の処理と、
を実行すると共に、
前記差分処理部は、前記文書間リンクの状態と前記リンク先の文書の状態との組合せと、該組合せに対応する木構造データの変更の有無及び変更がある場合の変更内容と、を示す変更規則テーブルを有し、前記変更内容には、前記(a)、前記(b)、及び前記(c)の少なくとも3種類が含まれ、前記第3の処理において前記変化の後のハイパーテキスト構造の文書間リンクを辿る際に、前記収集後文書テーブル及び前記収集後リンクテーブルからの検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに対応する変更内容が該変更規則テーブルから求められた場合には求められた変更内容に該当する変更が前記木構造データに加えられたと判定する、
ことを特徴とする木構造差分データ作成装置。
In response to changes in the hypertext structure documents on the network is configured, in order to update the tree structure data representing the hypertext structure, tree showing the change of the tree structure data corresponding to a change in the hypertext structure An apparatus for creating structural difference data,
A pre-update document table in which information indicating whether each document exists on the hypertext structure at a time before the change of the hypertext structure is registered;
A pre-update link table in which links between documents existing on the hypertext structure at the time before the change of the hypertext structure are registered;
By examining the document group after the change while referring to the pre-update document table and the pre-update link table, a document and a link added to and deleted from the hypertext structure due to the change are detected. A differential processing unit that creates a tree structure difference data indicating a change in the tree structure data by tracing an inter-document link of the hypertext structure after the change in order from a predetermined head document while referring to a detection result;
With
The difference processing unit
Said pre-update document table registered document group, and collects the linked document group thereof each document from over the network, based on whether or not acquired their respective documents, they each document, the change Among those that existed before and the document content has not been updated, those that existed before the change and the document content has been updated, those that have been added due to the change, and those that have been deleted due to the change A first process for creating a post-collection document table that indicates which is,
Based on a comparison between an inter-document link group included in each document collected from the network and an inter-document link group registered in the pre-update link table, each inter-document link exists before the change. A second process of creating a post-collection link table that indicates which one of the one added by the change and the one deleted by the change;
When tracing the inter-document link of the hypertext structure after the change in order from the top document, the post-collection document table and the post-collection state of the inter-document link state and the link destination document indicated by the inter-document link are indicated. Based on a combination of the state of the link between documents and the state of the link-destination document retrieved from the link table, and (a) the link source document indicated by the link between documents in the tree structure data A change that a node corresponding to the link destination document indicated by the inter-document link is added as a child of the corresponding node; (b) a node corresponding to the link destination document indicated by the inter-document link in the tree structure data Is deleted from the child of the node corresponding to the link source document indicated by the inter-document link, and (c) the tree structure data And a change corresponding to any one of the change contents that the contents of the link destination document are updated with respect to the node corresponding to the link destination document indicated by the inter-document link is added to the tree structure data A third process for adding data indicating the change contents to the tree structure difference data when determined;
As well as
The difference processing unit is a change indicating a combination of the inter-document link state and the link-destination document state, presence / absence of a change in the tree structure data corresponding to the combination, and a change content when there is a change. The change contents include at least three types (a), (b), and (c), and the hypertext structure after the change in the third process is included in the change contents. When the inter-document link is traced, the change contents corresponding to the combination of the state of the inter-document link obtained by the search from the post-collection document table and the post-collection link table and the state of the link destination document are When determined from the change rule table, it is determined that a change corresponding to the determined change content has been added to the tree structure data .
A tree structure difference data creation device characterized by that.
請求項1記載の木構造差分データ作成装置であって、
前記更新前リンクテーブルは、前記各文書間リンクが前記先頭文書から該文書間リンクのリンク先の文書への最短パスに該当するか否かを示す最短パス情報を有し、
前記差分処理部は、複数の変更規則テーブルを有し、前記変化の後のハイパーテキスト構造の文書間リンクを辿っていくときにそれら各文書間リンクが前記先頭文書から該文書間リンクのリンク先の文書への最短パスに該当するかどうかを判定し、この判定結果と、前記更新前テーブルにおける該文書間リンクの最短パス情報との組合せに対応する変更規則テーブルを用いること特徴とする木構造差分データ作成装置。
The tree structure difference data creation device according to claim 1,
The pre-update link table has shortest path information indicating whether each inter-document link corresponds to a shortest path from the first document to a link destination document of the inter-document link,
The difference processing unit has a plurality of change rule tables, and when tracing the inter-document link of the hypertext structure after the change, each inter-document link is linked to the inter-document link from the first document. A tree structure using a change rule table corresponding to a combination of the determination result and the shortest path information of the inter-document link in the pre-update table Differential data creation device.
請求項1記載の木構造差分データ作成装置であって、前記差分処理部は、前記先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿る際、前記リンク先の文書に対応するノードを前記木構造データから削除する変更が必要と判断した場合、その変更内容を示すデータをその時点で木構造差分データに追加することはせず、残りのすべての文書間リンクを辿り終わった時点で前記リンク先の文書への文書間リンクがまったく見つからなかった場合に初めて、その変更内容を示すデータを木構造差分データに追加する、ことを特徴とする木構造差分データ作成装置。   The tree structure difference data creation device according to claim 1, wherein the difference processing unit corresponds to the link destination document when following the hypertext structure inter-document link after the change in order from the first document. When it is determined that a change to delete the node from the tree structure data is necessary, the data indicating the change content is not added to the tree structure difference data at that time, and all remaining inter-document links are traced. A tree structure difference data creation device that adds data indicating the change contents to the tree structure difference data only when no inter-document link to the link destination document is found at the time. 請求項1記載の木構造差分データ作成装置であって、
前記更新前リンクテーブルには、前記文書間リンクごとに、該文書間リンクが記述された文書中で該文書間リンクに対応づけて記述されたアンカーテキストが登録されると共に、
前記差分処理部は、前記ネットワーク上から収集した各文書に含まれる各文書間リンクに付されたアンカーテキストを検出し、該アンカーテキストを該文書間リンクに対応づけて前記収集後リンクテーブルに登録すると共に、前記更新前リンクテーブルと前記収集後リンクテーブルとの間で同一の文書間リンクに対するアンカーテキストが異なる場合、該文書間リンクのアンカーテキストが前記収集後リンクテーブルに示されたアンカーテキストに変更された旨を示すデータを前記木構造差分データに追加する、
ことを特徴とする木構造差分データ作成装置。
The tree structure difference data creation device according to claim 1,
In the pre-update link table, for each inter-document link, an anchor text described in association with the inter-document link in the document in which the inter-document link is described is registered,
The difference processing unit detects an anchor text attached to each inter-document link included in each document collected from the network, and registers the anchor text in the post-collection link table in association with the inter-document link. When the anchor text for the same inter-document link is different between the pre-update link table and the post-collection link table, the anchor text of the inter-document link is changed to the anchor text indicated in the post-collection link table. Adding data indicating the change to the tree structure difference data;
A tree structure difference data creation device characterized by that.
ネットワーク上の文書群が構成するハイパーテキスト構造の変化に応じて該ハイパーテキスト構造を表現する木構造データを更新するために、コンピュータシステムを、前記ハイパーテキスト構造の変化に対応する木構造データの変化を示す木構造差分データを作成する装置として機能させるためのプログラムであって、該コンピュータシステムを、
前記ハイパーテキスト構造の変化の前の時点で各文書が前記ハイパーテキスト構造上に存在するか否かを表す情報が登録された更新前文書テーブル、
前記ハイパーテキスト構造の変化の前の時点で前記ハイパーテキスト構造上に存在する各文書間リンクが登録された更新前リンクテーブル、
前記更新前文書テーブル及び前記更新前リンクテーブルを参照しつつ前記変化の後の文書群を調査することにより、前記変化により前記ハイパーテキスト構造に対し追加及び削除された文書及びリンクを検出し、この検出結果を参照しつつ所定の先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿ることにより、前記木構造データの変化を示す木構造差分データを作成する差分処理部、
として機能させるとともに、
前記差分処理部は、
前記更新前文書テーブルに登録された文書群、及びそれら各文書のリンク先の文書群を前記ネットワーク上から収集し、それら各文書が取得できたか否かに基づき、それら各文書が前記変化の前から存在し且つ文書内容が更新されていないもの、前記変化の前から存在し且つ文書内容が更新されたもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後文書テーブルを作成する第1の処理と、
前記ネットワーク上から収集した各文書に含まれる文書間リンク群と、前記更新前リンクテーブルに登録されている文書間リンク群との比較に基づき、各文書間リンクが前記変化の前から存在するもの、前記変化により追加されたもの、及び前記変化により削除されたもの、のうちのいずれであるかを示す収集後リンクテーブルを作成する第2の処理と、
前記先頭文書から順に前記変化の後のハイパーテキスト構造の文書間リンクを辿る際、該文書間リンクの状態及びこの文書間リンクが示すリンク先の文書の状態を前記収集後文書テーブル及び前記収集後リンクテーブルから検索し、検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに基づき、(a)前記木構造データにおいて前記文書間リンクの示すリンク元の文書に対応するノードの子として前記文書間リンクの示すリンク先の文書に対応するノードが追加されるという変更内容、(b)前記木構造データにおいて前記文書間リンクの示すリンク先の文書に対応するノードが前記文書間リンクの示すリンク元の文書に対応するノードの子から削除されるという変更内容、及び(c)前記木構造データにおいて前記文書間リンクの示すリンク先の文書に対応するノードに関して前記リンク先の文書の内容が更新されるという変更内容、のうちのいずれかに該当する変更が前記木構造データに加えられたと判定される場合にその変更内容を示すデータを木構造差分データに追加する第3の処理と、
を実行すると共に、
前記差分処理部は、前記文書間リンクの状態と前記リンク先の文書の状態との組合せと、該組合せに対応する木構造データの変更の有無及び変更がある場合の変更内容と、を示す変更規則テーブルを有し、前記変更内容には、前記(a)、前記(b)、及び前記(c)の少なくとも3種類が含まれ、前記第3の処理において前記変化の後のハイパーテキスト構造の文書間リンクを辿る際に、前記収集後文書テーブル及び前記収集後リンクテーブルからの検索により得られた前記文書間リンクの状態と前記リンク先の文書の状態との組合せに対応する変更内容が該変更規則テーブルから求められた場合には求められた変更内容に該当する変更が前記木構造データに加えられたと判定する、
ことを特徴とするプログラム。
In order to update the tree structure data representing the hypertext structure according to the change of the hypertext structure formed by the documents on the network, the computer system changes the tree structure data corresponding to the change of the hypertext structure. A program for causing a computer system to function as a device for creating tree structure difference data indicating:
A pre-update document table in which information indicating whether each document exists on the hypertext structure at a time before the change of the hypertext structure is registered;
A link table before update in which links between documents existing on the hypertext structure at the time before the change of the hypertext structure are registered;
By examining the document group after the change while referring to the pre-update document table and the pre-update link table, a document and a link added to and deleted from the hypertext structure due to the change are detected. A differential processing unit that creates a tree structure difference data indicating a change in the tree structure data by following a hypertext structure inter-document link after the change in order from a predetermined head document while referring to a detection result,
As well as
The difference processing unit
Document groups registered in the pre-update document table and link destination document groups of the respective documents are collected from the network, and based on whether or not each of the documents has been acquired, the respective documents are changed before the change. Existing in the document and the document content has not been updated, one that has existed before the change and the document content has been updated, one that has been added due to the change, and one that has been deleted due to the change A first process of creating a post-collection document table indicating whether or not
Based on a comparison between an inter-document link group included in each document collected from the network and an inter-document link group registered in the pre-update link table, each inter-document link exists before the change. A second process of creating a post-collection link table that indicates which one of the one added by the change and the one deleted by the change;
When tracing the inter-document link of the hypertext structure after the change in order from the top document, the post-collection document table and the post-collection state of the inter-document link state and the link destination document indicated by the inter-document link are indicated. Based on a combination of the state of the link between documents and the state of the link-destination document retrieved from the link table, and (a) the link source document indicated by the link between documents in the tree structure data A change that a node corresponding to the link destination document indicated by the inter-document link is added as a child of the corresponding node; (b) a node corresponding to the link destination document indicated by the inter-document link in the tree structure data Is deleted from the child of the node corresponding to the link source document indicated by the inter-document link, and (c) the tree structure data And a change corresponding to any one of the change contents that the contents of the link destination document are updated with respect to the node corresponding to the link destination document indicated by the inter-document link is added to the tree structure data A third process for adding data indicating the change contents to the tree structure difference data when determined;
As well as
The difference processing unit is a change indicating a combination of the inter-document link state and the link-destination document state, presence / absence of a change in the tree structure data corresponding to the combination, and a change content when there is a change. The change contents include at least three types (a), (b), and (c), and the hypertext structure after the change in the third process is included in the change contents. When the inter-document link is traced, the change contents corresponding to the combination of the state of the inter-document link obtained by the search from the post-collection document table and the post-collection link table and the state of the link destination document are When determined from the change rule table, it is determined that a change corresponding to the determined change content has been added to the tree structure data .
A program characterized by that.
JP2004123428A 2003-08-29 2004-04-19 Tree structure differential data creation device Expired - Fee Related JP4539151B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004123428A JP4539151B2 (en) 2003-08-29 2004-04-19 Tree structure differential data creation device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003305880 2003-08-29
JP2004123428A JP4539151B2 (en) 2003-08-29 2004-04-19 Tree structure differential data creation device

Publications (2)

Publication Number Publication Date
JP2005100331A JP2005100331A (en) 2005-04-14
JP4539151B2 true JP4539151B2 (en) 2010-09-08

Family

ID=34467354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004123428A Expired - Fee Related JP4539151B2 (en) 2003-08-29 2004-04-19 Tree structure differential data creation device

Country Status (1)

Country Link
JP (1) JP4539151B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006301975A (en) * 2005-04-20 2006-11-02 Canon Inc Information processing device, information processing method and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001067260A (en) * 1999-08-30 2001-03-16 Jisedai Joho Hoso System Kenkyusho:Kk Transmitting device and transmitting method, receiving device and receiving method, and transmitting and receiving system and transmitting and receiving method
JP2002117073A (en) * 2000-10-04 2002-04-19 Sharp Corp Newly-arrived information presenting method, recording medium with recorded program implementing the method, and computer running the program
JP2003150584A (en) * 2001-11-16 2003-05-23 Nec Corp Multi-multi-template management system and method therefor and multi-multi-template management program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001067260A (en) * 1999-08-30 2001-03-16 Jisedai Joho Hoso System Kenkyusho:Kk Transmitting device and transmitting method, receiving device and receiving method, and transmitting and receiving system and transmitting and receiving method
JP2002117073A (en) * 2000-10-04 2002-04-19 Sharp Corp Newly-arrived information presenting method, recording medium with recorded program implementing the method, and computer running the program
JP2003150584A (en) * 2001-11-16 2003-05-23 Nec Corp Multi-multi-template management system and method therefor and multi-multi-template management program

Also Published As

Publication number Publication date
JP2005100331A (en) 2005-04-14

Similar Documents

Publication Publication Date Title
US6604099B1 (en) Majority schema in semi-structured data
JP4704750B2 (en) Link generation system
US8090740B2 (en) Search-centric hierarchichal browser history
US7392303B2 (en) Method for preserving referential integrity within web sites
US20050120292A1 (en) Device, method, and computer program product for generating information of link structure of documents
US10176173B1 (en) Method and apparatus for hyperlink list navigation
US7162686B2 (en) System and method for navigating search results
WO2007105759A1 (en) Mathematical expression structured language object search system and search method
US6981037B1 (en) Method and system for using access patterns to improve web site hierarchy and organization
JP2000222088A (en) Information providing server, intermediation server and browser terminal
US20060031771A1 (en) Method and code module for facilitating navigation between webpages
JP2005078296A (en) Device and method for creating document group structure data
JP4750628B2 (en) Information ranking method and apparatus, program, and computer-readable recording medium
JP4513437B2 (en) Program and apparatus for creating tree structure information
JP4610543B2 (en) Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program
JP2004206492A (en) Method for displaying document and gateway device having function of selecting link partner
JP2009075908A (en) Web page browsing history management system, web page browsing history management method, and computer program
JP4539151B2 (en) Tree structure differential data creation device
JPH09146962A (en) Method and device for supporting information space access
JP3999093B2 (en) Structured document search method and structured document search system
JP2000172680A (en) System and method for registering document, recording medium for executing the method, system and method for browsing document, recording medium for executing the method and document extracting system
JP4567581B2 (en) Operation search method and apparatus, and computer-readable recording medium
US20040177113A1 (en) Method, system, and article of manufacture for display of hierarchical data
JP4254511B2 (en) Tree structure data creation device and method
JPH07219835A (en) Decentralized hyper text device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100601

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100614

R150 Certificate of patent or registration of utility model

Ref document number: 4539151

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140702

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees