JP5187064B2 - Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method - Google Patents
Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method Download PDFInfo
- Publication number
- JP5187064B2 JP5187064B2 JP2008210003A JP2008210003A JP5187064B2 JP 5187064 B2 JP5187064 B2 JP 5187064B2 JP 2008210003 A JP2008210003 A JP 2008210003A JP 2008210003 A JP2008210003 A JP 2008210003A JP 5187064 B2 JP5187064 B2 JP 5187064B2
- Authority
- JP
- Japan
- Prior art keywords
- resource
- web resource
- web
- link
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、Web資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法に係り、特に1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を追跡する為のWeb資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法に関する。 The present invention relates to a Web resource tracking management program, a Web resource tracking management apparatus, and a Web resource tracking management method, and more particularly, to a resource transferred from a first Web resource including one or more resources per page to another Web resource. The present invention relates to a Web resource tracking management program, a Web resource tracking management apparatus, and a Web resource tracking management method for tracking.
近年、インターネットやイントラネット等のネットワーク上のWeb資源へのアクセス技術が、よく利用されるようになっている。Webページ等のWeb資源へのアクセス技術は検索システム,Webアノテーションシステム,Webブラウザ,ブックマークシステムなどで利用されている。 In recent years, techniques for accessing Web resources on a network such as the Internet or an intranet are often used. Access technology to Web resources such as Web pages is used in search systems, Web annotation systems, Web browsers, bookmark systems, and the like.
検索システムは、ネットワーク上のWebページに対して、あらかじめインデックスを用意しておき、検索時に与えられたクエリー(処理要求)に対してインデックスを参照してWebページの所在情報(例えばURL)を返すものである。 The search system prepares an index in advance for a Web page on the network, and returns the location information (for example, URL) of the Web page by referring to the index for a query (processing request) given at the time of search. Is.
一方、Webアノテーションシステムはネットワーク上のWebページに対して、そのWebページの作者と異なる別の第三者が、そのWebページに対し、二次情報として付箋,下線又はマーカなどのアノテーションを付与し、そのWebページの閲覧時に、付与したアノテーションをWebページと同時に表示したり、又は付与したアノテーションに基づいた処理をWebページに加えたりするものである。 On the other hand, in the Web annotation system, another third party different from the author of the Web page gives an annotation such as a tag, underline, or marker as secondary information to the Web page on the network. When the Web page is browsed, the added annotation is displayed at the same time as the Web page, or processing based on the added annotation is added to the Web page.
通常はWebページにアノテーションが付与されたとき、そのWebページのURLを保持しておき、そのURLで指定されるWebページの閲覧時にアノテーションを復元することで、時間をおいてのWebページの閲覧や、アノテーションを付与したアノテータと異なる第三者による閲覧であってもアノテーションを復元するものである。 Normally, when an annotation is added to a web page, the URL of the web page is stored, and the annotation is restored when the web page specified by the URL is browsed, so that the web page can be browsed over time. In addition, the annotation is restored even when browsing by a third party different from the annotator with the annotation.
これら検索システムやWebアノテーションシステム等は、Webページに含まれる記事などの資源の所在が時間を経ても変わらない場合、有効に作用する。しかし、ブログやニュース等のフロー型情報を扱うサイトでは、一つのURLで指定されるWebページに一つあるいは複数の記事を有する。また、ブログやニュース等のフロー型情報を扱うサイトでは、時間とともに別の記事が追加され、Webページ内の構成が変更される。 These search systems, Web annotation systems, and the like work effectively when the location of resources such as articles included in a Web page does not change over time. However, sites that handle flow-type information such as blogs and news have one or more articles on a Web page specified by a single URL. In addition, in sites that handle flow-type information such as blogs and news, other articles are added over time, and the configuration of the Web page is changed.
上述したように、検索システムやWebアノテーションシステム等は、Webページが必要となる度に、URLで指定されるWebページを取得しているため、Webページ内の構成が変更されると、インデックスの内容やアノテーションの付与される位置が実際のWebページと対応しなくなることがあった。 As described above, since the search system, the Web annotation system, and the like acquire the Web page specified by the URL every time the Web page is required, if the configuration in the Web page is changed, the index In some cases, the position where the content or annotation is added does not correspond to the actual Web page.
このような事態に対応するため、特許文献1にはマーカ等を文書に付した後、その文書が変更された場合であっても、ある程度の追跡を可能とする内容が記載されている。特許文献1ではマーカ等の表示位置とその前後の文字列とを対応付けて記録しておき、マーカ等を表示する際に表示位置の前後の文字列を検査する。そして、特許文献1ではマーカ等の表示位置の前後の文字列が、記録されている文字列と異なる場合に、記録されている文字列の位置を文書中から探し出して、本来、表示する位置を取得してマーカ等を表示している。
In order to cope with such a situation,
特許文献1の技術を応用することで、検索システムやWebアノテーションシステム等はWebページ内の構成が変更されたとしても、インデックスの内容やアノテーションの付与される位置を実際のWebページと対応させることができた。
従来、Webページ内の記事数が制限されている場合には「次のページ」というような形式で、最初のURLとは別のURLで指定されるWebページの中に記事が移動する場合もあった。 Conventionally, when the number of articles in a Web page is limited, an article may be moved into a Web page specified by a URL different from the first URL in a format such as “next page”. there were.
このような最初のURLとは別のURLで指定されるWebページの中に記事が移動する場合は、記事を閲覧しようとして元の所在(最初のURL)にアクセスしたとき、自動的にその記事が移動した先(別のURL)にジャンプ(移動した先の記事を表示)させたいという要求がある。 When an article moves into a Web page specified by a URL different from the first URL, when the original location (first URL) is accessed in order to browse the article, the article is automatically set. There is a request to jump (display the article of the moved destination) to the destination (another URL).
図1は最初のURLとは別のURLで指定されるWebページの中に記事が移動する例を表した一例の模式図である。ある時点で、1.htmlというファイル10には、記事A、記事B、記事Cがあったとする。一般的にニュースやブログなどは、ファイル10に示すように1ページに複数の記事A〜Cを含んでおり、新しい記事Cが上部に配置されることが多い。この時点で記事Bは、検索システムの場合、インデックスとして、Webアノテーションの場合、記事Bに付与されたアノテーションの位置として、1.htmlに存在すると記憶されている。
FIG. 1 is a schematic diagram illustrating an example in which an article moves into a Web page specified by a URL different from the initial URL. At some point: Assume that there are an article A, an article B, and an article C in the
ここでは仮にindex.htmlというファイル12が各記事の所在を記憶しているものとする。ある時間が経過すると、1.htmlには記事D、記事Eが追加され、一定の条件を超えた記事が他のWebページに移動される。図1では、1ページ内に3記事までと制限されているとして、あふれた記事Aと記事Bとが2.htmlというファイル11に移動したことを意味している。このように記事が移動した場合は、記事の移動先を自動的に追跡し、移動した先の記事を表示させたいという要求があった。
Here, index. Assume that a
検索システムではロボットが関連する資源を再収集し、インデックスを再構築することにより、インデックスが正しい位置を示すようにしている。検索システムでは再収集する間隔を短くすることにより、正しくなるまでの期間を短くするようにしている。しかしながら、これは確率的な問題であり、正しくなるまでの期間を零にできない。 In the search system, the robot re-collects the related resources and rebuilds the index so that the index indicates the correct position. The search system shortens the period until it is correct by shortening the recollection interval. However, this is a probabilistic problem and the time to correct cannot be zero.
Webアノテーションシステムは、キーワード(あるいはngram)を抽出して注目アイテム識別情報とし、この注目アイテム識別情報を検索システムに与えることで、検索システムが指し示すところにアノテーションの付与先が移動したと認識できる。しかしながら、前述のとおり、これは検索システムが常に正しい位置を指し示していることが前提となっており、この前提が成り立たないこともある。 The Web annotation system extracts a keyword (or ngram) as attention item identification information, and gives this attention item identification information to the search system, thereby recognizing that the annotation assignment destination has moved to the location indicated by the search system. However, as described above, this is based on the assumption that the search system always points to the correct position, and this assumption may not be satisfied.
従来は、記事の移動とロボットによる関連するWebページの位置の再収集とが非同期であるため、インデックスを再構築するまでに時間が掛かり、タイミングによっては移動した記事を検索できないという問題があった。なお、検索のインデックスをオンデマンドで起動して収集することも可能であるが、インデックスの再構築は時間が掛かり、高速に注目している記事を追跡できないという問題があった。 Conventionally, the movement of articles and the recollection of the position of the related web page by the robot are asynchronous, so it takes time to rebuild the index, and there is a problem that the moved articles cannot be searched depending on the timing. . Although it is possible to start and collect search indexes on demand, it takes time to rebuild the index, and there is a problem that it is not possible to track articles focused on at high speed.
本発明の一実施形態は、上記の点に鑑みなされたもので、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を容易且つ迅速に追跡できるWeb資源追跡管理プログラム、Web資源追跡管理装置及びWeb資源追跡管理方法を提供することを目的とする。 One embodiment of the present invention has been made in view of the above points, and a Web that can easily and quickly track a resource that has moved from a first Web resource including one or more resources to one page to another Web resource. An object is to provide a resource tracking management program, a Web resource tracking management device, and a Web resource tracking management method.
上記課題を解決するため、本発明の一実施形態は、コンピュータに、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理プログラムであって、前記コンピュータを、前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段として機能させるためのWeb資源追跡管理プログラムであることを特徴とする。 In order to solve the above-described problem, an embodiment of the present invention is a Web resource tracking management that causes a computer to track the resource that has been moved from a first Web resource including one or more resources per page to another Web resource. A receiving means for receiving correspondence between the location information of the first Web resource and the target resource identification information for identifying the target resource included in the first Web resource; Extraction means for extracting the Web resource corresponding to the location information selected by the user, and existence confirmation for confirming whether the attention resource exists in the Web resource extracted by the extraction means, based on the attention resource identification information And a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted by the extraction unit The extraction means to be output, the tracking means for notifying the location information indicated by the link extracted by the extraction means to the extraction means as the next location information, and the resource of interest exists in the Web resource extracted by the extraction means In this case, it is a Web resource tracking management program for causing the Web resource to function as a transmission unit that transmits the Web resource to the user terminal.
なお、本発明の一実施形態の構成要素、表現または構成要素の任意の組合せを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも本発明の態様として有効である。 In addition, what applied the component, the expression, or arbitrary combinations of the component of one Embodiment of this invention to a method, an apparatus, a system, a computer program, a recording medium, a data structure, etc. is also effective as an aspect of this invention. .
上述の如く、本発明の一実施形態によれば、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した資源を容易且つ迅速に追跡できる。 As described above, according to an embodiment of the present invention, resources moved from a first Web resource including one or more resources per page to another Web resource can be easily and quickly tracked.
次に、本発明を実施するための最良の形態を、以下の実施例に基づき図面を参照しつつ説明していく。 Next, the best mode for carrying out the present invention will be described based on the following embodiments with reference to the drawings.
(本実施例の概要)
本実施例は、Webページ間の移動がおこる記事などの注目アイテム(注目資源)へのジャンプにおいて、指定された所在(URL)に注目アイテムがない場合、Webページ内の「次のページ」というような形式で、別のURLで指定されるWebページにジャンプするリンク(以下、ナビゲーションリンクという)を探し出し、そのナビゲーションリンクを辿って目的の注目アイテムを見つけるものである。したがって、本実施例では他のWebページへ移動した注目アイテムを追跡できる。
(Overview of this example)
In the present embodiment, when there is no item of interest at a specified location (URL) in a jump to an item of interest (attention resource) such as an article that moves between Web pages, it is referred to as “next page” in the Web page. In such a format, a link that jumps to a Web page specified by another URL (hereinafter referred to as a navigation link) is searched, and the target attention item is found by following the navigation link. Therefore, in this embodiment, it is possible to track the item of interest that has moved to another Web page.
本実施例は、インターネットやイントラネット等のネットワーク上の記事等の資源に対する検索やアノテーションにおいて、無秩序に(人の自由意志によって)行われる移動ではないシステマティックな記事の移動があった場合でも、検索結果やアノテーションされた資源の閲覧において、資源の移動を反映した移動先へのアクセス(閲覧など)を可能とするものである。 In this embodiment, in the search and annotation for resources such as articles on networks such as the Internet and Intranet, even if there is a systematic article movement that is not a disorderly movement (by human free will), the search result In addition, when browsing an annotated resource, access (viewing etc.) to a destination reflecting the movement of the resource is made possible.
例えば、"hoge"という文字列を含む記事Aが「http://foo/bar1.html」のWebページにあったとする。検索エンジンのクローラは、このWebページを収集して"hoge"という文字列の所在として「http://foo/bar1.htmlを記憶したとする。その後、「http://foo/」というサイトでは記事が追加され、記事Aが「http://foo/bar2.html」に移動したとする。このとき検索エンジンの利用者が、クエリーとして"hoge"を与えて検索した時、従来の検索エンジンでは文字列"hoge"の所在として「http://foo/bar1.html」を返す。一方、本実施例では文字列"hoge"の所在として、記事Aの移動先である「http://foo/bar2.html」を返す(あるいは返された所在をクリックした時に移動先である「http://foo/bar2.html」にジャンプする)ことができる。 For example, it is assumed that an article A including a character string “hoge” is on a web page “http: //foo/bar1.html”. The search engine crawler collects this Web page and stores “http: //foo/bar1.html as the location of the string“ hoge ”. After that, the site“ http: // foo / ” Then, an article is added, and article A is moved to "http: //foo/bar2.html". At this time, when the user of the search engine performs a search by giving “hoge” as a query, the conventional search engine returns “http: //foo/bar1.html” as the location of the character string “hoge”. On the other hand, in this embodiment, as the location of the character string “hoge”, “http: //foo/bar2.html”, which is the destination of the article A, is returned (or the destination “ http: //foo/bar2.html ”).
あるいはWebアノテーションという応用では、「http://foo/bar1.html」にあった記事Aにアノテーションをしたとき、Webアノテーションシステムがそのアノテーションの所在として「http://foo/bar1.html」を記憶したとする。その後、「http://foo/」というサイトでは記事が追加され、記事Aは「http://foo/bar2.html」に移動したとする。このとき、アノテーションの所在を記したところから当アノテーションを付与した記事にジャンプしようとすると、従来のWebアノテーションシステムでは「http://foo/bar1.html」にジャンプしてしまい、アノテーションを付与した記事Aがみつからない。一方、本実施例では記事Aの移動先である「http://foo/bar2.html」にジャンプすることで、記事Aと、そこに付与されたアノテーションとを表示することができる。 Or in an application called Web Annotation, when annotating Article A that was in "http: //foo/bar1.html", the Web annotation system uses "http: //foo/bar1.html" as the location of the annotation. Suppose you remember it. After that, an article is added to the site “http: // foo /”, and article A is moved to “http: //foo/bar2.html”. At this time, if you try to jump to the article with the annotation from the location of the annotation, the conventional Web annotation system jumps to “http: //foo/bar1.html” and added the annotation. Article A is not found. On the other hand, in this embodiment, by jumping to “http: //foo/bar2.html” which is the destination of the article A, the article A and the annotation attached thereto can be displayed.
次に、サンプルのHTMLテキストで説明する。例えば、「http://foo/bar1.html」のWebページが図2に示すようなものであるとする。図2はWebページの一例のイメージ図である。図2のWebページは記事が水平線で区切られ、各記事に日付、タイトル、記事内容が含まれている。そして、図2のWebページは新しい記事が登録されると上に追加される。図2のWebページには一定の記事数だけが掲載される。図2のWebページは底に「前のページ」というリンクがあって、古くなった記事がリンク先に掲載されている。例えば記事3012を含むインデックスを作成し、図3のようなリンクページが作成されたとする。
Next, sample HTML text will be described. For example, assume that the web page “http: //foo/bar1.html” is as shown in FIG. FIG. 2 is an image diagram of an example of a Web page. In the Web page of FIG. 2, articles are separated by a horizontal line, and each article includes a date, title, and article content. The Web page in FIG. 2 is added above when a new article is registered. Only a certain number of articles are posted on the Web page in FIG. The web page in FIG. 2 has a link “Previous Page” at the bottom, and an old article is posted at the link destination. For example, assume that an index including an
図3はリンクページの一例のイメージ図である。図3のリンクページは、通常のWebにおいて、例えば図4のようなHTMLファイルで表現される。図4は、リンクページを表現するHTMLファイルの一例のイメージ図である。 FIG. 3 is an image diagram of an example of a link page. The link page of FIG. 3 is expressed by an HTML file as shown in FIG. FIG. 4 is an image diagram of an example of an HTML file representing a link page.
図3のリンクページの「記事3012」の部分をクリックすると、記事3012をもともと含んでいたWebページにジャンプすることになる。例えば図4のHTMLファイルの場合は、「http://foo/bar1.html」のWebページにジャンプする。図3のリンクページは文字列"hoge"の検索結果であっても、アノテーションした所在の一覧リストであってもよい。
When the “
しかし、ニュースやブログなどのWebページは時間が経つと記事が追加される。例えば図2のWebページは時間が経つと記事が追加され、例えば図5のWebページのようになっているかもしれない。図5は、記事が追加されたWebページの一例のイメージ図である。 However, articles are added to web pages such as news and blogs over time. For example, an article may be added to the Web page in FIG. 2 over time, and may be like the Web page in FIG. 5, for example. FIG. 5 is an image diagram of an example of a Web page to which an article has been added.
図5のWebページは、図2のWebページとURLが同じであるが、記事3014及び3015が追加され、図2のWebページに掲載されていた記事3011及び3012が「前のページ」というナビゲーションリンク先の図6に示すようなWebページに移動している。図6はナビゲーションリンク先のWebページの一例のイメージ図である。例えば図6のWebページのURLは、「http://foo/bar2.html」であるとする。
The Web page in FIG. 5 has the same URL as the Web page in FIG. 2, but articles 3014 and 3015 are added, and the
従来、図3のリンクページは注目アイテム(記事3012)の所在を、インデックスが作成された時点での物理的位置「http://foo/bar1.html」として記憶している。インデックスが作成された後で記事3012が「http://foo/bar2.html」のWebページに移動したとすると、図3のリンクページから記事3012へのジャンプでは、記事3012の無い物理的位置「http://foo/bar1.html」のWebページが表示されてしまう。
Conventionally, the link page of FIG. 3 stores the location of the item of interest (article 3012) as the physical location “http: //foo/bar1.html” at the time the index is created. If the
そこで、本実施例では、リンクページから注目アイテムである記事3012にアクセスしようとした時、インデックスが作成された時点での物理的位置「http://foo/bar1.html」のWebページではなく、「前のページ」というアンカーで示されたナビゲーションリンクを利用して、現時点で注目アイテムである記事3012が存在する「http://foo/bar2.html」のWebページにジャンプしようとするものである。
Therefore, in this embodiment, when trying to access the
すなわち、検索システムでは図3のリンクページの記事3012をクリックすると図5のWebページではなく図6のWebページが表示される。また、Webアノテーションシステムでは図6のWebページにアノテーションが付与された図7に示すWebページが表示される。図7はナビゲーションリンク先のWebページに復元したアノテーションの一例のイメージ図である。
That is, in the search system, when the
なお、上記では説明を容易化する為、「記事3010」のように記事番号で記事が一意に特定できるようにしたが、実際、このような記事番号が付与されているのではなく、通常のテキストがタイトルになっている。 In the above, for ease of explanation, the article number can be uniquely identified by the article number as in “Article 3010”. The text is the title.
一般に記事の移動は無秩序に行われるのではなく、記事の移動元のWebページから移動先のWebページへナビゲーションリンクが張られている。なお、ナビゲーションリンクとは、「次に」とか「next」などの目印が付けられた、その記事(資源)に関連する連続的なWebページへのリンクである。従来は、単に所在情報(URL)あるいは特徴情報で記事にアクセスしていた。 In general, the movement of articles is not performed randomly, but a navigation link is provided from the Web page of the article movement source to the Web page of the movement destination. The navigation link is a link to a continuous Web page related to the article (resource) with a mark such as “next” or “next”. Conventionally, articles are accessed simply by location information (URL) or feature information.
本実施例は、記事の移動元のWebページから移動先のWebページへナビゲーションリンクが張られていることに注目し、注目アイテム(注目記事)が見つからなかったときにナビゲーションリンクを自動的に辿ることで注目アイテムにアクセスできるようにしている。 In this embodiment, attention is paid to the fact that a navigation link is extended from the Web page that is the source of the article to the Web page that is the destination, and the navigation link is automatically traced when the item of interest (the article of interest) is not found. This makes it possible to access attention items.
(本実施例の原理)
図8は、本実施例の原理を表した説明図である。図8の資源追跡部20は、注目アイテム情報取出部21,Web情報取出部22,注目アイテム存在確認部23,ナビゲーションリンク抽出部24,ナビゲーション実行部25を有する構成である。
(Principle of this embodiment)
FIG. 8 is an explanatory diagram showing the principle of this embodiment. The
注目アイテム情報取出部21は、アドレス(URL)と共に、注目アイテム(記事、ブロックなど)の識別情報(キーワードや記事ID、記事のハッシュコード値など)を注目アイテム情報として受け取る。
The attention item
Web情報取出部22は、注目アイテム情報取出部21が受け取ったアドレスで指定されるWeb資源(Webページ)を取得する。注目アイテム存在確認部23は、Web情報取出部22が取得したWeb資源に、注目アイテム情報取出部21が受け取った注目アイテムの識別情報と一致する資源(記事)が存在するか否かを検査する。
The Web
注目アイテムの識別情報と一致する資源が存在しない場合、ナビゲーションリンク抽出部24は、そのWeb資源のナビゲーションリンクをアンカー文字列あるいは文書構造知識に基づいて探し出す。ナビゲーション実行部25は、ナビゲーションリンクを組織的に辿りながら、注目アイテムの識別情報と一致する資源を有するWeb資源を探す。
If there is no resource that matches the identification information of the item of interest, the navigation
資源追跡部20は、ステップS21で注目アイテム情報取出部21が受け取ったアドレスについて、Web情報取出部22,注目アイテム存在確認部23,ナビゲーションリンク抽出部24,ナビゲーション実行部25の処理を繰り返し行う。
The
以上のように、資源追跡部20は取得したWeb資源の注目アイテムの存在を確認しながら、注目アイテムがない時にナビゲーションリンクを辿って注目アイテムを探す。注目アイテムがオリジナルな所在位置からナビゲーションリンクで辿れる所在位置へ移動したのであれば、資源追跡部20は、どのタイミングでアクセスしても目当ての注目アイテムにアクセスできる。
As described above, the
これは、通常のニュースやブログなどのWebページは時間経過とともに記事が増えて行くタイプのWebページに対する検索システム、Webアノテーションシステム、Webブラウザ,ブックマークシステム等のインターネット関連製品において効果がある。 This is effective in Internet-related products such as a search system, a Web annotation system, a Web browser, and a bookmark system for a Web page of a type in which articles increase over time for normal Web pages such as news and blogs.
検索やアノテーションのインデックスから注目アイテムが真に存在するWebページへジャンプするようなシステムとしては、どのタイミングで上記の資源を探すかで、典型的には以下の3つがある。 There are typically the following three systems for jumping from a search or annotation index to a Web page where an item of interest really exists, depending on when the above resources are searched.
第1のシステムは、リンクページに一般のリンクを利用する。第1のシステムは、リンクがクリックされてジャンプするときに資源を追跡する。第1のシステムはブラウザ等の閲覧器の拡張あるいは専用閲覧器のような形態で実施される。 The first system uses a general link for the link page. The first system tracks resources when a link is clicked to jump. The first system is implemented in the form of an extension of a browsing device such as a browser or a dedicated browsing device.
第2のシステムは、リンクページにリンクを表示する際に資源を追跡し、追跡した結果をリンクとして表示する。第2のシステムは、例えば検索装置が検索結果を表示するときに実施される。 The second system tracks resources when displaying the link on the link page, and displays the tracked result as a link. The second system is implemented, for example, when the search device displays search results.
また、第3のシステムはリンクページにパラメータ付きの特定の所在へのリンクを利用する。第3のシステムは、そのリンクがクリックされると、特定の所在で資源の追跡が実施され、追跡した結果に基づき目的の所在へジャンプする。 The third system uses a link to a specific location with parameters on the link page. When the link is clicked, the third system performs resource tracking at a specific location, and jumps to the target location based on the tracked result.
図9は資源追跡部の一例の構成図である。本実施例では注目アイテムの存在を確認するための注目アイテム識別情報を同時に保有することを前提としている。本実施例では指定された注目アイテムに対してその特徴、具体的に検索では検索用インデックスが注目アイテム識別情報になり、Webアノテーションではアノテーションを付与した際に付与された場所の周辺情報(周辺のテキスト、記事タイトル、記事本文、それらのハッシュコード値など)が注目アイテム識別情報になる。 FIG. 9 is a configuration diagram of an example of the resource tracking unit. In this embodiment, it is assumed that attention item identification information for confirming the presence of the attention item is simultaneously held. In this embodiment, the feature of the specified attention item, specifically, the search index becomes the attention item identification information in the search, and in the Web annotation, the peripheral information (peripheral The text, article title, article body, hash code values thereof, etc.) are the item identification information.
図9の資源追跡部20は、注目アイテム情報取出部21,Web情報取出部22,注目アイテム存在確認部23,ナビゲーションリンク抽出部24,ナビゲーション実行部25,Web資源情報出力部26,ナビゲーション管理部27,ナビゲーションリンクDB28及びナビゲーションリンクテーブル29を有する構成である。
The
注目アイテム情報受取部21は、所在情報(URL)と共に、注目アイテム識別情報を受け取る。Web情報取出部22は、所在情報に対応するWeb資源をWebサーバ30から取り出す。注目アイテム存在確認部23は、取り出したWeb資源の中に注目アイテムが存在するかどうか、注目アイテム識別情報を使って確認する。
The attention item
取り出したWeb資源の中に注目アイテムが存在すれば、注目アイテム存在確認部23はWeb資源情報出力部26から、そのWeb資源の所在情報ないしはWeb資源自身を出力する。
If there is an item of interest in the extracted Web resource, the item-of-interest
取り出したWeb資源の中に注目アイテムが存在しなければ、ナビゲーションリンク抽出部24は、そのWeb資源から移動してしまった注目アイテムを追跡するため、現在のWeb資源からナビゲーションリンクを抽出する。ナビゲーションリンク抽出部24は図10に示すようなナビゲーションリンクテーブル29を参照し、現在のWeb資源からナビゲーションリンクを特定する。
If there is no item of interest in the extracted Web resource, the navigation
図10はナビゲーションリンクテーブルの一例の構成図である。ナビゲーションリンクテーブル29は、ナビゲーションリンクに付けられる「前のページ」,「→」などの目印が記載されている。 FIG. 10 is a configuration diagram of an example of the navigation link table. The navigation link table 29 describes marks such as “previous page” and “→” attached to the navigation link.
ナビゲーションリンク抽出部24は抽出したナビゲーションリンクをナビゲーション管理部27に通知する。ナビゲーション管理部27は一つのWeb資源中にナビゲーションリンクが一つとは限らないので、通知されたナビゲーションリンクをナビゲーションリンクDB28に保持させる。ナビゲーション管理部27は、どういう順番でナビゲーションリンクを辿るか、あるいは一度辿ったところを重複して辿らないように管理しながらナビゲーションリンクDB28からナビゲーションリンクを一つずつ取り出す。
The navigation
そして、ナビゲーション実行部25はナビゲーションリンクDB28から取り出されたナビゲーションリンクの示す所在情報を取り出し、取り出した所在情報をWeb情報取出部22に通知する。
Then, the
例えば資源追跡部20のない通常の検索システムは図11のようになる。図11は資源追跡部のない通常の検索システムを表した構成図である。利用者はブラウザ50を操作してキーワード等のクエリーを検索装置40に入力する。検索装置40は利用者に入力されたクエリーで検索を行う。
For example, a normal search system without the
具体的に、検索装置40はクエリーからキーの論理式を構築し、インデックス表に基づいて所在情報を求める。図12はインデックス表の一例の構成図である。インデックス表はキーと所在情報とを対応付けているものである。なお、クエリーからキーの論理式を構築する部分は本実施例の本質ではないので、ここでは単一のキーを例に説明する。
Specifically, the
例えば図12のインデックス表の場合、検索装置40はクエリーとして"hoge"が与えられたとすると、インデクス表から所在情報として「foo/bar1.html」、「foo/bar9.html」を得る。そして、検索装置40は、それぞれの所在の要約を合わせて検索結果のHTML文書41を作成し、ブラウザ50に図13の検索結果をリンクページとして表示する。
For example, in the case of the index table of FIG. 12, if “hoge” is given as a query, the
図13は検索結果画面の一例のイメージ図である。利用者は検索結果41の中から、その実体のWeb資源にアクセスするためにWeb資源へのリンク(例えば「foo/bar1のタイトル」と表示されている部分)をクリックする。
FIG. 13 is an image diagram of an example of a search result screen. The user clicks a link to the Web resource (for example, a part displayed as “foo / bar1 title”) in the
ブラウザ50は、クリックされたリンク先「foo/bar1.html」のアドレスに対応するWeb資源31をWebサーバ30から取り出し、そのWeb資源31を表示する。本実施例は検索であるかどうかは本質ではなく、注目アイテムへのリンクであればよい。以下の説明では、図3のリンクページによって説明する。
The
図3のリンクページでは、記事3012のHTMLは図4に示すようであり、記事3012のリンクをクリックしたら「http://foo/bar1.html」のアドレスに対応する図5のようなWebページが表示されることになる。
In the link page of FIG. 3, the HTML of the
例えば資源追跡部20のある検索システムは例えば図14のようになる。図14は資源追跡部のある検索システムの第一実施例の構成図である。図14の検索システムは、リンクをクリックしてWeb資源31にアクセスしようとした時、資源の追跡を行い、真に注目アイテムが存在するWeb資源31を表示するものである。
For example, a search system with the
利用者は、ブラウザ50を操作してキーワードを検索装置40に入力する。検索装置40は利用者に入力されたキーワードで検索を行う。検索装置40は、ブラウザ50に検索結果41をリンクページとして表示する。ここまでの処理は、通常の検索システムと同じである。
The user operates the
図14の検索システムは、利用者に入力されたキーワードを注目資源識別情報60として保持しておく点で図11の検索システムと異なる。利用者は検索結果41の中から、その実体のWeb資源にアクセスするためにWeb資源へのリンクをクリックする。
The search system of FIG. 14 is different from the search system of FIG. 11 in that the keyword input by the user is held as the resource-of-
ブラウザ50は、クリックされたリンク先のアドレスに対応するWeb資源31をWebサーバ30から単純に取り出すのではなく、リンク先のアドレス(所在情報)と注目資源識別情報60から資源の追跡を行い、真に注目アイテムのあるWeb資源31を表示するものである。なお、資源追跡部60はブラウザ50の拡張として実現してもよいし、資源追跡部60を有する専用のブラウザ50としてもよい。
The
なお、図14の検索システムは図11の検索システムと検索結果41のHTMLが全くかわらないが、記事3012のリンクをクリックしたら「http://foo/bar1.html」とあるにもかかわらず「http://foo/bar2.html」のWebページ、すなわち図6のWebページが表示されることになる。
The search system shown in FIG. 14 is completely different from the search system shown in FIG. 11 and the HTML of the
図15は、資源追跡部のある検索システムの第二実施例の構成図である。図15の検索システムは検索結果を表示する際、単純に、そのリンクを表示するのではなく、資源の追跡を行い、注目アイテムが真に存在するアドレスにリンクを書き換えて表示するものである。 FIG. 15 is a configuration diagram of a second embodiment of a search system having a resource tracking unit. When displaying the search result, the search system of FIG. 15 does not simply display the link, but tracks resources and rewrites and displays the link at the address where the item of interest really exists.
利用者は、ブラウザ50を操作してキーワードを検索装置40に入力する。検索装置40は利用者に入力されたキーワードで検索を行う。検索装置40は、ブラウザ50に検索結果41をリンクページとして表示する。このとき、検索装置40は単純に検索結果41のリンクを表示するのではなく、資源追跡部20に資源の追跡を行わせる。
The user operates the
すなわち、資源追跡部20は検索装置40に与えられたキーワードを注目資源識別情報として、各リンクで示す先に注目アイテムが存在するかどうか確認し、存在しないならばナビゲーションリンクを辿って、注目アイテムが見つかったWeb資源31の所在情報(URL)にリンクを書き換えて利用者に提示する。
That is, the
既にリンクが書き換えられているので、ブラウザ50は、その後、利用者がリンクをクリックしたならば、そのクリックされたリンク先のアドレスに対応するWeb資源31をWebサーバ30から取り出し、真に注目アイテムのあるWeb資源31を表示するものである。図15の検索システムでは、各リンクで示す先に注目アイテムが存在するかどうか確認し、存在しないならばナビゲーションリンクを辿って、注目アイテムが見つかったWeb資源31の所在情報(URL)にリンクを書き換えて利用者に提示する。
Since the link has already been rewritten, the
例えば図4のHTMLファイルの場合、図15の検索システムではナビゲーションリンクを辿って、注目アイテムが見つかったWeb資源31の所在情報(URL)にリンクを書き換える。図16は、注目アイテムが見つかったWeb資源の所在情報にリンクを書き換えたHTMLファイルの一例のイメージ図である。
For example, in the case of the HTML file of FIG. 4, the search system of FIG. 15 follows the navigation link and rewrites the link to the location information (URL) of the
図16のHTMLファイルの場合、図3のリンクページの「記事3012」の部分をクリックすると、「http://foo/bar2.html」のWebページ、すなわち図6のWebページが表示されることになる。
In the case of the HTML file in FIG. 16, when the “
図17は、図15の検索システムの処理手順を表したフローチャートである。ステップS1に進み、検索装置40は利用者からキーワードを受け取る。ステップS2に進み、検索装置40はインデックス表から所在集合を得る。ステップS3に進み、資源追跡部20は所在集合の各要素に対して現在の所在を求める。資源追跡部20は、インデックス表から得た所在情報と、注目アイテム識別情報としてのキーワードとを得ることで、所在集合の各要素に対して現在の所在を求めることができる。
FIG. 17 is a flowchart showing the processing procedure of the search system of FIG. In step S1, the
ステップS4に進み、資源追跡部20は検索結果41として、所在集合の各要素に対して現在の所在を付与して出力する。なお、ステップS4では例えば図18に示すようにリンク先のタイトル名なども修正された図18のような検索結果画面を出力するようにしてもよい。図18は検索結果画面の他の例のイメージ図である。
In step S4, the
図19は、資源追跡部のある検索システムの第三実施例の構成図である。図19の検索システムは検索結果を表示する際、単純に、そのリンクを表示するのではなく、特定のWebサーバ62のアドレス+パラメータをリンクに書き換えて表示するものである。 FIG. 19 is a configuration diagram of a third embodiment of a search system having a resource tracking unit. The search system of FIG. 19 does not simply display the link when displaying the search result, but rewrites the address + parameter of the specific Web server 62 into the link and displays it.
利用者は、ブラウザ50を操作してキーワードを検索装置40に入力する。検索装置40は利用者に入力されたキーワードで検索を行う。検索装置40は、ブラウザ50に検索結果41をリンクページとして表示する。このとき、検索装置40が単純に検索結果41のリンクを表示するのではないのは、図15の検索システムと同じである。しかし、図10の検索システムは、この時点で資源の追跡を行わず、リンク加工部61が、単にリンクを特定のWebサーバ62のアドレス+パラメータの形に書き換えておく。
The user operates the
例えばキーワード"hoge"の検索結果のURLが「foo/bar1.html」であり、特定のWebサーバ62のURLが「http://tracking」であったとすると、リンク加工部61はリンクを「http://tracking?kw=hoge&url=foo%2Fbar1.html」に書き換える。ブラウザ50には検索結果がリンクページとして表示される。
For example, if the URL of the search result of the keyword “hoge” is “foo / bar1.html” and the URL of the specific Web server 62 is “http: // tracking”, the
利用者が「foo.html」にアクセスしようとしてリンクをクリックすると、実際には「http://tracking?kw=hoge&url=foo%2Fbar1.html」がアクセスされる。即ち、特定のWebサーバ62として「http://tracking」がアクセスされる。特定のWebサーバ62には、特定アイテム識別情報としてキーワード"hoge"、所在情報「foo%2Fbar1.html」が資源追跡部20へ渡され、資源の追跡が実行される。したがって、ブラウザ50は真に注目アイテムのあるWeb資源31を表示できる。
When a user clicks a link to access "foo.html", "http: // tracking? Kw = hoge & url = foo% 2Fbar1.html" is actually accessed. That is, “http: // tracking” is accessed as the specific Web server 62. The keyword “hoge” and the location information “foo% 2Fbar1.html” are passed to the
例えば図4のHTMLファイルの場合、図19の検索システムでは特定のWebサーバ62のアドレス+パラメータ「http://tracking?kw=hoge&url=foo%2Fbar1.html」にリンクが書き換えられる。 For example, in the case of the HTML file of FIG. 4, the link is rewritten to the address of the specific Web server 62 + parameter “http: // tracking? Kw = hoge & url = foo% 2Fbar1.html” in the search system of FIG.
図20は、特定のWebサーバのアドレス+パラメータにリンクを書き換えたHTMLファイルの一例のイメージ図である。 FIG. 20 is an image diagram of an example of an HTML file in which a link is rewritten to a specific Web server address + parameter.
図20のHTMLファイルの場合、図3のリンクページの「記事3012」の部分をクリックすると、特定のWebサーバ62として「http://tracking」がアクセスされ、特定アイテム識別情報としてキーワード"hoge"、所在情報「foo%2Fbar1.html」が特定のWebサーバ62から資源追跡部20へ渡され、資源の追跡が実行された結果、真に注目アイテムのある「http://foo/bar2.html」のWeb資源31、すなわち図6のWeb資源31が表示されることになる。
In the case of the HTML file of FIG. 20, when the “
上記では検索システムを例に説明したが、Webアノテーションシステムの場合、検索システムの検索装置40をWebアノテーションDBからの情報取得を行う装置に置き換えればよい。
Although the search system has been described above as an example, in the case of a Web annotation system, the
図21は資源追跡部の処理手順を表した一例のフローチャートである。ステップS11に進み、資源追跡部20の注目アイテム情報受取部21は、所在情報(URL)と、注目アイテム識別情報を受け取る。ステップS12に進み、Web情報取出部22は所在情報に対応するWeb資源をWebサーバ30から取り出す。
FIG. 21 is a flowchart illustrating an example of the processing procedure of the resource tracking unit. In step S11, the item-of-interest
ステップS13に進み、注目アイテム存在確認部23は取り出したWeb資源の中に注目アイテム識別情報が存在するか(注目アイテムが存在するか)どうか確認する。取り出したWeb資源の中に注目アイテムが存在すれば(ステップS14においてYES)、注目アイテム存在確認部23はステップS16に進み、Web資源情報出力部26から、そのWeb資源の所在情報ないしはWeb資源自身を出力することで、ステップS12で取り出したWeb資源に対する処理(一般的には表示)を行う。なお、取り出したWeb資源に対する処理としては単純な表示の他、例えばWebアノテーションシステムであればアノテーションの処理(アノテーションを付与しての表示など)や、指定されたWeb資源のダウンロードなどの処理がある。
In step S13, the attention item
取り出したWeb資源の中に注目アイテムが存在しなければ(ステップS14においてNO)、ナビゲーションリンク抽出部24はステップS15に進み、そのWeb資源から移動してしまった注目アイテムを追跡するため、現在のWeb資源からナビゲーションリンクを探索する。現在のWeb資源にナビゲーションリンクがあれば(ステップS17においてYES)、ナビゲーションリンク抽出部24はステップS18に進み、ナビゲーションリンクを抽出する。ナビゲーション実行部25は、ナビゲーションリンク抽出部24が抽出したナビゲーションリンク先の所在情報を新しい所在情報としてナビゲーション管理部27に通知したあと、ステップS12の処理に戻る。
If the noticed item does not exist in the extracted Web resource (NO in step S14), the navigation
なお、現在のWeb資源にナビゲーションリンクがなければ(ステップS17においてNO)、ナビゲーションリンク抽出部24はステップS19に進み、注目アイテムが見つからなかったと判断する。ナビゲーション実行部25は見つからなかった時の処理(例外処理など)を行う。具体的には、例えばメッセージを出して、元々の所在情報(URL)で示されるWeb資源の表示などを行う。
If there is no navigation link in the current Web resource (NO in step S17), the navigation
ナビゲーションリンクが常に一つ正確に見つかる場合には、図21に示すような処理で良い。しかし、実際にはナビゲーションリンクの候補が複数ある場合もある。図22はナビゲーションリンクの候補が複数ある画面例である。図22の画面ではナビゲーションリンクの候補として「前のページ」と「次のページ」とがあるが、時間的過去へのリンクがどちらかがあいまいである。 If one navigation link is always found correctly, the processing shown in FIG. 21 is sufficient. However, there may actually be a plurality of navigation link candidates. FIG. 22 shows an example of a screen having a plurality of navigation link candidates. In the screen of FIG. 22, there are “previous page” and “next page” as navigation link candidates, but the link to the temporal past is ambiguous.
このように、ナビゲーションリンクの候補にあいまい性のある場合にも対処するための実施例としては、ナビゲーションリンクの候補を待ち行列に登録し、その待ち行列に登録されたナビゲーションリンクの候補を出し入れして、次に探索すべきナビゲーションリンクの候補を求める。上記処理のためには、ナビゲーション管理部27と待ち行列を保存するキューとが必要になる。なお、待ち行列の管理は、深さ優先探索、最良優先探索などのアルゴリズムが良く知られている(これらはコンピュータの基本的な探索アルゴリズムであるので詳細は省略する)。
As described above, as an embodiment for dealing with the case where the navigation link candidates are ambiguous, the navigation link candidates are registered in the queue, and the navigation link candidates registered in the queue are taken in and out. The navigation link candidate to be searched next is obtained. For the above processing, a
注目アイテム存在確認部23は、Web情報取出部22が取り出したWeb資源の中に注目アイテム識別情報が存在するかどうか確認するものである。典型的な注目アイテム存在確認部23は、文字列検索(例えばUNIX(登録商標)のfgrepコマンド)によりWeb資源の中に注目アイテム識別情報が存在するかどうか確認する。
The attention item
例えば、注目アイテム識別情報が文字列"記事3012のタイトル"であれば、Web資源中に文字列"記事3012のタイトル"が存在するか否かで注目アイテムが存在するか否かを判定するものである。
For example, if the item of interest identification information is a character string “title of
やや高度な注目アイテム存在確認部23は、情報構造を利用するものである。例えば図23のHTMLファイルではWeb資源が複数の記事から構成されており、各記事のタイトルがclass属性の値"entry-header"で指定されている。また、別の注目アイテム存在確認部23は、記事タイトルでなく、記事(図23ではclass属性の値"entry"内の本文)のハッシュ値を利用することもできる。
The somewhat advanced attention item
注目アイテム存在確認部23は、HTMLファイルの特定の構造と構造内の照合情報とを利用するものであり、図24のような処理を行う。図24は注目アイテム存在確認部の処理手順を表した一例のフローチャートである。
The attention item
ステップS21に進み、注目アイテム存在確認部23はWeb情報取出部22が取得したWeb資源(HTMLファイル)を取り込む。ステップS22に進み、注目アイテム存在確認部23は取り込んだWeb資源から、指定された属性及び値のペアをもつタグを探索する。
Proceeding to step S21, the notable item
ステップS23に進み、注目アイテム存在確認部23は指定された属性及び値のペアをもつタグが見つからないと、ステップS24に進み、取り込んだWeb資源の中に注目アイテムが存在しない旨をナビゲーションリンク抽出部24に返す。なお、注目アイテム存在確認部23は指定された属性及び値のペアをもつタグが見つかると、ステップS25に進み、そのタグの内容が探している内容と一致するか否かを判定する。見つかったタグの内容が探している内容と一致すると、注目アイテム存在確認部23はステップS26に進み、取り込んだWeb資源の中に注目アイテムが存在した旨をWeb資源情報出力部26に返す。見つかったタグの内容が探している内容と一致しなければ、注目アイテム存在確認部23はステップS22の処理に戻る。
The process proceeds to step S23, and if the target item
また、図25はナビゲーションリンク抽出部の処理手順を表した一例のフローチャートである。ステップS31に進み、ナビゲーションリンク抽出部24はWeb資源(Webページ)中のすべてのリンク情報を取り出す。
FIG. 25 is a flowchart illustrating an example of the processing procedure of the navigation link extraction unit. In step S31, the navigation
例えばHTMLファイルでは、ナビゲーションリンク抽出部24が、"a"タグで囲まれたアンカーテキスト及び"a"タグのhref属性の値を取り出す。また、ナビゲーションリンク抽出部24は必要に応じてalt属性を取り出す(アンカーがテキストではなくイメージの場合などalt属性がアンカーテキストの代替となる)。
For example, in the HTML file, the navigation
ステップS32に進み、ナビゲーションリンク抽出部24は、取り出したリンク情報のナビゲーションリンクらしさを、アンカーテキストやリンク先、文書中の位置などの情報を使って求める。ステップS33に進み、ナビゲーションリンク抽出部24は、それぞれのリンク情報のナビゲーションリンクらしさに基づきリンク情報の取捨選択を行い、ナビゲーションリンクを求める。リンク情報の取捨選択は一つないし無しを選ぶようなものであってもよいし、ナビゲーションリンクらしさの優先度を与えて、探索アルゴリズムによってナビゲーションリンクらしいものから順にナビゲーションリンクとして辿るという方策をとってもよい。
Proceeding to step S32, the navigation
ナビゲーションリンクらしさのチェックは、例えば以下のように行う。リンク情報がナビゲーションリンクであるかどうかは明確な基準があるわけではないので、ヒューリスティックスによってナビゲーションリンクらしさを求める。 For example, the navigation link likelihood is checked as follows. Whether or not the link information is a navigation link does not have a clear standard, so the likelihood of a navigation link is obtained by heuristics.
一般的にナビゲーションリンクは、そのWebページの閲覧者が一連の情報をサーチするために利用するものなので、アンカーテキストの手がかり(「前のページ」「次のページ」「next」「previous」「→」など)、文書中の位置(一般に文書の末尾付近)や、移動がシステマティックに行われることからリンク先の手がかり(xxx/1.htmlに対してはxxx/2.htmlであるはずというURLパターン)が利用できる。 In general, navigation links are used by viewers of the Web page to search a series of information. ”), The position in the document (generally near the end of the document) and the URL pattern that the link destination clue (xxx / 1.html should be xxx / 2.html because movement is done systematically) ) Is available.
図26は、資源追跡部20を実現する装置の一例の構成図である。図26の装置は、それぞれバスBで相互に接続された入力装置71,出力装置72,ドライブ装置73,補助記憶装置74,主記憶装置75,演算処理装置76およびインターフェース装置77を含むように構成される。
FIG. 26 is a configuration diagram of an example of an apparatus that implements the
入力装置71はキーボードやマウスなどで構成され、各種信号を入力するために用いられる。出力装置72はディスプレイ装置などで構成され、各種ウインドウやデータ等を表示するために用いられる。インターフェース装置77は、モデム,LANカードなどで構成されており、ネットワークに接続する為に用いられる。
The
本実施例に係るプログラムは、資源追跡部20を制御する各種プログラムの少なくとも一部である。プログラムは例えば記録媒体78の配布やネットワークからのダウンロードなどによって提供される。プログラムを記録した記録媒体78は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
The program according to the present embodiment is at least a part of various programs that control the
また、プログラムを記録した記録媒体78がドライブ装置73にセットされると、プログラムは記録媒体78からドライブ装置73を介して補助記憶装置74にインストールされる。ネットワークからダウンロードされたプログラムは、インターフェース装置77を介して補助記憶装置74にインストールされる。
When the
補助記憶装置74は、インストールされたプログラムを格納すると共に、必要なファイル,データ等を格納する。主記憶装置75は、起動時に補助記憶装置74からプログラムを読み出して格納する。そして、演算処理装置76は主記憶装置75に格納されたプログラムに従って、上記したような各種処理を実現している。
The
本発明は、以下に記載する付記のような構成が考えられる。
(付記1)
コンピュータに、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理プログラムであって、
前記コンピュータを、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
して機能させるためのWeb資源追跡管理プログラム。
(付記2)
前記抽出手段は、前記Web資源に含まれる前記他のWeb資源への1種類以上のリンクを示したテーブル手段に基づき、前記Web資源に含まれる前記他のWeb資源へのリンクを抽出することを特徴とする付記1記載のWeb資源追跡管理プログラム。
(付記3)
前記存在確認手段は、キーワード,資源番号,又は前記資源のハッシュコード値を前記注目資源識別情報として、前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを確認することを特徴とする付記1又は2記載のWeb資源追跡管理プログラム。
(付記4)
前記第一のWeb資源は、1ページに含む前記資源の数が制限されており、前記資源の数が制限を超過しないよう古い前記資源から順に、前記リンクで示される前記所在情報に対応する前記他のWeb資源に移動されることを特徴とする付記1乃至3何れか一項記載のWeb資源追跡管理プログラム。
(付記5)
1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理装置であって、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
を有するWeb資源追跡管理装置。
(付記6)
コンピュータによって実行される、1ページに1つ以上の資源を含む第一のWeb資源から他のWeb資源へ移動した前記資源を追跡させるWeb資源追跡管理方法であって、
前記コンピュータが、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手順と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手順と、
前記抽出手順で抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手順と
を実行することを特徴とするWeb資源追跡管理方法。
The present invention may have the following configurations as described below.
(Appendix 1)
A web resource tracking management program for causing a computer to track the resource moved from a first web resource including one or more resources per page to another web resource,
The computer,
Receiving means for receiving a correspondence relationship between the location information of the first Web resource and target resource identification information for identifying the target resource included in the first Web resource;
Retrieval means for retrieving the Web resource corresponding to the location information selected by the user;
Presence checking means for confirming whether or not the attention resource exists in the Web resource extracted by the extraction means, based on the attention resource identification information;
Extraction means for extracting a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted by the extraction means;
Tracking means for notifying the take-out means of the location information indicated by the link extracted by the extraction means as the next location information;
A Web resource tracking management program for causing a Web resource to function as a transmission unit for transmitting the Web resource to the user terminal if the resource of interest exists in the Web resource extracted by the extraction unit.
(Appendix 2)
The extraction means extracts a link to the other Web resource included in the Web resource based on a table means indicating one or more types of links to the other Web resource included in the Web resource. The Web resource tracking management program according to
(Appendix 3)
The presence confirmation unit is configured to confirm whether the target resource exists in the Web resource extracted by the extraction unit, using a keyword, a resource number, or a hash code value of the resource as the target resource identification information. The Web resource tracking management program according to
(Appendix 4)
In the first Web resource, the number of the resources included in one page is limited, and the first Web resource corresponds to the location information indicated by the link in order from the old resource so that the number of the resources does not exceed the limit. The Web resource tracking management program according to any one of
(Appendix 5)
A web resource tracking management apparatus for tracking the resource moved from a first web resource including one or more resources in one page to another web resource,
Receiving means for receiving a correspondence relationship between the location information of the first Web resource and target resource identification information for identifying the target resource included in the first Web resource;
Retrieval means for retrieving the Web resource corresponding to the location information selected by the user;
Presence checking means for confirming whether or not the attention resource exists in the Web resource extracted by the extraction means, based on the attention resource identification information;
Extraction means for extracting a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted by the extraction means;
Tracking means for notifying the take-out means of the location information indicated by the link extracted by the extraction means as the next location information;
A Web resource tracking management apparatus comprising: a transmission unit configured to transmit the Web resource to the user terminal if the resource of interest exists in the Web resource extracted by the extraction unit.
(Appendix 6)
A web resource tracking management method for tracking the resource moved from a first web resource including one or more resources per page to another web resource, which is executed by a computer,
The computer is
A receiving procedure for receiving correspondence between the location information of the first Web resource and the target resource identification information for identifying the target resource included in the first Web resource;
An extraction procedure for retrieving the Web resource corresponding to the location information selected by the user;
A presence confirmation procedure for confirming whether or not the target resource exists in the Web resource extracted in the extraction procedure by the target resource identification information;
An extraction procedure for extracting a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted in the extraction procedure;
A tracking procedure for notifying the extraction means of the location information indicated by the link extracted in the extraction procedure as the next location information;
A Web resource tracking management method comprising: executing a transmission procedure for transmitting the Web resource to the user terminal if the resource of interest exists in the Web resource extracted in the extraction procedure.
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。 The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.
20 資源追跡部
21 注目アイテム情報取出部
22 Web情報取出部
23 注目アイテム存在確認部
24 ナビゲーションリンク抽出部
25 ナビゲーション実行部
26 Web資源情報出力部
27 ナビゲーション管理部
28 ナビゲーションリンクDB
29 ナビゲーションリンクテーブル
30 Webサーバ
31 Web資源
40 検索装置
41 検索結果
50 ブラウザ
60 注目資源識別情報
61 リンク加工部
62 特定のWebサーバ
71 入力装置
72 出力装置
73 ドライブ装置
74 補助記憶装置
75 主記憶装置
76 演算処理装置
77 インターフェース装置
DESCRIPTION OF
DESCRIPTION OF
Claims (6)
前記コンピュータを、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
して機能させるためのWeb資源追跡管理プログラム。 A web resource tracking management program for causing a computer to track the resource moved from a first web resource including one or more resources per page to another web resource,
The computer,
Receiving means for receiving a correspondence relationship between the location information of the first Web resource and target resource identification information for identifying the target resource included in the first Web resource;
Retrieval means for retrieving the Web resource corresponding to the location information selected by the user;
Presence checking means for confirming whether or not the attention resource exists in the Web resource extracted by the extraction means, based on the attention resource identification information;
Extraction means for extracting a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted by the extraction means;
Tracking means for notifying the take-out means of the location information indicated by the link extracted by the extraction means as the next location information;
A Web resource tracking management program for causing a Web resource to function as a transmission unit for transmitting the Web resource to the user terminal if the resource of interest exists in the Web resource extracted by the extraction unit.
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手段と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手段と、
前記抽出手段が抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手段と、
前記取出手段が取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手段と
を有するWeb資源追跡管理装置。 A web resource tracking management apparatus for tracking the resource moved from a first web resource including one or more resources in one page to another web resource,
Receiving means for receiving a correspondence relationship between the location information of the first Web resource and target resource identification information for identifying the target resource included in the first Web resource;
Retrieval means for retrieving the Web resource corresponding to the location information selected by the user;
Presence checking means for confirming whether or not the attention resource exists in the Web resource extracted by the extraction means, based on the attention resource identification information;
Extraction means for extracting a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted by the extraction means;
Tracking means for notifying the take-out means of the location information indicated by the link extracted by the extraction means as the next location information;
A Web resource tracking management apparatus comprising: a transmission unit configured to transmit the Web resource to the user terminal if the resource of interest exists in the Web resource extracted by the extraction unit.
前記コンピュータが、
前記第一のWeb資源の所在情報と、前記第一のWeb資源に含まれる注目資源を識別する為の注目資源識別情報との対応関係を受け取る受取手順と、
利用者に選択された前記所在情報に対応する前記Web資源を取り出す取出手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在するかを、前記注目資源識別情報により確認する存在確認手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在しなければ前記Web資源に含まれる前記他のWeb資源へのリンクを抽出する抽出手順と、
前記抽出手順で抽出した前記リンクで示される所在情報を次の所在情報として前記取出手段へ通知する追跡手順と、
前記取出手順で取り出した前記Web資源に前記注目資源が存在すれば前記Web資源を前記利用者の端末に送信する送信手順と
を実行することを特徴とするWeb資源追跡管理方法。 A web resource tracking management method for tracking the resource moved from a first web resource including one or more resources per page to another web resource, which is executed by a computer,
The computer is
A receiving procedure for receiving correspondence between the location information of the first Web resource and the target resource identification information for identifying the target resource included in the first Web resource;
An extraction procedure for retrieving the Web resource corresponding to the location information selected by the user;
A presence confirmation procedure for confirming whether or not the target resource exists in the Web resource extracted in the extraction procedure by the target resource identification information;
An extraction procedure for extracting a link to the other Web resource included in the Web resource if the resource of interest does not exist in the Web resource extracted in the extraction procedure;
A tracking procedure for notifying the extraction means of the location information indicated by the link extracted in the extraction procedure as the next location information;
A Web resource tracking management method comprising: executing a transmission procedure for transmitting the Web resource to the user terminal if the resource of interest exists in the Web resource extracted in the extraction procedure.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008210003A JP5187064B2 (en) | 2008-08-18 | 2008-08-18 | Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008210003A JP5187064B2 (en) | 2008-08-18 | 2008-08-18 | Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010044708A JP2010044708A (en) | 2010-02-25 |
JP5187064B2 true JP5187064B2 (en) | 2013-04-24 |
Family
ID=42016025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008210003A Expired - Fee Related JP5187064B2 (en) | 2008-08-18 | 2008-08-18 | Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5187064B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5519455B2 (en) * | 2010-09-21 | 2014-06-11 | 日本電信電話株式会社 | Web page link setting device and operation method thereof |
JP5765452B2 (en) * | 2014-01-20 | 2015-08-19 | 富士通株式会社 | Annotation addition / restoration method and annotation addition / restoration apparatus |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172614A (en) * | 1998-12-10 | 2000-06-23 | Nec Corp | Internet retrieving apparatus |
JP4172388B2 (en) * | 2003-12-08 | 2008-10-29 | 日本電気株式会社 | Link diagnostic device, link diagnostic method, and link diagnostic program. |
JP2006331019A (en) * | 2005-05-25 | 2006-12-07 | Nec Corp | Management device for web site, management method for web site, and program |
JP4767694B2 (en) * | 2006-01-13 | 2011-09-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Unauthorized hyperlink detection device and method |
JP4717677B2 (en) * | 2006-03-28 | 2011-07-06 | 株式会社エヌ・ティ・ティ・データ | Web page providing apparatus and web page providing program |
-
2008
- 2008-08-18 JP JP2008210003A patent/JP5187064B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010044708A (en) | 2010-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101454781B (en) | Expanded snippets | |
US8554800B2 (en) | System, methods and applications for structured document indexing | |
CN101192231B (en) | Bookmark based on context | |
US20090089278A1 (en) | Techniques for keyword extraction from urls using statistical analysis | |
CN101410834A (en) | Method of bookmarking in an internet browser | |
US20190235721A1 (en) | Flexible content organization and retrieval | |
JP2011022705A (en) | Trail management method, system, and program | |
JP2010128928A (en) | Retrieval system and retrieval method | |
JP2008090404A (en) | Document retrieval apparatus, method and program | |
JP5098605B2 (en) | Annotation program, annotation device | |
Jatowt et al. | Detecting age of page content | |
KR20110122719A (en) | Systems and methods for a search engine results page research assistant | |
JP5284064B2 (en) | Product ID server device and method for controlling product ID server device | |
JP2005174138A (en) | Content retrieval method, system, and program, and program recording medium | |
JP2004054588A (en) | Document retrieval device and method and program for making computer execute the same method | |
JP5187064B2 (en) | Web resource tracking management program, Web resource tracking management device, and Web resource tracking management method | |
JP5423470B2 (en) | Name identification check support device, name identification check support program, and name identification check support method | |
Wanjari et al. | Automatic news extraction system for Indian online news papers | |
JP2008176565A (en) | Database management method, program thereof and database management apparatus | |
JP5380874B2 (en) | Information retrieval method, program and apparatus | |
JP2006185059A (en) | Contents management apparatus | |
JP5391738B2 (en) | Annotation program, annotation apparatus, and annotation method | |
JP6707410B2 (en) | Document search device, document search method, and computer program | |
JP6578693B2 (en) | Information extraction apparatus, information extraction method, and display control system | |
JP3543726B2 (en) | Knowledge search service method and apparatus for supporting search of books and the like |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160201 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |