JP2006072494A - Url information management system - Google Patents
Url information management system Download PDFInfo
- Publication number
- JP2006072494A JP2006072494A JP2004252475A JP2004252475A JP2006072494A JP 2006072494 A JP2006072494 A JP 2006072494A JP 2004252475 A JP2004252475 A JP 2004252475A JP 2004252475 A JP2004252475 A JP 2004252475A JP 2006072494 A JP2006072494 A JP 2006072494A
- Authority
- JP
- Japan
- Prior art keywords
- url
- information
- investigation
- search result
- connection request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、URL記憶手段に記憶されているURLを管理するURL情報管理システムであって、特に、URLに対応するホームページのネットワーク上における現在の状況に基づいてURLを管理するものに関する。 The present invention relates to a URL information management system for managing a URL stored in a URL storage means, and more particularly to a URL information management system for managing a URL based on the current status of a homepage corresponding to the URL on the network.
従来のURL情報管理システムの一例であるウェブサイト検索システム101を図21に示す。ウェブサイト検索システム101は、ウェブサーバ110及び検索エンジンシステム120が互いにインターネット等のネットワーク130を介して接続されて構成されている。検索エンジンシステム120は、サイト情報の検索,削除等の処理を行う情報処理装置121と、この検索エンジンに登録される全てのウェブページのURLに関するサイト情報を格納するサイト情報データベース(以下、サイト情報DBという)122とを有している。また、情報処理装置121は、インターネット上のウェブサイトを検索して当該サイトにて提供されるウェブページの情報を収集するサイト情報収集部121aと、収集したサイト情報がサイト情報DB122内に登録済みか否かを検索し、その検索結果とサイト情報内の識別子とに基づいて各サイト情報の更新処理を行うサイト情報登録部121bと、サイト情報DB122内に登録済みの各URLにより実際にアクセスできるか否かを確認するサイト情報確認部121cと、当該サイト情報確認部121cにより実際にアクセスできなかったURLのサイト情報をサイト情報DB22から削除するサイト情報削除部121dと、を具備している。
FIG. 21 shows a
ここで、検索エンジンシステム20の動作について図22を用いて説明する。サイト情報収集部121aが、インターネット内で検索したウェブページのサイト情報を取得する(S201)。続いて、サイト情報登録部121bが、検索したウェブページと同じURLがサイト情報DB122内のURL項目内に既に登録済みであるか否かを、各URLについてそれぞれ検索する(S202、S203)。サイト情報DB122内のURL項目に同じURLが既に登録されている場合には、本処理動作は終了となる。
Here, the operation of the search engine system 20 will be described with reference to FIG. The site
一方、サイト情報DB122内のURL項目に同じURLが登録されていない場合には、さらにサイト情報登録部121bは、同じ識別子がサイト情報DB122内の識別子項目に登録済みであるか否かを検索する(S204)。
On the other hand, when the same URL is not registered in the URL item in the
ここで、識別子とは、識別子付与部11が当該ウェブサーバ10内の全てのHTMLファイル14に対して与えるそのウェブサーバ固有の番号である。また、一旦識別子が付与されたHTMLファイルを他のウェブサーバに移転させても、当該HTMLファイルの識別子は不変である。 Here, the identifier is a number unique to the web server that the identifier assigning unit 11 gives to all the HTML files 14 in the web server 10. Moreover, even if the HTML file once assigned with an identifier is transferred to another web server, the identifier of the HTML file remains unchanged.
ステップS204において、同じ識別子がサイト情報DB122内の識別子項目に登録されていない場合には、このURLのサイトは今回初めて検索された新規のサイトであると判断できるため、サイト情報登録部121bは、サイト情報DB122内に当該ウェブページのURL及び識別子を登録する(S205)。一方、ステップS204において同じ識別子がサイト情報DB122内の識別子項目に登録済みの場合には、このURLは何らかの理由で変更されたものであると判断できるため、サイト情報登録部121bは、サイト情報DB122内の該当するレコードのURL項目を当該ウェブページのURLに置き換えて登録する(S206)。以上の処理を、ステップS201において取得した全てのウェブページのサイト情報について行う(S207)。
In step S204, if the same identifier is not registered in the identifier item in the
以上のように、本実施形態のウェブサイト検索システム1によれば、検索エンジンシステム20におけるサイト情報の登録・更新処理を自動的に行うことが可能となり、その結果、本来無効であるべき変更前のURLが検索エンジンシステム20に登録されたままになることもない。
As described above, according to the
前述のウェブサイト検索システム101には、次のような問題点がある。ステップS202、S203において、検索したウェブページのURLとサイト情報DB122内のURLとが同一か否かを判断している。つまり、サイト情報DB122内のURLに対応するウェブページが、現在もそのURLにあるか否かを判断している。また、ステップS204において、サイト情報DB122内のURL項目に同じURLが登録されていない場合には、同じ識別子がサイト情報DB122内の識別子項目に登録済みであるか否かを検索する。つまり、サイト情報DB122内のURLに対応するウェブページが、他のURLに移動しているか否かについても判断している。また、ステップS206において、サイト情報DB122内のURLが何らかの理由で変更されたものであると判断できるものについては、サイト情報DB122内の該当するレコードのURLを置き換えて登録している。
The aforementioned
しかし、サイト情報DB122内のURLに対応するウェブページが何らかの理由で変更されたものであると確認できないもの、つまり、サイト情報DB122内のURLに対応するウェブページが、現在はそのURLに存在しないが、その異動先がわからないものについては、何ら対応がされず、いつまでもサイト情報DB122内に保存され続けることになる。従って、このサイト情報DB122について検索を行うと、現在は存在しないにもかかわらず、サイト情報DB122内のURLが表示されるものが存在する、という問題点がある。
However, the web page corresponding to the URL in the
また、従来のウェブサイト検索システム101では、サイト情報DB122内のURL全てについて、ステップS202におけるサイト情報DB122内のURLに対応するウェブページが他のURLに移動しているか否かの判断等を実行している。従って、サイト情報DB122内のURLの更新処理に時間がかかる、という問題点がある。
Further, in the conventional
そこで、本発明は、効率的にURLを管理することができるURL情報管理システムの提供を目的とする。 SUMMARY An advantage of some aspects of the invention is that it provides a URL information management system capable of efficiently managing URLs.
本発明に関する課題を解決するための手段及び発明の効果を以下に示す。 Means for solving the problems relating to the present invention and effects of the present invention will be described below.
本発明に係るURL管理システムでは、検索装置は、検索要求情報を取得し、前記検索要求情報を取得したと判断すると、前記検索情報に対応するURLを検索し、検索したURLに基づいて検索結果情報を生成し、前記検索結果情報を提供し、URL管理装置は、前記検索結果情報に含まれるURLのホームページに接続を求める旨の接続要求情報を取得し、前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行し、前記URL調査の調査結果と前記URLと関連付けて前記URL記憶手段に対して記憶する。 In the URL management system according to the present invention, when the search device acquires the search request information and determines that the search request information has been acquired, the search device searches the URL corresponding to the search information, and the search result is based on the searched URL. Information is generated and the search result information is provided, and the URL management apparatus acquires connection request information for requesting connection to the homepage of the URL included in the search result information, and determines that the connection request information has been acquired. Then, a URL presence check is performed to check whether or not a URL homepage corresponding to the connection request information exists in the URL, and the URL storage means is associated with the URL search result and the URL. Remember.
これにより、URL記憶手段に記憶されているURLについて、URLのホームページが当該URLに存在するか否かのURL存在調査結果を用いた管理が可能となるので、効率的なURLの管理が可能となる。 As a result, the URL stored in the URL storage means can be managed using the URL existence investigation result as to whether or not the URL home page exists in the URL, so that the URL can be efficiently managed. Become.
また、ユーザがアクセスを要求したURLについてURL存在調査を実行し、アクセスがないURLに対するURL存在調査は行われないので、効率的なURL管理が可能となる。 Further, since the URL presence check is executed for the URL requested by the user and the URL presence check is not performed for the URL without access, efficient URL management is possible.
本発明に係るURL管理装置では、検索装置に対して行われたURLの検索結果である検索結果情報に含まれるURLに対応するホームページに接続を求める旨の接続要求情報を取得し、前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行し、前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶する。 The URL management device according to the present invention acquires connection request information for requesting connection to a homepage corresponding to a URL included in search result information that is a search result of a URL performed on the search device, and the connection request If it is determined that the information has been acquired, a URL presence check is performed to check whether or not the URL homepage corresponding to the connection request information exists in the URL, and the URL search result and the URL are associated with the URL. Store in the storage means.
これにより、URL記憶手段に記憶されているURLについて、URLのホームページが当該URLに存在するか否かのURL存在調査結果を用いた管理が可能となるので、効率的なURLの管理が可能となる。 As a result, the URL stored in the URL storage means can be managed using the URL existence investigation result as to whether or not the URL home page exists in the URL, so that the URL can be efficiently managed. Become.
また、ユーザがアクセスを要求したURLについてURL存在調査を実行し、アクセスがないURLに対するURL存在調査は行われないので、効率的なURL管理が可能となる。 Further, since the URL presence check is executed for the URL requested by the user and the URL presence check is not performed for the URL without access, efficient URL management is possible.
本発明に係るURL管理装置では、検索装置に対して行われたURLの検索結果である検索結果情報を取得し、前記検索結果情報を取得したと判断すると、前記検索結果情報に含まれるURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行し、前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶する。 The URL management device according to the present invention acquires search result information that is a URL search result performed on the search device, and determines that the search result information has been acquired, the URL of the URL included in the search result information A URL presence check is performed to check whether a home page exists in the URL, and the URL storage means is stored in association with the URL check result and the URL.
これにより、URL記憶手段に記憶されているURLについて、URLのホームページが当該URLに存在するか否かのURL存在調査結果を用いた管理が可能となるので、効率的なURLの管理が可能となる。 As a result, the URL stored in the URL storage means can be managed using the URL existence investigation result as to whether or not the URL home page exists in the URL, so that the URL can be efficiently managed. Become.
また、検索結果情報に含まれる全てのURLについてURL存在調査を実行するので、URLの更新間隔が短くなり、効率的なURL管理が可能となる。 In addition, since the URL existence investigation is executed for all URLs included in the search result information, the URL update interval is shortened, and efficient URL management becomes possible.
本発明に係るURL管理装置では、URLに対応するホームページに接続を求める旨の接続要求情報を取得し、前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行し、前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶する。 The URL management device according to the present invention acquires connection request information for requesting connection to a homepage corresponding to the URL, and determines that the connection request information has been acquired, the homepage of the URL corresponding to the connection request information A URL presence check is performed to check whether the URL exists or not, and the URL check result is stored in the URL storage means in association with the URL.
これにより、例えば、リンク集に記載されているURLについて、URLのホームページが当該URLに存在するか否かのURL存在調査結果を用いた管理が可能となるので、効率的なリンク集の管理が可能となる。 As a result, for example, the URL described in the link collection can be managed using the URL existence investigation result as to whether or not the URL home page exists in the URL. It becomes possible.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記接続要求情報若しくは前記検索結果情報に対応するURLのホームページが当該URLに存在しないと判断すると、前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在するか否かを調査する相異URL存在調査を実行し、前記相異URL存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶する。 In the URL management system or the URL management apparatus according to the present invention, if it is determined that there is no home page of the URL corresponding to the connection request information or the search result information, the home page is the connection request information or the search. A different URL existence investigation is performed for investigating whether or not a URL different from the URL corresponding to the result information exists, and the difference URL existence investigation result and the URL corresponding to the connection request information or the search result information Are associated and stored in the URL storage means.
これにより、URLが他の異なるURLに変更されているか否かの相違URL存在調査の結果を用いたURLの管理が可能となる。従って、URLが他の異なるURLに変更されている場合には削除する等のURLの効率的な管理が可能となる。 As a result, it becomes possible to manage the URL using the result of the difference URL existence investigation as to whether or not the URL has been changed to another different URL. Therefore, when the URL is changed to another different URL, it is possible to efficiently manage the URL such as deleting it.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在しないと判断すると、当該異なるURLに対する上位のURLを有するコンピュータが存在するか否か調査する上位コンピュータ存在調査を実行し、前記上位コンピュータ存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶する。 In the URL management system or URL management device according to the present invention, if it is determined that the homepage does not exist in a URL different from the URL corresponding to the connection request information or the search result information, a higher-order URL for the different URL is displayed. An upper computer existence investigation for investigating whether there is a computer is executed, and the upper computer existence investigation result and the URL corresponding to the connection request information or the search result information are associated and stored in the URL storage means.
これにより、異なるURLに対する上位のURLを有するコンピュータが存在するか否かの上位コンピュータ存在調査の結果を用いたURLの管理が可能となる。従って、上位コンピュータが存在しない場合には削除する等のURLの効率的な管理が可能となる。 As a result, it becomes possible to manage URLs using the result of the high-level computer existence investigation as to whether or not there is a computer having a high-level URL for different URLs. Therefore, it is possible to efficiently manage URLs such as deleting when there is no host computer.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記異なるURLに対する上位のURLを有するコンピュータが存在しないと判断すると、前記上位のURLから当該上位のURLを特定する特定情報を得ることができるか否かを調査する特定情報調査を実行し、前記特定情報調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶する。 In the URL management system or the URL management device according to the present invention, if it is determined that there is no computer having a higher URL with respect to the different URL, specific information for specifying the higher URL can be obtained from the higher URL. A specific information investigation for investigating whether or not it is possible is executed, and the specific information investigation result and the URL corresponding to the connection request information or the search result information are associated and stored in the URL storage means.
これにより、上位のURLを特定する特定情報を得ることができるか否かの特定情報調査の結果を用いたURLの管理が可能となる。従って、上位のURLを特定する特定情報を得ることができない場合には削除する等のURLの効率的な管理が可能となる。 As a result, it becomes possible to manage the URL using the result of the specific information investigation as to whether or not the specific information specifying the upper URL can be obtained. Therefore, it is possible to efficiently manage URLs, such as deleting URLs when specific information for specifying higher-level URLs cannot be obtained.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記上位のURLから当該上位のURLを特定する特定情報を得ることができないと判断すると、前記URL情報記憶手段から、前記上位のURLを含むURLを削除する。 In the URL management system or URL management device according to the present invention, if it is determined that the specific information for specifying the higher URL cannot be obtained from the higher URL, the higher URL is obtained from the URL information storage means. Delete the included URL.
これにより、上位のURLを特定する特定情報を得ることができない場合には削除するので、URLの効率的な管理が可能となる。 As a result, when the specific information for specifying the upper URL cannot be obtained, the information is deleted, so that the URL can be efficiently managed.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記上位のURLから当該上位のURLを特定する特定情報を得ることができると判断すると、前記特定情報調査結果と前記上位のURLとを関連付けて上位URL情報記憶手段に記憶する。 In the URL management system or URL management device according to the present invention, if it is determined that the specific information for specifying the higher URL can be obtained from the higher URL, the specific information investigation result and the higher URL are obtained. The associated URL information is stored in the upper URL information storage means.
これにより、特定情報により特定できる上位のURLを有するコンピュータを管理することができる。従って、URL情報記憶手段に記憶されているURLのうち、同じ上位のURLを有するものを、上位URL情報記憶手段を用いることによって一括して管理することが可能となる。 Thereby, it is possible to manage a computer having a higher-level URL that can be specified by the specific information. Therefore, URLs having the same upper URL among the URLs stored in the URL information storage means can be collectively managed by using the upper URL information storage means.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時刻と前記接続要求情報に含まれるURLとを関連付けて前記URL情報記憶装置に記憶し、前記URL情報記憶装置における前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時間から所定の時間が経過しているか否かを判断し、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時間から所定の時間が経過していると判断すると、対応するURLについて、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を実行する。 In the URL management system or the URL management device according to the present invention, the URL existence investigation, the different URL existence investigation, the upper computer existence investigation, or the specific information investigation is performed, and the URL included in the connection request information is further determined. Whether or not a predetermined time has elapsed since the URL information investigation, the difference URL existence investigation, the upper computer existence investigation, or the specific information investigation was performed in the URL information storage device in association with the URL information storage device. And if it is determined that a predetermined time has elapsed from the time when the URL existence investigation, the difference URL existence investigation, the upper computer existence investigation, or the specific information investigation is performed, Existence investigation, difference URL existence investigation, host computer existence investigation, or specific information investigation To.
これにより、所定の間隔で各調査を行うことができるので、効率的なURLの管理が可能となる。 Thereby, since each investigation can be performed at a predetermined interval, efficient URL management becomes possible.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査に関する調査回数と前記接続要求情報に含まれるURLとを関連付けて前記URL情報記憶装置に記憶し、前記URL情報記憶装置における前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査に関する調査回数が所定の回数以上若しくは所定の回数より大きいか否かを判断し、前記調査回数が所定の回数以上若しくは所定の回数より大きいと判断すると、前記URL情報記憶装置から、当該調査回数に対応するURLを削除する。 In the URL management system or URL management apparatus according to the present invention, the number of investigations related to the URL existence investigation, the different URL existence investigation, the upper computer existence investigation, or the specific information investigation is further associated with the URL included in the connection request information. Stored in the URL information storage device, and the number of investigations related to the URL existence investigation, the different URL existence investigation, the upper computer existence investigation, or the specific information investigation in the URL information storage device is greater than or equal to a predetermined number of times. If it is determined whether the number of investigations is equal to or greater than a predetermined number or greater than a predetermined number, the URL corresponding to the number of investigations is deleted from the URL information storage device.
これにより、一定回数以上、各調査を行ったURLについては削除するので、効率的なURL管理が可能となる。 As a result, URLs that have been surveyed for a certain number of times or more are deleted, so efficient URL management becomes possible.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記URL情報記憶装置における前記調査回数が所定の回数以上若しくは所定の回数より大きいか否かの調査を行う時期を、前記調査回数に基づいて決定する。 In the URL management system or the URL management device according to the present invention, the timing for investigating whether or not the number of investigations in the URL information storage device is greater than or equal to a predetermined number or greater than a predetermined number is based on the number of investigations. To decide.
これにより、調査の回数によって、調査間隔を変更することができるので、効率的なURL管理が可能となる。 As a result, the survey interval can be changed depending on the number of surveys, so that efficient URL management is possible.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査の結果と前記URL情報記憶手段に記憶されているURLを検索結果情報に含めるか否かを示す表示可否情報とを関連付けて前記URL情報記憶手段に記憶する。 In the URL management system or the URL management apparatus according to the present invention, the URL presence survey, the different URL presence survey, the host computer presence survey, or the result of the specific information survey and the URL stored in the URL information storage means are further stored. The URL information storage means stores the information in association with display availability information indicating whether or not to include the search result information.
これにより、各調査の結果をふまえた上で、検索結果情報として対応するURLを表示するか否かを決定することが可能となる。従って、ホームページが対応するURLに存在しない場合には、検索結果として表示しない等の表示処理が可能となるので、検索を行うユーザの利便性を向上させることが可能となる。 Thereby, it is possible to determine whether or not to display the corresponding URL as the search result information based on the results of each investigation. Therefore, when the home page does not exist in the corresponding URL, display processing such as not displaying as a search result is possible, so that it is possible to improve the convenience of the user who performs the search.
本発明に係るURL管理システム又はURL管理装置では、さらに、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査の結果と前記URL情報記憶手段に記憶されているURLを検索結果情報として表示する際に順番を示す表示順番情報とを関連付けて前記URL情報記憶手段に記憶する。 In the URL management system or the URL management apparatus according to the present invention, the URL presence survey, the different URL presence survey, the host computer presence survey, or the result of the specific information survey and the URL stored in the URL information storage means are further stored. When displaying it as search result information, it is stored in the URL information storage means in association with display order information indicating the order.
これにより、各調査の結果をふまえた上で、検索結果情報として対応するURLを表示するか否かを決定することが可能となる。従って、ホームページが対応するURLに実際に存在するか否か不明な場合には、検索結果として表示する順番を後にする等の表示処理が可能となるので、検索を行うユーザの利便性を向上させることが可能となる。 Thereby, it is possible to determine whether or not to display the corresponding URL as the search result information based on the results of each investigation. Therefore, when it is unclear whether or not the home page actually exists in the corresponding URL, display processing such as decrementing the order of display as a search result becomes possible, improving the convenience of the user who performs the search. It becomes possible.
ここで、請求項に記載されている要素と実施例における要素との対応関係を示す。URL管理システムはURL管理システム1に、URL管理装置はURL管理装置21及びURLDBサーバ29に、検索装置は検索サーバ23に、それぞれ対応する。
Here, the correspondence relationship between the elements described in the claims and the elements in the embodiment is shown. The URL management system corresponds to the
検索要求情報取得手段はCPU311及び通信回路318に、検索手段はCPU311に、検索結果情報生成手段はCPU311に、検索結果情報提供手段はCPU311及び通信回路318に、それぞれ該当する。
The search request information acquisition means corresponds to the
接続要求情報取得手段はCPU211及び通信回路218に、URL調査実行手段はCPU211に、URL管理手段はCPU211に、URL記憶手段はURLDBサーバ29のハードディスク913に、検索結果情報取得手段はCPU211及び通信回路218に、上位URL情報記憶手段はURL管理装置21のハードディスク113に、それぞれ該当する。
The connection request information acquisition means is the
接続要求取得手段はステップS1の処理を、URL調査実行手段はステップS3〜S9、S301〜S307、S401〜S404、S411〜S419、S501〜S504、S700〜S704、S802〜S804の処理を、URL管理手段はステップS1001〜S1007、S1101〜S1109、S1201〜S1207、S1301〜S1319の処理を、それぞれ実行する。 URL request management means performs the process of step S1, URL investigation execution means performs the processes of steps S3 to S9, S301 to S307, S401 to S404, S411 to S419, S501 to S504, S700 to S704, and S802 to S804. The means executes steps S1001 to S1007, S1101 to S1109, S1201 to S1207, and S1301 to S1319, respectively.
検索要求情報はユーザ端末から検索サーバ23へのアクセスに、検索結果情報は検索サーバ23からユーザ端末への検索結果に、上位のURLはホストコンピュータのURLに、上位のURLを有するコンピュータはホストコンピュータに、特定情報はIPアドレスに、表示可否情報及び表示順番情報は登録URLDBの[URL状態]列の値及び画面制御テーブルに、それぞれ対応する。
The search request information is the access from the user terminal to the
「URL存在調査」は、ステップS3、S301〜S307に示すURL存在調査に該当する。 “URL presence check” corresponds to the URL presence check shown in steps S3 and S301 to S307.
「相違URL存在調査」は、ステップS5、S401〜S404に示す遷移先URL存在調査に該当する。 The “difference URL presence check” corresponds to the transition destination URL presence check shown in steps S5 and S401 to S404.
「上位コンピュータ存在調査」は、ステップS7、S411〜S419、S700〜S704、S802〜S804に示す上位コンピュータ存在調査に該当する。 The “upper computer existence investigation” corresponds to the upper computer existence investigation shown in steps S7, S411 to S419, S700 to S704, and S802 to S804.
「特定情報調査」は、ステップS9、S501〜S504に示すIPアドレス変換調査に該当する。 The “specific information check” corresponds to the IP address conversion check shown in steps S9 and S501 to S504.
本発明におけるURL情報管理システムの実施例を以下において説明する。 An embodiment of the URL information management system according to the present invention will be described below.
1.概要
本発明に係るURL情報管理システムの概要を図1に示す機能ブロック図を用いて説明する。URL情報管理システム1は、URL管理装置M21、及び検索装置M23を有している。URL管理装置M21は、ホームページのURLを記憶するURL記憶手段m19に記憶されているURLの管理を行う。検索装置M23は、ホームページのURLの検索を行う。
1. Outline An outline of a URL information management system according to the present invention will be described with reference to a functional block diagram shown in FIG. The URL
検索装置M23は、検索要求情報取得手段m31、検索手段m33、検索結果情報生成手段m35、及び検索結果情報提供手段m37を有している。検索要求情報取得手段m31は、検索要求情報を取得する。検索手段m33は、検索要求情報を取得したと判断すると、前記検索情報に対応するURLを検索する。検索結果情報生成手段m35は、検索手段が検索したURLに基づいて検索結果情報を生成する。検索結果情報提供手段m37は、検索結果情報を提供する。 The search device M23 includes search request information acquisition means m31, search means m33, search result information generation means m35, and search result information provision means m37. The search request information acquisition unit m31 acquires search request information. When it is determined that the search request information has been acquired, the search unit m33 searches for a URL corresponding to the search information. The search result information generation unit m35 generates search result information based on the URL searched by the search unit. The search result information providing unit m37 provides search result information.
URL管理装置M21は、接続要求情報取得手段m11、URL調査実行手段m13、及びURL管理手段m15を有している。接続要求情報取得手段m11は、検索結果情報に含まれるURLのホームページに接続を求める旨の接続要求情報を取得する。URL調査実行手段m13は、接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行する。URL管理手段m15は、URL調査の調査結果と前記URLと関連付けて前記URL記憶手段に対して記憶する。 The URL management device M21 includes connection request information acquisition means m11, URL investigation execution means m13, and URL management means m15. The connection request information acquisition unit m11 acquires connection request information for requesting connection to the homepage of the URL included in the search result information. When the URL investigation execution unit m13 determines that the connection request information has been acquired, the URL investigation execution unit m13 executes a URL existence investigation for examining whether or not the URL home page corresponding to the connection request information exists in the URL. The URL management unit m15 stores the URL search result in association with the URL and the URL storage unit.
これにより、URL記憶手段m19に記憶されているURLについて、URLのホームページが当該URLに存在するか否かのURL存在調査結果を用いた管理が可能となるので、効率的なURLの管理が可能となる。また、ユーザがアクセスを要求したURLについてURL存在調査を実行し、アクセスがないURLに対するURL存在調査は行われないので、効率的なURL管理が可能となる。 As a result, the URL stored in the URL storage unit m19 can be managed using the URL existence investigation result as to whether or not the URL homepage exists in the URL, so that the URL can be efficiently managed. It becomes. Further, since the URL presence check is executed for the URL requested by the user and the URL presence check is not performed for the URL without access, efficient URL management is possible.
2. ハードウェア構成
2.1. URL情報管理システム1のハードウェア構成
URL情報管理システム1のハードウェア構成について図2を用いて説明する。URL情報管理システム1はURL情報管理装置21、検索サーバ23、URLデータベースサーバ(以下、URLDBサーバ)29で構成されている。URLDBサーバ29は、ホームページのURLを記憶している。URL情報管理装置21は、URLDBサーバ29に記憶されているURLの管理を行う。検索サーバ23は、ホームページのURLの検索を行う。
2. Hardware configuration
2.1. Hardware Configuration of URL
2.2. URL情報管理装置21のハードウェア構成
URL情報管理装置21のハードウェア構成を図3に基づいて説明する。URL情報管理装置21は、CPU211、メモリ212、ハードディスク213及び通信回路218を備えている。
2.2. Hardware Configuration of URL
CPU211は、ハードディスク213に記録されているオペレーティング・システム(OS)、URL情報管理プログラム等その他のアプリケーションに基づいた処理を行う。メモリ212は、CPU211に対して作業領域を提供する。ハードディスク213は、オペレーティング・システム(OS)、URL情報管理プログラム等その他のアプリケーション及び各種データを記録保持する。なお、ハードディスク213に記録されているデータについては後述する。
The
通信ボード218は、ネットワークに接続する通信回路を有しており、外部の通信機器とデータの送受信を行う。
The
なお、URL情報管理装置21には、キーボード214、マウス215、ディスプレイ216及びCD−ROMドライブ217が接続されている。キーボード214、マウス215は、外部からの命令を受け付ける。ディスプレイ216は、ユーザインターフェイス等の画像を表示する。CD−ROMドライブ217は、URL情報管理プログラムが記録されているCD−ROM210からURL情報管理プログラム及び他のCD−ROMからその他のアプリケーションのプログラムを読み取る等、CD−ROMからのデータの読み取りを行う。
Note that a
2.3. 検索サーバ23のハードウェア構成
検索サーバ23のハードウェア構成を図4に基づいて説明する。検索サーバ23は、CPU311、メモリ312、ハードディスク313及び通信回路318を備えている。
2.3. Hardware Configuration of
CPU311は、ハードディスク313に記録されているオペレーティング・システム(OS)、検索サーバプログラム等その他のアプリケーションに基づいた処理を行う。メモリ312は、CPU311に対して作業領域を提供する。ハードディスク313は、オペレーティング・システム(OS)、検索サーバプログラム等その他のアプリケーション及び各種データを記録保持する。
The
通信ボード318は、ネットワークに接続する通信回路を有しており、外部の通信機器とデータの送受信を行う。
The
なお、検索サーバ23には、キーボード314、マウス315、ディスプレイ316及びCD−ROMドライブ317が接続されている。キーボード314、マウス315は、外部からの命令を受け付ける。ディスプレイ316は、ユーザインターフェイス等の画像を表示する。CD−ROMドライブ317は、検索サーバプログラムが記録されているCD−ROM310から検索サーバプログラム及び他のCD−ROMからその他のアプリケーションのプログラムを読み取る等、CD−ROMからのデータの読み取りを行う。
Note that a
2.4. URLDBサーバ29のハードウェア構成
URLDBサーバ29のハードウェア構成を図5に基づいて説明する。URLDBサーバ29は、CPU911、メモリ912、ハードディスク913及び通信回路918を備えている。
2.4. Hardware Configuration of
CPU911は、ハードディスク913に記録されているオペレーティング・システム(OS)、URLDBサーバプログラム等その他のアプリケーションに基づいた処理を行う。メモリ912は、CPU911に対して作業領域を提供する。ハードディスク913は、オペレーティング・システム(OS)、URLDBサーバプログラム等その他のアプリケーション及び各種データを記録保持する。なお、ハードディスク913に記録されているデータについては後述する。
The
通信ボード918は、ネットワークに接続する通信回路を有しており、外部の通信機器とデータの送受信を行う。
The
なお、URLDBサーバ29には、キーボード914、マウス915、ディスプレイ916、CD−ROMドライブ917が接続されている。キーボード914、マウス915は、外部からの命令を受け付ける。ディスプレイ916は、ユーザインターフェイス等の画像を表示する。CD−ROMドライブ917は、URLDBサーバプログラムが記録されているCD−ROM910からURLDBサーバプログラム及び他のCD−ROMからその他のアプリケーションのプログラムを読み取る等、CD−ROMからのデータの読み取りを行う。
Note that a
3. データ
URL情報管理装置21のハードディスク213は、画面制御テーブル、存在未確認ホストデータベース(存在未確認ホストDB)、及びメンテナンステーブルを記録保持している。また、URLDBサーバ29のハードディスク213は、登録URLデータベース(以下、登録URLDB)を記録保持している。
3. Data The
3.1. 登録URLDB
URLDBサーバ29のハードディスク913に記録保持されている登録URLDBには、検索サーバ23が取得したURLとそのURLに対応するホームページのネットワーク上における現在の状態とが関連付けて登録されている。登録URLDBの一例を図6に示す。
3.1. Registration URLDB
In the registered URL DB recorded and held in the
登録URLDBは、[登録URL]列、[調査時間]列、[URL状態]列、及び[調査回数]列を有している。 The registered URL DB has a [Registered URL] column, a [Survey Time] column, a [URL Status] column, and a [Number of Surveys] column.
[登録URL]列には、検索サーバ23が収集したURLが記述される。本実施例においては、記述されるURLとして、一般的なURLの形式(http://www.abcd.co.jp/efg/aa.htm)の他に、一般的なURLの形式に所定の更新フラグを付加したURL(更新フラグ付加URL)の形式(http://www.abcd.co.jp/efg/aa.htm?Check=ON)の2種類を用意している。更新フラグとは、あるURLにおいて、前回のアクセス時間から所定の間隔を超えた場合に付加するフラグである。
In the [Registered URL] column, URLs collected by the
[調査時間]列には、[登録URL]列に記述されたURLに対応するホームページのネットワーク上における現在の状態を把握するための調査であるURL調査を行った時間が記述される。 In the [Investigation time] column, the time when the URL survey, which is a survey for grasping the current state of the homepage on the network corresponding to the URL described in the [Registered URL] column, is described.
[URL状態]列には、[URL]列に記述されたURLの現在の状態が記述される。本実施例においては、URLの状態として、「URL有り」、「URL遷移有り」、「URL遷移なし」、「ホストが存在しない」、及び「アクセス禁止」を定義している。 In the [URL status] column, the current status of the URL described in the [URL] column is described. In the present embodiment, “with URL”, “with URL transition”, “without URL transition”, “host does not exist”, and “access prohibited” are defined as URL states.
「URL有り」とは、登録URLDBに登録されているURLに対応するホームページがそのURLに存在すること、を意味する。 “With URL” means that a home page corresponding to the URL registered in the registered URL DB exists in the URL.
「URL遷移有り」とは、登録URLDBに登録されているURLに対応するホームページがそのURLとは異なるURLに存在すること、及び、登録URLDBに登録されているURLとは異なるURLと同一階層若しくは同一階層より下位階層のURLに対応するホームページが前記異なるURLに存在すること、を意味する。 “With URL transition” means that the home page corresponding to the URL registered in the registered URL DB exists in a URL different from the URL, and the same hierarchy as the URL different from the URL registered in the registered URL DB or This means that a homepage corresponding to a URL in a lower hierarchy than the same hierarchy exists in the different URL.
「遷移先URLが存在しない」とは、登録URLDBに登録されているURLに対応するホームページがそのURLとは異なるURLに存在すると確定することはできないが、登録URLDBに登録されているURLとは異なるURLのホストコンピュータには接続できること、を意味する。 “The transition destination URL does not exist” means that the homepage corresponding to the URL registered in the registered URL DB cannot be determined to exist in a URL different from the URL, but the URL registered in the registered URL DB is It means that it is possible to connect to a host computer with a different URL.
「ホストが存在しない」とは、登録URLDBに登録されているURLとは異なるURLのホストコンピュータに接続できないが、登録URLDBに登録されているURLとは異なるURLのURLからIPアドレスに変換できること、を意味する。 “Host does not exist” means that a host computer having a URL different from the URL registered in the registered URL DB cannot be connected, but a URL having a URL different from the URL registered in the registered URL DB can be converted into an IP address. Means.
「アクセス禁止」とは、登録URLDBに登録されているURL等にアクセスすることができないことを意味する。 “Access prohibited” means that a URL or the like registered in the registered URL DB cannot be accessed.
[調査回数]列には、[URL状態]列の値が「URL遷移なし」の場合に、URL調査を行った回数が記述される。 In the [Number of investigations] column, the number of URL investigations when the value of the [URL status] column is “No URL transition” is described.
3.2. 画面制御テーブル
URL情報管理装置21のハードディスク213に記録保持されてる画面制御テーブルには、あるURLに対応するホームページのネットワーク上における現在の状態とそのURLを検索結果情報としてディスプレイ216に表示するか否かの判断とが関連付けて登録されている。画面制御テーブルの一例を図7に示す。
3.2. Screen Control Table The screen control table recorded and held in the
画面制御テーブルは、[URL状態]列及び[画面表示]列を有している。[URL状態]列には、あるURLに対応するホームページのネットワーク上における現在の状態の種類が記述される。本実施例においては、[URL状態]列の値として、「URL有り」、「URL遷移有り」、「URL遷移なし」、「ホストが存在しない」、及び「アクセス禁止」を定義している。各値の定義は、登録URLDBにおける[URL状態]列と同様である。 The screen control table has a [URL status] column and a [Screen display] column. In the [URL status] column, the type of the current status on the network of the homepage corresponding to a certain URL is described. In the present embodiment, “URL present”, “URL transition present”, “URL transition absent”, “Host does not exist”, and “Access prohibited” are defined as values of the [URL status] column. The definition of each value is the same as the [URL status] column in the registered URL DB.
[画面表示]列には、[URL状態]列に記述された状態を有する登録URLをディスプレイ216にどのように表示するかを示す画面表示の制御ルールが記述される。本実施例においては、[画面表示]列の値として、「表示しない」、「表示する」、及び「表示する。表示順は最後。」を定義している。「表示しない」とは、対応するURLをディスプレイ216上に検索結果情報として表示しないことを意味する。「表示する」とは、対応するURLをディスプレイ216上に検索結果情報として表示することを意味する。「表示する。表示順は最後。」とは、対応するURLをディスプレイ216上に検索結果情報として表示するが、検索結果として表示されるURLの最後尾に表示することを意味する。
In the [Screen Display] column, a screen display control rule indicating how the registered URL having the state described in the [URL State] column is displayed on the
本実施例においては、画面表示の制御ルールとして、あるURLに対応するホームページのネットワーク上における現在の状態が「ホストが存在しない」若しくは「遷移先URLが存在しない」場合には「URLの表示を行わない」こととし、また、「アクセス禁止」の場合には「表示の優先度を最後にする」こととしている。従って、図7の画面制御テーブルには、[URL状態]列の値「ホストが存在しない」、「遷移先URLが存在しない」に対応して[画面表示]列の値「表示しない」が記述される。また、[URL状態]列の値「アクセス禁止」に対応して[画面表示]列の値「表示する。表示順は最後。」等が記述される。このようにあらかじめURLの状態に応じた画面表示の制御ルールを定義しておくことによって、登録URLを検索結果としてディスプレイ216に表示する際の見栄えを調整する。
In this embodiment, as a screen display control rule, if the current state of the homepage corresponding to a certain URL on the network is “no host” or “no transition destination URL”, “display URL” is displayed. In the case of “access prohibition”, “the display priority is made last”. Therefore, in the screen control table of FIG. 7, the value “not displayed” in the “screen display” column is described corresponding to the values “host does not exist” and “transition destination URL does not exist” in the [URL status] column. Is done. In addition, the value “displayed in the last display order” in the “screen display” column is described in correspondence with the value “access prohibited” in the “URL status” column. In this way, by defining a screen display control rule corresponding to the URL state in advance, the appearance when the registered URL is displayed on the
3.3. 存在未確認ホストDB
URL情報管理装置21のハードディスク213に記録保持されてる存在未確認ホストDBには、あるURLに対応するホストコンピュータのURLと当該ホストコンピュータのネットワーク上における現在の状態とが関連付けて登録されている。存在未確認ホストDBの一例を図8に示す。
3.3. Unexisting host DB
In the presence-unconfirmed host DB recorded and held in the
未確認ホストDBは、[ホストURL]列、[調査時間]列、及び[調査回数]列を有している。[ホストURL]列には、ホストコンピュータのURLが記述される。[調査時間]列には、[ホストURL]列に記述されたURLを有するホストコンピュータに対してホスト存在調査若しくはホスト存在再調査を行った時間が記述される。[調査回数]列には、ホスト存在調査若しくはホスト存在再調査を行った回数が記述される。なお、ホストコンピュータ、ホスト存在調査、及びホスト存在再調査については、後述する。 The unconfirmed host DB has a [Host URL] column, a [Investigation time] column, and a [Number of investigations] column. In the [Host URL] column, the URL of the host computer is described. In the [Investigation time] column, the time when the host existence investigation or the host existence re-examination is performed on the host computer having the URL described in the [Host URL] column is described. In the [Number of investigations] column, the number of times the host existence investigation or the host existence re-examination was performed is described. The host computer, the host presence check, and the host presence recheck are described later.
3.4. メンテナンステーブル
URL情報管理装置21のハードディスク213に記録保持されてるメンテナンステーブルには、あるURLに対応するホームページのネットワーク上における現在の状態とそのURLを検索結果情報としてディスプレイ216に表示するか否かの判断とが関連付けて登録されている。メンテナンステーブルには、URL調査回数に基づくメンテナンステーブルであるURL調査用メンテナンステーブルとホスト調査回数に基づくメンテナンステーブルであるホスト調査用メンテナンステーブルがある。URL調査用メンテナンステーブルを図9Aに、ホスト調査用メンテナンステーブルを図9Bに、それぞれ示す。
3.4. Maintenance Table In the maintenance table recorded and held in the
図9Aに示すように、URL調査用メンテナンステーブルは、[URL調査回数]列及び[調査間隔]列を有する。[URL調査回数]列には、URL存在調査等の調査を行った回数が記述される。[調査間隔]列には、これまで[URL調査回数]列に記述された回数の調査を行ったURLについて、次回の調査を行うまでの間隔が記述される。 As shown in FIG. 9A, the URL search maintenance table has a [URL search count] column and a [search interval] column. In the [URL investigation count] column, the number of investigations such as URL existence investigation is described. In the [Survey interval] column, the interval until the next survey is described for URLs that have been surveyed the number of times described in the [URL survey count] column.
一方、図9Bに示すように、ホスト調査用メンテナンステーブルは、[ホスト調査回数]列及び[調査間隔]列を有する。[ホスト調査回数]列には、ホスト存在調査を行った回数が記述される。[調査間隔]列には、これまで[ホスト調査回数]列に記述された回数のホスト存在調査を行ったホストコンピュータについて、次回の調査を行うまでの間隔が記述される。 On the other hand, as shown in FIG. 9B, the host investigation maintenance table has a “host investigation count” column and a “survey interval” column. In the [Number of Host Checks] column, the number of times the host presence check was performed is described. In the [Investigation Interval] column, the interval until the next investigation is described for the host computer that has been subjected to the host existence investigation as many times as described in the [Host Investigation Count] column.
4. URL情報管理装置21の動作
4.1. 概要
ユーザは、ホームページの検索をする際に、ユーザ端末から検索サーバ23へアクセスする。検索サーバ23のCPU311は、ユーザからのアクセスがあったと判断すると、URLDBサーバ29に対して所定の検索処理を行い、検索結果をユーザ端末へ送信する。
4. Operation of URL
4.1. Overview A user accesses the
CPU311がユーザ端末へ送信する検索結果には、更新フラグ付加URLが含まれている場合がある。検索結果に更新フラグ付加URLが含まれている場合には、CPU311は、ユーザが更新フラグ付加URLを選択した場合に、当該更新フラグ付加URLに接続を希望する旨の接続要求情報がURL情報管理装置21へ送信されるように検索結果を構築しておく。このように接続要求情報をURL情報管理装置21へ送信する方法としては、プログラム、スクリプト、タグ等を検索結果に埋め込む方法がある。
The search result transmitted from the
また、このとき送信される検索結果は、画面制御テーブルを利用して構築されている。つまり、CPU311は、検索結果に含まれる各URLについて、対応する[URL状態]列の値を取得し、さらに、画面制御テーブルにおいて対応する[画面表示]列の値を取得し、取得した[画面表示]列の値に基づいて検索結果を構築する。これにより、検索結果を獲得したユーザ端末のディスプレイには、URLに対応するリンク先が存在しない等検索結果としては有用ではない情報が表示されない、若しくは最後の方に表示されるので、ユーザの効率的な検索結果の利用が可能となる。
Further, the search result transmitted at this time is constructed using the screen control table. That is, the
URL管理装置21の動作の概要を図10を用いて説明する。URL管理装置21のCPU211は、接続要求情報を取得したと判断すると(S1)、前記接続要求情報に対応する更新フラグ付加URLのホームページが当該更新フラグ付加URLに存在するか否かを調査するURL存在調査を実行する(S3)。
An outline of the operation of the
CPU211は、前記接続要求情報に対応する更新フラグ付加URLのホームページが当該更新フラグ付加URLに存在しないと判断すると、前記ホームページが接続要求情報に対応する更新フラグ付加URLとは異なるURLに存在するか否かを調査する遷移先URL存在調査を実行し、遷移先URL存在調査結果と接続要求情報に対応する更新フラグ付加URLとを関連付けてURLDBサーバ29のハードディスク913に記憶されている登録URLDBに記憶する(S5)。
If the
また、CPU211は、前記ホームページが検索結果情報に対応する更新フラグ付加URLとは異なるURLに存在しないと判断すると、当該異なるURLに対する上位のURLを有するホストコンピュータが存在するか否か調査するホスト存在調査を実行し、当該ホスト存在調査結果と接続要求情報に対応する更新フラグ付加URLとを関連付けてURLDBサーバ29のハードディスク913に記憶されている登録URLDBに記憶する(S7)。
When the
さらに、CPU211は、前記異なるURLに対する上位のURLを有するホストコンピュータが存在しないと判断すると、前記上位のURLから当該上位のURLを特定するIPアドレスを得ることができるか否かを調査するIPアドレス変換調査を実行し、当該IPアドレス変換調査結果と接続要求情報に対応する更新フラグ付加URLとを関連付けてURLDBサーバ29のハードディスク913に記憶されている登録URLDBに記憶する(S9)。また、CPU211は、前記上位のURLから当該上位のURLを特定するIPアドレスを得ることができると判断すると、IPアドレス変換調査結果と上位のURLとを関連付けてURL情報管理装置21のハードディスク113に記憶されている存在未確認ホストDBに記憶する(S11)。
Further, when the
さらに、CPU211は、URL存在調査、遷移先URL存在調査、ホスト存在調査、若しくはIPアドレス変換調査を行った時間から所定の時間が経過しているか否かを判断し、URL存在調査、遷移先URL存在調査、ホスト存在調査、若しくはIPアドレス変換調査を行った時間から所定の時間が経過していると判断すると、対応するURLについて、URL存在調査、遷移先URL存在調査、ホスト存在調査、若しくはIPアドレス変換調査を実行し、各調査結果と登録URLDBに記憶されているURLとを関連付けて登録URLDBを更新する(S13)。
Further, the
以下において、URL存在調査処理(S3)、遷移先URL存在調査処理(S5)、ホスト存在調査処理(S7)、IPアドレス変換調査処理(S9、S11)、及びメンテナンス処理(S13)について説明する。 In the following, the URL presence check process (S3), the transition destination URL presence check process (S5), the host presence check process (S7), the IP address conversion check process (S9, S11), and the maintenance process (S13) will be described.
4.1.1 URL存在調査処理
ユーザが、更新フラグ付加URLを選択した場合のURL存在調査処理について図11に示すフローチャートを用いて説明する。URL情報管理装置21のCPU211は、更新フラグ付加URLに対応するホームページ(以下、元ホームページとする。)がその更新フラグ付加URL(詳細には、更新フラグ付加URLから更新フラグを除いたURL)に存在するか否かを判断する(S303)。元ホームページがその更新フラグ付加URLに存在するか否かの判断は、CPU211が、更新フラグ付加URLに対応するホームページに実際にアクセスできるか否かで判断する。
4.1.1 URL Presence Investigation Process The URL existence investigation process when the user selects the update flag addition URL will be described with reference to the flowchart shown in FIG. The
CPU211は、元ホームページが更新フラグ付加URLに存在しないと判断すると、元ホームページが他のURL(以下、遷移先URLとする。)へ移動した可能性があるか否かを判断する遷移先URL存在調査処理を実行する(S305)。
When the
一方、CPU211は、元ホームページが更新フラグ付加URLに存在すると判断すると、登録URLDBの[URL状態]列の値を「URL有り」に、[調査時間]列の値を現在の時刻に、[調査回数]列の値を「0」に、それぞれ更新する(S307)。
On the other hand, if the
4.1.2 遷移先URL存在調査処理
次に、遷移先URL存在調査処理について図12に示すフローチャートを用いて説明する。CPU211は、ステップS303(図11参照)において元ホームページが更新フラグ付加URLに存在しないと判断すると、元ホームページが他のURL(以下、遷移先URLとする。)へ移動した可能性があるか否かを判断する(S401)。元ホームページが遷移先URLへ移動した可能性があるかの判断は、例えば、HTTPステータスコードで判断する。HTTPステータスコードが「301」等であれば元ホームページは遷移先URLへ移動した可能性があることを示す。
4.1.2 Transition Destination URL Presence Investigation Process Next, the transition destination URL existence investigation process will be described with reference to the flowchart shown in FIG. If the
CPU211は、ステップS401において元ホームページが遷移先URLへ移動した可能性があると判断すると、元ホームページがその遷移先URLに実際に存在するか否かを判断する(S402)。元ホームページがその遷移先URLに実際に存在するか否かの判断は、CPU211が、元ホームページに実際にアクセスできるか否かで判断する。
If the
CPU211は、ステップS402において元ホームページがその遷移先URLに存在すると判断すると、登録URLDBの[URL状態]列の値を「URL遷移有り」に、[調査時間]列の値を現在の時刻に、[調査回数]列の値を「0」に、それぞれ更新する(S403)。
If the
一方、CPU211は、ステップS402において元ホームページがその遷移先URLに存在しないと判断すると、ホスト存在調査処理を実行する(S404)。ホスト存在調査処理については、後述する。
On the other hand, if the
なお、CPU211は、ステップS401において元ホームページが遷移先URLへ移動した可能性がないと判断すると、登録URLDBの[URL状態]列の値を「遷移先URLが存在しない」に、[調査時間]列の値を現在の時刻に、[調査回数]列の値を「1」に、それぞれ更新する(S405)。
If the
4.1.3 ホスト存在調査処理
次に、ホスト存在調査処理について図13に示すフローチャートを用いて説明する。CPU211は、ステップS402(図11参照)において元ホームページが遷移先URLに存在しないと判断すると、遷移先URLのホストコンピュータ(以下、ホスト)にアクセスできるか否かを判断する(S411)。なお、ホストとは、遷移先URLが「http://www.abcd.co.jp/efg/aa.htm」である場合、「http://www.abcd.co.jp」のURLを有するコンピュータのことをいう。
4.1.3 Host Presence Check Process Next, the host presence check process will be described with reference to the flowchart shown in FIG. If the
CPU211は、ステップS411において遷移先URLのホストにアクセスできないと判断すると、登録URLDB(図6参照)の[URL状態]列の値を「ホストに接続できない」に更新する(S413)。その後、CPU211は、IPアドレス変換調査処理を実行する(S415)。IPアドレス変換調査処理については、後述する。
If the
一方、CPU211は、ステップS411において遷移先URLのホストにアクセスできると判断すると、登録URLDBの[URL状態]列の値を「遷移先URLが存在しない」に、[調査時間]列の値を現在の時刻に、[調査回数]列の値を「1」に、それぞれ更新する(S417)。
On the other hand, if the
ここで、ホストが存在するが、元ホームページが遷移先URLに存在しない場合は、元ホームページに関するサイト全てが存在しない可能性がある。この場合、遷移先URLと「同一階層のURL」又は「同一階層より下位階層のURL」にも対応するホームページが存在しない可能性がある。従って、CPU211は、遷移先URLと「同一階層のURL」又は「同一階層より下位階層のURL」に、それぞれのURLに対応するホームページが存在するか否かを調査するサイト存在調査処理を実行する(S419)。ここで、「同一階層のURL」とは、例えば、「http://www.xxww.ne.jp/zzz/bb.htm」というURLに対しては、「http://www.xxww.ne.jp/zzz/fff.htm」のようなURLをいい、「同一階層より下位階層のURL」とは、「http://www.xxww.ne.jp/zzz/・・/・・/ZZ.htm」のようなURLをいう。
Here, if the host exists but the original homepage does not exist in the transition destination URL, there is a possibility that not all the sites related to the original homepage exist. In this case, there is a possibility that there is no home page corresponding to the transition destination URL and “URL in the same hierarchy” or “URL in the hierarchy lower than the same hierarchy”. Therefore, the
4.1.4 IPアドレス変換調査処理
CPU211が行うIPアドレス変換調査処理について、図14を用いて説明する。CPU211は、ホストのURLからIPアドレスに変換可能かどうかを判断する(S501)。具体的には、例えば、DNS(Domain Name System)サーバにアクセスし、ホストのURLに対応するIPアドレスが存在するか否か調べる。
4.1.4 IP Address Translation Investigation Process The IP address translation investigation process performed by the
CPU211は、ステップS501において、ホストのURLからIPアドレスに変換できないと判断すると、そのホストはネットワーク上に存在しないと判断し、登録URLDBに登録されている登録URLについて、同じホストのURLを含むもの全てを登録URLDBから消去する(S502)。
If the
一方、CPU211は、ステップS501において、ホストのURLからIPアドレスに変換できると判断すると、存在未確認ホストDB(図8参照)の[ホストURL]列にホストのURLを、[調査時間]列に現在の時刻を、[調査回数]列に「1」を記述して、存在未確認ホストDBを更新する(S503)。ステップS404においてホストに接続できないと判断した一方で、ホストのURLからIPアドレスに変換できる場合には、同じホストのURLを含む登録URLの全てを登録URLDBから消去しないのは、その時にホストの電源が落とされていた等の理由により、たまたまホストに接続できなかったという可能性があるからである。
On the other hand, when the
その後、CPU211は、ホストと同じURLを含む登録URLDB(図6参照)の登録URLに対して、[URL状態]列の値を「ホストが存在しない」にし、登録URLDBを更新する(S504)。
Thereafter, the
4.1.5 サイト存在調査処理
CPU211が行うサイト存在調査処理について、図15を用いて説明する。CPU211は、登録URLDBから任意の登録URLを抽出し(S700)、抽出した登録URLが、遷移先URLと同一階層若しくは同一階層より下位階層のURL(以下、下位URLとする。)であるか否かを判断する(S701)。CPU211は、抽出した登録URLが、下位URLであると判断すると、登録URLDBにおいて、ステップS700で抽出した登録URL対応する[URL状態]の値が「URL遷移有り」であるか否かを判断する(S702)。CPU211は、対応する[URL状態]の値が「URL遷移有り」であると判断すると、下位URLに対応するホームページが当該下位URLに対応する遷移先URLに現時点で存在するか否かを再び調査する下位URL存在調査処理を実行する(S703)。下位URL存在調査処理については、後述する。CPU211は、全ての登録URLに対してステップS701、S702、S703の処理を行う(S704)。
4.1.5 Site Presence Investigation Process The site presence investigation process performed by the
ここで、下位URL存在調査処理について、図16を用いて説明する。CPU211は、下位URLに対応するホームページ(以下、下位ホームページとする。)が対応する遷移先URLに実際に存在するか否かを判断する(S802)。CPU211は、下位ホームページが遷移先URLに実際に存在するか否かの判断を、遷移先URLに実際にアクセスできるか否かで判断する。
Here, the lower URL existence investigation processing will be described with reference to FIG. The
CPU211は、ステップS802において下位ホームページが遷移先URLに存在する判断すると、登録URLDBの[URL状態]列の値を「URL遷移有り」に、[調査時間]列の値を現在の時刻に、[調査回数]列の値を「0」に、それぞれ更新する(S803)。
If the
一方、CPU211は、ステップS802において、下位ホームページが遷移先URLに存在しないと判断すると、登録URLDBの[URLの状態]列の値を「遷移先URLが存在しない」に、[最終アクセス時間]列の値を現在の時刻に、[調査回数]列の値を現在の値に「1」を加算した値に、それぞれ更新する(S804)。
On the other hand, if the
4.1.6 メンテナンス処理
次に、CPU211が行うメンテナンス処理について図17〜図20を用いて説明する。メンテナンス処理とは、登録URLDB及び存在未確認ホストDB対して所定の期間ごとに行われるデータベースの維持管理処理である。本実施例においては、1日に1回、登録URLDBに登録されているURL及び存在未確認ホストDBに登録されているホストに対して実行する。
4.1.6 Maintenance Process Next, the maintenance process performed by the
登録URLDBに対するメンテナンス処理を図17及び図18を用いて説明する。図17に示すように、CPU211は、登録URLDB(図6参照)から[URL状態]列の値が「URL遷移有り」であるものを抽出する(S1001)。CPU211は、登録URLDBにおいて、抽出した登録URLに対応する[調査回数]列の値を取得する(S1002)。次に、CPU211は、URL調査用メンテナンステーブル(図9A参照)において、[URL調査回数]列の値がステップS1002で取得した[調査回数]列の値に対応する[調査間隔]列の値を取得する(S1003)。
The maintenance process for the registered URL DB will be described with reference to FIGS. As illustrated in FIG. 17, the
CPU211は、ステップS1001で抽出した登録URLに対応する[調査時間]列の値を取得する(S1004)。そして、CPU211は、現在の時刻が、ステップS1004で取得した[調査時間]列の値とステップS1003で取得した[調査間隔]列の値とを加算した値を超えているかを判断する(S1005)。
The
CPU211は、現在の時間が[調査時間]列の値と[調査間隔]列の値とを加算した値を超えていると判断すると、遷移先URL存在調査処理を行う(S1006)。なお、ステップS1006における遷移先URL存在調査処理は、図12に示す遷移先URL存在調査処理と同じである。CPU211は、全てのURLについて、ステップS1001〜S1003の処理を行う(S1007)。
If the
次に、図18に示すように、CPU211は、登録URLDB(図6参照)から[URL状態]列の値が「遷移先URLが存在しない」であるものを抽出する(S1101)。CPU211は、登録URLDBにおいて、抽出した登録URLに対応する[調査回数]列の値を取得する(S1102)。次に、CPU211は、URL調査用メンテナンステーブル(図9A参照)において、[URL調査回数]列の値がステップS1102で取得した[調査回数]列の値に対応する[調査間隔]列の値を取得する(S1103)。
Next, as illustrated in FIG. 18, the
CPU211は、ステップS1101で抽出した登録URLに対応する[調査時間]列の値を取得する(S1104)。そして、CPU211は、現在の時刻が、ステップS1104で取得した[調査時間]列の値とステップS1103で取得した[調査間隔]列の値とを加算した値を超えているかを判断する(S1105)。
The
CPU211は、現在の時間が[調査時間]列の値と[調査間隔]列の値とを加算した値を超えていると判断すると、遷移先URL存在調査処理(S1106)を行う。なお、ステップS1106における遷移先URL存在調査処理は図12における遷移先URL存在調査処理と同じである。
If the
CPU211は、遷移先URL存在調査処理を行った登録URLについて、[調査回数]列の値があらかじめ定めておいた既定の値を超えているかを判断する(S1107)。CPU211は、既定の回数を超えていると判断すると、ステップS1101で抽出した登録URLに対応する全てのデータを登録URLDBから削除する(S1108)。CPU211は、全てのURLについて、ステップS1101〜S1106の処理を行う(S1109)。
The
次に、存在未確認ホストDBのメンテナンス処理を図19及び図20を用いて説明する。図19に示すように、CPU211は、存在未確認ホストDB(図8参照)の[ホストURL]列の値を抽出する(S1201)。CPU211は、抽出した[ホストURL]列に対応する[調査回数]列の値を取得する(S1202)。次に、CPU211は、ホスト調査用メンテナンステーブル(図9B参照)において、[ホスト調査回数]列の値がステップS1202で取得した[調査回数]列の値に対応する[調査間隔]列の値を取得する(S1203)。
Next, the maintenance process for the unidentified host DB will be described with reference to FIGS. 19 and 20. As shown in FIG. 19, the
CPU211は、存在未確認ホストDB(図8参照)において、ステップS1201で抽出したホストURLに対応する[調査時間]列の値を取得する(S1104)。そして、CPU211は、現在の時刻が、ステップS1204で取得した[調査時間]列の値とステップS1203で取得した[調査間隔]列の値とを加算した値を超えているかを判断する(S1205)。
The
CPU211は、現在の時間が[調査時間]列の値と[調査間隔]列の値とを加算した値を超えていると判断すると、存在未確認ホストDB更新処理(S1206)を実行する。ホスト存在調査勝利の詳細については、後述する。CPU211は、全てのURLについて、ステップS1201〜S1203の処理を行う(S1207)。
If the
CPU211が行う存在未確認ホストDB更新処理を図20を用いて説明する。CPU211は、ステップS1201で抽出したホストURLを有するホストにアクセスできるか否かを判断する(S1301)。CPU211は、ホストにアクセスできると判断すると、登録URLDB(図6参照)において、同じホストURLを「登録URL」列に含む登録URL全てに対して[調査回数]列の値を「0」に更新する(S1302)。そして、CPU211は、当該登録URLに対応するホームページが遷移先URLに存在するか否かを確認するために遷移先URL存在確認処理(図8参照)を実行する(S1303)。その後、CPU211は、ホストが存在するのため存在未確認ホストDB(図8参照)からステップS1201で抽出したホストURLを消去する(S1304)。
An unidentified host DB update process performed by the
CPU211は、ステップS1301においてステップS1201で抽出したホストURLに対応するホストにアクセスできないと判断すると、抽出したホストURLからIPアドレスに変換可能かどうかを判断する(S1311)。
If the
CPU211は、ホストURLからIPアドレスに変換できないと判断すると、登録URLDB(図6参照)の[登録URL]列におてい同じホストURLを含む登録URL全てについて、登録URLDBから消去する(S1317)。そして、CPU211は、存在未確認ホストDB(図8参照)からステップS1201で抽出したホストURLを消去する(S1319)。
If the
一方、CPU211は、ホストURLからIPアドレスに変換できると判断すると、存在未確認ホストDB(図8参照)の[調査時間]列の値を現在の時刻に、[調査回数]列の値を現在の値に「1」を加算した値に、それぞれ更新する(S1313)。そして、CPU211は、存在未確認ホストDBの[調査回数]列の値が既定の回数を超えているかを判断する(S1315)。
On the other hand, when the
CPU211は、既定の回数を超えていると判断すると、登録URLDB(図6参照)の[登録URL]列におてい同じホストURLを含む登録URL全てについて、登録URLDBから消去する(S1307)。そして、CPU211は、存在未確認ホストDB(図8参照)からステップS1201で抽出したホストURLを消去する(S1308)。
If the
[その他の実施例]
前述の実施例1においては、ユーザが検索サーバ23に対して行ったホームページの検索結果に含まれるURLのうち一つのURLを選択した場合に、URL管理装置21が対応するURLについてURL存在調査等を実行することとした。しかし、URL管理装置21は、ユーザが検索サーバ23に対して行ったホームページの検索結果に含まれるURL全てについて、URL存在調査等を実行するようにしてもよい。この場合、URL管理装置21は、検索サーバ23より検索結果を取得し、取得したURLについてURL存在調査を実行するようにすればよい。また、検索結果に含まれるURLのうち更新フラグ付加URLについてのみURL存在調査等を実行するようにしてもよい。このように、ユーザに検索結果を送信する前にURL存在調査等を実行することによって、その検索を行ったユーザに対しても、調査結果を反映した検索結果を提供することが可能となる。
[Other Examples]
In the first embodiment described above, when the user selects one URL among the URLs included in the search result of the home page performed with respect to the
また、前述の実施例1においては、検索サーバ23が行ったホームページの検索結果に含まれるURLについて、URL存在調査等を実行することとした。しかし、URL存在調査等を実行する対象としては、URLを含むものであれば検索結果に限定されない。例えば、ホームページにおけるリンク集等であってもよい。URL管理装置21が、リンク集に含まれるURLに対応するホームページに接続を求める旨の接続要求情報を取得すると、URL存在調査等を実行するようにすればよい。
Further, in the above-described first embodiment, a URL presence check or the like is performed on the URL included in the search result of the home page performed by the
さらに、前述の実施例1においは、URLDBサーバ29のハードディスク913に登録URLDBを記憶するものとしたが、URL管理装置21のハードディスク113に登録URLDBを記憶するようにしてもよい。
Furthermore, in the first embodiment, the registered URL DB is stored in the
さらに、前述の実施例1においては、検索サーバ23は登録URLDBに対して検索を行うとしたが、検索サーバ23が検索をする他のURLデータベースは別に用意しておき、登録URLDBは、他のURLデータベースを管理するデータベースとしての機能だけを有するようにしてもよい。
Furthermore, in the above-described first embodiment, the
1・・・・・URL情報管理システム
21・・・・・URL情報管理装置
23・・・・・検索サーバ
29・・・・・URLDBサーバ
DESCRIPTION OF
Claims (29)
前記検索装置は、
検索要求情報を取得する検索要求情報取得手段、
前記検索要求情報を取得したと判断すると、前記検索情報に対応するURLを検索する検索手段、
前記検索手段が検索したURLに基づいて検索結果情報を生成する検索結果情報生成手段、
前記検索結果情報を提供する検索結果情報提供手段、
を有し、
前記URL管理装置は、
前記検索結果情報に含まれるURLのホームページに接続を求める旨の接続要求情報を取得する接続要求情報取得手段、
前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行するURL調査実行手段、
前記URL調査の調査結果と前記URLと関連付けて前記URL記憶手段に対して記憶するURL管理手段、
を有すること、
を特徴とするURL情報管理システム。 In a URL management system having a search device for searching a URL of a home page and a URL management device for managing a URL stored in a URL storage means for storing the URL of the home page,
The search device includes:
Search request information acquisition means for acquiring search request information,
When it is determined that the search request information has been acquired, search means for searching for a URL corresponding to the search information;
Search result information generating means for generating search result information based on the URL searched by the search means;
Search result information providing means for providing the search result information;
Have
The URL management device
Connection request information acquisition means for acquiring connection request information for requesting connection to a homepage of a URL included in the search result information;
If it is determined that the connection request information has been acquired, URL search execution means for executing a URL presence check for checking whether a URL homepage corresponding to the connection request information exists in the URL;
URL management means for storing in the URL storage means in association with the URL search result and the URL;
Having
URL information management system characterized by the above.
前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行するURL調査実行手段、
前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶するURL管理手段、
を有するURL管理装置。 Connection request information acquisition means for acquiring connection request information for requesting connection to a homepage corresponding to the URL included in the search result information that is a search result of the URL performed for the search device;
If it is determined that the connection request information has been acquired, URL search execution means for executing a URL presence check for checking whether a URL homepage corresponding to the connection request information exists in the URL;
URL management means for storing in the URL storage means in association with the URL search result and the URL;
URL management device having
前記検索結果情報を取得したと判断すると、前記検索結果情報に含まれるURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行するURL調査実行手段、
前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶するURL管理手段、
を有するURL管理装置。 Search result information acquisition means for acquiring search result information that is a search result of a URL performed for the search device;
If it is determined that the search result information has been acquired, URL search execution means for executing a URL presence check for checking whether or not the URL home page of the URL included in the search result information exists in the URL;
URL management means for storing in the URL storage means in association with the URL search result and the URL;
URL management device having
前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行するURL調査実行手段、
前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶するURL管理手段、
を有するURL管理装置。 Connection request information acquisition means for acquiring connection request information for requesting connection to a homepage corresponding to the URL;
If it is determined that the connection request information has been acquired, URL search execution means for executing a URL presence check for checking whether a URL homepage corresponding to the connection request information exists in the URL;
URL management means for storing in the URL storage means in association with the URL search result and the URL;
URL management device having
前記URL調査実行手段は、さらに、
前記接続要求情報若しくは前記検索結果情報に対応するURLのホームページが当該URLに存在しないと判断すると、前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在するか否かを調査する相異URL存在調査を実行し、
前記URL管理手段は、さらに、
前記相異URL存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claims 1 to 4,
The URL survey execution means further includes:
If it is determined that the home page of the URL corresponding to the connection request information or the search result information does not exist in the URL, whether the home page exists in a URL different from the URL corresponding to the connection request information or the search result information Investigate whether there is a different URL
The URL management means further includes:
Associating the different URL presence investigation result with the URL corresponding to the connection request information or the search result information and storing it in the URL storage means;
It is characterized by.
前記URL調査実行手段は、さらに、
前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在しないと判断すると、当該異なるURLに対する上位のURLを有するコンピュータが存在するか否か調査する上位コンピュータ存在調査を実行し、
前記URL管理手段は、さらに、
前記上位コンピュータ存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 5,
The URL survey execution means further includes:
If it is determined that the homepage does not exist in a URL different from the URL corresponding to the connection request information or the search result information, a higher-level computer presence check is performed to check whether a computer having a higher URL with respect to the different URL exists. Run,
The URL management means further includes:
Associating and storing the higher-level computer presence investigation result and the URL corresponding to the connection request information or the search result information in the URL storage means;
It is characterized by.
前記URL調査実行手段は、さらに、
前記異なるURLに対する上位のURLを有するコンピュータが存在しないと判断すると、前記上位のURLから当該上位のURLを特定する特定情報を得ることができるか否かを調査する特定情報調査を実行し、
前記URL管理手段は、さらに、
前記特定情報調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 6,
The URL survey execution means further includes:
If it is determined that there is no computer having a higher URL with respect to the different URL, a specific information search is performed to check whether specific information for specifying the higher URL can be obtained from the higher URL.
The URL management means further includes:
Storing the specific information investigation result and the connection request information or the URL corresponding to the search result information in association with each other in the URL storage unit;
It is characterized by.
前記URL管理手段は、さらに、
前記上位のURLから当該上位のURLを特定する特定情報を得ることができないと判断すると、前記URL情報記憶手段から、前記上位のURLを含むURLを削除すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 7,
The URL management means further includes:
If it is determined that the specific information specifying the higher URL cannot be obtained from the higher URL, deleting the URL including the higher URL from the URL information storage unit;
It is characterized by.
前記URL管理手段は、さらに、
前記上位のURLから当該上位のURLを特定する特定情報を得ることができると判断すると、前記特定情報調査結果と前記上位のURLとを関連付けて上位URL情報記憶手段に記憶すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 8,
The URL management means further includes:
If it is determined that the specific information for identifying the high-order URL can be obtained from the high-order URL, the specific information investigation result and the high-order URL are associated and stored in the high-order URL information storage unit.
It is characterized by.
前記URL管理手段は、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時刻と前記接続要求情報に含まれるURLとを関連付けて前記URL情報記憶装置に記憶し、
前記URL情報記憶装置における前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時間から所定の時間が経過しているか否かを判断し、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時間から所定の時間が経過していると判断すると、対応するURLについて、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を実行すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 1,
The URL management means further includes:
The URL information investigation, the different URL existence investigation, the host computer existence investigation, or the time when the specific information investigation was performed and the URL included in the connection request information are associated with each other and stored in the URL information storage device,
Determining whether or not a predetermined time has elapsed from the time of performing the URL presence survey, the different URL presence survey, the higher-level computer presence survey, or the specific information survey in the URL information storage device; If it is determined that a predetermined time has elapsed from the time of performing the different URL existence investigation, the upper computer existence investigation, or the specific information investigation, for the corresponding URL, the URL existence investigation, the different URL existence investigation, the upper computer Performing presence surveys or specific information surveys;
It is characterized by.
前記URL管理手段は、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査に関する調査回数と前記接続要求情報に含まれるURLとを関連付けて前記URL情報記憶装置に記憶し、
前記URL情報記憶装置における前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査に関する調査回数が所定の回数以上若しくは所定の回数より大きいか否かを判断し、前記調査回数が所定の回数以上若しくは所定の回数より大きいと判断すると、前記URL情報記憶装置から、当該調査回数に対応するURLを削除すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 1,
The URL management means further includes:
The number of investigations related to the URL existence investigation, the different URL existence investigation, the upper computer existence investigation, or the specific information investigation and the URL included in the connection request information are associated with each other and stored in the URL information storage device,
It is determined whether or not the number of investigations regarding the URL existence investigation, the different URL existence investigation, the upper computer existence investigation, or the specific information investigation in the URL information storage device is greater than or equal to a predetermined number of times, and the number of investigations Deletes the URL corresponding to the number of investigations from the URL information storage device.
It is characterized by.
前記URL管理手段は、さらに、
前記URL情報記憶装置における前記調査回数が所定の回数以上若しくは所定の回数より大きいか否かの調査を行う時期を、前記調査回数に基づいて決定すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claim 11,
The URL management means further includes:
Determining a timing for conducting an investigation as to whether or not the number of investigations in the URL information storage device is greater than or equal to a predetermined number or greater than a predetermined number based on the number of investigations;
It is characterized by.
前記URL管理手段は、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査の結果と前記URL情報記憶手段に記憶されているURLを検索結果情報に含めるか否かを示す表示可否情報とを関連付けて前記URL情報記憶手段に記憶すること、
を特徴とするもの。 In either the URL management system or the URL management device according to claims 1 to 12,
The URL management means further includes:
A result of the URL existence investigation, a different URL existence investigation, a higher-level computer existence investigation, or a specific information investigation, and display availability information indicating whether or not the URL stored in the URL information storage means is included in the search result information. Storing the URL information in association with the URL information storage means;
It is characterized by.
前記URL管理手段は、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査の結果と前記URL情報記憶手段に記憶されているURLを検索結果情報として表示する際に順番を示す表示順番情報とを関連付けて前記URL情報記憶手段に記憶すること、
を特徴とするもの。 In either the URL management system or URL management device according to claims 1-13,
The URL management means further includes:
Display order information indicating the order when displaying the URL presence survey, the difference URL presence survey, the higher-level computer presence survey, or the specific information survey result and the URL stored in the URL information storage means as search result information; In association with the URL information storage means,
It is characterized by.
前記検索装置に対して、
検索要求情報を取得させるステップ、
前記検索要求情報を取得したと判断すると、前記検索情報に対応するURLを検索させるステップ、
前記検索手段が検索したURLに基づいて検索結果情報を生成させるステップ、
前記検索結果情報を提供させるステップ、
を実行させ、
前記URL管理装置は、
前記検索結果情報に含まれるURLのホームページに接続を求める旨の接続要求情報を取得させるステップ、
前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行させるステップ、
前記URL調査の調査結果と前記URLと関連付けて前記URL記憶手段に対して記憶させるステップ、
を実行させること、
を特徴とするURL管理システムプログラム。 A URL management system for managing URLs stored in URL storage means using a search device for searching URLs of home pages and a URL management apparatus for managing URLs stored in URL storage means for storing URLs of home pages In the program
For the search device,
Obtaining search request information;
Determining that the search request information has been acquired, searching for a URL corresponding to the search information;
Generating search result information based on the URL searched by the search means;
Providing the search result information;
And execute
The URL management device
Obtaining connection request information for requesting connection to a homepage of a URL included in the search result information;
If it is determined that the connection request information has been acquired, a URL presence check is performed to check whether a homepage of a URL corresponding to the connection request information exists in the URL;
Storing in the URL storage means in association with the URL search result and the URL;
Running
URL management system program characterized by the above.
前記URL管理プログラムは、
コンピュータに、
検索装置に対して行われたURLの検索結果である検索結果情報に含まれるURLに対応するホームページに接続を求める旨の接続要求情報を取得させるステップ、
前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行させるステップ、
前記URL調査の調査結果と前記URLと関連付けて前記URL記憶手段に対して記憶させるステップ、
を実行させるURL管理システムプログラム。 In the URL management program for managing the URL stored in the URL storage means,
The URL management program
On the computer,
Obtaining connection request information for requesting connection to a homepage corresponding to the URL included in the search result information that is a search result of the URL performed for the search device;
If it is determined that the connection request information has been acquired, a URL presence check is performed to check whether a homepage of a URL corresponding to the connection request information exists in the URL;
Storing in the URL storage means in association with the URL search result and the URL;
URL management system program for executing
前記URL管理プログラムは、
コンピュータに、
検索装置に対して行われたURLの検索結果である検索結果情報を取得させるステップ、
前記検索結果情報を取得したと判断すると、前記検索結果情報に含まれるURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行させるステップ、
前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶させるステップ、
を実行させるURL管理システムプログラム。 In the URL management program for managing the URL stored in the URL storage means,
The URL management program
On the computer,
A step of acquiring search result information that is a search result of a URL performed for the search device;
If it is determined that the search result information has been acquired, a URL presence check is performed to check whether the URL homepage of the URL included in the search result information exists in the URL;
Storing in the URL storage means in association with the URL search result and the URL;
URL management system program for executing
前記URL管理プログラムは、
コンピュータに、
URLに対応するホームページに接続を求める旨の接続要求情報を取得させるステップ、
前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行させるステップ、
前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶させるステップ、
を実行させるURL管理プログラム。 In the URL management program for managing the URL stored in the URL storage means,
The URL management program
On the computer,
Obtaining connection request information for requesting connection to a homepage corresponding to the URL;
If it is determined that the connection request information has been acquired, a URL presence check is performed to check whether a homepage of a URL corresponding to the connection request information exists in the URL;
Storing in the URL storage means in association with the URL search result and the URL;
URL management program for executing
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記接続要求情報若しくは前記検索結果情報に対応するURLのホームページが当該URLに存在しないと判断すると、前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在するか否かを調査する相異URL存在調査を実行させるステップ、
前記相異URL存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶させるステップ、
を実行させるもの。 Either of the URL management system program or the URL management program according to claim 15-18,
The URL management system program or URL management program is:
Against the computer,
If it is determined that the home page of the URL corresponding to the connection request information or the search result information does not exist in the URL, whether the home page exists in a URL different from the URL corresponding to the connection request information or the search result information Executing a different URL existence investigation to investigate whether or not
Associating the URL search result with the URL corresponding to the connection request information or the search result information and storing it in the URL storage means;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在しないと判断すると、当該異なるURLに対する上位のURLを有するコンピュータが存在するか否か調査する上位コンピュータ存在調査を実行させるステップ、
前記上位コンピュータ存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶させるステップ、
を実行させるもの。 In either the URL management system program or the URL management program according to claim 19,
The URL management system program or URL management program is:
Against the computer,
If it is determined that the homepage does not exist in a URL different from the URL corresponding to the connection request information or the search result information, a higher-level computer presence check is performed to check whether a computer having a higher URL with respect to the different URL exists. The steps to be performed,
Associating the higher-level computer presence investigation result with the URL corresponding to the connection request information or the search result information and storing it in the URL storage means;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記異なるURLに対する上位のURLを有するコンピュータが存在しないと判断すると、前記上位のURLから当該上位のURLを特定する特定情報を得ることができるか否かを調査する特定情報調査を実行させるステップ、
前記URL管理手段は、さらに、
前記特定情報調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶させるステップ、
を実行させるもの。 In either the URL management system program or the URL management program according to claim 20,
The URL management system program or URL management program is:
Against the computer,
When determining that there is no computer having a higher URL with respect to the different URL, executing a specific information investigation for investigating whether or not specific information for specifying the higher URL can be obtained from the higher URL;
The URL management means further includes:
Associating the specific information investigation result with the URL corresponding to the connection request information or the search result information and storing it in the URL storage means;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記上位のURLから当該上位のURLを特定する特定情報を得ることができないと判断すると、前記URL情報記憶手段から、前記上位のURLを含むURLを削除させるステップ、
を実行させるもの。 In either the URL management system program or the URL management program according to claim 21,
The URL management system program or URL management program is:
Against the computer,
If it is determined that the specific information for specifying the higher URL cannot be obtained from the higher URL, the URL including the higher URL is deleted from the URL information storage unit;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記上位のURLから当該上位のURLを特定する特定情報を得ることができると判断すると、前記特定情報調査結果と前記上位のURLとを関連付けて上位URL情報記憶手段に記憶させるステップ、
を実行させるもの。 In either the URL management system program or the URL management program according to claim 22,
The URL management system program or URL management program is:
Against the computer,
If it is determined that the specific information for identifying the high-order URL can be obtained from the high-order URL, the specific information investigation result and the high-order URL are associated with each other and stored in the high-order URL information storage unit;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時刻と前記接続要求情報に含まれるURLとを関連付けて前記URL情報記憶装置に記憶させるステップ、
前記URL情報記憶装置における前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時間から所定の時間が経過しているか否かを判断し、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を行った時間から所定の時間が経過していると判断すると、対応するURLについて、前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査を実行させるステップ、
を実行させるもの。 Either of the URL management system program or the URL management program according to claims 15 to 23,
The URL management system program or URL management program is:
Against the computer,
A step of associating and storing in the URL information storage device the time when the URL existence investigation, the different URL existence investigation, the host computer existence investigation, or the specific information investigation is performed and the URL included in the connection request information;
Determining whether or not a predetermined time has elapsed from the time of performing the URL presence survey, the different URL presence survey, the higher-level computer presence survey, or the specific information survey in the URL information storage device; If it is determined that a predetermined time has elapsed from the time of performing the different URL existence investigation, the upper computer existence investigation, or the specific information investigation, for the corresponding URL, the URL existence investigation, the different URL existence investigation, the upper computer A step of executing a presence survey or a specific information survey,
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査に関する調査回数と前記接続要求情報に含まれるURLとを関連付けて前記URL情報記憶装置に記憶させるステップ、
前記URL情報記憶装置における前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査に関する調査回数が所定の回数以上若しくは所定の回数より大きいか否かを判断し、前記調査回数が所定の回数以上若しくは所定の回数より大きいと判断すると、前記URL情報記憶装置から、当該調査回数に対応するURLを削除させるステップ、
を実行させるもの。 Either of the URL management system program or the URL management program according to claims 15 to 24,
The URL management system program or URL management program is:
Against the computer,
A step of associating the number of investigations related to the URL existence investigation, the different URL existence investigation, the higher-level computer existence investigation, or the specific information investigation with the URL included in the connection request information, and storing it in the URL information storage device;
It is determined whether or not the number of investigations regarding the URL existence investigation, the different URL existence investigation, the upper computer existence investigation, or the specific information investigation in the URL information storage device is greater than or equal to a predetermined number of times, and the number of investigations The URL corresponding to the number of investigations is deleted from the URL information storage device,
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記URL情報記憶装置における前記調査回数が所定の回数以上若しくは所定の回数より大きいか否かの調査を行う時期を、前記調査回数に基づいて決定させるステップ、
を実行させるもの。 In either the URL management system program or the URL management program according to claim 25,
The URL management system program or URL management program is:
Against the computer,
A step of determining, based on the number of investigations, a timing for investigating whether or not the number of investigations in the URL information storage device is greater than or equal to a predetermined number of times or greater than a predetermined number of times;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査の結果と前記URL情報記憶手段に記憶されているURLを検索結果情報に含めるか否かを示す表示可否情報とを関連付けて前記URL情報記憶手段に記憶させるステップ、
を実行させるもの。 Either of the URL management system program or the URL management program according to claims 15 to 26,
The URL management system program or URL management program is:
Against the computer,
A result of the URL existence investigation, a different URL existence investigation, a higher-level computer existence investigation, or a specific information investigation, and display availability information indicating whether or not the URL stored in the URL information storage means is included in the search result information. Associating and storing in the URL information storage means;
Something to run.
前記URL管理システムプログラム又はURL管理プログラムは、
コンピュータに対して、さらに、
前記URL存在調査、相異URL存在調査、上位コンピュータ存在調査、若しくは特定情報調査の結果と前記URL情報記憶手段に記憶されているURLを検索結果情報として表示する際に順番を示す表示順番情報とを関連付けて前記URL情報記憶手段に記憶させるステップ、
を実行させるもの。 Either of the URL management system program or the URL management program according to claims 15 to 27,
The URL management system program or URL management program is:
Against the computer,
Display order information indicating the order when displaying the URL presence survey, the difference URL presence survey, the higher-level computer presence survey, or the specific information survey result and the URL stored in the URL information storage means as search result information; Storing the URL information in the URL information storage means,
Something to run.
コンピュータが、検索装置に対して行われたURLの検索結果である検索結果情報に含まれるURLに対応するホームページに接続を求める旨の接続要求情報を取得し、
コンピュータが、前記接続要求情報を取得したと判断すると、前記接続要求情報に対応するURLのホームページが当該URLに存在するか否かを調査するURL存在調査を実行し、
コンピュータが、前記接続要求情報若しくは前記検索結果情報に対応するURLのホームページが当該URLに存在しないと判断すると、前記ホームページが前記接続要求情報若しくは前記検索結果情報に対応するURLとは異なるURLに存在するか否かを調査する相異URL存在調査を実行し、
コンピュータが、前記URL調査の調査結果と前記URLと関連付けてURL記憶手段に対して記憶する
コンピュータが、前記相異URL存在調査結果と前記接続要求情報若しくは前記検索結果情報に対応するURLとを関連付けて前記URL記憶手段に記憶すること、
を特徴とするURL管理方法。
In a URL management method for managing URLs stored in URL storage means using a computer having URL storage means,
The computer acquires connection request information for requesting connection to a homepage corresponding to the URL included in the search result information that is a search result of the URL performed for the search device,
If the computer determines that the connection request information has been acquired, it performs a URL presence check to check whether a URL homepage corresponding to the connection request information exists in the URL;
If the computer determines that the URL corresponding to the connection request information or the search result information does not exist in the URL, the home page exists in a URL different from the URL corresponding to the connection request information or the search result information. Execute a different URL existence investigation to investigate whether or not
The computer associates the URL investigation result with the URL and stores it in the URL storage means. The computer associates the difference URL existence investigation result with the URL corresponding to the connection request information or the search result information. Storing in the URL storage means,
URL management method characterized by this.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004252475A JP2006072494A (en) | 2004-08-31 | 2004-08-31 | Url information management system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004252475A JP2006072494A (en) | 2004-08-31 | 2004-08-31 | Url information management system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006072494A true JP2006072494A (en) | 2006-03-16 |
Family
ID=36153091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004252475A Pending JP2006072494A (en) | 2004-08-31 | 2004-08-31 | Url information management system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006072494A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008099539A1 (en) * | 2007-02-15 | 2008-08-21 | Mitsubishi Electric Corporation | Url management device and url management system |
US10956517B2 (en) | 2018-06-22 | 2021-03-23 | International Business Machines Corporation | Holistic mapping and relocation of social media assets |
-
2004
- 2004-08-31 JP JP2004252475A patent/JP2006072494A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008099539A1 (en) * | 2007-02-15 | 2008-08-21 | Mitsubishi Electric Corporation | Url management device and url management system |
US10956517B2 (en) | 2018-06-22 | 2021-03-23 | International Business Machines Corporation | Holistic mapping and relocation of social media assets |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6460060B1 (en) | Method and system for searching web browser history | |
KR101908162B1 (en) | Live browser tooling in an integrated development environment | |
WO2014010082A1 (en) | Retrieval device, method for controlling retrieval device, and recording medium | |
JP2004258911A (en) | Server, method for collecting information, and program | |
JP2005149136A (en) | Information collection program, information collection method, information collection system and information collection device | |
WO2008002108A1 (en) | A method of managing web services using integrated document | |
JP2010061334A (en) | File management system, file management method, and program | |
KR101556743B1 (en) | Apparatus and method for generating poi information based on web collection | |
JPWO2005121982A1 (en) | Information providing system, method, program, information communication terminal, and information display switching program | |
CN101231655A (en) | Method and system for processing search engine results | |
JP2008191982A (en) | Retrieval result output device | |
KR101248186B1 (en) | System for generating blog using each content in search result page and method thereof | |
JP2007304644A (en) | Static web page creation method, program, recording medium, and static web page creation management system | |
JP2006072494A (en) | Url information management system | |
JPH10171703A (en) | Site map display device and document access supporting device | |
JP2005242760A (en) | Information retrieval support method, and information retrieval support system and server using method | |
JP4259858B2 (en) | WWW site history search device, method and program | |
JP2007299170A (en) | Information providing method, system, and program | |
JP3725087B2 (en) | Knowledge information collecting system and knowledge information collecting method | |
JP7197531B2 (en) | Information processing device, information processing system, information processing method, and program | |
JP3708893B2 (en) | Knowledge information collecting system and knowledge information collecting method | |
JP2018152015A (en) | Storage controller, storage control program and storage control method | |
JP2010097296A (en) | Electronic document file retrieval device, electronic document file retrieval method, and computer program | |
JP2004280416A (en) | Software parts management system, software parts management method, and software parts management program | |
JP2009217499A (en) | Document classification program and document classification device |