JP2006309633A - Home page monitoring system - Google Patents

Home page monitoring system Download PDF

Info

Publication number
JP2006309633A
JP2006309633A JP2005133869A JP2005133869A JP2006309633A JP 2006309633 A JP2006309633 A JP 2006309633A JP 2005133869 A JP2005133869 A JP 2005133869A JP 2005133869 A JP2005133869 A JP 2005133869A JP 2006309633 A JP2006309633 A JP 2006309633A
Authority
JP
Japan
Prior art keywords
web data
data
homepage
monitoring system
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005133869A
Other languages
Japanese (ja)
Inventor
Toshio Tanaka
利男 田中
Yasuyuki Monma
康之 門馬
Reiko Asakura
玲子 朝倉
Kazukane Mitani
千兼 三谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTERNET ARC KK
Original Assignee
INTERNET ARC KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INTERNET ARC KK filed Critical INTERNET ARC KK
Priority to JP2005133869A priority Critical patent/JP2006309633A/en
Publication of JP2006309633A publication Critical patent/JP2006309633A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a home page monitoring system capable of searching a page (Web data) having desired articles in a home page selected by a user, searching the Web data when the Web data are updated afterwards and informing the user of the update content. <P>SOLUTION: A client 2 transmits his or her desired keyword suitable for a retrieval theme and the address of his or her desired home page to a retrieval proxy server 1, and the retrieval server, which is provided with a retrieval result database 30 where Web data retrieved from a Web server on the Internet are stored, acquires the Web data of a page having predetermined correlation with the home page, and detects new Web data including the keyword which are not included in the retrieval database as data for update. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

この出願は、インターネット上で、検索したいテーマに適した所望のキーワードに関するホームページの更新動向を監視し、常に最新のWeb情報を得る為のホームページ監視システムに関する。   This application relates to a homepage monitoring system for monitoring the update trend of a homepage related to a desired keyword suitable for a theme to be searched on the Internet and always obtaining the latest Web information.

インターネットでは、クライアント端末(以下、クライアント)から、各種のWebサーバーにアップロードされている様々なWebデータ(ホームページ)を画面に表示して見ることができる。これらは、各人が自分でアップロードを希望する情報を画面データとして作成し、インターネット上に公開するものであり、そのホームページと呼ばれている画面を作成する方法も様々に提供されている(特許文献1参照)。   On the Internet, various Web data (homepage) uploaded to various Web servers can be displayed on a screen and viewed from a client terminal (hereinafter referred to as a client). Each of these creates information that each person desires to upload as screen data and publishes it on the Internet. Various methods for creating a screen called the home page are also provided (patents). Reference 1).

Webデータを表示する時には、そのWebデータのネット上の所在地を示すURLと呼ばれるアドレスを入力するのである。或いは、検索エンジンによるキーワード検索により、そのキーワードを含むWebデータが一覧表示されるので、その中から見たいWebデータをホームページとして見ている。
特開2001−290729号公報
When displaying Web data, an address called URL indicating the location of the Web data on the net is input. Alternatively, Web data including the keyword is displayed as a list by keyword search by a search engine, and the Web data to be viewed is viewed as a home page.
JP 2001-290729 A

しかし同じホームページでも、一旦アップロードされると、その後はほとんど更新されないものから、比較的よく更新されるものまで様々である。そのため、新しい内容を見ようとすると、更新されているものも、されていないものも、共に確認しなければならない。しかも、確認した中で更新されているのは一部しかなく、この一部の新しいページを見る為に、更新されていない他のホームページも全て、更新の有無を確認しなければならず、確認作業の無駄となっている。   However, even if the same home page is uploaded, it varies from one that is rarely updated thereafter to one that is relatively well updated. Therefore, if you try to see new content, you must check both what has been updated and what has not been updated. In addition, only a part has been updated in the confirmation, and in order to see some new pages, all other homepages that have not been updated must also be checked for updates. It is a waste of work.

また、更新された新たなホームページを早く見つけようとするなら、以上の様な確認の検索を頻繁に行わなければならず、これも面倒である。   In addition, if the user wants to find a new updated home page quickly, the above confirmation search must be frequently performed, which is also troublesome.

また更新されたホームページを見つけることができても、更新されてから何日か過ぎたものが見つかることも多く、更新されると同時に直ちに見ると云う訳にはいかない。   Even if an updated homepage can be found, it is often found that a few days have passed since it was updated, and it cannot be said that it is immediately viewed as soon as it is updated.

従って、本願発明の目的とするところは、利用者が選んだホームページの中で、探している記事の載っているページ(そのWebデータ)を探すことができ、またこの様にして探したWebデータがその後に更新された場合には、この更新された最新のWebデータをも探し、この様な一連のサイクルを所定の契機で行うことができ、或いは更新内容を通知することのできるホームページ監視システムを提供することにある。   Therefore, the object of the present invention is to search for the page (the Web data) on which the article being searched is found in the home page selected by the user, and the Web data searched in this way. Is updated later, the updated web data is also searched for, and a series of such cycles can be performed at a predetermined opportunity, or a homepage monitoring system capable of notifying the updated contents Is to provide.

以上の目的の為に、本願発明では、インターネットのクライアントコンピュータと検索代理サーバコンピュータとによるホームページ監視システムを提供するものである。   For the above purpose, the present invention provides a homepage monitoring system using an Internet client computer and a search proxy server computer.

まず、請求項1記載の発明では、
(A)クライアントが、検索したいテーマに適した所望のキーワードと、検索を希望するホームページのアドレスと、を含む依頼データを入力する入力手段と、入力された前記依頼データを前記検索代理サーバに送信する送信手段と、を有するものである。
First, in the invention according to claim 1,
(A) An input means for inputting request data including a desired keyword suitable for a theme to be searched and a homepage address to be searched, and the client transmits the input request data to the search proxy server. And transmitting means.

(B)またサーバは、インターネット上のWebサーバから検索されたWebデータを格納する検索結果データベース、を有する前記検索代理サーバである。そしてこの検索代理サーバは、前記クライアントから送信される前記依頼データを受信する受信手段と、前記アドレスのホームページ及びこのホームページと所定の関連付けを持つページのWebデータを取得する取得手段と、取得した前記Webデータから前記キーワードを含むWebデータを抽出する抽出手段と、前記抽出手段により抽出された前記Webデータの中から、前記検索結果データベースには含まれない新規なWebデータを更新用データとして検出する検出手段と、検出された前記更新用データで前記検出結果データベースを更新する更新手段とを有するものである。   (B) Further, the server is the search proxy server having a search result database for storing Web data searched from a Web server on the Internet. The search proxy server includes a receiving unit that receives the request data transmitted from the client, an acquisition unit that acquires the homepage of the address and a Web data of a page having a predetermined association with the homepage, and the acquired Extracting means for extracting Web data including the keyword from Web data, and detecting new Web data not included in the search result database as update data from the Web data extracted by the extracting means. It has a detection means and an update means for updating the detection result database with the detected update data.

一般に「ホームページ」とは、ホームページURLで開いた先頭のページを意味する場合と、そこから移動できる配下のページの全てまで含めたものを指す場合があるが、ここでは先頭ページの意味である。またここで、Webデータは、通常ではクライアントの画面に表示されるデータである。つまりクライアントに表示されたホームページの画面上では、他の画面へ移動する移動先が幾つか表示されており、その中の移動先をカーソルでクリックすれば、その新たな画面が表示されるのである。しかし本発明では、この様なホームページ等のWebデータをクライアントに送って表示させるのではなく、検索代理サーバ内で、これらWebデータ等の中から、所望したキーワードが含まれているWebデータを抽出するのである。この抽出は抽出手段により行われるのであり、例えば文字列のマッチングにより行うのである。   In general, the “homepage” may mean the top page opened by the homepage URL, or may include all subordinate pages that can be moved from there, but here it means the top page. Here, the Web data is usually data displayed on the client screen. In other words, on the homepage screen displayed on the client, several destinations to move to other screens are displayed, and clicking on the destination with the cursor will display the new screen. . However, in the present invention, instead of sending such Web data such as a home page to the client for display, Web data containing a desired keyword is extracted from the Web data in the search proxy server. To do. This extraction is performed by extraction means, for example, by matching character strings.

この様にして抽出されたWebデータは、検索結果データベースにすでに格納されているデータで有るか無いかを調べ、格納されていなければ、このWebデータを更新用データとして、検索結果データベースを更新するのである。この更新用データのページは、新規なページの場合と既存ページの更新ページの場合がある。新規ページの場合には、新規書き込みにより更新となる。更新ページの場合には、これに対応するWebデータが既に検索結果データベースに格納されているので、この既存ページの旧となったWebデータを更新するのである。或いはこの旧ページのデータをそのまま保存して、更新ページをこれに追加する方法もあるが、どちらでもよい。尚この検索結果データベースは、当初においてはデータが空の状態であるから、最初は、更新データは全て新規ページとして新規書き込みされるのである。そしてその後のWebデータで、新規ページか更新ページかが判断されるようになるのである。   The Web data extracted in this way is checked to see if it is already stored in the search result database. If it is not stored, the search result database is updated using this Web data as update data. It is. This update data page may be a new page or an update page of an existing page. In the case of a new page, it is updated by new writing. In the case of an update page, since the Web data corresponding to this is already stored in the search result database, the old Web data of this existing page is updated. Alternatively, there is a method of saving the data of the old page as it is and adding an update page to the old page. Since the search result database is initially in an empty state, all the update data is newly written as a new page at first. Then, the subsequent Web data determines whether it is a new page or an updated page.

以上により、本ホームページ監視システムでは、このシステムの利用者の検索したいテーマに適した所望のキーワードと、このキーワードでの検索を希望するホームページのアドレスとをクライアントから入力しておけば、インターネット上からそのキーワードを含むWebデータを得ることができるのである。即ち検索代理サーバ側で、そのURLのホームページをインターネット上の各種Webサーバから検索し、そのホームページ及びこのホームページと所定の関連付けをもつWebデータから、そのキーワードを含むWebデータを抽出してくれるものである。これにより、このシステムの利用者は、自分の知りたいテーマに関するインターネット上の情報を得ることができるのである。この様にして得た情報は、最終的にはクライアントの利用者に供されるのであるが、どの様に知らせるかは様々でよい。例えば電子メールで知らせたり、或いは検索代理サーバ側に本システムの問い合わせホームページを作り、ここに結果を表示させて、いつでも見ることができるようにするなどの方法がある。   As described above, in this homepage monitoring system, if the client inputs the desired keyword suitable for the theme that the user of this system wants to search and the address of the homepage that the user wishes to search using this keyword, it can be accessed from the Internet. Web data including the keyword can be obtained. That is, the search proxy server searches the homepage of the URL from various web servers on the Internet, and extracts web data including the keyword from the homepage and web data having a predetermined association with the homepage. is there. As a result, the user of this system can obtain information on the Internet regarding the theme that he / she wants to know. The information obtained in this way is ultimately provided to the client user, but how it is notified may vary. For example, there is a method of notifying by e-mail or creating an inquiry homepage of the system on the search proxy server side and displaying the result so that it can be viewed at any time.

なお、利用者が検索を希望したホームページからは、このホームページと所定の関連付けを持つページWebデータまでも検索できるのであるが、請求項2記載の発明では、この「所定の関連付け」を、ハイパーテキストによる関連付けとした。これにより、関連付けされたページの取得が容易になる。ここでハイパーテキストとはコンピュータを利用した文書システムの一つであり、文書の任意の場所に、他の文書の位置情報(ハイパーリンク)を埋めこみ、複数の文書を相互に連結できる仕組みのことである。これにより、最初に取得したホームページから連結されている他のWebデータを取得することができ、取得したこのWebデータから更に他のWebデータを取得し、この様な事を次々と繰り返して、関連付けられた全てのWebデータを取得するのである。   In addition, from the home page that the user desires to search, it is possible to search even page Web data having a predetermined association with this home page. In the invention according to claim 2, this “predetermined association” is designated as hypertext. The association by. This facilitates acquisition of the associated page. Here, hypertext is a computer-based document system, which is a mechanism that allows multiple documents to be linked together by embedding location information (hyperlinks) of other documents in any location of the document. is there. As a result, it is possible to acquire other Web data linked from the first acquired home page, acquire other Web data from the acquired Web data, and repeat this process one after another for association. All the obtained Web data is acquired.

また請求項3記載の発明では、取得手段、抽出手段、検出手段、及び更新手段を、所定の契機で繰り返し実行する繰り返し手段を有することを特徴とした。所定の契機とは、例えば毎日所定の時刻になったら、クライアントから受信して保持してあるURLでWebデータの取得を開始し、これに続く抽出手段、検出手段、更新手段を順次起動させる様な日次処理等のものをいう。これによりその時点での、当該キーワードに関する最新のWebデータを得ることができるのである。またこの様な所定の契機には、例えば日次のほかに、隔日や週次などの契機で繰り返し実行する繰り返し手段により、インターネット上の新しい情報を得ることができるのである。   Further, the invention described in claim 3 is characterized in that the acquisition means, the extraction means, the detection means, and the update means have a repeat means for repeatedly executing at a predetermined trigger. For example, when a predetermined time is reached every day at a predetermined time, acquisition of Web data is started with a URL received and held from the client, and subsequent extraction means, detection means, and update means are sequentially activated. Such as daily processing. As a result, the latest Web data regarding the keyword at that time can be obtained. In addition to such a predetermined opportunity, for example, in addition to daily, new information on the Internet can be obtained by repetitive means that are repeatedly executed every other day or weekly.

また請求項4記載の発明では、契機毎に、検索の状況を通知されるようにしたものである。即ち、更新手段により更新された更新内容をクライアントに通知する通知手段を、検索代理サーバが有す様にしたものである。そしてこの通知手段を、繰り返し手段が、更新手段のあとに通知手段を追加された状態で繰り返されることを特徴とするのである。これにより、繰り返し手段が実行されるたびに、利用者に検索結果が通知される。そのため、利用者としては、一旦、キーワード等の入力をしておけば、後は、契機毎の通知が成されてくるのであり、常に新しいネット情報を得ることができるのである。   In the invention according to claim 4, the status of the search is notified for each opportunity. That is, the search proxy server has notification means for notifying the client of the updated contents updated by the update means. The notifying means is characterized in that the repeating means is repeated with the notifying means added after the updating means. Thus, the search result is notified to the user every time the repetitive means is executed. For this reason, once a user has entered a keyword or the like, notifications are made for each opportunity, and new net information can be obtained constantly.

また請求項5記載の発明では、所定の契機がクライアントから入力されて、依頼データに含まれることを特徴とする。これによりこの所定の契機は、利用者がクライアントから入力されることとなり、よって利用者の目的にあった契機を設定することができるのである。これにより、検索したいテーマやホーム,ページがどの程度で頻度で更新されるかを予測して、その予測した更新頻度に合わせたサイクルで、最新情報の検索をすることができるのである。   The invention according to claim 5 is characterized in that a predetermined trigger is input from the client and included in the request data. As a result, this predetermined opportunity is input by the user from the client, and therefore an opportunity suitable for the purpose of the user can be set. As a result, it is possible to predict how frequently the theme, home, and page to be searched are updated, and to search for the latest information in a cycle that matches the predicted update frequency.

以上の本願発明により、利用者が選んだホームページの中での探している記事の載っているWebデータを探すことができ、またこの様にして探したWebデータがその後に更新された場合には、この更新された最新のWebデータをも探し、この様な一連のサイクルを所定の契機で行うことができ、或いは更新内容を通知することのできる。   According to the present invention as described above, it is possible to search for the Web data containing the article to be searched for in the home page selected by the user, and when the Web data searched in this way is subsequently updated. The updated latest Web data can also be searched, and a series of such cycles can be performed at a predetermined timing, or the update contents can be notified.

次に本願発明を、図をもって説明する。このホームページ監視システムは、図1に示すように、検索代理サーバ1とインターネットのクライアント2とによるホームページ監視システムである。検索代理サーバ1には会員データベース10と、依頼データベース20と、検出結果データベース30とが備わっている。   Next, the present invention will be described with reference to the drawings. As shown in FIG. 1, this homepage monitoring system is a homepage monitoring system using a search proxy server 1 and an Internet client 2. The search proxy server 1 includes a member database 10, a request database 20, and a detection result database 30.

(クライアント);クライアント2は、入力手段、送信手段、電子メール機能を有している。入力手段は、このシステムの利用を申し込む為の申し込み登録入力と、登録された会員により、利用の依頼を入力できる入力画面表示ができ、又この画面からの入力処理ができる様になっている。   (Client); The client 2 has an input means, a transmission means, and an electronic mail function. The input means can perform application registration input for applying for the use of this system, an input screen display for inputting a request for use by a registered member, and input processing from this screen.

登録された会員が個々の検索を依頼する場合には、検索したいテーマに適したキーワードと、その希望する検索の対象にしたいホームページのアドレスと、検索する契機とが入力できる。又この様にして依頼入力した後には、依頼したホームページを削除したり、新たなホームページの追加なども依頼データとして再送信することができるようになっている。一旦入力した契機を変更する入力もできるようになっている。送信手段は、この様にして入力された依頼データのその他にも、種種のデータ(例えば、会員IDやパスワードなど)を検索代理サーバに送信するものである。   When a registered member requests an individual search, a keyword suitable for a theme to be searched, a homepage address to be searched for and a search opportunity can be input. In addition, after the request is input in this way, the requested home page can be deleted or a new home page added can be retransmitted as request data. It is also possible to change the trigger once entered. In addition to the request data input in this way, the transmission means transmits various types of data (for example, a member ID, a password, etc.) to the search proxy server.

(サーバ);また検索代理サーバーは、図1に示したように、会員データベース10と依頼データデータベース20と検索結果データベース30とを有している。また更に受信手段、取得手段、抽出手段、検出手段、更新手段、通知手段を有しており、これら手段が繰り返し行われる繰り返し手段を有している。そして、クライアント2から会員が入力してきた契機により、例えば1日1回というサイクルで、この繰り返し手段による繰り返しが行われるのである。契機は、1日1回の他に1日に何回かを契機にしてもよく、或いは曜日指定、1週1回、更には1時間おきの様な契機を指定してもよい。   (Server); Further, the search proxy server has a member database 10, a request data database 20, and a search result database 30, as shown in FIG. Furthermore, it has a receiving means, an acquisition means, an extraction means, a detection means, an updating means, and a notification means, and has a repeating means for repeatedly performing these means. Then, when the member inputs from the client 2, the repetition by the repeating means is performed in a cycle of once a day, for example. The trigger may be triggered several times a day in addition to once a day, or may be designated as a day of the week, once a week, or every other hour.

検出結果データベース30は、検索代理サーバ1がインターネット上のWebサーバ3から目的とするWebデータを検索した時に、このWebデータを格納するデータベースである。この検出結果データベース30は。各Webデータが、このWebデータのページ・アドレス(URL)で呼び出しができるようになっている。   The detection result database 30 is a database that stores Web data when the search proxy server 1 searches for target Web data from the Web server 3 on the Internet. This detection result database 30 is. Each Web data can be called by the page address (URL) of the Web data.

会員データベース10は、このホームページ監視システムを利用する会員の情報を登録するものであり、クライアントからの登録申請を経て登録されるものである。また依頼データベース20は、各会員からの依頼データを登録しておくものであり、図2に示すように、各会員から検索依頼されたキーワード21が登録できるようになっている。会員一人で、複数のキーワード21が登録できるようになっている。そして、各キーワード21には、そのキーワード21で検索したいホームページのURL22が、これも複数登録できる様になっている。そして会員11とキーワード21とURL22とが、図2に示したように、会員データベース10と依頼データベース20とに跨った階層構造になっている。   The member database 10 is for registering information on members who use the homepage monitoring system, and is registered through a registration application from a client. Further, the request database 20 stores request data from each member. As shown in FIG. 2, the keyword 21 requested to be searched by each member can be registered. A single member can register a plurality of keywords 21. Each keyword 21 can register a plurality of URLs 22 of websites to be searched with the keyword 21. The member 11, the keyword 21, and the URL 22 have a hierarchical structure straddling the member database 10 and the request database 20 as shown in FIG. 2.

受信手段は、クライアント2から入力された依頼データを受信するものであり、クライアント2の入力画面に示された送信ボタン(図示せず)を押すことにより送信され、この送信されてきたデータを、検索代理サーバ1側で受信するものである。ただこの受信手段は、これだけを受信するのではなく、会員登録の申請データや、その他の各種データを受信するものである。   The receiving means receives the request data input from the client 2, and is transmitted by pressing a transmission button (not shown) displayed on the input screen of the client 2, and the transmitted data is It is received by the search proxy server 1 side. However, this receiving means receives not only this but also application data for member registration and other various data.

取得手段は、この様にして受信したこの依頼データの、そのURL22に基づいてそのホームページをアクセスし、このホームページからハイパーテキストで関連付けられた全てのWebデータを取得するものである。具体的には、まずクライアント2から受信したURL22のホームページを取得するのである。次に取得されたこのホームページのWebデータに含まれるハイパーリンクを全て探し、このハイパーリンクから、次のWebデータを探して取得するのである。取得したらまた更に、その取得されたWebデータの中のハイパーリンクを探し、そのWebデータを取得するのである。この様に次々とWebデータを取得してゆくのである。   The acquisition means accesses the home page based on the URL 22 of the request data received in this way, and acquires all the Web data associated with the hypertext from the home page. Specifically, first, the home page of the URL 22 received from the client 2 is acquired. Next, all the hyperlinks included in the web data of this home page obtained are searched, and the next web data is searched and obtained from this hyperlink. Once acquired, the hyperlink is searched for in the acquired Web data, and the Web data is acquired. In this way, Web data is acquired one after another.

またこの様にしてWebデータを取得したら、その都度に、下記に述べる抽出手段、検出手段、更新手段を実行するのである。即ち、取得されたWebデータの中からキーワード21を含むWebデータを抽出手段で抽出し、次に、キーワード21を含むとして抽出されたWebデータが更新すべき新たなWebデータかどうかを検出手段で検出し、次に、新たなWebデータとして検出されたものを更新手段で更新するのである。抽出や検出から外れたWebデータは読み捨てられるのである。以上の処理は、Webデータを1件所得する毎に、「抽出手段→検出手段→更新手段」と云う様に行ってもよいが、全てのWebデータを先に取得しておき、取得された全てのWebデータを一括して抽出手段で処理し、更に検出手段、更新手段もそれぞれ一括して処理するのでもよい。   In addition, whenever Web data is acquired in this way, the extraction means, detection means, and update means described below are executed. That is, the Web data including the keyword 21 is extracted from the acquired Web data by the extraction unit, and then the detection unit determines whether the Web data extracted as including the keyword 21 is new Web data to be updated. Then, the detected new web data is updated by the updating means. Web data that is not extracted or detected is discarded. The above processing may be performed as “extraction means → detection means → update means” every time one piece of Web data is earned. However, all the Web data is acquired first and acquired. All Web data may be processed by the extraction unit at a time, and the detection unit and the update unit may be processed at a time.

抽出手段は、取得したWebデータが当該キーワード21の文字列を含むかどうかを調べ、含んでいるのならこれを抽出し、キーワード21を含んでいなければ上述した様に、読み捨てるのである。   The extraction means checks whether or not the acquired Web data includes the character string of the keyword 21, and if included, extracts this, and if it does not include the keyword 21, discards it as described above.

検出手段は、この様にして抽出されたWebデータを、検出結果データベースと比べ、新規なページのWebデータであるかどうかを調べるのである。まず抽出されたWebデータのページURLで、検出結果データベースに読み込みをするのである。検出結果データベースは、このURLを読み込みキーとしているのである。   The detection means compares the Web data extracted in this way with the detection result database to check whether the Web data is a new page. First, the detection result database is read with the page URL of the extracted Web data. The detection result database uses this URL as a read key.

この読み込みで、該当するURLのデータがデータベース内に無ければ、そのWebデータは新規なページのWebデータとなるので、これを更新用データとするのである。   If there is no data of the corresponding URL in the database by this reading, the Web data becomes Web data of a new page, and this is used as update data.

また抽出されたWebデータのURLに該当するデータが検出結果データベースにあれば、それは既存のページのWebデータである。この場合には、抽出されたWebデータと、検出結果データベース30から読みとったそのWebデータとを比べ、同じかどうかを調べるのである。これは、双方のWebデータを全て突き合わせ、同じであれば、そのページは更新されていないページであり、そのWebデータは読み捨てるのである。また同じでなければ、そのページは更新されているであるので、このWebデータを更新用データとするのである。つまり更新データは、キーワードを含むページであって、新規のページか更新されている既存ページのWebデータなのである。   If data corresponding to the URL of the extracted Web data exists in the detection result database, it is Web data of an existing page. In this case, the extracted Web data is compared with the Web data read from the detection result database 30 to check whether they are the same. This is because both the web data are matched, and if they are the same, the page is an unupdated page, and the web data is discarded. If they are not the same, the page has been updated, and this Web data is used as update data. That is, the update data is a page including a keyword, and is Web data of a new page or an existing page that has been updated.

更新手段は、以上による更新用データにより更新するものである。新規ページに対応するWebデータは、検出結果データベースに対して新規データとして書き込まれる。また既存ページが更新されたWebデータは、検出結果データベースのWebデータを更新することとなる。ただ更新される旧データも必要であるなら、旧データを更新せずに、新規データとして書き込んでもよい。この場合は書き込んだデータのキーをURLにしておき、旧データにはこれに関連付けた別のキーを与えておく必要がある。   The update means updates the update data as described above. Web data corresponding to the new page is written as new data in the detection result database. In addition, the Web data in which the existing page is updated will update the Web data in the detection result database. However, if the old data to be updated is also required, the old data may be written as new data without being updated. In this case, it is necessary to set the key of the written data as a URL and give another key associated with the old data in advance.

また通知手段は、更新用データに対応するページのアドレスを、電子メールの電文中に記載し、そのクライアントに送信するものである。これにより、電子メールの届いたことに気が付いた会員が、この電子メールを開封し、示されたURLをクリックして、そのページの確認をすることができるのである。   Further, the notifying means describes the address of the page corresponding to the update data in the electronic mail message and transmits it to the client. As a result, a member who notices that the e-mail has arrived can open the e-mail and click the indicated URL to confirm the page.

検索代理サーバでは、以上のような、取得手段、抽出手段、検出手段、更新手段、通知手段のサイクルを繰り返し手段により、繰り返し行われる様になっている。そしてこの繰り返しは、所定の契機で繰り返されるのである。例えば、契機が、毎日朝9時と入力しておくと、毎朝9時にこのサイクルが始まり、その時点での、前日かのその時点までの間にできた新たなページや更新されたページを、電子メールで通知してくる様になっている。   In the search proxy server, the cycle of the acquisition unit, the extraction unit, the detection unit, the update unit, and the notification unit as described above is repeatedly performed by the repetition unit. This repetition is repeated at a predetermined opportunity. For example, if the opportunity is entered as 9:00 am every day, this cycle starts at 9:00 am every morning, and new or updated pages created up to that point on the previous day You will be notified by email.

次に、この様なホームページ監視システムの利用方法を、図3を用いて説明する。まず、このシステムのサービスを利用したい者は、事前にクライアント2から会員の登録申請をするのである(図3の(1))。具体的には、クライアント2に図示しない登録申請画面を表示させ、ここから必要な申請事項を入力して、送信ボタンを押して検索代理サーバ1に送信するのである。この様な申請により、会員登録が成され、会員IDとパスワードの発行が成されるのである(同(2))。   Next, a method of using such a homepage monitoring system will be described with reference to FIG. First, a person who wants to use the service of this system applies for membership registration from the client 2 in advance ((1) in FIG. 3). Specifically, a registration application screen (not shown) is displayed on the client 2, a necessary application item is input from here, and a transmission button is pressed to transmit it to the search proxy server 1. With such an application, membership registration is completed and a member ID and password are issued ((2)).

この様な登録の成された会員が、検索を依頼する場合には、IDとパスワードの入力画面を表示させるのである。そして本ホームページ監視システムにログインしたら、依頼データの入力画面から、検索したいキーワードと、ホームページのURLと、契機を入力し、これを依頼データとして検索代理サーバに送信するのである(同(3))。URLは複数入力できるようになっている。   When a member who has made such a registration requests a search, an ID and password input screen is displayed. Then, after logging in to the homepage monitoring system, the keyword to be searched, the URL of the homepage, and the opportunity are entered from the request data input screen, and this is sent to the search proxy server as request data ((3)). . A plurality of URLs can be input.

この様な依頼データを受信した検索代理サーバ1側では、依頼データを依頼データベース20に登録し(同(4))、検出結果データベース30には、当該キーワードで検索されたWebデータの格納の準備をしておくのである(同(5))。   Upon receiving such request data, the search proxy server 1 side registers the request data in the request database 20 ((4)), and the detection result database 30 prepares to store the Web data searched by the keyword. (5).

この様な準備が成されたら、繰り返し手段が所定の契機で、取得手段とこれに続く各手段の繰り返しを開始させるのである。つまり、検索代理サーバ内には時計が備わっていて、その時々の日時が分かるのであるが、繰り返し手段では、この時計により、取得手段とこれに続く各手段を開始させる日時を常時、見ているのである(同(6))。そして、会員から指定されている契機が到来したら、このこれら手段の実行を始めるのである(同(7))。即ち与えられたURLによりWebデータを取得する取得手段を実行し(同(8))、その際には、抽出手段でキーワードの入ったWebデータを抽出し(同(9))、それが更新用データに該当するかどうかを検出手段で検出し(同(10))、更新データに該当するので有れば、検出結果データベースを更新するのである(同(11))。そして、その更新用データに対応するURLを書き込んだ電子メールを作成し、クライアントに通知のメール送信をするのである(同(12))。   When such a preparation is made, the repetition means starts the repetition of the acquisition means and each subsequent means at a predetermined opportunity. In other words, the search proxy server has a clock, and the time and date can be known, but the repeater always uses this clock to see the date and time at which the acquisition unit and the subsequent units are started. (Id. (6)). Then, when an opportunity designated by the member comes, execution of these means is started ((7)). That is, the acquisition means for acquiring the Web data by the given URL is executed ((8)), and at that time, the extraction means extracts the Web data containing the keyword ((9)) and updates it. It is detected by the detecting means whether it corresponds to the data for use (same (10)), and if it corresponds to the update data, the detection result database is updated (same (11)). Then, an electronic mail in which a URL corresponding to the update data is written is created, and a notification mail is transmitted to the client ((12)).

クライアントでは、電子メールを受信した事が、通常のパソコン機能として表示されるので、会員はこれにより通知のあったことが分かるのである。電子メールを開封すると、その本文中に、更新された更新用データのページのURLが何個か記載してあるので、これをクリックすることにより、そのページが確認できるのである。   At the client, the fact that the e-mail has been received is displayed as a normal personal computer function, so that the member knows that there has been a notification. When the e-mail is opened, the URL of the updated update data page is described in the body of the e-mail. By clicking on the URL, the page can be confirmed.

なお、通知は電子メールに限るものではなく、このホームページ監視システム自身のホームページの中で、通知すべき更新データの有る旨を表示させ、それをみた会員が、そのホームページの中で表示されている更新されたページURLから、それを見るようにしてもよい。   Note that notifications are not limited to e-mails. In the homepage of the homepage monitoring system itself, the fact that there is update data to be notified is displayed, and the members who see it are displayed in the homepage. You may make it see it from updated page URL.

なお本願発明は上記実施例に限るものではなく、発明の趣旨を逸脱しない範囲でどの様に実施されてもよい。また、本願のホームページ監視システムに、各種の機能を付加させるのは自由である。   The present invention is not limited to the above-described embodiments, and may be implemented in any manner without departing from the spirit of the invention. Moreover, it is free to add various functions to the homepage monitoring system of the present application.

この図は、検索代理サーバとクライアントがインターネット上でどの様な関係であるかを、各データベースとともに示す図である。This figure shows the relationship between the search proxy server and the client on the Internet together with each database. この図は、会員データベースと依頼データベースを説明する図である。This figure explains the member database and the request database. この図は、ホームページ監視システムの利用方法を説明する図である。This figure is a diagram for explaining how to use the homepage monitoring system.

符号の説明Explanation of symbols

1 検索代理サーバ
2 クライアント
3 Webサーバ
10 会員データベース
11 会員
20 依頼データベース
21 キーワード
22 URL
30 検索結果データベース
1 Search Proxy Server 2 Client 3 Web Server 10 Member Database 11 Member 20 Request Database 21 Keyword 22 URL
30 Search result database

Claims (5)

インターネットのクライアントと検索代理サーバとによるホームページ監視システムであって、
(A)検索したいテーマに適した所望のキーワードと、前記検索を希望するホームページのアドレスと、を含む依頼データを入力する入力手段と、
入力された前記依頼データを前記検索代理サーバに送信する送信手段と、を有する前記クライアントと、
(B)インターネット上のWebサーバから検索されたWebデータを格納する検索結果データベース、を有する前記検索代理サーバーであって、
前記クライアントから送信される前記依頼データを受信する受信手段と、
前記アドレスのホームページ及びこのホームページと所定の関連付けを持つページのWebデータを取得する取得手段と、
取得した前記Webデータから前記キーワードを含むWebデータを抽出する抽出手段と、
前記抽出手段により抽出された前記Webデータの中から、前記検索結果データベースには含まれない新規なWebデータを更新用データとして検出する検出手段と、
検出された前記更新用データで前記検出結果データベースを更新する更新
手段と、を有する前記検索代理サーバと、
を有することを特徴とするホームページ監視システム。
A homepage monitoring system using an Internet client and a search proxy server,
(A) an input means for inputting request data including a desired keyword suitable for a theme to be searched and an address of a home page for which the search is desired;
Transmitting means for transmitting the input request data to the search proxy server; and the client,
(B) the search proxy server having a search result database for storing Web data searched from a Web server on the Internet,
Receiving means for receiving the request data transmitted from the client;
Obtaining means for obtaining the homepage of the address and the web data of a page having a predetermined association with the homepage;
Extraction means for extracting Web data including the keyword from the acquired Web data;
Detecting means for detecting, as update data, new Web data not included in the search result database from the Web data extracted by the extracting means;
Updating means for updating the detection result database with the detected update data, and the search proxy server,
A homepage monitoring system characterized by comprising:
請求項1記載のホームページ監視システムにおいて、所定の関連付けが、ハイパーテキストによる関連付けであることを特徴とするホームページ監視システム。   2. The homepage monitoring system according to claim 1, wherein the predetermined association is hypertext association. 請求項1又は2記載のホームページ監視システムにおいて、
取得手段、抽出手段、検出手段、及び更新手段を、所定の契機で繰り返し実行する繰り返し手段を有することを特徴とするホームページ監視システム。
In the homepage monitoring system according to claim 1 or 2,
A homepage monitoring system comprising: a repeating unit that repeatedly executes an acquiring unit, an extracting unit, a detecting unit, and an updating unit at a predetermined opportunity.
請求項3記載のホームページ監視システムにおいて、検索代理サーバが、更新手段により更新された更新内容をクライアントに通知する通知手段を有し、
繰り返し手段が、更新手段のあとに前記通知手段が追加された状態で繰り返されることを特徴とするホームページ監視システム。
The homepage monitoring system according to claim 3, wherein the search proxy server has a notification means for notifying the client of the updated content updated by the update means,
A homepage monitoring system characterized in that the repeating means is repeated with the notification means added after the updating means.
請求項3又は4記載のホームページ監視システムであって、所定の契機がクライアントから入力されて、依頼データに含まれることを特徴とするホームページ監視システム。 5. The homepage monitoring system according to claim 3 or 4, wherein a predetermined trigger is input from a client and is included in the request data.
JP2005133869A 2005-05-02 2005-05-02 Home page monitoring system Withdrawn JP2006309633A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005133869A JP2006309633A (en) 2005-05-02 2005-05-02 Home page monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005133869A JP2006309633A (en) 2005-05-02 2005-05-02 Home page monitoring system

Publications (1)

Publication Number Publication Date
JP2006309633A true JP2006309633A (en) 2006-11-09

Family

ID=37476426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005133869A Withdrawn JP2006309633A (en) 2005-05-02 2005-05-02 Home page monitoring system

Country Status (1)

Country Link
JP (1) JP2006309633A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056430A1 (en) * 2006-11-10 2008-05-15 Telefonaktiebolaget Lm Ericsson (Publ) Server, user equipment, notification system, method for controlling server, and method for controlling user equipment
JP2012502329A (en) * 2008-09-11 2012-01-26 トムソン ライセンシング Automatic search transfer device and automatic search transfer system
CN103258019A (en) * 2013-04-28 2013-08-21 百度在线网络技术(北京)有限公司 Method and device for providing query result

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056430A1 (en) * 2006-11-10 2008-05-15 Telefonaktiebolaget Lm Ericsson (Publ) Server, user equipment, notification system, method for controlling server, and method for controlling user equipment
GB2456118A (en) * 2006-11-10 2009-07-08 Ericsson Telefon Ab L M Server, user equipment,notification system, method for controlling server, and method for controlling user equipment
JP2010508566A (en) * 2006-11-10 2010-03-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Server, user device, notification system, server control method, and user device control method
JP2012502329A (en) * 2008-09-11 2012-01-26 トムソン ライセンシング Automatic search transfer device and automatic search transfer system
CN103258019A (en) * 2013-04-28 2013-08-21 百度在线网络技术(北京)有限公司 Method and device for providing query result

Similar Documents

Publication Publication Date Title
US8056007B2 (en) System and method for recognizing and storing information and associated context
US8522257B2 (en) System and method for context information retrieval
US7499940B1 (en) Method and system for URL autocompletion using ranked results
US8005806B2 (en) System and method for information retrieval using context information
US9081851B2 (en) Method and system for autocompletion using ranked results
CA2779366C (en) Method and system for processing information of a stream of information
US8732252B2 (en) Cooperating system, chat server, program, and cooperating method
US9892096B2 (en) Contextual hyperlink insertion
US20120151310A1 (en) Method and system for identifying and delivering contextually-relevant information to end users of a data network
US8082516B2 (en) Preview panel
KR20170110671A (en) Method and device for storing chat history of instant messaging
JP4830637B2 (en) Electronic document update notification device and electronic document update notification method
JP2007323394A (en) Meta retrieval system and meta retrieval method, user terminal to be used for the same, and program
JP2005346495A (en) Information processing system, information processing method, and information processing program
JP2003006225A (en) Information providing method, information providing device, and terminal therefor
JP2006309633A (en) Home page monitoring system
JP2008204198A (en) Information providing system and information providing program
JP5040544B2 (en) Content-related registration method
KR101079802B1 (en) System and Method for Searching Website, Devices for Searching Website and Recording Medium
Ganibardi et al. Web Usage Data Cleaning: A Rule-Based Approach for Weblog Data Cleaning
JP4854752B2 (en) Ordinance revision information storage device and ordinance revision notification system
JP4104878B2 (en) Web page guidance method and web page guidance program
JP5103161B2 (en) Document management apparatus, document management system, document search method, program, and computer-readable recording medium
JP2004192335A (en) E-mail collecting/searching system
JP2010044708A (en) Program, device and method for managing tracking of web resource

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080805