JP2011129146A - Information search system for automatically searching information on network, information search device, information search method, recording medium and program - Google Patents

Information search system for automatically searching information on network, information search device, information search method, recording medium and program Download PDF

Info

Publication number
JP2011129146A
JP2011129146A JP2011015693A JP2011015693A JP2011129146A JP 2011129146 A JP2011129146 A JP 2011129146A JP 2011015693 A JP2011015693 A JP 2011015693A JP 2011015693 A JP2011015693 A JP 2011015693A JP 2011129146 A JP2011129146 A JP 2011129146A
Authority
JP
Japan
Prior art keywords
information
search
site
storage device
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011015693A
Other languages
Japanese (ja)
Inventor
Shunji Sugaya
俊二 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Optim Corp
Original Assignee
Optim Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Optim Corp filed Critical Optim Corp
Priority to JP2011015693A priority Critical patent/JP2011129146A/en
Publication of JP2011129146A publication Critical patent/JP2011129146A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To search information disclosed on a network in real time. <P>SOLUTION: A search server SS is configured to collect information actually disclosed at sites on the network NW by a site data acquisition unit 45, to temporarily store the information in an internal RAM 23, to select, based on a search condition designated by search object information related to a registered search request, the collected and temporarily stored information by a determination processing unit 47, and to store only the selected information in a site data storage unit 48 constituted by an external storage device 24. Accordingly to this, when a search is requested, the information actually disclosed at sites on the network can be searched, and processing related to the search is executed in a state where the information acquired from the sites is developed in the RAM 23, whereby search processing can be performed at high speed. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、ネットワーク上の情報を自動検索する情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラムに関し、詳しくはインターネット等のネットワーク上で公開されている情報の検索技術に関する。   The present invention relates to an information search system, an information search apparatus, an information search method, a recording medium, and a program for automatically searching for information on a network, and more particularly to a search technique for information published on a network such as the Internet.

近年、インターネット等のネットワークの普及に伴い、ウェブサイト等の数が増加し、ネットワークを介してさまざまな情報が公開されている。ネットワーク上に存在するウェブサイトは多種多様であり、これらウェブサイトにより公開されている膨大な情報の中から所望の情報を探し出すための情報検索システムとして、いわゆるサーチエンジンと呼ばれる情報検索システムがある。   In recent years, with the spread of networks such as the Internet, the number of websites and the like has increased, and various information has been released through the networks. There are a wide variety of websites on the network, and there is an information search system called a search engine as an information search system for searching for desired information from a vast amount of information published by these websites.

従来提供されている情報検索システムでは、サーバーがソフトウェア(アプリケーションソフト)等によりネットワーク上のウェブサイトを巡回して情報(データ)を収集し、収集した情報をデータセンター等のハードディスクに書き込む。これにより、各ウェブサイトにて公開されている情報が、情報検索システムを構成するサーバー側(システム運用側)のハードディスクに保存蓄積される。   In a conventional information retrieval system, a server visits a website on a network by software (application software) and collects information (data) and writes the collected information to a hard disk such as a data center. As a result, information published on each website is stored and accumulated in the hard disk on the server side (system operation side) constituting the information search system.

また、システムを利用するユーザー側からキーワードなどの検索条件が入力され情報の検索が要求されると、サーバー(より詳細にはサーバーのCPU)は、情報が蓄積保存されたハードディスク内を検索条件に従って検索する。具体的には、ユーザー側から入力された検索条件を基に、ハードディスク内に蓄積されている情報を取捨選択し検索を行う。この検索結果を、サーバーが検索要求の応答としてユーザー側に返す。   When a search condition such as a keyword is input from a user using the system and a search for information is requested, the server (more specifically, the server CPU) searches the hard disk in which the information is stored and stored according to the search condition. Search for. Specifically, based on the search condition input from the user side, the information stored in the hard disk is selected and searched. The server returns the search result to the user as a response to the search request.

しかしながら、従来の情報検索システムは、ネットワーク上の各ウェブサイトで公開されている情報を収集してハードディスクに蓄積する処理に多大な時間を要し、例えば、ネットワーク上に存在するウェブサイトを情報の収集・蓄積を行って一回り巡回するのに1ヶ月の期間を要することもある。そのため、ウェブサイトにて公開されている情報の更新(変更、追加、削除など)が行われても、その更新内容がハードディスクに蓄積されている情報に直ちに反映されることはほとんどなく、反映されるまでに時間がかかる。   However, a conventional information retrieval system requires a great amount of time to collect information published on each website on the network and store it on the hard disk. It may take one month to make a round after collecting and accumulating. Therefore, even if the information published on the website is updated (changed, added, deleted, etc.), the updated contents are hardly reflected immediately in the information stored on the hard disk. It takes time to

したがって、従来の情報検索システムにおいてユーザー側に返される検索結果は、検索要求時に各ウェブサイトで実際に公開されている最新の情報とは必ずしも一致しないハードディスクに蓄積された情報に基づくものであった。つまり、検索結果は、検索要求時に実際に公開されている最新の情報に基づくものではなく、過去の情報収集時に公開されていた情報に基づくものであった。   Therefore, the search result returned to the user in the conventional information search system is based on information stored in the hard disk that does not necessarily match the latest information that is actually published on each website at the time of the search request. . That is, the search result is not based on the latest information actually disclosed at the time of the search request, but based on the information disclosed at the time of collecting the past information.

本発明は、このような事情に鑑みてなされたものであり、ネットワーク上で公開されている情報をリアルタイムに検索できるようにすることを目的とする。   The present invention has been made in view of such circumstances, and an object thereof is to make it possible to search information published on a network in real time.

本発明の情報検索システムは、情報の検索要求を基に、ネットワーク上で公開されている情報を検索する情報検索システムであって、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、上記検索要求に係る検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定手段と、上記判定手段での判定結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段とを備えることを特徴とする。
本発明の情報検索装置は、ネットワーク上で公開されている情報を検索する情報検索装置であって、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、情報の検索要求に係る検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定手段と、上記判定手段での判定結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段とを備えることを特徴とする。
また、本発明の情報検索装置は、ユーザー側からの情報検索要求に応じた情報を、ネットワーク上で公開されている情報の中から検索する情報検索装置であって、上記情報検索要求に係る検索対象情報を登録し記憶する情報登録手段と、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、上記記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とを照合し、当該情報が上記検索条件を満足するか否かを判定する判定手段と、上記判定手段での判定の結果、上記半導体記憶装置に保持している情報が上記検索条件を満足する場合に、当該情報を磁気記憶装置に記憶する記憶手段と、上記半導体記憶装置に保持している情報が上記磁気記憶装置に記憶されたことを条件として、上記情報検索要求に対する検索結果情報を出力する出力手段とを備えることを特徴とする。
また、本発明の情報検索装置は、ネットワーク上で公開されている情報を検索する情報検索装置であって、検索する情報に係る検索対象情報を登録し記憶する情報登録手段と、上記ネットワーク上のサイトを自動的に巡回して、各サイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、上記記憶した検索対象情報と上記半導体記憶装置に保持した情報とに基づいて、当該情報を公開しているサイトの危険度を判定する判定手段と、上記判定の結果、サイトの危険度が所定範囲内である場合には、当該サイトのサイト情報及び上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段と、上記判定結果に係る検索結果情報を出力する出力手段とを備えることを特徴とする。
本発明の情報検索方法は、ネットワーク上で公開されている情報を検索する情報検索方法であって、検索する情報に係る検索対象情報を登録し記憶する情報登録工程と、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得工程と、上記情報登録工程にて記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定工程と、上記判定の結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶工程とを有することを特徴とする。
本発明のプログラムは、ネットワーク上で公開されている情報の検索処理を行うためのプログラムであって、検索する情報に係る検索対象情報を登録し記憶する情報登録ステップと、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得ステップと、上記情報登録ステップにて記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定ステップと、上記判定ステップでの結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶ステップとをコンピュータに実行させることを特徴とする。
本発明のコンピュータ読み取り可能な記録媒体は、上記プログラムを記録したことを特徴とする。
An information retrieval system of the present invention is an information retrieval system for retrieving information published on a network based on an information retrieval request, and acquires information published on a site on the network to obtain a semiconductor memory An acquisition unit stored in the apparatus; a determination unit that determines whether to store the information based on a search condition specified by the search target information related to the search request and information stored in the semiconductor memory device; And a storage means for storing information held in the semiconductor storage device in the magnetic storage device in accordance with a determination result in the determination means.
An information search apparatus according to the present invention is an information search apparatus for searching for information published on a network, and obtains information published on a site on the network and stores it in a semiconductor storage device; A determination unit that determines whether or not to save the information based on a search condition specified by the search target information related to the information search request and the information held in the semiconductor memory device; and a determination by the determination unit According to a result, the information processing apparatus includes storage means for storing information held in the semiconductor storage device in the magnetic storage device.
The information search apparatus of the present invention is an information search apparatus that searches information according to an information search request from a user from information published on a network, and the search related to the information search request Information registration means for registering and storing target information; acquisition means for acquiring information published on a site on the network and storing it in a semiconductor storage device; search conditions specified by the stored search target information; and The information stored in the semiconductor memory device is collated with information stored in the semiconductor memory device as a result of the determination performed by the information stored in the semiconductor memory device to determine whether the information satisfies the search condition. Storage means for storing the information in the magnetic storage device and information held in the semiconductor storage device is stored in the magnetic storage device when the search condition is satisfied. As a condition, and an outputting means for outputting the search result information for the information retrieval request.
The information search device of the present invention is an information search device for searching information published on the network, and includes information registration means for registering and storing search target information related to the information to be searched, Based on the acquisition means that automatically circulates the site, acquires the information published in each site and holds it in the semiconductor memory device, the stored search target information and the information held in the semiconductor memory device, The determination means for determining the risk level of the site that publishes the information, and if the risk level of the site is within a predetermined range as a result of the determination, the information is stored in the site information of the site and the semiconductor storage device. Storage means for storing the stored information in a magnetic storage device, and output means for outputting search result information relating to the determination result.
The information search method of the present invention is an information search method for searching information published on the network, and includes an information registration step for registering and storing search target information related to information to be searched, and a site on the network. Based on the acquisition process of acquiring public information and holding it in the semiconductor memory device, the search condition specified by the search target information stored in the information registration process, and the information held in the semiconductor memory device, The method includes a determination step for determining whether or not to save information, and a storage step for storing information held in the semiconductor storage device in the magnetic storage device in accordance with a result of the determination.
The program of the present invention is a program for performing a search process of information published on a network, and registers and stores search target information related to information to be searched, and a site on the network. Based on the acquisition step of acquiring public information and holding it in the semiconductor memory device, the search condition specified by the search target information stored in the information registration step, and the information held in the semiconductor memory device, Causing a computer to execute a determination step of determining whether or not to save information, and a storage step of storing information held in the semiconductor storage device in the magnetic storage device according to a result of the determination step It is characterized by.
The computer-readable recording medium of the present invention records the above program.

本発明によれば、情報の検索要求を基にネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持して、当該情報を保存するか否かの判定を行い、その判定結果に応じて半導体記憶装置に保持している情報を磁気記憶装置に記憶する。これにより、検索要求時にネットワーク上のサイトで実際に公開されている情報を検索することができ、かつ取得した情報を半導体記憶装置に記憶して検索に係る実際の処理を実行することで高速に検索処理を行うことができる。したがって、ネットワーク上で公開されている情報をリアルタイムに検索でき、検索結果として最新の情報に基づく最適な情報を提供することができる。   According to the present invention, based on a search request for information, information published on a site on a network is acquired, held in a semiconductor storage device, and it is determined whether or not to store the information, and the determination result Accordingly, the information stored in the semiconductor memory device is stored in the magnetic memory device. As a result, it is possible to search for information that is actually disclosed at a site on the network at the time of a search request, and to store the acquired information in a semiconductor memory device and execute the actual processing related to the search at high speed. Search processing can be performed. Therefore, information published on the network can be searched in real time, and optimum information based on the latest information can be provided as a search result.

本発明の実施形態による情報検索システムの一構成例を示すブロック図である。It is a block diagram which shows the example of 1 structure of the information search system by embodiment of this invention. 検索サーバーのハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of a search server. ユーザー端末のハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of a user terminal. 検索サーバーの機能的な構成の一例を示すブロック図である。It is a block diagram which shows an example of a functional structure of a search server. 本実施形態による情報検索システムの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information search system by this embodiment. 本実施形態による情報検索システムを適用したリアルタイム検索システムの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the real-time search system to which the information search system by this embodiment is applied. リアルタイム検索システムでの画面表示の一例を示す図である。It is a figure which shows an example of the screen display in a real-time search system. 本実施形態による情報検索システムを適用したネットパトロールシステムの機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the net patrol system to which the information search system by this embodiment is applied. ネットパトロールシステムにおける検索処理の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of the search process in a net patrol system. ネットパトロールシステムにおける監視処理の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of the monitoring process in a net patrol system.

以下、本発明の実施形態を図面に基づいて説明する。
図1は、本発明の実施形態による情報検索システムの構成例を示すブロック図である。
図1において、SSiはサーバー(検索サーバー)、PCjはユーザー端末、WSAk及びWSBlはウェブサーバーである。ここで、各符号における“i”、“j”、“k”、“l”は添え字であり、任意の自然数である。つまり、図1においては、3つの検索サーバーSS1〜SS3、2つのユーザー端末PC1、PC2、及び4つのウェブサーバーWSA1、WSA2、WSB1、WSB2を図示しているが、これに限定されるものではなく、検索サーバー、ユーザー端末、ウェブサーバーの数は任意である。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of an information search system according to an embodiment of the present invention.
In FIG. 1, SSi is a server (search server), PCj is a user terminal, and WSAk and WSBl are web servers. Here, “i”, “j”, “k”, and “l” in each code are subscripts and are arbitrary natural numbers. That is, in FIG. 1, three search servers SS1 to SS3, two user terminals PC1 and PC2, and four web servers WSA1, WSA2, WSB1, and WSB2 are illustrated, but not limited thereto. The number of search servers, user terminals, and web servers is arbitrary.

検索サーバーSSi、ユーザー端末PCj、及びウェブサーバーWSAk、WSBlは、それぞれが備えるネットワークインタフェースにより、インターネット等のネットワークNWを介して互いに通信可能なように接続されている。なお、図示していないが、検索サーバーSSiとユーザー端末PCjとは、個別線により通信可能なように接続されていても良い。   The search server SSi, the user terminal PCj, and the web servers WSAk and WSBl are connected to each other through a network NW such as the Internet so that they can communicate with each other via a network interface provided therein. Although not shown, the search server SSi and the user terminal PCj may be connected so as to be able to communicate with each other via an individual line.

検索サーバーSSiは、ユーザー端末PCjからの情報の検索要求に基づいて、ウェブサーバーWSAk、WSBlが提供するサイトで公開されている情報を検索する。また、検索サーバーSSiは、ユーザー端末PCjからの要求等に応じて検索結果を返す。   The search server SSi searches information published on the sites provided by the web servers WSAk and WSBl based on a search request for information from the user terminal PCj. The search server SSi returns a search result in response to a request from the user terminal PCj.

ユーザー端末PCjは、ユーザーが検索サーバーSSiに情報の検索を要求したり、検索サーバーSSiから供給される検索結果を表示したりするためのものである。ウェブサーバーWSAk、WSBlは、ネットワークNW上のサイトを提供するものであり、外部からの要求を受けてサイトで公開している情報をネットワークNWを介して提供する。   The user terminal PCj is for a user to request a search for information from the search server SSi or to display a search result supplied from the search server SSi. The web servers WSAk and WSBl provide sites on the network NW, and provide information published on the sites in response to external requests via the network NW.

なお、後述するように本実施形態による情報検索システムにおいて検索サーバーSSiを複数設けた場合には、各検索サーバーSSiは、ユーザー端末PCjからの情報の検索要求に係る情報等を相互に交換するとともに、互いに異なるサイトに対して検索を行う。すなわち、各検索サーバーSSiは、検索要求に係る情報等を共有化し、かつ検索範囲を分割して(各検索サーバーSSiの検索対象とするサイトを分けて)検索を行う。また、この検索結果についても、検索サーバーSSi間で情報を交換し反映させる。このように検索サーバーSSで検索要求に係る情報及び検索結果等を共有し、ネットワークNW上の複数のサイトに対する検索を分けて各検索サーバーSSで並行して行うことで、各検索サーバーSSの負荷を分散して軽減することができるとともに、検索処理を高速に行うことができる。   As will be described later, when a plurality of search servers SSi are provided in the information search system according to the present embodiment, the search servers SSi mutually exchange information related to information search requests from the user terminal PCj. , Search for different sites. That is, each search server SSi shares information related to the search request and divides the search range (separates search sites of each search server SSi) and performs a search. In addition, information on the search result is also exchanged and reflected between the search servers SSi. In this way, the information related to the search request and the search result are shared by the search server SS, and the search for a plurality of sites on the network NW is divided and performed in parallel by each search server SS. Can be distributed and reduced, and the search process can be performed at high speed.

例えば、検索サーバーSS1が、ウェブサーバー群SGAの各ウェブサーバーWSAkにより提供されるサイトに対して検索を行い、検索サーバーSS2がウェブサーバー群SGBの各ウェブサーバーWSBlにより提供されるサイトに対して検索を行う。同様に、他の検索サーバーも検索対象のサイトが互いに相違するようにして検索を行う。   For example, the search server SS1 searches a site provided by each web server WSAK of the web server group SGA, and the search server SS2 searches for a site provided by each web server WSBl of the web server group SGB. I do. Similarly, other search servers also perform searches so that search target sites are different from each other.

また、複数の検索サーバーSSiにて、ある検索サーバーSSiが統括的に制御を行い、制御される側の検索サーバーSSiに情報の検索要求に係る情報等を配信したり、各検索サーバーSSiで得られた検索結果を集めて他の検索サーバーSSiにそれぞれ配信し反映させたりするようにしても良い。   A plurality of search servers SSi controls the search server SSi in a centralized manner, and distributes information related to information search requests to the search server SSi on the controlled side. The retrieved search results may be collected, distributed to other search servers SSi, and reflected.

図2は、本実施形態における検索サーバーSSのハードウェア構成例を示すブロック図である。
検索サーバーSSは、図2に示すように、CPU21と、ROM(読み出し専用メモリ)22と、RAM23と、ハードディスク等の外部記憶装置24と、ネットワークインタフェース25とを有する。図2においては、詳細は後述する本実施形態における検索処理でのデータの流れ等を理解しやすいように検索サーバーSSの構成を図示しているが、CPU21、ROM22、RAM23、外部記憶装置24、及びネットワークインタフェース25は、図示しないバスを介して互いに通信可能に接続されている。このバスを介して、バスに接続された各種構成要素(機器)間相互のアドレス信号、制御信号及び各種データの転送が行われる。
FIG. 2 is a block diagram illustrating a hardware configuration example of the search server SS in the present embodiment.
As shown in FIG. 2, the search server SS includes a CPU 21, a ROM (read only memory) 22, a RAM 23, an external storage device 24 such as a hard disk, and a network interface 25. In FIG. 2, the configuration of the search server SS is illustrated so that the flow of data in the search processing in the present embodiment, which will be described in detail later, is easy to understand, but the CPU 21, ROM 22, RAM 23, external storage device 24, The network interface 25 is connected to be communicable with each other via a bus (not shown). The address signals, control signals, and various data are transferred between the various components (devices) connected to the bus via this bus.

CPU21は、データの送受信、データの結合、データの比較や照合などを行うため、検索サーバーSS内の各種構成要素を統括的に制御する。この制御は、あらかじめCPU21の制御手順(コンピュータプログラム、ソフトウェア)をROM22(外部記憶装置24でも良い。)に記憶させておき、この制御手順をCPU21が実行することにより行われ、データの転送、結合、比較や照合等の処理を実行することが可能となる。   The CPU 21 comprehensively controls various components in the search server SS in order to transmit / receive data, combine data, compare and collate data, and the like. This control is performed in advance by storing the control procedure (computer program, software) of the CPU 21 in the ROM 22 (or the external storage device 24), and this control procedure is executed by the CPU 21 to transfer and combine data. It is possible to execute processing such as comparison and verification.

RAM23は、データの送受信、結合、比較、照合等のためのワークメモリ、各種構成要素の制御のための一時記憶として用いられる。また、RAM23には、本実施形態における検索処理おいて、ネットワークNW上のサイトで公開されている情報を取得した際に、この取得した情報が一時的に保持される。   The RAM 23 is used as a work memory for data transmission / reception, combination, comparison, comparison, etc., and temporary storage for control of various components. Further, in the search process in the present embodiment, when the information published on the site on the network NW is acquired, the acquired information is temporarily stored in the RAM 23.

本実施形態では、CPU21及びROM22(あるいは外部記憶装置24)に記憶されたプログラムにより、本発明の取得手段、判定手段、記憶手段等の機能が実現される。   In the present embodiment, functions such as an acquisition unit, a determination unit, and a storage unit of the present invention are realized by a program stored in the CPU 21 and the ROM 22 (or the external storage device 24).

外部記憶装置24は、例えばハードディスクなどの保存用磁気記憶装置である。ネットワークインタフェース25は、検索サーバーSSiとネットワークNWとを接続し、ネットワークNWに接続された他の装置との間でデータの授受を行うためのものである。   The external storage device 24 is a storage magnetic storage device such as a hard disk. The network interface 25 connects the search server SSi and the network NW and exchanges data with other devices connected to the network NW.

図3は、本実施形態における各ユーザー端末PCjのハードウェア構成例を示すブロック図である。
ユーザー端末PCjは、図3に示すように、CPU31と、ROM(読み出し専用メモリ)32と、RAM33と、ハードディスク等の外部記憶装置34と、ネットワークインタフェース35と、入力装置36と、出力装置37とが、バス38を介して互いに通信可能に接続された構成としている。このバス38を介して、バス38に接続された各種構成要素(機器)間相互のアドレス信号、制御信号及び各種データの転送が行われる。
FIG. 3 is a block diagram illustrating a hardware configuration example of each user terminal PCj in the present embodiment.
As shown in FIG. 3, the user terminal PCj includes a CPU 31, a ROM (Read Only Memory) 32, a RAM 33, an external storage device 34 such as a hard disk, a network interface 35, an input device 36, and an output device 37. However, they are configured to be communicably connected to each other via a bus 38. Via this bus 38, address signals, control signals, and various data are transferred between the various components (devices) connected to the bus 38.

CPU31は、データの入出力、データの送受信等を行うため、バス38を介して接続された各種構成要素を制御するものである。あらかじめROM32に記憶させておいた制御手順(コンピュータプログラム)をCPU31が実行することにより、データの入出力、データの送受信等の処理を実行することが可能となる。なお、当該制御手順(コンピュータプログラム)をハードディスク等の外部記憶装置34にあらかじめ記憶させておき、それを実行するようにしても良い。RAM33は、データの入出力、送受信のためのワークメモリ、各種構成要素の制御のための一時記憶として用いられる。また、ROM32にCPU31の制御手順(コンピュータプログラム)を記憶させた場合には、当該プログラムをROM32からRAM33にロードし、RAM33にロードされたプログラムを実行するようにしても良い。   The CPU 31 controls various components connected via the bus 38 in order to input / output data and transmit / receive data. When the CPU 31 executes a control procedure (computer program) stored in advance in the ROM 32, processing such as data input / output and data transmission / reception can be executed. The control procedure (computer program) may be stored in advance in the external storage device 34 such as a hard disk and executed. The RAM 33 is used as a work memory for data input / output, transmission / reception, and temporary storage for control of various components. When the control procedure (computer program) of the CPU 31 is stored in the ROM 32, the program may be loaded from the ROM 32 to the RAM 33 and the program loaded in the RAM 33 may be executed.

外部記憶装置34は、例えばハードディスクなどの保存用外部記憶装置である。ネットワークインタフェース35は、ネットワークNWに接続された他の装置との間でデータの授受を行うため、各ユーザー端末PCjとネットワークNWとを接続する。入力装置36は、例えばキーボードやマウスのような入力装置であり、ユーザーが情報の検索要求に係る検索対象情報を入力するために用いられる。出力装置37は、例えばディスプレイのような出力装置であり、検索対象情報の入力画面や検索結果の表示画面を表示するために用いられる。
なお、ウェブサーバーWSAk、WSBlの構成は、公知のウェブサーバーと同様であるので説明を省略する。
The external storage device 34 is a storage external storage device such as a hard disk. The network interface 35 connects each user terminal PCj and the network NW in order to exchange data with other devices connected to the network NW. The input device 36 is an input device such as a keyboard or a mouse, and is used for a user to input search target information related to an information search request. The output device 37 is an output device such as a display, for example, and is used to display a search target information input screen or a search result display screen.
Note that the configuration of the web servers WSAk and WSB1 is the same as that of a known web server, and thus the description thereof is omitted.

図4は、本実施形態における検索サーバーSSの機能的な構成を示す機能ブロック図であり、検索サーバーSS内の各機能部は、制御部41により統括的に制御される。   FIG. 4 is a functional block diagram showing a functional configuration of the search server SS in the present embodiment, and each functional unit in the search server SS is comprehensively controlled by the control unit 41.

情報登録部42は、登録情報設定部43及び登録情報記憶部44を有し、ネットワークNWを介して供給されるユーザー端末PCjからの情報の検索要求に係る検索対象情報を登録し記憶する。ここで、検索対象情報は、ネットワークNW上のサイトで公開されている情報を検索するための検索条件等を示すものであり、検索に用いるキーワードを含む。さらに、検索対象情報として、例えば検索対象とするサイトや優先的に検索するサイトなどの他の情報を含むようにしても良い。   The information registration unit 42 includes a registration information setting unit 43 and a registration information storage unit 44, and registers and stores search target information related to a search request for information from the user terminal PCj supplied via the network NW. Here, the search target information indicates a search condition for searching information published on a site on the network NW, and includes a keyword used for the search. Further, as the search target information, for example, other information such as a site to be searched or a site to be preferentially searched may be included.

登録情報設定部43は、ユーザー端末PCjから検索対象情報が入力され、又は検索対象情報を収集し、その検索対象情報を登録情報記憶部44に供給する。また、登録情報記憶部44は、供給される検索対象情報を記憶する。   The registration information setting unit 43 receives search target information from the user terminal PCj or collects the search target information and supplies the search target information to the registration information storage unit 44. Further, the registration information storage unit 44 stores supplied search target information.

サイトデータ取得部45は、いわゆるクローラ(ロボット、スパイダーとも呼ばれる)に相当するものであり、ネットワークNW上のサイトを自動的に巡回してサイトを構成するコンテンツのデータを収集し、サイトで公開されている情報を取得する。さらに、サイトデータ取得部45は取得した情報を一時的に保持する。この取得した情報の一時的な保持には、図2に示したRAM23の記憶領域が用いられる。   The site data acquisition unit 45 corresponds to a so-called crawler (also called a robot or a spider), and automatically circulates the sites on the network NW to collect data of the contents constituting the sites and is released on the sites. Get information. Further, the site data acquisition unit 45 temporarily holds the acquired information. The storage area of the RAM 23 shown in FIG. 2 is used for temporary storage of the acquired information.

また、サイトデータ取得部45は、最適化処理部46を有する。最適化処理部46は、公開されている情報を取得する際のサイトの巡回順序や巡回範囲を最適化するものである。最適化処理部46により最適化されたサイトの巡回順序や巡回範囲に従って、サイトデータ取得部45がネットワークNW上のサイトを巡回する。   Further, the site data acquisition unit 45 includes an optimization processing unit 46. The optimization processing unit 46 optimizes the patrol order and the patrol range of the site when acquiring public information. The site data acquisition unit 45 circulates the sites on the network NW according to the circulation order and the circulation range of the sites optimized by the optimization processing unit 46.

ここで、最適化処理部46は、学習機能を有しており、登録情報記憶部44に記憶された検索対象情報及び後述する判定処理部47での判定結果の少なくとも一方に基づいて、ネットワークNW上のサイトに優先順位を付し、サイトの巡回順序や巡回範囲を変化させる。また、例えば登録情報記憶部44に記憶された検索対象情報により検索対象とするサイトや優先的に検索するサイトなどが指定されている場合には、指定されたサイトで公開されている情報をサイトデータ取得部45が最優先に取得するように、最適化処理部46は指定されたサイトの優先順位(巡回順序)を上げる。また、例えば新しい情報が容易に得られるように、他のサイトに比べて公開している情報の更新頻度が高いサイトの優先順位を高くするようにして、サイトで公開している情報の更新頻度に応じて優先順位(巡回順序)を変化させるようにしても良い。   Here, the optimization processing unit 46 has a learning function, and based on at least one of search target information stored in the registration information storage unit 44 and a determination result in a determination processing unit 47 described later, the network NW Prioritize the top sites and change the site's order and range. For example, when the search target information stored in the registered information storage unit 44 specifies a site to be searched or a site to be searched preferentially, the information published on the specified site is displayed as the site. The optimization processing unit 46 increases the priority (cyclic order) of the designated site so that the data acquisition unit 45 acquires the highest priority. Also, for example, the frequency of updating the information published on the site is increased by giving higher priority to the site that has a higher frequency of updating information published than other sites so that new information can be easily obtained. The priority (cyclic order) may be changed according to the above.

判定処理部47は、サイトデータ取得部45がサイトより取得し一時保持している情報と、登録情報記憶部44に記憶された検索対象情報により指定される検索条件とに基づいて、サイトより取得した情報がユーザーの指定する検索条件を満足するか否かを判定する。判定の結果、サイトから取得した情報が検索条件を満足する(例えば、検索対象情報に含まれるキーワードとの一致数が所定数以上など)場合には、サイトデータ取得部45が一時保持している情報をサイトデータ記憶部48に保存し、そうでない場合には、サイトデータ取得部45が一時保持している情報を保存せずに廃棄する。   The determination processing unit 47 acquires from the site based on the information that the site data acquisition unit 45 acquires from the site and temporarily holds and the search conditions specified by the search target information stored in the registration information storage unit 44. It is determined whether the selected information satisfies a search condition specified by the user. As a result of the determination, when the information acquired from the site satisfies the search condition (for example, the number of matches with the keyword included in the search target information is a predetermined number or more), the site data acquisition unit 45 temporarily holds the information. The information is stored in the site data storage unit 48. If not, the information temporarily stored in the site data acquisition unit 45 is discarded without being stored.

言い換えれば、判定処理部47は、サイトデータ取得部45がサイトより取得し一時保持している情報と、登録情報記憶部44に記憶された検索対象情報により指定される検索条件とに基づいて、サイトデータ取得部45が一時保持している情報をサイトデータ記憶部48に保存するか否かを判定する。さらに、判定処理部47は、その判定結果に応じて、サイトデータ取得部45が一時保持している情報をサイトデータ記憶部48に記憶させる。
このサイトデータ記憶部48は、図2に示した外部記憶装置24を用いて構成される。
In other words, the determination processing unit 47 is based on the information acquired by the site data acquisition unit 45 from the site and temporarily held, and the search condition specified by the search target information stored in the registration information storage unit 44. It is determined whether or not the information temporarily stored in the site data acquisition unit 45 is stored in the site data storage unit 48. Further, the determination processing unit 47 causes the site data storage unit 48 to store the information temporarily held by the site data acquisition unit 45 according to the determination result.
The site data storage unit 48 is configured using the external storage device 24 shown in FIG.

なお、判定処理部47における判定処理は、サイト単位で行うようにしても良いし、サイトを構成する各ページ単位で行うようにしても良い。また、判定処理部47での判定処理においては、検索対象情報に含まれるキーワード等に重み付けを行い、サイトより取得した情報をサイトデータ記憶部48に保存するか否かを判定するようにしても良い。   Note that the determination processing in the determination processing unit 47 may be performed in units of sites or may be performed in units of pages constituting the site. Further, in the determination process in the determination processing unit 47, a keyword or the like included in the search target information is weighted to determine whether or not the information acquired from the site is stored in the site data storage unit 48. good.

結果処理部49は、判定処理部47での判定結果及びサイトデータ記憶部48に記憶されたサイトで公開されている情報とに基づいて、検索結果情報を生成する。そして、生成した検索結果情報を、ユーザーからの情報の検索要求に対する応答として出力する。   The result processing unit 49 generates search result information based on the determination result in the determination processing unit 47 and information published on the site stored in the site data storage unit 48. The generated search result information is output as a response to the information search request from the user.

情報交換処理部50は、各検索サーバーSSが持つ検索処理に係る情報を相互に反映させ共有化を図るため、他の検索サーバーSSとの間で検索処理に係る情報を送受信する。具体的には、情報交換処理部50は、登録情報記憶部44に記憶される検索対象情報、判定処理部47での判定結果及びサイトデータ記憶部48に記憶される情報を含む検索処理に係る情報を他の検索サーバーSSとの間で授受する。   The information exchange processing unit 50 transmits / receives information related to the search processing to / from other search servers SS in order to mutually reflect and share information related to the search processing possessed by each search server SS. Specifically, the information exchange processing unit 50 relates to a search process including the search target information stored in the registration information storage unit 44, the determination result in the determination processing unit 47, and the information stored in the site data storage unit 48. Information is exchanged with other search servers SS.

なお、本実施形態では、検索サーバーSSが検索エンジン(サイトデータ取得部45や判定処理部47等)を有し、検索に係る情報(検索要求に係る情報や検索結果に係る情報)を検索サーバーSS間で相互に交換して共有するようにしている。しかし、これに限定されるものではなく、各ユーザー端末PCに検索エンジンを搭載し、各ユーザー端末PC間で検索に係る情報をピア・ツー・ピア(Peer To Peer)型の通信形態で相互に交換して共有するようにして、情報検索システムを構成しても良い。   In the present embodiment, the search server SS has a search engine (site data acquisition unit 45, determination processing unit 47, etc.), and information related to the search (information related to the search request and information related to the search result) is stored in the search server. The SSs are mutually exchanged and shared. However, the present invention is not limited to this. A search engine is installed in each user terminal PC, and information related to the search between the user terminal PCs is mutually exchanged in a peer-to-peer type communication form. The information search system may be configured so as to be exchanged and shared.

次に、動作について説明する。
図5は、本実施形態による情報検索システムの検索処理動作を示すフローチャートである。
Next, the operation will be described.
FIG. 5 is a flowchart showing the search processing operation of the information search system according to this embodiment.

まず、ステップS1にて、情報登録部42内の登録情報設定部43は、ユーザー端末PCjからの検索要求に係る検索対象情報を得て、この得られた検索対象情報が登録情報記憶部44に登録され記憶される。なお、情報検索システムが複数の検索サーバーSSiで構成される場合には上記処理に加え、このステップS1にて、さらに登録情報記憶部44に記憶された検索対象情報が、情報交換処理部50により他のすべての検索サーバーSSiに送信され、情報検索システムを構成する全検索サーバーSSiにて検索対象情報が共有化される。   First, in step S1, the registration information setting unit 43 in the information registration unit 42 obtains search target information related to a search request from the user terminal PCj, and the obtained search target information is stored in the registration information storage unit 44. Registered and memorized. When the information search system is configured by a plurality of search servers SSi, in addition to the above processing, the information to be searched stored in the registration information storage unit 44 is further updated by the information exchange processing unit 50 in step S1. The information is transmitted to all other search servers SSi, and the search target information is shared by all the search servers SSi constituting the information search system.

次に、ステップS2にて、サイトデータ取得部45は、内部の最適化処理部46により定められる巡回順序や巡回範囲に従ってネットワーク上のサイトにアクセスし、サイトを構成するコンテンツのデータを収集して保持する。これにより、ネットワーク上のあるサイトで公開されている情報が取得され、検索サーバーSSi内のRAM23に記憶され保持される。   Next, in step S2, the site data acquisition unit 45 accesses the site on the network according to the cyclic order and the cyclic range determined by the internal optimization processing unit 46, and collects the data of the contents constituting the site. Hold. As a result, information published at a certain site on the network is acquired, and stored and held in the RAM 23 in the search server SSi.

ステップS3にて、判定処理部47は、ステップS1において登録された検索対象情報により指定される検索条件を参照し、ステップS2においてサイトデータ取得部45がサイトより取得し保持したコンテンツのデータをサイトデータ記憶部48に保存するか否かを判定する。   In step S3, the determination processing unit 47 refers to the search condition specified by the search target information registered in step S1, and the content data acquired and held by the site data acquisition unit 45 from the site in step S2 is stored in the site. It is determined whether or not to save in the data storage unit 48.

判定の結果、コンテンツのデータをサイトデータ記憶部48に保存すると判定した場合には(ステップS4のYES)、ステップS5にて、サイトデータ取得部45が保持しているコンテンツのデータがサイトデータ記憶部48に書き込まれ保存される。一方、判定の結果、コンテンツのデータをサイトデータ記憶部48に保存しないと判定した場合には(ステップS4のNO)、ステップS5をスキップする。
以降、ステップS6にて、制御部41がユーザーからの検索要求に対して検索結果を出力すると判断するまで、上述したステップS2〜S5の処理を繰り返し行う。
As a result of the determination, if it is determined that the content data is to be stored in the site data storage unit 48 (YES in step S4), the content data held by the site data acquisition unit 45 is stored in the site data storage in step S5. It is written and stored in the unit 48. On the other hand, as a result of the determination, if it is determined that the content data is not stored in the site data storage unit 48 (NO in step S4), step S5 is skipped.
Thereafter, in step S6, the above-described steps S2 to S5 are repeated until the control unit 41 determines that the search result is output in response to the search request from the user.

ステップS6にて、制御部41がユーザーからの検索要求に対して検索結果を出力すると判断した場合には(ステップS6のYES)、ステップS7にて、結果処理部49は結果処理を行う。この結果処理では、判定処理部47の判定結果及びサイトデータ記憶部48に保存されたコンテンツのデータに基づいて、ユーザー端末PCjに応答として出力する検索結果情報が生成される。   When the control unit 41 determines in step S6 that a search result is output in response to a search request from the user (YES in step S6), the result processing unit 49 performs a result process in step S7. In this result processing, search result information to be output as a response to the user terminal PCj is generated based on the determination result of the determination processing unit 47 and the content data stored in the site data storage unit 48.

次に、ステップS8にて、結果処理部49は、ステップS7において生成した検索結果情報をユーザー端末PCjにネットワークNWを介して出力し処理を終了する。なお、本実施形態では、検索結果情報をユーザー端末PCjに出力して処理を終了するようにしているが、実際の出力までは行わずにユーザー端末PCjへの検索結果情報の出力準備の完了をもって処理を終了するようにしても良い。このようにした場合には、例えばユーザー端末PCjへの出力準備が完了した検索結果情報を所定の記憶部に記憶しておき、ユーザー側からの結果出力要求に応じて検索結果情報を提供するようにすれば良い。   Next, in step S8, the result processing unit 49 outputs the search result information generated in step S7 to the user terminal PCj via the network NW and ends the process. In the present embodiment, the search result information is output to the user terminal PCj and the processing is terminated. You may make it complete | finish a process. In this case, for example, search result information that has been prepared for output to the user terminal PCj is stored in a predetermined storage unit, and the search result information is provided in response to a result output request from the user. You can do it.

以上、説明したように本実施形態によれば、ネットワーク上のサイトで公開されている情報を検索する際、従来のようにあらかじめ収集し蓄積された情報に基づいて検索を行うのではなく、ユーザー側から検索要求がなされ、情報登録部42が当該検索要求に係る検索対象情報等を登録記憶した後に、ネットワーク上のサイトで公開されている情報をサイトデータ取得部45により収集して情報の検索を行う。   As described above, according to the present embodiment, when searching for information published on a site on a network, a search is not performed based on information collected and accumulated in advance as in the past, but a user is searched. After the search request is made from the side and the information registration unit 42 registers and stores the search target information related to the search request, the information published on the site on the network is collected by the site data acquisition unit 45 to search for information I do.

この情報の検索では、まず現在、サイトで公開されている情報をサイトデータ取得部45が収集し検索サーバーSS内のRAM23に一時記憶する。そして、判定処理部47が、情報登録部42に登録記憶した検索対象情報等を基に、RAM23に一時記憶された情報を外部記憶装置24により構成されるサイトデータ記憶部48に保存するか否かを判定する。判定の結果、RAM23に一時記憶された情報が検索対象情報により指定される検索条件を満足する場合には、RAM23に一時記憶された情報が外部記憶装置24であるサイトデータ記憶部48に書き込まれ、そうでない場合には廃棄される。   In the search for this information, first, the site data acquisition unit 45 collects information currently disclosed on the site and temporarily stores it in the RAM 23 in the search server SS. Whether the determination processing unit 47 stores the information temporarily stored in the RAM 23 in the site data storage unit 48 configured by the external storage device 24 based on the search target information registered and stored in the information registration unit 42. Determine whether. As a result of the determination, when the information temporarily stored in the RAM 23 satisfies the search condition specified by the search target information, the information temporarily stored in the RAM 23 is written in the site data storage unit 48 that is the external storage device 24. Otherwise, it is discarded.

つまり、本実施形態による情報検索システムでは情報の検索を行う場合に、ユーザー側からの検索要求を受けた後にサイトで実際に公開されている情報を収集し、ユーザー側より指定され予め決まっている検索条件(キーワード等)を基に収集した情報の取捨選択を行う。この処理は、従来のように収集した情報のすべてを外部記憶装置24に記憶して行うのではなく、検索サーバーSS内のRAM23に収集した情報を展開して行い、選択した情報のみを外部記憶装置24に書き込み保存する。   In other words, in the information search system according to the present embodiment, when searching for information, after receiving a search request from the user side, the information that is actually made public on the site is collected, specified by the user side and determined in advance. Select information collected based on search conditions (keywords, etc.). This processing is not performed by storing all of the collected information in the external storage device 24 as in the prior art, but is performed by expanding the collected information in the RAM 23 in the search server SS and storing only the selected information in the external storage. Write to the device 24 and save.

これにより、検索要求時にネットワーク上のサイトで実際に公開されている情報を検索することができるとともに、検索サーバーSS内のCPU21及びRAM23を用いて検索に係る実際の処理が実行されるので高速に検索処理を行うことができる。したがって、ネットワーク上で公開されている情報をリアルタイムに検索でき、検索結果として最新の情報に基づく最適な情報を提供することができる。
また、検索対象情報や判定処理部47での判定結果などに基づいて、学習機能を有する最適化処理部46により公開されている情報を取得するサイトの巡回順序や巡回範囲を最適化して情報の検索を行うことにより、検索処理を効率良く行うことができる。
As a result, it is possible to search for information that is actually disclosed on a site on the network at the time of a search request, and since the actual processing related to the search is executed using the CPU 21 and the RAM 23 in the search server SS, it is possible to search at high speed. Search processing can be performed. Therefore, information published on the network can be searched in real time, and optimum information based on the latest information can be provided as a search result.
Further, based on the search target information and the determination result in the determination processing unit 47, the traveling order and the traveling range of the site from which the information published by the optimization processing unit 46 having a learning function is optimized are optimized, and the information By performing a search, the search process can be performed efficiently.

この最適化処理では、ネットワーク上のサイトで公開されている情報を検索して得られた検索結果を基にベイズ理論を用いてキーワード分類を行い、その後の判定等に利用するようにしても良い。検索結果にかかったサイトに関しては、次回からの検索間隔調整を行いそのサイトに対して集中的に検索を行うようにしても良い。   In this optimization process, keyword classification may be performed using Bayesian theory based on search results obtained by searching information published on a site on the network, and used for subsequent determination or the like. . For a site that falls within the search result, the search interval may be adjusted from the next time, and the search may be concentrated on the site.

次に、本実施形態による情報検索システムを適用した具体的なシステムの一例として、リアルタイム検索システム及びネットパトロールシステムについて説明する。   Next, a real-time search system and a net patrol system will be described as examples of a specific system to which the information search system according to the present embodiment is applied.

(リアルタイム検索システム)
まず、リアルタイム検索システムについて説明する。以下に説明するリアルタイム検索システムは、登録された検索要求に係る検索対象情報と、ネットワーク上のサイトを巡回して得た結果(サイトで公開されている情報)とのマッチング処理をリアルタイムに行うことで、検索対象情報の登録者(検索要求を行った者)にネットワーク上のサイトで実際に公開されている最新かつ最適な情報を提供するものである。
(Real-time search system)
First, a real-time search system will be described. The real-time search system described below performs real-time matching processing between search target information related to registered search requests and results (information published on the site) obtained by visiting sites on the network. Thus, the latest and optimum information that is actually disclosed on the site on the network is provided to the registrant of the search target information (the person who made the search request).

図6は、本実施形態による情報検索システムを適用したリアルタイム検索システムの動作を示すフローチャートである。
まず、ステップS11にて、情報登録部42は、ユーザー端末PCから検索要求に係る検索対象情報を収集し、収集した検索対象情報を登録し記憶する。なお、リアルタイム検索システムが複数の検索サーバーSSで構成される場合には、図5に示した動作と同様にして全検索サーバーSSでの検索対象情報の共有化処理が行われる。
FIG. 6 is a flowchart showing the operation of the real-time search system to which the information search system according to this embodiment is applied.
First, in step S11, the information registration unit 42 collects search target information related to a search request from the user terminal PC, and registers and stores the collected search target information. When the real-time search system is configured by a plurality of search servers SS, the search target information is shared by all the search servers SS in the same manner as the operation shown in FIG.

ここで、検索対象情報の収集は、検索サーバーSS側で情報登録サイトの提供を行うことにより、図7(A)に示すような情報登録画面をユーザー端末PCの出力装置37に表示させる。そして、ユーザーが入力装置36等を用いて検索対象情報(例えば、嗜好や地域、得たい情報を特定するためのキーワード等)を入力し、さらに検索サーバーSSが情報登録サイトを巡回して入力された検索対象情報を収集することにより行われる。なお、ユーザー端末PCから検索対象情報を検索サーバーSSに送信するようにしても良い。また、例えばあるユーザーに対する情報登録サイトを他のユーザーにも閲覧可能にする場合には、検索対象情報を公開しても良い公開情報とそうでない非公開情報とに分け、検索サーバーSSは、公開情報については自ら収集し、非公開情報についてはユーザー端末PCからの送信を受けるようにしても良い。   Here, the search target information is collected by providing an information registration site on the search server SS side to display an information registration screen as shown in FIG. 7A on the output device 37 of the user terminal PC. Then, the user inputs search object information (for example, a preference, a region, a keyword for specifying information to be obtained, etc.) using the input device 36 or the like, and the search server SS circulates and enters the information registration site. This is done by collecting the search target information. The search target information may be transmitted from the user terminal PC to the search server SS. Further, for example, when making it possible for other users to browse an information registration site for a certain user, the search server SS can divide the search target information into public information that may be disclosed and private information that is not. Information may be collected by itself, and non-public information may be transmitted from the user terminal PC.

次に、ステップS12にて、サイトデータ取得部45は、最適化処理部46により最適化された巡回順序や巡回範囲に従ってネットワークNW上のサイトにアクセスしてコンテンツのデータを収集し保持する。これにより、ネットワークNW上のサイトで公開されている情報が取得され、検索サーバーSS内のRAM23に記憶され保持される。   Next, in step S12, the site data acquisition unit 45 accesses the site on the network NW according to the cyclic order and the cyclic range optimized by the optimization processing unit 46, and collects and holds content data. As a result, information published on the site on the network NW is acquired, and stored and held in the RAM 23 in the search server SS.

続いて、ステップS13にて、判定処理部47は、ステップS11において登録された検索対象情報により指定される検索条件と、ステップS12においてネットワークNW上のサイトから取得し保持したコンテンツのデータとのマッチング処理(照合)を行う。
その結果、検索対象情報により指定される検索条件とサイトから取得し保持したコンテンツのデータとが所定の条件(例えば、一致の度合が所定以上)を満足しない場合には、当該コンテンツのデータを廃棄すると判定し(ステップS14のNO)、上述したステップS12に戻る。
Subsequently, in step S13, the determination processing unit 47 matches the search condition specified by the search target information registered in step S11 with the content data acquired and held from the site on the network NW in step S12. Perform processing (collation).
As a result, if the search condition specified by the search target information and the content data acquired and held from the site do not satisfy a predetermined condition (for example, the degree of matching is not less than a predetermined level), the content data is discarded. Then, it determines (NO of step S14) and returns to step S12 mentioned above.

一方、ステップS13でのマッチング処理の結果、検索対象情報により指定される検索条件とサイトから取得し保持したコンテンツのデータとが所定の条件を満たす場合には、当該コンテンツのデータをサイトデータ記憶部48に保存すると判定し(ステップS14のYES)、ステップS15にて、サイトデータ取得部45が保持しているコンテンツのデータがサイトデータ記憶部48に書き込まれ保存される。   On the other hand, as a result of the matching process in step S13, if the search condition specified by the search target information and the content data acquired and held from the site satisfy a predetermined condition, the content data is stored in the site data storage unit. In step S15, the content data stored in the site data acquisition unit 45 is written and stored in the site data storage unit 48.

このようにして、サイトから取得しサイトデータ取得部45に保持しているコンテンツのデータがサイトデータ記憶部48に記憶されると、ステップS16にて、結果処理部49は、判定処理部47の判定結果及びサイトデータ記憶部48に保存されたコンテンツのデータに基づいて、ユーザーに提供する検索結果情報を生成する。   In this way, when the content data acquired from the site and stored in the site data acquisition unit 45 is stored in the site data storage unit 48, the result processing unit 49 of the determination processing unit 47 in step S16. Based on the determination result and content data stored in the site data storage unit 48, search result information to be provided to the user is generated.

そして、ステップS17にて、結果処理部49は、ステップS16において生成した検索結果情報をユーザー端末PCにネットワークNWを介して出力することで、検索結果をユーザーに通知する。検索結果としてユーザーに通知される情報には、情報が公開されているサイトのURL、そのコンテンツのデータ、及びサイトの発見日時等がある。
ここで、検索結果のユーザーへの通知は、任意の通知方法が適用でき、例えば図7(B)に示すようにユーザー端末PCにて表示している画面上に検索結果を示す画像71をポップアップ表示させるようにしても良い。また、電子メールや電子メッセージ等により検索結果をユーザーに通知するようにしても良い。
In step S17, the result processing unit 49 notifies the user of the search result by outputting the search result information generated in step S16 to the user terminal PC via the network NW. The information notified to the user as a search result includes the URL of the site where the information is disclosed, the data of the content, the date of discovery of the site, and the like.
Here, any notification method can be applied to notify the search result to the user. For example, as shown in FIG. 7B, an image 71 showing the search result is popped up on the screen displayed on the user terminal PC. You may make it display. Further, the user may be notified of the search result by e-mail, electronic message or the like.

以上のようにして、本実施形態による情報検索システムを適用し、登録されたユーザー側からの検索対象情報と、ネットワーク上のサイトを自動的に巡回して得たサイトで公開されている情報とのマッチング処理をリアルタイムに行うことで、ネットワーク上のサイトで実際に公開されている情報の検索を高速に行い、検索対象情報の登録者に対して最新かつ最適な情報を提供することができる。   As described above, by applying the information search system according to the present embodiment, the search target information from the registered user side, and the information published on the site obtained by automatically visiting the site on the network, By performing the matching process in real time, it is possible to search for information that is actually disclosed on the site on the network at high speed, and to provide the latest and optimum information to the registrant of the search target information.

また、上述したリアルタイム検索システムにおいて、需要情報と供給情報とのマッチング処理、すなわち検索対象情報との間に需給関係が成立するような公開されている情報の検索を行うようにしても良い。ここで、需要情報と供給情報には、募集・応募情報や、売買情報等がある。例えば、検索対象情報として募集情報を登録した場合には、その募集情報に合った(マッチする)求人情報を検索・収集する。また、例えば、検索対象情報として求人情報を登録した場合には、その求人情報に合った募集情報を検索・収集する。このとき、例えば、「名前」、「なまえ」、「氏名」等のように同様の項目であってもサイトに応じて項目名が異なる場合もあるので、呼び方の異なる同一項目についてはグルーピング(グループ化)を行い、同一用語(例えば、上述した例ではすべて「氏名」)として取り扱う類義語統一処理を必要に応じて適宜行うことが望ましい。   Further, in the above-described real-time search system, matching processing between demand information and supply information, that is, search for public information that establishes a supply-demand relationship between search target information may be performed. Here, the demand information and the supply information include recruitment / application information, sales information, and the like. For example, when recruitment information is registered as search target information, job information that matches (matches) the recruitment information is retrieved and collected. Further, for example, when job posting information is registered as search target information, recruitment information that matches the job posting information is searched and collected. At this time, even for similar items such as “name”, “name”, “name”, etc., the item names may differ depending on the site. It is desirable to perform synonym unification processing that is handled as the same term (for example, all “names” in the above-described example) as necessary.

(ネットパトロールシステム)
次に、ネットパトロールシステムについて説明する。以下に説明するネットパトロールシステムは、ネットワークNW上のサイトで公開されている情報をリアルタイムに検索可能な本実施形態による情報検索システムを用い、ネットワークNW(例えば、インターネット)上のサイトを自動巡回して点在する不正なコンテンツをリアルタイムに検索及び追跡し、その結果をユーザー側に適宜提供するものである。例えば、ネットワークNW上のオークションサイトへの不正出展や個人サイトでの著作権画像・映像利用による著作権侵害等、ユーザーにとって不利益となるサイト(コンテンツ)を監視するシステムに用いて好適なものである。
(Net patrol system)
Next, the net patrol system will be described. The net patrol system described below uses the information search system according to the present embodiment capable of searching information published on a site on the network NW in real time, and automatically patrols the site on the network NW (for example, the Internet). In order to search and track unauthorized content scattered in real time, the results are provided to the user as appropriate. For example, it is suitable for use in a system for monitoring sites (contents) that are disadvantageous to the user, such as illegal exhibition at an auction site on the network NW and copyright infringement by using copyright images / videos on personal sites. is there.

なお、本実施形態による情報検索システムを適用したネットパトロールシステムにおけるシステムサーバーSSのハードウェア構成は、図2に示した検索サーバーSSと同様であるので説明は省略する。   Note that the hardware configuration of the system server SS in the net patrol system to which the information search system according to the present embodiment is applied is the same as that of the search server SS shown in FIG.

図8は、本実施形態による情報検索システムを適用したネットパトロールシステムにおけるシステムサーバーSSの機能的な構成を示す機能ブロック図である。この図8において、図4に示したブロック等と同一の機能を有するブロック等には同一の符号を付し、重複する説明は省略する。なお、機能は同一ではないが、図8に示す危険度判定処理部81は図4に示した判定処理部47に対応するものである。また、図8に示すサイトデータ記憶部83及び結果処理部86は、図4に示したサイトデータ記憶部48及び結果処理部49にそれぞれ対応するものである。   FIG. 8 is a functional block diagram showing a functional configuration of the system server SS in the net patrol system to which the information search system according to the present embodiment is applied. In FIG. 8, blocks having the same functions as those shown in FIG. 4 are denoted by the same reference numerals, and redundant description is omitted. Although the functions are not the same, the risk determination processing unit 81 shown in FIG. 8 corresponds to the determination processing unit 47 shown in FIG. Further, the site data storage unit 83 and the result processing unit 86 shown in FIG. 8 respectively correspond to the site data storage unit 48 and the result processing unit 49 shown in FIG.

危険度判定処理部81は、判定条件記憶部82を有し、登録情報記憶部44に記憶された検索対象情報と、サイトデータ取得部45がネットワークNW上のサイトを自動的に巡回することにより取得し一時保持している情報とに基づいて、この一時保持している情報を公開しているサイトの危険度を判定する。   The risk determination processing unit 81 includes a determination condition storage unit 82, and the search target information stored in the registration information storage unit 44 and the site data acquisition unit 45 circulates a site on the network NW automatically. Based on the acquired and temporarily stored information, the risk level of the site that publishes the temporarily stored information is determined.

具体的には、危険度判定処理部81は、検索対象情報とサイトデータ取得部45が一時保持している情報とから、一時保持している情報を公開しているサイトの危険度を求める。さらに、危険度判定処理部81は、求めたサイトの危険度が、判定条件記憶部82に判定条件として予め設定された所定範囲内であるか否かを判定することで、当該サイトが危険であるか否かを判定する。なお、危険度の判定は、ある1つの閾値を設定すること等により二者択一的に危険であるか否かのみを判定するようにしても良いし、複数の異なる閾値を設定すること等によりどの程度危険であるのか危険度を複数にランク分けして判定するようにしても良い。   Specifically, the degree-of-risk determination processing unit 81 obtains the degree of risk of the site that publishes the temporarily held information from the search target information and the information temporarily held by the site data acquisition unit 45. Further, the risk level determination processing unit 81 determines whether or not the calculated site risk level is within a predetermined range set in advance as a determination condition in the determination condition storage unit 82. It is determined whether or not there is. The determination of the degree of risk may be made by determining whether or not it is dangerous alternatively by setting a certain threshold value, or setting a plurality of different threshold values, etc. Therefore, the degree of danger may be determined by ranking the risk into a plurality of ranks.

サイトデータ記憶部83は、図2に示した外部記憶装置24を用いて構成され、監視対象データベース(監視対象DB)84を有する。
監視対象DB84は、危険度判定処理部81により危険と判定されたサイトの監視対象データ(サイトデータ取得部45が一時保持していた当該サイトで公開されているコンテンツのHTMLデータならびに各種ファイル、及び当該サイトに係るURLならびに発見日時等のサイト情報)を格納するデータベースである。監視対象DB84に格納される監視対象データには、例えば、サイトのURL、タイトル、HTMLデータ及び各種ファイルを含むコンテンツデータ、オーナー、発見日時、危険度、警告を行った場合にはその日時、ステータス、ページの存在するか否か、キーワード、及び調査対象物などの情報が含まれる。
The site data storage unit 83 is configured using the external storage device 24 illustrated in FIG. 2 and includes a monitoring target database (monitoring target DB) 84.
The monitoring target DB 84 includes monitoring target data of sites determined to be dangerous by the risk determination processing unit 81 (HTML data and various files of content published on the site temporarily held by the site data acquisition unit 45, and This is a database for storing URLs related to the site and site information such as discovery date and time. The monitoring target data stored in the monitoring target DB 84 includes, for example, content data including the URL, title, HTML data and various files of the site, owner, discovery date / time, risk level, date / time, status , Whether or not a page exists, a keyword, and information such as a survey object are included.

結果処理部86は、警告処理部87及び結果情報出力部88を有し、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とに基づいて、所定の結果処理を行う。   The result processing unit 86 includes a warning processing unit 87 and a result information output unit 88, and is based on the determination result in the risk determination processing unit 81 and information published on the site stored in the site data storage unit 83. Then, predetermined result processing is performed.

警告処理部87は、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とを基に、危険なサイトに対して警告通知を行う。例えば、警告処理部87は、危険度判定処理部81にて危険であると判定されたサイトを構成する、サイトデータ記憶部83に記憶されたコンテンツのデータ等から当該サイトの管理者などのメールアドレスを抽出し、抽出したメールアドレス宛に警告メールを送信する。なお、警告処理部87により危険なサイトに対して警告通知を行うか否かは、ネットパトロールシステムのオペレーターや監視を依頼したユーザーがサイト単位で任意に設定可能である。   The warning processing unit 87 issues a warning notification to the dangerous site based on the determination result in the risk determination processing unit 81 and the information published on the site stored in the site data storage unit 83. For example, the warning processor 87 configures a site determined to be dangerous by the risk determination processor 81, and the mail of the administrator of the site or the like from the content data stored in the site data storage unit 83. The address is extracted, and a warning mail is sent to the extracted mail address. Whether or not to issue a warning notification to a dangerous site by the warning processing unit 87 can be arbitrarily set for each site by an operator of the net patrol system or a user who requests monitoring.

結果情報出力部88は、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とを基に検索結果情報を生成し、生成した検索結果情報をユーザー側に提供する。この検索結果情報には、危険度判定処理部81にて危険であると判定されたサイトの監視対象データの情報が含まれる。また、検索結果情報には、危険であると判定されたサイトのステータス(状態)、危険なサイトに対して警告通知を行っている場合にはその通知に対する応答の有無等の情報を含んでも良い。   The result information output unit 88 generates search result information based on the determination result in the risk determination processing unit 81 and information published on the site stored in the site data storage unit 83, and the generated search result information To the user. The search result information includes information on the monitoring target data of the site determined to be dangerous by the risk determination processing unit 81. Further, the search result information may include information such as the status (state) of the site determined to be dangerous, and the presence or absence of a response to the notification when a warning notification is given to the dangerous site. .

次に、ネットパトロールシステムの動作について説明する。
図9は、ネットパトロールシステムにおける検索処理の動作を示すフローチャートである。
Next, the operation of the net patrol system will be described.
FIG. 9 is a flowchart showing the search processing operation in the net patrol system.

まず、ステップS21にて、情報登録部42は、ユーザー端末PC(監視を依頼するユーザー側)からの検索要求に係る検索対象情報を得て、この得られた検索対象情報を登録し記憶する。なお、複数のシステムサーバーSSを有する場合には、さらに登録する検索対象情報をシステムサーバーSS間で送受信し、全システムサーバーSSにて検索対象情報を共有化する。   First, in step S21, the information registration unit 42 obtains search target information related to a search request from the user terminal PC (the user who requests monitoring), and registers and stores the obtained search target information. When a plurality of system servers SS are provided, search target information to be registered is transmitted and received between the system servers SS, and the search target information is shared by all the system servers SS.

ここで、例えば検索対象情報には、キーワード、監視サイト(情報の収集・取得を行う対象として予め設定するサイト)、検索対象ファイル設定、警告通知送信元メールアドレス、送信サーバー設定、調査対象物、パトロール(検索)開始日、危険度判定条件などが含まれる。なお、これに限定されるものではなく、検索対象情報の項目及び内容については任意である。   Here, for example, the search target information includes a keyword, a monitoring site (a site set in advance as a target for collecting and acquiring information), a search target file setting, a warning notification sender email address, a transmission server setting, a survey target, This includes the patrol (search) start date, risk judgment conditions, and the like. Note that the present invention is not limited to this, and the items and contents of the search target information are arbitrary.

また、検索対象情報に含まれるキーワードは、複数の種類に分けても良い。本例では、キーワードを、違法な言葉を表す(違法なものを想起させる)キーワードとして「デフォルトキーワード」、対象物ごとのキーワードとして「対象物のキーワード」、対象物のジャンルごとに設定可能なキーワードとして「サブキーワード」、及び状態を表すキーワードとして「カテゴリキーワード」の4種類に分ける。このようにキーワードを複数種類に分けた場合には、キーワードの種類ごとに重み付けを行って後述する危険度判定処理を行うようにしても良い。   Moreover, the keywords included in the search target information may be divided into a plurality of types. In this example, the keyword is “default keyword” as a keyword representing illegal words (recalling illegal things), “target keyword” as a keyword for each target object, and keyword that can be set for each genre of target object Are divided into four types: “sub-keywords” and “category keywords” as status keywords. When the keywords are divided into a plurality of types as described above, the risk determination processing described later may be performed by weighting each keyword type.

次に、ステップS22にて、サイトデータ取得部45は、ネットワークNW上のサイトにアクセスし、サイトを構成するコンテンツのデータを収集して保持する。これにより、ネットワーク上のあるサイトで公開されている情報が取得され、システムサーバーSS内のRAM23に記憶され保持される。ここで、ネットパトロールシステムにおけるサイトで公開されている情報の取得方法には、検索対象情報の監視サイトにより予め設定されたサイトから情報を随時取得する第1の方法と、最適化処理部46により最適化された巡回順序や巡回範囲に従ってネットワークNW上のサイトを自動的に巡回して情報を取得する第2の方法がある。第1の方法と第2の方法とは適宜時間的に切り換えたり、又は複数のシステムサーバーSSにより並行して実行したりするようにすれば良い。   Next, in step S22, the site data acquisition unit 45 accesses a site on the network NW and collects and holds data of contents constituting the site. As a result, information published at a site on the network is acquired, and stored and held in the RAM 23 in the system server SS. Here, as a method for acquiring information published on the site in the net patrol system, the first method for acquiring information from a site preset in advance by the monitoring site of the search target information and the optimization processing unit 46 There is a second method in which information is acquired by automatically visiting sites on the network NW according to an optimized tour order and tour range. The first method and the second method may be appropriately switched over time, or may be executed in parallel by a plurality of system servers SS.

続いて、ステップS23にて、危険度判定処理部81は、ステップS11において登録された検索対象情報と、ステップS2においてサイトデータ取得部45に保持したサイトのコンテンツのデータに基づいて、当該サイトの危険度を求める。さらに、危険度判定処理部81は、求めたサイトの危険度と、検索対象情報の危険度判定条件として入力され判定条件記憶部82に設定された判定条件とを比較し、当該サイトの危険度を判定する。   Subsequently, in step S23, the risk determination processing unit 81, based on the search target information registered in step S11 and the content data of the site held in the site data acquisition unit 45 in step S2, Find the risk. Further, the risk level determination processing unit 81 compares the calculated risk level of the site with the determination condition input as the risk level determination condition of the search target information and set in the determination condition storage unit 82, and the risk level of the site. Determine.

その判定の結果、サイトデータ取得部45にコンテンツのデータが保持されているサイトが危険であると判定された場合には(ステップS24のYES)、ステップS25にて、サイトデータ取得部45が保持しているコンテンツのデータを含む監視対象データがサイトデータ記憶部83の監視対象DB84に格納される。   As a result of the determination, if it is determined that the site where the content data is stored in the site data acquisition unit 45 is dangerous (YES in step S24), the site data acquisition unit 45 stores it in step S25. Monitoring target data including the content data being stored is stored in the monitoring target DB 84 of the site data storage unit 83.

一方、ステップS23での危険度判定処理の結果、危険なサイトではないと判定された場合には(ステップS24のNO)、サイトデータ取得部45に保持しているデータを廃棄しステップS22に戻る。
なお、上述した危険度の判定は、サイトを構成するコンテンツ単位で行うようにしても良いし、リンクされた複数のコンテンツを1つの単位として行うようにしても良い。
On the other hand, as a result of the risk determination process in step S23, if it is determined that the site is not a dangerous site (NO in step S24), the data held in the site data acquisition unit 45 is discarded and the process returns to step S22. .
Note that the above-described risk determination may be performed in units of content constituting the site, or a plurality of linked contents may be performed as one unit.

次に、ステップS26にて、制御部41は、監視を依頼したユーザーからの結果出力要求があるか否かを確認し、ユーザーからの結果出力要求があった場合にはステップS27に進み、要求がない場合にはステップS22に戻る。
ステップS27にて、結果情報出力部88は、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とを基に検索結果に係る集計処理を行い、検索結果情報を生成する。そして、ステップS28にて、結果情報出力部88は、ステップS27において生成した検索結果情報をユーザー側に出力提供し、ステップS22に戻る。
Next, in step S26, the control unit 41 confirms whether or not there is a result output request from the user who has requested monitoring, and if there is a result output request from the user, the process proceeds to step S27. If there is no, the process returns to step S22.
In step S27, the result information output unit 88 performs an aggregation process related to the search result based on the determination result in the risk determination processing unit 81 and the information published on the site stored in the site data storage unit 83. To generate search result information. In step S28, the result information output unit 88 provides the search result information generated in step S27 to the user and returns to step S22.

このシステムサーバーSS内の結果情報出力部88が出力した検索結果情報を受けたユーザー側では、検索結果情報をユーザー端末PCが備える出力装置37の画面上に表示することで検索・監視結果が確認できる。なお、システムサーバーSSから出力される検索結果情報によりユーザー端末PCの出力装置37にて表示可能な検索結果の表示形態には、例えば危険であると判定したサイト(ページ)の一覧表示、その各サイト(ページ)の詳細表示、また表示する情報の項目を絞り込んだ絞り込み表示等がある。   On the user side that has received the search result information output from the result information output unit 88 in the system server SS, the search / monitoring result is confirmed by displaying the search result information on the screen of the output device 37 provided in the user terminal PC. it can. The search result display form that can be displayed on the output device 37 of the user terminal PC based on the search result information output from the system server SS includes, for example, a list display of sites (pages) determined to be dangerous, There are detailed display of the site (page), narrowed display that narrows down the items of information to be displayed, and the like.

図10は、ネットパトロールシステムにおける監視処理の動作を示すフローチャートである。この監視処理は、危険度判定処理部81にてサイトが危険であると判定され、当該サイトに係る監視対象データがサイトデータ記憶部83内の監視対象DB84に格納された後に実行される処理であり、随時継続して実行されている。   FIG. 10 is a flowchart showing the operation of the monitoring process in the net patrol system. This monitoring process is a process that is executed after the risk determination processing unit 81 determines that the site is dangerous and the monitoring target data related to the site is stored in the monitoring target DB 84 in the site data storage unit 83. Yes, it is continuously executed from time to time.

まず、ステップS31にて、制御部41は、危険度判定処理部81での判定結果等に基づいて、危険度判定処理部81にて危険であると判定したサイトに対して警告メールを送信するか否かを判断する。
その結果、制御部41にて警告メールを送信すると判断された場合には、ステップS32にて、警告処理部87は、サイトデータ記憶部83に記憶された危険なサイトのコンテンツのデータ等から当該サイトの管理者などのメールアドレスを抽出する。そして、警告処理部87は、抽出したメールアドレス宛に警告メールを送信する。
First, in step S <b> 31, the control unit 41 transmits a warning mail to a site determined to be dangerous by the risk determination processing unit 81 based on the determination result in the risk determination processing unit 81. Determine whether or not.
As a result, if it is determined by the control unit 41 that a warning mail is to be transmitted, the warning processing unit 87 in step S32 determines the relevant data from the dangerous site content data stored in the site data storage unit 83. Extract the email address of the site administrator. Then, the warning processing unit 87 transmits a warning mail to the extracted mail address.

続いて、ステップS33にて、警告処理部87は、ステップS32において送信した警告メールに対する返信メールがあったか否か判断し、返信メールがあった場合には、ステップS34にてサイトの監視ステータスを変更し、ステップS35にて、監視を依頼したユーザーにその返信メールを転送する。ここで、監視ステータスは、危険である判定されたサイトに対する対応状況を示す情報であり、例えば「警告対応済み」、「警告中」、「未対応」などがある。この監視ステータスは、ユーザー側での処理及びサイト側での処理に応じて遷移する。
一方、ステップS33での判断の結果、返信メールがなかった場合には、ステップS34、S35をスキップする。
Subsequently, in step S33, the warning processing unit 87 determines whether or not there is a reply mail to the warning mail transmitted in step S32. If there is a reply mail, the site monitoring status is changed in step S34. In step S35, the reply mail is transferred to the user who has requested monitoring. Here, the monitoring status is information indicating a response status to the site determined to be dangerous, and includes, for example, “already warned”, “warning”, “not yet supported”, and the like. This monitoring status changes according to the process on the user side and the process on the site side.
On the other hand, if the result of determination in step S33 is that there is no reply mail, steps S34 and S35 are skipped.

以上のようにして、本実施形態による情報検索システムを用いて、登録された検索対象情報とネットワークNW上のサイトで公開されている情報とを基に危険度の判定をリアルタイムに行うことで、ネットワークNW上に存在する不正なコンテンツの検索を高速に行い、その結果をユーザー側に提供できるとともに、監視対象とすべき危険なサイトを容易に検出し追跡することができる。例えば、更新頻度が高く、短期間で情報の更新が行われるため、従来の情報検索システムでは発見したときにはほとんど手遅れで対応することが困難であったオークションサイトへの不正出展等についても、本実施形態による情報検索システムを適用したネットパトロールシステムではリアルタイムで検索するので、即時に発見し十分に対応することが可能になる。   As described above, by using the information search system according to the present embodiment, the risk determination is performed in real time based on the registered search target information and the information published on the site on the network NW. It is possible to search for illegal contents existing on the network NW at high speed and provide the result to the user side, and to easily detect and track a dangerous site to be monitored. For example, because of frequent updates, information is updated in a short period of time, and this is also implemented for illegal exhibitions at auction sites that were difficult to deal with when it was discovered by conventional information retrieval systems. Since the net patrol system to which the information search system according to the form is applied, the search is performed in real time.

また、危険であると判断したサイトに対して警告を通知することにより当該サイトの管理者側に改善を促すことができる。例えば、オークションサイトへの不正出展や個人サイトでの著作権画像・映像利用による著作権侵害等に対しては、その情報(データ)の削除等の対処を促すことができる。   In addition, by notifying a warning to a site determined to be dangerous, the administrator of the site can be urged to improve. For example, for illegal exhibition on an auction site or copyright infringement due to the use of copyright images / videos on a personal site, it is possible to prompt the user to take measures such as deleting the information (data).

(本発明の他の実施形態)
なお、コンピュータが上述した実施形態の機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって、上述の実施形態の機能が実現される場合も、かかるプログラムを記録した記録媒体は本発明の実施形態に含まれる。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。また、一部のプログラムが他のコンピュータで実行されるようになっていても良い。
(Other embodiments of the present invention)
When the function of the above-described embodiment is realized by recording a program that causes the computer to perform the function of the above-described embodiment on a recording medium such as a CD-ROM and causing the computer to read the program. In addition, a recording medium on which such a program is recorded is included in the embodiment of the present invention. As a recording medium for recording the program, a flexible disk, a hard disk, a magnetic tape, a magneto-optical disk, a nonvolatile memory card, and the like can be used in addition to the CD-ROM.
In addition, the functions of the above-described embodiments are realized by executing a program supplied by a computer, and the program is used in cooperation with an OS (operating system) or other application software running on the computer. When the functions of the above-described embodiment are realized, or when all or part of the processing of the supplied program is performed by a function expansion board or a function expansion unit of the computer, the function of the above-described embodiment is realized. Such a program is included in the embodiment of the present invention. Also, some programs may be executed on other computers.

なお、上記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。   The above-described embodiments are merely examples of implementation in carrying out the present invention, and the technical scope of the present invention should not be construed as being limited thereto. That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.

SS サーバー
PC ユーザー端末
WSA、WSB ウェブサーバー
NW ネットワーク
21 CPU
22 ROM
23 RAM
24 外部記憶装置
25 ネットワークインタフェース
41 制御部
42 情報登録部
43 登録情報設定部
44 登録情報記憶部
45 サイトデータ取得部
46 最適化処理部
47 判定処理部
48 サイトデータ記憶部
49 結果処理部
50 情報交換処理部
SS server PC user terminal WSA, WSB Web server NW network 21 CPU
22 ROM
23 RAM
24 external storage device 25 network interface 41 control unit 42 information registration unit 43 registration information setting unit 44 registration information storage unit 45 site data acquisition unit 46 optimization processing unit 47 determination processing unit 48 site data storage unit 49 result processing unit 50 information exchange Processing part

Claims (10)

情報の検索要求を基に、ネットワーク上で公開されている情報を検索する情報検索システムであって、
情報検索要求に係る検索対象情報を登録し記憶する情報登録手段と、
上記情報検索要求に応じて、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に一時的に保持する取得手段と、
上記検索要求に係る検索対象情報により指定される検索条件のキーワードと上記半導体記憶装置に一時的に保持した情報の一致数に基づいて、当該情報を磁気記憶装置に記憶するか否かを判定する判定手段と、
上記判定手段での該一致数が所定数以上だと判定した結果に応じて、上記半導体記憶装置に一時的に保持している情報を磁気記憶装置に記憶する記憶手段と、
上記記憶手段に記憶された上記磁気記憶装置に記憶している情報に基づいて、上記検索要求に係る検索結果を出力する出力手段と、を備えることを特徴とする情報検索システム。
An information search system for searching information published on a network based on an information search request,
Information registration means for registering and storing search target information related to an information search request;
In response to the information search request, acquisition means for acquiring information published on the site on the network and temporarily holding it in the semiconductor storage device;
Whether to store the information in the magnetic storage device is determined based on the number of matches between the search condition keyword specified by the search target information related to the search request and the information temporarily held in the semiconductor storage device. A determination means;
Storage means for storing information temporarily held in the semiconductor storage device in the magnetic storage device according to a result of determining that the number of matches in the determination means is a predetermined number or more;
An information search system comprising: output means for outputting a search result related to the search request based on information stored in the magnetic storage device stored in the storage means.
上記判定手段での判定結果又は上記検索対象情報に基づいて、上記公開されている情報を取得するサイト順序を最適化する最適化手段と、を備え、
上記最適化手段は、さらに、当該サイトで公開している情報の更新頻度に応じてサイト順序を最適化することを特徴とする請求項1に記載の情報検索システム。
Optimization means for optimizing the site order for obtaining the published information based on the determination result in the determination means or the search target information,
2. The information search system according to claim 1, wherein the optimization unit further optimizes the site order according to the update frequency of information published on the site.
上記取得手段、上記判定手段、及び上記記憶手段を有する情報検索装置を複数有し、
上記複数の情報検索装置は上記検索対象情報を共有化し、かつ上記複数の情報検索装置間で互いに異なるサイトに対して検索を行い、上記複数の情報検索装置は、検索に係る情報をピア・ツー・ピア型の通信で交換し共有化することを特徴とする請求項2記載の情報検索システム。
A plurality of information retrieval devices including the acquisition unit, the determination unit, and the storage unit;
The plurality of information search devices share the search target information and search different sites between the plurality of information search devices, and the plurality of information search devices search for information related to the search with peer-to-peer information. The information retrieval system according to claim 2, wherein the information is exchanged and shared by peer-type communication.
ネットワーク上で公開されている情報を検索する情報検索装置であって、
情報検索要求に係る検索対象情報を登録し記憶する情報登録手段と、
上記情報検索要求に応じて、上記ネットワーク上のサイトを自動的に巡回して、各サイトで公開されている情報を取得し半導体記憶装置に一時的に保持する取得手段と、
上記記憶した検索対象情報により指定される検索条件のキーワードと上記半導体記憶装置に一時的に保持した情報の一致数に基づいて、当該情報を公開しているサイトの危険度を判定する判定手段と、
上記判定の結果、サイトの危険度が所定範囲内である場合には、当該サイトのサイト情報及び上記半導体記憶装置に一時的に保持している情報を磁気記憶装置に記憶する記憶手段と、
上記記憶手段に記憶された上記磁気記憶装置に記憶している情報に基づいて、上記判定結果に係る検索結果情報を出力する出力手段と、を備えることを特徴とする情報検索装置。
An information search device for searching information published on a network,
Information registration means for registering and storing search target information related to an information search request;
In response to the information retrieval request, an acquisition unit that automatically circulates the sites on the network, acquires information published in each site, and temporarily holds the information in the semiconductor storage device;
Determining means for determining a risk level of a site that publishes the information based on the number of matches between the keyword of the search condition specified by the stored search target information and the information temporarily stored in the semiconductor memory device; ,
As a result of the determination, if the risk level of the site is within a predetermined range, storage means for storing the site information of the site and information temporarily held in the semiconductor storage device in the magnetic storage device;
An information search apparatus comprising: output means for outputting search result information related to the determination result based on information stored in the magnetic storage device stored in the storage means.
上記判定手段での判定の結果又は上記検索対象情報に基づいて、上記公開されている情報を取得するサイト順序を最適化する最適化手段と、を備え、
上記最適化手段は、さらに、当該サイトで公開している情報の更新頻度に応じてサイト順序を最適化することを特徴とする請求項4に記載の情報検索装置。
Optimization means for optimizing the site order for obtaining the published information based on the determination result in the determination means or the search target information,
5. The information search apparatus according to claim 4, wherein the optimization unit further optimizes the site order according to the update frequency of information published on the site.
上記判定の結果、上記一時的に保持する情報に基づいて、上記危険度が所定範囲内となったと判定したサイトに対して、選択的に警告通知を送信可能な警告手段をさらに備えることを特徴とする請求項5記載の情報検索装置。   As a result of the determination, it further comprises warning means capable of selectively transmitting a warning notification to a site determined that the degree of risk is within a predetermined range based on the information held temporarily. The information search device according to claim 5. 上記警告手段が警告通知したことに応じて、上記警告通知に対する返信があったか否かを判断し、上記返信があった場合には、上記サイトの上記サイト情報に含まれる警告ステータスを変更する請求項6に記載の情報検索装置。   A determination is made as to whether or not there has been a reply to the warning notice in response to the warning notice from the warning means, and if there is a reply, the warning status included in the site information of the site is changed. 6. The information search device according to 6. ネットワーク上で公開されている情報を検索する情報検索方法であって、
情報検索要求に係る検索対象情報を登録し記憶する情報登録工程と、
上記情報検索要求に応じて、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に一時的に保持する取得工程と、
上記情報登録工程にて記憶した検索対象情報により指定される検索条件のキーワードと上記半導体記憶装置に一時的に保持した情報の一致数に基づいて、当該情報を保存するか否かを判定する判定工程と、
上記判定の結果に応じて、上記半導体記憶装置に一時的に保持している情報を磁気記憶装置に記憶する記憶工程と、
上記記憶工程にて記憶された上記磁気記憶装置に記憶している情報に基づいて、上記検索要求に係る検索結果を出力する出力工程と、を備えることを特徴とする情報検索方法。
An information search method for searching information published on a network,
An information registration step of registering and storing search target information related to the information search request;
In response to the information search request, an acquisition step of acquiring information published on a site on the network and temporarily holding it in a semiconductor storage device;
Determining whether to save the information based on the number of matches between the search condition keyword specified by the search target information stored in the information registration step and the information temporarily stored in the semiconductor memory device Process,
A storage step of storing information temporarily held in the semiconductor storage device in the magnetic storage device according to the result of the determination;
An output step of outputting a search result related to the search request based on the information stored in the magnetic storage device stored in the storage step.
上記判定工程での判定の結果又は上記検索対象情報に基づいて、上記公開されている情報を取得するサイト順序を最適化する最適化工程と、を備え、
上記最適化工程は、さらに、当該サイトで公開している情報の更新頻度に応じてサイト順序を最適化する、ことを特徴とする請求項8に記載の情報検索方法。
An optimization step of optimizing the site order for acquiring the published information based on the determination result in the determination step or the search target information,
9. The information search method according to claim 8, wherein the optimization step further optimizes the site order according to the update frequency of information published on the site.
ネットワーク上で公開されている情報の検索処理を行うためのプログラムであって、
情報検索要求に係る検索対象情報を登録し記憶する情報登録ステップと、
上記情報検索要求に応じて、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に一時的に保持する取得ステップと、
上記情報登録ステップにて記憶した検索対象情報により指定される検索条件のキーワードと上記半導体記憶装置に一時的に保持した情報の一致数に基づいて、当該情報を磁気記憶装置に記憶するか否かを判定する判定ステップと、
上記判定ステップでの結果に応じて、上記半導体記憶装置に一時的に保持している情報を磁気記憶装置に記憶する記憶ステップと、
上記記憶ステップにて記憶された上記磁気記憶装置に記憶している情報に基づいて、上記検索要求に係る検索結果を出力する出力ステップと、をコンピュータに実行させるためのプログラム。
A program for searching information published on the network,
An information registration step of registering and storing search target information related to the information search request;
In response to the information search request, an acquisition step of acquiring information published on a site on the network and temporarily holding it in a semiconductor storage device;
Whether to store the information in the magnetic storage device based on the number of matches between the search condition keyword specified by the search target information stored in the information registration step and the information temporarily held in the semiconductor storage device A determination step for determining
A storage step of storing information temporarily held in the semiconductor storage device in the magnetic storage device according to a result in the determination step;
A program for causing a computer to execute an output step of outputting a search result related to the search request based on the information stored in the magnetic storage device stored in the storage step.
JP2011015693A 2011-01-27 2011-01-27 Information search system for automatically searching information on network, information search device, information search method, recording medium and program Pending JP2011129146A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011015693A JP2011129146A (en) 2011-01-27 2011-01-27 Information search system for automatically searching information on network, information search device, information search method, recording medium and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011015693A JP2011129146A (en) 2011-01-27 2011-01-27 Information search system for automatically searching information on network, information search device, information search method, recording medium and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005197510A Division JP4741301B2 (en) 2005-07-06 2005-07-06 Information search system, information search device, information search method, recording medium, and program

Publications (1)

Publication Number Publication Date
JP2011129146A true JP2011129146A (en) 2011-06-30

Family

ID=44291590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011015693A Pending JP2011129146A (en) 2011-01-27 2011-01-27 Information search system for automatically searching information on network, information search device, information search method, recording medium and program

Country Status (1)

Country Link
JP (1) JP2011129146A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035990A (en) * 2014-06-09 2014-09-10 宁波公众信息产业有限公司 Electronic shop searching system
CN105224692A (en) * 2015-11-03 2016-01-06 武汉烽火网络有限责任公司 Support the system and method for the SDN multilevel flow table parallel search of polycaryon processor

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06291956A (en) * 1993-04-06 1994-10-18 Hitachi Ltd Input output device
JP2000163431A (en) * 1998-11-26 2000-06-16 Canon Inc System and method for information processing
JP2001075859A (en) * 1999-08-31 2001-03-23 Just Syst Corp Device for cyclic acquiring information
JP2002099557A (en) * 2000-09-22 2002-04-05 Matsushita Electric Ind Co Ltd Device and method for providing information
JP2002116958A (en) * 2000-10-05 2002-04-19 Mieko Tsuyusaki Web page browsing/use limiting system and web page address extraction system
JP2002342371A (en) * 2001-05-16 2002-11-29 Nec Corp System and method for www retrieval
JP2003030495A (en) * 2001-07-17 2003-01-31 Minolta Co Ltd Device, system and method for retrieving article and device for receiving and placing order for article
JP2005038402A (en) * 2003-06-27 2005-02-10 Ricoh Co Ltd Illicit use investigation service providing system of image data, device, method, program and recording medium

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06291956A (en) * 1993-04-06 1994-10-18 Hitachi Ltd Input output device
JP2000163431A (en) * 1998-11-26 2000-06-16 Canon Inc System and method for information processing
JP2001075859A (en) * 1999-08-31 2001-03-23 Just Syst Corp Device for cyclic acquiring information
JP2002099557A (en) * 2000-09-22 2002-04-05 Matsushita Electric Ind Co Ltd Device and method for providing information
JP2002116958A (en) * 2000-10-05 2002-04-19 Mieko Tsuyusaki Web page browsing/use limiting system and web page address extraction system
JP2002342371A (en) * 2001-05-16 2002-11-29 Nec Corp System and method for www retrieval
JP2003030495A (en) * 2001-07-17 2003-01-31 Minolta Co Ltd Device, system and method for retrieving article and device for receiving and placing order for article
JP2005038402A (en) * 2003-06-27 2005-02-10 Ricoh Co Ltd Illicit use investigation service providing system of image data, device, method, program and recording medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035990A (en) * 2014-06-09 2014-09-10 宁波公众信息产业有限公司 Electronic shop searching system
CN105224692A (en) * 2015-11-03 2016-01-06 武汉烽火网络有限责任公司 Support the system and method for the SDN multilevel flow table parallel search of polycaryon processor
CN105224692B (en) * 2015-11-03 2018-08-31 武汉烽火网络有限责任公司 Support the system and method for the SDN multilevel flow table parallel searchs of multi-core processor

Similar Documents

Publication Publication Date Title
US10949408B2 (en) Pervasive search architecture
CN105431844B (en) Third party for search system searches for application
JP4753597B2 (en) Discovery of user intent
JP4997950B2 (en) Network management system, network management program, and network management method
US7933972B1 (en) Method and system for organizing categories of content in a distributed network
US20100161780A1 (en) Hot data management method based on hit counter
CN101568919A (en) Single view of data in a networked computer system with distributed storage
JP2004005491A (en) Pier-to-pier file sharing method and its device
JP4741301B2 (en) Information search system, information search device, information search method, recording medium, and program
US9026534B2 (en) Method and system to collect and search user-selected content
KR20170029503A (en) Private content distribution network
JP2009193250A (en) Distributed directory server, distributed directory system, distributed directory method, and program
US20090234902A1 (en) System, method and apparatus for making content available over multiple devices
US10242102B2 (en) Network crawling prioritization
JP5352712B2 (en) Search method, integrated search server, and computer program
JP2011129146A (en) Information search system for automatically searching information on network, information search device, information search method, recording medium and program
JP2004157826A (en) Peer-to-peer document sharing network system
JP2010198492A (en) Method, device, and program for estimating information selection index, and method and system for providing information
JP2004302564A (en) Name service providing method, execution device of the same, and processing program of the same
JP6213660B2 (en) Information management apparatus, information sharing system, control method, and computer-readable recording medium
JP2010198493A (en) Information providing method, information providing device, and information providing program
JP6751366B2 (en) Information management system, information management method, and information management program
JP2011087072A (en) Image providing server device, control method thereof, and program
JP2008225997A (en) Metadata management method, metadata management system and metadata management program
JP5877802B2 (en) COMMUNICATION TERMINAL DEVICE AND COMMUNICATION ACCESS METHOD

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110621

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110916

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20111115

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20120223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120730