JP2007018153A - 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム - Google Patents

情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム Download PDF

Info

Publication number
JP2007018153A
JP2007018153A JP2005197510A JP2005197510A JP2007018153A JP 2007018153 A JP2007018153 A JP 2007018153A JP 2005197510 A JP2005197510 A JP 2005197510A JP 2005197510 A JP2005197510 A JP 2005197510A JP 2007018153 A JP2007018153 A JP 2007018153A
Authority
JP
Japan
Prior art keywords
information
search
site
determination
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005197510A
Other languages
English (en)
Other versions
JP4741301B2 (ja
Inventor
Shunji Sugaya
俊二 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Optim Corp
Original Assignee
Optim Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Optim Corp filed Critical Optim Corp
Priority to JP2005197510A priority Critical patent/JP4741301B2/ja
Publication of JP2007018153A publication Critical patent/JP2007018153A/ja
Application granted granted Critical
Publication of JP4741301B2 publication Critical patent/JP4741301B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ネットワーク上で公開されている情報をリアルタイムに検索できるようにする。
【解決手段】 検索サーバーSSが、サイトデータ取得部45によりネットワークNW上のサイトで実際に公開されている情報を収集して内部のRAM23に一時記憶し、判定処理部47にて登録された検索要求に係る検索対象情報により指定される検索条件を基に収集し一時保持している情報の取捨選択を行い、選択した情報のみを外部記憶装置24により構成されるサイトデータ記憶部48に記憶するようにすることで、検索要求時にネットワーク上のサイトで実際に公開されている情報を検索でき、かつサイトから取得した情報をRAM23に展開した状態で検索に係る処理を実行し高速に検索処理を行うことができるようにする。
【選択図】 図4

Description

本発明は、情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラムに関し、詳しくはインターネット等のネットワーク上で公開されている情報の検索技術に関する。
近年、インターネット等のネットワークの普及に伴い、ウェブサイト等の数が増加し、ネットワークを介してさまざまな情報が公開されている。ネットワーク上に存在するウェブサイトは多種多様であり、これらウェブサイトにより公開されている膨大な情報の中から所望の情報を探し出すための情報検索システムとして、いわゆるサーチエンジンと呼ばれる情報検索システムがある。
従来提供されている情報検索システムでは、サーバーがソフトウェア(アプリケーションソフト)等によりネットワーク上のウェブサイトを巡回して情報(データ)を収集し、収集した情報をデータセンター等のハードディスクに書き込む。これにより、各ウェブサイトにて公開されている情報が、情報検索システムを構成するサーバー側(システム運用側)のハードディスクに保存蓄積される。
また、システムを利用するユーザー側からキーワードなどの検索条件が入力され情報の検索が要求されると、サーバー(より詳細にはサーバーのCPU)は、情報が蓄積保存されたハードディスク内を検索条件に従って検索する。具体的には、ユーザー側から入力された検索条件を基に、ハードディスク内に蓄積されている情報を取捨選択し検索を行う。この検索結果を、サーバーが検索要求の応答としてユーザー側に返す。
しかしながら、従来の情報検索システムは、ネットワーク上の各ウェブサイトで公開されている情報を収集してハードディスクに蓄積する処理に多大な時間を要し、例えば、ネットワーク上に存在するウェブサイトを情報の収集・蓄積を行って一回り巡回するのに1ヶ月の期間を要することもある。そのため、ウェブサイトにて公開されている情報の更新(変更、追加、削除など)が行われても、その更新内容がハードディスクに蓄積されている情報に直ちに反映されることはほとんどなく、反映されるまでに時間がかかる。
したがって、従来の情報検索システムにおいてユーザー側に返される検索結果は、検索要求時に各ウェブサイトで実際に公開されている最新の情報とは必ずしも一致しないハードディスクに蓄積された情報に基づくものであった。つまり、検索結果は、検索要求時に実際に公開されている最新の情報に基づくものではなく、過去の情報収集時に公開されていた情報に基づくものであった。
本発明は、このような事情に鑑みてなされたものであり、ネットワーク上で公開されている情報をリアルタイムに検索できるようにすることを目的とする。
本発明の情報検索システムは、情報の検索要求を基に、ネットワーク上で公開されている情報を検索する情報検索システムであって、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、上記検索要求に係る検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定手段と、上記判定手段での判定結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段とを備えることを特徴とする。
本発明の情報検索装置は、ネットワーク上で公開されている情報を検索する情報検索装置であって、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、情報の検索要求に係る検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定手段と、上記判定手段での判定結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段とを備えることを特徴とする。
また、本発明の情報検索装置は、ユーザー側からの情報検索要求に応じた情報を、ネットワーク上で公開されている情報の中から検索する情報検索装置であって、上記情報検索要求に係る検索対象情報を登録し記憶する情報登録手段と、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、上記記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とを照合し、当該情報が上記検索条件を満足するか否かを判定する判定手段と、上記判定手段での判定の結果、上記半導体記憶装置に保持している情報が上記検索条件を満足する場合に、当該情報を磁気記憶装置に記憶する記憶手段と、上記半導体記憶装置に保持している情報が上記磁気記憶装置に記憶されたことを条件として、上記情報検索要求に対する検索結果情報を出力する出力手段とを備えることを特徴とする。
また、本発明の情報検索装置は、ネットワーク上で公開されている情報を検索する情報検索装置であって、検索する情報に係る検索対象情報を登録し記憶する情報登録手段と、上記ネットワーク上のサイトを自動的に巡回して、各サイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、上記記憶した検索対象情報と上記半導体記憶装置に保持した情報とに基づいて、当該情報を公開しているサイトの危険度を判定する判定手段と、上記判定の結果、サイトの危険度が所定範囲内である場合には、当該サイトのサイト情報及び上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段と、上記判定結果に係る検索結果情報を出力する出力手段とを備えることを特徴とする。
本発明の情報検索方法は、ネットワーク上で公開されている情報を検索する情報検索方法であって、検索する情報に係る検索対象情報を登録し記憶する情報登録工程と、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得工程と、上記情報登録工程にて記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定工程と、上記判定の結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶工程とを有することを特徴とする。
本発明のプログラムは、ネットワーク上で公開されている情報の検索処理を行うためのプログラムであって、検索する情報に係る検索対象情報を登録し記憶する情報登録ステップと、上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得ステップと、上記情報登録ステップにて記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定ステップと、上記判定ステップでの結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶ステップとをコンピュータに実行させることを特徴とする。
本発明のコンピュータ読み取り可能な記録媒体は、上記プログラムを記録したことを特徴とする。
本発明によれば、情報の検索要求を基にネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持して、当該情報を保存するか否かの判定を行い、その判定結果に応じて半導体記憶装置に保持している情報を磁気記憶装置に記憶する。これにより、検索要求時にネットワーク上のサイトで実際に公開されている情報を検索することができ、かつ取得した情報を半導体記憶装置に記憶して検索に係る実際の処理を実行することで高速に検索処理を行うことができる。したがって、ネットワーク上で公開されている情報をリアルタイムに検索でき、検索結果として最新の情報に基づく最適な情報を提供することができる。
以下、本発明の実施形態を図面に基づいて説明する。
図1は、本発明の実施形態による情報検索システムの構成例を示すブロック図である。
図1において、SSiはサーバー(検索サーバー)、PCjはユーザー端末、WSAk及びWSBlはウェブサーバーである。ここで、各符号における“i”、“j”、“k”、“l”は添え字であり、任意の自然数である。つまり、図1においては、3つの検索サーバーSS1〜SS3、2つのユーザー端末PC1、PC2、及び4つのウェブサーバーWSA1、WSA2、WSB1、WSB2を図示しているが、これに限定されるものではなく、検索サーバー、ユーザー端末、ウェブサーバーの数は任意である。
検索サーバーSSi、ユーザー端末PCj、及びウェブサーバーWSAk、WSBlは、それぞれが備えるネットワークインタフェースにより、インターネット等のネットワークNWを介して互いに通信可能なように接続されている。なお、図示していないが、検索サーバーSSiとユーザー端末PCjとは、個別線により通信可能なように接続されていても良い。
検索サーバーSSiは、ユーザー端末PCjからの情報の検索要求に基づいて、ウェブサーバーWSAk、WSBlが提供するサイトで公開されている情報を検索する。また、検索サーバーSSiは、ユーザー端末PCjからの要求等に応じて検索結果を返す。
ユーザー端末PCjは、ユーザーが検索サーバーSSiに情報の検索を要求したり、検索サーバーSSiから供給される検索結果を表示したりするためのものである。ウェブサーバーWSAk、WSBlは、ネットワークNW上のサイトを提供するものであり、外部からの要求を受けてサイトで公開している情報をネットワークNWを介して提供する。
なお、後述するように本実施形態による情報検索システムにおいて検索サーバーSSiを複数設けた場合には、各検索サーバーSSiは、ユーザー端末PCjからの情報の検索要求に係る情報等を相互に交換するとともに、互いに異なるサイトに対して検索を行う。すなわち、各検索サーバーSSiは、検索要求に係る情報等を共有化し、かつ検索範囲を分割して(各検索サーバーSSiの検索対象とするサイトを分けて)検索を行う。また、この検索結果についても、検索サーバーSSi間で情報を交換し反映させる。このように検索サーバーSSで検索要求に係る情報及び検索結果等を共有し、ネットワークNW上の複数のサイトに対する検索を分けて各検索サーバーSSで並行して行うことで、各検索サーバーSSの負荷を分散して軽減することができるとともに、検索処理を高速に行うことができる。
例えば、検索サーバーSS1が、ウェブサーバー群SGAの各ウェブサーバーWSAkにより提供されるサイトに対して検索を行い、検索サーバーSS2がウェブサーバー群SGBの各ウェブサーバーWSBlにより提供されるサイトに対して検索を行う。同様に、他の検索サーバーも検索対象のサイトが互いに相違するようにして検索を行う。
また、複数の検索サーバーSSiにて、ある検索サーバーSSiが統括的に制御を行い、制御される側の検索サーバーSSiに情報の検索要求に係る情報等を配信したり、各検索サーバーSSiで得られた検索結果を集めて他の検索サーバーSSiにそれぞれ配信し反映させたりするようにしても良い。
図2は、本実施形態における検索サーバーSSのハードウェア構成例を示すブロック図である。
検索サーバーSSは、図2に示すように、CPU21と、ROM(読み出し専用メモリ)22と、RAM23と、ハードディスク等の外部記憶装置24と、ネットワークインタフェース25とを有する。図2においては、詳細は後述する本実施形態における検索処理でのデータの流れ等を理解しやすいように検索サーバーSSの構成を図示しているが、CPU21、ROM22、RAM23、外部記憶装置24、及びネットワークインタフェース25は、図示しないバスを介して互いに通信可能に接続されている。このバスを介して、バスに接続された各種構成要素(機器)間相互のアドレス信号、制御信号及び各種データの転送が行われる。
CPU21は、データの送受信、データの結合、データの比較や照合などを行うため、検索サーバーSS内の各種構成要素を統括的に制御する。この制御は、あらかじめCPU21の制御手順(コンピュータプログラム、ソフトウェア)をROM22(外部記憶装置24でも良い。)に記憶させておき、この制御手順をCPU21が実行することにより行われ、データの転送、結合、比較や照合等の処理を実行することが可能となる。
RAM23は、データの送受信、結合、比較、照合等のためのワークメモリ、各種構成要素の制御のための一時記憶として用いられる。また、RAM23には、本実施形態における検索処理おいて、ネットワークNW上のサイトで公開されている情報を取得した際に、この取得した情報が一時的に保持される。
本実施形態では、CPU21及びROM22(あるいは外部記憶装置24)に記憶されたプログラムにより、本発明の取得手段、判定手段、記憶手段等の機能が実現される。
外部記憶装置24は、例えばハードディスクなどの保存用磁気記憶装置である。ネットワークインタフェース25は、検索サーバーSSiとネットワークNWとを接続し、ネットワークNWに接続された他の装置との間でデータの授受を行うためのものである。
図3は、本実施形態における各ユーザー端末PCjのハードウェア構成例を示すブロック図である。
ユーザー端末PCjは、図3に示すように、CPU31と、ROM(読み出し専用メモリ)32と、RAM33と、ハードディスク等の外部記憶装置34と、ネットワークインタフェース35と、入力装置36と、出力装置37とが、バス38を介して互いに通信可能に接続された構成としている。このバス38を介して、バス38に接続された各種構成要素(機器)間相互のアドレス信号、制御信号及び各種データの転送が行われる。
CPU31は、データの入出力、データの送受信等を行うため、バス38を介して接続された各種構成要素を制御するものである。あらかじめROM32に記憶させておいた制御手順(コンピュータプログラム)をCPU31が実行することにより、データの入出力、データの送受信等の処理を実行することが可能となる。なお、当該制御手順(コンピュータプログラム)をハードディスク等の外部記憶装置34にあらかじめ記憶させておき、それを実行するようにしても良い。RAM33は、データの入出力、送受信のためのワークメモリ、各種構成要素の制御のための一時記憶として用いられる。また、ROM32にCPU31の制御手順(コンピュータプログラム)を記憶させた場合には、当該プログラムをROM32からRAM33にロードし、RAM33にロードされたプログラムを実行するようにしても良い。
外部記憶装置34は、例えばハードディスクなどの保存用外部記憶装置である。ネットワークインタフェース35は、ネットワークNWに接続された他の装置との間でデータの授受を行うため、各ユーザー端末PCjとネットワークNWとを接続する。入力装置36は、例えばキーボードやマウスのような入力装置であり、ユーザーが情報の検索要求に係る検索対象情報を入力するために用いられる。出力装置37は、例えばディスプレイのような出力装置であり、検索対象情報の入力画面や検索結果の表示画面を表示するために用いられる。
なお、ウェブサーバーWSAk、WSBlの構成は、公知のウェブサーバーと同様であるので説明を省略する。
図4は、本実施形態における検索サーバーSSの機能的な構成を示す機能ブロック図であり、検索サーバーSS内の各機能部は、制御部41により統括的に制御される。
情報登録部42は、登録情報設定部43及び登録情報記憶部44を有し、ネットワークNWを介して供給されるユーザー端末PCjからの情報の検索要求に係る検索対象情報を登録し記憶する。ここで、検索対象情報は、ネットワークNW上のサイトで公開されている情報を検索するための検索条件等を示すものであり、検索に用いるキーワードを含む。さらに、検索対象情報として、例えば検索対象とするサイトや優先的に検索するサイトなどの他の情報を含むようにしても良い。
登録情報設定部43は、ユーザー端末PCjから検索対象情報が入力され、又は検索対象情報を収集し、その検索対象情報を登録情報記憶部44に供給する。また、登録情報記憶部44は、供給される検索対象情報を記憶する。
サイトデータ取得部45は、いわゆるクローラ(ロボット、スパイダーとも呼ばれる)に相当するものであり、ネットワークNW上のサイトを自動的に巡回してサイトを構成するコンテンツのデータを収集し、サイトで公開されている情報を取得する。さらに、サイトデータ取得部45は取得した情報を一時的に保持する。この取得した情報の一時的な保持には、図2に示したRAM23の記憶領域が用いられる。
また、サイトデータ取得部45は、最適化処理部46を有する。最適化処理部46は、公開されている情報を取得する際のサイトの巡回順序や巡回範囲を最適化するものである。最適化処理部46により最適化されたサイトの巡回順序や巡回範囲に従って、サイトデータ取得部45がネットワークNW上のサイトを巡回する。
ここで、最適化処理部46は、学習機能を有しており、登録情報記憶部44に記憶された検索対象情報及び後述する判定処理部47での判定結果の少なくとも一方に基づいて、ネットワークNW上のサイトに優先順位を付し、サイトの巡回順序や巡回範囲を変化させる。また、例えば登録情報記憶部44に記憶された検索対象情報により検索対象とするサイトや優先的に検索するサイトなどが指定されている場合には、指定されたサイトで公開されている情報をサイトデータ取得部45が最優先に取得するように、最適化処理部46は指定されたサイトの優先順位(巡回順序)を上げる。また、例えば新しい情報が容易に得られるように、他のサイトに比べて公開している情報の更新頻度が高いサイトの優先順位を高くするようにして、サイトで公開している情報の更新頻度に応じて優先順位(巡回順序)を変化させるようにしても良い。
判定処理部47は、サイトデータ取得部45がサイトより取得し一時保持している情報と、登録情報記憶部44に記憶された検索対象情報により指定される検索条件とに基づいて、サイトより取得した情報がユーザーの指定する検索条件を満足するか否かを判定する。判定の結果、サイトから取得した情報が検索条件を満足する(例えば、検索対象情報に含まれるキーワードとの一致数が所定数以上など)場合には、サイトデータ取得部45が一時保持している情報をサイトデータ記憶部48に保存し、そうでない場合には、サイトデータ取得部45が一時保持している情報を保存せずに廃棄する。
言い換えれば、判定処理部47は、サイトデータ取得部45がサイトより取得し一時保持している情報と、登録情報記憶部44に記憶された検索対象情報により指定される検索条件とに基づいて、データ取得部45が一時保持している情報をサイトデータ記憶部48に保存するか否かを判定する。さらに、判定処理部47は、その判定結果に応じて、データ取得部45が一時保持している情報をサイトデータ記憶部48に記憶させる。
このサイトデータ記憶部48は、図2に示した外部記憶装置24を用いて構成される。
なお、判定処理部47における判定処理は、サイト単位で行うようにしても良いし、サイトを構成する各ページ単位で行うようにしても良い。また、判定処理部47での判定処理においては、検索対象情報に含まれるキーワード等に重み付けを行い、サイトより取得した情報をサイトデータ記憶部48に保存するか否かを判定するようにしても良い。
結果処理部49は、判定処理部47での判定結果及びサイトデータ記憶部48に記憶されたサイトで公開されている情報とに基づいて、検索結果情報を生成する。そして、生成した検索結果情報を、ユーザーからの情報の検索要求に対する応答として出力する。
情報交換処理部50は、各検索サーバーSSが持つ検索処理に係る情報を相互に反映させ共有化を図るため、他の検索サーバーSSとの間で検索処理に係る情報を送受信する。具体的には、情報交換処理部50は、登録情報記憶部44に記憶される検索対象情報、判定処理部47での判定結果及びサイトデータ記憶部48に記憶される情報を含む検索処理に係る情報を他の検索サーバーSSとの間で授受する。
なお、本実施形態では、検索サーバーSSが検索エンジン(サイトデータ取得部45や判定処理部47等)を有し、検索に係る情報(検索要求に係る情報や検索結果に係る情報)を検索サーバーSS間で相互に交換して共有するようにしている。しかし、これに限定されるものではなく、各ユーザー端末PCに検索エンジンを搭載し、各ユーザー端末PC間で検索に係る情報をピア・ツー・ピア(Peer To Peer)型の通信形態で相互に交換して共有するようにして、情報検索システムを構成しても良い。
次に、動作について説明する。
図5は、本実施形態による情報検索システムの検索処理動作を示すフローチャートである。
まず、ステップS1にて、情報登録部42内の登録情報設定部43は、ユーザー端末PCjからの検索要求に係る検索対象情報を得て、この得られた検索対象情報が登録情報記憶部44に登録され記憶される。なお、情報検索システムが複数の検索サーバーSSiで構成される場合には上記処理に加え、このステップS1にて、さらに登録情報記憶部44に記憶された検索対象情報が、情報交換処理部50により他のすべての検索サーバーSSiに送信され、情報検索システムを構成する全検索サーバーSSiにて検索対象情報が共有化される。
次に、ステップS2にて、サイトデータ取得部45は、内部の最適化処理部46により定められる巡回順序や巡回範囲に従ってネットワーク上のサイトにアクセスし、サイトを構成するコンテンツのデータを収集して保持する。これにより、ネットワーク上のあるサイトで公開されている情報が取得され、検索サーバーSSi内のRAM23に記憶され保持される。
ステップS3にて、判定処理部47は、ステップS1において登録された検索対象情報により指定される検索条件を参照し、ステップS2においてサイトデータ取得部45がサイトより取得し保持したコンテンツのデータをサイトデータ記憶部48に保存するか否かを判定する。
判定の結果、コンテンツのデータをサイトデータ記憶部48に保存すると判定した場合には(ステップS4のYES)、ステップS5にて、サイトデータ取得部45が保持しているコンテンツのデータがサイトデータ記憶部48に書き込まれ保存される。一方、判定の結果、コンテンツのデータをサイトデータ記憶部48に保存しないと判定した場合には(ステップS4のNO)、ステップS5をスキップする。
以降、ステップS6にて、制御部41がユーザーからの検索要求に対して検索結果を出力すると判断するまで、上述したステップS2〜S5の処理を繰り返し行う。
ステップS6にて、制御部41がユーザーからの検索要求に対して検索結果を出力すると判断した場合には(ステップS6のYES)、ステップS7にて、結果処理部49は結果処理を行う。この結果処理では、判定処理部47の判定結果及びサイトデータ記憶部48に保存されたコンテンツのデータに基づいて、ユーザー端末PCjに応答として出力する検索結果情報が生成される。
次に、ステップS8にて、結果処理部49は、ステップS7において生成した検索結果情報をユーザー端末PCjにネットワークNWを介して出力し処理を終了する。なお、本実施形態では、検索結果情報をユーザー端末PCjに出力して処理を終了するようにしているが、実際の出力までは行わずにユーザー端末PCjへの検索結果情報の出力準備の完了をもって処理を終了するようにしても良い。このようにした場合には、例えばユーザー端末PCjへの出力準備が完了した検索結果情報を所定の記憶部に記憶しておき、ユーザー側からの結果出力要求に応じて検索結果情報を提供するようにすれば良い。
以上、説明したように本実施形態によれば、ネットワーク上のサイトで公開されている情報を検索する際、従来のようにあらかじめ収集し蓄積された情報に基づいて検索を行うのではなく、ユーザー側から検索要求がなされ、情報登録部42が当該検索要求に係る検索対象情報等を登録記憶した後に、ネットワーク上のサイトで公開されている情報をサイトデータ取得部45により収集して情報の検索を行う。
この情報の検索では、まず現在、サイトで公開されている情報をサイトデータ取得部45が収集し検索サーバーSS内のRAM23に一時記憶する。そして、判定処理部47が、情報登録部42に登録記憶した検索対象情報等を基に、RAM23に一時記憶された情報を外部記憶装置24により構成されるサイトデータ記憶部48に保存するか否かを判定する。判定の結果、RAM23に一時記憶された情報が検索対象情報により指定される検索条件を満足する場合には、RAM23に一時記憶された情報が外部記憶装置24であるサイトデータ記憶部48に書き込まれ、そうでない場合には廃棄される。
つまり、本実施形態による情報検索システムでは情報の検索を行う場合に、ユーザー側からの検索要求を受けた後にサイトで実際に公開されている情報を収集し、ユーザー側より指定され予め決まっている検索条件(キーワード等)を基に収集した情報の取捨選択を行う。この処理は、従来のように収集した情報のすべてを外部記憶装置24に記憶して行うのではなく、検索サーバーSS内のRAM23に収集した情報を展開して行い、選択した情報のみを外部記憶装置24に書き込み保存する。
これにより、検索要求時にネットワーク上のサイトで実際に公開されている情報を検索することができるとともに、検索サーバーSS内のCPU21及びRAM23を用いて検索に係る実際の処理が実行されるので高速に検索処理を行うことができる。したがって、ネットワーク上で公開されている情報をリアルタイムに検索でき、検索結果として最新の情報に基づく最適な情報を提供することができる。
また、検索対象情報や判定処理部47での判定結果などに基づいて、学習機能を有する最適化処理部46により公開されている情報を取得するサイトの巡回順序や巡回範囲を最適化して情報の検索を行うことにより、検索処理を効率良く行うことができる。
この最適化処理では、ネットワーク上のサイトで公開されている情報を検索して得られた検索結果を基にベイズ理論を用いてキーワード分類を行い、その後の判定等に利用するようにしても良い。検索結果にかかったサイトに関しては、次回からの検索間隔調整を行いそのサイトに対して集中的に検索を行うようにしても良い。
次に、本実施形態による情報検索システムを適用した具体的なシステムの一例として、リアルタイム検索システム及びネットパトロールシステムについて説明する。
(リアルタイム検索システム)
まず、リアルタイム検索システムについて説明する。以下に説明するリアルタイム検索システムは、登録された検索要求に係る検索対象情報と、ネットワーク上のサイトを巡回して得た結果(サイトで公開されている情報)とのマッチング処理をリアルタイムに行うことで、検索対象情報の登録者(検索要求を行った者)にネットワーク上のサイトで実際に公開されている最新かつ最適な情報を提供するものである。
図6は、本実施形態による情報検索システムを適用したリアルタイム検索システムの動作を示すフローチャートである。
まず、ステップS11にて、情報登録部42は、ユーザー端末PCから検索要求に係る検索対象情報を収集し、収集した検索対象情報を登録し記憶する。なお、リアルタイム検索システムが複数の検索サーバーSSで構成される場合には、図5に示した動作と同様にして全検索サーバーSSでの検索対象情報の共有化処理が行われる。
ここで、検索対象情報の収集は、検索サーバーSS側で情報登録サイトの提供を行うことにより、図7(A)に示すような情報登録画面をユーザー端末PCの出力装置37に表示させる。そして、ユーザーが入力装置36等を用いて検索対象情報(例えば、嗜好や地域、得たい情報を特定するためのキーワード等)を入力し、さらに検索サーバーSSが情報登録サイトを巡回して入力された検索対象情報を収集することにより行われる。なお、ユーザー端末PCから検索対象情報を検索サーバーSSに送信するようにしても良い。また、例えばあるユーザーに対する情報登録サイトを他のユーザーにも閲覧可能にする場合には、検索対象情報を公開しても良い公開情報とそうでない非公開情報とに分け、検索サーバーSSは、公開情報については自ら収集し、非公開情報についてはユーザー端末PCからの送信を受けるようにしても良い。
次に、ステップS12にて、サイトデータ取得部45は、最適化処理部46により最適化された巡回順序や巡回範囲に従ってネットワークNW上のサイトにアクセスしてコンテンツのデータを収集し保持する。これにより、ネットワークNW上のサイトで公開されている情報が取得され、検索サーバーSS内のRAM23に記憶され保持される。
続いて、ステップS13にて、判定処理部47は、ステップS11において登録された検索対象情報により指定される検索条件と、ステップS12においてネットワークNW上のサイトから取得し保持したコンテンツのデータとのマッチング処理(照合)を行う。
その結果、検索対象情報により指定される検索条件とサイトから取得し保持したコンテンツのデータとが所定の条件(例えば、一致の度合が所定以上)を満足しない場合には、当該コンテンツのデータを廃棄すると判定し(ステップS14のYES)、上述したステップS12に戻る。
一方、ステップS13でのマッチング処理の結果、検索対象情報により指定される検索条件とサイトから取得し保持したコンテンツのデータとが所定の条件を満たす場合には、当該コンテンツのデータをサイトデータ記憶部48に保存すると判定し(ステップS14のYES)、ステップS15にて、サイトデータ取得部45が保持しているコンテンツのデータがサイトデータ記憶部48に書き込まれ保存される。
このようにして、サイトから取得しサイトデータ取得部45に保持しているコンテンツのデータがサイトデータ記憶部48に記憶されると、ステップS16にて、結果処理部49は、判定処理部47の判定結果及びサイトデータ記憶部48に保存されたコンテンツのデータに基づいて、ユーザーに提供する検索結果情報を生成する。
そして、ステップS17にて、結果処理部49は、ステップS16において生成した検索結果情報をユーザー端末PCにネットワークNWを介して出力することで、検索結果をユーザーに通知する。検索結果としてユーザーに通知される情報には、情報が公開されているサイトのURL、そのコンテンツのデータ、及びサイトの発見日時等がある。
ここで、検索結果のユーザーへの通知は、任意の通知方法が適用でき、例えば図7(B)に示すようにユーザー端末PCにて表示している画面上に検索結果を示す画像71をポップアップ表示させるようにしても良い。また、電子メールや電子メッセージ等により検索結果をユーザーに通知するようにしても良い。
以上のようにして、本実施形態による情報検索システムを適用し、登録されたユーザー側からの検索対象情報と、ネットワーク上のサイトを自動的に巡回して得たサイトで公開されている情報とのマッチング処理をリアルタイムに行うことで、ネットワーク上のサイトで実際に公開されている情報の検索を高速に行い、検索対象情報の登録者に対して最新かつ最適な情報を提供することができる。
また、上述したリアルタイム検索システムにおいて、需要情報と供給情報とのマッチング処理、すなわち検索対象情報との間に需給関係が成立するような公開されている情報の検索を行うようにしても良い。ここで、需要情報と供給情報には、募集・応募情報や、売買情報等がある。例えば、検索対象情報として募集情報を登録した場合には、その募集情報に合った(マッチする)求人情報を検索・収集する。また、例えば、検索対象情報として求人情報を登録した場合には、その求人情報に合った募集情報を検索・収集する。このとき、例えば、「名前」、「なまえ」、「氏名」等のように同様の項目であってもサイトに応じて項目名が異なる場合もあるので、呼び方の異なる同一項目についてはグルーピング(グループ化)を行い、同一用語(例えば、上述した例ではすべて「氏名」)として取り扱う類義語統一処理を必要に応じて適宜行うことが望ましい。
(ネットパトロールシステム)
次に、ネットパトロールシステムについて説明する。以下に説明するネットパトロールシステムは、ネットワークNW上のサイトで公開されている情報をリアルタイムに検索可能な本実施形態による情報検索システムを用い、ネットワークNW(例えば、インターネット)上のサイトを自動巡回して点在する不正なコンテンツをリアルタイムに検索及び追跡し、その結果をユーザー側に適宜提供するものである。例えば、ネットワークNW上のオークションサイトへの不正出展や個人サイトでの著作権画像・映像利用による著作権侵害等、ユーザーにとって不利益となるサイト(コンテンツ)を監視するシステムに用いて好適なものである。
なお、本実施形態による情報検索システムを適用したネットパトロールシステムにおけるシステムサーバーSSのハードウェア構成は、図2に示した検索サーバーSSと同様であるので説明は省略する。
図8は、本実施形態による情報検索システムを適用したネットパトロールシステムにおけるシステムサーバーSSの機能的な構成を示す機能ブロック図である。この図8において、図4に示したブロック等と同一の機能を有するブロック等には同一の符号を付し、重複する説明は省略する。なお、機能は同一ではないが、図8に示す危険度判定処理部81は図4に示した判定処理部47に対応するものである。また、図8に示すサイトデータ記憶部83及び結果処理部86は、図4に示したサイトデータ記憶部48及び結果処理部49にそれぞれ対応するものである。
危険度判定処理部81は、判定条件記憶部82を有し、登録情報記憶部44に記憶された検索対象情報と、サイトデータ取得部45がネットワークNW上のサイトを自動的に巡回することにより取得し一時保持している情報とに基づいて、この一時保持している情報を公開しているサイトの危険度を判定する。
具体的には、危険度判定処理部81は、検索対象情報とサイトデータ取得部45が一時保持している情報とから、一時保持している情報を公開しているサイトの危険度を求める。さらに、危険度判定処理部81は、求めたサイトの危険度が、判定条件記憶部82に判定条件として予め設定された所定範囲内であるか否かを判定することで、当該サイトが危険であるか否かを判定する。なお、危険度の判定は、ある1つの閾値を設定すること等により二者択一的に危険であるか否かのみを判定するようにしても良いし、複数の異なる閾値を設定すること等によりどの程度危険であるのか危険度を複数にランク分けして判定するようにしても良い。
サイトデータ記憶部83は、図2に示した外部記憶装置24を用いて構成され、監視対象データベース(監視対象DB)84を有する。
監視対象DB84は、危険度判定処理部81により危険と判定されたサイトの監視対象データ(サイトデータ取得部45が一時保持していた当該サイトで公開されているコンテンツのHTMLデータならびに各種ファイル、及び当該サイトに係るURLならびに発見日時等のサイト情報)を格納するデータベースである。監視対象DB84に格納される監視対象データには、例えば、サイトのURL、タイトル、HTMLデータ及び各種ファイルを含むコンテンツデータ、オーナー、発見日時、危険度、警告を行った場合にはその日時、ステータス、ページの存在するか否か、キーワード、及び調査対象物などの情報が含まれる。
結果処理部86は、警告処理部87及び結果情報出力部88を有し、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とに基づいて、所定の結果処理を行う。
警告処理部87は、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とを基に、危険なサイトに対して警告通知を行う。例えば、警告処理部87は、危険度判定処理部81にて危険であると判定されたサイトを構成する、サイトデータ記憶部83に記憶されたコンテンツのデータ等から当該サイトの管理者などのメールアドレスを抽出し、抽出したメールアドレス宛に警告メールを送信する。なお、警告処理部87により危険なサイトに対して警告通知を行うか否かは、ネットパトロールシステムのオペレーターや監視を依頼したユーザーがサイト単位で任意に設定可能である。
結果情報出力部88は、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とを基に検索結果情報を生成し、生成した検索結果情報をユーザー側に提供する。この検索結果情報には、危険度判定処理部81にて危険であると判定されたサイトの監視対象データの情報が含まれる。また、検索結果情報には、危険であると判定されたサイトのステータス(状態)、危険なサイトに対して警告通知を行っている場合にはその通知に対する応答の有無等の情報を含んでも良い。
次に、ネットパトロールシステムの動作について説明する。
図9は、ネットパトロールシステムにおける検索処理の動作を示すフローチャートである。
まず、ステップS21にて、情報登録部42は、ユーザー端末PC(監視を依頼するユーザー側)からの検索要求に係る検索対象情報を得て、この得られた検索対象情報を登録し記憶する。なお、複数のシステムサーバーSSを有する場合には、さらに登録する検索対象情報をシステムサーバーSS間で送受信し、全システムサーバーSSにて検索対象情報を共有化する。
ここで、例えば検索対象情報には、キーワード、監視サイト(情報の収集・取得を行う対象として予め設定するサイト)、検索対象ファイル設定、警告通知送信元メールアドレス、送信サーバー設定、調査対象物、パトロール(検索)開始日、危険度判定条件などが含まれる。なお、これに限定されるものではなく、検索対象情報の項目及び内容については任意である。
また、検索対象情報に含まれるキーワードは、複数の種類に分けても良い。本例では、キーワードを、違法な言葉を表す(違法なものを想起させる)キーワードとして「デフォルトキーワード」、対象物ごとのキーワードとして「対象物のキーワード」、対象物のジャンルごとに設定可能なキーワードとして「サブキーワード」、及び状態を表すキーワードとして「カテゴリキーワード」の4種類に分ける。このようにキーワードを複数種類に分けた場合には、キーワードの種類ごとに重み付けを行って後述する危険度判定処理を行うようにしても良い。
次に、ステップS22にて、サイトデータ取得部45は、ネットワークNW上のサイトにアクセスし、サイトを構成するコンテンツのデータを収集して保持する。これにより、ネットワーク上のあるサイトで公開されている情報が取得され、システムサーバーSS内のRAM23に記憶され保持される。ここで、ネットパトロールシステムにおけるサイトで公開されている情報の取得方法には、検索対象情報の監視サイトにより予め設定されたサイトから情報を随時取得する第1の方法と、最適化処理部46により最適化された巡回順序や巡回範囲に従ってネットワークNW上のサイトを自動的に巡回して情報を取得する第2の方法がある。第1の方法と第2の方法とは適宜時間的に切り換えたり、又は複数のシステムサーバーSSにより並行して実行したりするようにすれば良い。
続いて、ステップS23にて、危険度判定処理部81は、ステップS11において登録された検索対象情報と、ステップS2においてサイトデータ取得部45に保持したサイトのコンテンツのデータに基づいて、当該サイトの危険度を求める。さらに、危険度判定処理部81は、求めたサイトの危険度と、検索対象情報の危険度判定条件として入力され判定条件記憶部82に設定された判定条件とを比較し、当該サイトの危険度を判定する。
その判定の結果、サイトデータ取得部45にコンテンツのデータが保持されているサイトが危険であると判定された場合には(ステップS24のYES)、ステップS25にて、サイトデータ取得部45が保持しているコンテンツのデータを含む監視対象データがサイトデータ記憶部83の監視対象DB84に格納される。
一方、ステップS23での危険度判定処理の結果、危険なサイトではないと判定された場合には(ステップS24のNO)、サイトデータ取得部45に保持しているデータを廃棄しステップS22に戻る。
なお、上述した危険度の判定は、サイトを構成するコンテンツ単位で行うようにしても良いし、リンクされた複数のコンテンツを1つの単位として行うようにしても良い。
次に、ステップS26にて、制御部41は、監視を依頼したユーザーからの結果出力要求があるか否かを確認し、ユーザーからの結果出力要求があった場合にはステップS27に進み、要求がない場合にはステップS22に戻る。
ステップS27にて、結果情報出力部88は、危険度判定処理部81での判定結果及びサイトデータ記憶部83に記憶されたサイトで公開されている情報とを基に検索結果に係る集計処理を行い、検索結果情報を生成する。そして、ステップS28にて、結果情報出力部88は、ステップS27において生成した検索結果情報をユーザー側に出力提供し、ステップS22に戻る。
このシステムサーバーSS内の結果情報出力部88が出力した検索結果情報を受けたユーザー側では、検索結果情報をユーザー端末PCが備える出力装置37の画面上に表示することで検索・監視結果が確認できる。なお、システムサーバーSSから出力される検索結果情報によりユーザー端末PCの出力装置37にて表示可能な検索結果の表示形態には、例えば危険であると判定したサイト(ページ)の一覧表示、その各サイト(ページ)の詳細表示、また表示する情報の項目を絞り込んだ絞り込み表示等がある。
図10は、ネットパトロールシステムにおける監視処理の動作を示すフローチャートである。この監視処理は、危険度判定処理部81にてサイトが危険であると判定され、当該サイトに係る監視対象データがサイトデータ記憶部83内の監視対象DB84に格納された後に実行される処理であり、随時継続して実行されている。
まず、ステップS31にて、制御部41は、危険度判定処理部81での判定結果等に基づいて、危険度判定処理部81にて危険であると判定したサイトに対して警告メールを送信するか否かを判断する。
その結果、制御部41にて警告メールを送信すると判断された場合には、ステップS32にて、警告処理部87は、サイトデータ記憶部83に記憶された危険なサイトのコンテンツのデータ等から当該サイトの管理者などのメールアドレスを抽出する。そして、警告処理部87は、抽出したメールアドレス宛に警告メールを送信する。
続いて、ステップS33にて、警告処理部87は、ステップS32において送信した警告メールに対する返信メールがあったか否か判断し、返信メールがあった場合には、ステップS34にてサイトの監視ステータスを変更し、ステップS35にて、監視を依頼したユーザーにその返信メールを転送する。ここで、監視ステータスは、危険である判定されたサイトに対する対応状況を示す情報であり、例えば「警告対応済み」、「警告中」、「未対応」などがある。この監視ステータスは、ユーザー側での処理及びサイト側での処理に応じて遷移する。
一方、ステップS33での判断の結果、返信メールがなかった場合には、ステップS34、S35をスキップする。
以上のようにして、本実施形態による情報検索システムを用いて、登録された検索対象情報とネットワークNW上のサイトで公開されている情報とを基に危険度の判定をリアルタイムに行うことで、ネットワークNW上に存在する不正なコンテンツの検索を高速に行い、その結果をユーザー側に提供できるとともに、監視対象とすべき危険なサイトを容易に検出し追跡することができる。例えば、更新頻度が高く、短期間で情報の更新が行われるため、従来の情報検索システムでは発見したときにはほとんど手遅れで対応することが困難であったオークションサイトへの不正出展等についても、本実施形態による情報検索システムを適用したネットパトロールシステムではリアルタイムで検索するので、即時に発見し十分に対応することが可能になる。
また、危険であると判断したサイトに対して警告を通知することにより当該サイトの管理者側に改善を促すことができる。例えば、オークションサイトへの不正出展や個人サイトでの著作権画像・映像利用による著作権侵害等に対しては、その情報(データ)の削除等の対処を促すことができる。
(本発明の他の実施形態)
なお、コンピュータが上述した実施形態の機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって、上述の実施形態の機能が実現される場合も、かかるプログラムを記録した記録媒体は本発明の実施形態に含まれる。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。また、一部のプログラムが他のコンピュータで実行されるようになっていても良い。
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
本発明の実施形態による情報検索システムの一構成例を示すブロック図である。 検索サーバーのハードウェア構成の一例を示すブロック図である。 ユーザー端末のハードウェア構成の一例を示すブロック図である。 検索サーバーの機能的な構成の一例を示すブロック図である。 本実施形態による情報検索システムの動作を示すフローチャートである。 本実施形態による情報検索システムを適用したリアルタイム検索システムの動作を示すフローチャートである。 リアルタイム検索システムでの画面表示の一例を示す図である。 本実施形態による情報検索システムを適用したネットパトロールシステムの機能的構成を示すブロック図である。 ネットパトロールシステムにおける検索処理の動作を示すフローチャートである。 ネットパトロールシステムにおける監視処理の動作を示すフローチャートである。
符号の説明
SS サーバー
PC ユーザー端末
WSA、WSB ウェブサーバー
NW ネットワーク
21 CPU
22 ROM
23 RAM
24 外部記憶装置
25 ネットワークインタフェース
41 制御部
42 情報登録部
43 登録情報設定部
44 登録情報記憶部
45 サイトデータ取得部
46 最適化処理部
47 判定処理部
48 サイトデータ記憶部
49 結果処理部
50 情報交換処理部

Claims (16)

  1. 情報の検索要求を基に、ネットワーク上で公開されている情報を検索する情報検索システムであって、
    上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、
    上記検索要求に係る検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定手段と、
    上記判定手段での判定結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段とを備えることを特徴とする情報検索システム。
  2. 上記取得手段、上記判定手段、及び上記記憶手段を有する情報検索装置を複数有し、
    上記複数の情報検索装置は上記検索対象情報を共有化し、かつ互いに異なるサイトに対して検索を行うことを特徴とする請求項1記載の情報検索システム。
  3. 上記複数の情報検索装置は、検索に係る情報をピア・ツー・ピア型の通信で交換し共有化することを特徴とする請求項2記載の情報検索システム。
  4. ネットワーク上で公開されている情報を検索する情報検索装置であって、
    上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、
    情報の検索要求に係る検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定手段と、
    上記判定手段での判定結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段とを備えることを特徴とする情報検索装置。
  5. 上記検索対象情報が入力され又は上記検索対象情報を収集し、当該検索対象情報を登録し記憶する情報登録手段をさらに備えることを特徴とする請求項4記載の情報検索装置。
  6. 上記検索対象情報及び上記判定手段での判定結果の少なくとも一方に基づいて上記ネットワーク上のサイトに優先順位を付し、当該優先順位に従ってサイトから公開されている情報を取得することを特徴とする請求項4又は5記載の情報検索装置。
  7. 上記判定手段での判定結果に基づいて、上記公開されている情報を取得するサイト順序を最適化する最適化手段をさらに備えることを特徴とする請求項4〜6の何れか1項に記載の情報検索装置。
  8. 通信可能に接続された他の情報検索装置との間で、上記検索対象情報と上記判定手段での判定結果とを含む検索処理情報を授受する情報交換手段をさらに備えることを特徴とする請求項4〜7の何れか1項に記載の情報検索装置。
  9. 上記判定手段での判定結果を基にベイズ理論を用いたキーワード分類を行い、その結果を上記判定手段での判定に利用するようにしたことを特徴とする請求項4〜8の何れか1項に記載の情報検索装置。
  10. 上記ネットワーク上のサイトで公開されている情報のなかから、上記検索対象情報との間に需給関係が成立する情報を検索し収集するようにしたことを特徴とする請求項4〜9の何れか1項に記載の情報検索装置。
  11. ユーザー側からの情報検索要求に応じた情報を、ネットワーク上で公開されている情報の中から検索する情報検索装置であって、
    上記情報検索要求に係る検索対象情報を登録し記憶する情報登録手段と、
    上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、
    上記記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とを照合し、当該情報が上記検索条件を満足するか否かを判定する判定手段と、
    上記判定手段での判定の結果、上記半導体記憶装置に保持している情報が上記検索条件を満足する場合に、当該情報を磁気記憶装置に記憶する記憶手段と、
    上記半導体記憶装置に保持している情報が上記磁気記憶装置に記憶されたことを条件として、上記情報検索要求に対する検索結果情報を出力する出力手段とを備えることを特徴とする情報検索装置。
  12. ネットワーク上で公開されている情報を検索する情報検索装置であって、
    検索する情報に係る検索対象情報を登録し記憶する情報登録手段と、
    上記ネットワーク上のサイトを自動的に巡回して、各サイトで公開されている情報を取得し半導体記憶装置に保持する取得手段と、
    上記記憶した検索対象情報と上記半導体記憶装置に保持した情報とに基づいて、当該情報を公開しているサイトの危険度を判定する判定手段と、
    上記判定の結果、サイトの危険度が所定範囲内である場合には、当該サイトのサイト情報及び上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶手段と、
    上記判定結果に係る検索結果情報を出力する出力手段とを備えることを特徴とする情報検索装置。
  13. 上記判定の結果、上記危険度が所定範囲内となったサイトに対して、選択的に警告通知を送信可能な警告手段をさらに備えることを特徴とする請求項12記載の情報検索装置。
  14. ネットワーク上で公開されている情報を検索する情報検索方法であって、
    検索する情報に係る検索対象情報を登録し記憶する情報登録工程と、
    上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得工程と、
    上記情報登録工程にて記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定工程と、
    上記判定の結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶工程とを有することを特徴とする情報検索方法。
  15. ネットワーク上で公開されている情報の検索処理を行うためのプログラムであって、
    検索する情報に係る検索対象情報を登録し記憶する情報登録ステップと、
    上記ネットワーク上のサイトで公開されている情報を取得し半導体記憶装置に保持する取得ステップと、
    上記情報登録ステップにて記憶した検索対象情報により指定される検索条件と上記半導体記憶装置に保持した情報とに基づいて、当該情報を保存するか否かを判定する判定ステップと、
    上記判定ステップでの結果に応じて、上記半導体記憶装置に保持している情報を磁気記憶装置に記憶する記憶ステップとをコンピュータに実行させるためのプログラム。
  16. 請求項15記載のプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2005197510A 2005-07-06 2005-07-06 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム Active JP4741301B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005197510A JP4741301B2 (ja) 2005-07-06 2005-07-06 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005197510A JP4741301B2 (ja) 2005-07-06 2005-07-06 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011015693A Division JP2011129146A (ja) 2011-01-27 2011-01-27 ネットワーク上の情報を自動検索する情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム

Publications (2)

Publication Number Publication Date
JP2007018153A true JP2007018153A (ja) 2007-01-25
JP4741301B2 JP4741301B2 (ja) 2011-08-03

Family

ID=37755288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005197510A Active JP4741301B2 (ja) 2005-07-06 2005-07-06 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム

Country Status (1)

Country Link
JP (1) JP4741301B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009070349A (ja) * 2007-09-12 2009-04-02 Kashiko Kodate 動画データの照合システム
JP2009169783A (ja) * 2008-01-18 2009-07-30 Hitachi Ltd コンテンツ受信方法及びコンテンツ受信装置
JP2009282982A (ja) * 2008-05-22 2009-12-03 Gmarket Inc ウェブサイト内の不正コードを点検するためのシステム及びその方法並びに前記方法を行うためのコンピューターで判読可能なプログラムを記録した記録媒体
JPWO2008142791A1 (ja) * 2007-05-24 2010-08-05 富士通株式会社 差分算出プログラム、差分算出装置および差分算出方法
JP2017084139A (ja) * 2015-10-28 2017-05-18 株式会社オプティム 端末管理システム及び端末管理方法。
JP2020086996A (ja) * 2018-11-27 2020-06-04 株式会社クリエイト 掲載情報検索システム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163431A (ja) * 1998-11-26 2000-06-16 Canon Inc 情報処理システムおよび情報処理方法
JP2001075859A (ja) * 1999-08-31 2001-03-23 Just Syst Corp 情報巡回獲得装置
JP2002099557A (ja) * 2000-09-22 2002-04-05 Matsushita Electric Ind Co Ltd 情報提供装置及び情報提供方法
JP2002116958A (ja) * 2000-10-05 2002-04-19 Mieko Tsuyusaki Webページ閲覧・使用制限システム、Webページアドレス抽出システム
JP2002342371A (ja) * 2001-05-16 2002-11-29 Nec Corp Www検索システムおよび方法
JP2003030495A (ja) * 2001-07-17 2003-01-31 Minolta Co Ltd 物品検索装置、物品受発注装置、物品検索システムおよび物品検索方法
JP2005038402A (ja) * 2003-06-27 2005-02-10 Ricoh Co Ltd 画像データの不正使用調査サービス提供システム、装置、方法、プログラム、及び記録媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163431A (ja) * 1998-11-26 2000-06-16 Canon Inc 情報処理システムおよび情報処理方法
JP2001075859A (ja) * 1999-08-31 2001-03-23 Just Syst Corp 情報巡回獲得装置
JP2002099557A (ja) * 2000-09-22 2002-04-05 Matsushita Electric Ind Co Ltd 情報提供装置及び情報提供方法
JP2002116958A (ja) * 2000-10-05 2002-04-19 Mieko Tsuyusaki Webページ閲覧・使用制限システム、Webページアドレス抽出システム
JP2002342371A (ja) * 2001-05-16 2002-11-29 Nec Corp Www検索システムおよび方法
JP2003030495A (ja) * 2001-07-17 2003-01-31 Minolta Co Ltd 物品検索装置、物品受発注装置、物品検索システムおよび物品検索方法
JP2005038402A (ja) * 2003-06-27 2005-02-10 Ricoh Co Ltd 画像データの不正使用調査サービス提供システム、装置、方法、プログラム、及び記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008142791A1 (ja) * 2007-05-24 2010-08-05 富士通株式会社 差分算出プログラム、差分算出装置および差分算出方法
JP4957796B2 (ja) * 2007-05-24 2012-06-20 富士通株式会社 差分算出プログラム、差分算出装置および差分算出方法
JP2009070349A (ja) * 2007-09-12 2009-04-02 Kashiko Kodate 動画データの照合システム
JP2009169783A (ja) * 2008-01-18 2009-07-30 Hitachi Ltd コンテンツ受信方法及びコンテンツ受信装置
JP2009282982A (ja) * 2008-05-22 2009-12-03 Gmarket Inc ウェブサイト内の不正コードを点検するためのシステム及びその方法並びに前記方法を行うためのコンピューターで判読可能なプログラムを記録した記録媒体
JP2017084139A (ja) * 2015-10-28 2017-05-18 株式会社オプティム 端末管理システム及び端末管理方法。
JP2020086996A (ja) * 2018-11-27 2020-06-04 株式会社クリエイト 掲載情報検索システム
JP7018202B2 (ja) 2018-11-27 2022-02-10 株式会社クリエイト 掲載情報検索システム

Also Published As

Publication number Publication date
JP4741301B2 (ja) 2011-08-03

Similar Documents

Publication Publication Date Title
US11681654B2 (en) Context-based file selection
CN101568919B (zh) 具有分布式存储的联网计算机系统中的单个数据视图
JP4753597B2 (ja) ユーザ意図の発見
US6418453B1 (en) Network repository service for efficient web crawling
US7933972B1 (en) Method and system for organizing categories of content in a distributed network
CN105431844B (zh) 用于搜索系统的第三方搜索应用
US20140149385A1 (en) Searching content in distributed computing networks
US8126997B2 (en) Hot data management method based on hit counter
JP5008748B2 (ja) 検索方法、統合検索サーバ及びコンピュータプログラム
JP5121194B2 (ja) 組織内情報検索システム及び組織内情報検索プログラム
JP2008146412A (ja) ネットワーク管理システム、ネットワーク管理プログラムおよびネットワーク管理方法
CN105659234A (zh) 普适搜索架构
JP4741301B2 (ja) 情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム
US9026534B2 (en) Method and system to collect and search user-selected content
US20110029538A1 (en) System for creation of content with correlated geospatial and virtual locations by mobile device users
JPWO2009084363A1 (ja) アクセス対象情報検索装置
JP2008140041A (ja) 画像共有サーバ、システム、方法およびプログラム
JP4847517B2 (ja) 自動イントラネットサービス公開及びサービスアクセス
JP2012194989A (ja) 検索方法、統合検索サーバ及びコンピュータプログラム
WO2005062250A2 (en) Distributed knowledge management system
JP5164673B2 (ja) サーバ装置、カタログ処理方法及びプログラム
JP2011129146A (ja) ネットワーク上の情報を自動検索する情報検索システム、情報検索装置、情報検索方法、記録媒体及びプログラム
JP2004157826A (ja) ピアツーピア型文書共有ネットワークシステム
JP2004302564A (ja) ネームサービス提供方法及びその実施装置並びにその処理プログラム
JPWO2015063873A1 (ja) 情報検索システムおよび情報検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080611

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20100623

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20100803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100929

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110506

R150 Certificate of patent or registration of utility model

Ref document number: 4741301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350