JP4719684B2 - 情報検索提供装置および情報検索提供システム - Google Patents

情報検索提供装置および情報検索提供システム Download PDF

Info

Publication number
JP4719684B2
JP4719684B2 JP2006535689A JP2006535689A JP4719684B2 JP 4719684 B2 JP4719684 B2 JP 4719684B2 JP 2006535689 A JP2006535689 A JP 2006535689A JP 2006535689 A JP2006535689 A JP 2006535689A JP 4719684 B2 JP4719684 B2 JP 4719684B2
Authority
JP
Japan
Prior art keywords
content
reliability
information
unit
evaluated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006535689A
Other languages
English (en)
Other versions
JPWO2006027973A1 (ja
Inventor
重樹 上田平
美嗣 上田平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
inta-man kabusikigaisya
Original Assignee
inta-man kabusikigaisya
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by inta-man kabusikigaisya filed Critical inta-man kabusikigaisya
Priority to JP2006535689A priority Critical patent/JP4719684B2/ja
Publication of JPWO2006027973A1 publication Critical patent/JPWO2006027973A1/ja
Application granted granted Critical
Publication of JP4719684B2 publication Critical patent/JP4719684B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

この発明は情報検索提供装置および情報検索提供システムに係るものであり、特にインターネットなどのネットワーク上のウェブページに掲載される、文章、画像やプログラムなどのコンテンツを検索結果として提供する情報検索提供装置および情報検索提供システムに関する。
近年、インターネットの利用が進むにつれ、その主要なアプリケーションであるWWW(World Wide Web)のユーザが激増し、電子化された情報の流通が非常に活発になってきた。それに伴い、情報量の爆発的な増大によってユーザが真に欲する情報を取り出すことが困難になるという問題が生じてきた。このような問題を軽減するために、インターネットなどのネットワーク上において様々な検索エンジンが登場してきた。
過去にユーザが検索を実行し、どのウェブページで目的の情報を見出されたかを推定し、その推定結果から検索キーワードおよびウェブページのURL(Uniform Resource Locator )にポイントを付与し、このポイントの大きい順に、後の検索におけるコンテンツの検索結果としての提示順序を決定する技術が開示されている。
特開2004−29943号公報
確かに、特許文献1によれば、所望の情報が含まれるウェブページがユーザにより見出される可能性は高くなるが、ユーザがウェブページに掲載されているコンテンツを利用したとき、そのコンテンツが信頼のおけないコンテンツであれば、不利益を被る可能性が高い。そのため、そのような不都合を軽減する新たな情報検索サービスの仕組み作りが必要である。
本発明はこうした課題に鑑みてなされたものであり、その目的は信頼のおけるコンテンツと信頼のおけないコンテンツとを選別する新たな情報検索サービスを実現する情報検索提供装置および情報検索提供システムの提供にある。
本発明のある態様は、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、ウェブページに掲載される評価対象のコンテンツをネットワークを介して所定のタイミングで収集する収集部と、収集部による評価対象のコンテンツの収集の可否に応じて、評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、を備える。
この態様によれば、評価対象のコンテンツの収集の可否に応じて当該コンテンツを信頼度の側面から評価することができ、その結果、信頼のおけるコンテンツと信頼のおけないコンテンツとを選別でき、ユーザ利便性の高い情報検索サービスを実現できる。
この態様の情報検索提供装置は、ユーザから検索条件文を受け付ける検索条件文受付部と、受け付けた検索条件文に合致したコンテンツを検索する検索部と、検索されたコンテンツの信頼度をユーザに提示する信頼度提示部と、をさらに備えてもよい。評価対象のコンテンツに含まれる当該コンテンツの存続期間の推測に供する要素に基づいて、評価対象のコンテンツの信頼度を予測する予測部をさらに備え、信頼度提示部は予測された信頼度をユーザに提示してもよい。
信頼度制御部は、収集部により評価対象のコンテンツが所定のタイミングで連続して収集される期間内において、評価対象のコンテンツの信頼度を徐々に増加せしめてもよい。例えば、第1のタイミング以降、収集部により評価対象のコンテンツが収集され、その後、第2のタイミング以降、収集部により評価対象のコンテンツが収集されず、さらにその後、第3のタイミング以降、収集部により評価対象のコンテンツが収集されたとき、増加幅制御部は、第3のタイミングにおける評価対象のコンテンツの信頼度の増加幅を、第1のタイミングにおける評価対象のコンテンツの信頼度の増加幅よりも低く制御してもよい。
この態様の情報検索提供装置は、収集部による評価対象の収集の可否の履歴に応じて当該評価対象のコンテンツの信頼度の増加幅を制御する履歴増加幅制御部をさらに備えてもよい。評価対象のコンテンツと信頼度の高いコンテンツとの関連性の有無を判断する関連性判断部をさらに備え、信頼度制御部は、関連性判断部により関連性があると判断されたときにおける評価対象のコンテンツの信頼度の増加幅を、関連性がないと判断されたときにおける評価対象のコンテンツの信頼度の増加幅よりも高く制御してもよい。
関連性判断部は、評価対象のコンテンツと信頼度の高いコンテンツとの間に関連性があることを示す関連情報が、評価対象のコンテンツ内に含まれるか否かに基づいて、評価対象のコンテンツと信頼度の高いコンテンツとの関連性の有無を判断してもよい。関連性判断部は、信頼度の高いコンテンツ内に、当該コンテンツと評価対象のコンテンツとの間に関連性があることを示す関連情報が含まれるか否かに基づいて、評価対象のコンテンツと信頼度の高いコンテンツとの関連性の有無を判断してもよい。
本発明の別の態様も、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、ウェブページに掲載される評価対象のコンテンツをネットワークを介して所定のタイミングで収集する収集部と、収集された評価対象のコンテンツの内容と、当該コンテンツを掲載するウェブページと同一のウェブページから次に収集される評価対象のコンテンツの内容とを比較する比較部と、比較の結果に基づいて評価対象のコンテンツが更新されたか否かを判断する更新判断部と、判断の結果に応じて評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、を備える。
信頼度制御部は、更新判断部により評価対象のコンテンツが更新されていると所定のタイミングで連続して判断される期間内において、評価対象のコンテンツの信頼度を徐々に増加せしめてもよい。収集された評価対象のコンテンツの内容を参照し当該コンテンツが本来更新を必要とするべきものであるか否かを分析する更新分析部をさらに備え、信頼度制御部は、更新判断部による判断の結果および更新分析部による分析の結果に応じて、評価対象のコンテンツの信頼度を増減せしめてもよい。
本発明のさらに別の態様も、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、評価対象のコンテンツに関連するコンテンツを取得する関連コンテンツ取得部と、取得されたコンテンツを参照し評価対象のコンテンツの信頼度の増加あるいは減少に貢献する要素を抽出する要素抽出部と、抽出された要素を参照して評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、を備える。
要素抽出部は、信頼度の評価の観点ごとに、評価対象のコンテンツの信頼度の増加あるいは減少に貢献する要素を抽出するものであり、信頼度制御部は、信頼度の評価の観点ごとに抽出された要素を参照して、評価対象のコンテンツの信頼度を増減せしめてもよい。
この態様の情報検索提供装置は、抽出された要素それぞれを、評価対象のコンテンツの信頼度の増加に貢献する第1グループ、あるいは評価対象のコンテンツの信頼度の減少に貢献する第2グループに分類する分類部をさらに備え、信頼度制御部は、分類部により分類された第1グループ内の要素数が第2グループ内の要素数よりも多いとき、評価対象のコンテンツの信頼度を増加せしめてもよい。
本発明のさらに別の態様も、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、判断対象項目を含むコンテンツを取得するコンテンツ取得部と、取得されたコンテンツのうち判断対象項目の情報発生源となる自コンテンツを特定するコンテンツ特定部と、特定された自コンテンツの内容と取得されたコンテンツのうち自コンテンツ以外の他コンテンツの内容とを比較し、判断対象項目の整合性の有無を判断する整合性判断部と、判断の結果に応じて自コンテンツの信頼度と他コンテンツの信頼度とを増減せしめる信頼度制御部と、を備える。
この態様の情報検索提供装置は、自コンテンツの信頼度と他コンテンツの信頼度とがともに高いときであって、整合性判断部により判断対象項目について整合性有りと判断されたとき、信頼度制御部は自コンテンツの信頼度と他コンテンツの信頼度とをともに増加せしめてもよい。
上述の情報検索提供装置は、ウェブページを公開するサーバの所在を示す所在情報を参照して当該サーバにアクセスするアクセス部と、アクセス部によるサーバへのアクセスの可否を判断するアクセス可否判断部と、アクセス可否判断部による判断の結果とアクセス部によりサーバにアクセスしたタイミングとの対応関係を保持するアクセス履歴保持部と、対応関係を参照しアクセス部によるサーバへのアクセスが最初に可能になったタイミングを特定するタイミング特定部と、をさらに備え、信頼度制御部は特定されたタイミングにて信頼度の増減の制御を開始してもよい。
本発明のさらに別の態様は、情報検索提供システムに関する。この情報検索提供システムは、ネットワーク上に接続される端末装置と、ネットワークを介してウェブページを提供するサーバと、当該サーバ上のウェブページに掲載されるコンテンツを収集し、収集されたコンテンツのうち検索条件文に合致したコンテンツを検索結果として端末装置に提供する情報検索提供装置と、を含む情報検索提供システムであって、情報検索提供装置は、ウェブページに掲載される評価対象のコンテンツをネットワークを介して所定のタイミングで収集する収集部と、収集部による評価対象のコンテンツの収集の可否に応じて、評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、を備える。
本発明のさらに別の態様は、情報検索提供システムに関する。この情報検索提供システムは、評価対象のコンテンツをウェブページに掲載するコンテンツ提供装置と、ネットワークを介して評価対象のコンテンツにアクセスする端末装置と、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置と、を備え、端末装置は、端末装置に付随するクライアント情報を発信する情報発信部を有し、情報検索提供装置は、評価対象のコンテンツにネットワークを介してアクセスした端末装置から発信されたクライアント情報を直接的または間接的に受信する情報受信部と、クライアント情報に基づいて、評価対象のコンテンツの信頼度を増減せしめる信頼度増減部と、を有する。
本発明のさらに別の態様は、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、評価対象のコンテンツにアクセスした端末装置から発信されたクライアント情報を直接的または間接的に受信する情報受信部と、クライアント情報に基づいて、評価対象のコンテンツの信頼度を増減せしめる信頼度増減部と、を有する。
本発明のさらに別の態様は、情報検索提供システムに関する。この情報検索提供システムは、評価対象のコンテンツをウェブページに掲載するコンテンツ提供装置と、ネットワークを介して評価対象のコンテンツにアクセスする端末装置と、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置と、を備え、端末装置は、端末装置に付随するクライアント情報を発信する情報発信部を有し、情報検索提供装置は、評価対象のコンテンツにネットワークを介してアクセスした端末装置から発信されたクライアント情報を直接的または間接的に受信する情報受信部と、クライアント情報に基づいて、評価対象のコンテンツに対して見積もられる資産価値を増減せしめる資産価値増減部と、を有する。
本発明のさらに別の態様は、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、評価対象のコンテンツにアクセスした端末装置から発信されたクライアント情報を直接的または間接的に受信する情報受信部と、クライアント情報に基づいて、評価対象のコンテンツに対して見積もられる資産価値を増減せしめる資産価値増減部と、を有する。
本発明のさらに別の態様は、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、ウェブページに掲載される評価対象のコンテンツおよび評価対象のコンテンツ以外の比較用コンテンツをネットワークを介して所定のタイミングで収集する収集部と、評価対象のコンテンツおよび比較用コンテンツについて、評価対象のコンテンツの提供者に関連する判定項目の掲載状況をそれぞれ取得し、評価対象のコンテンツにおける判定項目の掲載状況と比較用コンテンツにおける判定項目の掲載状況とを比較することにより、評価対象のコンテンツが適切に更新されているか否かを判断する更新判断部と、更新判断部の結果に応じて評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、を備える。
本発明のさらに別の態様は、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、ウェブページに掲載される評価対象のコンテンツをネットワークを介して所定のタイミングで収集する収集部と、異なるタイミングで収集された評価対象のコンテンツの同一性を判断する同一性判断部と、同一性の判断結果に応じて、評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、備える。
本発明のさらに別の態様は、情報検索提供装置に関する。この情報検索提供装置は、検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、ウェブページに掲載される評価対象のコンテンツおよび評価対象のコンテンツ以外の比較用コンテンツをネットワークを介して所定のタイミングで収集する収集部と、評価対象のコンテンツと、評価対象のコンテンツが収集された時点で収集済みの比較用コンテンツとを比較して、評価対象のコンテンツの独自性を判断する独自性判断部と、独自性の判断結果に応じて、評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、を備える。
本発明によれば、ユーザ利便性の高い情報検索サービスを提供できる。
実施の形態1に係る情報検索提供システムの構成を示す図である。 実施の形態1に係る端末装置の構成を示す図である。 実施の形態1に係る情報検索提供装置の構成を示す図である。 検索情報保持部に格納される検索情報ファイルのデータ構造の一例を示す図である。 アクセス履歴保持部に格納されたアクセス履歴ファイルのデータ構造の一例を示す図である。 実施の形態1に係るコンテンツ収集処理の流れを示す図である。 継続的に収集可能である場合の評価対象のコンテンツの信頼度と時間との関係を示す図である。 評価対象のコンテンツが途中、収集不可能となった場合のコンテンツの信頼度と時間との関係を示す図である。 実施の形態2に係る情報検索提供装置の構成を示す図である。 評価対象のコンテンツの信頼度と時間との関係を示す図である。 実施の形態3に係る情報検索提供装置の構成を示す図である。 図12(a)は、評価対象のコンテンツが連続して更新されるときの信頼度と時間との関係を示し、図12(b)は、評価対象のコンテンツが途中更新されなくなったときの信頼度と時間との関係を示す図である。 実施の形態4に係る情報検索提供装置の構成を示す図である。 実施の形態5に係る情報検索提供装置の構成を示す図である。 評価対象のコンテンツに途中、リンク切れが生じた場合のコンテンツの信頼度と時間との関係を示す図である。 実施の形態6に係る情報検索提供装置の構成を示す図である。 実施の形態7に係る情報検索提供装置の構成を示す図である。 自己コンテンツと他者コンテンツとの信頼度の相関関係を模式的に示す図である。 検索初期画面の一例を示す図である。 検索結果画面の一例を示す図である。 実施の形態9に係る情報検索提供システムの構成を示す図である。 実施の形態9に係るネットワーク利用端末装置の構成を示す図である。 実施の形態9に係るウェブサーバの構成を示す図である。 実施の形態9に係る情報検索提供装置の構成を示す図である。 実施の形態9に係る受信情報保持部に格納された受信情報のデータ構造の一例を示す図である。 実施の形態9に係る検索情報保持部に格納された検索情報ファイルのデータ構造の一例を示す図である。 実施の形態9に係る受信した情報による信頼度増減処理の流れを示すフローチャートである。 実施の形態10に係る情報検索提供装置の構成を示す図である。 実施の形態10に係る取得コンテンツ情報保持部に格納された検索情報ファイルのデータ構造の一例を示す図である。 実施の形態10に係る検索情報保持部に格納された受信情報のデータ構造の一例を示す図である。 実施の形態10に係るイベント保持部に格納された検索情報ファイルのデータ構造の一例を示す図である。 実施の形態10に係る依頼情報保持部に格納されたデータ構造の一例を示す図である。 実施の形態11に係る情報検索提供装置の構成を示す図である。 実施の形態12に係る情報検索提供装置の構成を示す図である。 比較用コンテンツ保持部に格納された比較用コンテンツ情報ファイルの一例を示す図である。 実施の形態13に係る情報検索提供装置の構成を示す図である。 検索情報保持部に格納された検索情報ファイルのデータ構造の一例を示す図である。 グループ化情報保持部に格納されたIPアドレス情報テーブルの一例を示す図である。 所在情報信頼度保持部に格納された各種信頼度テーブルの一例を示す図である。 所在情報信頼度保持部に格納された各種信頼度テーブルの一例を示す図である。 所在情報信頼度保持部に格納された各種信頼度テーブルの一例を示す図である。 ドメイン名種別テーブルの一例を示す図である。
符号の説明
10 情報検索提供システム、 12 ネットワーク、 50 端末装置、 54 取得部、 100 情報検索提供装置、 112 検索条件文取得部、 114 検索部、 122 アクセス部、 124 アクセス可否判断部、 126 タイミング特定部、 128 収集部、 130 信頼度制御部、 132 履歴増加幅制御部、 134 関連性判断部、 136 比較部、 138 更新判断部、 142 関連コンテンツ取得部、 144 要素抽出部、 146 分類部、 147 コンテンツ取得部、 148 自コンテンツ特定部、 150 整合性判断部、 190 アクセス履歴保持部、200 ウェブサーバ、 R1 自コンテンツ。
(実施の形態1)
図1は、本実施の形態に係る情報検索提供システム10の構成を示す。図1に示す情報検索提供システム10は、情報検索提供装置100と、ウェブサーバ200と、ネットワーク12とを備える。ネットワーク12には、情報検索提供装置100と、ウェブサーバ200と、端末装置50とが接続されている。本実施の形態に係るネットワーク12はWAN(Wide Area Network)であるが、別の例として、例えばLAN(Local Area Network)、あるいは所定のデータをTCP/IP(Transmission Control Protocol/Internet Protocol )等の通信規格に準じて送受信する通信網であってよい。端末装置50は、パーソナルコンピュータ、PDA(Personal Digital Assistance)、あるいは携帯電話であり、一方、情報検索提供装置100やウェブサーバ200はパーソナルコンピュータなどで実装される。ウェブサーバ200はウェブページに掲載したコンテンツをネットワーク12を介して公開する。コンテンツとはテキストデータ、映像データ、動画データ、音声データなど電子化可能なデータを指す。
ユーザは、端末装置50に搭載される図示しないWWWブラウザを用いて情報検索提供装置100にアクセスし、検索条件文を指定して検索を行う。情報検索提供装置100は、その検索条件文による検索実行指示を受けて、図1では図示しないデータベースに保持されている膨大な量の情報の中から、検索条件文に合致したコンテンツと当該コンテンツに付随する情報(以下、「コンテンツ付随情報」という)とを抽出し、それらを一覧化したものを検索結果として端末装置50に提供する。このとき、さらにコンテンツの信頼度が提示される。コンテンツ付随情報はウェブページのURL、コンテンツのサイズ、コンテンツの更新日付、コンテンツの表題などを含む。なお、データベースに保持されている膨大な量のコンテンツは、情報検索提供装置100内の図1では図示しない収集制御部によりウェブページから定期的あるいは不定期に収集される。
図2は、本実施の形態に係る端末装置50の構成を示す。端末装置50は、検索条件文受付部62と、送信部52と、取得部54と、表示部64とを備える。検索条件文受付部62は、キーボード、マウス、その他の外部機器を介してユーザから入力されたデータ、ここでは検索条件文を取得する。検索条件文は、例えば「牛肉」、「料理」、「レシピ」のようなキーワード単位の形式でもよいし、「牛肉を使った料理のレシピが知りたい」というように自然文の形式でもよい。
送信部52は検索条件文受付部62により取得されたユーザからの検索条件文をネットワーク12を介して情報検索提供装置100に送信する。このとき、情報検索提供装置100による検索処理が行われる。取得部54は、検索結果として、検索条件文に合致したコンテンツやコンテンツ付随情報、例えば当該コンテンツのサイズやURLの一覧をネットワーク12を介して取得する。このとき、さらに、コンテンツの信頼度が提示される。表示部64は取得部54により取得された情報を整形し、図示しないディスプレイを介してユーザに表示する。なお、図示しないスピーカを介して音声によりユーザに通知してもよい。
図3は、本実施の形態に係る情報検索提供装置100の構成を示す。情報検索提供装置100は、ユーザから指定された検索条件文に合致したコンテンツを検索し検索結果として端末装置50に提供する検索制御部110と、ウェブサーバ200上のウェブページに掲載されるコンテンツを定期的あるいは不定期に収集する収集制御部120と、収集されたコンテンツを保持する検索情報保持部180と、収集制御部120によるウェブサーバへのアクセス履歴を保持するアクセス履歴保持部190とを備える。検索制御部110は、検索条件文取得部112と、検索部114と、検索結果提供部116と、信頼度提示部118とを備える。収集制御部120は、アクセス部122と、アクセス可否判断部124と、タイミング特定部126と、収集部128と、信頼度制御部130と、履歴増加幅制御部132とを備える。
情報検索提供装置100の各構成要素は、ハードウエアコンポーネントでいえば、任意のコンピュータのCPU(Central Processing Unit )、メモリ、その他の素子、およびソフトウエアとしてメモリにロードされた情報検索、収集機能、記憶機能、およびその他機能のあるプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組み合わせによっていろいろな形で実現できることは、当業者には理解されるところである。
検索条件文取得部112は送信部52により送信されたユーザからの検索条件文を取得する。このとき、検索条件文が自然文の形式であれば、検索条件文取得部112はその検索条件文を一度、図示しないキーワード抽出部に送ってもよい。このとき、キーワード抽出部は、形態素へ分解し、主に名詞、先の検索条件文の例で言えば、「牛肉」、「料理」、「レシピ」などをキーワードとして抽出し、検索条件文取得部112は、それらキーワードを組み合わせたものを新たな検索条件文として取得する。
検索部114は、検索情報保持部180に格納されている検索情報ファイルから、検索条件文取得部112で取得された検索条件文に合致したコンテンツ、当該コンテンツの信頼度やコンテンツ付随情報を検索する。このとき、検索部114は、検索情報保持部180に格納されているコンテンツに対する索引語を含むファイル、いわゆるインデックスファイルを利用して検索を行ってもよい。これにより検索処理の高速化を実現できる。検索結果提供部116は、検索により得られた情報を一覧化したものを検索結果として端末装置50に提供する。このとき、信頼度提示部118は検索されたコンテンツの後述する信頼度を端末装置50に提示する。これにより、ユーザはコンテンツがどの程度の信頼度を有するかを知ることができる。
アクセス部122は、後述するアクセス履歴保持部190内のアクセス履歴ファイルに含まれるウェブサーバ200の所在を示す所在情報、例えばIPアドレスを参照して、ウェブサーバ200にアクセスする。別の例として、アクセス部122はウェブページのURLやドメイン名を参照して、当該ウェブページにアクセスしてもよい。本実施の形態に係るアクセス部122は、アクセス履歴ファイルに含まれる、未使用のIPアドレスを含むすべてのIPアドレスに対し、一日に一回、例えば午前0時に順番にアクセスするものとする。なお、アクセス部122によるアクセスの頻度は「一日に一回」に限定されるものではなく、「一日に二回」でも「二日に一回」でもよい。アクセス部122は定期的ではなく不定期にアクセスしてもよい。
アクセス可否判断部124は、アクセス部122によるウェブページへのアクセスの可否を判断する。このとき、アクセス可否判断部124は、アクセスが不可能であったと判断したとき、当該IPアドレスでかつ後述のアクセス履歴欄内の現在の日付の欄にフラグ「×」を設定する。一方、アクセス可否判断部124は、アクセス部122によるアクセスが可能であったと判断したとき、当該IPアドレスでかつ後述のアクセス履歴欄内の現在の日付の欄にフラグ「○」を設定する。
タイミング特定部126はアクセス履歴ファイルを参照しアクセス部122によるウェブページへのアクセスが最初に可能になったタイミングを特定する。具体的には、タイミング特定部126は、過去のアクセス履歴が今まで「×」であったが、最初に「○」になった日をウェブページの提供開始日とする。タイミング特定部126は現在の日付がウェブページの提供開始日に相当すると判断したとき、後述のウェブページ提供開始日欄に現在の日付を設定する。すでにウェブページがネットワーク12上に存在し、以後にアクセス部122によるアクセスがあったとき、タイミング特定部126はアクセスがあったときの日付をウェブページの提供開始日に相当すると判断してもよい。
ところで、近年、インターネットに接続されるサーバの増加に伴い、IPアドレスの枯渇化が問題になっている。本実施の形態によれば、長期間「×」であるIPアドレスを未使用とすることで、未使用のIPアドレスを特定できる。その結果、IPアドレスを管理する第三者機関などが、その未使用のIPアドレスを他のIPアドレスの取得を望む情報提供者に提供することで、効果的にIPアドレスを活用できる。
アクセス履歴保持部190は、アクセス可否判断部124による判断の結果とアクセス部122によりウェブページにアクセスしたタイミングとの対応関係を含むアクセス履歴ファイルを保持する。アクセス履歴ファイルには、ネットワーク12上に存在する可能な限りすべてのIPアドレスが保持されているものとする。もちろん、すべてではなく一部のIPアドレスが保持されていてもよい。検索情報保持部180は後述する収集部128により収集されたコンテンツ、コンテンツ付随情報、信頼度などを含む検索情報ファイルを保持する。
収集部128は、アクセス可否判断部124によりウェブページへのアクセスが可能であったと判断されたとき、そのウェブページに掲載される評価対象のコンテンツを所定のタイミングで、ここでは一日に一回収集する。なお、アクセス部122によりIPアドレスやドメイン名を利用したアクセスがあったときは、収集部128は、ウェブサーバ上のすべてのウェブページが掲載するコンテンツを収集してもよい。コンテンツ収集の際、収集部128は収集されたコンテンツのコンテンツ付随情報を生成し、検索情報保持部180に格納する。収集部128は、コンテンツ内のHTML(Hyper Text Markup Language)文の先頭箇所、例えば<HEAD>〜</HEAD>間にメタタグが記載されていれば、このメタタグで囲まれる領域内に記述された指示内容に従ってもよい。すなわち、情報検索提供装置100への登録の不要が明示されていれば収集部128は当該ページの情報を収集しなくてもよい。
信頼度制御部130は収集部128による評価対象のコンテンツの収集の可否に応じて、評価対象のコンテンツの信頼度を所定のタイミングで、ここでは一日に一回増減せしめる。具体的には、信頼度制御部130は、評価対象のコンテンツをウェブページから収集できたとき、当該評価対象のコンテンツに設定された信頼度を所定の増加幅分だけ増加させる。一方、収集部128により評価対象のコンテンツをウェブページから収集できなかったとき、当該評価対象のコンテンツに設定された信頼度を減少させる。なお、信頼度制御部130はウェブページの提供開始日から、そのウェブページに掲載されるコンテンツの信頼度の増減の制御を開始する。
さらに、信頼度制御部130は、収集部128により評価対象のコンテンツが所定のタイミングで連続して収集される期間内において、評価対象のコンテンツの信頼度を徐々に増加させる。なお、本実施の形態では、コンテンツの信頼度を増減させているが、これは実質的にコンテンツを掲載するウェブページの信頼度、当該ウェブページを公開するウェブサーバや当該ウェブサーバを運営する情報提供者の信頼度を増減させることと同意である。さらに、当該ウェブサーバを運営する情報提供者が提供するコンピュータシステムに含まれる、他の各種サービス提供サーバ、例えば、メールサーバやFTP(File Transfer Protocol )サーバやニュースサーバなどの信頼度を増減させることと実質的に同意である。
本実施の形態に係る情報検索提供装置100によれば、コンテンツに信頼度を設定することで、そのコンテンツがどの程度の信頼度を有するのかをユーザに提示できる。その結果、ユーザは、情報検索提供装置100が提供する情報検索サービスを通じて、コンテンツの信頼度を手軽に知ることができる。例えば、ある会社が他の企業と取引するとき、相手の素性を知りたいときがある。このとき、その企業が提供するウェブページの信頼度を情報検索提供装置100による検索結果を通じて知ることができる。海外企業と取引するとき、国内企業と比較して相手の素性が分からない場合が多いため、特に有意義である。さらに、企業の信用を調査する調査機関への取引先の信用調査依頼を省くことができるため、手間やコストを削減できる。
本実施の形態に係る情報検索提供装置100によれば、ウェブページに連続してコンテンツを掲載しているほど信頼度を上昇させていく。そのため、ウェブサーバ200が昔から安定してウェブページを提供していればいるほど、信頼度が高く設定されようになる。ウェブページが、例えばインターネットショッピングサービスを提供するショッピングモールのページであり、そのウェブページに掲載されるコンテンツの信頼度が高ければ、ユーザはウェブページを提供する提供者が以前から安定して商売を続けていることを知ることができる。逆にその信頼度が低ければ、ウェブページの提供者は商売を開始して間もないか、ウェブページを転々とするいわゆる悪徳業者である可能性が高い。
本実施の形態に係る情報検索提供装置100によれば、信頼のおけるコンテンツと信頼のおけないコンテンツとを信頼度をもとに選別してユーザに提示することで、ユーザは検索結果の中から信頼度の高いコンテンツのみを選択できる。これにより、ユーザは信頼度の高いコンテンツを選択することで、優良業者から提供されるサービスを利用できる。その結果、情報検索提供装置100はユーザ利便性の高い検索サービスを実現できる。
履歴増加幅制御部132は、収集部128による評価対象のコンテンツの収集の可否の履歴に応じて当該評価対象のコンテンツの信頼度の増加幅を制御する。例えば、「2004年1月1日」以降、収集部128により評価対象のコンテンツが収集され、その後、「2004年2月1日」以降、収集部128により評価対象のコンテンツが収集されず、さらにその後、「2004年3月1日」以降、収集部128により評価対象のコンテンツが収集されたとき、履歴増加幅制御部132は、「2004年3月1日」における評価対象のコンテンツの信頼度の増加幅を、「2004年1月1日」における評価対象のコンテンツの信頼度の増加幅よりも低く制御する。なお、履歴増加幅制御部132は、一定期間が経過すれば、低く制御したコンテンツの信頼度の増加幅を、低く制御しないときに想定されるもとの増加幅に戻してもよい。具体的には、「2004年3月1日」での増加幅の減少分を、1年後の「2005年3月1日」に、現在の信頼度の増加幅に加えてもよい。
これにより、昔から継続してコンテンツが収集可能であったときのウェブページの信頼度の増加幅は、途中、コンテンツが収集不可能となったときのウェブページ信頼度の増加幅よりも大きくなり、両者の増加幅を差別化することができる。その結果、コンテンツを継続して提供することの重要性をさらに高めることができる。
図4は、検索情報保持部180に格納される検索情報ファイルのデータ構造の一例を示す。図4における検索情報ファイルは、IPアドレス欄302と、URL欄304と、コンテンツ欄306と、ウェブページ提供開始日欄308と、信頼度欄310と、増加幅欄312とを含む。収集部128により収集されたコンテンツはコンテンツ欄306に、コンテンツ付随情報の一部の情報であるURLはURL欄304に格納される。
IPアドレス欄302は、ネットワーク12に接続されるウェブサーバ200のIPアドレスを含む。本図のIPアドレス欄302に格納されているIPアドレスはIPv4形式であるが別の例としてIPv6形式であってもよい。URL欄304はネットワーク12上におけるウェブページの所在を示す情報、いわゆるURLを備える。コンテンツ欄306には、収集部128により収集されたコンテンツ、本図では、HTML(Hyper Text Markup Language)言語で記述されたテキストデータを含む。ウェブページ提供開始日欄308はウェブサーバ200がウェブページの提供を開始した日を含む。信頼度欄310は、ウェブページに掲載されるコンテンツの信頼度を含む。増加幅欄312は信頼度の増加幅を含む。
例えば、データ314について言えば、ウェブサーバ200のIPアドレスが「200.100.100.001」、ウェブサーバ200上のウェブページのURLが「http://〜1/」、ウェブページの提供開始日は「2004年1月1日」、現在のコンテンツの信頼度は「600」で、信頼度の増加幅は「5」であることを示す。すなわち、URLが「http://〜1/」であるウェブページに掲載されるコンテンツの信頼度は、コンテンツがそのウェブページ内に掲載される期間内において、所定のタイミングで、ここでは一日に一回「5」ずつ増加されることを示す。
図5は、アクセス履歴保持部190に格納されたアクセス履歴ファイルのデータ構造の一例を示す。図4と同等の構成には同じ符号を与え適宜説明を略す。図5におけるデータ表は、IPアドレス欄302とアクセス履歴欄322を含む。アクセス履歴欄322は、アクセス部122によりウェブサーバ200にアクセスできたか否かを示す情報をアクセス履歴として保持する。具体的には、特定の日にフラグ「○」が格納されていれば、当該日はウェブページへのアクセスが可能であったことを示し、一方、フラグ「×」が格納されていれば、ウェブページへのアクセスが不可能であったことを示す。
本図では便宜のため、「1月2日」から「5月1日」までの期間、「5月5日」から「5月30日」までの期間、および「6月3日」から「8月31日」までの期間についてのアクセス履歴の表示を省略しているが、それぞれの期間内におけるアクセス履歴は、それぞれの期間の開始日の前日におけるフラグの値をそのまま保持するものとする。なお、本図では「2004年1月1日」から現在の日付である「2004年9月1日」までのアクセス履歴を示しているが、もちろん、アクセス履歴欄322は「2003年12月31日」以前のアクセス履歴を備えてもよい。
例えば、第1データ324について言えば、ウェブサーバ200のIPアドレスが「200.100.100.001」であり、「1月1日」から現在の日付である「9月1日」まで、アクセス部122によるウェブページへのアクセスが可能であったことを示している。すなわち、ウェブサーバ200はその期間中、継続的にウェブページを提供していることを示す。一方、第2データ326について言えば、「5月31日」までウェブページへのアクセスが不可能で、「6月1日」以降、ウェブページへのアクセスが可能であったことを示している。すなわち、IPアドレスが「200.100.100.002」であるウェブサーバ200上のウェブページが「6月1日」に提供開始されたことを示す。さらに、第3データ328によれば、IPアドレスが「200.100.100.003」であるウェブサーバ200は「5月3日」にウェブページの提供を開始したが、「5月4日」以降は、ウェブページを提供していない。なお、信頼度の増減制御の開始日は、例えば第2データ326について言えば、「6月1日」である。
図6は、本実施の形態に係るコンテンツ収集処理の流れを示す。情報検索提供装置100は、アクセス履歴ファイルに記録されているすべてのIPアドレスについて、一日に一回、以下のコンテンツ収集処理を行う。アクセス部122は、アクセス履歴保持部190に格納されているアクセス履歴ファイルの中からコンテンツ収集対象のウェブサーバ200のIPアドレスを取得し(S10)、ウェブサーバ200にアクセスする。アクセス可否判断部124は、アクセス部122によるウェブサーバ200へのアクセスの可否を判断し、アクセスが不可能であったと判断したとき(S12のN)、当該IPアドレスでかつアクセス履歴欄322内の現在の日付の欄にフラグ「×」を設定する(S14)。
アクセス可否判断部124は、アクセス部122によるアクセスが可能であったと判断したとき(S12のY)、当該IPアドレスでかつアクセス履歴欄322内の現在の日付の欄にフラグ「○」を設定する(S18)。タイミング特定部126はアクセス履歴ファイルを参照し、現在の日付がウェブページの提供開始日に相当すると判断したとき(S20のY)、ウェブページ提供開始日欄308に現在の日付を設定する。タイミング特定部126は現在の日付がウェブページの提供開始日に相当しないと判断したとき(S20のN)、ウェブページ提供開始日欄308に現在の日付を設定する動作をスキップする。
収集部128により当該IPアドレスのウェブサーバ上のウェブページに掲載されるコンテンツの収集が可能であったとき(S24のY)、収集部128は検索情報ファイル内のコンテンツ欄306にコンテンツを格納する(S26)。このとき、コンテンツ付随情報も格納する。履歴増加幅制御部132はアクセス履歴ファイルを参照し、現在の日付の前日にアクセス部122によるアクセスが不可能であったと判断したとき(S28のY)、増加幅を「1」減少させ(S30)、信頼度制御部130は現在のコンテンツの信頼度を増加幅分だけ増加させる(S32)。履歴増加幅制御部132は、アクセス履歴ファイルを参照し、現在の日付の前日にアクセス部122によるアクセスが不可能でなかったと判断したとき(S28のN)、信頼度制御部130は現在のコンテンツの信頼度を増加幅分だけ増加させる(S32)。
収集部128により当該IPアドレスのウェブページに掲載されるコンテンツの収集が不可能であったとき(S24のN)、信頼度制御部130は現在のコンテンツの信頼度を減少させる(S34)。収集制御部120は、アクセス履歴ファイル中のすべてのIPアドレスに対しコンテンツ収集処理が終了したか否かを判断し、コンテンツ収集処理が終了していないIPアドレスがあれば(S16のN)、そのIPアドレスについて、コンテンツ収集処理を実施する。終了していれば、情報検索提供装置100はその日のコンテンツ収集処理を終了する(S16のY)。
図7は、評価対象のコンテンツが継続的に収集可能である場合の評価対象のコンテンツの信頼度と時間との関係を示す。縦軸はコンテンツの信頼度、横軸は時間を示す。図中の日付D0はウェブページの提供開始日であり、当該日以降の日を一日経過するごとの日付を日付D1〜D4と示す。本実施の形態では、一日経過するごとにコンテンツの信頼度が上下するため、実際の信頼度は離散値として表現されるが、当然ながら時間の経過とともに連続的に信頼度が変動するとしてもよく、本図ではその様子を示す。図示のごとく、収集部128により継続して評価対象のコンテンツが収集できる期間内、すなわち日付D1以降の期間内において、評価対象のコンテンツの信頼度が徐々に増加している。
図8は、評価対象のコンテンツが途中、収集不可能となった場合のコンテンツの信頼度と時間との関係を示す。縦軸はコンテンツの信頼度、横軸は時間を示す。図7と同等のものには同じ符号を与え適宜説明を略す。本図では、日付D0にウェブページの提供が開始され、当該日以降そのウェブページに掲載されるコンテンツの収集が可能であり、日付D2以降コンテンツの収集が不可能になるが、日付D3以降再度コンテンツの収集が可能になるときの信頼度の変化の様子を示す。コンテンツの収集可能な期間である、日付D0から日付D2までの期間および日付D3以降の期間内において、信頼度制御部130によりコンテンツの信頼度は徐々に増加されているが、履歴増加幅制御部132により後者の期間内における信頼度の増加幅は前者の期間内における信頼度の増加幅よりも小さく制御されている。
(実施の形態2)
実施の形態1では評価対象のコンテンツの収集が可能であったか否かに応じて当該コンテンツの信頼度を増減させたが、実施の形態2では収集の可否の結果に加え、評価対象のコンテンツと信頼度の高いコンテンツとの関連性の有無の結果を評価対象のコンテンツの信頼度の増減に反映させる。図9は、実施の形態2に係る情報検索提供装置100の構成を示す。図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態2に係る情報検索提供装置100には、図3に示した実施の形態1に係る情報検索提供装置100と異なる構成要素である関連性判断部134がさらに設けられる。
関連性判断部134は、信頼度の高いコンテンツ内に、当該コンテンツと評価対象のコンテンツとの間に関連性があることを示す関連情報が含まれるか否かに基づいて、評価対象のコンテンツと信頼度の高いコンテンツとの関連性の有無を判断する。このとき、例えば、関連性判断部134は、信頼度の高いコンテンツ内に、当該関連情報、例えば信頼度の高いコンテンツから評価対象のコンテンツへのリンクが含まれているかどうか判断する。具体的には、関連性判断部134は、信頼度の高いコンテンツに含まれるタグ<A HREF="〜">内の「〜」に、評価対象のコンテンツのURLが含まれているかどうか判断する。他の例で言えば、関連性判断部134は、信頼度の高いコンテンツ内の出店情報欄、紹介情報欄、提携情報欄や推薦情報欄内などに、評価対象のコンテンツからのリンク、評価対象のコンテンツを掲載するウェブページのURLやそのウェブページの情報提供者の名称があるか否かを判断する。このとき、それらの情報は関連性判断部134により検索情報ファイルから取得される。
信頼度制御部130は、関連性判断部134により関連性があると判断されたときにおける評価対象のコンテンツの信頼度の増加幅を、関連性がないと判断されたときにおける評価対象のコンテンツの信頼度の増加幅よりも高く制御する。これにより、例えば、信頼度の高いウェブページ内に評価対象のコンテンツへのリンクがある場合とない場合とで、評価対象のコンテンツの信頼度を差別化できる。
信頼度制御部130は、複数の信頼度の高いコンテンツにわたって、評価対象のコンテンツのURLと合致するURLがあれば合致する信頼度の高いコンテンツの数だけ信頼度の増加幅を増加させてもよい。例えば、三つの信頼度の高いコンテンツ内に、評価対象のコンテンツのURLと合致するURLがあれば、評価対象のコンテンツの現在の増加幅にさらに「3」を加算する。これにより、より多くの信頼度の高いコンテンツ内に、信頼度の高いコンテンツから評価対象のコンテンツへのリンクが張られれば張られるほど、信頼度の増加幅を大きくすることができる。
また、信頼度制御部130は、複数の信頼度の高いコンテンツにわたって、当該コンテンツ内の出店情報欄、紹介情報欄、提携情報欄や推薦情報欄内に、評価対象のコンテンツからのリンク、評価対象のコンテンツを掲載するウェブページのURLやそのウェブページの情報提供者の名称が含まれていれば、含まれる信頼度の高いコンテンツの数だけ評価対象のコンテンツの信頼度の増加幅を増加させてもよい。例えば、含まれる信頼度の高いコンテンツの数が二つであれば、評価対象のコンテンツの現在の増加幅にさらに「2」を加算する。
信頼度の高いコンテンツの情報提供者は、評価対象のコンテンツの情報提供者から見て第三者であるため、通常、評価対象のコンテンツの情報提供者はその信頼度の高いコンテンツの内容を勝手に変更することはできない。よって、信頼度の高いコンテンツ内に、信頼度の高いコンテンツから評価対象のコンテンツへのリンクや評価対象のコンテンツを紹介する等の情報が掲載されていれば、その事実は尊重されるべきである。上述のごとく、本実施の形態に係る信頼度制御部130は、上述のリンクや情報が掲載されている場合における信頼度の増加幅を、それらが掲載されていない場合における信頼度の増加幅よりも高く制御することで、両者の差別化を図っている。
図10は、評価対象のコンテンツの信頼度と時間との関係を示す。縦軸はコンテンツの信頼度、横軸は時間を示す。図7と同等のものには同じ符号を与え適宜説明を略す。図中実線L1は、信頼度の高いコンテンツ内に評価対象のコンテンツへのリンクが張られていない場合の評価対象のコンテンツの信頼度の変化の様子を示し、一方、実線L2は、日付D0に関連性判断部134により関連性があると判断され、当該日以降信頼度の高いコンテンツ内に評価対象のコンテンツへのリンクが張られている場合の評価対象のコンテンツの信頼度の変化の様子を示す。実線L2の場合における信頼度の増加幅は、実線L2の場合における信頼度の増加幅よりも大きいため、実線L2は実線L1の信頼度を上回る。
(実施の形態3)
実施の形態1では評価対象のコンテンツの収集可否に応じて当該コンテンツの信頼度を増減させたが、実施の形態3では当該コンテンツが更新されているか否かに応じて当該コンテンツの信頼度を増減させる。図11は、実施の形態3に係る情報検索提供装置100の構成を示す。図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態3に係る情報検索提供装置100には、図3に示した実施の形態1に係る情報検索提供装置100の履歴増加幅制御部132のかわりに、新たな構成要素である比較部136および更新判断部138がさらに設けられる。
比較部136は、収集部128により収集された評価対象のコンテンツの内容と、当該コンテンツを掲載するウェブページと同一のウェブページから収集される次の評価対象のコンテンツの内容とを比較する。比較の際、比較部136は、例えば、両者のコンテンツに含まれるHTML言語構造、テキスト文字、画像やプログラムを参照する。比較部136は内部に、HTML言語構造、テキスト文字、画像やプログラムの変位量を解析する図示しない変位量解析部を備えてもよい。比較部136は、ウェブページ固有の情報である、例えば、企業名、住所や電話番号について比較してもよい。前回収集されたコンテンツに記載されていた企業名、住所や電話番号が次に収集されたコンテンツにおいて理由無く変更されていたとき、信頼度制御部130によりコンテンツの信頼度は減少される。
更新判断部138は、比較部136による比較の結果に基づいて評価対象のコンテンツが更新されたか否かを判断する。このとき、更新判断部138は、前回収集したコンテンツの内容と次に収集されたコンテンツの内容とに含まれる、例えば文字が所定数以上、相違があったときに、評価対象のコンテンツが更新されたと判断する。なお、1文字でも相違した場合に当該コンテンツが更新されたと判断してもよい。
別の例としてHTML言語構造を挙げれば、前回収集した評価対象のコンテンツ内の特定の場所に位置していたタグが別のタグに置き換わっていたり、新たなタグが追加挿入されたりしたとき、更新判断部138は、評価対象のコンテンツに更新があったものと判断してもよい。さらに別の例として画像を挙げれば、コンテンツ内の人物の写真が10年前と変わっていない場合、更新されていないものと判断してもよい。さらに別の例として、コンテンツ内の日記に記載する文章が途切れた場合や、掲示板の不適切な使用に対し何らかの対策を行っていない場合、更新判断部138は評価対象のコンテンツが更新されていないものと判断してもよい。
信頼度制御部130は、更新判断部138による判断の結果に応じて評価対象のコンテンツの信頼度を所定のタイミングで、ここでは一日に一回、増減させる。すなわち、更新判断部138により評価対象のコンテンツの更新があったと判断されたとき、評価対象のコンテンツが更新されていると、一日に一回、連続して判断される期間内において、当該コンテンツの信頼度を徐々に増加させる。一方、更新判断部138により評価対象のコンテンツの更新がないと判断されたとき、評価対象のコンテンツが更新されていないと、一日に一回、連続して判断される期間内において、当該コンテンツの信頼度を徐々に減少させる。
本実施の形態に係る情報検索提供装置100によれば、ウェブページに掲載されるコンテンツが定期的に更新されるほど信頼度が上がる可能性が高い。そのコンテンツの信頼度をユーザに提示することで、ユーザはそのコンテンツがどの程度の信頼度を有するかを簡単に知ることができる。例えば、ユーザは、信頼度の高い、インターネットによるショッピングサービスのウェブページを利用することで、安心してショッピングできる。一方、ウェブページ提供者側は自身のコンテンツの信頼度を高めようと、定期的な更新を積極的に行うことがありうる。これにより、ネットワーク上に存在するウェブページが全体的により更新される可能性が高くなり、ひいてはインターネット全体の活性化にもつながる。
図12(a)は、評価対象のコンテンツが連続して更新されるときの信頼度と時間との関係を示し、図12(b)は、評価対象のコンテンツが途中更新されなくなったときの信頼度と時間との関係を示す。縦軸はコンテンツの信頼度、横軸は時間を示す。図7と同等のものには同じ符号を与え適宜説明を略す。図12(a)では、日付D0以降コンテンツが毎日更新されるため、図中の信頼度は徐々に増加している。一方、図12(b)では、日付D0〜日付D2の期間内ではコンテンツが毎日更新されるが、日付D2以降コンテンツが更新されなくなり、当該日以降、信頼度は徐々に減少している。
(実施の形態4)
実施の形態3では評価対象のコンテンツが更新されているか否かに応じて当該コンテンツの信頼度を増減させたが、実施の形態4では当該コンテンツの更新有無の結果に加え、当該コンテンツが本来更新を必要とするべきものであるか否かの分析結果を評価対象のコンテンツの信頼度の増減に反映させる。図13は、本実施の形態4に係る情報検索提供装置100の構成を示す。図11と同等の構成には同じ符号を与え適宜説明を略す。実施の形態4に係る情報検索提供装置100には、図11に示した実施の形態3に係る情報検索提供装置100に新たな構成要素である更新分析部140がさらに設けられる。
更新分析部140は、収集部128により収集された評価対象のコンテンツの内容を参照し、当該コンテンツが本来更新を必要とするべきものであるか否かを分析する。具体的には、更新分析部140は評価対象のコンテンツを「本来更新の必要のあるグループ」と「本来更新の必要のないグループ」のいずれかのグループに分類する。「本来更新の必要のあるグループ」とは、情報を高い頻度で更新することで有意となるコンテンツ、例えば、ニュース速報、天気、日記を提供するコンテンツを含むグループをいう。一方、「本来更新の必要のないグループ」とは、情報を更新しないことで有意となるコンテンツ、例えば、政治家の主張、会社の基本的運営方針を提供するコンテンツを含むグループをいう。
具体的には、更新分析部140はコンテンツの中に「ニュース」や「天気」など頻度の高い更新で有意になるキーワードが含まれていれば、そのコンテンツを「本来更新の必要のあるグループ」に分類する。一方、コンテンツの中に「主張」や「基本方針」など更新なしで有意となるキーワードが含まれていれば、そのコンテンツを「本来更新の必要のないグループ」に分類する。コンテンツをそれらグループに分類するためのキーワードは、あらかじめ情報検索提供装置100内に登録されていてもよい。
更新分析部140は、「本来更新の必要のあるグループ」を、「定期的な更新が必要であるグループ」と、「定期的な更新が必要でないグループ」とにさらに分類してもよい。更新分析部140は、「定期的な更新が必要であるグループ」に分類されるコンテンツが定期的に更新されているかを分析する。「定期的な更新が必要であるグループ」には、現存する人物の年齢に関する情報、容姿の画像などを掲載するコンテンツが含まれる。現存する人物の年齢、容姿などは変化し続けるので、最新の情報を提供するという観点から、現存する人物の年齢に関する情報、容姿の画像などは、定期的に更新されている必要がある。現存する人物の容姿の画像を掲載するコンテンツの例としては、結婚相談所などが主催しているお見合い写真の顔の画像、会社案内に掲載される代表者の顔の画像、何らかの会に属している会員の顔の画像などが挙げられる。現存する人物の容姿の画像が定期的に更新されていることは、後で実際にその人物と会う場合に特に有用である。
信頼度制御部130は、更新判断部138による判断の結果および更新分析部140による分析の結果に応じて、評価対象のコンテンツの信頼度を増減させる。すなわち、「本来更新の必要のあるグループ」に分類された評価対象のコンテンツについては、信頼度制御部130は、更新判断部138によりコンテンツが更新されていると判断されたときに信頼度を増加させ、コンテンツが更新されていないと判断されたときに信頼度を減少させる。一方、「本来更新の必要のないグループ」に分類された評価対象のコンテンツについては、信頼度制御部130は、更新判断部138によりコンテンツが更新されていないと判断されたときに信頼度を増加させ、コンテンツが更新されていると判断されたときに信頼度を減少させる。
本実施の形態によれば、コンテンツの更新有無に加え、コンテンツが本来更新を必要とするべきものであるか否かを信頼度の増減の判断材料にすることで、コンテンツが更新されなくてもそのコンテンツが本来更新すべきものではないものであれば信頼度を増加させることができ、当該コンテンツを救済できる。
(実施の形態5)
実施の形態3では評価対象のコンテンツが更新されているか否かに応じて当該コンテンツの信頼度を増減させたが、実施の形態5では当該コンテンツが更新されているかどうかを調べるとき、当該コンテンツ内にリンク切れが生じているか否かを調べる。図14は、実施の形態5に係る情報検索提供装置100の構成を示す。図11と同等の構成には同じ符号を与え適宜説明を略す。実施の形態5に係る情報検索提供装置には図11に示した実施の形態3に係る情報検索提供装置100に新たな構成要素であるリンク切れ判断部141がさらに設けられる。
リンク切れ判断部141は収集部128により収集された評価対象のコンテンツ内に記述されたリンク先のウェブページにアクセスし、当該ウェブページに何らかのコンテンツが掲載されているか否かを判断する。具体的には、リンク切れ判断部141は、評価対象のコンテンツに含まれるタグ<A HREF="〜">内の「〜」を参照して他のウェブサーバのウェブページにアクセスする。上記のタグが複数あれば複数のウェブページにアクセスする。このとき、例えば「移動しました」や「FILE NOT FOUND」などの文字を発見したとき、リンク切れが生じていると判断する。一方、ウェブページに何らかのコンテンツ、例えば上記の文字以外を含むコンテンツが掲載されていれば、リンク切れが生じていないと判断する。
もちろん、リンク切れ判断部141は、同一ウェブサーバ上の同一ウェブページへのリンク先や同一ウェブサーバ上の異なるウェブページへのリンク先にアクセスしてもよい。このとき、リンク切れ判断部141は、例えば、リンク先に画像や映像データが存在しないとき、リンク切れが生じていると判断する。
信頼度制御部130はリンク切れ判断部141による判断の結果に応じて、評価対象のコンテンツの信頼度の増減を制御する。具体的には、信頼度制御部130はリンク切れが生じていると判断されれば、リンク切れが生じている期間内において、評価対象のコンテンツの信頼度を一定に保つ。なお、この場合、信頼度を減少させてもよい。一方、評価対象のコンテンツが更新されリンク切れが解消すればコンテンツの信頼度を増加させる。
本実施の形態によれば、ウェブページ内にリンク切れがあるときの信頼度をウェブページ内にリンク切れがないときの信頼度よりも低くすることで、両者を差別化できる。ウェブページとウェブページとをつなぐリンクは、インターネットが発展した理由の重要な要素の一つであるため、リンク切れが有るか否かをコンテンツの信頼度を評価する際の指標にするのは有意義である。リンク切れに基づいた信頼度をユーザに提示することで、ユーザはリンク切れのない信頼度の高いコンテンツのみを利用できる。一方、ウェブページ提供者側はコンテンツの信頼度を高めようと、リンク切れの修正を積極的に行うことがありうる。これにより、ネットワーク上に存在するデッドリンクが全体的に見てより修正される可能性が高くなり、ひいてはウェブページ全体の品質の向上にもつながる。
図15は、評価対象のコンテンツに、途中リンク切れが生じた場合のコンテンツの信頼度と時間との関係を示す。縦軸はコンテンツの信頼度、横軸は時間を示す。図7と同等のものには同じ符号を与え適宜説明を略す。本図では、日付D0にウェブページの提供が開始され、当該日以降そのウェブページに掲載されるコンテンツが一日に一回更新され、日付D2以降コンテンツにリンク切れが生じるが、日付D3に、コンテンツの更新によりリンク切れが修正されたときの信頼度の変化の様子を示す。図示のごとく、リンク切れが生じている期間である、日付D2から日付D3までの期間内において、信頼度制御部130によりコンテンツの信頼度が一定に保持されている。
(実施の形態6)
実施の形態1ではコンテンツの収集が可能であったか否かに応じて評価対象のコンテンツの信頼度を増減させたが、実施の形態6では評価対象のコンテンツの信頼度の増加あるいは減少に貢献する要素に応じてコンテンツの信頼度を増減させる。図16は、実施の形態6に係る情報検索提供装置100の構成を示す。図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態6に係る情報検索提供装置100には、図3に示した実施の形態1に係る情報検索提供装置100の履歴増加幅制御部132のかわりに、新たな構成要素である関連コンテンツ取得部142、要素抽出部144および分類部146がさらに設けられる。
関連コンテンツ取得部142は評価対象のコンテンツに関連するコンテンツを取得する。例えば、検索部114が、評価対象のコンテンツに含まれる検索条件文、例えば「ABC会社」文を指定して検索を行い、関連コンテンツ取得部142は、その検索条件文に合致したコンテンツを関連するコンテンツ(以下、「関連コンテンツ」という)としてもよい。このとき、検索部114は検索情報保持部180から関連コンテンツを取得してもよいし、他の検索エンジンやウェブページを利用して関連コンテンツを取得してもよい。検索条件文は、端末装置50を介してユーザから指定されてもよいし、情報検索提供装置100内部の図示しない検索条件文生成部により辞書を用いて定期的に生成されてもよい。なお、関連コンテンツは評価対象のコンテンツ自身を含んでもよい。
要素抽出部144は取得されたコンテンツの中から評価対象のコンテンツの信頼度の増加あるいは減少に貢献する要素を抽出する。例えば、信頼度の増加に貢献する要素とは「新商品開発」、「特許取得」、「新規展開」、「増収増益」、などのキーワードを示し、信頼度の減少に貢献する要素とは「裁判」、「負債」、「逮捕」、「減益」などのキーワードを示す。信頼度の増加あるいは減少に貢献するキーワードのすべては、あらかじめ図示しない貢献保持部に保持されていてもよい。このとき、要素抽出部144は、その貢献保持部からキーワードを取得し、関連コンテンツ取得部142により取得されたコンテンツに対して、これらのキーワードを指定して検索し合致した情報を取得する。
分類部146は要素抽出部144により抽出された要素それぞれを、評価対象のコンテンツの信頼度の増加に貢献する第1グループ、あるいは評価対象のコンテンツの信頼度の減少に貢献する第2グループに分類する。
信頼度制御部130は要素抽出部144により抽出された要素を参照して評価対象のコンテンツの信頼度を増減させる。具体的には、信頼度制御部130は、分類部146により分類された第1グループ内の要素数が第2グループ内の要素数よりも多いとき、評価対象のコンテンツの信頼度を増加させる。一方、信頼度制御部130は、第2グループ内の要素数が第1グループ内の要素数よりも多いとき、評価対象のコンテンツの信頼度を減少させる。
本実施の形態によれば、情報検索提供装置100は、評価対象のコンテンツが他のウェブページやコンテンツからどのように評価されているかに応じて評価対象のコンテンツの信頼度を増減できる。このとき、評価対象のコンテンツの信頼度の上昇に貢献する要素だけでなく、評価対象のコンテンツの信頼度の下降に貢献する要素をも考慮することで、信頼度の評価の精度が高まる。
(実施の形態7)
実施の形態1〜6では評価対象のコンテンツの信頼度を単独で増減させたが、実施の形態7ではお互いに関連するコンテンツの信頼度を同時に制御する。図17は、実施の形態7に係る情報検索提供装置100の構成を示す。図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態7に係る情報検索提供装置100には、図3に示した実施の形態1に係る情報検索提供装置100の履歴増加幅制御部132のかわりに、新たな構成要素であるコンテンツ取得部147、自コンテンツ特定部148および整合性判断部150がさらに設けられる。
コンテンツ取得部147は、判断対象項目を含むコンテンツを取得する。判断対象項目とは、整合性の判断対象のデータであり、例えば住所、電話番号やファクシミリ番号、他に採用関連情報や財務関連情報などであってもよい。採用関連情報とは、例えば、来年の採用予定人数や今年の採用実績人数、財務関連情報とは、売上高や経常利益額などを指す。なお、判断対象項目のデータ形式は問わず、テキストデータ、画像データ、音声データや映像データであってもよい。自コンテンツ特定部148は、取得されたコンテンツのうち判断対象項目の情報発生源となる自コンテンツを特定する。以下、自コンテンツを特定する際の判断材料の一例を示す。もちろん、判断材料は以下の組み合わせで構成されてもよい。
(1)コンテンツのURLを参照して特定する。
(2)コンテンツの内容を参照して特定する。
(3)他のウェブページ、検索エンジンやデータベースから得られる検索結果を参照して特定する。
(4)コンテンツに張られているリンクの総数で特定する。
(5)コンテンツの提供開始日で特定する。
(1)の場合、自コンテンツ特定部148は、取得されたコンテンツのURLを参照し、例えば、判断対象項目が特定の企業の電話番号であり、URL内にその企業のドメイン名「abc」を含んでいるか否かを判断し、それを含んでいればそのコンテンツを自コンテンツであると判断する。このとき、アクセス部122はドメイン名を管理する第三者機関のデータベースにアクセスして、その企業のドメイン名を取得してもよい。
(2)の場合、自コンテンツ特定部148は取得されたコンテンツの内容を参照し、例えば、判断対象項目が特定の企業の電話番号であり、コンテンツ内のタイトル部分、例えば、タグ<TITLE>〜</TITLE>に囲まれた領域に企業の名称があれば、自コンテンツであると判断する。
(3)の場合、自コンテンツ特定部148は、判断対象項目を検索条件文と指定して他のウェブページ、検索エンジンやデータベースから得られる検索結果のうち最上位に位置するコンテンツを自コンテンツと判断する。(4)の場合、自コンテンツ特定部148は、コンテンツ内のタグ<A HREF="〜">を参照し、他のコンテンツから張られるリンクの数が一番多いコンテンツを自コンテンツであると判断する。
(5)の場合、自コンテンツ特定部148は取得されたコンテンツに関するウェブページの提供開始日を参照し、最先の提供開始日であるコンテンツを自コンテンツであると判断する。
整合性判断部150は、自コンテンツ特定部148により特定された自コンテンツの内容と取得されたコンテンツのうち自コンテンツ以外の他コンテンツの内容とを比較し、判断対象項目の整合性の有無を判断する。
信頼度制御部130は、整合性判断部150による判断の結果に応じて自コンテンツの信頼度と他コンテンツの信頼度を増減させる。すなわち、信頼度制御部130は、自コンテンツの信頼度および他コンテンツの信頼度がともに高いときであって、整合性判断部150により判断対象項目について整合性有りと判断されたとき、信頼度制御部130は自コンテンツの信頼度および他コンテンツの信頼度をともに増加させる。自コンテンツの信頼度および他コンテンツの信頼度がともに高いときであって、整合性無しと判断されたとき、信頼度制御部130は両方のコンテンツの信頼度を下げる。このとき、情報検索提供装置100は図示しない通知部を備え、それぞれのコンテンツを掲載するウェブページの情報提供者に判断対象項目の是正の指示を通知してもよい。
自コンテンツの信頼度が高く他コンテンツの信頼度が低いときであって、整合性有りと判断されたとき、信頼度制御部130は他コンテンツの信頼度を上げるが、自コンテンツの信頼度については増減させない。さらに、自コンテンツの信頼度が高く他コンテンツの信頼度が低いときであって、整合性無しと判断されたとき、信頼度制御部130は他コンテンツの信頼度を下げるが、自コンテンツの信頼度については増減させない。すなわち、信頼度が低い他コンテンツはそもそも信頼のおけない内容であるため、信頼度制御部130はそれに左右されることがないよう自コンテンツの信頼度を制御するのである。
図18は、自コンテンツと他コンテンツとの判断対象項目に関する関係を模式的に示す。自コンテンツR1は判断対象項目である「情報X=鹿児島県」、他コンテンツR2は「情報X=鹿児島県」、他コンテンツR3は「情報X=沖縄県」を含む。整合性判断部150は、自コンテンツR1と他コンテンツR2とを比較し、あるいは自コンテンツR1と他コンテンツR3とを比較し、整合性の有無を判断する。本図の場合、整合性判断部150により自コンテンツR1と他者コンテンツR2については整合性有りと判断され、自コンテンツR1と他コンテンツR3については整合性無しと判断される。
他コンテンツは公のあるいは公共性の高い事業者により提供されるコンテンツであってもよい。公のあるいは公共性の高い事業者とは、例えば国、地方公共団体や第三者機関により運営される事業者を指す。それらの事業者により提供されるコンテンツの信頼度は一般的に高いため、整合性判断部150は、判断対象項目、例えば電話番号や住所について、自コンテンツと他コンテンツとの整合性が有ると判断すれば、自コンテンツの信頼度を増加させることができる。
一般的にコンテンツの中には虚偽や誤りの内容を含んだものもある。そのため、情報提供者が発信する内容について他のコンテンツやウェブページに掲載されている内容との整合性の有無を判断することは有意義である。本実施の形態に係る情報検索提供装置100により、整合性の有無に基づいたコンテンツの信頼度を通知されることで、ユーザはそのコンテンツが虚偽や誤りの内容を含む可能性の少ない、信頼度の高いコンテンツのみを利用できる。一方、ウェブページ提供者側はコンテンツの信頼度を高めようと、虚偽や誤りの修正を積極的に行うことがありうる。これにより、コンテンツ全体の虚偽や誤りが全体的に見てより修正される可能性が高くなり、これによりウェブページ全体の品質の向上にもつながる。
(実施の形態8)
実施の形態8に係る情報検索提供装置100は、実施の形態1、実施の形態3、実施の形態5、実施の形態6および実施の形態7に係る機能を実現する構成要素を備える。このとき、それぞれの実施の形態に係る構成要素で実現される信頼度は、それぞれ異なる信頼度として検索情報ファイル内の信頼度欄310に管理される。なお、実施の形態8に係る情報検索提供装置100は、実施の形態1に係る機能を実現する構成要素にかえて実施の形態2に係る機能を実現する構成要素、実施の形態3に機能を実現する構成要素にかえて実施の形態4に係る機能を実現する構成要素を備えてもよい。
図19は、情報検索提供装置100が提供する検索初期画面の一例を示す。検索初期画面400は、検索条件文を受け付ける第1入力ボックス402と第2入力ボックス404と第3入力ボックス406、開始ボタン408、およびキャンセルボタン410などで構成される。第1入力ボックス402には、会社名や代表者名や商品名に関する検索条件文が入力され、第2入力ボックス404にはURLや電話番号やファクシミリ番号や住所が入力され、第3入力ボックス406には、いわゆるフリー検索を行う際の検索条件文がユーザにより入力される。少なくとも一つのボックスに検索条件文が入力された後、開始ボタン408が押下されたとき、入力された検索条件文が送信部52により情報検索提供装置100に送信され、検索処理が行われる。送信中にキャンセルボタン410が押下されれば、情報検索提供装置100は検索処理を停止する。
図20は、情報検索提供装置100が提供する検索結果画面401の一例を示す。検索結果画面401には、検索条件文に合致したコンテンツと当該コンテンツに関連する各種情報、例えば信頼度が表示される。検索結果画面401は、コンテンツを掲載するウェブページの情報提供者が表示される領域412、ウェブページの提供開始日が表示される領域414、信頼度と時間との関係が表形式で表示される信頼度表420、表示されたコンテンツに対する評価内容が記載されている他コンテンツの一覧を示す一覧領域430、および特定の項目における信頼度をアルファベット形式で表示される信頼度ランク表440等で構成される。
信頼度表420は5つの第1〜第5信頼度表420a〜420eを備える。ここで、第1信頼度表420aは実施の形態1あるいは実施の形態2に係るコンテンツの連続性に関する信頼度表、第2信頼度表420bは実施の形態3あるいは実施の形態4に係るコンテンツの更新状況に関する信頼度表、第3信頼度表420cは実施の形態5に係るコンテンツのリンク先状況に関する信頼度表、第4信頼度表420dは実施の形態6に係るコンテンツの他コンテンツからの評価に関する信頼度表、第5信頼度表420eはそれら第1〜第4信頼度表420a〜420dの結果を総合化した信頼度表である。5つの第1〜第5信頼度表420a〜420e中の点Aは現在のコンテンツの信頼度を示す。
一覧領域430は、検索されたコンテンツに対し良好と評価している他ウェブページの一覧が格納される第1一覧領域422と検索されたコンテンツに対し良好でないと評価している他ウェブページの一覧が格納される第2一覧領域424を備える。具体的には、実施の形態6に係る関連コンテンツ取得部142により取得されたコンテンツのうち、評価対象のコンテンツの信頼度の増減に貢献するコンテンツが表示されている。図示のごとく、第1一覧領域422には検索されたコンテンツの信頼度を増加させるキーワードを含むコンテンツを掲載するウェブページの一覧が格納され、第2一覧領域424には検索されたコンテンツの信頼度を減少させるキーワードを含むコンテンツを掲載するウェブページの一覧が格納されている。
信頼度ランク表440は、項目欄442およびランク欄444を含む。この表は、実施の形態7に係る構成要素による整合性判断の結果として制御される信頼度が表示されたものである。この信頼度ランク表440は、前述の判断対象項目である住所、電話番号、ファクシミリ番号や採用関連情報などを含む。ランク欄444に含まれる情報は、コンテンツの信頼度をその大きさに応じていくつかのカテゴリに分類し、それをアルファベット形式で示したものである。例えば、ランク「A」は信頼度が高い状態を示し、以下順番に信頼度が低くなるにつれ、アルファベット順に「B」、「C」、「D」のように示す。
本実施の形態によれば、複数の観点、例えばコンテンツの連続性やコンテンツの更新状況の観点におけるコンテンツの信頼度をユーザに提示することで、ユーザは様々な観点からのコンテンツの信頼度を知ることができる。特に総合評価の信頼度は、複数の観点からの信頼度をまとめたものであり、バランス面において優れており、ユーザはコンテンツに関するより信頼性の高い評価結果を知ることができる。
(実施の形態9)
実施の形態1では、評価対象のコンテンツの収集が可能であったか否かに応じて当該コンテンツの信頼度が増減される。実施の形態9では、評価対象のコンテンツの収集が可能であったか否かに加え、当該コンテンツへネットワークを通じてアクセスするネットワーク利用端末装置に付随するクライアント情報に基づいて、当該コンテンツの信頼度が増減される。クライアント情報としては、前記ネットワーク利用端末装置から当該コンテンツへのアクセス状況に関する情報、前記ネットワーク利用端末装置から当該コンテンツに入力された情報が挙げられる。
図21は、実施の形態9に係る情報検索提供システム11の構成を示す。実施の形態9に係る情報検索提供システム11に関して、図1と同等の構成には同じ符号を与え適宜説明を略す。実施の形態9に係る情報検索提供システム11は、図3に示した実施の形態1に係る情報検索提供システム10に加えて当該コンテンツを利用するネットワーク利用端末装置500を有する。
図22は、実施の形態9に係るネットワーク利用端末装置500の構成を示す。ネットワーク利用端末装置500は、コンテンツ取得部502と、端末情報保持部504と、情報発信部506と、を備える。
コンテンツ取得部502は、ネットワーク12を介してウェブサーバ200が提供するコンテンツを取得する。具体的には、ネットワーク利用端末装置500に搭載される図示しないWWWブラウザからウェブサーバ200が提供するコンテンツの取得要求が送信される。当該コンテンツ取得要求に応じてウェブサーバ200から送信されたコンテンツがネットワーク利用端末装置500に取り込まれ、WWWブラウザ上に表示される。コンテンツ取得部502によるコンテンツの取得日時、コンテンツの取得回数等は、例えばcookieなどのアクセス状況記録データとしてネットワーク利用端末装置500に保存される。
端末情報保持部504は、ネットワーク利用端末装置500に関する情報を保持する。端末情報保持部504が保持する情報例としては、cookieから取得可能なコンテンツ取得日時、コンテンツ取得回数などの情報、コンテンツを取得した際に経由したURLに関する情報、ネットワーク利用端末装置500のオペレーティングシステム(以下、OSという)に関する情報、ネットワーク利用端末装置500で使用されているブラウザ、ネットワーク利用端末装置500が利用しているインターネットサービスプロバイダー(以下、ISPという)に関する情報などが挙げられる。
情報発信部506は、ネットワーク利用端末装置500に付随するクライアント情報をウェブサーバ200に送信する。情報発信部506が送信するクライアント情報の具体例は、上述したコンテンツ取得日時、コンテンツ取得回数、OSに関する情報、ISPに関する情報などである。また、後述するように、コンテンツ提供部202が提供するコンテンツが、インターネットを利用して商品の販売を行う内容である場合には、情報発信部506は、商品購入者の氏名、商品名、購入する商品の単価および個数などの情報をクライアント情報として、ウェブサーバ200に送信する。
図23は、実施の形態9に係るウェブサーバ200の構成を示す。実施の形態9に係るウェブサーバ200はコンテンツ提供部202と、アクセス感知部204と、入力情報受付部206と、情報取得部208、情報発信部210と、を備える。
コンテンツ提供部202は、ネットワーク利用端末装置500からの要求に応じてコンテンツを提供する。コンテンツ提供部202が提供するコンテンツは、ニュース、ブログ、画像、動画などの閲覧を目的とする内容であってもよく、インターネットを利用して商品の販売を行う内容であってもよい。コンテンツ提供部202は、上述した情報発信部506からのクライアント情報の発信を実現するために、ネットワーク利用端末装置500が当該コンテンツを閲覧したときや、当該コンテンツに対して何らかの情報を入力したときに、ウェブサーバ200に情報を受け渡しするような命令プログラム(ジャバスクリプトなどで記述)を埋め込んだコンテンツを提供することが好適である。
当該コンテンツに対して何らかの情報を入力する場合には、例えば、CGIプログラムなどによって作成されたテキストボックスやラジオボタンなどからなる入力フォームを用いることができる。
アクセス感知部204は、ネットワーク利用端末装置500が当該コンテンツを閲覧したこと、ネットワーク利用端末装置500から当該コンテンツに対して何らかの情報が入力されたことなどのネットワーク利用端末装置500による当該コンテンツへのアクセスを感知する。
入力情報受付部206は、ネットワーク利用端末装置500からの当該コンテンツに対する入力情報を受け付ける。例えば、コンテンツ提供部202が提供するコンテンツがインターネットを利用して商品の販売を行うウェブページである場合には、入力情報受付部206は入力情報として、商品購入者の氏名、商品名、購入する商品の単価および個数などの情報を受け付ける。
情報取得部208は、ネットワーク利用端末装置500の情報発信部506から発信されたコンテンツ取得日時、コンテンツ取得回数、OSに関する情報、ISPに関する情報などを取得する。
情報発信部210は、取得したクライアント情報を情報検索提供装置100に向けて送信する。
図24は、実施の形態9に係る情報検索提供装置100の構成を示す。図24に示す情報検索提供装置100に関して、図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態9に係る情報検索提供装置100は、図3に示した実施の形態1に係る情報検索提供装置100の構成要素に加えて、受信情報保持部510と、解析条件保持部520とをさらに備える。また、実施の形態9に係る収集制御部120は、情報受信部530と、情報受信終了判断部531と、情報解析部532と、クライアント判定部534と、常連顧客利用度制御部535と、取引評価部536と、取引評価更新部537と、資産価値算出部538と、資産価値更新部539とをさらに有する。
情報受信部530は、ウェブサーバ200の情報発信部210から送信された情報を受信し、受信情報保持部510に格納する。ネットワーク利用端末装置500からのアクセスが継続して行われている場合には、一連のアクセスにおけるクライアント情報として受信される。
図25は、受信情報保持部510に格納された受信情報のデータ構造の一例を示す。図25において、図4と同等の構成には同じ符号を与え適宜説明を略す。当該コンテンツにネットワーク利用端末装置500がアクセスする場合、ネットワーク利用端末装置500は、ネットワーク12を経由してアクセスするブラウザなどのコンテンツ閲覧用ソフトウエアを用いる。受信情報保持部510は、情報受信部530が受信したネットワーク利用端末装置500からのアクセス履歴に関連するクライアント情報、およびネットワーク利用端末装置500から入力されたデータに関連するクライアント情報を保持する。
アクセス履歴に関連するクライアント情報としては、ネットワーク利用端末装置500が当該コンテンツにアクセスしたアクセス日時550、ネットワーク利用端末装置500に割り当てられたアクセス元IPアドレス552、ネットワーク利用端末装置500が保持する経由先URL554、ネットワーク利用端末装置500で使用されているOS情報556などが挙げられる。
入力データに関連するクライアント情報としては、ネットワーク利用端末装置500が当該コンテンツに設置された商品購入用のフォームに入力、もしくは自動入力された購入金額568、商品名560、利用者氏名562などが挙げられる。
図24の構成の説明に戻り、情報受信終了判断部531は、情報の受信が継続しているか否かを判断し、一連のアクセスがいつ終了したかを判断する。例えば、情報の受信が継続しているか否かは、同一のネットワーク利用端末装置500からの情報の受信間隔が所定の時間内であるか否かにより判断される。
情報解析部532は、解析条件保持部520に保持されている信頼度に影響を与える解析条件に基づいて、受信情報保持部510に保持された情報を解析する。信頼度制御部130は、その解析結果により検索情報保持部180に保持されている信頼度を増減させる。前記解析条件は、あらかじめ解析条件保持部520に保存されていることが好ましいが、必要に応じて適宜更新してもよい。
例えば、解析条件保持部520に「同一のネットワーク利用端末装置500からのアクセスであれば初めてのアクセスより信頼度を高くする」という条件が設定してある場合には、情報解析部532は、受信情報保持部510に保持されている過去の受信情報を参照し、同一のネットワーク利用端末装置500からのアクセスか否かを解析する。信頼度制御部130は、同一のネットワーク利用端末装置500からのアクセスであれば、異なるネットワーク利用端末装置500からのアクセスに比べて、信頼度をより大きく増加させる。
ネットワーク利用端末装置500が当該コンテンツを閲覧したときに、当該コンテンツの信頼度を増加させる要因の例としては、ネットワーク利用端末装置500から当該コンテンツへのアクセスの増加や、信頼度の高いサイトを経てのアクセス、信頼度が高いOSを使用しているネットワーク利用端末装置500から当該コンテンツへのアクセスなどが挙げられる。逆に、信頼度を減少させる例としては、ネットワーク利用端末装置500から当該コンテンツへのアクセスの減少や、信頼度の低いサイトを経てのアクセス、信頼度が低いOSを使用しているネットワーク利用端末装置500から当該コンテンツへのアクセスなどが挙げられる。サイトの信頼度については、検索情報保持部180に保持されている情報を参照する。この他、ネットワーク利用端末装置500で使用されているブラウザやプログラムの種類、更新バージョン、脆弱性に対する対策の有無、他のサイトに危害を与える可能性の有無、ネットワーク利用端末装置500が利用しているISPの信頼度などに基づいて当該コンテンツの信頼度を増減させてもよい。
ネットワーク利用端末装置500が当該コンテンツに対して何らかの情報を入力したときに、当該コンテンツの信頼度を増加させる要因の例としては、ネットワーク利用端末装置500が当該コンテンツを買い物で利用することや、同じネットワーク利用端末装置500が当該コンテンツを複数回の買い物で利用することが挙げられる。買い物で当該コンテンツを利用するということは、ネットワーク利用端末装置500が、当該コンテンツを信用し利用していることの証であると考えても差し支えない。よって買い物をするネットワーク利用端末装置500が多ければ多いほど、当該コンテンツの信頼度を増減させることもできる。また、同じネットワーク利用端末装置500が当該コンテンツを複数回の買い物で利用する場合は、当該コンテンツの常連であると判断し、この常連が多ければ多いほど当該コンテンツの信頼度が高くなると考えてもよい。
なお、ネットワーク利用端末装置500が当該コンテンツを買い物で利用する場合に、決済をクレジットカードで行う場合には、より信頼度の高いユーザからのアクセスであると判断することができる。そこで、入力データに関連するクライアント情報に基づいてクレジットカードを利用する買い物であるか否かを判定し、クレジットカードを利用する買い物を実行するネットワーク利用端末装置500が多ければ多いほど当該コンテンツの信頼度を高くしてもよい。クレジットカードが使用されていることは、ネットワーク利用端末装置500を使用するユーザの身元が特定可能であることの一例であり、ユーザの身元が特定可能な方法であれば、クレジットカードの使用には限られない。
クライアント判定部534は、受信情報保持部510に保持されている当該コンテンツの利用者が、受信情報保持部510に保持された最新の利用者氏名562のいずれかと一致しているか否かの確認を行う。
図26は、検索情報保持部180に格納された検索情報ファイルのデータ構造の一例を示す。本実施の形態の検索情報保持部180に関し、図4と同等の構成には同じ符号を与え適宜説明を略す。本実施の形態の検索情報保持部180は、図4に示した構成に加えて、累計購入金額570、累計商品特性評価572、常連顧客利用度574、および資産価値576をさらに有する。
常連顧客利用度制御部535は、クライアント判定部534により一致が確認された場合に、検索情報保持部180に保持された常連顧客利用度を増加させる。
例えば、(http://〜1)のコンテンツにて「山崎太郎がA101という商品を29600円で購入した」という情報が受信情報保持部510に格納されている場合、検索情報保持部180の該当するコンテンツ(http://〜1)の累計購入金額は、「250000円」に「29600円」が加わり「279600円」となる。また、「A101」という商品は流行によらない食品であるとして5段階評価の最高ランクである「5」の評価を受けているとすると、累計商品特性評価は、「6」に「5」が加わり「11」となる。さらに、過去「山崎太郎」が(http://〜1)のコンテンツにて「3」回購入履歴があると、常連顧客利用度は、「20」に「3」が加わり、「23」となる。
取引評価部536は、受信情報保持部510に保持された最新の購入金額568と、商品名560とを取得する。取引評価部536は、買い物で入力された決済金額や商品情報を取得することにより、当該コンテンツでの決済規模や、取引内容を求める。信頼度制御部130は、当該コンテンツでの決済規模や、取引内容に基づいて信頼度を増減させてもよい。また、取引評価部536は、商品名について流行性、商品の種別などの商品特性に基づいて評価を行ってもよい。この場合、商品特性評価のための基準は事前に準備しておくことが好ましい。
例えば、当該コンテンツで1ヶ月に行われる決済の金額が一定金額以上あり、流行に左右されない商品を取り扱い、常連顧客が多い場合に、信頼度制御部130は信頼度を大きく増加させてもよい。
取引評価更新部537は、取引評価部536の処理に従って、検索情報保持部180に保持された累計購入金額570および累計商品特性評価572を更新する。
このように、当該コンテンツにおける決済に関する情報を収集することにより、当該コンテンツの取引や、当該コンテンツの持つ資産価値を算出することができる。
資産価値算出部538は、受信情報保持部510に保持された最新の購入金額568および商品名560を取得するとともに、当該コンテンツと関連するデータが格納された販売管理システム(図示せず)や経理システム(図示せず)から商品の仕入れ額を取得し、取引における利益を算出する。この利益を特定の期間で集計した値、常連顧客の利用度、および商品の特性を考慮し、将来的な収益を予測し、当該コンテンツの資産価値を算出する。
資産価値更新部539は、資産価値算出部538によって算出された資産価値に基づいて、検索情報保持部180に保持された資産価値を更新する。
例えば、(http://〜1)のコンテンツ資産価値を求める場合に、1年間の利益額が「1億円」、常連顧客利用度が「20」、累計商品特性評価が「6」であれば、常連顧客利用度と累計商品特性評価により「3」年間はこの利益が続くと予測する。これにより、当該コンテンツの資産価値が「3億円」と算出される。なお、常連顧客利用度と累計商品特性評価による利益算定期間算出のための基準は事前に準備しておくことが望ましい。
図27は、本実施の形態に係る信頼度増減処理の流れを示す。まず、情報検索提供装置100は、ウェブサーバ200から発信される情報を受信する待ち受け状態にある。情報受信部530がクライアント情報を受信する(S110)と、受信されたクライアント情報は、受信情報保持部510に格納される(S120)。
情報受信終了判断(S130)により、継続して情報の受信がある場合には(S130のY)、受信したクライアント情報を格納し続ける。ただし、最初にネットワーク利用端末装置500からクライアント情報を受信してから一定時間が経過したことを条件として、情報解析ステップ(S140)に移行してもよい。
一方、情報受信終了判断部531により、継続して情報の受信がない(S130のN)と判断されると、情報解析部532により情報解析(S140)が行われる。情報解析部532により「信頼度が増減する」と解析された場合には(S140のY)、信頼度制御部130により信頼度増減処理(S150)が行われ、処理は終了する。一方、情報解析部532により「信頼度に影響がない」と解析されると(S140のN)、処理が終了する。
本実施の形態によれば、コンテンツを利用するネットワーク利用端末装置500の持つ情報により、信頼度の制御が可能になる。さらに、ネットワーク利用端末装置500と当該コンテンツ間の決済情報などを収集することにより、コンテンツの持つ資産価値が演算可能となる。ネットワーク、特にインターネット上では法人、個人を問わず様々なコンテンツが運営されており、その中には有益なコンテンツも数多く存在している。しかしながら、コンテンツ運営の歴史は浅く、実空間では存在する土地や建物を評価するような方法は未だに確立されていない。コンテンツの資産価値算出は信頼度の算出と並び、個人で所有するコンテンツの譲渡や相続、法人で所有するコンテンツの継承や譲渡、または有益なコンテンツを所有する法人の合併や吸収、その他、前記法人に対する投資や融資などがスムーズに行われるために役立つだけではなく、コンテンツの流通という新しい仕組みの基礎となることも期待できる。
なお、実施の形態9では、ネットワーク利用端末装置500のクライアント情報がウェブサーバ200を経由して情報検索提供装置100に伝達されているが、ネットワーク利用端末装置500のクライアント情報が、情報検索提供装置100に直接的に伝達されてもよい。また、ネットワーク利用端末装置500のクライアント情報は、第三者が運営する情報収集装置を経由して、情報検索提供装置100に伝達されてもよい。この他、情報検索提供装置100がコンテンツを提供するウェブサーバ200を兼ねてもよい。
(実施の形態10)
実施の形態3では、評価対象のコンテンツが更新されたか否かに応じて、評価対象のコンテンツの信頼度が増減された。実施の形態10では、評価対象のコンテンツ提供者に関連する判定項目について、評価対象のコンテンツおよび比較用コンテンツにおける掲載状況をそれぞれ取得し、評価対象のコンテンツにおける判定項目の掲載状況と前記比較用コンテンツにおける判定項目の掲載状況とを比較することにより、評価対象のコンテンツが適切に判定されているか否かが判断される。評価対象のコンテンツ提供者に関連する判定項目は、具体的には、評価対象のコンテンツを運営する主催者が自ら公知にしたイベント情報などである。
一般的に、何らかのイベントが公知にされた場合、そのイベント情報は、主催者自身が運営する評価対象のコンテンツに掲載されるだけでなく、主催者が運営しない評価対象以外のコンテンツにも掲載される。評価対象以外のコンテンツに掲載される場合の情報源として、ネットワーク12を介する場合には、評価対象のコンテンツ、ネットワーク12を介さない場合には、プレス発表、独自取材などが挙げられる。ここでは、評価対象のコンテンツにイベント情報が掲載されていないにも拘わらず、評価対象以外のコンテンツにイベント情報が掲載されている場合や、評価対象のコンテンツにイベント情報が掲載される以前に評価対象以外のコンテンツに掲載された場合に、評価対象のコンテンツが適正に更新されていないと判断される。
本実施の形態では、イベント情報は主催者によって公知にされるが、これに限られず、イベント情報は主催者以外の第三者によって公知にされたものでもよい。例えば、主催者の不正や社会的悪事などは主催者自らが公知にせず、第三者が運営するコンテンツにおいて掲載され、公知にされる場合がある。このような場合には、第三者が運営するコンテンツに主催者の不正などのイベント情報が掲載されたときに、主催者が運営するコンテンツにこのイベント情報についての適切なコメントまたは謝罪などが掲載されているか否かに応じて、主催者が運営するコンテンツが適正に更新されているか否かを判断することができる。
図28は、実施の形態10に係る情報検索提供装置100の構成を示す。図28に関して、図11と同等の構成には同じ符号を与え適宜説明を略す。実施の形態10に係る情報検索提供装置100には、図11に示した実施の形態3に係る情報検索提供装置100の構成に加えて、取得コンテンツ情報保持部600と、イベント保持部610と、依頼情報保持部630とをさらに備える。また、本実施の形態の更新判断部138は、イベント抽出部640と、イベント主催者コンテンツ特定部641と、イベント発生制御部642と、コンテンツ情報源判断部650と、更新適正判断部660とをさらに有する。コンテンツ情報源判断部650は、イベント発生依頼部651と、イベント発生受信部652と、イベント監視部653と、コンテンツ情報源制御部654を含む。
図29は、取得コンテンツ情報保持部600に格納された検索情報ファイルのデータ構造の一例を示す。図29における検索情報ファイルはIPアドレス601と、URL602と、コンテンツ603と、コンテンツ取得日604とをデータ列として含む。収集部128により収集されたコンテンツは検索情報保持部180に保持されるだけでなく、取得コンテンツ情報保持部600にも保持される。取得されたコンテンツはコンテンツ603の欄に、コンテンツ付随情報の一部であるURLはURL602の欄に格納される。
図30は、検索情報保持部180に格納された受信情報のデータ構造の一例を示す。実施の形態10の検索情報保持部180に関して、図4と同等の構成には、同じ符号を与え適宜説明を略す。図30に記載のデータ構造は、図4と同じ構成に加えて、コンテンツ主催者620およびコンテンツ情報源622をさらにデータ列として有する。ここで、コンテンツ主催者とはコンテンツを運営する会社や個人、団体などを指す。コンテンツ情報源とはコンテンツに掲載されるイベントが何を参照して掲載されているのかを指す。
図31は、イベント保持部610に格納された検索情報ファイルのデータ構造の一例を示す。図31に示す検索情報ファイルはイベント611と、イベント主催者612と、イベント主催者自コンテンツへの掲載613と、自コンテンツへの掲載以前発生独自取材614と、自コンテンツへの掲載以降発生ウェブページ615と、自コンテンツへの掲載以降発生独自取材616とをデータ列として含む。
ここで、「イベント主催者自コンテンツへの掲載」とは、コンテンツ主催者が自ら発生させたイベントを自己のコンテンツに掲載することを指す。「自コンテンツへの掲載以前発生独自取材」とは、発生したイベントが自己のコンテンツに掲載される以前に、独自取材などにより他のコンテンツに掲載されたことを指す。「自コンテンツへの掲載以降発生ウェブページ」とは、発生したイベントが自己のコンテンツに掲載された以降に、その掲載されたコンテンツを参照して他のコンテンツに掲載されたことを指す。「自コンテンツへの掲載以降発生独自取材」とは、発生したイベントが自己のコンテンツに掲載された以降に、独自取材などにより他のコンテンツに掲載されたことを指す。
図32は、依頼情報保持部630に格納されたデータ構造の一例を示す。図32に示す検索情報ファイルは、イベント631と、イベントを発生させるコンテンツ主催者632と、公知日633と、イベントの公知方法634とをデータ列として含む。
図28の構成の説明に戻り、イベント抽出部640は、蓄積されたコンテンツを随時解析し、イベントの抽出を行う。例えば「2月4日に商品XがA社より新発売」というような情報が、イベントとして抽出される。
イベント主催者コンテンツ特定部641は、イベント抽出部640がイベントを抽出した場合に、検索情報保持部180に格納されている図30のコンテンツ主催者620を参照し、イベント主催者のコンテンツを特定する。特定したコンテンツ中に「2月4日に商品XがA社より新発売」とあれば、A社がそのイベントの主催者であることがわかる。コンテンツ主催者620にA社があれば、A社運営のコンテンツに関する情報を取得することができる。また、取得したコンテンツのURL602と、URL欄304とを比較することにより、取得したコンテンツのコンテンツ主催者を特定することができる。例えば、解析するコンテンツ(「2月4日に商品XがA社より新発売」が掲載された)のURLが(http://〜1/a.html)である場合、A社のURL(http://〜1/)を含んでいることより、A社の主催するイベントが、A社の自コンテンツへ掲載されたことになる。一方、解析するコンテンツ(「2月4日に商品XがA社より新発売」が掲載された)のURLが(http://〜3/c.html)の場合、X団体のURL(http://〜3/)を含んでいることより、A社の主催するイベントが、X団体のコンテンツへ掲載されたことになる。また、コンテンツ情報源622を参照することにより、コンテンツ主催者のコンテンツの情報源についても特定できる。上記例の場合、X団体のコンテンツ情報源は「独自取材」によるものとなる。
コンテンツ情報源判断部650は、図30で示されるコンテンツ情報源622の値を確定するために用いられる。
イベント発生依頼部651は、検索情報保持部に保持されているコンテンツ主催者(以下イベントを発生させるコンテンツ主催者と呼ぶ)にウェブページに掲載せずに公知にするイベント、あるいはウェブページのみに掲載し公知にするイベントの発生を依頼する。この依頼があることは、イベントを発生させるコンテンツ主催者と事前に合意しておくものとする。イベントを発生させるコンテンツ主催者は、依頼された方法でイベントを公知にし、そのイベント情報をイベント発生受信部652に向けて発信する。例えば図32では、イベントを発生させるコンテンツ主催者であるD社が発生させたイベントは、ウェブページに掲載せずに公知にするイベント(採用予定人数発表500人)であることがわかる。
イベント発生受信部652は、前記発生させたイベント情報を受信して依頼情報保持部630に保存する。この後、イベント監視部653は、依頼情報保持部630に保持されたイベントが、イベント抽出部640により抽出されるか否かを監視する。ウェブページに掲載せずに公知にするイベントが抽出された場合、そのコンテンツ主催者のコンテンツ情報源は、独自取材によると判断できる。一方ウェブページのみに掲載し公知にするイベントが、抽出された場合、そのコンテンツ主催者のコンテンツ情報源はウェブページによると判断できる。
コンテンツ情報源制御部654は、イベント監視部653による監視結果を、検索情報保持部180に保持される図30の対応するコンテンツ情報源622に格納する。その他、コンテンツ情報源622については、コンテンツ運営者などから聞き取り調査し値を入力してもよい。
イベント発生制御部642は、イベントを抽出し、イベント主催者、イベントを掲載したコンテンツ主催者、およびコンテンツ情報源を特定した後に、図31で示されるようなデータをイベント保持部610に保存する。イベント発生制御部642は、イベント保持部610に同一のイベントがあればそのイベントの項目であるイベント主催者自コンテンツへの掲載613、自コンテンツへの掲載以前発生独自取材614、自コンテンツへの掲載以降発生ウェブページ615および自コンテンツへの掲載以降発生独自取材616の中で該当するものの数値を増加させる。同一のイベントがない場合、新規イベントとしてレコードを追加し、イベント611およびイベント主催者612を入力し、さらにイベント主催者自コンテンツへの掲載613と、自コンテンツへの掲載以前発生独自取材614のいずれか該当するものに数値1を入力する。通常、イベントについてはある一定期間過ぎれば、出現する回数も減少すると考えられる。よって、イベントの初回の発生から一定期間経過後にイベントが抽出された場合には、なにもしないと制御してもよい。
更新適正判断部660は、イベント保持部610を参照してイベント主催者の自コンテンツが適正に更新されているか否かを判断する。
例えば、図31で示されるイベントが(9/6、採用予定人数発表、W社)、イベント主催者が(W社)の場合、主催者自コンテンツへの掲載が「0」で自コンテンツへの掲載以前発生独自取材が「10」であると表示されている。これは、他のコンテンツに掲載されているのに自コンテンツには掲載されていないと判断する。この場合、適正な更新を行っていないと判断される。同様に、イベントが(2/6、R氏鹿児島来訪、A社)、イベント主催者が(A社)の場合、主催者自コンテンツへの掲載が「1」で自コンテンツへの掲載以前発生独自取材が「5」、自コンテンツへの掲載以降発生ウェブページが「6」、自コンテンツへの掲載以降発生独自取材が「8」であると表示されている。これは、自コンテンツへ掲載されているものの、それ以前に他のコンテンツに掲載されていることより、自コンテンツへの掲載が遅れたと判断できる。この場合も適正な更新を行っていないと判断する。但し、自コンテンツへの「掲載以前発生独自取材」などの数値はある一定のしきい値を越えた場合に適正に更新されているか否かの判断を行ってもよい。適正に更新されていると判断できる例として、イベントが(2/4、商品X新発売、A社)、イベント主催者が(A社)の場合である。この場合、自コンテンツへの掲載以降、他のコンテンツに掲載されている。この場合、適正に更新していると判断する。このような場合でも自コンテンツへの「掲載以降発生独自取材」が、「0」もしくは極端に少なければ、独自取材を行うコンテンツに取り上げられるような重要なイベントでないと判断できることより、適正な更新か否かについては判断しないとしてもよい。
本実施の形態において、コンテンツが適正に更新されているか否かを判断する方法は、評価対象のコンテンツ主催者が発生させるイベントが評価対象コンテンツである自コンテンツや他のコンテンツへどのように波及していくかを観測するものである。これが実現されるとコンテンツを運営する者はタイムリーな情報の更新を心がけるようになり、ひいてはコンテンツの信頼度向上にも寄与するものとなる。
なお、本実施の形態では、イベント発生依頼部651に依頼されるイベントは単独であるが、イベント発生依頼部651にウェブページに掲載せずに公知にするイベント、およびウェブページのみに掲載し公知にするイベントの両方が同時期に依頼されてもよい。この場合、両者のイベントの種類は類似していることが望ましい。なお、「同時期」には、同日だけでなく、数日あるいは数週間の範囲が含まれる。
これによれば、ウェブページのみに掲載し公知にするイベントに関する情報が他のコンテンツへ波及する様子をある種のイベントに関する情報が他のコンテンツへ波及する様子の基準とし、この基準に基づいてウェブページに掲載せずに公知にするイベントに関する情報が他のコンテンツへ波及する様子を評価することができる。
例えば、イベントをウェブページのみに掲載し公知にしてから、他のコンテンツに掲載されるまでの時間および時間経過とともに当該イベントを掲載する他のコンテンツの数の増加の仕方を他のコンテンツへ波及する様子の評価基準とすることができる。ウェブページに掲載せずに公知にするイベントに関する情報が他のコンテンツへ波及する様子がこの評価基準と等しいか類似している場合には、ウェブページに掲載せずに公知したイベントが、公知後に速やかに自コンテンツに掲載されたと推定することができる。
また、ウェブページに掲載せずに公知にするイベントが他のコンテンツにおいて2番目以降に抽出された場合に、ウェブページに掲載せずに公知にするイベントと種類が類似し、かつ同時期にウェブページのみに掲載し公知にするイベントが、前記2番目以降に抽出された他のコンテンツに掲載されているか、あるいは過去に掲載されていた場合には、前記2番目以降に抽出された他のコンテンツの情報源はウェブページに掲載せずに公知にするイベントを最初に掲載した他のコンテンツ、すなわちウェブページからであると推定することができる。一方、ウェブページのみに掲載し公知にするイベントが、前記2番目以降に抽出された他のコンテンツに掲載されておらず、かつ過去にも掲載されていない場合には、前記2番目以降に抽出された他のコンテンツの情報源は独自取材によるものであると推定することができる。
(実施の形態11)
実施の形態1では評価対象のコンテンツの収集が可能であったか否かに応じて当該コンテンツの信頼度を増減させたが、実施の形態11では収集の可否の結果に加え、異なるタイミングで収集された評価対象のコンテンツの同一性が判断され、この判断結果に応じて、評価対象のコンテンツの信頼度が増減される。図33は、実施の形態11に係る情報検索提供装置100の構成を示す。図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態11に係る情報検索提供装置100は、図3に示した実施の形態1に係る情報検索提供装置100の構成に加えて同一性判断部700をさらに備える。
同一性判断部700は、異なるタイミングで収集された評価対象のコンテンツの同一性を判断する。具体的には、評価対象のコンテンツの同一性判断時において、評価対象のコンテンツが収集部128により新たに収集される。同一性判断部700は、検索情報保持部180のコンテンツ欄306に格納された過去に収集された評価対象のコンテンツの内容と、新たに収集された評価対象のコンテンツの内容とを比較し、評価対象のコンテンツの同一性が保たれているか否かを判断する。
信頼度制御部130は、同一性判断部700により評価対象のコンテンツの同一性が保たれていると判断された場合に、評価対象のコンテンツの信頼度を増加させる。一方、信頼度制御部130は、同一性判断部700により評価対象のコンテンツの同一性が保たれていないと判断された場合に、評価対象のコンテンツの信頼度を減少させてもよい。これにより、例えば、コンテンツの同一性が保たれているウェブページとコンテンツの同一性が保たれていないウェブページとの信頼度を差別化することができる。
なお、同一性判断部700は、過去に収集された評価対象のコンテンツの内容と、新たに収集された評価対象のコンテンツの内容とが完全に一致していることを同一性の条件とする必要はない。例えば、ブログやニュースなどのコンテンツでは、過去に記載された事項に新たな事項が順次追加される場合がある。このような場合には、同一性判断部700は、先のタイミングで収集された評価対象のコンテンツが後のタイミングで収集された評価対象のコンテンツの一部と同一であると判断された場合にも同一性が保たれていると判断してもよい。これによれば、先のタイミングで収集された評価対象のコンテンツが、後のタイミングで収集された評価対象のコンテンツの一部として包含され、かつ先のタイミングで収集された評価対象のコンテンツの同一性が保たれている場合にも、評価対象の信頼度が増加される。
(実施の形態12)
実施の形態1では評価対象のコンテンツの収集が可能であったか否かに応じて当該コンテンツの信頼度を増減させたが、実施の形態12では収集の可否の結果に加え、収集された評価対象のコンテンツの独自性が判断され、この判断結果に応じて、評価対象のコンテンツの信頼度が増減される。図34は、実施の形態12に係る情報検索提供装置100の構成を示す。図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態12に係る情報検索提供装置100は、図3に示した実施の形態1に係る情報検索提供装置100の構成に加えて、比較用コンテンツ登録部800、比較用コンテンツ保持部802、および独自性判断部810をさらに備える。
比較用コンテンツ登録部800は、比較用コンテンツとして、独自性を有する画像、動画、文章、音声データ、プログラムなどのコンテンツを受け付け、比較用コンテンツ保持部802に登録する。比較用コンテンツは、著作権が発生していることが好ましい。本実施の形態では、コンテンツが登録される際に、コンテンツの登録者およびコンテンツの権利者の情報も合わせて登録される。
図35は、比較用コンテンツ保持部802に格納された比較用コンテンツ情報ファイルの一例を示す。比較用コンテンツ情報ファイルは、コンテンツを識別するコンテンツID803に対応づけて、コンテンツ804、登録日805、登録者806および権利者807を格納している。
独自性判断部810は、評価対象のコンテンツと、評価対象のコンテンツが収集された時点で収集済みの比較用コンテンツとを比較して、評価対象のコンテンツの独自性を判断する。独自性判断部810は、比較用コンテンツ保持部802を参照し、評価対象のコンテンツが既に登録されているか否かを調べる。評価対象のコンテンツが比較用コンテンツ保持部802に登録されていない場合には、評価対象のコンテンツは独自性が高いと判断される。
なお、独自性判断部810は、評価対象のコンテンツが比較用コンテンツ保持部802に登録されていない場合であっても、評価対象のコンテンツが比較用コンテンツ保持部802に登録されたコンテンツの一部を改変したものと判断できる場合には、評価対象のコンテンツは独自性が低いと判断してもよい。評価対象のコンテンツが比較用コンテンツ保持部802に登録されたコンテンツの一部を改変したものであるか否かは、例えば、評価対象のコンテンツと比較用コンテンツ保持部802に登録されたコンテンツとの類似性を所定の基準に基づいて数値化し、得られた数値が基準値以上であるか否かにより判定することができる。
信頼度制御部130は、独自性判断部810により評価対象のコンテンツの独自性が高いと判断された場合に、評価対象のコンテンツの信頼度を増加させる。一方、信頼度制御部130は、独自性判断部810により評価対象のコンテンツが他のコンテンツを改変したものであると判断された場合に、評価対象のコンテンツの信頼度を減少させてもよい。なお、評価対象のコンテンツが他のコンテンツを改変したものであっても、比較用コンテンツ保持部802の権利者と、評価対象のコンテンツの提供者が同じであれば、評価対象のコンテンツの信頼度を下げる必要はない。これによれば、例えば、コンテンツの独自性が高いウェブページとコンテンツの独自性が低いウェブページとの信頼度を差別化できる。
(実施の形態13)
実施の形態1では、評価対象のコンテンツの収集が可能であったか否かに応じて当該コンテンツの信頼度が増減される。当該コンテンツの信用度はそれを運営する情報提供者の他のシステムの信用度にも対応することは既に述べた。実施の形態13では、当該コンテンツの所在情報の信頼度が、当該コンテンツの信頼度に応じて求められる。当該コンテンツの所在情報の具体例としては、当該コンテンツのURL、さらに前記URLから抽出されるドメイン名が挙げられる。その他、ドメイン名に割り振られるIPアドレスが固定されている場合には、IPアドレスと当該コンテンツの信頼度とを対応させることにより、IPアドレスの信頼度が求められる。また、ドメイン名を含む電子メールアドレスの信頼度と、当該コンテンツの信頼度とを対応させることにより、電子メールアドレスの信頼度が求められる。個々のドメイン名やIPアドレスの信頼度を求めることにより、ドメイン名やIPアドレスについて所定の属性により分類されたグループ毎の信頼度をさらに求めることができる。
図36は、実施の形態13に係る情報検索提供装置100の構成を示す。実施の形態13に係る情報検索提供装置100に関して、図3と同等の構成には同じ符号を与え適宜説明を略す。実施の形態13に係る情報検索提供装置100は、実施の形態1に係る情報検索提供装置100の構成に加えて、所在情報抽出部1000と、信頼度変換部1100と、グループ別信頼度算出部1200、グループ化情報保持部1250、所在情報信頼度保持部1300とを備える。また、実施の形態13に係る情報検索提供装置100が備える検索制御部110は、検索条件文解析部1500をさらに含む。
所在情報抽出部1000は、検索情報保持部180に保持されたURLからドメイン名部分を抽出し、検索情報保持部180に格納する。例えば、所在情報抽出部1000は、「http://www.abc.co.jp/a.html」というURLから「abc.co.jp」というドメイン名部分を抽出する。図37は、検索情報保持部180に格納された検索情報ファイルのデータ構造の一例を示す。本実施の形態の検索情報保持部180は、図4に示した構成に加えて抽出ドメイン名1400を有する。所在情報抽出部1000によって抽出されたドメイン名は、抽出ドメイン名1400の欄に書き込まれる。
信頼度変換部1100は、ドメイン名信頼度変換部1110と、電子メールアドレス信頼度変換部1120と、IPアドレス信頼度変換部1130とを含む。
ドメイン名信頼度変換部1110は、コンテンツの信頼度を基にドメイン名の信頼度を算出し所在情報信頼度保持部1300に格納する。原則的には、ドメイン名の信頼度は、コンテンツの信頼度から直接求められるが、コンテンツの信頼度以外の情報を加味してドメイン名の信頼度を算出してもよい。例えば、ドメイン名を所有する団体またはドメインの属性、ドメイン名の不正利用などの情報を加味してドメイン名の信頼度を算出することができる。
ドメイン名の信頼度を算出することは、そのドメイン名を含む電子メールアドレスの信頼度を算出することと同義であると考えてもよい。そこで、電子メールアドレス信頼度変換部1120は、コンテンツの信頼度に基づいて電子メールアドレスに含まれるドメイン名の信頼度を算出し、所在情報信頼度保持部1300に格納する。原則的には、電子メールアドレスの信頼度は、コンテンツの信頼度から求められたドメイン名の信頼度と一致するが、コンテンツの信頼度以外の情報を加味して算出してもよい。例えば、前記ドメイン名がスパムメールなどに利用されているなどのコンテンツ以外の情報を加味して電子メールアドレスの信頼度を算出することができる。
また、ドメイン名の信頼度は、そのドメイン名に割り振られたIPアドレスの信頼度と同義であると考えてよい。そこで、IPアドレス信頼度変換部1130は、コンテンツの信頼度を基にドメイン名の信頼度を算出し、算出された信頼度をそのドメイン名に割り振られたIPアドレスの信頼度として所在情報信頼度保持部1300に格納する。原則的には、IPアドレスの信頼度は、ドメイン名の信頼度と一致するが、コンテンツの信頼度以外の情報を加味してドメイン名の信頼度を算出してもよい。例えば、IPアドレスが割り振られたサーバによるスパム行為やサーバのセキュリティ上の脆弱性の情報などを加味してIPアドレスの信頼度を算出することができる。
グループ別信頼度算出部1200は、ドメイン名種別分類部1210と、ドメイン名種別信頼度算出部1220と、ISP分類部1230と、ISP信頼度算出部1240とを含む。
ドメイン名種別分類部1210は、検索情報保持部180に保持されたURLから抽出されたドメイン名からcom、co.jpなどの種別ドメイン名をさらに抽出し、検索情報保持部180に格納する。図37に示すように、本実施の形態の検索情報保持部180には、ドメイン名種別1402がデータ列としてさらに加えられている。ドメイン名種別分類部1210によって抽出されたドメイン名種別は、ドメイン名種別1402の欄に書き込まれる。
ドメイン名種別信頼度算出部1220は、com、co.jpなどのドメインの種別毎の信頼度を算出し、所在情報信頼度保持部1300に格納する。例えばcomドメインのドメイン名信頼度1306がそれぞれ300、300、200であれば(300+300+200)÷3=267として求めることができる。
ISP分類部1230は、グループ化情報保持部1250を参照し、検索情報保持部180に格納されているIPアドレス欄302から対応するISPに関する情報を取得し、検索情報保持部180に格納する。図38は、グループ化情報保持部1250に格納されたIPアドレス情報テーブルの一例を示す。図38に示すIPアドレス情報テーブルは、IPアドレス1262と、各IPアドレスを担当する国別担当レジストリー1264と、各IPアドレスを担当する担当ISP1266と、を含む。なお、グループ化情報保持部1250に格納されるIPアドレスおよびこれに付随する担当ISP等の情報は、グループ化情報入力部(図示せず)により、適宜追加または修正が可能である。
ISP分類部1230が、あるIPアドレスに対応する担当ISPの情報を取り出す場合には、図8に示したIPアドレス情報テーブルを参照して、当該IPアドレスに対応する担当ISPを参照して、検索情報保持部180に格納する。図37に示すように、本実施の形態の検索情報保持部180には、担当ISP1404がさらにデータ列として加えられている。ISP分類部1230によって抽出されたISPは、担当ISP1404の欄に書き込まれる。検索情報保持部180に、IPアドレスに対応する担当レジストリー、サーバ名などの情報が格納されてもよい。
ISP信頼度算出部1240は、検索情報保持部180を参照し、ISP毎の信頼度を算出し、所在情報信頼度保持部1300に格納する。例えばA社をISPとするIPアドレス信頼度がそれぞれ600、200、80であれば、ISP信頼度は、(600+200+80)÷3=293として求めることができる。
所在情報信頼度保持部1300は、ドメイン名およびIPアドレス毎の信頼度、ドメイン名種別毎の信頼度、担当ISP毎の信頼度など、コンテンツの所在に関連する信頼度を保持する。
図39、図40、および図41は、所在情報信頼度保持部1300に格納された各種信頼度テーブルの一例を示す。
図39は、ドメイン名およびIPアドレスに対応づけられた信頼度テーブルの一例を示す。図39に示す信頼度テーブルは、IPアドレス1302、抽出ドメイン名1304、ドメイン名信頼度1306、電子メールアドレス信頼度1308、およびIPアドレス信頼度1310を含む。図39に示す信頼度テーブルを参照することにより、特定のIPアドレス1302または抽出ドメイン名1304に対応するドメイン名信頼度1306、電子メールアドレス信頼度1308、またはIPアドレス信頼度1310を抽出することができる。
図40は、ドメイン名種別に対応づけられた信頼度テーブルの一例を示す。図40に示す信頼度テーブルは、ドメイン名種別1312およびドメイン名種別信頼度1314を含む。図40に示す信頼度テーブルを参照することにより、特定のドメイン名種別1312に対応するドメイン名種別信頼度1314を抽出することができる。
図41は、担当ISPに対応づけられた信頼度テーブルの一例を示す。図41に示す信頼度テーブルは、担当ISP1316およびISP信頼度1318を含む。図41に示す信頼度テーブルを参照することにより、特定の担当ISP1316に対応するISP信頼度1318を抽出することができる。
ユーザによって端末装置50に入力された検索条件文は、情報検索提供装置100の検索条件文取得部112によって取得される。検索条件文解析部1500は、取得した検索条件文にドメイン名、電子メールアドレス、またはIPアドレスが含まれるか否かを解析する。
検索条件文がドメイン名を含むか否かは、検索条件文がドメイン名の構成様式を満たしているか否かにより判断される。例えば、検索条件文が以下の条件を満たしている場合には、検索条件文がドメイン名を含むと判断される。
<条件>
(1)文字列がピリオド「.」で区切られていること。
(2)右から数えて最初のピリオドより右側の部分的な文字列が、「com」「net」「jp」などのトップレベルドメインに合致していること。
(3)右から数えて2番目のピリオドと、右から数えて最初のピリオドとの間の部分的な文字列が、「ac」「co」などの第2レベルドメインに合致していること。
検索条件文が電子メールアドレスを含むか否かは、検索条件文が電子メールアドレスの構成様式を満たしているか否かにより判断される。例えば、検索条件文が「x@y.z」(xは任意の文字あるいは数字の列、y.zは上記の条件に合致するドメイン名)であれば、検索条件文が電子メールアドレスを含むと判断される。
また、検索条件文がIPアドレスを含むか否かは、検索条件文がIPアドレスの構成様式を満たしているか否かにより判断される。例えば、検索条件文が「0.0.0.0〜255.255.255.255」の範囲に当てはまれば、検索条件文がIPアドレスを含むと判断される。
検索条件文解析部1500により、検索条件文にドメイン名が含まれると判断された場合には、検索部114は、検索情報保持部180に格納されている検索情報ファイルを参照し、抽出ドメイン名1400から検索条件文のドメイン名に合致する情報を検索する。検索結果提供部116は、検索で得られた情報を一覧化したものを検索結果として端末装置50に提供する。このとき信頼度提示部118は、図39を参照して、抽出ドメイン名1304に対応するドメイン名信頼度1306を端末装置50に提供する。
検索条件文解析部1500により、検索条件文に電子メールアドレスが含まれると判断された場合には、検索部114は、検索情報保持部180に格納されている検索情報ファイルを参照し、抽出ドメイン名1400から検索条件文の電子メールアドレスに含まれるドメイン名に合致する情報を検索する。検索結果提供部116は、検索で得られた情報を一覧化したものを検索結果として端末装置50に提供する。このとき信頼度提示部118は、図39を参照して、抽出ドメイン名1304に対応する電子メールアドレス信頼度1308を端末装置50に提供する。
検索条件文解析部1500により、検索条件文にIPアドレスが含まれると判断された場合には、検索部114は、検索情報保持部180に格納されている検索情報ファイルを参照し、IPアドレス欄302から検索条件文のIPアドレスに合致する情報を検索する。検索結果提供部116は、検索で得られた情報を一覧化したものを検索結果として端末装置50に提供する。このとき信頼度提示部118は、図39を参照して、IPアドレス1302に対応するIPアドレス信頼度1310を端末装置50に提供する。
また、検索条件文取得部112によって検索条件文が取得された場合に、検索条件文解析部1500は、取得した検索条件文にドメイン名種別、またはISP名が含まれるか否かを解析してもよい。
検索条件文がドメイン名種別を含むか否かは、検索条件文がドメイン名の構成様式を満たしているか否かに加えて、ドメイン名が所定のドメイン名種別に分類可能か否かにより判断される。この場合、グループ化情報保持部1250が、図42に示すようなドメイン名種別テーブルを格納することが好適である。図42に示すドメイン名種別テーブルは、ドメイン名種別1268に対応して、使用あるいは運用の目的1270、当該ドメイン種別が割り当てられた国1272を含む。
また、検索条件文がISPを含むか否かは、図41に示す信頼度テーブルを参照し、検索条件文が担当ISP1316のいずれかに該当するか否かにより判断される。
検索条件文解析部1500により、検索条件文にドメイン名種別が含まれると判断された場合には、検索部114は、検索情報保持部180に格納されている検索情報ファイルを参照し、ドメイン名種別1402から検索条件文のドメイン名種別に合致する情報を検索する。検索結果提供部116は、検索で得られた情報を一覧化したものを検索結果として端末装置50に提供する。このとき信頼度提示部118は、図40を参照して、ドメイン名種別1312に対応するドメイン名種別信頼度1314を端末装置50に提供する。
一方、検索条件文解析部1500により、検索条件文にISPが含まれると判断された場合には、検索部114は、検索情報保持部180に格納されている検索情報ファイルを参照し、担当ISP1404から検索条件文のISPに合致する情報を検索する。検索結果提供部116は、検索で得られた情報を一覧化したものを検索結果として端末装置50に提供する。このとき信頼度提示部118は、図41を参照して、担当ISP1316に対応するISP信頼度1318を端末装置50に提供する。
本実施の形態によれば、コンテンツの持つ信頼度を基に、当該コンテンツに対応するIPアドレスや、ドメイン名の信頼度を算出することにより、電子メールアドレスの信頼度をはじめ、担当ISPや、レジストリー、さらに国毎のドメイン種別などの信頼度を求めることができる。このように、コンテンツのみならず、コンテンツに関連するドメイン名等の信頼度を数値化することにより、ドメイン等の運営者に対してコンテンツの信頼度の改善を促す効果も期待できる。具体的には、ISPが悪質な業者へIPアドレスを割り振ることがないように自制したり、国全体でIPアドレスの管理を行うための適正な政策実施などが挙げられる。
本実施形態では、提供されるコンテンツの信頼度に基づいて、ドメイン名、電子メールアドレスまたはIPアドレスの信頼度が提供されるが、ドメイン名、電子メールアドレスまたはIPアドレスのうち少なくとも1つの信頼度を含むいずれの組み合わせの構成も可能である。
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下、変形例を挙げる。
(変形例1)
実施の形態に係る情報検索提供装置100は一つの装置として存在されていたが、変形例の構成として、情報検索提供装置100を2つのサーバの協働によって実現してもよい。一例として、図3の検索制御部110を検索用サーバ側に設け、それら以外の機能ブロックを収集用サーバ側に置いてもよい。当然ながら、図3の構成をこれ以外の部分で分割して検索用サーバ側と収集用サーバ側に分配することができる。どのような分配がよいかについては、サーバ管理者の管理の利便性、2つのサーバの負荷バランス、両者の通信量などの要素を考慮して定めることができる。
(変形例2)
実施の形態8に係る情報検索提供装置100は、実施の形態1、実施の形態3、実施の形態5、実施の形態6および実施の形態7に係る情報検索提供装置100が有する構成要素を備えたが、別の変形例の構成として、その組み合わせはこれに限定されない。例えば、実施の形態1に係る情報検索提供装置100の構成要素と実施の形態2に係る情報検索提供装置100の構成要素を含む装置を新たな情報検索提供装置100としてもよい。
(変形例3)
実施の形態3では評価対象のコンテンツが更新されているか否かに応じて当該コンテンツの信頼度を増減させたが、さらに別の変形例として、情報検索提供装置100は当該コンテンツの内容を分析する分析部を備え、分析部による分析の結果、評価対象のコンテンツの信頼度を上昇させる項目を含んでいる場合は、信頼度を評価対象のコンテンツの信頼度を増加させてもよい。以下、当該項目の一例を示す。なお、この分析部は内部に時間情報を取得するためのタイマやプログラムのソースを解析するソース解析部を備えるものとする。
(ア)コンテンツにSSL(Secure Sockets Layer)対策などのセキュリティ対策を行っているとき
(ィ)コンテンツがクレジット決済を扱っているとき
(ウ)コンテンツが有料ドメイン名を使用しているとき
(エ)コンテンツが悪質なプログラムを用いていないとき
(オ)コンテンツの利用者およびアクセス数が多いとき
(カ)コンテンツへアクセスした際の応答時間が短いとき
(キ)コンテンツ内の電子メールアドレスに当該コンテンツのウェブページのドメイン名が含まれているとき
(ク)性的な内容や暴力的な内容など公序良俗に反する内容を含んでいないとき
(変形例4)
実施の形態では、検索情報保持部180に保持されているコンテンツすべてを検索結果の提示対象としていたが、さらに別の変形例として、情報検索提供装置100は、検索結果のうち信頼度の高いコンテンツしかユーザに提示させない提示制限部を備えてもよい。インターネット上には悪質なウェブページもあり、信頼度が低いコンテンツをそもそもユーザに提示させないことによって、ユーザ全体における信頼度の低いウェブページへのアクセスを軽減できる。
(変形例5)
実施の形態7では、判断対象項目、例えば採用関連情報の整合性の有無に応じて、お互いに関連する自コンテンツと他コンテンツの信頼度を同時に制御したが、さらに別の変形例として、コンテンツ取得部147により取得されたコンテンツのうち、判断対象項目を掲載しているコンテンツが多いほど自コンテンツの信頼度を上げても良い。例えば、判断対象項目が採用関連情報であり、「新卒募集」であったとき、信頼度制御部130は、その「新卒募集」を含むコンテンツが多いほど、自コンテンツの信頼度を増加させる。
(変形例6)
さらに別の変形例として、実施の形態1〜8に係る情報検索提供装置100に将来のコンテンツの信頼度を予測する予測部をさらに設けてもよい。予測部は、評価対象のコンテンツに含まれるコンテンツの存続期間の推測に供する要素に基づいて、評価対象のコンテンツの信頼度を予測する。コンテンツの存続期間の推測に貢献する要素とは、例えば、コンテンツの情報提供者が個人であれば、当該個人の年齢に相当し、一方、企業であれば、会社の成長率に相当する。前者の例でいえば、個人の年齢が「30歳」であれば、通常の人の寿命である「80歳」まで、すなわち現在から50年後のコンテンツの信頼度を予測する。予測の際、現在の信頼度の増加幅を維持するという条件のもとで、50年後のコンテンツの信頼度を予測してもよい。信頼度提示部118はその予測された信頼度をユーザに提示する。これにより、ユーザは現在、過去の信頼度の変化の様子を知るだけでなく、将来のコンテンツの信頼度を知ることで、信頼度がさらに増加していれば、より安心してコンテンツを利用することができる。
(変形例7)
実施の形態1では、収集部128によるコンテンツの収集の可否に応じて信頼度の増減を制御したが、さらに別の変形例として、収集部128によりコンテンツが収集されないとき、情報検索提供装置100に新たに設けられた確認部が、確認対象項目についてコンテンツの収集の否に関する確認を行っても良い。以下、確認対象の項目の一例を示す。サーバ移転情報やサーバ故障情報に含まれるキーワードは、図示しない確認対象項目保持部にあらかじめ保持されている。
(A)コンテンツ内に「移転しました」などのサーバ移転情報があるか否か
(B)コンテンツ内に「ウェブサーバ故障中」などのサーバ故障情報があるか否か
それらサーバ移転情報やサーバ故障情報が評価対象のコンテンツ内に含まれているとき、評価対象のコンテンツが収集されなくても、信頼度制御部130は、評価対象のコンテンツの信頼度を減少させないよう制御してもよい。また、このとき、アクセス可否判断部124は、その情報がコンテンツ内に掲載されている期間内において、評価対象のコンテンツのアクセス履歴欄322内にフラグ「○」を設定する。また、例えば、評価対象のコンテンツの収集の否が10日間続いたとき、確認部はドメイン名を管理する第三者機関のデータベースにアクセスして、評価対象のコンテンツを掲載するウェブサーバのドメイン名をキーにして、当該ウェブサーバを提供する情報提供者の状態を把握してもよい。これにより、情報提供者の責めに期する理由がなく、情報提供者がコンテンツを提供できなかったとき、当該コンテンツの信頼度の減少をさせないことで、当該コンテンツを救済できる。
(変形例8)
実施の形態1〜8では、情報検索提供装置100は検索結果としてコンテンツとコンテンツの信頼度の一覧をユーザに示したが、さらに別の変形例として、ユーザが、その情報を用いて、例えば実際の店舗に赴いたり、あるいはインターネットショッピングで売買をしたりしたとき、情報検索提供装置100はユーザからのそのコンテンツに対する信頼度に関する評価値を取得し、現在の当該コンテンツの信頼度に反映させる。本変形例では、実施の形態1〜8に係る情報検索提供装置100に、新たに評価値取得部が設けられる。
評価値取得部はユーザからのコンテンツに対する信頼度に関する評価値を取得する。その評価値取得部を介して、ユーザからコンテンツの信頼度に関する、低い方から高い方へ「−5」〜「5」の10段階評価で表現された評価値を取得し、信頼度制御部130はその評価値を現在のコンテンツの信頼度に加算する。これにより、コンテンツを利用した際のユーザからの当該コンテンツに対する評価を取り込むことができ、より的確な信頼度を提示できる情報検索サービスを実現できる。
(変形例9)
実施の形態2では、信頼度の高いコンテンツ内に、当該コンテンツと評価対象のコンテンツとの間に関連性があることを示す関連情報が含まれるか否かに基づいて関連性の有無を判断したが、本変形例では、評価対象のコンテンツ内に、評価対象のコンテンツと信頼度の高いコンテンツとの間に関連性があることを示す関連情報が含まれるか否かに基づいて、関連性の有無を判断する。例えば、関連性判断部134は、評価対象のコンテンツ内に、当該関連情報、例えば、評価対象のコンテンツから信頼度の高いコンテンツへのリンクが含まれているかどうか判断する。具体的には、関連性判断部134は、評価対象のコンテンツに含まれるタグ<A HREF="〜">内の「〜」に、信頼度の高いコンテンツを掲載するウェブページのURLが含まれているかどうか判断する。このとき、信頼度の高いコンテンツを掲載するウェブページのURLは、関連性判断部134により検索情報保持部180に保持された検索情報ファイルから取得される。
信頼度制御部130は、関連性判断部134により関連性があると判断されたときにおける評価対象のコンテンツの信頼度の増加幅を、関連性がないと判断されたときにおける評価対象のコンテンツの信頼度の増加幅よりも高く制御する。これにより、例えば、評価対象のコンテンツ内に信頼度の高いウェブページへのリンクがある場合と、信頼度の高いウェブページへのリンクがない場合とを差別化できる。信頼度制御部130は、評価対象のコンテンツ内に、信頼度の高い複数のコンテンツのURLと合致するものがあれば合致する数だけ信頼度の増加幅を増加させてもよい。例えば、合致するものが三つあれば、評価対象のコンテンツの現在の増加幅にさらに「3」を加算する。これにより評価対象のコンテンツに信頼度の高いコンテンツへのリンクが張られれば張られるほど、信頼度の増加幅を大きくすることができる。
(変形例10)
実施の形態2および変形例9では、評価対象のコンテンツと信頼度の高いコンテンツとの関連性の有無を判断したが、さらに別の変形例として、評価対象のコンテンツと信頼度の低いコンテンツとの関連性の有無を判断する。本変形例における関連性判断部134による関連性の有無の判断方法については、実施の形態2および変形例9における関連性の有無の判断方法と同様である。すなわち、関連性判断部134は、信頼度の低いコンテンツ内に、当該コンテンツと評価対象のコンテンツとの間に関連性があることを示す関連情報が含まれるか否かに基づいて、評価対象のコンテンツと信頼度の低いコンテンツとの関連性の有無を判断する。さらに、関連性判断部134は、評価対象のコンテンツ内に、当該コンテンツと信頼度の低いコンテンツとの間に関連性があることを示す関連情報が含まれるか否かに基づいて、評価対象のコンテンツと信頼度の低いコンテンツとの関連性の有無を判断してもよい。
前者の判断の場合、信頼度制御部130は、関連性判断部134による関連性の有無の判断の結果を、評価対象のコンテンツの信頼度の増加幅の増減に反映させない。信頼度の低いコンテンツは信頼のおけない情報を有する可能性が高く、リンクなどの関連情報の存在自体を無視した方が有意義であるためである。後者の判断の場合、信頼度制御部130は、関連性判断部134により関連性があると判断されたときにおける評価対象のコンテンツの信頼度の増加幅を、関連性がないと判断されたときにおける評価対象のコンテンツの信頼度の増加幅よりも低く制御する。これにより、例えば、評価対象のコンテンツ内に、性的な内容や暴力的な内容など公序良俗に反する内容を含んだ、信頼度の低いコンテンツへのリンクが有る場合と、信頼度の低いウェブページへのリンクがない場合とを差別化できる。
(変形例11)
実施の形態6では単一の観点から評価対象のコンテンツの信頼度を増減させたが、本変形例では、複数の観点から評価対象のコンテンツの信頼度を増減させる。このとき、要素抽出部144は、信頼度の評価の観点ごとに、前記評価対象のコンテンツの信頼度の増加あるいは減少に貢献する要素を抽出する。具体的には、信頼度の評価の観点が、例えば「採用」であれば、要素抽出部144は、関連コンテンツ取得部142により取得されたコンテンツの中から、「採用」に関連する、評価対象のコンテンツの信頼度の増加あるいは減少に貢献する要素を抽出する。
信頼度の評価の観点、例えば「採用」に関するキーワードは、あらかじめ図示しない観点保持部に保持されていてもよい。「採用」に関するキーワードとは例えば、「採用実績人数」や「採用予定人数」などが挙げられる。このとき、要素抽出部144は、関連コンテンツ取得部142により取得されたコンテンツに対して、観点保持部の保持されたキーワードおよび前述の貢献保持部に保持されたキーワードを指定して検索し合致した情報を取得する。具体的には、要素抽出部144は、「採用実績人数」と「増加」をAND条件として検索すれば、「採用」の観点から信頼度の増加に貢献する要素を抽出できる。
信頼度制御部130は、信頼度の評価の観点ごとに抽出された要素を参照して、評価対象のコンテンツの信頼度を増減せしめる。例えば、評価対象のコンテンツが「ABC会社」により提供されるものであり、取得されたコンテンツの中に「ABC会社の採用人数は増加した」との記載があれば、「採用」という観点から「増加」という要素が要素抽出部144により抽出され、その要素は分類部146により前述の第1グループに分類される。このとき、信頼度制御部130は、「採用」という信頼度の評価の観点から評価対象のコンテンツの信頼度を増加せしめる。なお、信頼度制御部130は、観点ごとに信頼度を設定し、要素抽出部144による信頼度の評価の観点ごとに抽出された結果に基づいて、観点ごとにそれぞれの信頼度を増減せしめてもよい。このとき、信頼度制御部130は、観点ごとに得られたそれぞれの信頼度を合計して、一つの評価対象のコンテンツの信頼度としてもよい。本変形例によれば、評価対象のコンテンツの信頼度を様々な観点から評価でき、信頼度の精度が高まる。
本発明によれば、ユーザ利便性の高い情報検索サービスを提供できる。

Claims (2)

  1. 検索条件文を取得し当該検索条件文に合致したコンテンツを検索結果として提供する情報検索提供装置であって、
    ウェブページに掲載される評価対象のコンテンツをネットワークを介して所定のタイミングで収集する収集部と、
    前記収集された評価対象のコンテンツの内容と、当該コンテンツを掲載するウェブページと同一のウェブページから次に収集される評価対象のコンテンツの内容とを、評価対象のコンテンツ提供者に関連する判定項目について比較する比較部と、
    前記比較の結果に基づいて前記評価対象のコンテンツが更新されたか否かを判断する更新判断部と、
    前記収集された評価対象のコンテンツの内容を参照し当該コンテンツが本来更新を必要とするべきものであるか否かを分析する更新分析部と、
    前記更新判断部による判断の結果および前記更新分析部による分析の結果に応じて前記評価対象のコンテンツの信頼度を増減せしめる信頼度制御部と、
    を備えることを特徴とする情報検索提供装置。
  2. 前記信頼度制御部は、前記更新判断部により前記評価対象のコンテンツが更新されていると所定のタイミングで連続して判断される期間内において、前記評価対象のコンテンツの信頼度を徐々に増加せしめることを特徴とする請求項1に記載の情報検索提供装置。
JP2006535689A 2004-09-07 2005-08-30 情報検索提供装置および情報検索提供システム Active JP4719684B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006535689A JP4719684B2 (ja) 2004-09-07 2005-08-30 情報検索提供装置および情報検索提供システム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004259725 2004-09-07
JP2004259725 2004-09-07
JP2006535689A JP4719684B2 (ja) 2004-09-07 2005-08-30 情報検索提供装置および情報検索提供システム
PCT/JP2005/015770 WO2006027973A1 (ja) 2004-09-07 2005-08-30 情報検索提供装置および情報検索提供システム

Publications (2)

Publication Number Publication Date
JPWO2006027973A1 JPWO2006027973A1 (ja) 2008-05-08
JP4719684B2 true JP4719684B2 (ja) 2011-07-06

Family

ID=36036259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006535689A Active JP4719684B2 (ja) 2004-09-07 2005-08-30 情報検索提供装置および情報検索提供システム

Country Status (4)

Country Link
US (1) US8341135B2 (ja)
JP (1) JP4719684B2 (ja)
CN (1) CN101014954B (ja)
WO (1) WO2006027973A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010165374A (ja) * 2000-03-29 2010-07-29 Sojitz Corp 与信機能を備えた匿名電子商取引システム及び方法
JP4085284B2 (ja) 2005-03-24 2008-05-14 ソニー株式会社 再生装置
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
KR100807264B1 (ko) * 2006-04-29 2008-02-28 강찬구 온라인 컨텐츠 마켓플레이스 시스템 및 운영방법
JP4943759B2 (ja) * 2006-07-18 2012-05-30 株式会社リコー リンク情報管理システム、リンク情報管理方法及びリンク情報管理プログラム
US9912766B2 (en) * 2007-03-23 2018-03-06 Yahoo Holdings, Inc. System and method for identifying a link and generating a link identifier for the link on a webpage
US9430527B2 (en) * 2007-04-12 2016-08-30 Unicom Systems, Inc. Keyword-based content management
US8073803B2 (en) * 2007-07-16 2011-12-06 Yahoo! Inc. Method for matching electronic advertisements to surrounding context based on their advertisement content
JP2009025871A (ja) * 2007-07-17 2009-02-05 Hewlett-Packard Development Co Lp アクセス制限装置およびその方法。
US20090081629A1 (en) * 2007-09-24 2009-03-26 Chad Walter Billmyer System and method for matching students to schools
US8947421B2 (en) * 2007-10-29 2015-02-03 Interman Corporation Method and server computer for generating map images for creating virtual spaces representing the real world
US20090125319A1 (en) * 2007-11-14 2009-05-14 At&T Delaware Intellectual Property, Inc. Systems, methods, and computer program products for allocating credit based upon distribution of electronic content
US8762571B2 (en) * 2008-03-19 2014-06-24 Go Daddy Operating Company, LLC Interactive DNS for non-controlling party
US20090307191A1 (en) * 2008-06-10 2009-12-10 Li Hong C Techniques to establish trust of a web page to prevent malware redirects from web searches or hyperlinks
JP2010009180A (ja) * 2008-06-25 2010-01-14 Hitachi Information Systems Ltd 不法入国者を幇助する悪質ブローカーの摘発を支援するシステムおよびその方法
JP4849484B2 (ja) * 2008-11-19 2012-01-11 ヤフー株式会社 ホームページ診断装置、ホームページ診断方法及びプログラム
JP5418295B2 (ja) * 2010-02-25 2014-02-19 日本電気株式会社 検索装置
JP5440394B2 (ja) * 2010-05-31 2014-03-12 ソニー株式会社 評価予測装置、評価予測方法、及びプログラム
GB2487390A (en) * 2011-01-19 2012-07-25 Canon Kk Managing access to copies of resources
CN102236719A (zh) * 2011-07-25 2011-11-09 西交利物浦大学 基于网页分类的网页搜索引擎及快速查找方法
JP2013109539A (ja) * 2011-11-21 2013-06-06 Hitachi Consumer Electronics Co Ltd 商品購入装置および商品購入方法
CN102708144B (zh) * 2012-03-20 2015-05-27 华为技术有限公司 信息处理方法及设备
JP2014119861A (ja) * 2012-12-14 2014-06-30 Alpine Electronics Inc 評価提示システムとこれに用いるサーバならびに端末装置および評価提示方法
US9652482B2 (en) * 2012-12-31 2017-05-16 Teradata Us, Inc. Data storage management based on indicated storage levels and other criteria for multilevel storage systems
US11354486B2 (en) 2013-05-13 2022-06-07 International Business Machines Corporation Presenting a link label for multiple hyperlinks
JP5855072B2 (ja) * 2013-10-31 2016-02-09 ヤフー株式会社 融資システム、信用情報生成装置、融資判定装置、融資条件判定方法、信用情報生成プログラム及び融資条件判定プログラム
US20150149433A1 (en) * 2013-11-26 2015-05-28 Resultly, LLC. System, device, and method for searching network data
CN103634117B (zh) * 2013-12-09 2017-04-05 北京奇虎科技有限公司 一种网购安全防护的控制方法及装置
US9633128B2 (en) 2014-03-13 2017-04-25 Go Daddy Operating Company, LLC Lightweight web page generation
US9501211B2 (en) 2014-04-17 2016-11-22 GoDaddy Operating Company, LLC User input processing for allocation of hosting server resources
US9660933B2 (en) 2014-04-17 2017-05-23 Go Daddy Operating Company, LLC Allocating and accessing hosting server resources via continuous resource availability updates
US9137217B1 (en) * 2014-05-16 2015-09-15 Iboss, Inc. Manage encrypted network traffic using DNS responses
JP6520955B2 (ja) * 2014-11-14 2019-05-29 富士通株式会社 データ検証プログラム、データ検証方法及びデータ検証装置
US10164933B2 (en) 2014-12-19 2018-12-25 Go Daddy Operating Company, LLC System and method for domain name system restore points
US10659423B2 (en) 2014-12-19 2020-05-19 Go Daddy Operating Company, LLC System and method for modifying a domain name system template
JP6134369B2 (ja) * 2015-10-28 2017-05-24 株式会社オプティム 端末管理システム及び端末管理方法。
JP2022021099A (ja) * 2020-07-21 2022-02-02 ソニーグループ株式会社 情報処理プログラム、情報処理装置および情報処理方法
US20220084091A1 (en) * 2020-09-17 2022-03-17 Mastercard International Incorporated Continuous learning for seller disambiguation, assessment, and onboarding to electronic marketplaces
CN114169169B (zh) * 2021-12-08 2024-05-10 福建省特种设备检验研究院泉州分院 一种桥式起重机设备可靠性分析系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134529A (ja) * 1999-11-04 2001-05-18 Ntt Docomo Inc サーバ、情報処理方法及び記録媒体
JP2001318947A (ja) * 2000-05-12 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 情報統合システムおよび情報統合方法、ならびにそのプログラムを記録した記録媒体
JP2001337973A (ja) * 2000-05-25 2001-12-07 Fujitsu Ltd 検索システムのメンテナンス方法及び検索システム
JP2002157271A (ja) * 2000-11-20 2002-05-31 Yozan Inc ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法
JP2003256317A (ja) * 2002-02-28 2003-09-12 Nec Corp リンク集自動メンテナンス方法、サーバ端末、サイト運営者端末及びプログラム

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623652A (en) * 1994-07-25 1997-04-22 Apple Computer, Inc. Method and apparatus for searching for information in a network and for controlling the display of searchable information on display devices in the network
US5715443A (en) * 1994-07-25 1998-02-03 Apple Computer, Inc. Method and apparatus for searching for information in a data processing system and for providing scheduled search reports in a summary format
JPH101638A (ja) 1996-06-17 1998-01-06 Sumitomo Chem Co Ltd 遮光性塗料組成物および表面に遮光性薄膜を有する基板を製造する方法
US5920854A (en) * 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
JP4025379B2 (ja) 1996-09-17 2007-12-19 株式会社ニューズウオッチ 検索システム
US5974445A (en) * 1997-10-28 1999-10-26 International Business Machines Corporation Web browser which checks availability of hot links
US6041324A (en) * 1997-11-17 2000-03-21 International Business Machines Corporation System and method for identifying valid portion of computer resource identifier
US6163778A (en) * 1998-02-06 2000-12-19 Sun Microsystems, Inc. Probabilistic web link viability marker and web page ratings
US6638314B1 (en) * 1998-06-26 2003-10-28 Microsoft Corporation Method of web crawling utilizing crawl numbers
US6434556B1 (en) * 1999-04-16 2002-08-13 Board Of Trustees Of The University Of Illinois Visualization of Internet search information
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6269361B1 (en) * 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6547829B1 (en) * 1999-06-30 2003-04-15 Microsoft Corporation Method and system for detecting duplicate documents in web crawls
US6631369B1 (en) * 1999-06-30 2003-10-07 Microsoft Corporation Method and system for incremental web crawling
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US6785671B1 (en) * 1999-12-08 2004-08-31 Amazon.Com, Inc. System and method for locating web-based product offerings
US6594654B1 (en) * 2000-03-03 2003-07-15 Aly A. Salam Systems and methods for continuously accumulating research information via a computer network
US6643641B1 (en) * 2000-04-27 2003-11-04 Russell Snyder Web search engine with graphic snapshots
US6353448B1 (en) * 2000-05-16 2002-03-05 Ez Online Network, Inc. Graphic user interface display method
US6567103B1 (en) * 2000-08-02 2003-05-20 Verity, Inc. Graphical search results system and method
US7080073B1 (en) * 2000-08-18 2006-07-18 Firstrain, Inc. Method and apparatus for focused crawling
KR20000072482A (ko) * 2000-09-06 2000-12-05 이재학 이용자의 검색을 용이하게 하는 인터넷 검색 시스템 및 그방법
NO313399B1 (no) * 2000-09-14 2002-09-23 Fast Search & Transfer Asa Fremgangsmate til soking og analyse av informasjon i datanettverk
US20020099602A1 (en) * 2000-12-04 2002-07-25 Paul Moskowitz Method and system to provide web site schedules
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
US20020129062A1 (en) * 2001-03-08 2002-09-12 Wood River Technologies, Inc. Apparatus and method for cataloging data
US20040030741A1 (en) * 2001-04-02 2004-02-12 Wolton Richard Ernest Method and apparatus for search, visual navigation, analysis and retrieval of information from networks with remote notification and content delivery
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US7672894B2 (en) * 2001-07-20 2010-03-02 Shopzilla, Inc. Automated bidding system for use with online auctions
US7076483B2 (en) * 2001-08-27 2006-07-11 Xyleme Sa Ranking nodes in a graph
US7584262B1 (en) * 2002-02-11 2009-09-01 Extreme Networks Method of and system for allocating resources to resource requests based on application of persistence policies
JP2003256466A (ja) * 2002-03-04 2003-09-12 Denso Corp 適応的情報検索システム
JP2003271610A (ja) 2002-03-19 2003-09-26 Toshiba Corp 情報収集装置及び情報収集プログラム
JP3885152B2 (ja) 2002-03-28 2007-02-21 株式会社ジャストシステム ガイド情報提供装置、ガイド情報提供方法およびその方法をコンピュータに実行させるプログラム
KR20030084245A (ko) * 2002-04-26 2003-11-01 문성업 인터넷검색엔진과 연계한 역 탐색기의 구현 방법
JP2004029943A (ja) 2002-06-21 2004-01-29 Recruit Co Ltd 検索支援方法
AU2002953500A0 (en) * 2002-12-20 2003-01-09 Redbank Manor Pty Ltd A system and method of requesting, viewing and acting on search results in a time-saving manner
US7574651B2 (en) * 2003-06-26 2009-08-11 Yahoo! Inc. Value system for dynamic composition of pages
US7725452B1 (en) * 2003-07-03 2010-05-25 Google Inc. Scheduler for search engine crawler
WO2005057358A2 (en) * 2003-12-04 2005-06-23 Perfect Market Technologies, Inc. Search engine that dynamically generates search listings
US20050131872A1 (en) * 2003-12-16 2005-06-16 Microsoft Corporation Query recognizer
US7299222B1 (en) * 2003-12-30 2007-11-20 Aol Llc Enhanced search results
US7310632B2 (en) * 2004-02-12 2007-12-18 Microsoft Corporation Decision-theoretic web-crawling and predicting web-page change
US7251654B2 (en) * 2004-05-15 2007-07-31 International Business Machines Corporation System and method for ranking nodes in a network
US7437364B1 (en) * 2004-06-30 2008-10-14 Google Inc. System and method of accessing a document efficiently through multi-tier web caching
US20060015573A1 (en) * 2004-06-30 2006-01-19 Microsoft Corporation System and method for automatic redirection to stored web resources upon access failure
US20060053076A1 (en) * 2004-09-03 2006-03-09 Gary Kremen Monetizing time-sensitive content on network-connected media

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134529A (ja) * 1999-11-04 2001-05-18 Ntt Docomo Inc サーバ、情報処理方法及び記録媒体
JP2001318947A (ja) * 2000-05-12 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 情報統合システムおよび情報統合方法、ならびにそのプログラムを記録した記録媒体
JP2001337973A (ja) * 2000-05-25 2001-12-07 Fujitsu Ltd 検索システムのメンテナンス方法及び検索システム
JP2002157271A (ja) * 2000-11-20 2002-05-31 Yozan Inc ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法
JP2003256317A (ja) * 2002-02-28 2003-09-12 Nec Corp リンク集自動メンテナンス方法、サーバ端末、サイト運営者端末及びプログラム

Also Published As

Publication number Publication date
US20070208699A1 (en) 2007-09-06
CN101014954A (zh) 2007-08-08
WO2006027973A1 (ja) 2006-03-16
US8341135B2 (en) 2012-12-25
CN101014954B (zh) 2010-05-05
JPWO2006027973A1 (ja) 2008-05-08

Similar Documents

Publication Publication Date Title
JP4719684B2 (ja) 情報検索提供装置および情報検索提供システム
US11743214B2 (en) System and method for performing follow up based on user interactions
US7930285B2 (en) Systems for and methods of user demographic reporting usable for identifying users and collecting usage data
US9300755B2 (en) System and method for determining information reliability
US8856168B2 (en) Contextual application recommendations
US20090234727A1 (en) System and method for determining relevance ratings for keywords and matching users with content, advertising, and other users based on keyword ratings
US20080183664A1 (en) Presenting web site analytics associated with search results
CA2836700C (en) Active search results page ranking technology
US20040015715A1 (en) Systems for and methods of placing user indentification in the header of data packets usable in user demographic reporting and collecting usage data
WO2004084097A1 (en) Method and apparatus for detecting invalid clicks on the internet search engine
JP2009193465A (ja) 情報処理装置、情報提供システム、情報処理方法、およびプログラム
US20130282516A1 (en) Scraping resistant system and method for placing orders through an internet shopping service
WO2006083118A1 (en) Keyword association advertisement system and method thereof
CN103617278A (zh) 一种地址栏搜索的控制方法及装置
US20130204864A1 (en) Information provision device, information provision method, program, and information recording medium
US20170323019A1 (en) Ranking information providers
KR100366772B1 (ko) 인터넷을 이용한 지식/정보 제공 서비스 방법
US9064014B2 (en) Information provisioning device, information provisioning method, program, and information recording medium
US8271482B2 (en) Information processing device
US20150154612A1 (en) System and method for determining the legitimacy of a listing
JP4773379B2 (ja) イベント検索システム、イベント検索装置、イベント検索結果出力方法およびプログラム
KR101380946B1 (ko) 웹 사이트 정보에 기반한 광고 서비스 시스템 및 방법
JP2012073798A (ja) 監視サーバ及び方法
JP2005135293A (ja) プライバシーステートメント作成支援システム及び方法並びにプライバシーステートメント作成支援用プログラム
GB2470563A (en) Populating a database

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101013

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110222

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110404

R150 Certificate of patent or registration of utility model

Ref document number: 4719684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140408

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350