JP4922274B2 - 社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム - Google Patents

社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム Download PDF

Info

Publication number
JP4922274B2
JP4922274B2 JP2008249089A JP2008249089A JP4922274B2 JP 4922274 B2 JP4922274 B2 JP 4922274B2 JP 2008249089 A JP2008249089 A JP 2008249089A JP 2008249089 A JP2008249089 A JP 2008249089A JP 4922274 B2 JP4922274 B2 JP 4922274B2
Authority
JP
Japan
Prior art keywords
url
directory
query
search
input query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008249089A
Other languages
English (en)
Other versions
JP2010020739A5 (ja
JP2010020739A (ja
Inventor
澄男 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008249089A priority Critical patent/JP4922274B2/ja
Publication of JP2010020739A publication Critical patent/JP2010020739A/ja
Publication of JP2010020739A5 publication Critical patent/JP2010020739A5/ja
Application granted granted Critical
Publication of JP4922274B2 publication Critical patent/JP4922274B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ディレクトリ方式に登録サイトを管理する情報管理装置、方法及びプログラムに関する。
従来、Web検索の技術分野において、URL(Uniform Resource Locator)へのリンクや検索キーワードとしてのクエリにユーザの興味や関心を反映させる技術が知られている。
例えば、特許文献1には、URLを管理するとともに自動的にカテゴリ分けして、当該リンクの個人及び公共ディレクトリを作成する技術が開示されている。また、特許文献2には、ユーザが、ある特定の検索クエリの結果に自身の個人的な関心をどの程度影響させるかについて可変的に調整する技術が開示されている。
特表2002−539559号公報 特表2007−531160号公報
ここで、Web検索において、ディレクトリ型と呼ばれる方式がある。これは、主題分類を反映した階層構造のディレクトリに登録サイトを配置して、検索者が階層をたどりながら登録サイトにアクセスする方式である。
一方、ディレクトリ型の固定的な分類付与に対して、最近の協調タッギング等では、より自由に利用者が思いついたタグを、情報アイテムに付与する方式が行われている。これにより、情報アイテムが、利用者のコミュニティーにおける社会的な関心度合いに応じて、検索されやすくなる。
また、ディレクトリ型の検索方式において、特定の専門分野の関心や特定個人の関心をディレクトリに反映させる場合を考える。この場合、一般的な社会的人気・関心を当該ディレクトリに反映させるだけでは、特定の専門分野の関心や特定個人の関心を充分に反映させることができない可能性がある。
そこで、本発明は、ディレクトリ型の検索方式において、利用者の社会的な関心度合いを反映したディレクトリを作成及び表示する情報管理装置、方法及びプログラムを提供することを目的とする。
また、ディレクトリ型の検索方式において、特定の専門分野の関心や特定個人の関心を反映したディレクトリを作成する情報管理装置、方法及びプログラムを提供することを目的とする。
本発明では、以下のような解決手段を提供する。
(1)ディレクトリに格納されており、表示順位が予め示されているURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力され、前記検索エンジ ンによりウェブページが検索され、検索結果として、前記表示順位にしたがったURLを 表示するユーザ端末とを管理する情報管理装置において、前記ユーザ端末に入力された前 記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果として表示 されるURLのうち、前記ユーザがクリックしたクリックURLと前記入力クエリとが対応付けて記憶される記憶手段と、前記記憶手段に記憶された前記クリックURL及び前記入力クエリに基づいて、前記ディレクトリに格納されているURLの中から前記クリックURLを検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成手段と、前記記憶手段に対応付けて記憶されている前記クリックURL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成手段と、前記第1有向リンクを構成する 記クリックURLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出手段と、前記遷移確率が第1の閾値よりも大きいか否かを判定する第1閾値判定手段と、前記第1閾値判定手段により判定された結果、前記遷移確率が前記第1の閾値よりも大きい場合には、前記選択URLが前記ディレクトリに存在するか否かを判定するURL判定手段と、前記URL判定手段により判定された結果、前記選択URLが前記ディレクトリに存在する場合には、前記表示順位を変更する表示順位変更手段とを備える情報管理装置。
(1)の構成によれば、情報管理装置は、記憶手段に記憶されたURL及び入力クエリに基づいて、ディレクトリから選択URLへの遷移確率を算出し、この遷移確率が第1の閾値よりも大きい、且つ選択URLがディレクトリに存在する場合には、ディレクトリの選択URLの表示順位を変更する。
このため、情報管理装置は、ユーザの社会的な興味・関心を反映している記憶手段に記憶されたURL及び入力クエリに基づいて、選択URLの表示順位を変更する。したがって、情報管理装置は、選択URLの表示順位にユーザの社会的な興味・関心を反映させることができる。
(2)前記URL判定手段により判定された結果、前記選択URLが前記ディレクトリに存在しない場合には、前記選択URLを前記ディレクトリに追加するURL追加手段を更に備える(1)に記載の情報管理装置。
(2)の構成によれば、情報管理装置は、ディレクトリから選択URLへの遷移確率が第1の閾値よりも大きい、且つ選択URLがディレクトリに存在しない場合には、ディレクトリに選択URLを追加する。
このため、情報管理装置は、ユーザの社会的な興味・関心を反映している記憶手段に記憶されたURL及び入力クエリに基づいて、選択URLをディレクトリに追加する。したがって、情報管理装置は、ユーザの社会的な興味・関心を反映させた選択URLをディレクトリに追加することができる。
(3)前記遷移確率算出手段は、前記記憶手段に記憶された前記URL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記URLから前記第1有向リンクを構成するクエリへの第1遷移確率を算出する第1遷移確率算出手段と、前記記憶手段に記憶された前記URL及び前記入力クエリに基づいて、前記第1有向リンク及び前記第2有向リンクを構成するクエリから前記第2有向リンクを構成する前記選択URLへの第2遷移確率を算出する第2遷移確率算出手段と、前記第1遷移確率と前記第2遷移確率とに基づいて、前記第1有向リンクを構成する前記URLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの前記遷移確率を算出する第3遷移確率算出手段とを備える(1)又は(2)に記載の情報管理装置。
(3)の構成によれば、情報管理装置は、第1有向リンクを構成するURLから第1有向リンクを構成する入力クエリへの第1遷移確率と、第1有向リンク及び第2有向リンクを構成する入力クエリから第2有向リンクを構成する選択URLへの第2遷移確率とを算出し、第1遷移確率と2遷移確率とに基づいて、ディレクトリから選択URLへの遷移確率を算出する。
このため、情報管理装置は、遷移確率を第1遷移確率と第2遷移確率に基づいて、好適に算出することができる。
(4)前記第1遷移確率に基づいて、前記ディレクトリから前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリへの第4遷移確率を算出する第4遷移確率算出手段と、前記第4遷移確率が第2の閾値よりも大きいか否かを判定する第2閾値判定手段と、前記第2閾値判定手段により判定された結果、前記第4遷移確率が前記第2の閾値よりも大きい場合には、前記ディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成手段とを更に備える(3)に記載の情報管理装置。
(4)の構成によれば、情報管理装置は、ディレクトリから第1有向リンク及び第2有向リンクを構成する入力クエリへの第4遷移確率を算出し、この第4遷移確率が第2の閾値よりも大きい場合には、ディレクトリに第1有向リンク及び第2有向リンクを構成する入力クエリの名称が付与されたサブディレクトリを作成する。
このため、情報管理装置は、ユーザの社会的な興味・関心を反映させたクエリの名称が付与されたサブディレクトリを作成することができる。
(5)前記第4遷移確率が第3の閾値よりも大きいか否かを判定する第3閾値判定手段と、前記第3閾値判定手段により判定された結果、前記第4遷移確率が前記第3の閾値よりも大きい場合には、作成された前記サブディレクトリに前記選択URLを追加するサブディレクトリURL追加手段とを更に備える(4)に記載の情報管理装置。
(5)の構成によれば、情報管理装置は、ディレクトリから選択URLへの遷移確率が第3の閾値よりも大きい場合には、作成されたサブディレクトリに択URLを追加する。
このため、情報管理装置は、ユーザの社会的な興味・関心を反映している記憶手段に記憶されたURL及び入力クエリに基づいて、選択URLをサブディレクトリに追加する。したがって、情報管理装置は、ユーザの社会的な興味・関心を反映している選択URLをサブディレクトリに追加することができる。
(6)前記ディレクトリと作成された前記サブディレクトリとの類似度を算出する類似度算出手段と、前記類似度算出手段により算出された前記類似度が所定の条件を満たすか否かを判定する類似度判定手段と、前記類似度判定手段により判定された結果、前記類似度が前記所定の条件を満たす場合には、前記ディレクトリと作成された前記サブディレクトリとのリンクを作成するリンク作成手段とを更に備える(5)に記載の情報管理装置。
(6)の構成によれば、情報管理装置は、ディレクトリと作成されたサブディレクトリとの類似度が所定の条件を満たす場合には、ディレクトリと作成されたサブディレクトリとのリンクを作成する。
このため、情報管理装置は、類似度の高いディレクトリとサブディレクトリとのリンクを作成することにより、ウェブディレクトリにおける検索機能をより向上させることができる。
(7)ディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理する情報管理装置において、 記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される記憶手段と、前記記憶手段に記憶された前記URL及び前記入力クエリに基づいて、前記ディレクトリに格納されるURLが選択された頻度を算出する頻度算出手段と、前記頻度算出手段により算出された前記頻度のうち、所定の頻度を超えるURLを抽出するURL抽出手段と、前記URL抽出手段に より抽出された前記URLの集合を仮想ディレクトリとして、前記ディレクトリとの類似度を算出する類似度算出手段と、前記類似度算出手段により算出された前記類似度が所定の条件を満たすか否かの判定を行う類似度判定手段と、前記類似度判定手段により判定された結果、前記所定の条件を満たす場合、前記類似度を算出したディレクトリに、抽出された前記URLが格納されるサブディレクトリを作成するサブディレクトリ作成手段とを備える情報管理装置。
(7)の構成によれば、情報管理装置は、所定の頻度を超えるURLを抽出し、抽出されたURLの集合を仮想ディレクトリとして、ディレクトリとの類似度を算出し、算出された類似度が所定の条件を満たす場合、類似度を算出したディレクトリに、抽出されたURLが格納されるサブディレクトリを作成する。
このため、情報管理装置は、ユーザの社会的な興味・関心を反映している記憶手段に記憶されたURL及び入力クエリに基づいて、サブディレクトリをディレクトリに作成する。したがって、情報管理装置は、ユーザの社会的な興味・関心を反映させたサブディレクトリを作成することができる。
(8)前記類似度判定手段により判定された結果、前記所定の条件を満たす場合、抽出された前記URLを前記サブディレクトリに追加し、当該追加したURLと前記類似度を算出したディレクトリに格納されるURLとで重複するURLを併合するURL併合手段を更に備える(7)に記載の情報管理装置。
(8)の構成によれば、情報管理装置は、算出された類似度が所定の条件を満たす場合、抽出されたURLをサブディレクトリに追加し、追加したURLと類似度を算出したディレクトリに格納されるURLとで重複するURLを併合する。
このように、情報管理装置は、ユーザの社会的な興味・関心を反映している記憶手段に記憶されたURL及び入力クエリに基づいて、抽出されたURLをサブディレクトリに追加し、追加したURLを併合する。したがって、情報管理装置は、ユーザの社会的な興味・関心を反映させたURLをサブディレクトリに追加することができる。
(9)ディレクトリに格納されており、表示順位が予め示されているURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力され、前記検索エンジ ンによりウェブページが検索され、検索結果として、前記表示順位にしたがったURLを 表示するユーザ端末とを管理し、前記ユーザ端末に入力された前記検索クエリである入力 クエリで前記検索エンジンにより検索された検索結果として表示されるURLのうち、前記ユーザがクリックしたクリックURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される情報管理装置により実行される情報管理方法において、憶されている前記クリックURL及び前記入力クエリに基づいて、前記ディレクトリに格納されているURLの中から前記クリックURLを検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、憶されている前記クリックURL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、前記第1有向リンクを構成する前記クリックURLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、前記遷移確率が所定の閾値よりも大きいか否かを判定する閾値判定ステップと、前記閾値判定ステップにより判定された結果、前記遷移確率が前記所定の閾値よりも大きい場合には、前記選択URLが前記ディレクトリに存在するか否かを判定するURL判定ステップと、前記URL判定ステップにより判定された結果、前記選択URLが前記ディレクトリに存在する場合には、前記表示順位を変更する表示順位変更ステップとを備える情報管理方法。
(10)ディレクトリに格納されており、表示順位が予め示されているURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力され、前記検索エン ジンによりウェブページが検索され、検索結果として、前記表示順位にしたがったURL を表示するユーザ端末とを管理し、前記ユーザ端末に入力された前記検索クエリである入 力クエリで前記検索エンジンにより検索された検索結果として表示されるURLのうち、前記ユーザがクリックしたクリックURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される情報管理装置のコンピュータにより実行されるコンピュータプログラムであって、憶されている前記クリックURL及び前記入力クエリに基づいて、前記ディレクトリに格納されているURLの中から当該クリックURLを検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、憶されている前記クリックURL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、前記第1有向リンクを構成する前記クリックURLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、前記遷移確率が所定の閾値よりも大きいか否かを判定する閾値判定ステップと、前記閾値判定ステップにより判定された結果、前記遷移確率が前記所定の閾値よりも大きい場合には、前記選択URLが前記ディレクトリに存在するか否かを判定するURL判定ステップと、前記URL判定ステップにより判定された結果、前記選択URLが前記ディレクトリに存在する場合には、前記表示順位を変更する表示順位変更ステップとをコンピュータに実行させるコンピュータプログラム。
(11)特定の専門分野に関するシードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記シードディレクトリを前記特定の専門分野に専門化する情報管理装置であって、前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される記憶手段と、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記記憶手段に記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリから第1選択基準に基づいて、前記シードディレクトリに関連する前記URL及び前記入力クエリを抽出する第1抽出手段と、前記第1抽出手段により抽出された前記URLから第2選択基準に基づいて、前記シードディレクトリに追加するためのURLを抽出する第2抽出手段と、前記第2抽出手段により抽出された前記URLを前記シードディレクトリに追加するURL追加手段とを備える情報管理装置。
(11)の構成によれば、情報管理装置は、記憶手段に記憶されるURL及び入力クエリから第1選択基準に基づいて、特定の専門分野に関するシードディレクトリに関連するURL及び入力クエリを抽出し、抽出されたURLから第2選択基準に基づいて、ディレクトリに追加するためのURLを抽出し、抽出されたURLをディレクトリに追加する。
このため、情報管理装置は、特定の専門分野に関連の深いURLをシードディレクトリに追加することができる。したがって、情報管理装置は、特定の専門分野に関するシードディレクトリを追加されたURLによって好適に専門化して、このシードディレクトリを拡張することができる。
(12)前記記憶手段に記憶される前記URL及び前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成手段と、前記記憶手段に記憶される前記URL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成手段と、前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出手段と、前記遷移確率算出手段により算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成手段と、前記サブディレクトリ作成手段により作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加手段と更に備える(11)に記載の情報管理装置。
(12)の構成によれば、情報管理装置は、遷移確率算出手段により算出された遷移確率に基づいて、第1有向リンク及び第2有向リンクを構成する入力クエリの名称が付与されたサブディレクトリを作成し、作成されたサブディレクトリをシードディレクトリに追加する。
このため、情報管理装置は、特定の専門分野を検索するために作成されたシードディレクトリに、記憶手段に記憶されるURL及び入力クエリに基づいて作成されたサブディレクトリを追加することができる。したがって、情報管理装置は、特定の専門分野に関するシードディレクトリを追加されたサブディレクトリによって好適に専門化して、このシードディレクトリを拡張することができる。
(13)前記第1リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成し、前記第2リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する(12)に記載の情報管理装置。
(13)の構成によれば、情報管理装置は、シードディレクトリにアクセスしたユーザにより入力されたURL及びシードディレクトリにアクセスしたユーザ端末により入力された入力クエリに基づいて、作成されたサブディレクトリをシードディレクトリに追加することができる。
(14)前記サブディレクトリ追加手段により追加された前記サブディレクトリに格納される各々のURLの取捨選択を行う取捨選択手段を更に備える(12)に記載の情報管理装置。
(14)の構成によれば、情報管理装置は、追加されたサブディレクトリに格納される各々のURLの取捨選択を行う。このため、情報管理装置は、サブディレクトリに格納されるURLを特定の専門分野の検索に適合した状態で維持することができる。
(15)特定の専門分野に関するシードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記特定の専門分野に専門化するための情報管理装置により実行される情報管理方法であって、憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリから第1選択基準に基づいて、前記シードディレクトリに関連する前記URL及び前記入力クエリを抽出する第1抽出ステップと、前記第1抽出ステップにより抽出された前記URLから第2選択基準に基づいて、前記シードディレクトリに追加するためのURLを抽出する第2抽出ステップと、前記第2抽出ステップにより抽出された前記URLを前記シードディレクトリに追加するURL追加ステップとを備える情報管理方法。
(16)特定の専門分野に関するシードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記特定の専門分野に専門化する情報管理装置のコンピュータにより実行されるコンピュータプログラムであって、憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリから第1選択基準に基づいて、前記シードディレクトリに関連する前記URL及び前記入力クエリを抽出する第1抽出ステップと、前記第1抽出ステップにより抽出された前記URLから第2選択基準に基づいて、前記シードディレクトリに追加するためのURLを抽出する第2抽出ステップと、前記第2抽出ステップにより抽出された前記URLを前記シードディレクトリに追加するURL追加ステップとをコンピュータに実行させるコンピュータプログラム。
(17)シードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザが検索クエリを入力するユーザ端末とを管理し、前記シードディレクトリを前記ユーザに対して個人化する情報管理装置であって、前記検索クエリが前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される記憶手段と、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記記憶手段に記憶されている全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成手段と、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記記憶手段に記憶されている全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成手段と、前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出手段と、前記遷移確率算出手段により算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成手段と、サブディレクトリ判定基準に基づいて、前記サブディレクトリ作成手段により作成された前記サブディレクトリを前記シードディレクトリに追加するか否かを判定するサブディレクトリ判定手段と、前記サブディレクトリ判定手段による判定結果に応じて前記サブディレクトリ作成手段により作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加手段とを備える情報管理装置。
(17)の構成によれば、情報管理装置は、算出された遷移確率に基づいて、第1有向リンク及び第2有向リンクを構成する入力クエリの名称が付与されたサブディレクトリを作成し、サブディレクトリ判定基準に基づいて、作成されたサブディレクトリをシードディレクトリに追加するか否かを判定し、判定結果に応じて作成されたサブディレクトリをシードディレクトリに追加する。
このため、情報管理装置は、記憶手段に記憶されたURL及び入力クエリ基づいて、ユーザ端末を操作するユーザに対して個人化されたサブディレクトリをシードディレクトリに追加することができる。したがって、情報管理装置は、ディレクトリの個人化をユーザからの操作を必要とせずに行うことができる。
(18)前記第1リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成し、前記第2リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された前記選択URLへの第2有向リンクを作成する(17)に記載の情報管理装置。
(18)の構成によれば、情報管理装置は、シードディレクトリにアクセスしたユーザにより入力されたURL及びシードディレクトリにアクセスしたユーザ端末により入力された入力クエリに基づいて、作成されたサブディレクトリをシードディレクトリに追加することができる。
(19)前記サブディレクトリ追加手段により追加された前記サブディレクトリに格納される各々のURLの取捨選択を行う取捨選択手段を更に備える(17)に記載の情報管理装置。
(19)の構成によれば、情報管理装置は、追加されたサブディレクトリに格納される各々のURLの取捨選択を行う。このため、情報管理装置は、サブディレクトリに格納されるURLを特定の専門分野の検索に適合した状態で維持することができる。
(20)シードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記ユーザ端末に 入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記ユーザに対して個人化する情報管理装置により実行される情報管理方法であって、憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、前記遷移確率算出ステップにより算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成ステップと、サブディレクトリ判定基準に基づいて、前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するか否かを判定するサブディレクトリ判定ステップと、前記サブディレクトリ判定ステップによる判定結果に応じて前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加ステップとを備える情報管理方法。
(21)シードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記ユーザ端末に 入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記ユーザに対して個人化する情報管理装置のコンピュータにより実行されるコンピュータプログラムであって、憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、憶された前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、前記遷移確率算出ステップにより算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成ステップと、サブディレクトリ判定基準に基づいて、前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するか否かを判定するサブディレクトリ判定ステップと、前記サブディレクトリ判定ステップによる判定結果に応じて前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加ステップとをコンピュータに実行させるコンピュータプログラム。
本発明によれば、ディレクトリ型の検索方式において、利用者の社会的な関心度合いを反映したディレクトリを作成及び表示する情報管理装置、方法及びプログラムを提供することができる。また、ディレクトリ型の検索方式において、特定の専門分野の関心や特定個人の関心を反映したディレクトリを作成する情報管理装置、方法及びプログラムを提供することができる。
以下、本発明の実施形態について図面を参照しながら説明する。
[検索システム1の機能構成]
図1は、本発明の検索処理装置の一実施形態に係る検索システム1を示す構成図である。情報管理サーバ(情報管理装置)10、検索サーバ20、端末装置30、及びコンテンツサーバ40は、通信回線50を介して接続されている。端末装置30のユーザは、検索サーバ20にアクセスし、所定の検索エンジンに対して、所望のWebページに辿り着くための検索クエリとなるクエリ(検索キーワード)を入力することにより、検索結果を取得する。ユーザは、この検索結果にリストされたURLを選択し、コンテンツサーバ40にて管理されるWebページを閲覧する。
端末装置(ユーザ端末)30は、パソコン、携帯電話機、PHS(Personal Handy−phone System:登録商標)、モバイル、ノートPC、PDA(Personal Digital Assistant)等の端末装置を代表とするものであり、有線又は無線通信を行う通信回線50を介して、情報管理サーバ10及び検索サーバ20から送信される情報を参照できるものであればどのようなものでもよい。また、情報管理サーバ10及び検索サーバ20は、必要に応じてWebサーバ、DBサーバ、アプリケーションサーバを含んで構成してよく、1台のサーバで構成しても、それぞれ別のサーバで構成してもよい。また、情報管理サーバ10と検索サーバ20とは、1台又は複数台のサーバが一体とされたサーバ群として構成してもよい。更に、情報管理サーバ10はユーザがクエリ(検索クエリを入力する端末装置30を管理する。
[情報管理サーバ10のハードウェア構成]
図2は、本発明の一実施形態に係る情報管理サーバ10のハードウェア構成の一例を示す図である。図2に示すように、CPU1(以下「CPU11」という)(マルチプロセッサ構成ではCPU2(以下「CPU12」という)等複数のCPUが追加されてもよい)、通信I/F(I/F:インターフェイス)13、メインメモリ14、表示装置15、I/Oコントローラ16並びにキーボード及びマウス等の入力装置17がバスラインBUSにより接続されて情報管理サーバ10を構成する。
CPU11(CPU12)は、情報管理サーバ10を統括的に制御する部分であり、後述するハードディスク18aに記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
通信I/F13は、情報管理サーバ10が、通信回線50を介して端末装置30から各種の入力情報を受け取ったり、また表示装置15への表示内容を送信したりする場合のネットワーク・アダプタである。通信I/F13は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
表示装置15は、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。I/Oコントローラ16には、ハードディスク18a及び半導体メモリ18b等の記憶装置18を接続することができる。入力装置17は、情報管理サーバ10の管理者による入力の受け付けを行うものである。ハードディスク18aは、本ハードウェアを情報管理サーバ10として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するテーブル等を記憶する。なお、情報管理サーバ10は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
以上の例は、情報管理サーバ10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明した情報管理サーバ10により実現される機能は、上述の方法を当該コンピュータにより実行することにより、或いは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
<第1実施形態>
[情報管理サーバ10の機能構成]
図3は、本実施形態の情報管理サーバ10の機能ブロック図である。情報管理サーバ10は、主として記憶装置18により構成される記憶部110と、主としてCPU11(CPU12)により構成される制御部120とを備える。
記憶部110は、クリックデータ蓄積部111と、ウェブディレクトリ記憶部112とを備える。
クリックデータ蓄積部(記憶手段)111は、クエリと、このクエリを検索キーワードとして検索エンジンにより検索された検索結果のURL(Uniform Resource Locator)のうち、ユーザの操作する任意の端末装置30により選択(クリック)されたURL(以下クリックURLという)とを対応付けて履歴データとして記憶する。履歴データは、例えば、図4に示すように、クリックデータテーブル111aとして蓄積的に記憶される。図4に示すクリックデータテーブル111aには、クエリ、クリックURL、クリックURLの検索ランク(図4では、「ランク」という)、クリックURL(図4では、「URL」という)を選択した端末のIPアドレス、選択された時 (図4では、「時間」という)及びセッションが対応付けて記憶されている。クリックデータテーブル111aに記憶される履歴データは、ユーザの操作する端末装置30のクエリ及びクリックURLの選択により随時変化し、ユーザの社会的な興味・関心を反映する情報である。
ウェブディレクトリ記憶部112は、ディレクトリ型の検索方式におけるウェブディレクトリに関する情報と、このウェブディレクトリに格納されるURLとを記憶している。図5は、ウェブディレクトリ記憶部112に記憶されるウェブディレクトリWについて示す模式図である。ウェブディレクトリWは、Directory1(以下「ディレクトリ 」という)(図5中のD1)と、このディレクトリのDirectory11及び12( 以下「サブディレクトリ」という)(図5中のD11及びD12)と、サブディレクトリ内に格納されるURL(図5中のU11)とを備える。また、ディレクトリ及びサブディレクトリの名称は、各々のディレクトリ及びサブディレクトリに格納されるURLの属性(カテゴリ)が付与されている。また、図5のU11は、端末装置30の表示装置へ表示するときの表示順位が上から降順で示されている。図5の例では、表示順位は、URL1、URL2、URL3、URL4、・・・の順である。なお、図5に示すウェブディレクトリW、ディレクトリD1、サブディレクトリD11D12及びU11は、後述の図11乃至図13においても同様である。
制御部120は、リンク作成部121と、遷移確率算出部122と、閾値判定部123と、URL判定部124と、表示順位変更部125と、URL追加部126と、サブディレクトリ作成部127と、サブディレクトリURL追加部128と、類似度算出部129と、類似度判定部130と、サブディレクトリリンク作成部131と、を備える。
リンク作成部(第1リンク作成手段及び第2リンク作成手段)121は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、ディレクトリ(Dir)に格納されたURL(u)からこのURL(u)を検索結果として得るための検索キーワードであるクエリ(q)への有向リンクである第1有向リンクを作成する。ここで、有向リンクとは、リンクされる一方の対象と他方の対象とのリンク関係に方向性を有するものをいう。
また、リンク作成部121は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、第1有向リンクを構成するクエリからこのクエリを検索キーワードとして検索エンジンにより検索された検索結果のURLのうち、ユーザの操作する任意の端末装置30により選択されたURL(以下選択URLという)への第2有向リンクを作成する。
遷移確率算出部(遷移確率算出手段、第1遷移確率算出手段、第2遷移確率算出手段、第3遷移確率算出手段及び第4遷移確率算出手段)122は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、第1有向リンクを構成するURLが格納されるディレクトリから第2有向リンクを構成する選択URLへの遷移確率を算出する。
詳細には、遷移確率算出部122は、リンク作成部121により作成された第1有向リンクを構成するURLから第1有向リンクを構成するクエリへの遷移確率(第1遷移確率)を算出する。具体的には、第1有向リンクが作成されたクリックURL(u)が選択されたとき、このクリックURL(u)が選択クエリ(q)に基づく場合の遷移確率(第1遷移確率)P(q|u)を算出する。
また、遷移確率算出部122は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、第1有向リンク及び前記第2有向リンクを構成する選択クエリ(q)から第2有向リンクを構成する選択URL(u´)への遷移確率(第2遷移確率)を算出する。具体的には、第1有向リンクを構成するクエリ(q)が選択されたとき、この選択クエリ(q)により検索された検索結果のうち、ユーザの操作する任意の端末装置30により選択されたURLが選択URL(u´)である場合の遷移確率(第2遷移確率)P(u´|q)を算出する。
また、遷移確率算出部122は、算出された第1遷移確率P(q|u)と第2遷移確率P(u´|q)とに基づいて、URL(u)が格納されたディレクトリ(Dir)から選択URL(u´)への遷移確率を算出する。具体的には、遷移確率P(u´|Dir)、すなわち各々の選択URL(u´)についての、P(q|u)*P(u´|q)の総和を算出する。
また、遷移確率算出部122は、第1遷移確率P(q|u)に基づいて、URL(u)が格納されたディレクトリ(Dir)から第1有向リンク及び第2有向リンクを構成するクエリ(q)への遷移確率(第3遷移確率)を算出する。具体的には、第3遷移確率P(q|Dir)、すなわち第1有向リンク及び第2有向リンクを構成する各々のクエリ(q)についての、第1遷移確率P(q|u)の総和を算出する。
また、遷移確率算出部122は、算出した第1遷移確率、第2遷移確率及び第3遷移確率をソートする。具体的には、算出した各々の第1遷移確率、第2遷移確率及び第3遷移確率を降順又は昇順でソートする。
また、遷移確率算出部122は、第1遷移確率に基づいて、ディレクトリ(Dir)か ら第1有向リンク及び第2有向リンクを構成する入力クエリへの第4遷移確率を算出する
閾値判定部(第1閾値判定手段、第2閾値判定手段及び第3閾値判定手段)123は、遷移確率算出部122により算出された遷移確率P(u´|Dir)が第1の閾値よりも大きいか否かを判定する。
また、閾値判定部123は、遷移確率算出部122により算出された第3遷移確率P(q|Dir)が第2の閾値よりも大きいか否かを判定する。
また、閾値判定部123は、遷移確率算出部122により算出された遷移確率P(u´|Dir)が第3の閾値よりも大きいか否かを判定する。
ここで、第1の閾値、第2の閾値及び第3の閾値は、任意の値に設定することができる。
URL判定部124は、閾値判定部123により判定された結果、遷移確率P(u´|Dir)が第1の閾値よりも大きい場合には、選択URL(u´)がディレクトリ(Dir)内に存在するか否かを判定する。
表示順位変更部125は、URL判定部124により判定された結果、選択URL(u´)がディレクトリ(Dir)内に存在する場合には、ディレクトリ(Dir)内の選択URL(u´)の表示順位を変更する。
URL追加部126は、URL判定部124により判断された結果、選択URL(u´)がディレクトリ(Dir)内に存在しない場合には、この選択URL(u´)をディレクトリ(Dir)内に追加する。
サブディレクトリ作成部127は、閾値判定部123により判定された結果、第3遷移確率P(q|Dir)が第2の閾値よりも大きい場合には、ディレクトリ(Dir)のサブディレクトリとして第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)を作成する。このようにして作成されたサブディレクトリをクリックディレクトリともいう。
サブディレクトリURL追加部128は、閾値判定部123により判定された結果、遷移確率P(u´|Dir)が第3の閾値よりも大きい場合には、サブディレクトリ作成部127により作成されたサブディレクトリ(SubDir)内に選択URL(u´)を追加する。
類似度算出部129は、URL(u)が格納されたディレクトリ(Dir)とサブディレクトリ作成部127により作成されたサブディレクトリ(SubDir)との類似度を算出する。具体的には、ディレクトリ(Dir)に格納される各々のURL(u)と、サブディレクトリ(SubDir)に格納される各々の選択URL(u´)とを順次マッチングを行い、類似度sim(Dir,SubDir)を算出する。ここで、類似度simの尺度としては、Cosine類似度、Dice類似度、Jaccard類似度等を適用することができる。
類似度判定部130は、類似度算出部129により算出された類似度sim(Dir,SubDir)が所定の条件を満たすか否かを判定する。具体的には、所定の条件として、例えば、全ディレクトリの中から類似度sim(Dir,SubDir)が最も大きいディレクトリ、類似度sim(Dir,SubDir)が予め定めた閾値よりも大きい、又は全ディレクトリの中から類似度sim(Dir,SubDir)が最も大きいディレクトリであり、且つ類似度sim(Dir,SubDir)が予め定めた閾値よりも大きい等の条件を適用することができる。
サブディレクトリリンク作成部131は、類似度判定部130により判定された結果、類似度sim(Dir,SubDir)が所定の条件を満たす場合には、ディレクトリ(Dir)とサブディレクトリ作成部127により作成された(SubDir)とのリンクを作成する。
[処理の流れ]
次に、図6から図8のフローチャートを参照して本実施形態の情報管理サーバ10の処理の流れについて説明する。また、図9及び図10は、リンク作成部121により作成される有向リンクについて示す図である。また、図11〜図13は、本実施形態の情報管理サーバ10が、ウェブディレクトリWについて実行する処理について示す模式図である。
ステップS1:リンク作成部121は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、ディレクトリ(Dir)に格納されたURL(u)からこのURL(u)を検索結果として得るための検索キーワードであるクエリ(q)への有向リンクである第1有向リンクを作成する。具体的には、図9に示すように、ディレクトリに格納されたURL(u)(図9中のURL1、URL2、URL3及びURL4)からクエリ(q)(図9中のQ1、Q2、Q3及びQ4)への第1有向リンクを作成する。ここで、有向リンクの矢印は、リンクの方向を示している。図9の例では、URL1からクエリQ1及びQ2への第1有向リンクが作成される。また、URL2からクエリQ2への第1有向リンクが作成される。また、URL3からクエリQ2、Q3及びQ4への第1有向リンクが作成される。また、URL4からクエリQ4への第1有向リンクが作成される。
ステップS2:リンク作成部121は、クリックデータテーブル111aに記憶されたURL及びクエリに基づいて、ステップS1で作成された第1有向リンクを構成するクエリ(q)からこのクエリ(q)を検索キーワードとして検索エンジンにより検索された検索結果のURLのうち、ユーザの操作する任意の端末装置30により選択された選択URL(u´)への第2有向リンクを作成する。具体的には、図10に示すように、第1有向リンクが作成されたクエリ(q)(図10中のQ1、Q2、Q3及びQ4)から選択URL(u´)(図10中のURL11、URL12、URL13及びURL14)への第2有向リンクを作成する。図10の例では、クエリQ1からURL11への第2有向リンクが作成される。また、クエリQ2からURL11、URL12及びURL13への第2有向リンクが作成される。また、クエリQ3からURL13への第2有向リンクが作成される。また、クエリQ4からURL14への第2有向リンクが作成される。このように、ステップS1及びステップS2の処理により、URL(u)、クエリ(q)、選択URL(u´)、第1有向リンク及び第2有向リンクで構成される2部グラフが作成される。
ステップS3:遷移確率算出部122は、遷移確率P(u´|Dir)を算出する。具体的には、ステップS1で作成された第1有向リンクにおいて、第1有向リンクを構成するURL(u)が選択されたとき、このURL(u)が選択クエリ(q)に基づく場合の遷移確率(第1遷移確率)P(q|u)を算出する。また、遷移確率算出部122は、ステップS2で作成された第2有向リンクにおいて、第1有向リンク及び第2有向リンクを構成するクエリ(q)が選択されたとき、このクエリ(q)により検索された検索結果のうち、任意に選択されるURLが選択URL(u´)である場合の遷移確率(第2遷移確率)P(u´|q)を算出する。そして、第1遷移確率P(q|u)と第2遷移確率P(u´|q)とに基づいて、遷移確率P(u´|Dir)を算出する。すなわち各々の選択URL(u´)についての、P(q|u)*P(u´|q)の総和を算出する。
ステップS4:遷移確率算出部122は、ステップS3で算出した各々の選択URL(u´)についての遷移確率P(u´|Dir)を降順にソートする。なお、本実施形態では、遷移確率P(u´|Dir)を降順にソートしたが、これに限らず、昇順にソートしてもよく、その他の方法でソートしてもよい。
ステップS5:閾値判定部123は、遷移確率算出部122により算出された各々の選 択URL(u´)についての遷移確率P(u´|Dir)が第1の閾値よりも大きいか否かを判定する。遷移確率P(u´|Dir)が第1の閾値よりも大きい場合(Yes)には、ステップS6へ移る。一方、遷移確率P(u´|Dir)が第1の閾値以下である場合(No)には、一連の処理を終了する。
ステップS6:URL判定部124は、選択URL(u´)がディレクトリ(Dir)内に存在するか否かを判定する。選択URL(u´)がディレクトリ(Dir)内に存在する場合(Yes)には、ステップS7へ移る。一方、選択URL(u´)がディレクトリ(Dir)内に存在しない場合(No)には、ステップS8へ移る。
ステップS7:表示順位変更部125は、選択URL(u´)がディレクトリ(Dir)内に存在する場合であるため、ディレクトリ(Dir)内の選択URL(u´)の表示順位を変更する。具体的には、図11(a)に示すようにディレクトリD11内のU11の表示順位を変更する。図11(a)の例では、図5に示した表示順位URL1、URL2、URL3、URL4・・・を、表示順位URL4、URL1、URL2、URL3・・・に変更する。
このように、情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているクリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、選択URL(u´)の表示順位を変更する。したがって、情報管理サーバ10は、選択URL(u´)の表示順位にユーザの社会的な興味・関心を反映させることができる。
ステップS8:URL追加部126は、選択URL(u´)がディレクトリ(Dir)内に存在しない場合であるため、この選択URL(u´)をディレクトリ(Dir)内に追加する。具体的には、図11(b)に示すようにディレクトリD11内のU11に既存のURL1、URL2、URL3及びURL4に加えて、選択URL(u´)としてURL5を追加する。このように、情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているクリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、選択URL(u´)をディレクトリ(Dir)内に追加する。したがって、情報管理サーバ10は、ユーザの社会的な興味・関心を反映させた選択URL(u´)をディレクトリ(Dir)内に追加することができる。
ステップS9:遷移確率算出部122は、第4遷移確率P(q|Dir)を算出する。具体的には、ステップS2で作成された第1有向リンクにおいて、ステップS3で算出された第1遷移確率P(q|u)に基づいて、各々の選択クエリ(q)についての、第1遷移確率P(q|u)の総和を算出する。これにより、第4遷移確率P(q|Dir)を算出することができる。
ステップS10:遷移確率算出部122は、ステップS9において算出した各々の選択クエリ(q)についての第4遷移確率P(q|Dir)を降順にソートする。なお、本実施形態では、第4遷移確率P(q|Dir)を降順にソートしたが、これに限らず、昇順にソートしてもよく、その他の方法でソートしてもよい。
ステップS11:閾値判定部123は、遷移確率算出部122により算出された各々の 選択クエリ(q)についての第4遷移確率P(q|Dir)が第2の閾値よりも大きいか否かを判定する。第4遷移確率P(q|Dir)が第2の閾値よりも大きい場合(Yes)には、ステップS12へ移る。一方、第4遷移確率P(q|Dir)が第2の閾値以下である場合(No)には、本フローチャートの処理を終了する。
ステップS12:サブディレクトリ作成部127は、第4遷移確率P(q|Dir)が第2の閾値よりも大きい場合であるため、ディレクトリ(Dir)のサブディレクトリとして第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)を作成する。具体的には、図12に示すように、サブディレクトリD11のサブディレクトリとしてクエリQ2の名称が付与されたサブディレクトリD21が作成される。
このように、情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているクリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)をディレクトリ(Dir)のサブディレクトリとして作成する。したがって、情報管理サーバ10は、ユーザの社会的な興味・関心を反映させたクエリ(q)の名称が付与されたサブディレクトリ(SubDir)をディレクトリ(Dir)のサブディレクトリとして作成することができる。
ステップS13:閾値判定部123は、遷移確率算出部122により算出された各々の 選択URL(u´)についての遷移確率P(u´|Dir)が第3の閾値よりも大きいか否かを判定する。遷移確率P(u´|Dir)が第3の閾値よりも大きい場合(Yes)には、ステップS14へ移る。一方、遷移確率P(u´|Dir)が第3の閾値以下である場合(No)には、一連の処理を終了する。
ステップS14:サブディレクトリURL追加部128は、ステップS13において、遷移確率P(u´|Dir)が第3の閾値よりも大きい場合であるため、サブディレクトリ作成部127により作成されたサブディレクトリ(SubDir)内に選択URL(u´)を追加する。具体的には、図12に示すようにサブディレクトリD21内のU21に選択URL(u´)としてのURL11、URL12、URL13、URL14・・・を追加する。
このように、情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているクリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、選択URL(u´)をサブディレクトリ(SubDir)内に追加する。したがって、情報管理サーバ10は、ユーザの社会的な興味・関心を反映している選択URL(u´)をサブディレクトリ(SubDir)内に追加することができる。
ステップS14の処理を終了した後、情報管理サーバ10は、ステップS15及びステップS18の処理へ移行する。
ステップS15:類似度算出部129は、URL(u)が格納されたディレクトリ(Dir)とサブディレクトリ作成部127により作成されたサブディレクトリ(SubDir)との類似度sim(Dir,SubDir)を、URL(u)が格納されたディレク トリ(Dir)とサブディレクトリ作成部127により作成されたサブディレクトリ(S ubDir)との比較により算出する。
ステップS16:類似度判定部130は、ステップS15において算出された類似度sim(Dir,SubDir)が所定の条件を満たすか否かを判定する。類似度sim(Dir,SubDir)が所定の条件を満たす場合(Yes)には、ステップS17へ移る。一方、類似度sim(Dir,SubDir)が所定の条件を満たさない場合(No)には、一連の処理を終了する。
ステップS17:サブディレクトリリンク作成部131は、ステップS16において、類似度sim(Dir,SubDir)が所定の条件を満たす場合であるため、ディレクトリ(Dir)とステップS12において作成されたサブディレクトリ(SubDir)とのリンクを作成する。具体的には、図13に示すように、サブディレクトリD12とサブディレクトリD21とのリンクLが作成される。
このように、情報管理サーバ10は、類似度の高いディレクトリとサブディレクトリとのリンクを作成することにより、ウェブディレクトリにおける検索機能をより向上させることができる。
ステップS18:リンク作成部121は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、サブディレクトリに格納されたURL(u´)からこのURL(u)を検索結果として得るための検索キーワードであるクエリ(q´)への有向リンクである第1有向リンクを作成する。
ステップS19:リンク作成部121は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、ステップS18で作成された第1有向リンクを構成するクエリ(q´)からこのクエリ(q´)を検索キーワードとして検索エンジンにより検索された検索結果のURLのうち、ユーザの操作する任意の端末装置30により選択された選択URL(u´´)への第2有向リンクを作成する。
ステップS20:遷移確率算出部122は、遷移確率P(u´´|Dir)を算出する。具体的には、ステップS18で作成された第1有向リンクにおいて、URL(u´)がユーザの操作する任意の端末装置30により選択されたとき、このURL(u´)が選択クエリ(q´)である第1遷移確率P(q´|u´)を算出する。また、遷移確率算出部122は、ステップS19で作成された第2有向リンクにおいて、選択クエリ(q´)が選択されたとき、この選択クエリ(q´)により検索された検索結果のうち、選択されるURLが選択URL(u´´)である第2遷移確率P(u´´|q´)を算出する。そして、第1遷移確率P(q´|u´)と第2遷移確率P(u´´|q´)とに基づいて、遷移確率P(u´´|Dir)、すなわち各々の選択URL(u´´)についての、P(q´|u´)*P(u´´|q´)の総和を算出する。
ステップS21:遷移確率算出部122は、ステップS20で算出した各々の選択URL(u´´)についての遷移確率P(u´´|Dir)を降順にソートする。なお、本実施形態では、遷移確率P(u´´|Dir)を降順にソートしたが、これに限らず、昇順にソートしてもよく、その他の方法でソートしてもよい。
ステップS22:閾値判定部123は、遷移確率算出部122により算出された各々の 選択URL(u´´)についての遷移確率P(u´´|Dir)が第1の閾値よりも大きいか否かを判定する。遷移確率P(u´´|Dir)が第1の閾値よりも大きい場合(Yes)には、ステップS23へ移る。一方、遷移確率P(u´´|Dir)が第1の閾値以下である場合(No)には、本フローチャートの処理を終了する。
ステップS23:URL判定部124は、選択URL(u´´)がディレクトリ(Dir)内に存在するか否かを判定する。選択URL(u´´)がディレクトリ(Dir)内に存在する場合(Yes)には、ステップS25へ移る。一方、選択URL(u´´)がディレクトリ(Dir)内に存在しない場合(No)には、ステップS24へ移る。
ステップS24:表示順位変更部125は、選択URL(u´´)がディレクトリ(Dir)内に存在する場合であるため、ディレクトリ(Dir)内の選択URL(u´´)の表示順位を変更する。このように、サブディレクトリ内の選択URLの表示順位を変更することにより、サブディレクトリ内の選択URLについてもステップS7における処理と同様の効果を奏することができる。
ステップS25:URL追加部126は、選択URL(u´´)がディレクトリ(Dir)内に存在しない場合であるため、この選択URL(u´´)をディレクトリ(Dir)内に追加する。このように、サブディレクトリに選択URLを追加することにより、サブディレクトリについてもステップS8における処理と同様の効果を奏することができる。
以上説明したように、本実施形態の情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているディレクトリ型の検索方式を提供することができる。したがって、ディレクトリ型の検索方式による検索サービスの検索機能が向上し、ユーザによるディレクトリ型の検索方式による検索サービスの利用増加を図ることができる。
<第2実施形態>
次に本発明の第2実施形態について説明する。第2実施形態については、主として、第1実施形態とは異なる点を説明し、第1実施形態と同様の構成について同じ符号を付し、説明を省略する。
[情報管理サーバ10の機能構成]
図14は、本実施形態の情報管理サーバ10の機能ブロック図である。情報管理サーバ10の制御部120は、頻度算出部141と、URL抽出部142と、類似度算出部143と、類似度判定部144と、サブディレクトリ作成部145と、URL併合部146と、を備える。なお、他の機能構成については、第1実施形態と同様であるため、説明を省略する。
頻度算出部141は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、ディレクトリ(Dir)に格納されたURL(u)が選択された頻度を算出する。
URL抽出部142は、頻度算出部141により算出された頻度のうち、所定の頻度を超えるURLを抽出する。
類似度算出部143は、URL抽出部142により抽出されたURLの集合を仮想ディレクトリ(C)として、ディレクトリ(Dir)との類似度を算出する。具体的には、仮想ディレクトリに格納される各々のURLと、ディレクトリ(Dir)に格納される各々のURL(u)とを順次マッチングを行い、類似度sim(C,Dir)を算出する。ここで、類似度simの尺度としては、Cosine類似度、Dice類似度、Jaccard類似度等を適用することができる。
類似度判定部144は、類似度算出部143により算出された類似度sim(C,Dir)が所定の条件を満たすか否かの判断を行う。具体的には、全ディレクトリの中から類似度sim(C,Dir)が最も大きいディレクトリ、類似度sim(C,Dir)が予め定めた閾値よりも大きい、又は全ディレクトリの中から類似度sim(C,Dir)が最も大きいディレクトリであり、且つ類似度sim(C,Dir)が予め定めた閾値よりも大きい等の条件を適用することができる。
サブディレクトリ作成部145は、類似度判定部144により判定された結果、所定の条件を満たす場合、類似度sim(C,Dir)を算出したディレクトリのサブディレクトリとして、URL抽出部142により抽出されたURLが格納されるサブディレクトリ(SubDir)を作成する。
URL併合部146は、類似度判定部144により判定された結果、所定の条件を満たす場合、類似度sim(C,Dir)を算出したディレクトリに格納されたURLとURL抽出部142により抽出されたURLとの重複するURLを併合する。なお、類似度判定部144により判定された結果、所定の条件を満たす場合に実行される処理としては、上述したサブディレクトリ作成部145及びURL併合部146に限られず、仮想ディレクトリ(C)とディレクトリ(Dir)とを表示するために関連付けることができる他の処理を適用してもよい。
次に、図15に示すフローチャートを参照して本実施形態の情報管理サーバ10の処理の流れについて説明する。
ステップS31:頻度算出部141は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、ディレクトリ(Dir)に格納されたURL(u)が選択された頻度を算出する。
ステップS32:URL抽出部142は、ステップS31において算出された頻度のうち、所定の頻度を超えるURLを抽出する。
ステップS33:類似度算出部143は、ステップS32において抽出されたURLの集合を仮想ディレクトリ(C)として、ディレクトリ(Dir)との類似度を算出する。
ステップS34:類似度判定部144は、ステップS33において算出された類似度sim(C,Dir)が所定の条件を満たすか否かの判断を行う。類似度sim(C,Dir)が所定の条件を満たす場合(Yes)には、ステップS35及びステップS36へ移る。一方、類似度sim(C,Dir)が所定の条件を満たさない場合(No)には、一連の処理を終了する。
ステップS35:サブディレクトリ作成部145は、ステップS34において判定された結果、所定の条件を満たす場合であるため、類似度sim(C,Dir)を算出したディレクトリのサブディレクトリとして、ステップS32において抽出されたURLが格納されるサブディレクトリ(SubDir)を作成する。その後、本フローチャートの処理を終了する。
このように、情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているクリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、サブディレクトリ(SubDir)をディレクトリ(Dir)に作成する。したがって、情報管理サーバ10は、ユーザの社会的な興味・関心を反映させたサブディレクトリ(SubDir)を作成することができる。
ステップS36:URL併合部146は、ステップS34において判定された結果、所定の条件を満たす場合であるため、ステップS32において抽出されたURLをサブディレクトリ(SubDir)に追加し、追加したURLと類似度sim(C,Dir)を算出したディレクトリに格納されたURLとの重複するURLを併合する。その後、本フローチャートの処理を終了する。
このように、情報管理サーバ10は、ユーザの社会的な興味・関心を反映しているクリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、抽出されたURLをサブディレクトリ(SubDir)に追加し、追加したURLを併合する。したがって、情報管理サーバ10は、ユーザの社会的な興味・関心を反映させたサブディレクトリ(SubDir)内に追加することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
<第3実施形態>
次に本発明の第3実施形態について説明する。
[情報管理サーバ10の機能構成]
図16は、本実施形態の情報管理サーバ10の機能ブロック図である。情報管理サーバ10の記憶部110は、クリックデータ蓄積部111と、ウェブディレクトリ記憶部112と、アクセスログ記憶部113と、選択基準記憶部114と、取捨選択基準記憶部115とを備える。クリックデータ蓄積部111は、第1及び第2実施形態と同様であるため説明を省略する。
ウェブディレクトリ記憶部112は、ディレクトリ型の検索方式におけるウェブディレクトリに関する情報と、このウェブディレクトリに格納されるURLとを記憶している。図17は、ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW2について示す模式図である。ウェブディレクトリW2は、Directory3(以下「ディレ クトリ」という)(図17中のD3)と、このディレクトリのDirectory31及 び32(以下「サブディレクトリ」という)(図17中のD31及びD32)と、サブディレクトリ内に格納されるURL(図17中のU31)とを備える。また、ディレクトリ及びサブディレクトリの名称は、各々のディレクトリ及びサブディレクトリに格納されるURLの属性(カテゴリ)が付与されている。また、図17のU31は、端末装置30の表示装置へ表示するときの表示順位が上から降順で示されている。図17の例では、表示順位は、URL31、URL32、URL33、URL・・・の順である。なお、図17に示すウェブディレクトリW2、ディレクトリD3、サブディレクトリD31、サブディ レクトリD32及びU31は、後述の図20〜図22においても同様である。
ここで、第3実施形態では、専門化させる対象となるディレクトリ(例えば後述のサブディレクトリD31に相当)を特に、シードディレクトリという。シードディレクトリは、ウェブディレクトリ記憶部112に予め作成されて記憶されている。
本実施形態において、情報管理サーバ10は、特定の専門分野に関するシードディレクトリを専門化することを主な目的とする。
アクセスログ記憶部113は、端末装置30によりウェブディレクトリW2、すなわちディレクトリD31、サブディレクトリD31及びD32の各々へアクセスされたときのアクセスログを記憶する。アクセスログは、例えばセッション、URL、IPアドレス等が対応付けて記憶される。
選択基準記憶部114は、抽出部151がクリックデータ蓄積部111からシードディレクトリに関連するクリックURL及びクエリを抽出するために用いられる第1選択基準を記憶する。また、選択基準記憶部114は、抽出部151が第1選択基準に基づいて抽出したURLからシードディレクトリに追加するクリックURLを抽出するために用いられる第2選択基準を記憶する。
ここで、第1選択基準及び第2選択基準について詳細に説明する。
第1選択基準は、クリックデータ蓄積部111からシードディレクトリに関連するクリックURL及びクエリを抽出するために、例えば以下の条件1〜3を用いることができる。
(条件1)クリックデータ蓄積部111に記憶されたクリックURL及びクエリは、シードディレクトリが端末装置30によりアクセスされているときに、クエリが端末装置30により入力され、このクエリが検索エンジンにより検索された検索結果のURLのうち、端末装置30を操作するユーザがクリックしたクリックURL及び端末装置30により入力されたクエリである。
(条件2)指定期間内において、クリックデータ蓄積部111にクリックURL及びクエリが指定回数以上記憶されている。
(条件3)端末装置30によるシードディレクトリへのアクセスが指定回数以上である。
第2選択基準は、抽出部151が第1選択基準に基づいて抽出したクリックURLからシードディレクトリに追加するクリックURLを抽出するために、例えば以下の条件4〜7を用いることができる。
(条件4)条件1を満たし、指定期間(例えば1時間)内におけるクリックURLの選択された頻度が高い3つのURLであり、且つ、この頻度が指定数以上である。
(条件5)条件2を満たし、且つ、条件4又は条件6を満たす。
(条件6)端末装置30によりシードディレクトリに指定回数(第1指定回数)以上アクセスし、且つこのシードディレクトリに格納されるクリックURLを指定回数(第2指定回数)以上選択している。
(条件7)条件4〜6を所定の混合比率によって混合させて用いる。例えば、混合比率は、条件4〜6の混合比率全体を1とすると、条件4は0.2、条件5は0.5、条件6は0.3のように設定することができる。
取捨選択基準記憶部115は、シードディレクトリに追加されるサブディレクトリに格納されるクリックURL(リンク)のうち、シードディレクトリに追加されるサブディレクトリとして望ましくない内容のサイトのURLを削除するための取捨選択基準のリストが記憶される。望ましくない内容のサイトのURLとは、例えば公序良俗に反するようなサイトのURLである。
制御部120は、抽出部151と、URL追加部152と、リンク作成部153と、遷移確率算出部154と、閾値判定部155と、サブディレクトリ追加部156と、取捨選択部157とを備える。なお、本実施形態における以下の説明では、シードディレクトリの具体例として、サブディレクトリD31を拡張する対象となるシードディレクトリとし、適宜サブディレクトリD31をシードディレクトリD31を表す。
抽出部151は、クリックデータ蓄積部111に記憶されるクエリ及びクリックURLから第1選択基準に基づいて、シードディレクトリD31を専門化するために、このシードディレクトリD31に関連するURL及び入力クエリを抽出する。そして、抽出されたURLから第2選択基準に基づいて、シードディレクトリD31に追加するためのURLを抽出する。また、抽出部151は、クリックデータ蓄積部111に記憶されるURL及び入力クエリのうち、全ユーザによるクエリ及び全ユーザによるクリックURLを用いることが好ましい。
URL追加部152は、抽出部151により第2選択基準に基づいて抽出されたクリックURLをシードディレクトリD31に追加する。
リンク作成部153は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、ディレクトリ(Dir)に格納されたURL(u)からこのURL(u)を検索結果として得るための検索キーワードであるクエリ(q)への有向リンクである第1有向リンクを作成する。このとき、上述したように本実施形態では、ディレクトリ(Dir)の具体例として、シードディレクトリD31を用いた場合について説明する。ここで、リンク作成部153は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLのうち、シードディレクトリD31にアクセスしたユーザにより入力されたクリックURL及びシードディレクトリD31にアクセスした端末装置30により入力されたクエリ用いることが好ましい。
遷移確率算出部154は、クリックデータテーブル111aに記憶されたクエリ及びク
リックURLに基づいて、第1有向リンクを構成するURLが格納されるディレクトリから第2有向リンクを構成する選択URLへの遷移確率を算出する。ここで、リンク作成部153は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLのうち、シードディレクトリD31にアクセスしたユーザにより入力されたクリックURL及びシードディレクトリD31にアクセスした端末装置30により入力されたクエリを用いることが好ましい。
詳細には、遷移確率算出部122は、リンク作成部121により作成された第1有向リンクを構成するURLから第1有向リンクを構成するクエリへの遷移確率(第1遷移確率)を算出する。具体的には、第1有向リンクが作成されたクリックURL(u)が選択されたとき、このクリックURL(u)が選択クエリ(q)に基づく場合の遷移確率(第1遷移確率)P(q|u)を算出する。
また、遷移確率算出部154は、クリックデータテーブル111aに記憶されたクエリ及びクリックURLに基づいて、第1有向リンク及び前記第2有向リンクを構成する選択クエリ(q)から第2有向リンクを構成する選択URL(u´)への遷移確率(第2遷移確率)を算出する。具体的には、第1有向リンクを構成するクエリ(q)が選択されたとき、この選択クエリ(q)により検索された検索結果のうち、ユーザの操作する任意の端末装置30により選択されたURLが選択URL(u´)である場合の遷移確率(第2遷移確率)P(u´|q)を算出する。
また、遷移確率算出部154は、算出された第1遷移確率P(q|u)と第2遷移確率P(u´|q)とに基づいて、URL(u)が格納されたディレクトリ(Dir)から選択URL(u´)への遷移確率を算出する。具体的には、遷移確率P(u´|Dir)、すなわち各々の選択URL(u´)についての、P(q|u)*P(u´|q)の総和を算出する。
また、遷移確率算出部154は、第1遷移確率P(q|u)に基づいて、URL(u)が格納されたディレクトリ(Dir)から第1有向リンク及び第2有向リンクを構成するクエリ(q)への遷移確率(第3遷移確率)を算出する。具体的には、第3遷移確率P(q|Dir)、すなわち第1有向リンク及び第2有向リンクを構成する各々のクエリ(q)についての、第1遷移確率P(q|u)の総和を算出する。
閾値判定部155は、遷移確率算出部154により算出された遷移確率P(u´|Dir)が第1の閾値よりも大きいか否かを判定する。
また、閾値判定部123は、遷移確率算出部154により算出された第3遷移確率P(q|Dir)が第2の閾値よりも大きいか否かを判定する。
サブディレクトリ追加部156は、閾値判定部155により判定された結果、第3遷移確率P(q|Dir)が第2の閾値よりも大きい場合には、第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)を作成し、シードディレクトリのサブディレクトリとして追加する。このようにして作成されたサブディレクトリをクリックディレクトリともいう。すなわち、サブディレクトリ追加部156は、シードディレクトリにクリックディレクトリをサブディレクトリとして追加する。
このように、本実施形態の情報管理サーバ10によれば、シードディレクトリに関するURLをクリックデータ蓄積部111から抽出し、シードディレクトリに追加できる。また、クリックデータ蓄積部111に基づいてシードディレクトリにクリックディレクトリを追加できる。
このため、情報管理サーバ10は、特定の専門分野に関連の深いURL及びサブディレクトリをシードディレクトリに追加することができる。したがって、情報管理サーバ10は、特定の専門分野に関するシードディレクトリを追加されたURL及びサブディレクトリによって好適に専門化して、このシードディレクトリを拡張することができる。
取捨選択部157は、アクセスログ記憶部113に記憶されるアクセスログに基づいて、シードディレクトリD31に追加されたクリックディレクトリに格納される各々のURL(リンク)の取捨選択を行う。具体的には、例えば所定数以下のアクセスがあったURLをクリックディレクトリから削除する。
また、取捨選択部157は、取捨選択基準記憶部115に記憶される取捨選択基準に基づいて、シードディレクトリD31に追加されたクリックディレクトリに格納される各々のURL(リンク)の取捨選択を行う。具体的には、例えば取捨選択基準記憶部115に記憶される取捨選択基準のリストに基づいて、シードディレクトリD31に追加されるサブディレクトリに格納されるURL(リンク)のうち、望ましくない内容のサイトのURLを削除する。
このように、取捨選択部157は、シードディレクトリD31に追加されたクリックディレクトリに格納される各々のURL(リンク)の取捨選択を行う。このため、情報管理サーバ10は、クリックディレクトリに格納されるURLを特定の専門分野の検索に適合した状態で維持することができる。
[処理の流れ]
次に、図18及び図19のフローチャートを参照して本実施形態の情報管理サーバ10の処理の流れについて説明する。また、図20〜図22は、本実施形態の情報管理サーバ10が、ウェブディレクトリW2について実行する処理について示す模式図である。
図18は、本実施形態の情報管理サーバ10の処理の流れについて示すフローチャートである。
ステップS41:抽出部151は、クリックデータ蓄積部111に記憶されるURL及び入力クエリから第1選択基準に基づいて、シードディレクトリD31に関連するURL及び入力クエリを抽出する。
ステップS42:抽出部151は、ステップS41において抽出されたURLから第2選択基準に基づいて、シードディレクトリD31に追加するためのURLを抽出する。
ステップS43:URL追加部152は、ステップS42において抽出部151により第2選択基準に基づいて抽出されたURLをシードディレクトリD31に追加する。具体的には、図21に示すように、URLが追加される前のシードディレクトリD31内(図20参照)にURL34、URL35及びURL36が追加される。
ステップS44:リンク作成部153、遷移確率算出部154及び閾値判定部155は、クリックディレクトリ作成処理を実行する。クリックディレクトリ作成処理については、図19で詳述する。
ステップS45:サブディレクトリ追加部156は、クリックディレクトリ作成処理の結果に基づき、第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)を作成し、シードディレクトリのサブディレクトリとして追加する。すなわち、サブディレクトリ追加部156は、シードディレクトリにクリックディレクトリをサブディレクトリとして追加する。具体的には、図22に示すように、クリックディレクトリD41がシードディレクトリD31のサブディレクトリとして追加される。また、クリックディレクトリD41には、URL41、URL42及びURL43が格納される。
ステップS46:取捨選択部157は、アクセスログ記憶部113に記憶されるアクセスログ又は取捨選択基準記憶部115に記憶される取捨選択基準に基づいて、シードディレクトリD31に追加されたクリックディレクトリに格納される各々のURL(リンク)の取捨選択を行い、一連の処理を終了する。
図19は、クリックディレクトリ作成処理の流れについて示すフローチャートである。
ステップS51:リンク作成部153は、クリックデータテーブル111aに記憶されるクエリ及びクリックURLに基づいて、ディレクトリ(Dir)に格納されたURL(u)からこのURL(u)を検索結果として得るための検索キーワードであるクエリ(q)への有向リンクである第1有向リンクを作成する。
ステップS52:リンク作成部153は、クリックデータテーブル111aに記憶されるURL及びクエリに基づいて、ステップS51で作成された第1有向リンクを構成するクエリ(q)からこのクエリ(q)を検索キーワードとして検索エンジンにより検索された検索結果のURLのうち、ユーザの操作する任意の端末装置30により選択された選択URL(u´)への第2有向リンクを作成する。このように、ステップS51及びステップS52の処理により、URL(u)、クエリ(q)、選択URL(u´)、第1有向リンク及び第2有向リンクで構成される2部グラフが作成される。
ステップS53:遷移確率算出部154は、遷移確率P(u´|Dir)を算出する。具体的には、ステップS51で作成された第1有向リンクにおいて、第1有向リンクを構成するURL(u)が選択されたとき、このURL(u)が選択クエリ(q)に基づく場合の遷移確率(第1遷移確率)P(q|u)を算出する。また、遷移確率算出部154は、ステップS52で作成された第2有向リンクにおいて、第1有向リンク及び第2有向リンクを構成するクエリ(q)が選択されたとき、このクエリ(q)により検索された検索結果のうち、任意に選択されるURLが選択URL(u´)である場合の遷移確率(第2遷移確率)P(u´|q)を算出する。そして、第1遷移確率P(q|u)と第2遷移確率P(u´|q)とに基づいて、遷移確率P(u´|Dir)を算出する。すなわち各々の選択URL(u´)についての、P(q|u)*P(u´|q)の総和を算出する。
ステップS54:遷移確率算出部154により算出された各々の選択URL(u´)に ついての遷移確率P(u´|Dir)が第1の閾値よりも大きいか否かを判定する。遷移確率P(u´|Dir)が第1の閾値よりも大きい場合(Yes)には、ステップS55へ移る。一方、遷移確率P(u´|Dir)が第1の閾値以下である場合(No)には、一連の処理を終了する。
ステップS55:遷移確率算出部154は、第4遷移確率P(q|Dir)を算出する。具体的には、ステップS51で作成された第1有向リンクにおいて、ステップS53で算出された第1遷移確率P(q|u)に基づいて、各々の選択クエリ(q)についての、第1遷移確率P(q|u)の総和を算出する。これにより、第4遷移確率P(q|Dir)を算出することができる。
ステップS56:閾値判定部155は、遷移確率算出部154により算出された各々の 選択クエリ(q)についての第4遷移確率P(q|Dir)が第2の閾値よりも大きいか否かを判定する。第4遷移確率P(q|Dir)が第2の閾値よりも大きい場合(Yes)には、ステップS57へ移る。一方、第4遷移確率P(q|Dir)が第2の閾値以下である場合(No)には、本フローチャートの処理を終了する。
ステップS57:サブディレクトリ追加部156は、第4遷移確率P(q|Dir)が第2の閾値よりも大きい場合であるため、ディレクトリ(Dir)のサブディレクトリとして第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)を作成し、一連の処理を終了する。
[ウェブディレクトリW2の具体例]
次に、本実施形態のウェブディレクトリW2の具体例について図23〜図26を参照しながら説明する。
図23〜図26は、ウェブディレクトリW2の具体的な表示例について示す図である。図23に示すように、ウェブディレクトリW2の表示画面60は、ウェブディレクトリW2を構成する各々のシードディレクトリ61と、シードディレクトリ61に格納されている(リンクされている)URLである登録サイト62と、クエリを入力する検索語入力欄63と、検索ボタン64とを含んで構成されている。
図24に示す追加URL65は、URL追加部152によりシードディレクトリ61に追加されたURLである(図18のステップS43に相当)。
図25は、図24に示すシードディレクトリ61のうち、シードディレクトリ61aに対して作成され、追加されたクリックディレクトリ(サブディレクトリ)66の具体例について示す図である。図25に示すように、シードディレクトリ61aは、カテゴリ名が「ダイエット」であるため、作成されたクリックディレクトリ66は、「ダイエット」に関連性の高いカテゴリ名が付与されている。図25では、「カロリーコントロール」、「ダイエットレシピ」、「ダイエット体験記」及び「フィットネス」のカテゴリ名が付与されたクリックディレクトリ66が作成される。
図26は、図25に示すクリックディレクトリ66のうち、「カロリーコントロール」のカテゴリ名のクリックディレクトリ66aに格納されるURLを示す図である。図26に示すように、「カロリーコントロール」のカテゴリ名のクリックディレクトリ66aに格納されるURL6は、「カロリーコントロール辞典」、「インターネットでカロリー計算」及び「あっという間にわかるカロリー」の名称が付与されるURLへのリンクである。
このように、情報管理サーバ10は、追加されたURL及びクリックディレクトリによってシードディレクトリを好適に拡張することができる。
<第4実施形態>
次に本発明の第4実施形態について説明する。
[情報管理サーバ10の機能構成]
図27は、本実施形態の情報管理サーバ10の機能ブロック図である。情報管理サーバ10の記憶部110は、クリックデータ蓄積部111と、ウェブディレクトリ記憶部112と、アクセスログ記憶部113と、選択基準記憶部114と、取捨選択基準記憶部115と、サブディレクトリ判定基準記憶部116と、を備える。
ここで、第4実施形態では、個人化される対象となるディレクトリ(例えば後述のサブディレクトリD51に相当)を特に、シードディレクトリという。シーディレクトリは、ウェブディレクトリ記憶部112に予め作成されて記憶されている。
本実施形態では、情報管理サーバ10は、シードディレクトリを端末装置30を操作する各々のユーザに対して個人化(パーソナライズ)することを主な目的とする。
ここで、クリックデータ蓄積部111、ウェブディレクトリ記憶部112、アクセスログ記憶部113、選択基準記憶部114、及び取捨選択基準記憶部115は、上述した第3実施形態の記憶部110の構成と同様であるため、説明を省略する。
サブディレクトリ判定基準記憶部116は、シードディレクトリにサブディレクトリ作成部158により作成されたサブディレクトリを追加するか否か判定するときに用いられる。サブディレクトリ判定基準は、例えば以下に示す条件A〜Dを用いることができる。
(条件A)サブディレクトリ作成部158は、サブディレクトリ(クリックディレクトリ)を作成する際に、クリックデータ蓄積部111に記憶されるクリックURL及びクエリを全て用いる。
(条件B)サブディレクトリ作成部158は、サブディレクトリ(クリックディレクトリ)を作成する際に、クリックデータ蓄積部111に記憶されるクリックURL及びクエリを、個人化するユーザの操作する端末装置30によってアクセスされたURLを含むもののみを利用して、サブディレクトリを作成する。
(条件C)サブディレクトリ作成部158は、サブディレクトリ(クリックディレクトリ)を作成する際に、個人化するユーザの操作する端末装置30によって入力されたクエリを含むもののみを利用して、サブディレクトリを作成する。
条件A〜Cでは、サブディレクトリを作成する際に、第2実施形態に記載された技術を用いる。具体的には、仮想ディレクトリと既存のディレクトリ(シードディレクトリ)との類似度を算出する方法を用いて類似度を算出する。そして、算出された類似度を判定して、判定結果に応じてサブディレクトリを作成する。
(条件D)条件A〜を所定の混合比率によって混合させて用いる。例えば、混合比率は、条件A〜の混合比率全体を1とすると、条件Aは0.4、条件Bは0.2、条件は0.4のように設定することができる。
この場合、各条件ごとの類似度に各条件ごとの混合比率を乗じて、乗じた値を加算する。そして、加算された値を用いてサブディレクトリ作成するか否かを判定することができる。
制御部120は、リンク作成部153と、遷移確率算出部154と、閾値判定部155と、サブディレクトリ作成部158と、サブディレクトリ判定部159と、サブディレクトリ追加部160と、取捨選択部161とを備える。
ここで、第3実施形態のリンク作成部153、遷移確率算出部154、閾値判定部155、及び取捨選択部157は、それぞれ第4実施形態のリンク作成部153、遷移確率算出部154、閾値判定部155、及び取捨選択部161と同様の機能構成であるため、説明を省略する。
サブディレクトリ作成部158は、閾値判定部155により判定された結果、第3遷移確率P(q|Dir)が第2の閾値よりも大きい場合には、第1有向リンク及び第2有向リンクを構成するクエリ(q)の名称が付与されたサブディレクトリ(SubDir)を作成する。このようにして作成されたサブディレクトリをクリックディレクトリともいう。すなわち、サブディレクトリ作成部158は、シードディレクトリにクリックディレクトリをサブディレクトリとして作成する。
サブディレクトリ判定部159は、サブディレクトリ判定基準に基づいて、シードディレクトリを個人化するために、このシードディレクトリにサブディレクトリ作成部158により作成されたサブディレクトリを追加するか否かを判定する。
サブディレクトリ追加部160は、サブディレクトリ判定部159による判定結果に応じて、シードディレクトリにサブディレクトリ作成部158により作成されたサブディレクトリを追加する。具体的には、サブディレクトリ追加部160は、サブディレクトリ作成部158により作成されたサブディレクトリがサブディレクトリ判定基準を満たす場合には、シードディレクトリに作成されたサブディレクトリを追加する。
このように、本実施形態の情報管理サーバ10は、記憶手段に記憶されたURL及び入力クエリ基づいて、端末装置30を操作するユーザに対して個人化されたサブディレクトリをシードディレクトリに追加することができる。したがって、情報管理サーバ10は、ディレクトリの個人化をユーザからの操作を必要とせずに行うことができる。
また、情報管理サーバ10は、追加されたサブディレクトリに格納される各々のURLの取捨選択を行う。このため、情報管理サーバ10は、サブディレクトリに格納されるURLを特定の専門分野の検索に適合した状態で維持することができる。
[処理の流れ]
次に、図28及び図29のフローチャートを参照して本実施形態の情報管理サーバ10の処理の流れについて説明する。また、図30及び図31は、本実施形態の情報管理サーバ10が、ウェブディレクトリW3について実行する処理について示す模式図である。
ステップS61:リンク作成部153、遷移確率算出部154、閾値判定部155、及びサブディレクトリ作成部158は、クリックディレクトリ作成処理を実行する。クリッ クディレクトリ作成処理については、図29で詳述する。
ステップS62:サブディレクトリ判定部159は、シードディレクトリにステップS61においてサブディレクトリ作成部158により作成されたサブディレクトリを追加するか否かをサブディレクトリ判定基準に基づいて判定する。シードディレクトリにサブディレクトリを追加する場合(Yes)には、ステップS63へ移る。一方、シードディレクトリにサブディレクトリを追加しない場合(No)には、一連の処理を終了する。
ステップS63:サブディレクトリ追加部160は、ステップS62においてサブディレクトリ判定部159によりシードディレクトリにサブディレクトリを追加すると判定された場合であるため、シードディレクトリにサブディレクトリ作成部158により作成されたサブディレクトリを追加する。具体的には、図31に示すように、URLが追加される前のシードディレクトリD61内(図30参照)にURL61、URL62及びURL63が追加される。
ステップS64:取捨選択部161は、アクセスログ記憶部113に記憶されるアクセスログ又は取捨選択基準記憶部115に記憶される取捨選択基準に基づいて、シードディレクトリD31に追加されたクリックディレクトリに格納される各々のURL(リンク)の調整を行い、一連の処理を終了する。
図29は、クリックディレクトリ作成処理の流れについて示すフローチャートである。ここで、図29のフローチャートに示すクリックディレクトリ作成処理は、第3実施形態のクリックディレクトリ作成処理と同様の処理であるため、説明を省略する。
[ウェブディレクトリW3の具体例]
次に、本実施形態のウェブディレクトリW3の具体例について図32〜図34を参照しながら説明する。
図32〜図34は、ウェブディレクトリW3の具体的な表示例について示す図である。図32に示すように、ウェブディレクトリW3の表示画面70は、ウェブディレクトリW3を構成する各々のシードディレクトリ71と、シードディレクトリ71に格納されている(リンクされている)URLである登録サイト72と、クエリを入力する検索語入力欄73と、検索ボタン74とを含んで構成されている。
図33は、図32に示すシードディレクトリ71のうち、シードディレクトリ71に対して作成され、追加されたクリックディレクトリ(サブディレクトリ)75の具体例について示す図である。図33に示すように、クリックディレクトリ75は、それぞれ「夏レシピ」、「おすすめ料理」、「しょうが焼き」及び「洋食レシピ」のカテゴリ名が付与されている。
図34は、図33に示すクリックディレクトリ75のうち、「夏レシピ」のカテゴリ名のクリックディレクトリ75aに格納されるURLを示す図である。図34に示すように、「夏レシピ」のカテゴリ名のクリックディレクトリ75aに格納されるURL76は、「夏においしい!!夏の料理レシピ」、「夏!もてなしレシピ150品」、「粗食の進め夏レシピ」及び「梅雨レシピ」の名称が付与されるURLへのリンクである。
このように、情報管理サーバ10は、端末装置30を操作するユーザ向けにシードディレクトリの拡張を行うことができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
本発明の情報管理装置の一実施形態に係る検索システム1を示す構成図である。 本発明の情報管理装置の一実施形態に係る情報管理サーバ10のハードウェア構成の一例を示す図である。 第1実施形態の情報管理サーバ10の機能ブロック図である。 クリックデータテーブル111aの一例を示す図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリWについて示す模式図である。 第1実施形態の情報管理サーバ10の処理の流れについて説明するフローチャートである。 第1実施形態の情報管理サーバ10の処理の流れについて説明するフローチャートである。 第1実施形態の情報管理サーバ10の処理の流れについて説明するフローチャートである。 リンク作成部121により作成される有向リンクについて示す図である。 リンク作成部121により作成される有向リンクについて示す図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリWについて示す模式図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリWについて示す模式図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリWについて示す模式図である。 第2実施形態の情報管理サーバ10の機能ブロック図である。 第2実施形態の情報管理サーバ10の処理の流れについて説明するフローチャートである。 第3実施形態の情報管理サーバ10の機能ブロック図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW2について示す模式図である。 第3実施形態の情報管理サーバ10の処理の流れについて説明するフローチャートである。 クリックディレクトリ作成処理の流れについて示すフローチャートである。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW2について示す模式図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW2について示す模式図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW2について示す模式図である。 ウェブディレクトリW2の具体的な表示例について示す図である。 ウェブディレクトリW2の具体的な表示例について示す図である。 ウェブディレクトリW2の具体的な表示例について示す図である。 ウェブディレクトリW2の具体的な表示例について示す図である。 第4実施形態の情報管理サーバ10の機能ブロック図である。 第4実施形態の情報管理サーバ10の処理の流れについて説明するフローチャートである。 クリックディレクトリ作成処理の流れについて示すフローチャートである。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW3について示す模式図である。 ウェブディレクトリ記憶部112に記憶されるウェブディレクトリW3について示す模式図である。 ウェブディレクトリW3の具体的な表示例について示す図である。 ウェブディレクトリW3の具体的な表示例について示す図である。 ウェブディレクトリW3の具体的な表示例について示す図である。
1 検索システム
10 情報管理サーバ
20 検索サーバ
30 端末装置
40 コンテンツサーバ
50 通信回線
110 記憶部
111 クリックデータ蓄積部
120 制御部

Claims (21)

  1. ディレクトリに格納されており、表示順位が予め示されているURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力され、前記検索エンジンによ りウェブページが検索され、検索結果として、前記表示順位にしたがったURLを表示す ユーザ端末とを管理する情報管理装置において、
    前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果として表示されるURLのうち、前記ユーザがクリックしたクリッ URLと前記入力クエリとが対応付けて記憶される記憶手段と、
    前記記憶手段に記憶された前記クリックURL及び前記入力クエリに基づいて、前記ディレクトリに格納されているURLの中から前記クリックURLを検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成手段と、
    前記記憶手段に対応付けて記憶されている前記クリックURL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成手段と、
    前記第1有向リンクを構成する前記クリックURLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出手段と、
    前記遷移確率が第1の閾値よりも大きいか否かを判定する第1閾値判定手段と、
    前記第1閾値判定手段により判定された結果、前記遷移確率が前記第1の閾値よりも大きい場合には、前記選択URLが前記ディレクトリに存在するか否かを判定するURL判定手段と、
    前記URL判定手段により判定された結果、前記選択URLが前記ディレクトリに存在する場合には、前記表示順位を変更する表示順位変更手段とを備える情報管理装置。
  2. 前記URL判定手段により判定された結果、前記選択URLが前記ディレクトリに存在しない場合には、前記選択URLを前記ディレクトリに追加するURL追加手段を更に備える請求項1に記載の情報管理装置。
  3. 前記遷移確率算出手段は、
    前記記憶手段に記憶された前記URL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記URLから前記第1有向リンクを構成するクエリへの第1遷移確率を算出する第1遷移確率算出手段と、
    前記記憶手段に記憶された前記URL及び前記入力クエリに基づいて、前記第1有向リンク及び前記第2有向リンクを構成するクエリから前記第2有向リンクを構成する前記選択URLへの第2遷移確率を算出する第2遷移確率算出手段と、
    前記第1遷移確率と前記第2遷移確率とに基づいて、前記第1有向リンクを構成する URLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの前記遷移確率を算出する第3遷移確率算出手段とを備える請求項1又は2に記載の情報管理装置。
  4. 前記第1遷移確率に基づいて、前記ディレクトリから前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリへの第4遷移確率を算出する第4遷移確率算出手段と、
    前記第4遷移確率が第2の閾値よりも大きいか否かを判定する第2閾値判定手段と、
    前記第2閾値判定手段により判定された結果、前記第4遷移確率が前記第2の閾値よりも大きい場合には、前記ディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成手段とを更に備える請求項3に記載の情報管理装置。
  5. 前記第4遷移確率が第3の閾値よりも大きいか否かを判定する第3閾値判定手段と、
    前記第3閾値判定手段により判定された結果、前記第4遷移確率が前記第3の閾値よりも大きい場合には、作成された前記サブディレクトリに前記選択URLを追加するサブディレクトリURL追加手段とを更に備える請求項4に記載の情報管理装置。
  6. 前記ディレクトリと作成された前記サブディレクトリとの類似度を算出する類似度算出手段と、
    前記類似度算出手段により算出された前記類似度が所定の条件を満たすか否かを判定する類似度判定手段と、
    前記類似度判定手段により判定された結果、前記類似度が前記所定の条件を満たす場合には、前記ディレクトリと作成された前記サブディレクトリとのリンクを作成するリンク作成手段とを更に備える請求項5に記載の情報管理装置。
  7. ディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理する情報管理装置において、
    前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される記憶手段と、
    前記記憶手段に記憶された前記URL及び前記入力クエリに基づいて、前記ディレクトリに格納されるURLが選択された頻度を算出する頻度算出手段と、
    前記頻度算出手段により算出された前記頻度のうち、所定の頻度を超えるURLを抽出するURL抽出手段と、
    前記URL抽出手段により抽出された前記URLの集合を仮想ディレクトリとして、前記ディレクトリとの類似度を算出する類似度算出手段と、
    前記類似度算出手段により算出された前記類似度が所定の条件を満たすか否かの判定を行う類似度判定手段と、
    前記類似度判定手段により判定された結果、前記所定の条件を満たす場合、前記類似度を算出したディレクトリに、抽出された前記URLが格納されるサブディレクトリを作成するサブディレクトリ作成手段とを備える情報管理装置。
  8. 前記類似度判定手段により判定された結果、前記所定の条件を満たす場合、抽出された前記URLを前記サブディレクトリに追加し、当該追加したURLと前記類似度を算出したディレクトリに格納されるURLとで重複するURLを併合するURL併合手段を更に備える請求項7に記載の情報管理装置。
  9. ディレクトリに格納されており、表示順位が予め示されているURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力され、前記検索エンジンによ りウェブページが検索され、検索結果として、前記表示順位にしたがったURLを表示す ユーザ端末とを管理し、前記ユーザ端末に入力された前記検索クエリである入力クエリ 前記検索エンジンにより検索された検索結果として表示されるURLのうち、前記ユーザがクリックしたクリックURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される情報管理装置により実行される情報管理方法において、
    憶されている前記クリックURL及び前記入力クエリに基づいて、前記ディレクトリに格納されているURLの中から前記クリックURLを検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、
    憶されている前記クリックURL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、
    前記第1有向リンクを構成する前記クリックURLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、
    前記遷移確率が所定の閾値よりも大きいか否かを判定する閾値判定ステップと、
    前記閾値判定ステップにより判定された結果、前記遷移確率が前記所定の閾値よりも大きい場合には、前記選択URLが前記ディレクトリに存在するか否かを判定するURL判定ステップと、
    前記URL判定ステップにより判定された結果、前記選択URLが前記ディレクトリに存在する場合には、前記表示順位を変更する表示順位変更ステップとを備える情報管理方法。
  10. ディレクトリに格納されており、表示順位が予め示されているURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力され、前記検索エンジンによ りウェブページが検索され、検索結果として、前記表示順位にしたがったURLを表示す ユーザ端末とを管理し、前記ユーザ端末に入力された前記検索クエリである入力クエリ 前記検索エンジンにより検索された検索結果として表示されるURLのうち、前記ユーザがクリックしたクリックURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される情報管理装置のコンピュータにより実行されるコンピュータプログラムであって、
    憶されている前記クリックURL及び前記入力クエリに基づいて、前記ディレクトリに格納されているURLの中から当該クリックURLを検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、
    憶されている前記クリックURL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、
    前記第1有向リンクを構成する前記クリックURLが格納される前記ディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、
    前記遷移確率が所定の閾値よりも大きいか否かを判定する閾値判定ステップと、
    前記閾値判定ステップにより判定された結果、前記遷移確率が前記所定の閾値よりも大きい場合には、前記選択URLが前記ディレクトリに存在するか否かを判定するURL判定ステップと、
    前記URL判定ステップにより判定された結果、前記選択URLが前記ディレクトリに存在する場合には、前記表示順位を変更する表示順位変更ステップとをコンピュータに実行させるコンピュータプログラム。
  11. 特定の専門分野に関するシードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記シードディレクトリを前記特定の専門分野に専門化する情報管理装置であって、
    前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される記憶手段と、
    前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記記憶手段に記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリから第1選択基準に基づいて、前記シードディレクトリに関連する前記URL及び前記入力クエリを抽出する第1抽出手段と、
    前記第1抽出手段により抽出された前記URLから第2選択基準に基づいて、前記シードディレクトリに追加するためのURLを抽出する第2抽出手段と、
    前記第2抽出手段により抽出された前記URLを前記シードディレクトリに追加するURL追加手段とを備える情報管理装置。
  12. 前記記憶手段に記憶される前記URL及び前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成手段と、
    前記記憶手段に記憶される前記URL及び前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成手段と、
    前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出手段と、
    前記遷移確率算出手段により算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成手段と、
    前記サブディレクトリ作成手段により作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加手段と更に備える請求項11に記載の情報管理装置。
  13. 前記第1リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成し、
    前記第2リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する請求項12に記載の情報管理装置。
  14. 前記サブディレクトリ追加手段により追加された前記サブディレクトリに格納される各々のURLの取捨選択を行う取捨選択手段を更に備える請求項12に記載の情報管理装置。
  15. 特定の専門分野に関するシードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、 記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記特定の専門分野に専門化するための情報管理装置により実行される情報管理方法であって、
    憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリから第1選択基準に基づいて、前記シードディレクトリに関連する前記URL及び前記入力クエリを抽出する第1抽出ステップと、
    前記第1抽出ステップにより抽出された前記URLから第2選択基準に基づいて、前記シードディレクトリに追加するためのURLを抽出する第2抽出ステップと、
    前記第2抽出ステップにより抽出された前記URLを前記シードディレクトリに追加するURL追加ステップとを備える情報管理方法。
  16. 特定の専門分野に関するシードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、 記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記特定の専門分野に専門化する情報管理装置のコンピュータにより実行されるコンピュータプログラムであって、
    憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリから第1選択基準に基づいて、前記シードディレクトリに関連する前記URL及び前記入力クエリを抽出する第1抽出ステップと、
    前記第1抽出ステップにより抽出された前記URLから第2選択基準に基づいて、前記シードディレクトリに追加するためのURLを抽出する第2抽出ステップと、
    前記第2抽出ステップにより抽出された前記URLを前記シードディレクトリに追加するURL追加ステップとをコンピュータに実行させるコンピュータプログラム。
  17. シードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記シードディレクトリを前記ユーザに対して個人化する情報管理装置であって、
    前記ユーザ端末に入力された前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶される記憶手段と、
    前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記記憶手段に記憶されている全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成手段と、
    前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記記憶手段に記憶されている全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成手段と、
    前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出手段と、
    前記遷移確率算出手段により算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成手段と、
    サブディレクトリ判定基準に基づいて、前記サブディレクトリ作成手段により作成された前記サブディレクトリを前記シードディレクトリに追加するか否かを判定するサブディレクトリ判定手段と、
    前記サブディレクトリ判定手段による判定結果に応じて前記サブディレクトリ作成手段により作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加手段とを備える情報管理装置。
  18. 前記第1リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成し、
    前記第2リンク作成手段は、前記記憶手段に記憶される前記URL及び前記入力クエリのうち、前記シードディレクトリにアクセスした前記ユーザにより入力された前記URL及び前記シードディレクトリにアクセスした前記ユーザ端末により入力された前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された前記選択URLへの第2有向リンクを作成する請求項17に記載の情報管理装置。
  19. 前記サブディレクトリ追加手段により追加された前記サブディレクトリに格納される各々のURLの取捨選択を行う取捨選択手段を更に備える請求項17に記載の情報管理装置。
  20. シードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記ユーザ端末に入力され た前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記ユーザに対して個人化する情報管理装置により実行される情報管理方法であって、
    憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、
    憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、
    前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、
    前記遷移確率算出ステップにより算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成ステップと、
    サブディレクトリ判定基準に基づいて、前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するか否かを判定するサブディレクトリ判定ステップと、
    前記サブディレクトリ判定ステップによる判定結果に応じて前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加ステップとを備える情報管理方法。
  21. シードディレクトリに格納されるURLと、ウェブページを検索する検索エンジンと、ユーザにより検索クエリ入力されるユーザ端末とを管理し、前記ユーザ端末に入力され た前記検索クエリである入力クエリで前記検索エンジンにより検索された検索結果のURLのうち、前記ユーザがクリックしたURLと前記ユーザ端末により入力された入力クエリとが対応付けて記憶され、前記シードディレクトリを前記ユーザに対して個人化する情報管理装置のコンピュータにより実行されるコンピュータプログラムであって、
    憶される前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記シードディレクトリに格納されるURLから当該URLを前記検索結果として得るための前記入力クエリへの第1有向リンクを作成する第1リンク作成ステップと、
    憶された前記URL及び前記入力クエリのうち、記憶される全ユーザによる前記URL及び全ユーザによる前記入力クエリに基づいて、前記第1有向リンクを構成する前記入力クエリから当該入力クエリが前記検索エンジンにより検索された検索結果のURLのうち、選択された選択URLへの第2有向リンクを作成する第2リンク作成ステップと、
    前記第1有向リンクを構成するURLが格納される前記シードディレクトリから前記第2有向リンクを構成する前記選択URLへの遷移確率を算出する遷移確率算出ステップと、
    前記遷移確率算出ステップにより算出された前記遷移確率に基づいて、前記シードディレクトリに前記第1有向リンク及び前記第2有向リンクを構成する前記入力クエリの名称が付与されたサブディレクトリを作成するサブディレクトリ作成ステップと、
    サブディレクトリ判定基準に基づいて、前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するか否かを判定するサブディレクトリ判定ステップと、
    前記サブディレクトリ判定ステップによる判定結果に応じて前記サブディレクトリ作成ステップにより作成された前記サブディレクトリを前記シードディレクトリに追加するサブディレクトリ追加ステップとをコンピュータに実行させるコンピュータプログラム。
JP2008249089A 2008-06-12 2008-09-26 社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム Expired - Fee Related JP4922274B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008249089A JP4922274B2 (ja) 2008-06-12 2008-09-26 社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008154440 2008-06-12
JP2008154440 2008-06-12
JP2008249089A JP4922274B2 (ja) 2008-06-12 2008-09-26 社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2010020739A JP2010020739A (ja) 2010-01-28
JP2010020739A5 JP2010020739A5 (ja) 2010-03-11
JP4922274B2 true JP4922274B2 (ja) 2012-04-25

Family

ID=41705528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008249089A Expired - Fee Related JP4922274B2 (ja) 2008-06-12 2008-09-26 社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4922274B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142021B (zh) * 2011-02-10 2013-02-20 北京百度网讯科技有限公司 一种页面浏览目录辅助方法
US10217058B2 (en) 2014-01-30 2019-02-26 Microsoft Technology Licensing, Llc Predicting interesting things and concepts in content
US9846836B2 (en) 2014-06-13 2017-12-19 Microsoft Technology Licensing, Llc Modeling interestingness with deep neural networks

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002151413A (ja) * 2000-10-31 2002-05-24 Applied Materials Inc 成膜装置
JP3571312B2 (ja) * 2001-06-29 2004-09-29 株式会社ジャストシステム リンク集作成装置、リンク集作成方法、及びリンク集作成プログラム
JP4068891B2 (ja) * 2002-01-18 2008-03-26 日本電信電話株式会社 コンテンツ検索装置および方法とコンテンツ検索プログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体
JP3964728B2 (ja) * 2002-05-02 2007-08-22 日本電信電話株式会社 情報検索方法及びその装置、並びに該方法の実行プログラム及び該方法の実行プログラムを記録した記録媒体
JP2005196254A (ja) * 2003-12-26 2005-07-21 Fuji Xerox Co Ltd ディレクトリ構造形成装置及びその方法、ディレクトリサービスシステム
JP2006236254A (ja) * 2005-02-28 2006-09-07 Japan Science & Technology Agency コミュニティ依存型情報検索システム及び方法

Also Published As

Publication number Publication date
JP2010020739A (ja) 2010-01-28

Similar Documents

Publication Publication Date Title
US6848077B1 (en) Dynamically creating hyperlinks to other web documents in received world wide web documents based on text terms in the received document defined as of interest to user
US9940398B1 (en) Customization of search results for search queries received from third party sites
CA2573672C (en) Personalization of placed content ordering in search results
US7921109B2 (en) Customizable ordering of search results and predictive query generation
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
US20090006388A1 (en) Search result ranking
US20060184512A1 (en) Content searching and configuration of search results
US20080104042A1 (en) Personalized Search Using Macros
US9996630B2 (en) System and/or method for linking network content
US20060059134A1 (en) Creating attachments and ranking users and attachments for conducting a search directed by a hierarchy-free set of topics
US20110238662A1 (en) Method and system for searching a wide area network
US20090006962A1 (en) Audio thumbnail
US9411895B2 (en) Personalized deeplinks for search results
JP2006164246A (ja) エンティティ固有の調整された検索
WO2005033979A1 (en) Personalization of web search
US20100125781A1 (en) Page generation by keyword
US20020129051A1 (en) Previewing portions of the hypertext World Wide Web documents linked to hyperlinks in received World Wide Web documents
US7975238B2 (en) Identifying previously bookmarked hyperlinks in a received Web page in a World Wide Web network browser system for searching
US20020107884A1 (en) Prioritizing and visually distinguishing sets of hyperlinks in hypertext world wide web documents in accordance with weights based upon attributes of web documents linked to such hyperlinks
US8271517B2 (en) Presentation of websites to a computer user
JP4922274B2 (ja) 社会的な人気・関心を反映したディレクトリを作成、検索及び表示する情報管理装置、方法及びプログラム
JP2010205224A (ja) 商品情報提供装置、商品情報の提供方法及びプログラム
US20080288439A1 (en) Combined personal and community lists
JP2010020739A5 (ja)
US20030023624A1 (en) Web browser interest terms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091208

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120203

R150 Certificate of patent or registration of utility model

Ref document number: 4922274

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350