JP5075895B2 - 情報検索システム及び情報検索方法 - Google Patents

情報検索システム及び情報検索方法 Download PDF

Info

Publication number
JP5075895B2
JP5075895B2 JP2009217647A JP2009217647A JP5075895B2 JP 5075895 B2 JP5075895 B2 JP 5075895B2 JP 2009217647 A JP2009217647 A JP 2009217647A JP 2009217647 A JP2009217647 A JP 2009217647A JP 5075895 B2 JP5075895 B2 JP 5075895B2
Authority
JP
Japan
Prior art keywords
url
content
browsing
frequency
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009217647A
Other languages
English (en)
Other versions
JP2011065570A (ja
Inventor
純 佐々木
大祐 鳥居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2009217647A priority Critical patent/JP5075895B2/ja
Publication of JP2011065570A publication Critical patent/JP2011065570A/ja
Application granted granted Critical
Publication of JP5075895B2 publication Critical patent/JP5075895B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、検索クエリに対応するコンテンツの検索結果を提供する情報検索システム、及び該情報検索システムにおいて実行される情報検索方法に関する。
現在インターネットには膨大な情報が蓄積されており、ユーザは検索エンジンなどの情報提供装置を使用して、所望の情報にアクセスしている。従来の情報提供方法には、コンテンツ内の文書を蓄積しておき、ユーザが入力する検索クエリに含まれる検索語の使用頻度に基づいて、文書と検索クエリの関連度を求め、関連度の大きいものから順に検索結果を提示する方法がある(非特許文献1)。
また、特許文献1には、ユーザからの検索条件とコンテンツの閲覧要求とを記録し、閲覧要求の回数を用いて、上述の文書と検索クエリの関連度を補正する方法が開示されている。
更に、特許文献2には、コンテンツの閲覧回数を検索する際に、URLのドメイン名、或いは、「/」、「.」及び「〜」の記号で区切ったURLの一部、を検索条件とする方法が記載されている。
特開2000−227922号公報 特開2008−269427号公報
北研二他、「情報検索アルゴリズム」、共立出版、2002
しかしながら、上記の特許文献1に記載された方法では、新たに追加されたコンテンツは閲覧要求の回数が低いため、上位に表示されないという問題があった。日記やニュースなどのコンテンツは追加頻度が高く、且つ追加されたコンテンツは閲覧要求の回数の集計単位となるURL(Uniform Resorce Locater)が異なる場合がある。この場合、追加頻度が高いコンテンツから派生したコンテンツは、コンテンツ自体への閲覧要求の回数が少ないために、価値が高いコンテンツであっても検索結果の上位に表示されない。
また、特許文献2に記載された方法に関して、近年、閲覧ユーザの特定、直前に閲覧したURLなどユーザ閲覧状態の把握、ユーザ毎にカスタマイズした情報表示といった目的で、CGI(Common Gateway Interface)などを使用した、動的に生成される変数部を含んだURLによるコンテンツへのアクセスが増加している。それに伴って、同じコンテンツを閲覧していても、ユーザによって或いはアクセスしたタイミングによってURLが異なる場合がある。
このような場合には、単純にURLの一部を単位として閲覧頻度を集計すると複数のURLに閲覧回数が分散してしまうため、閲覧頻度が高い有用なコンテンツが検索結果の上位に表示されない。
本発明は、上記のような問題点に鑑みてなされたものであり、コンテンツが新規に追加された場合、及び内容が同様であるコンテンツを表示するURLが複数に分散している場合等、URL自体への閲覧頻度が小さい場合であっても、同一或いは類似するコンテンツへの閲覧頻度が大きい、価値の高いコンテンツをより高い検索順位とすることが可能となる情報検索装置、情報検索システム及び情報検索方法を提供することを目的とする。
上記課題を解決するために、本発明の情報検索システムは、検索に用いる文字列を含んだ検索要求を検索要求元装置から受信し、該受信した検索要求に応じてコンテンツを検索し、該検索したコンテンツのリストを検索要求元装置に対して提示する情報検索部と、情報検索部に対してコンテンツの閲覧頻度に関する情報を提供する閲覧頻度提供部と、を含んで構成される情報検索システムであって、閲覧頻度提供部は、コンテンツが閲覧された履歴に基づいて、コンテンツに関する閲覧要求に含まれるURLが有するURL特徴に対応する閲覧頻度であるURL特徴別頻度を集計する閲覧頻度集計手段と、閲覧頻度集計手段が集計したURL特徴別頻度を格納する閲覧頻度格納手段と、を備え、情報検索部は、コンテンツに対応するURL情報と、当該コンテンツの特徴情報とを予め対応づけて格納しているコンテンツ特徴格納手段と、文字列と、コンテンツ特徴格納手段に特徴情報が格納されているコンテンツとの適合度を算出する適合度算出手段と、適合度算出手段によって適合度が算出されたコンテンツと関連付けられてコンテンツ特徴格納手段に格納されているURL情報から変数部を除去することで除去後URLとする除去手段と、除去後URLと、該除去後URLの一部とを含むURL群、及び内容が互いに類似しているコンテンツを表示する関連URL群のそれぞれのURL特徴に対応するURL特徴別頻度を、閲覧頻度格納手段に格納されているURL特徴別頻度を参照することにより取得し、URL群及び関連URL群のそれぞれのURL特徴別頻度、及び、適合度算出手段が算出した適合度に基づいてコンテンツに対応するスコアを算出するスコア算出手段と、コンテンツのリストを、スコア算出手段が算出したスコアに応じた順番で検索要求元装置に対して提示する検索結果提示手段と、を備え、関連URL群は、コンテンツの内容にしたがって複数のコンテンツ毎に付与されているグループIDによって分類されたURL群であり、URL特徴は、除去後URL及び除去後URLの一部であり、URL特徴別頻度は、URL特徴がグループIDによって分類されている場合、グループIDが同一である全てのコンテンツを複数のユーザが閲覧した履歴に基づく閲覧頻度の合計であり、URL特徴が除去後URLであった場合、除去後URLが同一である全てのコンテンツに対応する閲覧頻度の合計であり、URL特徴が除去後URLの一部であった場合、除去後URLの一部が同一である全てのコンテンツに対応する閲覧頻度の合計である。
本発明の情報検索システムによれば、変数部(パラメータ部)がURLから除去されることにより、内容が同様であるコンテンツを表示するURLが複数に分散している場合であっても、それらを同一のURLとするために閲覧回数を分散することを防ぐこととなる。また、除去後URL、及びその一部を含んだURL群の閲覧頻度に基づいてコンテンツのスコアを得ることとなる。その為、コンテンツが新規に追加された場合、及び内容が同様であるコンテンツを表示するURLが複数に分散している場合等、URL自体への閲覧頻度が小さい場合であっても、同一或いは類似するコンテンツへの閲覧頻度が大きい、価値の高いコンテンツをより高いスコアとすることが可能となる。
また、除去手段は、URL情報中に所定の文字が含まれているか否かを判断し、該文字が含まれていると判断した場合に、該URL情報から該文字以降の文字を除くことにより除去後URLとすることが好適である。所定の文字を例えば「?」、「;」或いは「*」とすることにより、変数部を除去することが可能となる。
また、閲覧頻度格納手段は、更に、グループIDが同一であるコンテンツに関する閲覧頻度を、該グループIDと関連づけて格納している。
例えば、「http://aaa.com/news」と「http://aaa.com/game」との例のように、ドメイン名が同じであってもコンテンツの内容(ニュースとゲームと)が大きく異なる場合がある。逆にドメイン名が異なっていてもコンテンツの内容は類似している場合もある。このような場合に、内容が類似しているコンテンツを表示するURL群をグループIDとして集約し、集約したURL群の閲覧頻度を考慮することによって、価値の高いコンテンツをより高いスコアとすることが可能となる。
また、閲覧頻度格納手段は、閲覧頻度を曜日及び時間帯の一方或いは両方毎に格納しており、スコア算出手段は、検索要求元装置が検索要求を送信した曜日及び時間帯の一方或いは両方に対応して閲覧頻度格納手段に格納されている閲覧頻度に基づいて、スコアを算出する、ことが好適である。
これにより、同一の文字列(検索クエリ)を用いて入手することが望まれるコンテンツの内容が曜日或いは時間帯によって異なる傾向があっても、その傾向を考慮して、価値の高いコンテンツをより高いスコアとすることが可能となる。
また、閲覧頻度集計手段は、検索要求元装置が検索結果提示手段によって提示されたコンテンツリストの中から閲覧するコンテンツを選択することによって該コンテンツを閲覧した履歴に基づいて閲覧頻度を集計することが好適である。これにより、煩雑な処理をすることなく、閲覧履歴を得る事が可能となる。
上記課題を解決するために、本発明の情報検索方法は、検索に用いる文字列を含んだ検索要求を検索要求元装置から受信し、該受信した検索要求に応じてコンテンツを検索し、該検索したコンテンツのリストを検索要求元装置に対して提示する、コンテンツに対応するURL情報と当該コンテンツの特徴情報とを予め対応づけて格納しているコンテンツ特徴格納手段を含んで備える情報検索部と、情報検索部に対してコンテンツの閲覧頻度に関する情報を提供する閲覧頻度提供部と、を含んで構成される情報検索システムにおいて実行される情報検索方法であって、閲覧頻度提供部が、コンテンツが閲覧された履歴に基づいて、コンテンツに関する閲覧要求に含まれるURLが有するURL特徴に対応する閲覧頻度であるURL特徴別頻度を集計する閲覧頻度集計ステップと、閲覧頻度格納手段に閲覧頻度集計ステップにおいて集計されたURL特徴別頻度を格納する閲覧頻度格納ステップと、情報検索部が、文字列と、コンテンツ特徴格納手段に特徴情報が格納されているコンテンツとの適合度を算出する適合度算出ステップと、適合度算出ステップにおいて適合度が算出されたコンテンツと関連づけられてコンテンツ特徴格納手段に格納されているURL情報から変数部を除去することで除去後URLとする除去ステップと、除去後URLと、該除去後URLの一部とを含むURL群、及び内容が互いに類似しているコンテンツを表示する関連URL群のそれぞれのURL特徴に対応するURL特徴別頻度を閲覧頻度格納手段に格納されているURL特徴別頻度を参照することにより取得し、URL群及び関連URL群のそれぞれのURL特徴別頻度、及び、適合度算出ステップにおいて算出された適合度に基づいてコンテンツに対応するスコアを算出するスコア算出ステップと、コンテンツのリストを、スコア算出ステップにおいて算出されたスコアに応じた順番で検索要求元装置に対して提示する検索結果提示ステップと、を備え、関連URL群は、コンテンツの内容にしたがって複数のコンテンツ毎に付与されているグループIDによって分類されたURL群であり、URL特徴は、除去後URL及び除去後URLの一部であり、URL特徴別頻度は、URL特徴がグループIDによって分類されている場合、グループIDが同一である全てのコンテンツを複数のユーザが閲覧した履歴に基づく閲覧頻度の合計であり、URL特徴が除去後URLであった場合、除去後URLが同一である全てのコンテンツに対応する閲覧頻度の合計であり、URL特徴が除去後URLの一部であった場合、除去後URLの一部が同一である全てのコンテンツに対応する閲覧頻度の合計である。
本発明の情報検索方法によれば、変数部がURLから除去されることにより、内容が同様であるコンテンツを表示するURLが複数に分散している場合であっても、それらを同一のURLとするために閲覧回数を分散することを防ぐこととなる。また、除去後URL、及びその一部を含んだURL群の閲覧頻度に基づいて閲覧頻度を得ることとなる。その為、コンテンツが新規に追加された場合、及び内容が同様であるコンテンツを表示するURLが複数に分散している場合等、URL自体への閲覧頻度が小さい場合であっても、同一或いは類似するコンテンツへの閲覧頻度が大きい、価値の高いコンテンツをより高いスコアとすることが可能となる。
また、閲覧頻度格納手段は、閲覧頻度を曜日及び時間帯の一方或いは両方毎に格納しており、スコア算出ステップにおいて、情報検索部は、検索要求元装置が検索要求を送信した曜日及び時間帯の一方或いは両方に対応して閲覧頻度格納手段に格納されている閲覧頻度に基づいて、スコアを算出することが好適である。
これにより、同一の文字列(検索クエリ)を用いて入手することが望まれるコンテンツの内容が曜日或いは時間帯によって異なる傾向があっても、その傾向を考慮して、価値の高いコンテンツをより高いスコアとすることが可能となる。
本発明によれば、コンテンツが新規に追加された場合、及び内容が同様であるコンテンツを表示するURLが複数に分散している場合等、URL自体への閲覧頻度が小さい場合であっても、同一或いは類似するコンテンツへの閲覧頻度が大きい、価値の高いコンテンツをより高いスコアとすることが可能となる情報検索システム及び情報検索方法を提供することが可能となる。
実施形態の情報検索システムの機能構成を示す図である。 図1に示すコンテンツ特徴格納部が格納している情報の例を示す図である。 図1に示す変数部除去部及びスコア算出部の処理を説明するための図である。 図1に示すURL特徴別頻度格納部が格納している情報の例を示す図である。 図1に示すURL特徴別頻度格納部が格納している情報の例を示す図である。 図1に示すURL特徴別頻度格納部が格納している情報の例を示す図である。 図1に示すURL特徴別頻度格納部が格納している情報の例を示す図である。 図1に示す検索ログ格納部が格納する情報の例を示す図である。 図1に示す情報検索システム及びクライアント端末における処理の流れを示す図である。
本発明の実施形態に係る情報検索システムについて、図面を参照して説明する。なお、説明において、同一要素又は同一機能を有する要素には同一符号を用いることとし、重複する説明は省略する。
図1にクライアント端末100(検索要求元装置)、ネットワークN、Webサーバ101、及び情報検索システム130の機能構成を示す。
クライアント端末100は、検索クエリ(文字列)を含む検索要求を情報検索システム130に対して送信し、検索要求に応じたコンテンツリストを情報検索システム130から受信する端末である。
具体的には、クライアント端末100は、ネットワークNを介して情報検索システム130との間で情報の送受信を行う機能、検索クエリを含む検索要求を情報検索システム130に送信する機能、当該検索クエリに応じたコンテンツリストを受信する機能、受信したコンテンツリストの情報を表示出力等して、ユーザへの情報の提示を行う機能、ユーザによってコンテンツリストの中からコンテンツが選択された場合、選択内容を情報検索システム130に送信する機能、該選択したコンテンツのURLを取得する機能、リダイレクト処理により、URLで指定されるWebサーバ101へコンテンツ要求を送信する機能、Webサーバ101から所望のコンテンツを受信する機能、及び、コンテンツを表示出力する機能を有する。
物理的には、クライアント端末100は、携帯電話機等の移動通信端末であることが好適である。
クライアント端末100は、携帯電話機等の移動通信端末に限定される必要はなく、例えば、簡易型携帯電話機(PHS:Personal Handy-phone System)、通信機能を有する携帯型情報端末(PDA:Personal Digital Assistant)、或いは、パーソナルコンピュータ(PC:Personal Computer)等であってもよい。
ネットワークNは、具体的には、移動体通信網を含んだ通信網であることが好適である。ネットワークNは、必ず移動体通信網を含む必然性はない。例えば、クライアント端末100としてのPCと後述のWebサーバ101を含んで構成されているインターネットであっても勿論よい。
クライアント端末100は、所定の方法でネットワークN上の情報にアクセスする。具体的には、クライアント端末100は、URL(Uniform Resource Locator)を含むHTTP(Hyper Text Transfer Protocol)リクエストをネットワークNに送信することで、URLに対応するWebサーバ101にアクセスしてコンテンツ(情報)を受信する。
Webサーバ101は、ネットワークN内に設置され、保有したコンテンツを閲覧要求(コンテンツ要求)に従ってクライアント端末100に対して送信する機能を有する。
次に、情報検索システム130が有する機能について説明する。情報検索システム130は、クライアント端末100に対して情報を提供するシステムである。クライアント端末100へ提供される情報は、具体的にはクライアント端末100から送信される検索クエリに対するコンテンツに関する検索結果であるコンテンツリストの情報である。情報検索システム130による情報検索は、上記のようにクライアント端末100からの要求に応じて行われることが好適である。
図1に示すように情報検索システム130は、具体的には、クライアント端末100への検索結果(コンテンツリスト)提供のための主要機能を有する検索サーバ(情報検索部)110と、コンテンツリストの選択結果を受信し、クライアント端末100が選択したコンテンツを表示するURLをリダイレクトするコンテンツ選択結果受付部102と、クライアント端末100が送信したコンテンツ選択結果を記録し、コンテンツ識別子であるURLの特徴別に頻度情報を生成するURL特徴別頻度生成部(閲覧頻度提供部)120を含んで構成される。
コンテンツ選択結果受付部102と、検索サーバ110と、URL特徴別頻度生成部120とがそれぞれ有する機能は、物理的にはネットワーク上のサーバによって実現されている。必要に応じて通常のサーバが備える基本構成(例えば、CPU、RAM、ROM、キーボード、マウス、外部との通信を行う通信デバイス、情報を記憶する記憶デバイス、ディスプレイ、及びプリンタ)を適宜備える。
コンテンツ選択結果受付部102と、検索サーバ110と、URL特徴別頻度生成部120とがそれぞれ有する機能は、プログラム等のソフトウェアがサーバ上に読み込まれ、ソフトウェアと、サーバにおける各物理的基本構成とが協働することによって実現されている。コンテンツ選択結果受付部102と、検索サーバ110と、URL特徴別頻度生成部120とがそれぞれ有する機能は、単体のサーバによって実現されていても良い。或いは、複数のサーバによってこれらが有する機能を分散的に実現されていても良い。
以下、検索サーバ110の各機能について説明する。図1に示すように、検索サーバ110は、機能的な構成ブロックとして、コンテンツ特徴格納部(コンテンツ特徴格納手段)111と、検索クエリ受付部112と、適合度算出部(適合度算出手段)113と、変数部除去部(除去手段)114と、スコア算出部(スコア算出手段)115と、検索結果提示部(検索結果提示手段)116と、を含んで構成される。
コンテンツ特徴格納部111は、検索対象となるコンテンツについて、コンテンツ識別子であるURL、コンテンツの属するグループID、及びコンテンツに含まれる文章の特徴(特徴情報)を予め格納している。なお、URLに対してコンテンツは一意となるように関連付けられている。以後、特定のURLと関連付けられているコンテンツのことを、“(該特定の)URLが表示するコンテンツ”と称する。
図2にコンテンツ特徴格納部111が格納している情報の例を示す。図2に例示すように、コンテンツ特徴格納部111には、具体的に、URLと、コンテンツの属するグループIDと、コンテンツに含まれる単語(word)と、単語使用回数(TF:Term Frequency)と、単語使用回数に対して重み付けを行った重み付後使用回数(TF・IDF:Term Frequency*Inverse Document Frequency)が格納されている。
ここで、重み付後使用回数は、(単語使用回数)×(IDF)の式で表せる。
単語使用回数とは、対象としている単語がコンテンツの中で使用されている回数を指す。単語kについてのIDFは検索対象コンテンツ総数をN、単語kを含むコンテンツ数をnとして、下記数式(1)で表せる。
Figure 0005075895
コンテンツ特徴格納部111は、単語kについて求めたIDFと単語使用回数とを乗算することで重み付後使用回数を算出し、格納する。
グループIDとは、コンテンツの内容に応じて複数のコンテンツのグループ(群)に対して付加されるIDである。即ち、グループIDとは、コンテンツを提供者や内容に応じてグループに分類するものである。検索対象が登録制のコンテンツである場合は、グループIDは、登録時にコンテンツに対して情報検索システム130の管理者によって付加される。検索対象が一般のWebサイトである場合は、グループIDは、提供者あるいは内容に応じて管理者によって別途付加される。
情報検索システム130の管理者は、例えば、URLの一部を検索キーとして、対応するグループIDを登録したテーブルを作成し、これを参照してグループIDを判定することとしても良い。
検索クエリ受付部112は、クライアント端末100から検索クエリを含んだ検索要求を受信する機能、及び受信した検索クエリを適合度算出部113に対して出力する機能を有する。
適合度算出部113は、コンテンツ特徴格納部111を検索することにより、検索クエリに含まれる検索単語(文字列、キーワード)を含むコンテンツのリストを得て、検索クエリとコンテンツリストに含まれるコンテンツとの適合度を算出する機能、並びに、検索したコンテンツを表示するURL、該URLと関連づけられてコンテンツ特徴格納部111に格納されているグループID、及び算出した適合度を後述の変数部除去部114に対して出力する機能を有する。
具体的には、適合度算出部113は、検索クエリが一つの検索単語で構成される場合、該検索単語と、コンテンツ特徴格納部111が格納している「単語」と、を比較し、両者が同一である全てのコンテンツをコンテンツリストとして得る。また、適合度算出部113は、上記方法で得た全てのコンテンツについて、関連付けられた「URL」、「グループID」、及び「重み付後使用回数」を得る。
この場合(検索クエリが一つの検索単語で構成されている場合)、適合度算出部113は、得られた「重み付後使用回数」を、コンテンツに対応する適合度とする。
検索クエリに複数の検索単語が含まれる場合は、適合度算出部113は、コンテンツ特徴格納部111に格納されている情報について、「URL」が同一である情報毎に検索を行う。適合度算出部113は、検索クエリに含まれている全ての検索単語が「単語」として関連付けられている全てのコンテンツをコンテンツリストとして得る。また、適合度算出部113は、上記方法で得た全てのコンテンツについて、関連付けられた「URL」と、「グループID」と、「単語」毎の「重み付後使用回数」とを得る。
例えば、図2の例では、適合度算出部113は、検索クエリに検索単語として“A”、“B”、“C”、及び“D”の内のどれかの検索単語が一以上含まれており、且つ、その他の検索単語が含まれていない場合に、“http://aaa.com/aaa.cgi?a1=1&a2=2”が表示するコンテンツをコンテンツリストに含める。また、適合度算出部113は、「URL」として"http://aaa.com/aaa.cgi?a1=1&a2=2"、「グループID」として“0001”を得る。また、「単語」“A”、“B”、“C”、及び“D”にそれぞれ対応する「重み付後使用回数」として“3.4525”、“15.4314”、“0.0042”、及び“7.1754”を得る。
そして、適合度算出部113は、“3.4525”、“15.4314”、“0.0042”、及び“7.1754”を足し合わせることによって、「URL」"http://aaa.com/aaa.cgi?a1=1&a2=2"が表示するコンテンツの適合度として26.0635を算出する。
すなわち、適合度算出部113は、コンテンツリストに含まれるそれぞれのコンテンツに対して「単語」毎の「重み付後使用回数」を合算して、そのコンテンツの適合度とする。
或いは、適合度算出部113は、“3.4525”、“15.4314”、“0.0042”、及び“7.1754”を掛け合わせることによって、「URL」"http://aaa.com/aaa.cgi?a1=1&a2=2"が表示するコンテンツの適合度として1.605589143を算出してもよい。
適合度算出部113は、上記方法によって、検索クエリに含まれる検索単語の全てが関連付けられたコンテンツを検索し、検索した全てのコンテンツの適合度を算出する。
変数部除去部114は、URLから変数部を除去することで除去後URLとする機能を有する。
具体的には、変数部除去部114は、適合度算出部113が検索したコンテンツを表示するURL中に「?」、「;」、「*」等の変数部の開始を示す文字が含まれているか否かを判断する機能、及び、含まれていると判断した場合に、該文字以降の文字をURLから除去することにより除去後URLとする機能を有する。
また、変数部除去部114は、適合度算出部113が検索したコンテンツを表示するURL中に「?」、「;」、「*」等の変数部の開始を示す文字が含まれていないと判断した場合には、該URLを除去後URLとする機能を有する。
更に、変数部除去部114は、URL、除去後URL、グループID、及び適合度を後述のスコア算出部115に対して出力する機能を有する。
本実施形態の変数部除去部114がこの機能を有することによって、URLから変数部を除去することが可能となる。例えば、利用者毎の閲覧回数を調査するために利用者名を変数部に含める場合に、「http://aa.com/bb/cc/・・・/ee/xx.cgi?name=hanako」等、利用者によってURLは異なるが、表示するコンテンツの内容は同一である場合がある。変数部除去部114がURLから変数部(上の例では“name=hanako”の部分)を除去することによって、「http://aa.com/bb/cc/・・・/ee/xx.cgi?name=hanako」も、「http://aa.com/bb/cc/・・・/ee/xx.cgi? name=taro」も同一のURLとして処理することが可能となる。
スコア算出部115は、後述のURL特徴別頻度生成部120のURL特徴別頻度格納部123を参照することにより、URL特徴別頻度を得る機能、並びに、該得たURL特徴別頻度及び適合度に基づいてコンテンツ毎のスコアを算出する機能を有する。
ここで、特定のURLのURL特徴とは、該特定のURLのグループID、URLの全体、URLから変数部を除去した除去後URL、及び、除去後URLの一部、のことを指す。
URL特徴別頻度とは、上述したURL特徴に対応した閲覧頻度のことを指す。例えば、URL特徴がグループIDである場合、グループIDが同一である全てのコンテンツに対する閲覧頻度の合計がURL特徴別頻度である。URL特徴が後述のホスト名或いはホストパスなど除去後URLの一部であった場合、該ホスト名或いはホストパスなど除去後URLの一部を有する全てのURLが表示するコンテンツに対する閲覧頻度の合計がURL特徴別頻度である。更に、URL特徴が除去後URLである場合、該除去後URLを有する全てのURLが表示するコンテンツに対する閲覧頻度の合計がURL特徴別頻度である。
また、特定のURLについて、グループID、該特定のURLの全体、該特定のURLから変数部を除去した除去後URL、及び、該除去後URLの一部、の一部或いは全てを指して“URL群”と称する。便宜上、グループIDもURL群に含めるが、厳密にはグループIDはURLではなく、URLの集合を表示する識別子である。
具体的には、スコア算出部115は、変数部除去部114が検索した全てのコンテンツについて、対応するURLの文字列の前方から順に検索し、最初に「?」、「;」及び「*」のうちのどれかの文字を検索した場合に該検索された文字(「?」、「;」或いは「*」)も含めてそれ以降の文字をURLから除去し、残りの部分の文字列を除去後URLとする。
スコア算出部115は、変数部除去部114から入力した除去後URLについて、「http://」、「https://」などのURLのスキーマ部分の直後にある「/」を検索し、URLスキーマ直後から、該検索した「/」の前までの部分をホスト名であると判断する。URLのスキーマ部分の直後にある「/」が無い場合(URLのスキーマ部分の直後以降URLの最後部までに「/」が無い場合)は、除去後URLの末尾までをホスト名であると判断する。
次に、スコア算出部115は、前回検索した「/」の直後から後方に向け次の「/」を検索し、URLスキーマ直後から、該2回目に検索した「/」の前までの部分をホストパス1であると判断する。
更に、スコア算出部115は、前回2回目に検索した「/」の直後から後方に向け次の「/」を検索し、URLスキーマ直後から、該3回目に検索した「/」の前までの部分をホストパス2であると判断する。
この処理を所定回繰り返すことで、一つのURLから、URL全体、除去後URL、ホスト名、ホストパス1、ホストパス2・・・ホストパスNを派生させる。
図3に示した例では、「URL」が「URL全体」に対応する。「NO_PARAM_URL」が「除去後URL」に対応する。「HOST」、「HOST_PATH_1」、「HOST_PATH_2」、及び「HOST_PATH_N」が、それぞれ「ホスト名」、「ホストパス1」、「ホストパス2」、及び「ホストパスN」に対応する。
なお、スコア算出部115は、必要に応じて他のURL分割手法を採用しても良い。
処理を繰り返す所定回数は、自由に設定することが可能であるが、例えば10とすることができる。回数を少なくすることで、処理負担を減らすことが可能となる。回数を大きくすることで、階層が深いURLであっても適切にURLを分割し後述のスコアをより適切なものとすることが可能となる。
スコア算出部115は、後述のURL特徴別頻度格納部123を参照することにより、上記方法によって派生させた全てのURL、及び変数部除去部114から入力したグループIDそれぞれの閲覧頻度(URL特徴別頻度)を得る。
図4〜7にURL特徴別頻度格納部123が格納している情報の例を示す。スコア算出部115は、図4に例示する情報の中から、入力したグループIDに対応する閲覧頻度を得る。
また、スコア算出部115は、図5に示す情報からURL群の中のホスト名に対応する閲覧頻度を得る。
また、スコア算出部115は、図6に示す情報からURL群の中のホストパス1〜ホストパスNに対応する閲覧頻度を得る。更に、スコア算出部115は、図7に示す情報からURL全体、及び除去後URLに対応する閲覧頻度を得る。
なお、以上図4〜7を用いた説明において、スコア算出部115は、「閲覧頻度」を得ているとしているが、「閲覧頻度」ではなく、「人数」を得てURL特徴別頻度としても良い。
スコア算出部115は、上記方法によって得られたURL特徴別頻度と、入力した適合度に基づいて、下記数式(2)によってスコアを算出する。
Figure 0005075895
ここで、適合度をM、考慮するURL群の数をN、URL特徴別頻度Sとする。
a及びbkは、適合度M及びURL特徴別頻度Sの重みを示す定数であり、自由に設定可能である。具体的にa及びbkは、例えば、SVM(Support Vector Machine)等の機械学習を用いて最適な値とすることが可能である。但し、これに限られるわけではない。
検索結果提示部116は、適合度算出部113が検索したコンテンツリストを、スコア算出部115が算出したスコアの順にクライアント端末100に対して提示する機能を有する。
具体的に、検索結果提示部116が提示する検索結果には、検索クエリ、コンテンツのURL、グループIDを変数部として含んだリダイレクト用URLのリストが含まれている。リダイレクト用URLは、情報検索システム130が通信先となっている。
コンテンツ選択結果受付部102は、クライアント端末100からコンテンツ選択結果を含んだリダイレクト用URLを受信する機能、クライアント端末100が選択したコンテンツのリダイレクト先URLをクライアント端末100に対して送信する機能、並びに、クライアント端末100のユーザID、クライアント端末100がコンテンツ選択結果を検索サーバ110へ送信した時刻(タイムスタンプ)、検索クエリ、クライアント端末100が選択したコンテンツのURL、及びグループIDを含む検索ログをURL特徴別頻度生成部120に対して送信する各機能を有する。
次に、URL特徴別頻度生成部120が有する各機能について詳述する。
URL特徴別頻度生成部120は、検索ログ格納部121、URL特徴別頻度集計部(閲覧頻度集計手段)122、及びURL特徴別頻度格納部(閲覧頻度格納手段)123を含んで構成されている。
検索ログ格納部121は、コンテンツ選択結果受付部102から検索ログを受信する機能、及び受信した検索ログを格納し、所定期間蓄積する機能を有する。
検索ログ格納部121が格納している情報の例を図8に示す。図8に示すように、検索ログ格納部121が格納する情報は、情報検索システム130を利用しているユーザを一意に識別可能である「ユーザID」、クライアント端末100がコンテンツ選択結果を送信した日時である「タイムスタンプ」、「検索クエリ」、クライアント端末100によって選択されたコンテンツを表示するURLである「リダイレクト先URL」、及びリダイレクト先URLに関連付けられた「グループID」を含んで構成される。
URL特徴別頻度集計部122は、検索ログ格納部121に蓄積された検索ログを参照することによって、URL特徴別に閲覧頻度を集計する機能を有する。
具体的には、URL特徴別頻度集計部122は、一定期間毎に、検索ログ格納部121に蓄えられた検索ログを集計し、リダイレクト先URLについて、URL特徴別頻度を計算する。
URL特徴別頻度集計部122は、URL特徴のそれぞれを単位として、検索ログ内に出現する回数、及び人数(ユニークなユーザIDの種類)を集計し、URL特徴別頻度格納部123に出力する。
更に具体的には、まず、URL特徴別頻度集計部122は、検索ログ格納部121に格納されている「リダイレクト先URL」から除去後URL、ホスト名、及び、ホストパス1、ホストパス2・・・ホストパスNを派生させる。ここで、派生の方法は、変数部除去部114及びスコア算出部115と同様の方法である。
例えば、「リダイレクト先URL」が“http://aaa.com/aaa.cgi?a1=1&a2=2”である場合、URL全体に加え、除去後URLとして“http://aaa.com/aaa.cgi”、ホスト名として“aaa.com”を派生させる。
次に、検索ログ格納部121のレコードに対してグループID、リダイレクト先URL(URLの全体)、リダイレクト先URLから派生させた除去後URL、ホスト名、ホストパス1、ホストパス2・・・ホストパスNのそれぞれについて出現する回数、及び人数を集計し、図4に例示するグループID毎の閲覧頻度、図7に例示するURL毎の閲覧頻度、図7に例示する除去後URL毎の閲覧頻度、図6に例示するホストパス1〜ホストパスN毎の閲覧頻度を算出する。
URL特徴別頻度集計部122は、所定の時間間隔で検索ログ格納部121に格納されている検索ログを上記方法により集計し、集計した閲覧回数でURL特徴別頻度格納部123に格納されている情報を更新する。
この際、URL特徴別頻度集計部122は、検索ログのうち「ユーザID」が同一、且つ、グループID或いはURLが同一であるログを一件に集約することによってコンテンツを閲覧した人数を集計して、URL特徴別頻度格納部123の「人数」を更新する。
URL特徴別頻度格納部123は、URL特徴別頻度集計部122の集計結果を格納する機能を有する。
図4〜7に、URL特徴別頻度格納部123が保持する情報の例を示す。図4〜7に示すように、URL特徴別頻度格納部123は、URL特徴毎の閲覧頻度及び人数を格納する。
次に、図9を用いて本実施形態の情報検索システム1及びクライアント端末100における処理の流れについて説明する。
クライアント端末100は、検索クエリを検索サーバ110へ送信することで、検索要求を行う(ステップS101)。
検索サーバ110の検索クエリ受付部112は、クライアント端末100から検索クエリを受信し、受信した検索クエリを適合度算出部113に対して出力する(ステップS102)。
適合度算出部113は、コンテンツ特徴格納部111を検索することにより、検索クエリの文字列を含むコンテンツのリストを得て、検索クエリの文字列とコンテンツとの適合度を算出する(ステップS103:適合度算出ステップ)。
変数部除去部114は、適合度算出部113が検索したコンテンツを表示するURL中に「?」、「;」、「*」等の変数部の開始を示す文字が含まれているか否かを判断し、含まれていると判断した場合に、該文字以降の文字をURLから除去することにより除去後URLとする。変数部除去部114は、適合度算出部113が検索したコンテンツを表示するURL中に「?」、「;」、「*」等の変数部の開始を示す文字が含まれていないと判断した場合に、該URLを除去後URLとする(ステップS104:除去ステップ)。
スコア算出部115は、URL特徴別頻度格納部123を参照することにより、URL特徴別頻度を得る。スコア算出部115は、該得たURL特徴別頻度、及び適合度に基づいてコンテンツ毎のスコアを算出する(ステップS105:スコア算出ステップ)。
検索結果提示部116は、適合度算出部113が検索したコンテンツのリストを、スコア算出部115が算出したスコアの順にクライアント端末100に対して提示する(ステップS106:検索結果提示ステップ)。
クライアント端末100は、検索サーバ110によって提示されたコンテンツの中から閲覧するコンテンツを選択し、コンテンツ選択結果を検索サーバ110に対して送信する(ステップS107)。
コンテンツ選択結果受付部102は、クライアント端末100からコンテンツ選択結果を受信する(ステップS108)。
コンテンツ選択結果受付部102は、クライアント端末100が選択したコンテンツのリダイレクト先URLをクライアント端末100に対して送信する(ステップS109)。
クライアント端末100は、Webサーバに対して、選択したコンテンツの送信を要求する(ステップS110)。
コンテンツ選択結果受付部102は、コンテンツ選択結果をURL特徴別頻度生成部120に対して送信する(ステップS111)。
URL特徴別頻度生成部120の検索ログ格納部121は、コンテンツ選択結果受付部102からコンテンツ選択結果を受信すると、受信したコンテンツ選択結果を格納し、検索ログとして所定期間蓄積する(ステップS112)。
URL特徴別頻度集計部122は、検索ログ格納部121に蓄積された検索ログを参照することによって、URL特徴別頻度を集計する(ステップS113:閲覧頻度集計ステップ)。
URL特徴別頻度格納部123は、URL特徴別頻度集計部122の集計結果を格納する(ステップS114:閲覧頻度格納ステップ)。
次に、本実施形態の情報検索システム130の作用及び効果について説明する。
本発明の情報検索システムの変数部除去部114は、URLから変数部を除去することで除去後URLとし、スコア算出部115は、除去後URLと、除去後URLの一部とを含んだURL群の閲覧回数、及び適合度算出部113が算出した適合度に基づいてスコアを算出し、検索結果提示部116は、スコア算出部115が算出したスコアに応じた順番でコンテンツをクライアント端末100に対して提示している。
その為、内容が同様であるコンテンツを表示するURLが複数に分散している場合であっても、それらを同一のURLとするために閲覧回数を分散することを防ぐこととなる。また、除去後URLと、除去後URLの一部とを含んだURL群の閲覧頻度に基づいて閲覧頻度を得ることとなる。その為、コンテンツが新規に追加された場合、及び内容が同様であるコンテンツを表示するURLが複数に分散している場合等、URL自体への閲覧頻度が小さい場合であっても、同一或いは類似するコンテンツへの閲覧頻度が大きい、価値の高いコンテンツをより高いスコアとすることが可能となる。
変数部除去部114は、URL中に所定の文字が含まれているか否かを判断し、該文字が含まれていると判断した場合に、URLから該文字以降の文字を除くことにより除去後URLとしている。所定の文字を例えば「?」、「;」或いは「*」とすることにより、変数部を除去することが可能となる。
スコア算出部115は、URLが表示するコンテンツの内容に従って該URLに関連付けられているグループIDが同一であるコンテンツに関する閲覧頻度に基づいてスコアを算出している。
例えば、「http://aaa.com/news」と「http://aaa.com/game」との例のように、ドメイン名が同じであってもコンテンツの内容(ニュースとゲームと)が大きく異なる場合がある。逆にドメイン名が異なっていてもコンテンツの内容は類似している場合もある。このような場合に、内容が類似しているコンテンツを表示するURL群の閲覧頻度を考慮することによって、価値の高いコンテンツをより高いスコアとすることが可能となる。
URL特徴別頻度生成部120は、クライアント端末100が検索結果提示部116によって提示されたコンテンツの中から選択することによってコンテンツを閲覧した履歴に基づいて閲覧頻度を集計しているため、煩雑な処理をすることなく、閲覧履歴を得る事が可能となる。
[第1の変形例]
上述した実施形態では、URL特徴別頻度集計部122は、URL特徴別頻度Sを集計する際に、曜日及び時間帯は区別せずに集計していたが、曜日あるいは時間帯毎に分離して頻度を集計することとしても良い。
この場合、URL特徴別頻度格納部123は、URL特徴別頻度集計部122が所定の時間間隔で集計したURL特徴別頻度及び人数を曜日毎、及び時間帯毎に保持する。
スコア算出部115は、クライアント端末100が検索要求を送信した曜日あるいは時間帯に応じて、対応するURL特徴別頻度を参照し、コンテンツ毎のスコアを計算する。
本変形例においては、スコア算出部115は、クライアント端末100が検索要求を送信した曜日及び時間帯の一方或いは両方に応じた閲覧頻度に基づいてスコアを算出している。このため、同一の検索単語(検索クエリ)を用いて入手することが望まれるコンテンツの内容が曜日或いは時間帯によって異なる傾向があっても、その傾向を考慮して、価値の高いコンテンツをより高いスコアとすることが可能となる。
[第2の変形例]
上述した実施形態では、検索ログ格納部121は、クライアント端末100が送信したコンテンツ選択結果から閲覧要求を記録していたが、検索サーバを介さない閲覧要求も含めた閲覧履歴情報を記録することとしても良い。
検索サーバを介さない閲覧要求は、例えば、プロキシサーバで記録される閲覧履歴から、あるいはクライアント端末100に蓄積された閲覧履歴から取得することが可能である。
これにより、検索サーバを介した閲覧要求が少ないコンテンツであっても、検索サーバを介さない閲覧要求が多い人気コンテンツであれば、検索結果のより上位に表示することが可能となり、ユーザの入手したい情報を高い精度で提示できるという作用及び効果がある。
100…クライアント端末、101…Webサーバ、102…コンテンツ選択結果受付部、110…検索サーバ、111…コンテンツ特徴格納部、112…検索クエリ受付部、113…適合度算出部、114…変数部除去部、115…スコア算出部、116…検索結果提示部、120…URL特徴別頻度生成部、121…検索ログ格納部、122…URL特徴別頻度集計部、123…URL特徴別頻度格納部、130…情報検索システム、N…ネットワーク。

Claims (7)

  1. 検索に用いる文字列を含んだ検索要求を検索要求元装置から受信し、該受信した検索要求に応じてコンテンツを検索し、該検索したコンテンツのリストを前記検索要求元装置に対して提示する情報検索部と、前記情報検索部に対してコンテンツの閲覧頻度に関する情報を提供する閲覧頻度提供部と、を含んで構成される情報検索システムであって、
    前記閲覧頻度提供部は、
    前記コンテンツが閲覧された履歴に基づいて、前記コンテンツに関する閲覧要求に含まれるURLが有するURL特徴に対応する閲覧頻度であるURL特徴別頻度を集計する閲覧頻度集計手段と、
    前記閲覧頻度集計手段が集計した前記URL特徴別頻度を格納する閲覧頻度格納手段と、を備え、
    前記情報検索部は、
    コンテンツに対応するURL情報と、当該コンテンツの特徴情報とを予め対応づけて格納しているコンテンツ特徴格納手段と、
    前記文字列と、前記コンテンツ特徴格納手段に特徴情報が格納されているコンテンツとの適合度を算出する適合度算出手段と、
    前記適合度算出手段によって適合度が算出されたコンテンツと関連付けられて前記コンテンツ特徴格納手段に格納されているURL情報から変数部を除去することで除去後URLとする除去手段と、
    前記除去後URLと、該除去後URLの一部とを含むURL群、及び内容が互いに類似している前記コンテンツを表示する関連URL群のそれぞれの前記URL特徴に対応する前記URL特徴別頻度を、前記閲覧頻度格納手段に格納されている前記URL特徴別頻度を参照することにより取得し、前記URL群及び前記関連URL群のそれぞれの前記URL特徴別頻度、及び、前記適合度算出手段が算出した適合度に基づいて前記コンテンツに対応するスコアを算出するスコア算出手段と、
    前記コンテンツのリストを、前記スコア算出手段が算出したスコアに応じた順番で前記検索要求元装置に対して提示する検索結果提示手段と、を備え、
    前記関連URL群は、前記コンテンツの内容にしたがって複数の前記コンテンツ毎に付与されているグループIDによって分類されたURL群であり、
    前記URL特徴は、前記除去後URL及び前記除去後URLの一部であり、
    前記URL特徴別頻度は、
    前記URL特徴が前記グループIDによって分類されている場合、前記グループIDが同一である全ての前記コンテンツを複数のユーザが閲覧した履歴に基づく閲覧頻度の合計であり、
    前記URL特徴が前記除去後URLであった場合、前記除去後URLが同一である全ての前記コンテンツに対応する閲覧頻度の合計であり、
    前記URL特徴が前記除去後URLの一部であった場合、前記除去後URLの一部が同一である全ての前記コンテンツに対応する閲覧頻度の合計である情報検索システム。
  2. 前記除去手段は、前記URL情報中に所定の文字が含まれているか否かを判断し、該文字が含まれていると判断した場合に、該URL情報から該文字以降の文字を除くことにより前記除去後URLとする、請求項1に記載の情報検索システム。
  3. 前記閲覧頻度格納手段は、更に、前記グループIDが同一であるコンテンツに関する閲覧頻度を、該グループIDと関連づけて格納している、請求項1又は2に記載の情報検索システム。
  4. 前記閲覧頻度格納手段は、閲覧頻度を曜日及び時間帯の一方或いは両方毎に格納しており、
    前記スコア算出手段は、前記検索要求元装置が前記検索要求を送信した曜日及び時間帯の一方或いは両方に対応して前記閲覧頻度格納手段に格納されている閲覧頻度に基づいて、前記スコアを算出する、請求項1〜3の何れか1項に記載の情報検索システム。
  5. 閲覧頻度集計手段は、前記検索要求元装置が前記検索結果提示手段によって提示されたコンテンツリストの中から閲覧するコンテンツを選択することによって該コンテンツを閲覧した履歴に基づいて前記閲覧頻度を集計する請求項1〜4の何れか1項に記載の情報検索システム。
  6. 検索に用いる文字列を含んだ検索要求を検索要求元装置から受信し、該受信した検索要求に応じてコンテンツを検索し、該検索したコンテンツのリストを前記検索要求元装置に対して提示する、コンテンツに対応するURL情報と当該コンテンツの特徴情報とを予め対応づけて格納しているコンテンツ特徴格納手段を含んで備える情報検索部と、前記情報検索部に対してコンテンツの閲覧頻度に関する情報を提供する閲覧頻度提供部と、を含んで構成される情報検索システムにおいて実行される情報検索方法であって、
    前記閲覧頻度提供部が、
    前記コンテンツが閲覧された履歴に基づいて、前記コンテンツに関する閲覧要求に含まれるURLが有するURL特徴に対応する閲覧頻度であるURL特徴別頻度を集計する閲覧頻度集計ステップと、
    閲覧頻度格納手段に前記閲覧頻度集計ステップにおいて集計された前記URL特徴別頻度を格納する閲覧頻度格納ステップと、
    前記情報検索部が、
    前記文字列と、前記コンテンツ特徴格納手段に特徴情報が格納されているコンテンツとの適合度を算出する適合度算出ステップと、
    前記適合度算出ステップにおいて適合度が算出されたコンテンツと関連づけられて前記コンテンツ特徴格納手段に格納されているURL情報から変数部を除去することで除去後URLとする除去ステップと、
    前記除去後URLと、該除去後URLの一部とを含むURL群、及び内容が互いに類似しているコンテンツを表示する関連URL群のそれぞれの前記URL特徴に対応する前記URL特徴別頻度を前記閲覧頻度格納手段に格納されている前記URL特徴別頻度を参照することにより取得し、前記URL群及び前記関連URL群のそれぞれの前記URL特徴別頻度、及び、前記適合度算出ステップにおいて算出された適合度に基づいて前記コンテンツに対応するスコアを算出するスコア算出ステップと、
    前記コンテンツのリストを、前記スコア算出ステップにおいて算出されたスコアに応じた順番で前記検索要求元装置に対して提示する検索結果提示ステップと、を備え、
    前記関連URL群は、前記コンテンツの内容にしたがって複数の前記コンテンツ毎に付与されているグループIDによって分類されたURL群であり、
    前記URL特徴は、前記除去後URL及び前記除去後URLの一部であり、
    前記URL特徴別頻度は、
    前記URL特徴が前記グループIDによって分類されている場合、前記グループIDが同一である全ての前記コンテンツを複数のユーザが閲覧した履歴に基づく閲覧頻度の合計であり、
    前記URL特徴が前記除去後URLであった場合、前記除去後URLが同一である全ての前記コンテンツに対応する閲覧頻度の合計であり、
    前記URL特徴が前記除去後URLの一部であった場合、前記除去後URLの一部が同一である全ての前記コンテンツに対応する閲覧頻度の合計である情報検索方法。
  7. 前記閲覧頻度格納手段は、閲覧頻度を曜日及び時間帯の一方或いは両方毎に格納しており、
    前記スコア算出ステップにおいて、前記情報検索部は、前記検索要求元装置が前記検索要求を送信した曜日及び時間帯の一方或いは両方に対応して前記閲覧頻度格納手段に格納されている閲覧頻度に基づいて、前記スコアを算出する請求項6に記載の情報検索方法。
JP2009217647A 2009-09-18 2009-09-18 情報検索システム及び情報検索方法 Expired - Fee Related JP5075895B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009217647A JP5075895B2 (ja) 2009-09-18 2009-09-18 情報検索システム及び情報検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009217647A JP5075895B2 (ja) 2009-09-18 2009-09-18 情報検索システム及び情報検索方法

Publications (2)

Publication Number Publication Date
JP2011065570A JP2011065570A (ja) 2011-03-31
JP5075895B2 true JP5075895B2 (ja) 2012-11-21

Family

ID=43951717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009217647A Expired - Fee Related JP5075895B2 (ja) 2009-09-18 2009-09-18 情報検索システム及び情報検索方法

Country Status (1)

Country Link
JP (1) JP5075895B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200043479A1 (en) * 2018-08-02 2020-02-06 Soundhound, Inc. Visually presenting information relevant to a natural language conversation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
JP2003281143A (ja) * 2002-03-22 2003-10-03 Ricoh Co Ltd 複数リスト表示システム及び該システムのプログラム
JP2006302265A (ja) * 2005-03-22 2006-11-02 Netstar Inc フィルタリング方法、クライアントシステム、その制御方法及びプログラム、フィルタリングシステム、サーバシステム、その制御方法及びプログラム
JP4991379B2 (ja) * 2007-04-23 2012-08-01 エヌ・ティ・ティ レゾナント株式会社 情報検索装置、情報検索方法、情報検索プログラム、及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2011065570A (ja) 2011-03-31

Similar Documents

Publication Publication Date Title
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
US20090006388A1 (en) Search result ranking
US8484343B2 (en) Online ranking metric
US8346753B2 (en) System and method for searching for internet-accessible content
US9443022B2 (en) Method, system, and graphical user interface for providing personalized recommendations of popular search queries
US9367591B2 (en) Client system and server
JP5673336B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
JP2004206517A (ja) ホットキーワード提示方法及びホットサイト提示方法
TW201101069A (en) Subject-based vitality
JP2013037624A (ja) 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
Schonfeld et al. Sitemaps: above and beyond the crawl of duty
US9183299B2 (en) Search engine for ranking a set of pages returned as search results from a search query
JP4369104B2 (ja) コミュニティ形成支援システム、その端末、サーバ及びプログラム
JP5290041B2 (ja) 情報検索装置及び情報検索方法
US8332415B1 (en) Determining spam in information collected by a source
US20080288439A1 (en) Combined personal and community lists
JP4839295B2 (ja) クエリ抽出方法、クエリ抽出装置およびクエリ抽出プログラム
JP5075895B2 (ja) 情報検索システム及び情報検索方法
JP2009252180A (ja) 電子掲示板システム
JP5208229B2 (ja) 検索サジェスト装置及び方法
JP5063728B2 (ja) 複数サーバ検索装置及び方法
US20130151549A1 (en) Method and Apparatus for Updating a Database of Online Content
JP5199952B2 (ja) 情報利用履歴共有方法、情報利用履歴共有装置、情報利用履歴共有プログラムおよび同プログラムを記録した記録媒体
JP4934154B2 (ja) コンテンツ提供装置
JP5519406B2 (ja) サーバ装置、ジャンルスコア算出方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120821

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120827

R150 Certificate of patent or registration of utility model

Ref document number: 5075895

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees