JP2011170666A - 検索装置 - Google Patents

検索装置 Download PDF

Info

Publication number
JP2011170666A
JP2011170666A JP2010034566A JP2010034566A JP2011170666A JP 2011170666 A JP2011170666 A JP 2011170666A JP 2010034566 A JP2010034566 A JP 2010034566A JP 2010034566 A JP2010034566 A JP 2010034566A JP 2011170666 A JP2011170666 A JP 2011170666A
Authority
JP
Japan
Prior art keywords
search
content
score
group
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010034566A
Other languages
English (en)
Other versions
JP5488031B2 (ja
Inventor
Shizuho Kuwako
静帆 桑子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010034566A priority Critical patent/JP5488031B2/ja
Publication of JP2011170666A publication Critical patent/JP2011170666A/ja
Application granted granted Critical
Publication of JP5488031B2 publication Critical patent/JP5488031B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のグルーピングを考慮したランキング付けが行えない。
【解決手段】この検索装置100は、履歴記憶手段110と検索手段120とを有する。履歴記憶手段110は、複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する。検索手段120は、ユーザの検索要求を入力してコンテンツを検索し、検索したコンテンツごとに、検索要求を行ったユーザが属する複数グループの当該コンテンツに関するクリック回数を考慮してスコアを算出し、算出したスコアでランキング付けした検索結果を出力する。
【選択図】図1

Description

本発明は、検索結果をランキング付けする機能を有する検索装置に関する。
ユーザから入力された検索条件に合致するコンテンツを検索する検索装置において、検索結果の一覧を表示する際の表示ランキング手法は各種提案ないし実用化されている。その内の一つに、多くのユーザに何度も閲覧されているコンテンツを上位にランキングする手法がある。以下、この手法をクリックフィードバック手法と呼ぶ。
クリックフィードバック手法を用いた検索装置の一例が特許文献1に記載されている。特許文献1に記載された検索装置は、各コンテンツごとの過去の閲覧履歴を記憶する閲覧情報蓄積部を備えている。具体的には、閲覧情報蓄積部には、各コンテンツごとに閲覧回数とバースト度(前日の閲覧数からの増減率)、およびこれらから導出されたトラフィックランクが記憶されている。そして、この検索装置は、ユーザからの検索条件に合致するコンテンツを検索した際、そのコンテンツのトラフィックランクの大小に応じて検索結果をソートして出力する。
他方、特許文献2には、検索結果のソート順をユーザが属するグループごとに変更する検索装置が記載されている。具体的には、検索されたコンテンツが、例えば、製品aに関する事例情報に分類される文書データである場合、検索したユーザが開発部門に属し、開発部門と製品aとの関連度が100、開発部門と事例情報との関連度が0.7として事前に設定されているとき、この文書データのスコアを100×0.7=70とする。他のコンテンツについても同様の方法でスコアを計算し、スコアの順に検索結果をソートしてユーザに提示する。
特開2009−48380号公報 特開2009−93588号公報
特許文献1に記載の検索装置では、ユーザの属性を考慮していないために、検索要求を行ったユーザとは属性が相違する他のユーザに多く閲覧されているコンテンツが上位にランキングされる可能性がある。他方、特許文献2では、検索要求を行ったユーザが属する部門に応じて検索結果のソート順を変更することにより、ユーザの属性を考慮したランキング付けが可能になる。しかし、部門の特色を考慮したランキング付けを行っても、その部門に属するユーザごとに検索結果に期待する情報に差がある場合がある。例えば、同じ開発部門に属するユーザでも、役職が担当と部長とでは、検索結果に期待する情報に差がある場合が多い。その理由は、役職によってその業務が大きく変わってくると考えられるためである。
一般にユーザは複数の属性を持つ。例えば企業に勤務するユーザは、部門、役職などの複数の属性を持つ。従って、グルーピング単位は1つだけではなく、ユーザの属性により複数のグルーピングが可能である場合が多い。しかるに上述した特許文献1および特許文献2に記載の検索装置では、複数のグルーピングを考慮したランキング付けが行えない。このため、ユーザが複数のグルーピングによって分けられている場合に、各グルーピングのグループの求める検索結果に特色があったとしても、それらの特色を総合的に考慮したランキング付けが行えない。
本発明の目的は、上述した課題、すなわち複数のグルーピングを考慮したランキング付けが行えない、という課題を解決する検索装置を提供することにある。
本発明の一形態にかかる検索装置は、複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する履歴記憶手段と、ユーザの検索要求を入力してコンテンツを検索し、該検索したコンテンツごとに、上記検索要求を行ったユーザが属する複数グループの当該コンテンツに関する上記クリック回数を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する検索手段とを備える。
本発明は上述したような構成を有するため、ユーザの有する複数の属性に基づく複数のグルーピングを考慮したランキング付けが可能になる。
本発明の第1の実施形態のブロック図である。 本発明の第2の実施形態のブロック図である。 部門単位のグルーピングのクリック履歴情報の構成例を示す図である。 役職単位のグルーピングのクリック履歴情報の構成例を示す図である。 コンテンツクリック比率の計算結果の例を示す図である。 グループの検索活用度の計算結果の例を示す図である。 グルーピングの標準偏差の計算結果の例を示す図である。 グルーピングの重みの計算結果の例を示す図である。 グループの補正スコアの計算結果の例を示す図である。 仮スコアの計算結果の例を示す図である。 最終スコアの計算結果を示す図である。
次に本発明の実施の形態について図面を参照して詳細に説明する。
[第1の実施形態]
図1を参照すると、本発明の第1の実施形態にかかる検索装置100は、一般的にはサーバ装置から構成され、ユーザから入力される検索条件に合致するコンテンツを検索し、検索結果をランキング付けしてユーザに返却する機能を有している。この検索装置100は、履歴記憶手段110と、検索手段120と、履歴更新手段130とを備えている。
履歴記憶手段110は、複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する機能を有する。クリック回数は、閲覧回数と同じ意味である。ユーザの属性の例としては、部門、役職、年齢層、性別、地域別などがある。グルーピングの数は2以上であれば任意でよい。
検索手段120は、ユーザの検索要求を入力してコンテンツを検索する機能と、検索したコンテンツごとに、検索要求を行ったユーザが属する複数グループの当該コンテンツに関するクリック回数を履歴記憶手段110から取得してスコアを算出する機能と、算出したスコアでランキング付けした検索結果を出力する機能とを有する。
検索手段120が検索の対象とするコンテンツ或いはそのインデックスは、検索装置100内の記憶装置あるいは検索装置100からアクセス可能な外部の記憶装置に記憶されている。検索装置100が企業内検索(Enterprise Search)を行う装置である場合、検索の対象となるコンテンツは、データベース内のデータ、ファイルサーバ内のデータや、業務アプリケーションなど、様々な形態の構造データ、非構造データが含まれる。また検索装置100がインターネット検索を行う装置である場合、検索の対象となるコンテンツは、ウェブサイトのページなどが含まれる。
検索手段120は、検索したコンテンツのスコアを算出する際、検索要求を行ったユーザが属する各グルーピングのグループごとのコンテンツクリック比率を算出し、この算出したコンテンツクリック比率を考慮してスコアを算出するように構成されていてよい。或るコンテンツに関する或るグルーピングのグループのコンテンツクリック比率は、そのコンテンツに関するそのグルーピングの全グループの一ユーザ当たりの平均クリック回数に対する当該グループの一ユーザ当たりの平均クリック回数の比率で与えられる。
また検索手段120は、検索したコンテンツのスコアを算出する際、検索要求を行ったユーザが属する各グループの検索活用度を算出し、この算出した各グループの検索活用度を考慮してスコアを算出するように構成されていてよい。或るグループの検索活用度は、そのグループが属するグルーピングの全コンテンツのクリック回数に対する当該グループの全コンテンツのクリック回数の比率で与えられる。
また検索手段120は、検索したコンテンツのスコアを算出する際、同一グルーピング内の各グループのクリック回数のばらつきの程度から各グルーピングの重みを算出し、この算出した各グルーピングの重みを考慮して、つまり、ばらつきの程度が大きいほど、より重みを大きくして、スコアを算出するように構成されていてよい。
また検索手段120は、上記のコンテンツクリック比率、グループの検索活用度、および各グルーピングの重みのうちの2つ或いは全てを考慮してスコアを算出するように構成されていてよい。
また検索手段120は、上記のコンテンツクリック比率、グループの検索活用度、および各グルーピングの重みのうちの1つ或いは2つ或いは全てを用いて、検索要求を行ったユーザが属するグループごとの補正スコアを算出し、この算出した補正スコアを考慮してスコアを算出するように構成されていてよい。
また検索手段120は、検索したコンテンツに対して仮スコアを付与し、この付与した仮スコアと上記補正スコアとからスコアを算出するように構成されていてよい。仮スコアは、汎用的なスコアリングエンジンなどを利用して算出することができる。また、全コンテンツに対して同じスコアを仮スコアとして付与しておいてもよい。
また検索手段120は、上記算出したスコアで検索結果をソートし、出力するように構成されていてよい。
履歴更新手段130は、ユーザによるコンテンツの閲覧時、履歴記憶手段110に記録された当該コンテンツに関する当該ユーザの属するグループごとのクリック回数を更新する機能を有する。例えば、履歴更新手段130は、ユーザが検索結果中の或るコンテンツをクリックして閲覧を要求すると、要求されたコンテンツをユーザに送信するとともに、そのユーザの属性からそのユーザが属する全てのグループを判定し、履歴記憶手段110に記憶された当該コンテンツに関する当該各グループごとのクリック回数を1だけ加算するように構成されていてよい。
次に本実施形態の動作を説明する。
ユーザから図示しないクライアント端末などの端末を通じて、検索キーワードなどの検索条件を指定した検索要求が入力されると、検索装置100の検索手段120は、検索条件に合致するコンテンツを検索する。
次に検索手段120は、検索したコンテンツごとに、検索要求を行ったユーザが属する複数グループの当該コンテンツに関するクリック回数を考慮してスコアを算出する。
次に検索手段120は、上記算出したスコアで検索結果をソートし、検索要求を行ったユーザの端末へ送信する。これにより、検索要求を行ったユーザの端末の画面に、そのユーザの有する複数の属性に基づく複数のグルーピングを考慮してランキング付けされた検索結果が表示される。
その後にユーザが、検索結果中の何れかのコンテンツを閲覧すると、履歴更新手段130は、履歴記憶手段110に記録された当該コンテンツに関する当該ユーザの属するグループごとのクリック回数を更新する。
このように本実施形態によれば、ユーザの有する複数の属性に基づく複数のグルーピングを考慮したランキング付けが可能になる。その理由は、複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する履歴記憶手段110と、ユーザの検索要求を入力してコンテンツを検索し、検索したコンテンツごとに、検索要求を行ったユーザが属する複数グループの当該コンテンツに関するクリック回数を考慮してスコアを算出し、この算出したスコアでランキング付けした検索結果を出力する検索手段120とを備えているためである。
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。
図2を参照すると、本発明の第2の実施形態は、検索キーワードからコンテンツ検索結果を作成する検索サーバ1と、検索要求などを送受信する検索者端末2と、実際にコンテンツが格納されている1以上のコンテンツ保存サーバ3と、これらを通信可能に接続するネットワーク4とから構成されている。
検索サーバ1は、クライアント要求受付/返却部11、クリックフィードバック情報受付部12、仮スコア決定部13、クリックスコア計算部14、データベース15を備えている。また、データベース15は、グルーピングごとのクリック履歴情報16と、人物詳細情報部17とを含む。図1との関係では、データベース15が履歴記憶手段110に相当し、クライアント要求受付/返却部11、仮スコア決定部13、およびクリックスコア計算部14が検索手段120に相当し、クリックフィードバック情報受付部12が履歴更新手段130に相当する。
[概要]
検索時には、検索者(ユーザ)は検索者端末2から検索キーワードおよびユーザ識別子を含む検索要求を、検索サーバ1のクライアント要求受付/返却処理部11に送信する。クライアント要求受付/返却処理部11は、受信した検索要求を仮スコア決定部13に渡す。
仮スコア決定部13は、検索要求に含まれる検索キーワードに合致するコンテンツを検索し、仮ランキングのスコアを計算する。仮スコア決定部13は汎用的なスコアリングエンジンが利用でき、仮ランキング決定に必要な情報は既に検索サーバ1に格納されているものとする。仮スコア決定部13は、検索要求に含まれるユーザ識別子と、計算した仮ランキングのスコアとをクリックスコア計算部14へ渡す。
クリックスコア計算部14は、人物詳細情報部17から検索者の所属するグループ情報を取得する。人物詳細情報部17には、例えば、ユーザ識別子に対応して、そのユーザ識別子を持つユーザが所属するグループの識別子が記憶されている。クリックスコア計算部14は、ユーザ識別子をキーに人物詳細情報部17を検索することにより、検索者の所属するグループの識別子を取得する。次に、クリックスコア計算部14は、検索者の属するグループのクリック履歴情報から、検索結果中の各コンテンツのクリック回数情報を取得する。クリック履歴情報16は、例えば各グルーピングごとに設けられている。或るグルーピングに対応するクリック履歴情報16には、そのグルーピングに属する全てのグループごとに、各コンテンツのクリック回数情報が記録されている。
次に、クリックスコア計算部14は、上記取得したクリック回数情報を元に検索者の属性を考慮したスコアを再計算する(詳細な計算方法については後述する)。そして、クリックスコア計算部14は、再計算したスコアで検索結果をソートしてクライアント要求受付/返却処理部11へ渡す。クライアント要求受付/返却処理部11は、受け取った検索結果を検索者端末2へ送信(返却)する。
検索結果を受け取った検索者端末2は、検索結果を画面表示する。検索者が検索結果の中から閲覧したいコンテンツを選択(クリック)すると、コンテンツ保存サーバ3に保存されているコンテンツを閲覧することができる。その際、検索者端末2は、クリックフィードバック情報受付部12に対して、クリックしたコンテンツの識別子とユーザ識別子を含むクリックフィードバック情報を送信する。
クリックフィードバック情報受付部12は、まず、受信したクリックフィードバック情報に含まれるユーザ識別子をキーに人物詳細情報部17を検索して、検索者(閲覧者)の所属するグループの識別子を取得する。次にクリックフィードバック情報受付部12は、取得したグループ識別子で特定されるグルーピングのクリック履歴情報16を選択し、この選択したクリック履歴情報16中の当該グループに記録されている当該閲覧コンテンツ(上記コンテンツ識別子で特定されるコンテンツ)のクリック回数を加算する。この操作を上記取得したグループ識別子の全てについて繰り返す。
次に、図2〜図11を参照しながら、本実施形態をより詳細に説明する。
上述したように、図1の検索者端末2の検索者が検索を実行し、クライアント要求受付/返却部11に検索キーワードを送信すると、クライアント要求受付/返却処理部11は仮スコア決定部13に情報を渡し、仮スコア決定部13は仮ランキングのスコアを計算する。続いて、仮スコア決定部13は、計算した仮ランキングのスコアをクリックスコア計算部14へ渡す。このクリックスコア計算部14での処理の詳細を次に説明する。
クリックスコア計算部14は、コンテンツごとの最終的なスコアを、計算式5に示すように、仮スコアにグループ固有の補正スコアを加えることで算出する。計算式5で仮スコアに加えるグループ固有の補正スコアの算出は、計算式1〜4を用いて行う。1つのコンテンツの最終的なスコアは、以下の手順で計算される。
まず、クリックスコア計算部14は、図1のデータベース15の人物詳細情報部17から、検索者の属性するグループの情報を得る。次に、検索者の属するグループのクリック履歴情報16から、該当コンテンツのクリック回数を得る。次に、計算式1〜4で補正スコアを求める。
まず、計算式1を用いて、検索者の属するグループごとに、そのグループのコンテンツクリック比率を算出する。計算式1で計算されるグループのコンテンツクリック比率は、グループの人数比率と全グループのコンテンツクリック数とから、予想されるクリック数であれば1、多ければ1以上、少なければ1以下の値をとる。
[数1]
グループのコンテンツクリック比率A
=グループのコンテンツクリック数
÷{全グループのコンテンツクリック数×(グループ人数/全人数)}
次に、計算式2を用いて、検索者の属するグループごとに、グループとそのグループを含むグルーピングそれぞれのコンテンツクリック数を比較し、そのグループの検索活用度を求める。計算式2で計算されるグループの検索活用度は、検索を比較的活用しているグループほど大きな値となる。
[数2]
グループの検索活用度B
=グループの全コンテンツクリック数/グルーピングの全コンテンツクリック数
次に、計算式3(計算式3−1、3−2)を用いて、検索者の属するグループを含むグルーピングごとに、そのグルーピングの重みを求める。グルーピングの重みとは、特定コンテンツに対してグルーピング内の各グループのクリック数のばらつきが大きいとき、そのグルーピングはグループ間の検索特徴が大きいため検索結果により反映すべきという考えの元に、グループの反映度を調整する値である。まず計算式3−1を用いて、特定コンテンツに対する各グループのスコアから標準偏差を求める。次に計算式3−2を用いて、グループの属するグルーピングの標準偏差を、最大となったグルーピングの標準偏差で割ったものをグルーピングの重みとする。
[数3−1]
標準偏差σ={(1/n)Σi=1 n (xi-x^)}1/2
ただし、nはグルーピングに含まれるグループ数、xiはi番目のグループのコンテンツクリック数、x^は各グループのコンテンツクリック数平均。
[数3−2]
グルーピングの重みC=σ/σMAX
ただし、σはグルーピングの標準偏差、σMAXはグルーピングの標準偏差の最大値。
次に、以上で得られたグループのコンテンツクリック比率Aとグループの活用頻度Bとグルーピングの重みCとにより、計算式4を用いて、複数グルーピングについてのスコアを加算し、グループの補正スコアを算出する。
[数4]
グループの補正スコア=Σn=1 n=M (重みC×コンテンツクリック比率A×検索活用度B)
ただし、Mはグルーピング種類数。
最後に、計算式5を用いて、上記のグループの補正スコアを仮スコアに加え、最終的なコンテンツの最終スコアを算出する。
[数5]
最終スコア=仮スコア+X×グループの補正スコア
ただし、グループの補正スコアに乗じるXは、補正スコア反映定数であり、元の仮スコアの値域にあわせて調整する。例えば、仮スコアの平均値の1割前後とすることができるが、これに限定されるものではない。
クリックスコア計算部14は、以上の計算式を用いて、検索結果で表示されるコンテンツすべてについて検索者の属性を考慮したスコアを再計算する。そして、クリックスコア計算部14は、再計算したスコアで検索結果を昇順にソートし、クライアント要求受付/返却処理部11へ渡す。クライアント要求受付/返却処理部11は、検索者端末2に検索結果を返却する。
図3は、1番目のグルーピングのクリック履歴情報16の構成例である。1番目のグルーピングは、部門単位であり、部門別にコンテンツに対するクリック回数が記録されている。また、各コンテンツごとの全部門合計のクリック回数と、各部門ごとの全コンテンツ合計のクリック回数も記録されている。各部門の人数(ユーザ数)は、営業、開発、人事部門で各200人、全体で600人とする。
図4は、2番目のグルーピングのクリック履歴情報16の構成例である。2番目のグルーピングは、役職単位であり、役職別にコンテンツに対するクリック回数が記録されている。また、各コンテンツごとの全役職合計のクリック回数と、各役職ごとの全コンテンツ合計のクリック回数も記録されている。各役職の人数(ユーザ数)は、担当、主任、課長、マネージャ、部長で各120人、全体で600人とする。
図3および図4に示されるようなクリック履歴情報16が存在するものとして、営業部門の担当である検索者と、同じ営業部門であるが役職が課長の検索者とが検索した際にクリックスコア計算部14で計算されるコンテンツクリック比率Aの計算結果例を図5に、グループの検索活用度Bの計算結果例を図6に、グルーピングの標準偏差の計算結果例を図7に、標準偏差を元に計算されたグルーピングの重みの計算結果例を図8に、グループの補正スコアの計算結果例を図9に、それぞれ示す。なお、検索されたコンテンツは、コンテンツ1、コンテンツ2、コンテンツ3の3つとしている。
また、仮スコア決定部13で決定された仮スコアの例を図10に、仮スコアに補正スコアを加えて計算された最終スコアの計算結果例を図11に示す。図11の最終スコアの計算例では、補正スコア反映定数Xを5.5としている。
図10の仮スコアの例を参照すると、コンテンツ1、コンテンツ2、コンテンツ3の順に仮スコアが高くなっている。本発明を適用しない通常の検索の場合は、この順位をそのまま検索結果として検索者端末2に返却することになる。これに対して本実施形態では、クリックスコア計算部14において、計算式5によりクリックスコア(コンテンツのトレンド性)を反映した最終スコアを計算して、この最終スコア順に検索結果として検索者端末2に返却する。
図11を参照すると、図10の仮スコアではコンテンツ1、コンテンツ2、コンテンツ3の順番になっているのに対して、営業部門のグルーピングのみで計算した場合、コンテンツ2、コンテンツ1、コンテンツ3の順番にスコアが高くなり、仮スコアの順番と比べて、コンテンツ2を多く参照する営業部門の特徴を生かした順番になっている。このようにグループの特徴をランキングに反映することができる。
さらに、複数グルーピングが存在する場合について、例として挙げた「営業部門の担当」と「営業部門の課長」についての図11の計算例を参照すると、「営業部門の担当」では最終スコアはコンテンツ1、コンテンツ2、コンテンツ3となり、担当に多く参照されるコンテンツ1が上位に表示される。これに対して、「営業部門の課長」の場合、最終スコアはコンテンツ3、コンテンツ2、コンテンツ1の順に高くなり、課長に多く参照されるコンテンツ3が最上位に表示され、営業部門で多く参照されるコンテンツ2はコンテンツ1よりも上位となっている。このように部門のグルーピングと役職のグルーピングの2つのグルーピングの特徴をスコアに反映することができる。
なお、前述したように、検索結果を受け取った検索者が閲覧したいコンテンツを選択(クリック)してコンテンツ保存サーバ3のコンテンツを参照すると、検索者端末2は選択されたコンテンツの識別子とユーザ識別子とを含むクリックフィードバック情報を検索サーバ1のクリックフィードバック情報受付部12に送信する。これにより、データベース15のクリック履歴情報16が更新される。
次に本実施形態の効果を説明する。
第1の効果は、複数のグルーピング単位が存在する場合も、すべてのグループについての過去の検索の特色をコンテンツに重み付けした検索結果が得られることである。その理由は、複数の属性を持つ複数の検索者を各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録するデータベースを備え、検索時には検索者の所属グループ毎に上記クリック回数からスコアに反映する値を算出し、最終スコアを計算しているためである。
第2の効果は、各グルーピングの重要性の重みを自動計算できることである。その理由は、コンテンツ毎に、各グループのクリック数のばらつきからグルーピングの重みを計算することで、自動的に重みが算出できるためである。
第3の効果は、検索自体の使用頻度によりグループの特色をスコアに反映する度合いを調整できることである。その理由は、グループのクリック回数の全体に対する比率から検索自体の使用頻度を求め、この使用頻度を重みとしてグループで算出したスコアに反映してから、最終的なスコアに加算するためである。
第4の効果は、検索者のグループが変化する場合も、検索者の変化前のクリック情報は変化前のグループのクリックフィードバックに使用され、検索実行結果は、その時点で検索者の属するグループに対しての検索結果が得られることである。その理由は、検索実行時点でクリック情報は検索者と切りはなされ、グループ情報として管理されるからである。過去に担当だったときのクリック情報はその人物が主任になった後も担当の検索結果としてフィードバックされる。新たに主任になった人物の検索結果は、主任としてグルーピングされていた人物のクリック情報を元にフィードバックする。
[他の実施形態]
図2では、検索サーバ1にスコア計算部分のクリックスコア計算部14等々と、クリックフィードバックのデータを保持するデータベース15の両方が配置されている。しかし必ずしも両方を同じサーバに配置する必要はない。例えばデータベース15とクリックフィードバック情報受付部12を別サーバ(以降サーバ1)に配置して、サーバ1にクリックフィードバック情報を蓄積する。一方、その他の機能を別サーバ(以降サーバ2)に配置し、サーバ2からクリックスコア計算部14が、サーバ1のデータベース15のクリック履歴情報16にアクセスし、計算元データを取得する構成も可能である。
また、本発明の検索装置は、その有する機能をハードウェア的に実現することは勿論、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリ等のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られ、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における検索装置、検索サーバとして機能させる。
企業内における各サーバに散在している構造データ・非構造データの横断的検索の際のランキングアルゴリズムの用途などに適用できる。
1 検索サーバ
2 検索者端末
3 コンテンツ保存サーバ
4 ネットワーク
11 クライアント要求受付/返却部
12 クリックフィードバック情報受付部
13 仮スコア決定部
14 クリックスコア計算部
15 データベース
16 クリック履歴情報
17 人物詳細情報部
100 検索装置
110 履歴記憶手段
120 検索手段
130 履歴更新手段

Claims (10)

  1. 複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する履歴記憶手段と、
    ユーザの検索要求を入力してコンテンツを検索し、該検索したコンテンツごとに、前記検索要求を行ったユーザが属する複数グループの当該コンテンツに関する前記クリック回数を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する検索手段と
    を備えることを特徴とする検索装置。
  2. 前記検索手段は、前記検索したコンテンツごとに、前記検索要求を行ったユーザが属する各グルーピングのグループごとのコンテンツクリック比率を算出し、該算出したコンテンツクリック比率を考慮して前記スコアを算出する
    ことを特徴とする請求項1に記載の検索装置。
  3. 前記検索手段は、前記検索要求を行ったユーザが属する各グループの検索活用度を算出し、該算出した各グループの検索活用度を考慮して前記スコアを算出する
    ことを特徴とする請求項1または2に記載の検索装置。
  4. 前記検索手段は、前記検索したコンテンツごとに、同一グルーピング内の各グループの前記クリック回数のばらつきの程度から各グルーピングの重みを算出し、該算出した各グルーピングの重みを考慮して前記スコアを算出する
    ことを特徴とする請求項1乃至3の何れか1項に記載の検索装置。
  5. 前記検索手段は、
    前記検索したコンテンツごとに、前記検索要求を行ったユーザが属する各グルーピングのグループごとのコンテンツクリック比率を算出し、
    前記検索要求を行ったユーザが属する各グループの検索活用度を算出し、
    前記検索したコンテンツごとに、同一グルーピング内の各グループの前記クリック回数のばらつきの程度から各グルーピングの重みを算出し、
    前記算出したコンテンツクリック比率、グループの検索活用度、および各グルーピングの重みを考慮して前記スコアを算出する
    ことを特徴とする請求項1に記載の検索装置。
  6. 前記検索手段は、前記算出したコンテンツクリック比率、グループの検索活用度、および各グルーピングの重みを用いて、前記検索要求を行ったユーザが属するグループごとの補正スコアを算出し、該算出した補正スコアを考慮して前記スコアを算出する
    ことを特徴とする請求項5に記載の検索装置。
  7. 前記検索手段は、前記検索したコンテンツに対して仮スコアを付与し、該付与した仮スコアと前記補正スコアとから前記スコアを算出する
    ことを特徴とする請求項6に記載の検索装置。
  8. 前記ユーザによる前記コンテンツの閲覧時、前記履歴記憶手段に記録された当該コンテンツに関する当該ユーザの属するグループごとのクリック回数を更新する履歴更新手段
    を備えることを特徴とする請求項1乃至7の何れか1項に記載の検索装置。
  9. 複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する履歴記憶手段と、検索手段とを備えた検索装置が実行する検索方法であって、
    前記検索手段が、ユーザの検索要求を入力してコンテンツを検索し、前記検索したコンテンツごとに、前記検索要求を行ったユーザが属する複数グループの当該コンテンツに関する前記クリック回数を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する
    ことを特徴とする検索方法。
  10. 複数の属性を持つ複数のユーザを各属性に基づいて複数にグルーピングしたときの各グルーピングのグループごとに、各コンテンツごとのクリック回数の履歴を記録する履歴記憶手段を備えてコンピュータを、
    ユーザの検索要求を入力してコンテンツを検索し、該検索したコンテンツごとに、前記検索要求を行ったユーザが属する複数グループの当該コンテンツに関する前記クリック回数を考慮してスコアを算出し、該算出したスコアでランキング付けした検索結果を出力する検索手段として機能させるためのプログラム。
JP2010034566A 2010-02-19 2010-02-19 検索装置 Expired - Fee Related JP5488031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010034566A JP5488031B2 (ja) 2010-02-19 2010-02-19 検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010034566A JP5488031B2 (ja) 2010-02-19 2010-02-19 検索装置

Publications (2)

Publication Number Publication Date
JP2011170666A true JP2011170666A (ja) 2011-09-01
JP5488031B2 JP5488031B2 (ja) 2014-05-14

Family

ID=44684717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010034566A Expired - Fee Related JP5488031B2 (ja) 2010-02-19 2010-02-19 検索装置

Country Status (1)

Country Link
JP (1) JP5488031B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014038381A1 (ja) * 2012-09-07 2014-03-13 オムロン株式会社 情報処理システム、情報処理方法
JP2014532942A (ja) * 2011-11-04 2014-12-08 グーグル・インコーポレーテッド ソーシャルページのトリガー
JP2018536937A (ja) * 2016-01-04 2018-12-13 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005033600A (ja) * 2003-07-08 2005-02-03 Sony Corp コンテンツ視聴支援システム及びコンテンツ視聴支援方法、並びにコンピュータ・プログラム
JP2009048380A (ja) * 2007-08-17 2009-03-05 Yahoo Japan Corp 検索システム、検索装置、および検索方法
JP2009284325A (ja) * 2008-05-23 2009-12-03 Brother Ind Ltd コンテンツ分散保存システム、コンテンツ保存方法、ノード装置、及びノード処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005033600A (ja) * 2003-07-08 2005-02-03 Sony Corp コンテンツ視聴支援システム及びコンテンツ視聴支援方法、並びにコンピュータ・プログラム
JP2009048380A (ja) * 2007-08-17 2009-03-05 Yahoo Japan Corp 検索システム、検索装置、および検索方法
JP2009284325A (ja) * 2008-05-23 2009-12-03 Brother Ind Ltd コンテンツ分散保存システム、コンテンツ保存方法、ノード装置、及びノード処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014532942A (ja) * 2011-11-04 2014-12-08 グーグル・インコーポレーテッド ソーシャルページのトリガー
WO2014038381A1 (ja) * 2012-09-07 2014-03-13 オムロン株式会社 情報処理システム、情報処理方法
JP2014052895A (ja) * 2012-09-07 2014-03-20 Omron Corp 情報処理システム、情報処理方法
JP2018536937A (ja) * 2016-01-04 2018-12-13 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体

Also Published As

Publication number Publication date
JP5488031B2 (ja) 2014-05-14

Similar Documents

Publication Publication Date Title
US10452668B2 (en) Smart defaults for data visualizations
US9495460B2 (en) Merging search results
JP5328896B2 (ja) ソーシャルネットワークを活用したクエリーの絞込みおよび提案
US7636713B2 (en) Using activation paths to cluster proximity query results
US9009162B1 (en) Method for search disambiguation using hashtags having context data associated therewith
US20110179025A1 (en) Social and contextual searching for enterprise business applications
US20100257171A1 (en) Techniques for categorizing search queries
US10248732B2 (en) Identifying related entities
US20160055252A1 (en) Methods and systems for personalizing aggregated search results
US20110314012A1 (en) Determining query intent
US20100057714A1 (en) Search results ranking method and system
US9245014B2 (en) Clustering of feedback reports
US20110041075A1 (en) Separating reputation of users in different roles
US20110307504A1 (en) Combining attribute refinements and textual queries
JP2002215659A (ja) 情報検索支援方法および情報検索支援システム
US9336330B2 (en) Associating entities based on resource associations
US8825698B1 (en) Showing prominent users for information retrieval requests
JP5488031B2 (ja) 検索装置
US9400789B2 (en) Associating resources with entities
JP5418295B2 (ja) 検索装置
JP6414192B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム
CN107851263B (zh) 用于处理推荐请求的方法和推荐引擎
US10394826B1 (en) System and methods for searching query data
US9659059B2 (en) Matching large sets of words
US7720832B1 (en) Dynamic contact information

Legal Events

Date Code Title Description
RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20120717

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140210

R150 Certificate of patent or registration of utility model

Ref document number: 5488031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees