JP5347532B2 - 検索サーバ、情報検索方法およびプログラム - Google Patents

検索サーバ、情報検索方法およびプログラム Download PDF

Info

Publication number
JP5347532B2
JP5347532B2 JP2009015662A JP2009015662A JP5347532B2 JP 5347532 B2 JP5347532 B2 JP 5347532B2 JP 2009015662 A JP2009015662 A JP 2009015662A JP 2009015662 A JP2009015662 A JP 2009015662A JP 5347532 B2 JP5347532 B2 JP 5347532B2
Authority
JP
Japan
Prior art keywords
content
search
click
calculating
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009015662A
Other languages
English (en)
Other versions
JP2010176198A (ja
Inventor
慶和 向井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009015662A priority Critical patent/JP5347532B2/ja
Publication of JP2010176198A publication Critical patent/JP2010176198A/ja
Application granted granted Critical
Publication of JP5347532B2 publication Critical patent/JP5347532B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報を検索する検索サーバ、情報検索方法およびプログラムに関する。
近年、企業内では取り扱う情報量が増大し、当該情報の構造データ・非構造データが複数のサーバに散在している傾向にある。また、これらの情報を横断的に検索して情報活用、業務効率化を図りたいというニーズが高まっている。
横断的に情報を検索する際に重要となってくる要素の1つに、欲しい情報が検索結果の上位に検索されるという点が挙げられる。企業内文書に対する検索については、インターネット上の検索とは違った企業内検索(Enterprise Search)ならではの効果的なランキングアルゴリズムが求められてきている。
企業内検索では、インターネット検索とは違い、データベース、ファイルサーバ、業務アプリケーションなど多種多様な形態の構造データ・非構造データを横断的に検索するという特性を有している。そのため、インターネット検索でよく知られるリンクアルゴリズム(サイトに張られたリンクの数を基に検索キーワードに対する検索順位を決定するアルゴリズム)ではなく、企業内検索の特性に特化したランキングアルゴリズムを適用する必要がある。
企業内検索におけるランキングアルゴリズムの1つとして、クリックフィードバック手法が考えられている(例えば、特許文献1,2参照。)。これは、企業内情報で多くの人から何度も閲覧される(検索結果をクリックされる)コンテンツはより重要であるという考えの元、検索者が検索結果に対してクリックした回数を、次回以降の検索結果のスコアに反映させるというアルゴリズムである。
例えば、企業内で全員が対象となる人事イベントなどがあった場合、そのイベントに必要な帳票類などのコンテンツへの検索要望は上がると考えられる。このとき、クリックフィードバック手法で、多くの社員がその帳票類を参照することによって検索結果の上位にその帳票類がランキングされるようになるという効果が見込まれる。補足として、このクリックフィードバック手法は、単体でスコアを計算するというよりは、主に既にあるスコアリングエンジンで計算された検索順位に対して、上記の配慮を加味した重み係数的な役割を果たす。
また、クリックフィードバック手法以外でも、従来までに過去のユーザの検索操作を次回の検索に役立てようと(フィードバック)する様々な類似手法が考えられている。
例えば、検索者の物理的な位置情報やネットワーク情報など多くの情報を履歴保持しておき、次回の検索時に1つの検索で様々な視点(ビュー)で検索結果の見せ方を提示する手法が考えられている(例えば、特許文献3参照。)。
また、検索キーワードにより仮ランキングを決定した後に「ユーザプリファレンス」という概念を考慮して最終的なランキングを決定する技術が考えられている(例えば、特許文献4,5参照。)。
また、他の手法と同じように検索キーワードによるランキングに加えて、ユーザ毎にプロファイルを用意して、そのプロファイルとの適合性をランキングに反映させる技術が考えられている(例えば、特許文献6参照。)。
また、検索キーワードの履歴情報から現在から最も近い検索キーワードグループを話題という概念で次回以降のスコア計算にフィードバックする技術が考えられている(例えば、特許文献7参照。)。
また、あらかじめ設定された有効期間中の検索キーワードの優先順位を高く計算する技術が考えられている(例えば、特許文献8参照。)。
特開平10−307845号公報 特開2006−331295号公報 特開平08−044759号公報 特開2006−092557号公報 特開2006−024212号公報 特開2002−032401号公報 特開2007−140605号公報 特開2007−188508号公報
しかしながら、上述したクリックフィードバック手法においては、コンテンツに対するトレンド性といったことは考慮していない。そのため、保持したクリック回数の情報をクリアしない限り、過去に人気のあったコンテンツなどはその後全く参照がなくなっても上位にランクされ続けてしまうという問題点がある。
また、特許文献3に記載された技術においては、上述した課題と同様にコンテンツのトレンド性を検索結果に反映させることはできないという問題点がある。
また、特許文献4,5では、「ユーザプリファレンス」については汎用的・概念的な記述になっており、ユーザがあらかじめ定義しておかなければならなく、その手間がかかってしまうという問題点がある。
また、特許文献6に記載された技術においては、プロファイルをユーザ毎にあらかじめ決定しておく必要があり、その手間がかかってしまうという問題点がある。
また、特許文献7に記載された技術においては、検索キーワードの履歴情報からでは、どのコンテンツが実際に参照されたのかわからないため、最近よく参照されたコンテンツを検索したいニーズの検索の場合、十分な技術とは言えない。
また、特許文献8に記載された技術においては、有効期間中のものであるか否かのみを優先順位の判断基準としているため、細かな精度で優先順位を計算することができないという問題点がある。
本発明は、上述した課題を解決する検索サーバ、情報検索方法およびプログラムを提供することを目的とする。
本発明の検索サーバは、
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバであって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算するコンテンツ有効期間計算処理部と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算するクリックスコア更新処理部と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算するクリックスコア反映処理部とを有する。
また、本発明の情報検索方法は、
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する情報検索方法であって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する処理と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する処理と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する処理とを有する。
また、本発明のプログラムは、
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバに実行させるためのプログラムであって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する手順と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する手順と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する手順とを実行させる。
以上説明したように本発明においては、MIMEタイプ等のコンテンツの種別と、コンテンツの更新回数とに基づいてコンテンツの有効期間を計算し、有効期間とコンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算し、重み係数とコンテンツが検索されたクリック回数とに基づいて、コンテンツの検索順位を計算する構成としたため、細かな精度でトレンド性を考慮した優先順位で検索結果を提供することができる。
本発明の検索サーバの実施の一形態を示す図である。 図1に示したコンテンツ有効期間計算処理部が確認した各コンテンツの更新回数とMIMEタイプとの一例を示す図である。 図2に示したコンテンツについて計算され、図1に示したコンテンツ有効期間情報データベースに格納されたコンテンツ有効期間情報の一例を示す図である。 図1に示したクリック履歴情報データベースに格納された1番目のコンテンツに関するクリック履歴情報の一例を示す図である。 図1に示したクリック履歴情報データベースに格納された2番目のコンテンツに関するクリック履歴情報の一例を示す図である。 図1に示したクリック履歴情報データベースに格納された3番目のコンテンツに関するクリック履歴情報の一例を示す図である。 図4〜図6に示したクリック履歴情報に基づいて計算されて図1に示したクリックスコア情報データベースに格納されたクリックスコア情報の一例を示す図である。 図1に示した仮ランキング決定部が決定した仮ランキングのスコアの一例を示す図である。 図1に示したクリックスコア反映処理部において計算されたコンテンツの最終スコアの一例を示す図である。 本発明の検索サーバの他の実施の形態を示す図である。
以下に、本発明の実施の形態について図面を参照して説明する。
図1は、本発明の検索サーバの実施の一形態を示す図である。
本形態は図1に示すように、検索サーバ100と、端末200と、コンテンツ保存サーバ300−1〜300−n(nは整数)とから構成されており、それらが互いにネットワーク400を介して接続されている。
端末200は、クライアントが入力した検索キーワードを検索要求としてネットワーク400を介して検索サーバ100へ送信する。
検索サーバ100は、端末200から送信されてきた検索キーワードに基づいてコンテンツを検索する。
コンテンツ保存サーバ300−1〜300−nは、検索されるコンテンツが格納されているサーバである。
また、検索サーバ100には図1に示すように、クライアント要求受付/返却処理部104と、仮ランキング決定部105と、クリックスコア反映処理部106と、クリックフィードバック受付処理部107と、コンテンツ有効期間計算処理部108と、クリックスコア更新処理部109と、クリックスコア情報データベース110と、クリック履歴情報データベース111と、コンテンツ有効期間情報データベース112とが設けられている。
ここで、仮ランキング決定部105は、汎用的なスコアリングエンジンが利用でき、仮ランキング決定に必要な情報は既に検索サーバ100に格納されている。
また、コンテンツ有効期間計算処理部108は、コンテンツ保存サーバ300−1〜300−nへ各コンテンツの更新回数とファイル種別であるMIMEタイプとを確認する。そのため、コンテンツの更新回数を把握しておく必要がある。これは、コンテンツ保存サーバ300−1〜300−nに更新回数を管理できる文書管理システムを導入するといった手段や、コンテンツが更新される度にコンテンツ保存サーバ300−1〜300−nがコンテンツ有効期間計算処理部108へ通知を行って検索サーバ100にて更新回数を保持しておくといった手段を用いることにより実現可能である。
また、コンテンツ有効期間計算処理部108は、各コンテンツの更新回数とMIMEタイプとから、長期間コンテンツの内容があまり変わらず有用なものほど長い期間が設定されるような計算により、コンテンツの有効期間を計算する。この具体的な計算方法については、後述する。そして、計算されたコンテンツの有効期間を示すコンテンツ有効期間情報をコンテンツ有効期間情報データベース112に格納する。このとき、同じコンテンツのコンテンツ有効期間情報がコンテンツ有効期間情報データベース112に既に設定されている場合は上書きする。本処理はコンテンツを検索する前に実施しておく必要があり、定期的に実行されるものである。
なお、本形態においては、更新回数とMIMEタイプとからコンテンツ有効期間を設定する方法を記述するが、この方法に限定せず、コンテンツのアクセスプロトコルやサーバ種別などコンテンツの有効期間に影響しそうな特徴が存在すれば、同等の計算方法を用いるものであっても良い。
次に、検索キーワードを用いた検索処理について説明する。
検索時には、端末200は、クライアントから入力を受け付けた検索キーワードをクライアント要求受付/返却処理部104へ送信する。
すると、クライアント要求受付/返却処理部104は、仮ランキング決定部105へ受け付けた検索キーワードを渡し、仮ランキング決定部105が仮ランキングのスコアを計算する。
続いて、仮ランキング決定部105が計算した仮ランキングのスコアをクリックスコア反映処理部106へ渡し、クリックスコア反映処理部106はコンテンツのトレンド性を考慮したスコアに再計算する。この具体的な計算方法については、後述する。
そして、クリックスコア反映処理部106は、再計算したスコアをクライアント要求受付/返却処理部104へ渡し、クライアント要求受付/返却処理部104は端末200へ検索結果を返却する。
検索結果を受け取った端末200を操作するクライアントが、その後、端末200に表示された検索結果の中から閲覧したいコンテンツを選択(クリック)すると、コンテンツ保存サーバ300−1〜300−nに保存されているコンテンツが閲覧できる。その際、端末200はクリックフィードバック受付処理部107に対して、クリックしたコンテンツ・日時の情報を送信する。
クリックフィードバック受付処理部107は、端末200から送信されてきた情報をクリック履歴情報としてクリック履歴情報データベース111に格納する。
すると、クリックスコア更新処理部109は、コンテンツ有効期間情報データベース112に格納されているコンテンツ有効期間情報を取得して、クリック履歴情報データベース111の中で有効期間を超えている情報を破棄する。
そして、クリックスコア更新処理部109は、クリック履歴情報データベース111に格納されているクリック履歴情報について、検索日時からより近いクリック履歴情報ほどスコアに反映されるような重み係数を計算する。計算した重み係数をクリックスコア情報データベース110へ格納する。この具体的な計算方法については、後述する。なお、この処理は、基本的にクライアントが端末200を用いて検索を行わない時間帯を狙って1日の最初に自動的に最低1度は動作するものが好ましい(検索が実行されない夜間に実行するようにするなど、設定は運用による)。
以下に、図1に示した形態における処理を具体的に説明する。なお、以降の説明では便宜上、日時を日単位で記述するが、分単位、秒単位など時間の単位に依存することなく本発明は適用できる。また、同様にコンテンツの有効期間を計算するために利用する特徴を更新回数とMIMEタイプとを用いて説明しているが、他の特徴においても本発明は適用可能である。
まず、検索の前処理として、コンテンツ有効期間計算処理部108は、コンテンツ保存サーバ300−1〜300−nへ各コンテンツの更新回数とMIMEタイプとを確認する。そして、各コンテンツの有効期間を計算し、計算したコンテンツ有効期間をコンテンツ有効期間情報としてコンテンツ有効期間情報データベース112に格納しておく。
図2は、図1に示したコンテンツ有効期間計算処理部108が確認した各コンテンツの更新回数とMIMEタイプとの一例を示す図である。
図2に示すように例えば、1番目のコンテンツ(http://aaa/bbb/abab.doc)は、更新回数が7回であり、MIMEタイプが「application/msword」であることを確認している。また、2番目のコンテンツ(smb://xyz/abc/zzz/yyyy.xls)は、更新回数が50回であり、MIMEタイプが「application/msexcel」であることを確認している。また、3番目のコンテンツ(file:///C:/aaa/bbb/ccc/abc.pdf)は、更新回数が950回であり、MIMEタイプが「application/pdf」であることを確認している。
図3は、図2に示したコンテンツについて計算され、図1に示したコンテンツ有効期間情報データベース112に格納されたコンテンツ有効期間情報の一例を示す図である。
図3に示すように、コンテンツ有効期間情報データベース112には3つのコンテンツについて計算された有効期間が格納されている。これらは、(式1)を用いて計算されたものである。
Figure 0005347532
ここで、「max(更新回数)」は、各コンテンツの更新回数の中の最大値を意味する。また、「MIMEタイプ別更新平均回数」は、MIMEタイプ単位で更新回数の統計をとって平均した値である。また、「max(MIMEタイプ別更新平均回数)」は、MIMEタイプ別更新平均回数の中の最大値を意味する。また、x,yは、更新回数、MIMEタイプ別更新平均回数に対する重みで、x+y=1となる数値である。また、「基準期間」は、有効期間を計算する上であらかじめ設定された基準を示す期間であり、システム上で適切な値を1つ設けるものである(コンテンツ毎に設定しなければならないものではない)。
図3に示すように例えば、1番目のコンテンツ(http://aaa/bbb/abab.doc)の有効期間が950日であるのに対して、3番目のコンテンツ(file:///C:/aaa/bbb/ccc/abc.pdf)の有効期間は7日である。つまり、3番目のコンテンツは1番目のコンテンツに比べて7日分のクリック履歴情報しか考慮しないトレンド性の高いコンテンツである。一方、1番目のコンテンツは更新回数も少なく内容が不変的で過去に参照されたクリック履歴情報も有効なコンテンツであると考えられる。
また、もう1つの前処理として最低限、日の始めに1回は、クリック履歴情報データベース111に格納されたクリック履歴情報の、経過時間を示す「経過日数」、「重み係数」、「クリック回数補正値」を(式2)、(式3)および(式4)を用いてクリックスコア更新処理部109が計算しておく。また、クリックスコア情報データベース110に格納されたクリックスコア情報の「クリックスコア」を(式5)を用いてクリックスコア更新処理部109が計算しておく。
なお、この計算を行う頻度を上げれば、より最近のクリック履歴情報を考慮することができ、検索結果の精度も向上する。一方、これらの計算の間はデータベースのテーブルをロックするため、検索ができなくなる。そのため、運用に応じて適当な計算タイミングを設定する必要がある。なお、下記の処理中に「重み係数」が「0」になったデータは有効期間が過ぎた情報であるため、クリック履歴情報データベース111から破棄する。
経過日数=現在日(検索日)−クリック日 (式2)
重み係数=(コンテンツ有効期間−経過日数)/コンテンツ有効期間 (式3)
クリック回数補正値=クリック回数×重み係数 (式4)
クリックスコア=Σクリック回数補正値 (式5)
ここで、(式3)の計算結果が負の値になった場合、重み係数を「0」とする。
図4は、図1に示したクリック履歴情報データベース111に格納された1番目のコンテンツに関するクリック履歴情報の一例を示す図である。
図5は、図1に示したクリック履歴情報データベース111に格納された2番目のコンテンツに関するクリック履歴情報の一例を示す図である。
図6は、図1に示したクリック履歴情報データベース111に格納された3番目のコンテンツに関するクリック履歴情報の一例を示す図である。
図7は、図4〜図6に示したクリック履歴情報に基づいて計算されて図1に示したクリックスコア情報データベース110に格納されたクリックスコア情報の一例を示す図である。
図2〜図7に示した例では、1番目のコンテンツは数年前に多く参照されているが最近はあまり参照されていないコンテンツであり、また、3番目のコンテンツは最近よく参照されているコンテンツであり、また、2番目のコンテンツはコンスタントに参照され続けているコンテンツである。計算結果を見ると、クリックスコアは、より最近多く参照されているコンテンツほど大きな値になっていることがわかる。
その後、端末200からの検索要求をクライアント要求受付/返却処理部104が受け付けると、仮ランキング決定部105が仮ランキングのスコアを計算する。仮ランキング決定部105における計算方法は、任意であり、本発明では訴求範囲としないため詳細は省略する。
図8は、図1に示した仮ランキング決定部105が決定した仮ランキングのスコアの一例を示す図である。
図8に示すように、1番目、2番目、3番目のコンテンツの順に仮ランキングのスコア(仮スコア)が高くなっている。なお、本発明を適用しない通常の検索の場合は、この順位をそのまま検索結果として端末200へ返却する。
続いて、クリックスコア反映処理部106において、(式6)を用いてクリックスコア(コンテンツのトレンド性)を反映した最終スコアを計算して、この最終スコア順に検索結果を端末200へ返却する。
最終スコア=仮スコア×(クリックスコア/max(全コンテンツのクリックスコア)) (式6)
ここで、「max(全コンテンツのクリックスコア)」は、各コンテンツのクリックスコアの中の最大値を意味する。
図9は、図1に示したクリックスコア反映処理部106において計算されたコンテンツの最終スコアの一例を示す図である。
図9に示すように、仮スコア(仮検索順位)では最も値が大きかった1番目のコンテンツは、最近はほとんど参照されていない(トレンド性が低い)コンテンツということで、最終スコア(検索順位)は最も値が小さくなっている。また、仮スコアでは最も値が小さかった3番目のコンテンツは、最近頻繁に参照されている(トレンド性が高い)コンテンツということで、最終スコアが最も高い値となっていることがわかる。
検索結果を受け取った端末200は、当該検索結果を表示する。そして、クライアントによって閲覧したいコンテンツが選択(クリック)されると、コンテンツ保存サーバ300−1〜300−nのコンテンツが参照される。このとき、選択したクリック履歴情報(コンテンツ・日付)を検索サーバ100のクリックフィードバック受付処理部107へ送信する。すると、クリックフィードバック受付処理部107は、送信されてきたクリック履歴情報に基づいてクリック履歴情報データベース111を更新する。このとき、クリック履歴情報データベース111に格納されている当該コンテンツのクリック回数が「1」加算される。
図1に示した形態においては、検索結果に対して選択(クリック)された情報を元にスコアを計算しているが、より利用する情報に汎用性を持たせても、同様に本発明の手法を適用することができる。
図10は、本発明の検索サーバの他の実施の形態を示す図である。
本形態は図10に示すように、図1に示した形態におけるクリックフィードバック受付処理部107の代わりにアクセスログ管理受付処理部113が、また、クリック履歴情報データベース111の代わりにアクセスログ情報データベース114が、検索サーバ100に設けられた形態である。
このように、利用する特徴について、クリック履歴情報の代わりに、アクセスログ情報を利用する。アクセスログであれば、検索結果に対する参照情報以外のアクセス履歴(通常のWebアクセスやFTP(File Transfer Protocol)アクセスなど検索を介さない参照)も検索順位に反映させることができ、より汎用的である。
アクセスログ情報データベース114に格納されたアクセスログ情報は、通常のWebサーバ等であれば管理している情報である。そのため、本発明上の前提としては既に各コンテンツ保存サーバ300−1〜300−nがアクセスログを保持しているものして、検索操作の前処理として、アクセスログ管理受付処理部113がアクセスログ情報データベース114に格納されたアクセスログ情報を更新する。ここで、図4〜図6に示したクリック履歴情報のクリック日をアクセス日に、クリック回数をアクセス回数というように情報を置き換えることで、同様の手法で本発明を適用することが可能である。
なお、上述した検索サーバ100の処理は、目的に応じて作製された論理回路で行うようにしても良い。また、処理内容を手順として記述したプログラムを検索サーバ100にて読取可能な記録媒体に記録し、この記録媒体に記録されたプログラムを検索サーバ100に読み込ませ、実行するものであっても良い。検索サーバ100にて読取可能な記録媒体とは、フロッピーディスク(登録商標)、光磁気ディスク、DVD、CDなどの移設可能な記録媒体の他、検索サーバ100に内蔵されたROM、RAM等のメモリやHDD等を指す。この記録媒体に記録されたプログラムは検索サーバ100内のCPU(不図示)にて読み込まれ、CPUの制御によって、上述したものと同様の処理が行われる。ここで、CPUは、プログラムが記録された記録媒体から読み込まれたプログラムを実行するコンピュータとして動作するものである。
また、上述した特許文献に記載された技術と本発明との違い・優位点を以下に説明する。
特許文献3に記載された技術と本発明とは過去の検索操作の履歴情報をフィードバックする点は類似しているが、フィードバック対象が検索ランキングのスコアではない点が大きく異なり、コンテンツ有効期間を自動設定して検索日時からの時間の概念を考慮している本発明の方が履歴情報を効果的にフィードバックしている。
また、特許文献4,5に記載された技術と本発明とは、検索キーワードにより仮ランキングを決定した後に「ユーザプリファレンス」という概念を考慮して最終的なランキングを決定するという処理の流れは類似している。しかしながら、特許文献4,5に記載された技術では、「ユーザプリファレンス」をユーザがあらかじめ定義しておくものであるのに対し、本発明では自動で動的に変化していくというものという位置付けである点が大きく異なる。
また、特許文献6に記載された技術では、プロファイルを予めユーザ毎に決定しておく必要がある一方、本発明では、動的にフィードバックされる情報が変わらない。その点が大きく異なる。
上述した類似手法は全般的に、ユーザの嗜好・選好を考慮してユーザ毎に検索結果をパーソナライズしようというアプローチである点に対して、本発明は全ユーザを対象としたクリック履歴情報を活用してコンテンツのトレンド性を反映しようというアプローチである点が異なる。
また、特許文献7に記載された技術は、本発明と同様にコンテンツが「ある期間内に参照されたかどうか」という点に注目している。また、過去の検索キーワードをコンテンツ単位に記録・分類していき、現在から最も近いキーワードグループを話題という概念で次回以降のスコア計算にフィードバックしており、より現在に近い履歴情報を重要視する考え方は類似している。しかし、本発明とは履歴情報・スコア算出方法が大きく異なる。検索キーワードの履歴情報からでは、どのコンテンツが実際に参照されたのかわからないため、最近よく参照されたコンテンツを検索したいニーズの検索の場合、本発明の方が有用である。
以上説明した本発明においては、以下に示す効果を奏する。
第1の効果は、過去によく参照されているコンテンツが上位にランキングされるような検索結果が得られることである。
その理由は、コンテンツ単位で過去に参照された日時・回数をデータベースに保持しておき、検索の際にこの情報をスコアに反映させているためである。
第2の効果は、ただ参照された回数が多いだけではなく、コンテンツのトレンド性も考慮された検索結果が得られることである。
その理由は、コンテンツ単位で有効期間を自動計算して、その間の参照回数の最近のものほど重みを高くしてスコアに反映させているためである。
100 検索サーバ
104 クライアント要求受付/返却処理部
105 仮ランキング決定部
106 クリックスコア反映処理部
107 クリックフィードバック受付処理部
108 コンテンツ有効期間計算処理部
109 クリックスコア更新処理部
110 クリックスコア情報データベース
111 クリック履歴情報データベース
112 コンテンツ有効期間情報データベース
113 アクセスログ管理受付処理部
114 アクセスログ情報データベース
200 端末
300−1〜300−n コンテンツ保存サーバ
400 ネットワーク

Claims (12)

  1. 端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバであって、
    MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算するコンテンツ有効期間計算処理部と、
    前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算するクリックスコア更新処理部と、
    前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算するクリックスコア反映処理部とを有する検索サーバ。
  2. 請求項1に記載の検索サーバにおいて、
    前記クリックスコア反映処理部は、前記重み係数と前記クリック回数とに基づいてクリックスコアを計算し、該クリックスコアと任意の方法で計算した仮検索順位とに基づいて前記検索順位を計算することを特徴とする検索サーバ。
  3. 請求項1に記載の検索サーバにおいて、
    前記検索した結果を前記検索順位で前記端末へ送信するクライアント要求受付返却処理部を有することを特徴とする検索サーバ。
  4. 請求項1に記載の検索サーバにおいて、
    前記コンテンツ有効期間計算処理部は、前記コンテンツが保存されているコンテンツ保存サーバから前記コンテンツの更新回数を取得することを特徴とする検索サーバ。
  5. 端末から送信されてきた検索キーワードに基づいて検索サーバがコンテンツを検索する情報検索方法であって、
    MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する処理と、
    前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する処理と、
    前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する処理とを有する情報検索方法。
  6. 請求項5に記載の情報検索方法において、
    前記重み係数と前記クリック回数とに基づいてクリックスコアを計算する処理と、
    前記クリックスコアと任意の方法で計算した仮検索順位とに基づいて前記検索順位を計算する処理とを有することを特徴とする情報検索方法。
  7. 請求項5に記載の情報検索方法において、
    前記検索した結果を前記検索順位で前記端末へ送信する処理を有することを特徴とする情報検索方法。
  8. 請求項5に記載の情報検索方法において、
    前記コンテンツが保存されているコンテンツ保存サーバから前記コンテンツの更新回数を取得する処理を有することを特徴とする情報検索方法。
  9. 端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバに、
    MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する手順と、
    前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する手順と、
    前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する手順とを実行させるためのプログラム。
  10. 請求項9に記載のプログラムにおいて、
    前記重み係数と前記クリック回数とに基づいてクリックスコアを計算する手順と、
    前記クリックスコアと任意の方法で計算した仮検索順位とに基づいて前記検索順位を計算する手順とを実行させるためのプログラム。
  11. 請求項9に記載のプログラムにおいて、
    前記検索した結果を前記検索順位で前記端末へ送信する手順を実行させるためのプログラム。
  12. 請求項9に記載のプログラムにおいて、
    前記コンテンツが保存されているコンテンツ保存サーバから前記コンテンツの更新回数を取得する手順を実行させるためのプログラム。
JP2009015662A 2009-01-27 2009-01-27 検索サーバ、情報検索方法およびプログラム Expired - Fee Related JP5347532B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009015662A JP5347532B2 (ja) 2009-01-27 2009-01-27 検索サーバ、情報検索方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009015662A JP5347532B2 (ja) 2009-01-27 2009-01-27 検索サーバ、情報検索方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010176198A JP2010176198A (ja) 2010-08-12
JP5347532B2 true JP5347532B2 (ja) 2013-11-20

Family

ID=42707151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009015662A Expired - Fee Related JP5347532B2 (ja) 2009-01-27 2009-01-27 検索サーバ、情報検索方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5347532B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10162892B2 (en) 2011-02-28 2018-12-25 International Business Machines Corporation Identifying information assets within an enterprise using a semantic graph created using feedback re-enforced search and navigation
US8751487B2 (en) 2011-02-28 2014-06-10 International Business Machines Corporation Generating a semantic graph relating information assets using feedback re-enforced search and navigation
US9646110B2 (en) 2011-02-28 2017-05-09 International Business Machines Corporation Managing information assets using feedback re-enforced search and navigation
JP5958134B2 (ja) * 2012-07-18 2016-07-27 株式会社リコー 検索装置、検索プログラム及び検索システム
US20200043479A1 (en) * 2018-08-02 2020-02-06 Soundhound, Inc. Visually presenting information relevant to a natural language conversation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3922693B2 (ja) * 2002-06-17 2007-05-30 Necシステムテクノロジー株式会社 インターネット情報検索システム
JP2005190453A (ja) * 2003-12-02 2005-07-14 Osaka Gas Co Ltd 検索結果表示システムおよび検索結果表示プログラム

Also Published As

Publication number Publication date
JP2010176198A (ja) 2010-08-12

Similar Documents

Publication Publication Date Title
EP2145264B1 (en) Calculating importance of documents factoring historical importance
RU2335013C2 (ru) Способы и системы для улучшения ранжирования поиска с использованием информации о статье
US10482073B2 (en) Updating a search index using reported browser history data
JP2019153323A (ja) 検索結果へのアクセスを改良するシステム、方法及び記憶媒体
JP5147174B2 (ja) ナレッジ交換クエリを受信しおよび応答する方法、システム、および装置
US7979501B1 (en) Enhanced message display
JP5916959B2 (ja) 動的データ取得方法およびシステム
US20130046783A1 (en) Real time searching and reporting
US20110078156A1 (en) Time-weighted scoring system and method
US9292607B2 (en) Using social-network data for identification and ranking of URLs
US20120197928A1 (en) Real time searching and reporting
US20120124038A1 (en) Variable Length Snippet Generation
JP5347532B2 (ja) 検索サーバ、情報検索方法およびプログラム
WO2007143223A2 (en) System and method for entity based information categorization
WO2012040692A2 (en) Presenting social search results
US10380121B2 (en) System and method for query temporality analysis
US7644098B2 (en) System and method for identifying advertisements responsive to historical user queries
JPH11102366A (ja) 検索方法および検索装置
US8489590B2 (en) Cross-market model adaptation with pairwise preference data
US20110004592A1 (en) Search system, search method, and program
JP4981941B2 (ja) 数値計算装置、方法及びプログラム
JP5418295B2 (ja) 検索装置
US20060149606A1 (en) System and method for agent assisted information retrieval
JPH11110410A (ja) データ検索装置及び方法、情報処理システム及び方法並びにデータ検索用プログラムを記録した記録媒体
WO2016028948A1 (en) Method for record selection to avoid negatively impacting latency

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130805

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees