JP2010176198A - Retrieval server, information retrieval method and program - Google Patents

Retrieval server, information retrieval method and program Download PDF

Info

Publication number
JP2010176198A
JP2010176198A JP2009015662A JP2009015662A JP2010176198A JP 2010176198 A JP2010176198 A JP 2010176198A JP 2009015662 A JP2009015662 A JP 2009015662A JP 2009015662 A JP2009015662 A JP 2009015662A JP 2010176198 A JP2010176198 A JP 2010176198A
Authority
JP
Japan
Prior art keywords
content
search
click
calculating
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009015662A
Other languages
Japanese (ja)
Other versions
JP5347532B2 (en
Inventor
Yoshikazu Mukai
慶和 向井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009015662A priority Critical patent/JP5347532B2/en
Publication of JP2010176198A publication Critical patent/JP2010176198A/en
Application granted granted Critical
Publication of JP5347532B2 publication Critical patent/JP5347532B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval result in order of priority in consideration of trend with fine accuracy. <P>SOLUTION: A retrieval server 100 calculates effective periods of contents, based on content types such as MIME types and the number of content update times retained in content preservation servers 300-1 through 300-n. By the calculation of a weight coefficient based on each effective period and the lapse of time which is time elapsing after the last retrieval of a content, the ritrieval server 100 calculates a content retrieval sequence, based on the weight coefficient and the number of click times by which the content is retrieved. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、情報を検索する検索サーバ、情報検索方法およびプログラムに関する。   The present invention relates to a search server, an information search method, and a program for searching for information.

近年、企業内では取り扱う情報量が増大し、当該情報の構造データ・非構造データが複数のサーバに散在している傾向にある。また、これらの情報を横断的に検索して情報活用、業務効率化を図りたいというニーズが高まっている。   In recent years, the amount of information handled in a company has increased, and there is a tendency that structured data and unstructured data of the information are scattered in a plurality of servers. In addition, there is a growing need to search for such information across the board for information utilization and operational efficiency.

横断的に情報を検索する際に重要となってくる要素の1つに、欲しい情報が検索結果の上位に検索されるという点が挙げられる。企業内文書に対する検索については、インターネット上の検索とは違った企業内検索(Enterprise Search)ならではの効果的なランキングアルゴリズムが求められてきている。   One of the important elements when searching for information across the board is that the desired information is searched for in the higher rank of the search results. As for the search for documents in the company, an effective ranking algorithm unique to the search in the company (Enterprise Search) different from the search on the Internet has been demanded.

企業内検索では、インターネット検索とは違い、データベース、ファイルサーバ、業務アプリケーションなど多種多様な形態の構造データ・非構造データを横断的に検索するという特性を有している。そのため、インターネット検索でよく知られるリンクアルゴリズム(サイトに張られたリンクの数を基に検索キーワードに対する検索順位を決定するアルゴリズム)ではなく、企業内検索の特性に特化したランキングアルゴリズムを適用する必要がある。   In-house search, unlike Internet search, has the characteristic of searching across various forms of structured data and unstructured data such as databases, file servers, and business applications. Therefore, it is necessary to apply a ranking algorithm specialized for the characteristics of in-house search, not the link algorithm well-known in Internet search (an algorithm that determines the search order for the search keyword based on the number of links placed on the site). There is.

企業内検索におけるランキングアルゴリズムの1つとして、クリックフィードバック手法が考えられている(例えば、特許文献1,2参照。)。これは、企業内情報で多くの人から何度も閲覧される(検索結果をクリックされる)コンテンツはより重要であるという考えの元、検索者が検索結果に対してクリックした回数を、次回以降の検索結果のスコアに反映させるというアルゴリズムである。   A click feedback method is considered as one of ranking algorithms in in-house search (see, for example, Patent Documents 1 and 2). This is based on the idea that content that is viewed many times by many people in company information (clicked on search results) is more important. This algorithm is reflected in the score of subsequent search results.

例えば、企業内で全員が対象となる人事イベントなどがあった場合、そのイベントに必要な帳票類などのコンテンツへの検索要望は上がると考えられる。このとき、クリックフィードバック手法で、多くの社員がその帳票類を参照することによって検索結果の上位にその帳票類がランキングされるようになるという効果が見込まれる。補足として、このクリックフィードバック手法は、単体でスコアを計算するというよりは、主に既にあるスコアリングエンジンで計算された検索順位に対して、上記の配慮を加味した重み係数的な役割を果たす。   For example, if there is a personnel event or the like that is targeted for everyone in the company, a search request for contents such as forms necessary for the event will increase. At this time, the click feedback method is expected to have an effect that a lot of employees refer to the form so that the form is ranked higher in the search result. As a supplement, this click feedback method plays a role like a weighting factor in consideration of the above consideration for the search rank calculated mainly by the existing scoring engine, rather than calculating the score alone.

また、クリックフィードバック手法以外でも、従来までに過去のユーザの検索操作を次回の検索に役立てようと(フィードバック)する様々な類似手法が考えられている。   In addition to the click feedback method, various similar methods have been conceived that try to use (feedback) past user search operations for the next search.

例えば、検索者の物理的な位置情報やネットワーク情報など多くの情報を履歴保持しておき、次回の検索時に1つの検索で様々な視点(ビュー)で検索結果の見せ方を提示する手法が考えられている(例えば、特許文献3参照。)。   For example, a method is considered in which a large amount of information such as a searcher's physical location information and network information is stored in a history, and how to display the search results from various viewpoints (views) in one search at the next search. (For example, see Patent Document 3).

また、検索キーワードにより仮ランキングを決定した後に「ユーザプリファレンス」という概念を考慮して最終的なランキングを決定する技術が考えられている(例えば、特許文献4,5参照。)。   In addition, a technique is considered in which a final ranking is determined in consideration of the concept of “user preference” after determining a temporary ranking using a search keyword (see, for example, Patent Documents 4 and 5).

また、他の手法と同じように検索キーワードによるランキングに加えて、ユーザ毎にプロファイルを用意して、そのプロファイルとの適合性をランキングに反映させる技術が考えられている(例えば、特許文献6参照。)。   In addition to the ranking based on the search keyword as in other methods, a technique is considered in which a profile is prepared for each user and the compatibility with the profile is reflected in the ranking (see, for example, Patent Document 6). .)

また、検索キーワードの履歴情報から現在から最も近い検索キーワードグループを話題という概念で次回以降のスコア計算にフィードバックする技術が考えられている(例えば、特許文献7参照。)。   Further, a technique is considered in which the search keyword group closest to the present from the search keyword history information is fed back to the score calculation for the next and subsequent times based on the concept of topic (for example, see Patent Document 7).

また、あらかじめ設定された有効期間中の検索キーワードの優先順位を高く計算する技術が考えられている(例えば、特許文献8参照。)。   In addition, a technique for calculating a higher priority of search keywords during a preset effective period has been considered (see, for example, Patent Document 8).

特開平10−307845号公報JP-A-10-307845 特開2006−331295号公報JP 2006-331295 A 特開平08−044759号公報Japanese Patent Laid-Open No. 08-044759 特開2006−092557号公報JP 2006-092557 A 特開2006−024212号公報JP 2006-244212 A 特開2002−032401号公報JP 2002-032401 A 特開2007−140605号公報JP 2007-140605 A 特開2007−188508号公報JP 2007-188508 A

しかしながら、上述したクリックフィードバック手法においては、コンテンツに対するトレンド性といったことは考慮していない。そのため、保持したクリック回数の情報をクリアしない限り、過去に人気のあったコンテンツなどはその後全く参照がなくなっても上位にランクされ続けてしまうという問題点がある。   However, the above-described click feedback method does not consider the trend toward content. Therefore, unless the information on the number of clicks held is cleared, content that has been popular in the past will continue to be ranked higher even if there is no reference thereafter.

また、特許文献3に記載された技術においては、上述した課題と同様にコンテンツのトレンド性を検索結果に反映させることはできないという問題点がある。   In addition, the technique described in Patent Document 3 has a problem in that the trend of content cannot be reflected in the search result as in the above-described problem.

また、特許文献4,5では、「ユーザプリファレンス」については汎用的・概念的な記述になっており、ユーザがあらかじめ定義しておかなければならなく、その手間がかかってしまうという問題点がある。   In Patent Documents 4 and 5, “user preference” is a general-purpose and conceptual description, and the user must define it in advance, which takes time. is there.

また、特許文献6に記載された技術においては、プロファイルをユーザ毎にあらかじめ決定しておく必要があり、その手間がかかってしまうという問題点がある。   Moreover, in the technique described in Patent Document 6, it is necessary to determine a profile for each user in advance, which is troublesome.

また、特許文献7に記載された技術においては、検索キーワードの履歴情報からでは、どのコンテンツが実際に参照されたのかわからないため、最近よく参照されたコンテンツを検索したいニーズの検索の場合、十分な技術とは言えない。   Further, in the technique described in Patent Document 7, it is not known from the history information of the search keyword which content is actually referred to. It's not technology.

また、特許文献8に記載された技術においては、有効期間中のものであるか否かのみを優先順位の判断基準としているため、細かな精度で優先順位を計算することができないという問題点がある。   Further, in the technique described in Patent Document 8, only whether or not it is in the effective period is used as a priority criterion, and therefore, there is a problem in that the priority cannot be calculated with fine accuracy. is there.

本発明は、上述した課題を解決する検索サーバ、情報検索方法およびプログラムを提供することを目的とする。   An object of this invention is to provide the search server, the information search method, and program which solve the subject mentioned above.

本発明の検索サーバは、
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバであって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算するコンテンツ有効期間計算処理部と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算するクリックスコア更新処理部と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算するクリックスコア反映処理部とを有する。
The search server of the present invention
A search server that searches for content based on a search keyword transmitted from a terminal,
A content validity period calculation processing unit that calculates the validity period of the content based on the type of the content such as MIME type and the number of updates of the content;
A click score update processing unit that calculates a weighting factor based on the effective period and an elapsed time that is an elapsed time from when the content was last searched;
A click score reflection processing unit for calculating a search order of the content based on the weighting factor and the number of clicks for searching the content;

また、本発明の情報検索方法は、
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する情報検索方法であって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する処理と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する処理と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する処理とを有する。
Moreover, the information retrieval method of the present invention includes:
An information search method for searching content based on a search keyword transmitted from a terminal,
A process for calculating the validity period of the content based on the type of the content such as MIME type and the number of updates of the content;
A process of calculating a weighting factor based on the effective period and an elapsed time that is an elapsed time from when the content was last searched;
Processing for calculating the search order of the content based on the weighting factor and the number of clicks on which the content was searched.

また、本発明のプログラムは、
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバに実行させるためのプログラムであって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する手順と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する手順と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する手順とを実行させる。
The program of the present invention is
A program for causing a search server to search for content based on a search keyword transmitted from a terminal,
A procedure for calculating the validity period of the content based on the type of the content such as MIME type and the number of updates of the content;
A procedure for calculating a weighting factor based on the validity period and an elapsed time that is an elapsed time since the content was last searched;
Based on the weighting factor and the number of clicks on which the content has been searched, a procedure for calculating the search order of the content is executed.

以上説明したように本発明においては、MIMEタイプ等のコンテンツの種別と、コンテンツの更新回数とに基づいてコンテンツの有効期間を計算し、有効期間とコンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算し、重み係数とコンテンツが検索されたクリック回数とに基づいて、コンテンツの検索順位を計算する構成としたため、細かな精度でトレンド性を考慮した優先順位で検索結果を提供することができる。   As described above, in the present invention, the effective period of the content is calculated based on the content type such as the MIME type and the number of times the content is updated, and the effective period and the time elapsed since the last time the content was searched. The weighting factor is calculated based on a certain elapsed time, and the content search order is calculated based on the weighting factor and the number of clicks on which the content has been searched. Can provide search results.

本発明の検索サーバの実施の一形態を示す図である。It is a figure which shows one Embodiment of the search server of this invention. 図1に示したコンテンツ有効期間計算処理部が確認した各コンテンツの更新回数とMIMEタイプとの一例を示す図である。It is a figure which shows an example of the update frequency of each content and MIME type which the content effective period calculation process part shown in FIG. 1 confirmed. 図2に示したコンテンツについて計算され、図1に示したコンテンツ有効期間情報データベースに格納されたコンテンツ有効期間情報の一例を示す図である。It is a figure which shows an example of the content effective period information calculated about the content shown in FIG. 2, and stored in the content effective period information database shown in FIG. 図1に示したクリック履歴情報データベースに格納された1番目のコンテンツに関するクリック履歴情報の一例を示す図である。It is a figure which shows an example of the click history information regarding the 1st content stored in the click history information database shown in FIG. 図1に示したクリック履歴情報データベースに格納された2番目のコンテンツに関するクリック履歴情報の一例を示す図である。It is a figure which shows an example of the click history information regarding the 2nd content stored in the click history information database shown in FIG. 図1に示したクリック履歴情報データベースに格納された3番目のコンテンツに関するクリック履歴情報の一例を示す図である。It is a figure which shows an example of the click history information regarding the 3rd content stored in the click history information database shown in FIG. 図4〜図6に示したクリック履歴情報に基づいて計算されて図1に示したクリックスコア情報データベースに格納されたクリックスコア情報の一例を示す図である。It is a figure which shows an example of the click score information calculated based on the click history information shown in FIGS. 4-6, and was stored in the click score information database shown in FIG. 図1に示した仮ランキング決定部が決定した仮ランキングのスコアの一例を示す図である。It is a figure which shows an example of the score of the temporary ranking determined by the temporary ranking determination part shown in FIG. 図1に示したクリックスコア反映処理部において計算されたコンテンツの最終スコアの一例を示す図である。It is a figure which shows an example of the final score of the content calculated in the click score reflection process part shown in FIG. 本発明の検索サーバの他の実施の形態を示す図である。It is a figure which shows other embodiment of the search server of this invention.

以下に、本発明の実施の形態について図面を参照して説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明の検索サーバの実施の一形態を示す図である。   FIG. 1 is a diagram showing an embodiment of a search server according to the present invention.

本形態は図1に示すように、検索サーバ100と、端末200と、コンテンツ保存サーバ300−1〜300−n(nは整数)とから構成されており、それらが互いにネットワーク400を介して接続されている。   As shown in FIG. 1, the present embodiment includes a search server 100, a terminal 200, and content storage servers 300-1 to 300-n (n is an integer), which are connected to each other via a network 400. Has been.

端末200は、クライアントが入力した検索キーワードを検索要求としてネットワーク400を介して検索サーバ100へ送信する。   The terminal 200 transmits the search keyword input by the client as a search request to the search server 100 via the network 400.

検索サーバ100は、端末200から送信されてきた検索キーワードに基づいてコンテンツを検索する。   The search server 100 searches for content based on the search keyword transmitted from the terminal 200.

コンテンツ保存サーバ300−1〜300−nは、検索されるコンテンツが格納されているサーバである。   The content storage servers 300-1 to 300-n are servers that store content to be searched.

また、検索サーバ100には図1に示すように、クライアント要求受付/返却処理部104と、仮ランキング決定部105と、クリックスコア反映処理部106と、クリックフィードバック受付処理部107と、コンテンツ有効期間計算処理部108と、クリックスコア更新処理部109と、クリックスコア情報データベース110と、クリック履歴情報データベース111と、コンテンツ有効期間情報データベース112とが設けられている。   Further, as shown in FIG. 1, the search server 100 includes a client request reception / return processing unit 104, a temporary ranking determination unit 105, a click score reflection processing unit 106, a click feedback reception processing unit 107, a content validity period. A calculation processing unit 108, a click score update processing unit 109, a click score information database 110, a click history information database 111, and a content valid period information database 112 are provided.

ここで、仮ランキング決定部105は、汎用的なスコアリングエンジンが利用でき、仮ランキング決定に必要な情報は既に検索サーバ100に格納されている。   Here, the temporary ranking determining unit 105 can use a general-purpose scoring engine, and information necessary for determining the temporary ranking is already stored in the search server 100.

また、コンテンツ有効期間計算処理部108は、コンテンツ保存サーバ300−1〜300−nへ各コンテンツの更新回数とファイル種別であるMIMEタイプとを確認する。そのため、コンテンツの更新回数を把握しておく必要がある。これは、コンテンツ保存サーバ300−1〜300−nに更新回数を管理できる文書管理システムを導入するといった手段や、コンテンツが更新される度にコンテンツ保存サーバ300−1〜300−nがコンテンツ有効期間計算処理部108へ通知を行って検索サーバ100にて更新回数を保持しておくといった手段を用いることにより実現可能である。   In addition, the content validity period calculation processing unit 108 confirms the number of times each content is updated and the MIME type that is the file type to the content storage servers 300-1 to 300-n. Therefore, it is necessary to grasp the number of times content is updated. This is because means for introducing a document management system capable of managing the number of updates to the content storage servers 300-1 to 300-n, and the content storage servers 300-1 to 300-n are used as content valid periods each time content is updated This can be realized by using a means for notifying the calculation processing unit 108 and keeping the number of updates in the search server 100.

また、コンテンツ有効期間計算処理部108は、各コンテンツの更新回数とMIMEタイプとから、長期間コンテンツの内容があまり変わらず有用なものほど長い期間が設定されるような計算により、コンテンツの有効期間を計算する。この具体的な計算方法については、後述する。そして、計算されたコンテンツの有効期間を示すコンテンツ有効期間情報をコンテンツ有効期間情報データベース112に格納する。このとき、同じコンテンツのコンテンツ有効期間情報がコンテンツ有効期間情報データベース112に既に設定されている場合は上書きする。本処理はコンテンツを検索する前に実施しておく必要があり、定期的に実行されるものである。   Further, the content valid period calculation processing unit 108 calculates the content valid period from the number of times each content is updated and the MIME type so that a longer period is set for a useful content that does not change much in the long term. Calculate This specific calculation method will be described later. Then, content validity period information indicating the calculated validity period of the content is stored in the content validity period information database 112. At this time, if the content valid period information of the same content is already set in the content valid period information database 112, it is overwritten. This processing needs to be performed before searching for content, and is executed periodically.

なお、本形態においては、更新回数とMIMEタイプとからコンテンツ有効期間を設定する方法を記述するが、この方法に限定せず、コンテンツのアクセスプロトコルやサーバ種別などコンテンツの有効期間に影響しそうな特徴が存在すれば、同等の計算方法を用いるものであっても良い。   In this embodiment, a method for setting the content validity period from the number of updates and the MIME type is described. However, the present invention is not limited to this method, and it is likely to affect the validity period of the content such as the content access protocol and server type. If there exists, an equivalent calculation method may be used.

次に、検索キーワードを用いた検索処理について説明する。   Next, search processing using search keywords will be described.

検索時には、端末200は、クライアントから入力を受け付けた検索キーワードをクライアント要求受付/返却処理部104へ送信する。   At the time of search, the terminal 200 transmits the search keyword received from the client to the client request reception / return processing unit 104.

すると、クライアント要求受付/返却処理部104は、仮ランキング決定部105へ受け付けた検索キーワードを渡し、仮ランキング決定部105が仮ランキングのスコアを計算する。   Then, the client request reception / return processing unit 104 passes the received search keyword to the temporary ranking determination unit 105, and the temporary ranking determination unit 105 calculates a temporary ranking score.

続いて、仮ランキング決定部105が計算した仮ランキングのスコアをクリックスコア反映処理部106へ渡し、クリックスコア反映処理部106はコンテンツのトレンド性を考慮したスコアに再計算する。この具体的な計算方法については、後述する。   Subsequently, the temporary ranking score calculated by the temporary ranking determination unit 105 is transferred to the click score reflection processing unit 106, and the click score reflection processing unit 106 recalculates the score considering the trend of the content. This specific calculation method will be described later.

そして、クリックスコア反映処理部106は、再計算したスコアをクライアント要求受付/返却処理部104へ渡し、クライアント要求受付/返却処理部104は端末200へ検索結果を返却する。   Then, the click score reflection processing unit 106 passes the recalculated score to the client request reception / return processing unit 104, and the client request reception / return processing unit 104 returns the search result to the terminal 200.

検索結果を受け取った端末200を操作するクライアントが、その後、端末200に表示された検索結果の中から閲覧したいコンテンツを選択(クリック)すると、コンテンツ保存サーバ300−1〜300−nに保存されているコンテンツが閲覧できる。その際、端末200はクリックフィードバック受付処理部107に対して、クリックしたコンテンツ・日時の情報を送信する。   When the client operating the terminal 200 that has received the search result then selects (clicks) the content to be browsed from the search results displayed on the terminal 200, the content is stored in the content storage servers 300-1 to 300-n. You can browse the content that you have. At that time, the terminal 200 transmits the clicked content / date information to the click feedback reception processing unit 107.

クリックフィードバック受付処理部107は、端末200から送信されてきた情報をクリック履歴情報としてクリック履歴情報データベース111に格納する。   The click feedback reception processing unit 107 stores information transmitted from the terminal 200 in the click history information database 111 as click history information.

すると、クリックスコア更新処理部109は、コンテンツ有効期間情報データベース112に格納されているコンテンツ有効期間情報を取得して、クリック履歴情報データベース111の中で有効期間を超えている情報を破棄する。   Then, the click score update processing unit 109 acquires the content effective period information stored in the content effective period information database 112 and discards information that exceeds the effective period in the click history information database 111.

そして、クリックスコア更新処理部109は、クリック履歴情報データベース111に格納されているクリック履歴情報について、検索日時からより近いクリック履歴情報ほどスコアに反映されるような重み係数を計算する。計算した重み係数をクリックスコア情報データベース110へ格納する。この具体的な計算方法については、後述する。なお、この処理は、基本的にクライアントが端末200を用いて検索を行わない時間帯を狙って1日の最初に自動的に最低1度は動作するものが好ましい(検索が実行されない夜間に実行するようにするなど、設定は運用による)。   Then, the click score update processing unit 109 calculates a weight coefficient for the click history information stored in the click history information database 111 so that the click history information closer to the search date is reflected in the score. The calculated weighting coefficient is stored in the click score information database 110. This specific calculation method will be described later. In addition, it is preferable that this processing be performed automatically at least once at the beginning of the day, aiming at a time period when the client does not search using the terminal 200 (executed at night when the search is not executed). The setting depends on the operation.)

以下に、図1に示した形態における処理を具体的に説明する。なお、以降の説明では便宜上、日時を日単位で記述するが、分単位、秒単位など時間の単位に依存することなく本発明は適用できる。また、同様にコンテンツの有効期間を計算するために利用する特徴を更新回数とMIMEタイプとを用いて説明しているが、他の特徴においても本発明は適用可能である。   Hereinafter, the processing in the form shown in FIG. 1 will be described in detail. In the following description, for convenience, the date and time are described in units of days. However, the present invention can be applied without depending on units of time such as minutes or seconds. Similarly, the features used for calculating the effective period of the content have been described using the number of updates and the MIME type, but the present invention can be applied to other features.

まず、検索の前処理として、コンテンツ有効期間計算処理部108は、コンテンツ保存サーバ300−1〜300−nへ各コンテンツの更新回数とMIMEタイプとを確認する。そして、各コンテンツの有効期間を計算し、計算したコンテンツ有効期間をコンテンツ有効期間情報としてコンテンツ有効期間情報データベース112に格納しておく。   First, as search pre-processing, the content validity period calculation processing unit 108 confirms the number of updates of each content and the MIME type to the content storage servers 300-1 to 300-n. Then, the effective period of each content is calculated, and the calculated content effective period is stored in the content effective period information database 112 as content effective period information.

図2は、図1に示したコンテンツ有効期間計算処理部108が確認した各コンテンツの更新回数とMIMEタイプとの一例を示す図である。   FIG. 2 is a diagram illustrating an example of the number of updates of each content and the MIME type confirmed by the content validity period calculation processing unit 108 illustrated in FIG.

図2に示すように例えば、1番目のコンテンツ(http://aaa/bbb/abab.doc)は、更新回数が7回であり、MIMEタイプが「application/msword」であることを確認している。また、2番目のコンテンツ(smb://xyz/abc/zzz/yyyy.xls)は、更新回数が50回であり、MIMEタイプが「application/msexcel」であることを確認している。また、3番目のコンテンツ(file:///C:/aaa/bbb/ccc/abc.pdf)は、更新回数が950回であり、MIMEタイプが「application/pdf」であることを確認している。   As shown in FIG. 2, for example, confirm that the first content (http: //aaa/bbb/abab.doc) has been updated 7 times and the MIME type is “application / msword”. Yes. Further, it is confirmed that the second content (smb: //xyz/abc/zzz/yyyy.xls) has been updated 50 times and the MIME type is “application / msexcel”. Confirm that the third content (file: /// C: /aaa/bbb/ccc/abc.pdf) has been updated 950 times and the MIME type is “application / pdf”. Yes.

図3は、図2に示したコンテンツについて計算され、図1に示したコンテンツ有効期間情報データベース112に格納されたコンテンツ有効期間情報の一例を示す図である。   FIG. 3 is a diagram showing an example of content valid period information calculated for the content shown in FIG. 2 and stored in the content valid period information database 112 shown in FIG.

図3に示すように、コンテンツ有効期間情報データベース112には3つのコンテンツについて計算された有効期間が格納されている。これらは、(式1)を用いて計算されたものである。   As shown in FIG. 3, the content validity period information database 112 stores the validity periods calculated for the three contents. These are calculated using (Equation 1).

Figure 2010176198
ここで、「max(更新回数)」は、各コンテンツの更新回数の中の最大値を意味する。また、「MIMEタイプ別更新平均回数」は、MIMEタイプ単位で更新回数の統計をとって平均した値である。また、「max(MIMEタイプ別更新平均回数)」は、MIMEタイプ別更新平均回数の中の最大値を意味する。また、x,yは、更新回数、MIMEタイプ別更新平均回数に対する重みで、x+y=1となる数値である。また、「基準期間」は、有効期間を計算する上であらかじめ設定された基準を示す期間であり、システム上で適切な値を1つ設けるものである(コンテンツ毎に設定しなければならないものではない)。
Figure 2010176198
Here, “max (update count)” means the maximum value among the update counts of each content. The “average number of updates by MIME type” is a value obtained by averaging statistics of the number of updates for each MIME type. Further, “max (MIME type update average number of times)” means the maximum value among MIME type update average times. Also, x and y are weights for the number of updates and the average number of updates for each MIME type, and are numerical values such that x + y = 1. In addition, the “reference period” is a period indicating a standard set in advance for calculating the effective period, and one appropriate value is provided on the system (in the case where it must be set for each content) Absent).

図3に示すように例えば、1番目のコンテンツ(http://aaa/bbb/abab.doc)の有効期間が950日であるのに対して、3番目のコンテンツ(file:///C:/aaa/bbb/ccc/abc.pdf)の有効期間は7日である。つまり、3番目のコンテンツは1番目のコンテンツに比べて7日分のクリック履歴情報しか考慮しないトレンド性の高いコンテンツである。一方、1番目のコンテンツは更新回数も少なく内容が不変的で過去に参照されたクリック履歴情報も有効なコンテンツであると考えられる。   As shown in FIG. 3, for example, the validity period of the first content (http: //aaa/bbb/abab.doc) is 950 days, whereas the third content (file: /// C: /aaa/bbb/ccc/abc.pdf) is valid for 7 days. That is, the third content is highly trending content that considers only the click history information for seven days compared to the first content. On the other hand, the first content is considered to be valid content because the number of updates is small and the content is unchanged, and the click history information referred to in the past is also effective.

また、もう1つの前処理として最低限、日の始めに1回は、クリック履歴情報データベース111に格納されたクリック履歴情報の、経過時間を示す「経過日数」、「重み係数」、「クリック回数補正値」を(式2)、(式3)および(式4)を用いてクリックスコア更新処理部109が計算しておく。また、クリックスコア情報データベース110に格納されたクリックスコア情報の「クリックスコア」を(式5)を用いてクリックスコア更新処理部109が計算しておく。   Further, as another pre-processing, at least once at the beginning of the day, “elapsed days”, “weighting coefficient”, “click count” indicating the elapsed time of the click history information stored in the click history information database 111 The click score update processing unit 109 calculates the “correction value” using (Expression 2), (Expression 3), and (Expression 4). Further, the click score update processing unit 109 calculates “click score” of the click score information stored in the click score information database 110 using (Equation 5).

なお、この計算を行う頻度を上げれば、より最近のクリック履歴情報を考慮することができ、検索結果の精度も向上する。一方、これらの計算の間はデータベースのテーブルをロックするため、検索ができなくなる。そのため、運用に応じて適当な計算タイミングを設定する必要がある。なお、下記の処理中に「重み係数」が「0」になったデータは有効期間が過ぎた情報であるため、クリック履歴情報データベース111から破棄する。   If the frequency of performing this calculation is increased, more recent click history information can be taken into account, and the accuracy of the search result is improved. On the other hand, since the database table is locked during these calculations, the search cannot be performed. Therefore, it is necessary to set an appropriate calculation timing according to the operation. Note that data whose “weighting factor” is “0” during the following processing is information whose valid period has expired, and is discarded from the click history information database 111.

経過日数=現在日(検索日)−クリック日 (式2)
重み係数=(コンテンツ有効期間−経過日数)/コンテンツ有効期間 (式3)
クリック回数補正値=クリック回数×重み係数 (式4)
クリックスコア=Σクリック回数補正値 (式5)
ここで、(式3)の計算結果が負の値になった場合、重み係数を「0」とする。
Elapsed days = Current date (search date)-Click date (Formula 2)
Weighting factor = (Content valid period−Elapsed days) / Content valid period (Formula 3)
Click count correction value = Click count x Weighting factor (Formula 4)
Click score = Σ click count correction value (Formula 5)
Here, when the calculation result of (Expression 3) becomes a negative value, the weighting coefficient is set to “0”.

図4は、図1に示したクリック履歴情報データベース111に格納された1番目のコンテンツに関するクリック履歴情報の一例を示す図である。   FIG. 4 is a diagram showing an example of click history information related to the first content stored in the click history information database 111 shown in FIG.

図5は、図1に示したクリック履歴情報データベース111に格納された2番目のコンテンツに関するクリック履歴情報の一例を示す図である。   FIG. 5 is a diagram illustrating an example of click history information relating to the second content stored in the click history information database 111 illustrated in FIG. 1.

図6は、図1に示したクリック履歴情報データベース111に格納された3番目のコンテンツに関するクリック履歴情報の一例を示す図である。   FIG. 6 is a diagram showing an example of click history information regarding the third content stored in the click history information database 111 shown in FIG.

図7は、図4〜図6に示したクリック履歴情報に基づいて計算されて図1に示したクリックスコア情報データベース110に格納されたクリックスコア情報の一例を示す図である。   FIG. 7 is a diagram showing an example of click score information calculated based on the click history information shown in FIGS. 4 to 6 and stored in the click score information database 110 shown in FIG.

図2〜図7に示した例では、1番目のコンテンツは数年前に多く参照されているが最近はあまり参照されていないコンテンツであり、また、3番目のコンテンツは最近よく参照されているコンテンツであり、また、2番目のコンテンツはコンスタントに参照され続けているコンテンツである。計算結果を見ると、クリックスコアは、より最近多く参照されているコンテンツほど大きな値になっていることがわかる。   In the example shown in FIGS. 2 to 7, the first content is often referenced several years ago, but has not been frequently referenced recently, and the third content has been frequently referenced recently. The content is the content, and the second content is the content that is continuously referred to. Looking at the calculation results, it can be seen that the click score has a larger value as the content is referenced more recently.

その後、端末200からの検索要求をクライアント要求受付/返却処理部104が受け付けると、仮ランキング決定部105が仮ランキングのスコアを計算する。仮ランキング決定部105における計算方法は、任意であり、本発明では訴求範囲としないため詳細は省略する。   After that, when the client request reception / return processing unit 104 receives a search request from the terminal 200, the temporary ranking determination unit 105 calculates a temporary ranking score. The calculation method in the provisional ranking determination unit 105 is arbitrary, and the details are omitted because it is not included in the appeal range in the present invention.

図8は、図1に示した仮ランキング決定部105が決定した仮ランキングのスコアの一例を示す図である。   FIG. 8 is a diagram illustrating an example of a temporary ranking score determined by the temporary ranking determination unit 105 illustrated in FIG. 1.

図8に示すように、1番目、2番目、3番目のコンテンツの順に仮ランキングのスコア(仮スコア)が高くなっている。なお、本発明を適用しない通常の検索の場合は、この順位をそのまま検索結果として端末200へ返却する。   As shown in FIG. 8, the provisional ranking score (provisional score) increases in the order of the first, second, and third contents. In the case of a normal search to which the present invention is not applied, this order is returned to the terminal 200 as a search result as it is.

続いて、クリックスコア反映処理部106において、(式6)を用いてクリックスコア(コンテンツのトレンド性)を反映した最終スコアを計算して、この最終スコア順に検索結果を端末200へ返却する。   Subsequently, the click score reflection processing unit 106 calculates a final score reflecting the click score (content trend) using (Equation 6), and returns the search result to the terminal 200 in the order of the final score.

最終スコア=仮スコア×(クリックスコア/max(全コンテンツのクリックスコア)) (式6)
ここで、「max(全コンテンツのクリックスコア)」は、各コンテンツのクリックスコアの中の最大値を意味する。
Final score = provisional score × (click score / max (click score of all contents)) (Formula 6)
Here, “max (click score of all contents)” means the maximum value among the click scores of each content.

図9は、図1に示したクリックスコア反映処理部106において計算されたコンテンツの最終スコアの一例を示す図である。   FIG. 9 is a diagram illustrating an example of the final score of content calculated in the click score reflection processing unit 106 illustrated in FIG.

図9に示すように、仮スコア(仮検索順位)では最も値が大きかった1番目のコンテンツは、最近はほとんど参照されていない(トレンド性が低い)コンテンツということで、最終スコア(検索順位)は最も値が小さくなっている。また、仮スコアでは最も値が小さかった3番目のコンテンツは、最近頻繁に参照されている(トレンド性が高い)コンテンツということで、最終スコアが最も高い値となっていることがわかる。   As shown in FIG. 9, the first content having the largest value in the provisional score (provisional search order) is the content that has not been referred to recently (low trend), and the final score (search order). Has the smallest value. In addition, it can be seen that the third content having the smallest value in the provisional score is the content that is frequently referred to recently (having a high trend), and thus has the highest final score.

検索結果を受け取った端末200は、当該検索結果を表示する。そして、クライアントによって閲覧したいコンテンツが選択(クリック)されると、コンテンツ保存サーバ300−1〜300−nのコンテンツが参照される。このとき、選択したクリック履歴情報(コンテンツ・日付)を検索サーバ100のクリックフィードバック受付処理部107へ送信する。すると、クリックフィードバック受付処理部107は、送信されてきたクリック履歴情報に基づいてクリック履歴情報データベース111を更新する。このとき、クリック履歴情報データベース111に格納されている当該コンテンツのクリック回数が「1」加算される。   The terminal 200 that has received the search result displays the search result. When the content to be browsed is selected (clicked) by the client, the contents of the content storage servers 300-1 to 300-n are referred to. At this time, the selected click history information (content / date) is transmitted to the click feedback reception processing unit 107 of the search server 100. Then, the click feedback reception processing unit 107 updates the click history information database 111 based on the transmitted click history information. At this time, “1” is added to the number of clicks of the content stored in the click history information database 111.

図1に示した形態においては、検索結果に対して選択(クリック)された情報を元にスコアを計算しているが、より利用する情報に汎用性を持たせても、同様に本発明の手法を適用することができる。   In the form shown in FIG. 1, the score is calculated based on the information selected (clicked) on the search result. However, even if the information to be used has more versatility, the score of the present invention is similarly applied. Techniques can be applied.

図10は、本発明の検索サーバの他の実施の形態を示す図である。   FIG. 10 is a diagram showing another embodiment of the search server of the present invention.

本形態は図10に示すように、図1に示した形態におけるクリックフィードバック受付処理部107の代わりにアクセスログ管理受付処理部113が、また、クリック履歴情報データベース111の代わりにアクセスログ情報データベース114が、検索サーバ100に設けられた形態である。   In this embodiment, as shown in FIG. 10, an access log management reception processing unit 113 is used instead of the click feedback reception processing unit 107 in the configuration shown in FIG. 1, and an access log information database 114 is used instead of the click history information database 111. Is a form provided in the search server 100.

このように、利用する特徴について、クリック履歴情報の代わりに、アクセスログ情報を利用する。アクセスログであれば、検索結果に対する参照情報以外のアクセス履歴(通常のWebアクセスやFTP(File Transfer Protocol)アクセスなど検索を介さない参照)も検索順位に反映させることができ、より汎用的である。   As described above, the access log information is used instead of the click history information for the feature to be used. In the case of an access log, an access history other than reference information with respect to a search result (reference not through a search such as normal Web access or FTP (File Transfer Protocol) access) can be reflected in the search order, and is more general. .

アクセスログ情報データベース114に格納されたアクセスログ情報は、通常のWebサーバ等であれば管理している情報である。そのため、本発明上の前提としては既に各コンテンツ保存サーバ300−1〜300−nがアクセスログを保持しているものして、検索操作の前処理として、アクセスログ管理受付処理部113がアクセスログ情報データベース114に格納されたアクセスログ情報を更新する。ここで、図4〜図6に示したクリック履歴情報のクリック日をアクセス日に、クリック回数をアクセス回数というように情報を置き換えることで、同様の手法で本発明を適用することが可能である。   The access log information stored in the access log information database 114 is information managed by a normal Web server or the like. Therefore, the premise of the present invention is that each content storage server 300-1 to 300-n already holds an access log, and the access log management reception processing unit 113 performs the access log as a pre-processing of the search operation. The access log information stored in the information database 114 is updated. Here, the present invention can be applied in a similar manner by replacing information such that the click date of the click history information shown in FIGS. 4 to 6 is the access date and the click count is the access count. .

なお、上述した検索サーバ100の処理は、目的に応じて作製された論理回路で行うようにしても良い。また、処理内容を手順として記述したプログラムを検索サーバ100にて読取可能な記録媒体に記録し、この記録媒体に記録されたプログラムを検索サーバ100に読み込ませ、実行するものであっても良い。検索サーバ100にて読取可能な記録媒体とは、フロッピーディスク(登録商標)、光磁気ディスク、DVD、CDなどの移設可能な記録媒体の他、検索サーバ100に内蔵されたROM、RAM等のメモリやHDD等を指す。この記録媒体に記録されたプログラムは検索サーバ100内のCPU(不図示)にて読み込まれ、CPUの制御によって、上述したものと同様の処理が行われる。ここで、CPUは、プログラムが記録された記録媒体から読み込まれたプログラムを実行するコンピュータとして動作するものである。   Note that the processing of the search server 100 described above may be performed by a logic circuit manufactured according to the purpose. Further, a program in which processing contents are described as a procedure may be recorded on a recording medium readable by the search server 100, and the program recorded on the recording medium may be read by the search server 100 and executed. The recording medium readable by the search server 100 is a removable recording medium such as a floppy disk (registered trademark), a magneto-optical disk, a DVD, and a CD, and a memory such as a ROM and a RAM built in the search server 100. And HDD. The program recorded on the recording medium is read by a CPU (not shown) in the search server 100, and the same processing as described above is performed under the control of the CPU. Here, the CPU operates as a computer that executes a program read from a recording medium on which the program is recorded.

また、上述した特許文献に記載された技術と本発明との違い・優位点を以下に説明する。   Further, differences and advantages between the technique described in the above-described patent document and the present invention will be described below.

特許文献3に記載された技術と本発明とは過去の検索操作の履歴情報をフィードバックする点は類似しているが、フィードバック対象が検索ランキングのスコアではない点が大きく異なり、コンテンツ有効期間を自動設定して検索日時からの時間の概念を考慮している本発明の方が履歴情報を効果的にフィードバックしている。   The technique described in Patent Document 3 and the present invention are similar in that the history information of past search operations is fed back, but the feedback target is not a search ranking score. The present invention, which is set and considering the concept of time from the search date and time, effectively feeds back history information.

また、特許文献4,5に記載された技術と本発明とは、検索キーワードにより仮ランキングを決定した後に「ユーザプリファレンス」という概念を考慮して最終的なランキングを決定するという処理の流れは類似している。しかしながら、特許文献4,5に記載された技術では、「ユーザプリファレンス」をユーザがあらかじめ定義しておくものであるのに対し、本発明では自動で動的に変化していくというものという位置付けである点が大きく異なる。   In addition, the technique described in Patent Documents 4 and 5 and the present invention have a process flow in which a final ranking is determined in consideration of the concept of “user preference” after determining a temporary ranking based on a search keyword. It is similar. However, in the techniques described in Patent Documents 4 and 5, the “user preference” is defined in advance by the user, whereas in the present invention, it is automatically and dynamically changed. The point is greatly different.

また、特許文献6に記載された技術では、プロファイルを予めユーザ毎に決定しておく必要がある一方、本発明では、動的にフィードバックされる情報が変わらない。その点が大きく異なる。   In the technique described in Patent Document 6, it is necessary to determine a profile for each user in advance. On the other hand, in the present invention, dynamically fed back information does not change. The point is very different.

上述した類似手法は全般的に、ユーザの嗜好・選好を考慮してユーザ毎に検索結果をパーソナライズしようというアプローチである点に対して、本発明は全ユーザを対象としたクリック履歴情報を活用してコンテンツのトレンド性を反映しようというアプローチである点が異なる。   In general, the above-described similar method is an approach of personalizing search results for each user in consideration of the user's preference / preference, whereas the present invention utilizes click history information for all users. The approach is to reflect the trend of content.

また、特許文献7に記載された技術は、本発明と同様にコンテンツが「ある期間内に参照されたかどうか」という点に注目している。また、過去の検索キーワードをコンテンツ単位に記録・分類していき、現在から最も近いキーワードグループを話題という概念で次回以降のスコア計算にフィードバックしており、より現在に近い履歴情報を重要視する考え方は類似している。しかし、本発明とは履歴情報・スコア算出方法が大きく異なる。検索キーワードの履歴情報からでは、どのコンテンツが実際に参照されたのかわからないため、最近よく参照されたコンテンツを検索したいニーズの検索の場合、本発明の方が有用である。   Further, the technique described in Patent Document 7 pays attention to whether content is referred to within a certain period as in the present invention. In addition, past search keywords are recorded and categorized in units of content, and the keyword group closest to the present is fed back to the score calculation from the next time on the concept of topic. Are similar. However, the history information / score calculation method is greatly different from the present invention. Since it is not known from the search keyword history information which content is actually referred to, the present invention is more useful in the case of a search for a need to search for a content that has been frequently referenced recently.

以上説明した本発明においては、以下に示す効果を奏する。   The present invention described above has the following effects.

第1の効果は、過去によく参照されているコンテンツが上位にランキングされるような検索結果が得られることである。   The first effect is that a search result is obtained such that content frequently referred to in the past is ranked higher.

その理由は、コンテンツ単位で過去に参照された日時・回数をデータベースに保持しておき、検索の際にこの情報をスコアに反映させているためである。   The reason is that the date and number of times referred to in the past in content units are stored in the database, and this information is reflected in the score at the time of search.

第2の効果は、ただ参照された回数が多いだけではなく、コンテンツのトレンド性も考慮された検索結果が得られることである。   The second effect is that a search result is obtained in which not only the number of times of reference is high but also the trend of content is taken into consideration.

その理由は、コンテンツ単位で有効期間を自動計算して、その間の参照回数の最近のものほど重みを高くしてスコアに反映させているためである。   The reason is that the effective period is automatically calculated for each content unit, and the more recent reference times during that period are weighted and reflected in the score.

100 検索サーバ
104 クライアント要求受付/返却処理部
105 仮ランキング決定部
106 クリックスコア反映処理部
107 クリックフィードバック受付処理部
108 コンテンツ有効期間計算処理部
109 クリックスコア更新処理部
110 クリックスコア情報データベース
111 クリック履歴情報データベース
112 コンテンツ有効期間情報データベース
113 アクセスログ管理受付処理部
114 アクセスログ情報データベース
200 端末
300−1〜300−n コンテンツ保存サーバ
400 ネットワーク
DESCRIPTION OF SYMBOLS 100 Search server 104 Client request reception / return processing part 105 Temporary ranking determination part 106 Click score reflection processing part 107 Click feedback reception processing part 108 Content effective period calculation processing part 109 Click score update processing part 110 Click score information database 111 Click history information Database 112 Content validity period information database 113 Access log management reception processing unit 114 Access log information database 200 Terminal 300-1 to 300-n Content storage server 400 Network

Claims (12)

端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバであって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算するコンテンツ有効期間計算処理部と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算するクリックスコア更新処理部と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算するクリックスコア反映処理部とを有する検索サーバ。
A search server that searches for content based on a search keyword transmitted from a terminal,
A content validity period calculation processing unit that calculates the validity period of the content based on the type of the content such as MIME type and the number of updates of the content;
A click score update processing unit that calculates a weighting factor based on the effective period and an elapsed time that is an elapsed time from when the content was last searched;
A search server comprising: a click score reflection processing unit that calculates a search order of the content based on the weighting factor and the number of clicks by which the content has been searched.
請求項1に記載の検索サーバにおいて、
前記クリックスコア反映処理部は、前記重み係数と前記クリック回数とに基づいてクリックスコアを計算し、該クリックスコアと任意の方法で計算した仮検索順位とに基づいて前記検索順位を計算することを特徴とする検索サーバ。
The search server according to claim 1,
The click score reflection processing unit calculates a click score based on the weighting factor and the number of clicks, and calculates the search order based on the click score and a temporary search order calculated by an arbitrary method. Feature search server.
請求項1に記載の検索サーバにおいて、
前記検索した結果を前記検索順位で前記端末へ送信するクライアント要求受付返却処理部を有することを特徴とする検索サーバ。
The search server according to claim 1,
A search server, comprising: a client request reception return processing unit that transmits the search result to the terminal in the search order.
請求項1に記載の検索サーバにおいて、
前記コンテンツ有効期間計算処理部は、前記コンテンツが保存されているコンテンツ保存サーバから前記コンテンツの更新回数を取得することを特徴とする検索サーバ。
The search server according to claim 1,
The content validity period calculation processing unit acquires the number of updates of the content from a content storage server in which the content is stored.
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する情報検索方法であって、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する処理と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する処理と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する処理とを有する情報検索方法。
An information search method for searching for content based on a search keyword transmitted from a terminal,
A process of calculating a validity period of the content based on the type of the content such as MIME type and the number of updates of the content;
A process of calculating a weighting factor based on the effective period and an elapsed time that is an elapsed time from when the content was last searched;
An information search method comprising: processing for calculating a search order of the content based on the weighting factor and the number of clicks for searching the content.
請求項5に記載の情報検索方法において、
前記重み係数と前記クリック回数とに基づいてクリックスコアを計算する処理と、
前記クリックスコアと任意の方法で計算した仮検索順位とに基づいて前記検索順位を計算する処理とを有することを特徴とする情報検索方法。
The information search method according to claim 5,
Processing for calculating a click score based on the weighting factor and the number of clicks;
And a process for calculating the search order based on the click score and a temporary search order calculated by an arbitrary method.
請求項5に記載の情報検索方法において、
前記検索した結果を前記検索順位で前記端末へ送信する処理を有することを特徴とする情報検索方法。
The information search method according to claim 5,
An information search method comprising a process of transmitting the search result to the terminal in the search order.
請求項5に記載の情報検索方法において、
前記コンテンツが保存されているコンテンツ保存サーバから前記コンテンツの更新回数を取得する処理を有することを特徴とする情報検索方法。
The information search method according to claim 5,
An information search method comprising: a process of acquiring the number of updates of the content from a content storage server storing the content.
端末から送信されてきた検索キーワードに基づいてコンテンツを検索する検索サーバに、
MIMEタイプ等の前記コンテンツの種別と前記コンテンツの更新回数とに基づいて該コンテンツの有効期間を計算する手順と、
前記有効期間と前記コンテンツを最後に検索したときから経過した時間である経過時間とに基づいて重み係数を計算する手順と、
前記重み係数と前記コンテンツが検索されたクリック回数とに基づいて、該コンテンツの検索順位を計算する手順とを実行させるためのプログラム。
To search server that searches contents based on search keyword sent from terminal,
A procedure for calculating the validity period of the content based on the type of the content such as MIME type and the number of updates of the content;
A procedure for calculating a weighting factor based on the validity period and an elapsed time that is an elapsed time since the content was last searched;
A program for executing a procedure for calculating a search order of content based on the weighting factor and the number of clicks by which the content has been searched.
請求項9に記載のプログラムにおいて、
前記重み係数と前記クリック回数とに基づいてクリックスコアを計算する手順と、
前記クリックスコアと任意の方法で計算した仮検索順位とに基づいて前記検索順位を計算する手順とを実行させるためのプログラム。
The program according to claim 9,
Calculating a click score based on the weighting factor and the number of clicks;
A program for executing a procedure for calculating the search order based on the click score and a temporary search order calculated by an arbitrary method.
請求項9に記載のプログラムにおいて、
前記検索した結果を前記検索順位で前記端末へ送信する手順を実行させるためのプログラム。
The program according to claim 9,
A program for executing a procedure for transmitting the search result to the terminal in the search order.
請求項9に記載のプログラムにおいて、
前記コンテンツが保存されているコンテンツ保存サーバから前記コンテンツの更新回数を取得する手順を実行させるためのプログラム。
The program according to claim 9,
The program for performing the procedure which acquires the update frequency of the said content from the content storage server in which the said content is preserve | saved.
JP2009015662A 2009-01-27 2009-01-27 Search server, information search method and program Expired - Fee Related JP5347532B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009015662A JP5347532B2 (en) 2009-01-27 2009-01-27 Search server, information search method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009015662A JP5347532B2 (en) 2009-01-27 2009-01-27 Search server, information search method and program

Publications (2)

Publication Number Publication Date
JP2010176198A true JP2010176198A (en) 2010-08-12
JP5347532B2 JP5347532B2 (en) 2013-11-20

Family

ID=42707151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009015662A Expired - Fee Related JP5347532B2 (en) 2009-01-27 2009-01-27 Search server, information search method and program

Country Status (1)

Country Link
JP (1) JP5347532B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012117318A1 (en) * 2011-02-28 2012-09-07 International Business Machines Corporation Generating a semantic graph relating information assets
JP2014021712A (en) * 2012-07-18 2014-02-03 Ricoh Co Ltd Retrieval device, retrieval program, and retrieval system
US9646110B2 (en) 2011-02-28 2017-05-09 International Business Machines Corporation Managing information assets using feedback re-enforced search and navigation
US10162892B2 (en) 2011-02-28 2018-12-25 International Business Machines Corporation Identifying information assets within an enterprise using a semantic graph created using feedback re-enforced search and navigation
JP2020034897A (en) * 2018-08-02 2020-03-05 サウンドハウンド,インコーポレイテッド Visually presenting information relevant to natural language conversation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021589A (en) * 2002-06-17 2004-01-22 Nec System Technologies Ltd Internet information retrieval system
JP2005190453A (en) * 2003-12-02 2005-07-14 Osaka Gas Co Ltd Retrieval result display system and retrieval result display program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004021589A (en) * 2002-06-17 2004-01-22 Nec System Technologies Ltd Internet information retrieval system
JP2005190453A (en) * 2003-12-02 2005-07-14 Osaka Gas Co Ltd Retrieval result display system and retrieval result display program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012117318A1 (en) * 2011-02-28 2012-09-07 International Business Machines Corporation Generating a semantic graph relating information assets
US8751487B2 (en) 2011-02-28 2014-06-10 International Business Machines Corporation Generating a semantic graph relating information assets using feedback re-enforced search and navigation
US8782039B2 (en) 2011-02-28 2014-07-15 International Business Machines Corporation Generating a semantic graph relating information assets using feedback re-enforced search and navigation
US9646110B2 (en) 2011-02-28 2017-05-09 International Business Machines Corporation Managing information assets using feedback re-enforced search and navigation
US9652559B2 (en) 2011-02-28 2017-05-16 International Business Machines Corporation Managing information assets using feedback re-enforced search and navigation
US10162892B2 (en) 2011-02-28 2018-12-25 International Business Machines Corporation Identifying information assets within an enterprise using a semantic graph created using feedback re-enforced search and navigation
JP2014021712A (en) * 2012-07-18 2014-02-03 Ricoh Co Ltd Retrieval device, retrieval program, and retrieval system
JP2020034897A (en) * 2018-08-02 2020-03-05 サウンドハウンド,インコーポレイテッド Visually presenting information relevant to natural language conversation

Also Published As

Publication number Publication date
JP5347532B2 (en) 2013-11-20

Similar Documents

Publication Publication Date Title
JP5147174B2 (en) Method, system, and apparatus for receiving and responding to knowledge exchange queries
JP2019153323A (en) System, method and storage medium for improving access to search result
US8140541B2 (en) Time-weighted scoring system and method
RU2335013C2 (en) Methods and systems for improving search ranging with application of information about article
EP2145264B1 (en) Calculating importance of documents factoring historical importance
US8838564B2 (en) Method to increase content relevance using insights obtained from user activity updates
US9110979B2 (en) Search of sources and targets based on relative expertise of the sources
JP5916959B2 (en) Dynamic data acquisition method and system
US8655842B2 (en) Push pull caching for social network information
US20160328428A1 (en) Updating A Search Index Using Reported Browser History Data
US8645367B1 (en) Predicting data for document attributes based on aggregated data for repeated URL patterns
US20130046783A1 (en) Real time searching and reporting
US20120197928A1 (en) Real time searching and reporting
US20110231241A1 (en) Real-time personalization of sponsored search based on predicted click propensity
US20120150833A1 (en) Using social-network data for identification and ranking of urls
JP5347532B2 (en) Search server, information search method and program
JP2006092540A (en) Method, system and apparatus for maintaining user privacy in knowledge exchange system
WO2007143223A2 (en) System and method for entity based information categorization
US20160012050A1 (en) Search result annotations
WO2012040692A2 (en) Presenting social search results
US7644098B2 (en) System and method for identifying advertisements responsive to historical user queries
JP2002215659A (en) Information retrieval support method and information retrieval support system
JPH11102366A (en) Retrieval method and retrieval device
US20120150855A1 (en) Cross-market model adaptation with pairwise preference data
US20120290552A9 (en) System and method for search of sources and targets based on relative topicality specialization of the targets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130805

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees