JP5296011B2 - Related burst query extraction apparatus and method - Google Patents

Related burst query extraction apparatus and method Download PDF

Info

Publication number
JP5296011B2
JP5296011B2 JP2010128962A JP2010128962A JP5296011B2 JP 5296011 B2 JP5296011 B2 JP 5296011B2 JP 2010128962 A JP2010128962 A JP 2010128962A JP 2010128962 A JP2010128962 A JP 2010128962A JP 5296011 B2 JP5296011 B2 JP 5296011B2
Authority
JP
Japan
Prior art keywords
query
burst
variation
score
queries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010128962A
Other languages
Japanese (ja)
Other versions
JP2011253506A (en
Inventor
重鎬 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2010128962A priority Critical patent/JP5296011B2/en
Publication of JP2011253506A publication Critical patent/JP2011253506A/en
Application granted granted Critical
Publication of JP5296011B2 publication Critical patent/JP5296011B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、関連バーストクエリ抽出装置及び方法に関する。   The present invention relates to a related burst query extraction apparatus and method.

従来、検索サーバで使用される検索用のクエリについて、この検索サーバを利用する複数のユーザが注目しているクエリを抽出する方法が提案されている。   2. Description of the Related Art Conventionally, a method has been proposed for extracting a query that has been noticed by a plurality of users using the search server, as a search query used in the search server.

例えば、特許文献1には、所定期間において検索サーバで使用されたクエリをクエリごとに第1集計値として集計し、所定期間よりも前の期間において検索サーバで使用されたクエリをクエリごとに第2集計値として集計し、第2集計値に対する第1集計値の比率を算出し、この算出された比率が高い順に、使用頻度が急上昇したクエリ、すなわち、バーストクエリとして提示する方法が示されている。   For example, in Patent Document 1, a query used in a search server in a predetermined period is totaled as a first total value for each query, and a query used in the search server in a period before the predetermined period is listed for each query. A method of presenting as a query with a burst of usage frequency, that is, a burst query, calculating the ratio of the first aggregated value to the second aggregated value, calculating the ratio of the first aggregated value relative to the second aggregated value. Yes.

このように、特許文献1で提案される方法では、算出された比率が高い順にバーストクエリを提示するので、ユーザは、提示されたクエリを確認して、世間において注目されているクエリを知ることができる。   As described above, in the method proposed in Patent Document 1, since burst queries are presented in descending order of the calculated ratio, the user confirms the presented query and knows a query that is attracting public attention. Can do.

特開2004−206517号公報JP 2004-206517 A

ところで、検索サーバにおいて出力される検索結果には、WebページのURL(Uniform Resource Locator)や、このWebページのタイトルや、このWebページの説明文であるスニペットが含まれる。特に、スニペットについては、近年、従来のスニペットの情報に加えて、リッチな情報が付加されたリッチスニペットをユーザに提示することが行われている。   By the way, the search result output by the search server includes a URL (Uniform Resource Locator) of the Web page, a title of the Web page, and a snippet that is an explanatory text of the Web page. In particular, as for snippets, in recent years, rich snippets to which rich information is added in addition to information on conventional snippets have been presented to the user.

リッチスニペットを生成するには、検索サーバの運営者は、検索に使用されたクエリと関連性のある情報を収集する必要がある。ここで、上述のバーストクエリは、同一の原因により複数発生する場合がある(例えば、テレビドラマのタイトルのクエリや、このテレビドラマの主演女優名のクエリ)。この場合、検索サーバの運営者側は、この同一の原因をこれらの複数のバーストクエリと関連性のある情報とし、この情報に基づいてこれらの複数のバーストクエリについて共通するリッチスニペットを生成できる場合がある。   To generate a rich snippet, the search server operator needs to collect information relevant to the query used for the search. Here, a plurality of burst queries described above may occur due to the same cause (for example, a query for a TV drama title or a query for the name of a leading actress of this TV drama). In this case, the search server operator can use this same cause as information relevant to these multiple burst queries and generate a rich snippet common to these multiple burst queries based on this information. There is.

しかしながら、特許文献1に記載の方法では、急上昇率が高い順にバーストクエリを提示するに過ぎないため、バーストクエリを複数抽出しても、これらのバーストクエリが同一の原因によって発生した可能性を知ることができない。よって、特許文献1に記載の方法では、これらの複数のバーストクエリについて共通するリッチスニペットを生成することができるかについて、判断することができない。   However, in the method described in Patent Document 1, only burst queries are presented in descending order of the rapid increase rate, so even if a plurality of burst queries are extracted, the possibility that these burst queries are generated due to the same cause is known. I can't. Therefore, the method described in Patent Literature 1 cannot determine whether a rich snippet common to these multiple burst queries can be generated.

本発明は、同一の原因により発生した可能性のある複数のバーストクエリの組合せを抽出することができる関連バーストクエリ抽出装置及び方法を提供することを目的とする。   An object of the present invention is to provide a related burst query extraction apparatus and method capable of extracting a combination of a plurality of burst queries that may have occurred due to the same cause.

(1)検索に使用されたクエリと、前記クエリが使用された時刻とを関連付けて検索ログとして記憶する検索ログ記憶手段と、前記検索ログ記憶手段に記憶されている前記検索ログに基づいて、前記クエリごとに、一定期間ごとの使用回数を集計する集計手段と、前記集計手段により集計された前記使用回数の、前記一定期間の直前の一定期間の使用回数に対する、変動率及び変動数に基づいて、前記クエリごとに、前記一定期間ごとの変動スコアを算出する変動スコア算出手段と、前記変動スコア算出手段により算出された前記クエリごとの前記一定期間ごとの前記変動スコアが所定値を超えるクエリを、使用頻度が急上昇しているクエリであるバーストクエリとして抽出するバーストクエリ抽出手段と、前記バーストクエリ抽出手段により抽出された前記バーストクエリについて、前記変動スコアのスケール調整を行う調整手段と、前記一定期間ごとの前記変動スコアの時系列の相関の解析により、前記調整手段によるスケール調整後の前記変動スコアの推移が類似する複数の前記バーストクエリの組合せを、バーストクエリセットとして抽出するクエリセット抽出手段と、前記クエリセット抽出手段により抽出された前記バーストクエリセットを出力する出力手段と、を備える関連バーストクエリ抽出装置。   (1) Based on the search log storage unit that stores the query used for the search and the time when the query was used in association as a search log, and the search log stored in the search log storage unit, For each query, a totaling unit that counts the number of uses for a certain period, and a rate of change and a number of fluctuations of the number of times used by the totaling unit with respect to the number of uses for a certain period immediately before the certain period Then, for each query, a fluctuation score calculation means for calculating a fluctuation score for each fixed period, and a query for which the fluctuation score for each fixed period for each query calculated by the fluctuation score calculation means exceeds a predetermined value Are extracted as burst queries, which are queries whose usage frequency is rapidly increasing, and the burst query extraction means An adjustment means for adjusting the scale of the fluctuation score for the extracted burst query, and a transition of the fluctuation score after the scale adjustment by the adjustment means by analyzing a time-series correlation of the fluctuation score for each predetermined period Related burst query extraction comprising: query set extraction means for extracting a combination of a plurality of burst queries similar to each other as a burst query set; and output means for outputting the burst query set extracted by the query set extraction means apparatus.

(1)の関連バーストクエリ抽出装置は、クエリセット抽出手段により、変動スコアの相関の時系列の解析により、この変動スコアの推移が類似すると判定される複数のバーストクエリの組合せを、バーストクエリセットとして抽出する。続いて、この関連バーストクエリ抽出装置は、出力手段により、クエリセット抽出手段により抽出されたバーストクエリセットを出力する。   The related burst query extraction device of (1) uses a query set extraction means to analyze a combination of a plurality of burst queries that are determined to have similar transitions of fluctuation scores by analyzing a time series of correlations of fluctuation scores. Extract as Subsequently, the related burst query extraction device outputs the burst query set extracted by the query set extraction means by the output means.

よって、(1)の関連バーストクエリ抽出装置は、当該変動スコアの推移が類似する複数のバーストクエリを、同一の原因でバーストした可能性のある複数のバーストクエリの組合せとして抽出することができ、これらのバーストクエリをリッチスニペットを共用できる候補情報として、この関連バーストクエリ抽出装置のユーザに提示することができる。   Therefore, the related burst query extraction device of (1) can extract a plurality of burst queries having similar transition scores as a combination of a plurality of burst queries that may have burst due to the same cause, These burst queries can be presented to the user of this related burst query extraction device as candidate information that can share a rich snippet.

(2)前記バーストクエリ抽出手段は、前記変動スコア算出手段により算出された前記クエリごとの前記一定期間ごとの前記変動スコアが最新の前記一定期間において所定値を超えるクエリを、使用頻度が急上昇しているクエリであるバーストクエリとして抽出し、前記調整手段は、前記バーストクエリ抽出手段により抽出された前記バーストクエリについて、最新の前記一定期間から遡及して前記変動スコアが前記所定値を超えている連続した前記一定期間の前記変動スコアのスケール調整を行う、(1)に記載の関連バーストクエリ抽出装置。   (2) The burst query extraction means has a frequency of use of a query in which the fluctuation score for each of the certain periods calculated by the fluctuation score calculation means exceeds a predetermined value in the latest certain period. The adjustment means is retroactive from the latest fixed period and the fluctuation score exceeds the predetermined value for the burst query extracted by the burst query extraction means. The related burst query extraction device according to (1), wherein scale adjustment of the variation score of the continuous period is performed.

(2)の関連バーストクエリ抽出装置は、最新の一定期間において変動スコアが所定値を超えるクエリを使用頻度が急上昇しているクエリであるバーストクエリとして抽出し、最新の一定期間から遡及して変動スコアが所定値を超えている連続した一定期間の変動スコアのスケール調整を行う。したがって、関連バーストクエリ抽出装置は、最新の変動スコアに基づいてバーストクエリを抽出して変動スコアのスケール調整を行う対象とするので、ユーザは、最新の情報に基づいてリッチスニペットを共用できる候補情報を認知することができる。   The related burst query extraction device of (2) extracts a query whose fluctuation score exceeds a predetermined value in the latest fixed period as a burst query that is a rapidly increasing use frequency, and changes retroactively from the latest fixed period. The scale adjustment is performed for the fluctuation score for a continuous period in which the score exceeds a predetermined value. Therefore, since the related burst query extraction device is a target for extracting a burst query based on the latest fluctuation score and adjusting the scale of the fluctuation score, the user can share the rich snippet based on the latest information. Can be recognized.

(3)前記変動スコア算出手段は、前記一定期間ごとに、当該一定期間の直前の一定期間における全クエリの使用回数を、当該一定期間における全クエリの使用回数で除算した値を正規化数として算出し、前記一定期間ごとの前記正規化数を乗算して正規化した当該一定期間に対する前記使用回数の、当該一定期間の直前の一定期間に対する前記使用回数に対する、変動率及び変動数を乗算して、前記クエリごとに、前記一定期間ごとの前記変動スコアを算出する(1)又は(2)に記載の関連バーストクエリ抽出装置。   (3) The variation score calculation means uses, as a normalized number, a value obtained by dividing the number of times of use of all queries in a certain period immediately before the certain period by the number of uses of all queries in the certain period. Calculate and multiply the fluctuation count and fluctuation count for the number of uses for the fixed period immediately before the fixed period, and the number of uses for the fixed period normalized by multiplying the normalized number for each fixed period. Then, the related burst query extraction device according to (1) or (2), wherein the fluctuation score for each certain period is calculated for each query.

(3)の関連バーストクエリ抽出装置は、一定期間ごとに正規化数を算出し、一定期間ごとの正規化数を乗算して正規化した当該一定期間に対する使用回数の、当該一定期間の直前の一定期間に対する使用回数に対する、変動率及び変動数を乗算して、クエリごとに、一定期間ごとの変動スコアを算出するので、一定期間それぞれの全使用回数が変わらなかったとした場合の変動スコアを算出できる。これにより、当該関連バーストクエリ抽出装置は、複数の一定期間それぞれにおける全使用回数の変動による変動スコアへの影響を考慮して、正規化したクエリの使用回数に基づく変動スコアを算出することができる。   The related burst query extraction device of (3) calculates a normalized number for each fixed period, and multiplies the normalized number for each fixed period to normalize the number of times of use for the fixed period immediately before the fixed period. Multiplying the number of uses for a certain period by the rate of change and the number of fluctuations to calculate the fluctuation score for each fixed period for each query, so calculate the fluctuation score when the total number of uses for each fixed period is unchanged. it can. As a result, the related burst query extraction device can calculate a variation score based on the number of times of use of the normalized query in consideration of the influence on the variation score due to the variation in the total number of uses in each of a plurality of fixed periods. .

(4)前記クエリセット抽出手段は、前記調整手段によるスケール調整後の前記変動スコアの推移が類似する複数の前記バーストクエリの組合せのうち、当該変動スコアの差が所定の値以上である前記バーストクエリの組合せを除いて、前記バーストクエリの組合せを前記バーストクエリセットとして抽出する(1)乃至(3)に記載の関連バーストクエリ抽出装置。   (4) The query set extraction unit includes the bursts whose difference in the variation scores is equal to or larger than a predetermined value among a plurality of combinations of the burst queries having similar transitions of the variation scores after the scale adjustment by the adjustment unit. The related burst query extraction device according to any one of (1) to (3), wherein a combination of burst queries is extracted as the burst query set, excluding a query combination.

(4)の関連バーストクエリ抽出装置は、当該変動スコアの差が所定の値以上であるバーストクエリの組合せを除いて、スケール調整後の変動スコアの推移が類似するバーストクエリの組合せを抽出する。これにより、当該関連バーストクエリ抽出装置は、変動スコアの推移が類似していることに加えて、当該変動スコアの差が当該所定の値未満のバーストクエリの組合せのみをさらに選別してクエリセットとして抽出することができる。   The related burst query extraction device of (4) extracts burst query combinations with similar transitions of the variation score after the scale adjustment, except for the combination of burst queries in which the difference of the variation scores is a predetermined value or more. As a result, the related burst query extraction device further selects only combinations of burst queries whose difference in variation score is less than the predetermined value in addition to the variation of the variation score being similar, as a query set. Can be extracted.

(5)検索に使用されたクエリと、前記クエリが使用された時刻とを関連付けて検索ログとして記憶する検索ログ記憶手段を備えるバーストクエリ抽出装置が実行する方法であって、前記検索ログ記憶手段に記憶されている前記検索ログに基づいて、前記クエリごとに、一定期間ごとの使用回数を集計する集計ステップと、前記集計ステップにおいて集計された前記使用回数の、前記一定期間の直前の一定期間の使用回数に対する、変動率及び変動数に基づいて、前記クエリごとに、前記一定期間ごとの変動スコアを算出する変動スコア算出ステップと、前記変動スコア算出ステップにおいて算出された前記クエリごとの前記一定期間ごとの前記変動スコアが所定値を超えるクエリを使用頻度が急上昇しているクエリであるバーストクエリとして抽出するバーストクエリ抽出ステップと、前記バーストクエリ抽出ステップにおいて抽出された前記バーストクエリについて、前記変動スコアのスケール調整を行う調整ステップと、前記一定期間ごとの前記変動スコアの時系列の相関の解析により、前記調整ステップにおけるスケール調整後の前記変動スコアの推移が類似する複数の前記バーストクエリの組合せを、バーストクエリセットとして抽出するクエリセット抽出ステップと、前記クエリセット抽出ステップにおいて抽出された前記バーストクエリセットを出力する出力ステップと、を備える方法。   (5) A method executed by a burst query extraction device including a search log storage unit that associates a query used for a search with a time when the query is used and stores it as a search log, the search log storage unit A totaling step for totaling the number of uses for a certain period for each query based on the search log stored in the query, and a certain period immediately before the certain period of the number of uses counted in the aggregating step A variation score calculating step for calculating a variation score for each fixed period for each query based on a variation rate and a variation number with respect to the number of times of use, and the constant for each query calculated in the variation score calculation step A burst query that is a query whose usage frequency is rapidly increasing and a query in which the fluctuation score for each period exceeds a predetermined value; Extracting a burst query, adjusting the scale of the variation score for the burst query extracted in the burst query extraction step, and analyzing the time-series correlation of the variation score for each predetermined period A query set extraction step for extracting a combination of a plurality of burst queries having similar transitions of the variation score after the scale adjustment in the adjustment step as a burst query set, and the burst extracted in the query set extraction step An output step of outputting the query set.

(5)に記載の方法によれば、(1)の装置と同様の効果を奏する。   According to the method as described in (5), there exists an effect similar to the apparatus of (1).

本発明によれば、同一の原因により発生した可能性のある複数のバーストクエリの組合せを抽出することができる。   According to the present invention, it is possible to extract a combination of a plurality of burst queries that may have occurred due to the same cause.

本実施形態に係る関連バーストクエリ抽出装置の機能構成を示す図である。It is a figure which shows the function structure of the related burst query extraction apparatus which concerns on this embodiment. 本実施形態に係る検索ログDBに格納されている検索ログテーブルの一例を示す図である。It is a figure which shows an example of the search log table stored in search log DB which concerns on this embodiment. 本実施形態に係る検索ログDBに記憶されている検索ログに基づいて、集計部により、集計された結果の一例を示す図である。It is a figure which shows an example of the result totaled by the total part based on the search log memorize | stored in search log DB which concerns on this embodiment. 本実施形態に係る変動スコアDBに格納されている変動スコアテーブルの一例を示す図である。It is a figure which shows an example of the fluctuation score table stored in fluctuation score DB which concerns on this embodiment. 本実施形態に係る調整後変動スコアDBに格納されている調整後変動スコアテーブルの一例を示す図である。It is a figure which shows an example of the adjusted fluctuation score table stored in the adjusted fluctuation score DB which concerns on this embodiment. 本実施形態に係る複数のバーストクエリの所定の期間における、一定期間ごとの変動スコアの一例を示す図である。It is a figure which shows an example of the fluctuation score for every fixed period in the predetermined period of the some burst query which concerns on this embodiment. 本実施形態に係る複数のバーストクエリの、所定の期間における、一定期間ごとの調整後変動スコアの差分の一例を示す図である。It is a figure which shows an example of the difference of the adjusted fluctuation score for every fixed period in the predetermined period of the some burst query which concerns on this embodiment. 本実施形態に係る関連バーストクエリ抽出装置の制御部における処理を示すフローチャートである。It is a flowchart which shows the process in the control part of the related burst query extraction apparatus which concerns on this embodiment. 本実施形態に係る複数のバーストクエリの、所定の期間における、一定期間ごとの調整後変動スコアの差分の別の例を示す図である。It is a figure which shows another example of the difference of the adjusted fluctuation score for every fixed period in the predetermined period of the some burst query which concerns on this embodiment.

以下、本発明の実施形態について図を参照しながら説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[機能構成]
図1は、本実施形態に係る関連バーストクエリ抽出装置1の機能構成を示す図である。関連バーストクエリ抽出装置1は、同一の原因で使用頻度が急上昇した(バーストした)可能性のある複数のバーストクエリの組合せを抽出するサーバである。
[Function configuration]
FIG. 1 is a diagram showing a functional configuration of a related burst query extraction apparatus 1 according to the present embodiment. The related burst query extraction device 1 is a server that extracts a combination of a plurality of burst queries that may have a sudden increase in frequency (burst) due to the same cause.

本実施形態は、コンピュータ(関連バーストクエリ抽出装置1)及びその周辺装置に適用される。本実施形態における各部は、コンピュータ及びその周辺装置が備えるハードウェア並びにこのハードウェアを制御するソフトウェアによって構成される。   This embodiment is applied to a computer (related burst query extraction device 1) and its peripheral devices. Each unit in the present embodiment is configured by hardware included in a computer and its peripheral devices, and software that controls the hardware.

上記ハードウェアには、制御部10としてのCPUの他、記憶部20、通信部、表示部及び入力部が含まれる。記憶部20としては、例えば、メモリ(RAM、ROM等)、ハードディスクドライブ(HDD)及び光ディスク(CD、DVD等)ドライブが挙げられる。通信部としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示部としては、例えば、液晶ディスプレイ、プラズマディスプレイ等の各種ディスプレイが挙げられる。入力部としては、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)が挙げられる。   In addition to the CPU as the control unit 10, the hardware includes a storage unit 20, a communication unit, a display unit, and an input unit. Examples of the storage unit 20 include a memory (RAM, ROM, etc.), a hard disk drive (HDD), and an optical disk (CD, DVD, etc.) drive. Examples of the communication unit include various wired and wireless interface devices. Examples of the display unit include various displays such as a liquid crystal display and a plasma display. Examples of the input unit include a keyboard and a pointing device (mouse, tracking ball, etc.).

上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶部20により記憶され、制御部10により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布することも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布することも可能である。   The software includes a computer program and data for controlling the hardware. The computer program and data are stored in the storage unit 20 and appropriately executed and referenced by the control unit 10. Further, the computer program and data can be distributed via a communication line, and can also be recorded and distributed on a computer-readable medium such as a CD-ROM.

関連バーストクエリ抽出装置1の制御部10は、集計部11(集計手段)と、変動スコア算出部12(変動スコア算出手段)と、バーストクエリ抽出部13(バーストクエリ抽出手段)と、調整部14(調整手段)と、クエリセット抽出部15(クエリセット抽出手段)と、出力部16(出力手段)とを備える。また、関連バーストクエリ抽出装置1の記憶部20は、検索ログDB(データベース)21(検索ログ記憶手段)と、変動スコアDB22と、調整後変動スコアDB23とを備える。   The control unit 10 of the related burst query extraction apparatus 1 includes a totaling unit 11 (totaling unit), a fluctuation score calculation unit 12 (fluctuation score calculation unit), a burst query extraction unit 13 (burst query extraction unit), and an adjustment unit 14. (Adjustment means), a query set extraction section 15 (query set extraction means), and an output section 16 (output means). The storage unit 20 of the related burst query extraction device 1 includes a search log DB (database) 21 (search log storage means), a fluctuation score DB 22, and an adjusted fluctuation score DB 23.

集計部11は、検索ログDB21に記憶されている検索ログに基づいて、クエリごとに、一定期間ごと(例えば15分ごと)の使用回数を集計する。   Based on the search log stored in the search log DB 21, the totaling unit 11 totals the number of uses for each fixed period (for example, every 15 minutes).

ここで、検索ログDB21は、Web上で提供されている検索サービスにおいて検索に使用されたクエリと、このクエリが使用された時刻とを関連付けて検索ログとして記憶する。検索サービスは、例えば、関連バーストクエリ抽出装置1と通信可能に接続されている検索サーバ(図示省略)において実施されていてもよいし、関連バーストクエリ抽出装置1において実施されていてもよい。   Here, the search log DB 21 stores a query used for search in a search service provided on the Web and a time when this query is used in association with each other as a search log. The search service may be implemented, for example, in a search server (not shown) that is communicably connected to the related burst query extraction device 1 or may be implemented in the related burst query extraction device 1.

図2は、本実施形態に係る検索ログDB21に格納されている検索ログテーブルの一例を示す図である。
検索ログテーブルには、検索サービスにおいて検索に使用されたクエリと、このクエリが検索に使用された時刻とが関連付けられて、検索ログとして記憶される。
FIG. 2 is a diagram illustrating an example of a search log table stored in the search log DB 21 according to the present embodiment.
In the search log table, the query used for the search in the search service and the time when the query was used for the search are associated and stored as a search log.

図3は、本実施形態に係る検索ログDB21に記憶されている検索ログ(「◎スリン」、「×帝▽子」、「○川△花」、「□山☆朗」のみ記憶されているものとする)に基づいて、集計部11により、集計された結果の一例を示す図である。ここでは、複数のクエリの所定の期間(2010/5/6 17:00〜18:44)における、一定期間(15分)ごとの使用回数について示す。図3に示される一定期間(15分)ごとの使用回数からは、変動の推移から類似するクエリを把握することも困難であることが確認できる。   FIG. 3 shows only the search logs stored in the search log DB 21 according to the present embodiment (“◎ Surin”, “× Emperor ▽ child”, “○ River △ flower”, “□ Yama ☆ Akira”). It is a figure which shows an example of the result totaled by the total part 11 based on Suppose). Here, the number of uses for a certain period (15 minutes) in a predetermined period (2010/5/6 17:00 to 18:44) of a plurality of queries is shown. It can be confirmed that it is difficult to grasp a similar query from the transition of fluctuations from the number of times of use for a certain period (15 minutes) shown in FIG.

図1に戻り、変動スコア算出部12は、集計部11により集計された使用回数の、直前の一定期間の使用回数に対する、変動率及び変動数に基づいて、クエリごとに、一定期間ごとの変動スコアを算出する。   Returning to FIG. 1, the fluctuation score calculation unit 12 changes, for each query, for each query based on the rate of change and the number of fluctuations of the number of uses counted by the counting unit 11 with respect to the number of uses for the immediately preceding fixed period. Calculate the score.

ここで、変動スコア算出部12は、全クエリの使用回数の変動による変動スコアへの影響を排除するために、集計した当該使用回数を正規化してから当該変動スコアを算出してもよい。より具体的には、変動スコア算出部12は、一定期間ごとに、当該一定期間の直前の一定期間における全クエリの使用回数を、当該一定期間における全クエリの使用回数で除算して得られる値を正規化数として算出する。続いて、変動スコア算出部12は、当該一定期間ごとの正規化数を乗算することで正規化した一定期間の使用回数の、当該一定期間の直前の一定期間の使用回数に対する、変動率及び変動数を乗算して、クエリごとに、一定期間ごとの変動スコアを算出する。   Here, the variation score calculation unit 12 may calculate the variation score after normalizing the aggregated number of times of use in order to eliminate the influence on the variation score due to variations in the number of uses of all queries. More specifically, the variation score calculation unit 12 obtains a value obtained by dividing the number of uses of all queries in a certain period immediately before the certain period by the number of uses of all queries in the certain period for each certain period. Is calculated as a normalized number. Subsequently, the variation score calculation unit 12 calculates the variation rate and variation of the number of times of use in a certain period normalized by multiplying the number of normalizations for each certain period with respect to the number of times of use in a certain period immediately before the certain period. Multiply the number to calculate a variation score for each fixed period for each query.

つまり、変動スコア算出部12は、複数の一定期間それぞれにおける使用回数を正規化し、正規化された使用回数の、一定期間の直前の使用回数に対する、変動率及び変動数に基づいて、クエリごとに、一定期間ごとの変動スコアを算出する。
続いて、変動スコア算出部12は、算出した変動スコアを変動スコアDB22に記憶させる。
なお、変動スコア算出部12は、変動率が1未満の場合、この変動率の逆数を用いて、変動スコアを算出してもよい。
That is, the fluctuation score calculation unit 12 normalizes the number of uses in each of a plurality of fixed periods, and for each query based on the fluctuation rate and the number of fluctuations of the normalized number of uses with respect to the number of uses immediately before the fixed period. , Calculate the fluctuation score for each fixed period.
Subsequently, the variation score calculation unit 12 stores the calculated variation score in the variation score DB 22.
Note that when the variation rate is less than 1, the variation score calculation unit 12 may calculate the variation score using the reciprocal of the variation rate.

図4は、本実施形態に係る変動スコアDB22に格納されている変動スコアテーブルの一例を示す図である。
変動スコアテーブルには、クエリと、このクエリが使用された期間(一定期間)と、この期間において算出された変動スコアとが関連付けられて記憶される。
FIG. 4 is a diagram illustrating an example of a variation score table stored in the variation score DB 22 according to the present embodiment.
In the variation score table, a query, a period during which the query is used (a certain period), and a variation score calculated in this period are stored in association with each other.

図1に戻り、バーストクエリ抽出部13は、変動スコアDB22に記憶されている、変動スコア算出部12により算出されたクエリごとの一定期間ごとの変動スコアが所定値を超えるクエリを、使用頻度が急上昇しているクエリであるバーストクエリとして抽出する。ここで、バーストクエリ抽出部13は、最新の一定期間において所定値を超えるクエリを、使用頻度が急上昇しているクエリであるバーストクエリとして抽出してもよい。   Returning to FIG. 1, the burst query extraction unit 13 uses a query whose frequency of use exceeds a predetermined value for each query calculated by the variation score calculation unit 12 and whose variation score for each fixed period is stored in the variation score DB 22. It is extracted as a burst query that is a rapidly increasing query. Here, the burst query extraction unit 13 may extract a query that exceeds a predetermined value in the latest fixed period as a burst query that is a query whose use frequency is rapidly increasing.

調整部14は、バーストクエリ抽出部13により抽出されたバーストクエリについて、変動スコアDB22を参照して、変動スコアのスケール調整を行う。ここで、調整部14は、最新の一定期間から遡及して変動スコアが所定値を超えている連続した一定期間の変動スコアを調整してもよい。調整部14は、調整の対象となる変動スコアの対数を計算する。続いて、調整部14は、この変動スコアの対数を調整後変動スコアとすることで、変動スコアのスケール調整を行う。具体的には、調整部14は、変動スコアが1以上の場合、変動スコアの対数を計算し、計算した値を調整後変動スコアとする。また、調整部14は、変動スコアが−1より大きく1未満の場合には、調整後変動スコアを0とする。また、調整部14は、変動スコアが−1以下の場合、変動スコアの絶対値の対数を計算し、計算した値に−1を乗算した数をスケール調整後の変動スコアとしての調整後変動スコアとする。なお、本実施形態では、調整部14は、自然対数を算出するものとするが、これに限られず、常用対数といった自然対数とは異なる対数により、対数の値を算出してもよい。
続いて、調整部14は、調整後変動スコアを調整後変動スコアDB23に記憶させる。
The adjustment unit 14 refers to the variation score DB 22 for the burst query extracted by the burst query extraction unit 13 and adjusts the scale of the variation score. Here, the adjustment unit 14 may adjust the fluctuation score of a continuous fixed period in which the fluctuation score exceeds a predetermined value retroactively from the latest fixed period. The adjustment unit 14 calculates the logarithm of the variation score to be adjusted. Subsequently, the adjustment unit 14 adjusts the scale of the variation score by using the logarithm of the variation score as the adjusted variation score. Specifically, when the variation score is 1 or more, the adjustment unit 14 calculates the logarithm of the variation score and sets the calculated value as the adjusted variation score. The adjustment unit 14 sets the adjusted variation score to 0 when the variation score is greater than −1 and less than 1. Moreover, the adjustment part 14 calculates the logarithm of the absolute value of a fluctuation score, when the fluctuation score is -1 or less, and the adjusted fluctuation score as a fluctuation score after scale adjustment is obtained by multiplying the calculated value by -1. And In the present embodiment, the adjustment unit 14 calculates the natural logarithm, but is not limited thereto, and the logarithm value may be calculated using a logarithm different from the natural logarithm such as a common logarithm.
Subsequently, the adjustment unit 14 stores the adjusted variation score in the adjusted variation score DB 23.

図5は、本実施形態に係る調整後変動スコアDB23に格納されている調整後変動スコアテーブルの一例を示す図である。
調整後変動スコアテーブルには、バーストクエリと、このバーストクエリが使用された期間(一定期間)と、この期間において算出された調整後変動スコアとが関連付けられて記憶される。
FIG. 5 is a diagram illustrating an example of the adjusted variation score table stored in the adjusted variation score DB 23 according to the present embodiment.
In the adjusted variation score table, a burst query, a period during which the burst query is used (a fixed period), and an adjusted variation score calculated in this period are stored in association with each other.

図1に戻り、クエリセット抽出部15は、一定期間ごとの変動スコアの時系列の解析により、調整後変動スコアDB23に記憶されている、調整部14による調整後変動スコアの推移が類似する複数のバーストクエリの組合せを、バーストクエリセットとして抽出する。   Returning to FIG. 1, the query set extraction unit 15 has a plurality of similar changes in the variation score adjusted by the adjustment unit 14 stored in the adjusted variation score DB 23 by analyzing the time series of the variation score for each fixed period. Are extracted as a burst query set.

ここで、クエリセット抽出部15は、バーストクエリセットの抽出において、調整部14によるスケール調整後の当該変動スコアの推移が類似する複数のバーストクエリの組合せのうち、変動スコアの差が第1の値(所定値)以上であるバーストクエリの組合せを除いて、バーストクエリの組合せをバーストクエリセットとして抽出してもよい。   Here, in the extraction of the burst query set, the query set extraction unit 15 determines that the difference in the variation score is the first among the combinations of the plurality of burst queries with similar transitions of the variation score after the scale adjustment by the adjustment unit 14. A combination of burst queries may be extracted as a burst query set, except for combinations of burst queries that are equal to or greater than a value (predetermined value).

クエリセット抽出部15の機能について、図6及び図7を参照しながら詳細に説明する。
図6は、本実施形態に係る複数のバーストクエリ(「◎スリン」、「×帝▽子」、「○川△花」、「□山☆朗」)の所定の期間(2010/5/6 17:15〜18:44)における、一定期間(15分)ごとの変動スコアの一例を示す図である。すなわち、図6(1)は、調整部14による調整前の変動スコアの一例を示す図であり、図6(2)は、調整後変動スコアの一例を示す図である。図6(1)に示されるスケール調整前の変動スコアでは、それぞれのバーストクエリの時系列の変動の推移を把握することが困難であり、変動の推移が類似するバーストクエリを把握することも困難である。これに対して、図6(2)に示される調整後変動スコアでは、スケール調整が行われたことにより、それぞれのバーストクエリの時系列の変動の推移が把握しやすくなり、この結果、変動の推移が類似するバーストクエリを把握することも容易となる。すなわち、図6(2)に示されるようにスケール調整を行うことにより、クエリセット抽出部15は、同一の原因により発生した可能性のある複数のバーストクエリの組合せの抽出を行うことができる。
The function of the query set extraction unit 15 will be described in detail with reference to FIGS.
FIG. 6 shows a predetermined period (2010/5/6) of a plurality of burst queries (“◎ Surin”, “× Emperor ▽ child”, “○ River △ flower”, “□ Yama ☆ Akira”) according to the present embodiment. 17:15 to 18:44) is a diagram illustrating an example of a variation score for each fixed period (15 minutes). 6A is a diagram illustrating an example of a variation score before adjustment by the adjustment unit 14, and FIG. 6B is a diagram illustrating an example of a variation score after adjustment. In the fluctuation score before scale adjustment shown in FIG. 6 (1), it is difficult to grasp the transition of the time series fluctuation of each burst query, and it is also difficult to grasp the burst query having the similar fluctuation transition. It is. On the other hand, in the adjusted fluctuation score shown in FIG. 6 (2), the scale adjustment is performed, so that it is easy to grasp the transition of the time series fluctuation of each burst query. It is also easy to grasp burst queries with similar transitions. That is, by performing the scale adjustment as shown in FIG. 6B, the query set extraction unit 15 can extract a combination of a plurality of burst queries that may have occurred due to the same cause.

図7は、本実施形態に係る複数のバーストクエリ(「◎スリン」、「×帝▽子」、「○川△花」、「□山☆朗」)の所定の期間(2010/5/6 17:15〜18:44)における、一定期間(15分)ごとの調整後変動スコアの差分の一例を示す図である。すなわち、図7(1)は、調整後変動スコアの差分の表の一例を示す図であり、図7(2)は、調整後変動スコアの差分のグラフの一例を示す図である。   FIG. 7 illustrates a predetermined period (2010/5/6) of a plurality of burst queries according to the present embodiment (“◎ Surin”, “× Emperor ▽ child”, “○ River △ flower”, “□ Yama ☆ Akira”). 17:15 to 18:44) is a diagram illustrating an example of the difference in the adjusted variation score after every fixed period (15 minutes). That is, FIG. 7A is a diagram illustrating an example of a table of differences in adjusted variation scores, and FIG. 7B is a diagram illustrating an example of a graph of differences in adjusted variation scores.

クエリセット抽出部15は、調整後変動スコアDB23に記憶されている複数のバーストクエリの一定期間ごとの調整後変動スコアについて、同一の一定期間の調整後変動スコアの差分を算出する。   The query set extraction unit 15 calculates the difference between the adjusted fluctuation scores for the same fixed period for the adjusted fluctuation scores for each fixed period of the plurality of burst queries stored in the adjusted fluctuation score DB 23.

続いて、クエリセット抽出部15は、当該一定期間ごとに算出した差分の時系列の推移が第1の値(例えば「0.5」)の範囲に収まっているバーストクエリの組合せを抽出する。図7に示す例では、クエリセット抽出部15は、「◎スリン」と「□山☆朗」の組合せと、「○川△花」と「×帝▽子」の組合せを抽出する。   Subsequently, the query set extraction unit 15 extracts a combination of burst queries in which the time-series transition of the difference calculated every certain period falls within the range of the first value (for example, “0.5”). In the example illustrated in FIG. 7, the query set extraction unit 15 extracts a combination of “◎ Surin” and “□ Yama ☆ Akira” and a combination of “○ River Δ Hana” and “× Emperor”.

ここで、クエリセット抽出部15は、抽出したバーストクエリのうち、当該一定期間ごとに算出した差分が第2の値(例えば「3」)以上のバーストクエリの組合せを除いて、当該一定期間ごとに算出した差分の時系列の推移が第1の値(例えば「0.5」)の範囲に収まっているバーストクエリの組合せを抽出してもよい。図7に示す例では、クエリセット抽出部15は、「◎スリン」と「□山☆朗」の組合せは差分の時系列の推移は「0.5」の範囲に収まっているものの、差分自体が「3」以上であるので除外し、結果として「○川△花」と「×帝▽子」の組合せのみを抽出することになる。   Here, the query set extraction unit 15 excludes a combination of burst queries in which the difference calculated for each fixed period of the extracted burst queries is a second value (for example, “3”) or more, for each fixed period. A combination of burst queries in which the time-series transition of the difference calculated in (1) falls within the range of the first value (for example, “0.5”) may be extracted. In the example shown in FIG. 7, the query set extraction unit 15 uses the difference itself for the combination of “◎ Surin” and “□ Yama ☆ Akira”, although the time-series transition of the difference is within the range of “0.5”. Is excluded because it is greater than or equal to “3”, and as a result, only a combination of “○ River Δ Hana” and “× Emperor” is extracted.

続いて、クエリセット抽出部15は、この抽出したバーストクエリの組合せを、当該変動スコアの推移が類似すると判定されるバーストクエリの組合せとし、当該組合せを、同一の原因でバーストした可能性のあるバーストクエリセットとする。図7に示す例では、「○川△花」と「×帝▽子」の組合せがバーストクエリセットとなる。   Subsequently, the query set extraction unit 15 may use the extracted burst query combination as a burst query combination that is determined to have similar transitions of the variation score, and the combination may be burst for the same cause. A burst query set. In the example shown in FIG. 7, a combination of “○ river Δ flower” and “× emperor ▽ child” is a burst query set.

出力部16は、クエリセット抽出部15により抽出されたバーストクエリセットを出力する。具体的には、出力部16は、関連バーストクエリ抽出装置1の表示部(図示省略)にバーストクエリセットを出力する。   The output unit 16 outputs the burst query set extracted by the query set extraction unit 15. Specifically, the output unit 16 outputs a burst query set to a display unit (not shown) of the related burst query extraction device 1.

[処理フロー]
図8は、本実施形態に係る関連バーストクエリ抽出装置1の制御部10における処理を示すフローチャートである。
[Processing flow]
FIG. 8 is a flowchart showing processing in the control unit 10 of the related burst query extraction device 1 according to the present embodiment.

ステップS1(集計ステップ)において、制御部10(集計部11)は、検索ログDB21に記憶されている検索ログに基づいて、クエリごとに、一定期間ごとの使用回数を集計する。   In step S <b> 1 (aggregation step), the control unit 10 (aggregation unit 11) aggregates the number of uses for a certain period for each query based on the search log stored in the search log DB 21.

ステップS2(変動スコア算出ステップ)において、制御部10(変動スコア算出部12)は、一定期間の直前の一定期間における全クエリの使用回数を、一定期間における全クエリの使用回数で除算することにより、一定期間ごとの正規化数を算出する。   In step S2 (fluctuation score calculation step), the control unit 10 (variation score calculation unit 12) divides the number of uses of all queries in a certain period immediately before the certain period by the number of uses of all queries in the certain period. The normalization number for every fixed period is calculated.

ステップS3(変動スコア算出ステップ)において、制御部10(変動スコア算出部12)は、ステップS1で集計された使用回数に対して正規化数を乗算することで正規化した一定期間の使用回数の、一定期間の直前の一定期間の使用回数に対する、変動率及び変動数を乗算して、クエリごとに、一定期間ごとの変動スコアを算出する。制御部10(変動スコア算出部12)は、算出した一定期間ごとの変動スコアを変動スコアDB22に記憶させる。   In step S3 (fluctuation score calculation step), the control unit 10 (variation score calculation unit 12) sets the number of times of use in a certain period normalized by multiplying the number of times used in step S1 by the normalized number. The fluctuation score for each fixed period is calculated for each query by multiplying the fluctuation rate and the fluctuation number for the number of times of use in the fixed period immediately before the fixed period. The control unit 10 (variation score calculation unit 12) stores the calculated variation score for each fixed period in the variation score DB 22.

ステップS4(バーストクエリ抽出ステップ)において、制御部10(バーストクエリ抽出部13)は、変動スコアDB22に記憶されている、ステップS3で算出されたクエリごとの一定期間ごとの変動スコアが所定値を超えるクエリを、使用頻度が急上昇しているクエリであるバーストクエリとして抽出する。ここで、制御部10(バーストクエリ抽出部13)は、最新の一定期間において所定値を超える場合、この変動スコアに対応するクエリをバーストクエリとして抽出してもよい。   In step S4 (burst query extraction step), the control unit 10 (burst query extraction unit 13) stores a predetermined value for the variation score for each query calculated in step S3 and stored in the variation score DB 22. Exceeding queries are extracted as burst queries, which are queries that are rapidly increasing in use frequency. Here, the control part 10 (burst query extraction part 13) may extract the query corresponding to this fluctuation score as a burst query, when exceeding a predetermined value in the newest fixed period.

ステップS5(調整ステップ)において、制御部10(調整部14)は、ステップS4で抽出されたバーストクエリについて、変動スコアDB22に記憶されている変動スコアのスケール調整を行う。ここで、制御部10(調整部14)は、最新の一定期間から遡及して変動スコアが所定値を超えている連続した一定期間の変動スコアを調整してもよい。制御部10(調整部14)は、調整後変動スコアを調整後変動スコアDB23に記憶させる。   In step S5 (adjustment step), the control unit 10 (adjustment unit 14) adjusts the scale of the variation score stored in the variation score DB 22 for the burst query extracted in step S4. Here, the control part 10 (adjustment part 14) may adjust the fluctuation score of the continuous fixed period retroactively from the newest fixed period and the fluctuation score exceeding predetermined value. The control unit 10 (adjustment unit 14) stores the adjusted variation score in the adjusted variation score DB 23.

ステップS6(クエリセット抽出ステップ)において、制御部10(クエリセット抽出部15)は、一定期間ごとの変動スコアの時系列の相関の解析により、調整ステップによるスケール調整後変動スコアの推移が類似する複数のバーストクエリの組合せを、バーストクエリセットとして抽出する。   In step S6 (query set extraction step), the control unit 10 (query set extraction unit 15) is similar in the transition of the variation score after the scale adjustment in the adjustment step by analyzing the time-series correlation of the variation score for each fixed period. A combination of a plurality of burst queries is extracted as a burst query set.

ステップS7(出力ステップ)において、制御部10(出力部16)は、ステップS6で抽出されたバーストクエリセットを出力する。   In step S7 (output step), the control unit 10 (output unit 16) outputs the burst query set extracted in step S6.

以上のように、本実施形態によれば、関連バーストクエリ抽出装置1は、クエリセット抽出部15により、変動スコアの相関の時系列の解析により、この変動スコアの推移が類似すると判定される複数のバーストクエリの組合せを、バーストクエリセットとして抽出する。続いて、この関連バーストクエリ抽出装置1は、出力部16により、クエリセット抽出部15により抽出されたバーストクエリセットを出力する。   As described above, according to the present embodiment, the related burst query extraction device 1 is determined by the query set extraction unit 15 to determine that the transition of the variation score is similar by analyzing the time series of the correlation of the variation score. Are extracted as a burst query set. Subsequently, the related burst query extraction device 1 outputs the burst query set extracted by the query set extraction unit 15 by the output unit 16.

よって、関連バーストクエリ抽出装置1は、当該変動スコアの推移が類似する複数のバーストクエリを、同一の原因でバーストした可能性のある複数のバーストクエリの組合せとして抽出することができ、これらのバーストクエリをリッチスニペットを共用できる候補情報として、関連バーストクエリ抽出装置1のユーザに提示することができる。   Therefore, the related burst query extraction device 1 can extract a plurality of burst queries having similar transition scores as a combination of a plurality of burst queries that may have burst due to the same cause. The query can be presented to the user of the related burst query extraction device 1 as candidate information that can share the rich snippet.

また、関連バーストクエリ抽出装置1は、一定期間ごとに正規化数を算出し、一定期間ごとの正規化数を乗算して正規化した当該一定期間に対する使用回数の、当該一定期間の直前の一定期間に対する使用回数に対する、変動率及び変動数を乗算して、クエリごとに、一定期間ごとの変動スコアを算出するので、一定期間それぞれの全使用回数が変わらなかったとした場合の変動スコアを算出できる。これにより、関連バーストクエリ抽出装置1は、複数の一定期間の全使用回数の変動による変動スコアへの影響を考慮して、正規化したクエリの使用回数に基づく変動スコアを算出することができる。   Further, the related burst query extraction device 1 calculates a normalization number for each fixed period, and multiplies the normalization number for each fixed period to normalize the number of times of use for the fixed period before the fixed period. By multiplying the number of uses for the period by the rate of change and the number of fluctuations, the change score for each fixed period is calculated for each query, so the change score can be calculated when the total number of uses for each fixed period has not changed. . Thereby, the related burst query extraction device 1 can calculate the variation score based on the normalized number of times of use of the query in consideration of the influence on the variation score due to the variation of the total number of times of use for a plurality of fixed periods.

また、関連バーストクエリ抽出装置1は、調整後変動スコアの差が所定の値以上であるバーストクエリの組合せを除いて調整後変動スコアの推移が類似する複数バーストクエリを抽出する。これにより、関連バーストクエリ抽出装置1は、変動スコアの推移が類似していることに加えて、当該変動スコアの差が当該所定の値未満のバーストクエリの組合せのみをさらに選別して、クエリセットとして抽出することができる。   Further, the related burst query extraction device 1 extracts a plurality of burst queries having similar transitions of the adjusted fluctuation score except for a combination of burst queries in which the difference of the adjusted fluctuation score is a predetermined value or more. Thereby, the related burst query extraction device 1 further selects only the combinations of burst queries whose difference in the variation score is less than the predetermined value in addition to the variation of the variation score being similar, and the query set Can be extracted as

以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。   As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.

例えば、クエリセット抽出部15は、調整部14による調整後変動スコアの推移が類似する複数のバーストクエリの組合せを、バーストクエリセットとして抽出することとしたが、これに限らない。例えば、クエリセット抽出部15は、複数のバーストクエリセットに共通するバーストクエリに、さらに共通するバーストクエリ同士の組合せも、バーストクエリセットとして抽出することとしてもよい。   For example, the query set extraction unit 15 extracts, as a burst query set, a combination of a plurality of burst queries with similar transitions of the fluctuation score after adjustment by the adjustment unit 14, but is not limited thereto. For example, the query set extraction unit 15 may extract a combination of burst queries common to burst queries common to a plurality of burst query sets as a burst query set.

上記では、2つのバーストクエリの調整後変動スコアの推移が類似する場合を示したが、クエリセット抽出部15は3以上のバーストクエリについてもバーストクエリセットとして抽出することができる。例えば、クエリセット抽出部15は、3つのバーストクエリA、B、Cがある場合、AとB、AとC、BとCの全ての組合せについて、調整後変動スコアの推移が類似する場合のみ、これら3つのクエリA、B、Cをバーストクエリセットとして抽出してもよいし、AとB、AとCが類似し、BとCが類似していない場合であっても、これら3つのクエリA、B、Cをバーストクエリセットとして抽出してもよい。このようにすれば、バーストクエリAを介して、同一の原因でバーストした可能性に配慮することができる。   In the above description, the transition of the adjusted fluctuation scores of the two burst queries is similar, but the query set extraction unit 15 can also extract three or more burst queries as burst query sets. For example, when there are three burst queries A, B, and C, the query set extraction unit 15 only applies when the transition of the adjusted variation score is similar for all combinations of A and B, A and C, and B and C. These three queries A, B, and C may be extracted as burst query sets, or even if A and B, A and C are similar, and B and C are not similar, The queries A, B, and C may be extracted as a burst query set. In this way, it is possible to consider the possibility of bursting due to the same cause via the burst query A.

図9は、本実施形態に係る複数のバーストクエリ(「◎スリン」、「×帝▽子」、「○川△花」)の所定の期間(2010/5/6 17:15〜18:44)における、一定期間(15分)ごとの調整後変動スコアの差分の別の例を示す図である。図9に示される例では、一定期間ごとに算出した差分の時系列の推移が第1の値(例えば「0.5」)の範囲に収まっているバーストクエリの組合せは、「◎スリン」と「○川△花」の組合せと、「○川△花」と「×帝▽子」の組合せとであるが、クエリセット抽出部15は、「○川△花」と「×帝▽子」と「◎スリン」の組合せを、バーストクエリセットとして抽出することとしてもよい。   FIG. 9 shows a predetermined period (2010/5/6 17: 15-18: 44) of a plurality of burst queries (“◎ Surin”, “× Emperor ▽ child”, “○ River Δ flower”) according to the present embodiment. It is a figure which shows another example of the difference of the fluctuation score after adjustment for every fixed period (15 minutes). In the example shown in FIG. 9, the burst query combination in which the time-series transition of the difference calculated every certain period falls within the range of the first value (for example, “0.5”) is “◎ Surin”. The query set extraction unit 15 uses the combination of “○ River △ Hana” and “○ River △ Hana” and “× Teiji ▽ Child”. And “◎ Surin” may be extracted as a burst query set.

1 関連バーストクエリ抽出装置
10 制御部
11 集計部
12 変動スコア算出部
13 バーストクエリ抽出部
14 調整部
15 クエリセット抽出部
16 出力部
20 記憶部
21 検索ログDB
22 変動スコアDB
23 調整後変動スコアDB
DESCRIPTION OF SYMBOLS 1 Related burst query extraction apparatus 10 Control part 11 Aggregation part 12 Fluctuation score calculation part 13 Burst query extraction part 14 Adjustment part 15 Query set extraction part 16 Output part 20 Storage part 21 Search log DB
22 Fluctuation score DB
23 Adjusted Fluctuation Score DB

Claims (4)

検索に使用されたクエリと、前記クエリが使用された時刻とを関連付けて検索ログとして記憶する検索ログ記憶手段と、
前記検索ログ記憶手段に記憶されている前記検索ログに基づいて、前記クエリごとに、一定期間ごとの使用回数を集計する集計手段と、
前記集計手段により集計された前記使用回数の、前記一定期間の直前の一定期間の使用回数に対する、変動率及び変動数に基づいて、前記クエリごとに、前記一定期間ごとの変動スコアを算出する変動スコア算出手段と、
前記変動スコア算出手段により算出された前記クエリごとの前記一定期間ごとの前記変動スコアが最新の一定期間において所定値を超えるクエリを、使用頻度が急上昇しているクエリであるバーストクエリとして抽出するバーストクエリ抽出手段と、
前記バーストクエリ抽出手段により抽出された前記バーストクエリについて、前記最新の一定期間から所定時間遡及させた第一の一定期間から前記最新の一定期間までの各一定期間で算出された各変動スコアのスケール調整を行う調整手段と、
前記第一の所定期間から前記最新の一定期間の間において、前記スケール調整後の変動スコアの推移が類似する複数の前記バーストクエリの組合せを、バーストクエリセットとして抽出するクエリセット抽出手段と、
前記クエリセット抽出手段により抽出された前記バーストクエリセットを出力する出力手段と、を備える関連バーストクエリ抽出装置。
Search log storage means for associating the query used for the search with the time when the query was used and storing it as a search log;
Based on the search log stored in the search log storage unit, for each of the queries, a totaling unit that counts the number of uses for a certain period;
A variation that calculates a variation score for each fixed period for each query based on a variation rate and a variation number with respect to the number of uses for a certain period immediately before the certain period of the number of times counted by the aggregation unit. A score calculation means;
A burst that extracts, as a burst query that is a query whose usage frequency is rapidly increasing, a query in which the variation score for each certain period of each query calculated by the variation score calculating unit exceeds a predetermined value in the latest certain period Query extraction means;
For each of the burst queries extracted by the burst query extraction means, a scale of each variation score calculated in each fixed period from a first fixed period retroactive to the latest fixed period from the latest fixed period Adjusting means for adjusting; and
Query set extraction means for extracting, as a burst query set, a combination of a plurality of the burst queries having similar transitions of the scaled variation score between the first predetermined period and the latest fixed period ;
An associated burst query extraction device comprising: output means for outputting the burst query set extracted by the query set extraction means.
前記変動スコア算出手段は、
前記一定期間ごとに、当該一定期間の直前の一定期間における全クエリの使用回数を、当該一定期間における全クエリの使用回数で除算した値を正規化数として算出し、
前記一定期間ごとの前記正規化数を乗算して正規化した当該一定期間に対する前記使用回数の、当該一定期間の直前の一定期間に対する前記使用回数に対する、変動率及び変動数を乗算して、前記クエリごとに、前記一定期間ごとの前記変動スコアを算出する請求項1に記載の関連バーストクエリ抽出装置。
The variation score calculating means includes
For each fixed period, the value obtained by dividing the number of uses of all queries in the fixed period immediately before the fixed period by the number of uses of all queries in the fixed period is calculated as a normalized number,
Multiplying the number of uses for the certain period normalized by multiplying the normalized number for each certain period, the rate of change and the number of fluctuations for the number of uses for the certain period immediately before the certain period, and The related burst query extraction device according to claim 1 , wherein the fluctuation score for each fixed period is calculated for each query.
前記クエリセット抽出手段は、前記調整手段によるスケール調整後の前記変動スコアの推移が類似する複数の前記バーストクエリの組合せのうち、当該変動スコアの差が所定の値以上である前記バーストクエリの組合せを除いて、前記バーストクエリの組合せを前記バーストクエリセットとして抽出する請求項1または2に記載の関連バーストクエリ抽出装置。 The query set extraction unit includes a combination of burst queries in which a difference between the variation scores is equal to or greater than a predetermined value among a plurality of combinations of the burst queries whose transition scores after the scale adjustment by the adjustment unit are similar. except for the associated burst query extractor device according to a combination of the burst query to claim 1 or 2 is extracted as the burst query set. 検索に使用されたクエリと、前記クエリが使用された時刻とを関連付けて検索ログとして記憶する検索ログ記憶手段を備えるバーストクエリ抽出装置が実行する方法であって、
前記検索ログ記憶手段に記憶されている前記検索ログに基づいて、前記クエリごとに、一定期間ごとの使用回数を集計する集計ステップと、
前記集計ステップにおいて集計された前記使用回数の、前記一定期間の直前の一定期間の使用回数に対する、変動率及び変動数に基づいて、前記クエリごとに、前記一定期間ごとの変動スコアを算出する変動スコア算出ステップと、
前記変動スコア算出ステップにおいて算出された前記クエリごとの前記一定期間ごとの前記変動スコアが最新の一定期間において所定値を超えるクエリを使用頻度が急上昇しているクエリであるバーストクエリとして抽出するバーストクエリ抽出ステップと、
前記バーストクエリ抽出ステップにおいて抽出された前記バーストクエリについて、前記最新の一定期間から所定時間遡及させた第一の一定期間から前記最新の一定期間までの各一定期間で算出された各変動スコアのスケール調整を行う調整ステップと、
前記第一の所定期間から前記最新の一定期間の間において、前記スケール調整後の変動スコアの推移が類似する複数の前記バーストクエリの組合せを、バーストクエリセットとして抽出するクエリセット抽出ステップと、
前記クエリセット抽出ステップにおいて抽出された前記バーストクエリセットを出力する出力ステップと、を備える方法。

A method executed by a burst query extraction device comprising search log storage means for associating and storing a query used for a search and a time when the query was used as a search log,
Based on the search log stored in the search log storage means, for each query, a totaling step of totalizing the number of uses for a certain period;
A variation that calculates a variation score for each fixed period for each query based on the variation rate and the number of variations of the number of uses counted in the aggregation step with respect to the number of uses for a certain period immediately before the certain period. A score calculating step;
A burst query that extracts a query in which the variation score for each certain period of each query calculated in the variation score calculation step exceeds a predetermined value in the latest certain period as a burst query that is a query whose use frequency is rapidly increasing An extraction step;
For each of the burst queries extracted in the burst query extraction step, the scale of each variation score calculated in each fixed period from the first fixed period retroactive to the latest fixed period from the latest fixed period An adjustment step for making adjustments;
A query set extraction step of extracting a plurality of combinations of the burst queries having similar transitions of the scaled variation score between the first predetermined period and the latest fixed period as a burst query set;
An output step of outputting the burst query set extracted in the query set extraction step.

JP2010128962A 2010-06-04 2010-06-04 Related burst query extraction apparatus and method Active JP5296011B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010128962A JP5296011B2 (en) 2010-06-04 2010-06-04 Related burst query extraction apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010128962A JP5296011B2 (en) 2010-06-04 2010-06-04 Related burst query extraction apparatus and method

Publications (2)

Publication Number Publication Date
JP2011253506A JP2011253506A (en) 2011-12-15
JP5296011B2 true JP5296011B2 (en) 2013-09-25

Family

ID=45417361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010128962A Active JP5296011B2 (en) 2010-06-04 2010-06-04 Related burst query extraction apparatus and method

Country Status (1)

Country Link
JP (1) JP5296011B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6946050B2 (en) * 2017-05-18 2021-10-06 ヤフー株式会社 Generation device, generation method and generation program
JP7008152B1 (en) * 2021-03-04 2022-01-25 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4489994B2 (en) * 2001-05-11 2010-06-23 富士通株式会社 Topic extraction apparatus, method, program, and recording medium for recording the program
JP2002351897A (en) * 2001-05-22 2002-12-06 Fujitsu Ltd Program for predicting information use frequency, device for predicting information use frequency and method for predicting information use frequency
JP2005309760A (en) * 2004-04-21 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> Search word ranking calculating method and device and program
WO2008087728A1 (en) * 2007-01-18 2008-07-24 Fujitsu Limited Keyword management program, keyword management system, and keyword management method

Also Published As

Publication number Publication date
JP2011253506A (en) 2011-12-15

Similar Documents

Publication Publication Date Title
US9934312B2 (en) Recommendation search method for search engine, device and computer readable storage medium
US9031941B2 (en) Information processing apparatus, terminal apparatus, information presentation system, calculation method of evaluation scores, and program
US20160055242A1 (en) Systems and methods for analyzing content from digital content sources
CN106447419B (en) Visitor identification based on feature selection
US8838580B2 (en) Method and system for providing keyword ranking using common affix
JP5547669B2 (en) Related word extraction device, related word extraction method, related word extraction program
JP5296011B2 (en) Related burst query extraction apparatus and method
JP6604603B2 (en) SEARCH DEVICE, SEARCH METHOD, AND PROGRAM
US8307005B1 (en) Determining reachability
US10229172B2 (en) Information processing device, information processing method, and information processing program
JP2014038480A (en) Information processing apparatus, information processing method, and program
CN110674387A (en) Method, apparatus, and computer storage medium for data search
JP5063728B2 (en) Multiple server search apparatus and method
US10262058B2 (en) Method and apparatus for evaluating search prompting system
JP2012174097A (en) Query extraction device and method
WO2016027364A1 (en) Topic cluster selection device, and search method
JP6059683B2 (en) Local topic word extraction device, local topic word extraction method, and local topic word extraction program
WO2016028948A1 (en) Method for record selection to avoid negatively impacting latency
JP5408658B2 (en) Information consistency determination device, method and program thereof
JP5386548B2 (en) Soaring word extraction apparatus and method
JP6500377B2 (en) Information processing apparatus and program
JP2009070210A (en) Device for creating ranking by category
JP2014160414A (en) Data processing device, data processing system and program
JP2019121323A (en) Information processing system
US9684697B1 (en) Ranking search results

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120904

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20121005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130612

R150 Certificate of patent or registration of utility model

Ref document number: 5296011

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250