JP2011227689A - Retrieval score calculation device and method - Google Patents
Retrieval score calculation device and method Download PDFInfo
- Publication number
- JP2011227689A JP2011227689A JP2010096588A JP2010096588A JP2011227689A JP 2011227689 A JP2011227689 A JP 2011227689A JP 2010096588 A JP2010096588 A JP 2010096588A JP 2010096588 A JP2010096588 A JP 2010096588A JP 2011227689 A JP2011227689 A JP 2011227689A
- Authority
- JP
- Japan
- Prior art keywords
- search
- period
- value
- terminal
- score calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title abstract description 12
- 238000004891 communication Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Abstract
Description
本発明は、検索スコア算出装置及び方法に関する。特に、所定期間内に使用頻度が上がった検索クエリのスコアを算出する検索スコア算出装置及び方法に関する。 The present invention relates to a search score calculation apparatus and method. In particular, the present invention relates to a search score calculation apparatus and method for calculating a score of a search query that has been used frequently within a predetermined period.
ユーザが注目されている話題について調べようとするときは、検索サービスを提供する検索サイトでその話題に係るキーワードを使用して検索を行い、情報を得ている。このキーワードは、検索サイトにおいて集計されて、注目度の高いキーワードとしてランキング表示されていることが多い。ユーザは、これらのランキング表示を見ることで、注目されている話題についての情報を他のユーザと共有することができる。 When a user tries to investigate a topic that is attracting attention, a search site that provides a search service uses a keyword related to the topic to perform a search to obtain information. In many cases, the keywords are aggregated at a search site and ranked as a keyword having a high degree of attention. By viewing these ranking displays, the user can share information about the topic that is attracting attention with other users.
キーワードの使用状況は、時期や単語によって変化する。例えば、郵便番号や有名Webサイトの名称等のように、長期間に亘って使用頻度が一定して高いキーワードもあるが、テレビ等で紹介されたり、大きなイベントが開催されたりしたことがきっかけで、一時的に急激に使用頻度が上がるキーワードもある。 The usage status of keywords changes depending on the time and words. For example, some keywords, such as zip codes and famous website names, have been used frequently over a long period of time, but they were introduced on TV, etc., or a big event was held. There are also keywords whose usage frequency increases rapidly.
そこで、これらのキーワードの使用頻度の推移について、急に使用頻度が高くなったキーワードを調べることができる装置が開示されている(例えば、特許文献1及び特許文献2)。特許文献1及び特許文献2に開示された装置は、いずれも、あるキーワードが、ある特定の期間において検索に使用された回数を基に集計して、使用頻度のランキングを決定している。
In view of this, with respect to the transition of the frequency of use of these keywords, an apparatus is disclosed that can check a keyword whose use frequency has suddenly increased (for example,
しかし、集計に使用する値をキーワードが検索に使用された回数とすると、ある特定の少数ユーザが集中的にあるキーワードを使用した場合でも、そのキーワードがランキングの上位となる可能性がある。この場合、そのキーワードは、少数ユーザ以外の大多数のユーザにとって関心のあるキーワードであるということはできない。このように、特許文献1及び特許文献2に開示された装置では、キーワードが使用された実態とランキングの結果が乖離している場合も生じ得る。
However, if the value used for tabulation is the number of times a keyword is used for a search, even if a specific minority user uses a certain keyword, the keyword may be ranked higher in the ranking. In this case, the keyword cannot be a keyword that is of interest to a majority of users other than a small number of users. As described above, in the devices disclosed in
そこで、本発明は、検索に使用されるキーワードについて、少数の者による特異な使用実態を集計結果に反映させない検索スコア算出装置及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a search score calculation apparatus and method that does not reflect the actual usage unique to a small number of people in a tabulation result for keywords used for search.
(1)検索サーバが端末から受信した所定の検索クエリの検索スコアを算出する検索スコア算出装置であって、前記検索サーバが、前記端末から受信した検索クエリ、前記検索クエリを受信した時刻及び前記検索クエリを送信した端末を特定する端末情報を関連付けて記憶する検索ログ記憶手段と、第1の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第1の値として計数する第1集計手段と、前記第1の期間とは異なる第2の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第2の値として計数する第2集計手段と、前記第1の値の前記第2の値に対する割合を検索スコアとして算出する検索スコア算出手段と、前記検索スコアを出力する出力手段と、を備える検索スコア算出装置。 (1) A search score calculation device for calculating a search score of a predetermined search query received from a terminal by the search server, wherein the search server receives the search query received from the terminal, the time when the search query is received, and Search log storage means for associating and storing terminal information for identifying a terminal that has transmitted a search query, and a terminal that has transmitted the predetermined search query for the predetermined search query received by the search server within a first period First counting means for counting the number of the terminal information as a first value, and the predetermined search query received by the search server within a second period different from the first period. Second counting means for counting the number of the terminal information of the terminal that transmitted the search query as a second value, and a ratio of the first value to the second value as a search score A search score calculation means for calculating, search score calculating device and an output means for outputting the search score.
(1)に記載の検索スコア算出装置は、検索サーバが、前記端末から受信した検索クエリ、検索クエリを受信した時刻及び検索クエリを送信した端末を特定する端末情報を関連付けて検索ログとして記憶する。そして、検索スコア算出装置は、第1の期間に対する第2の期間の所定の検索クエリについて、所定の検索クエリを送信した端末の端末情報の数を計数して第1の値を求め、第1の期間とは異なる第2の期間内に前記検索サーバが受信した所定の検索クエリについても同様にして第2の値を求める。そして、検索スコア算出装置は、第1の値の第2の値に対する割合を検索スコアとして算出し、出力する。 The search score calculation device according to (1) stores, as a search log, the search server associates the search query received from the terminal, the time when the search query was received, and the terminal information that identifies the terminal that transmitted the search query. . Then, the search score calculation apparatus obtains a first value by counting the number of terminal information of the terminal that has transmitted the predetermined search query for the predetermined search query in the second period relative to the first period, Similarly, a second value is obtained for a predetermined search query received by the search server within a second period different from the above period. Then, the search score calculation device calculates and outputs the ratio of the first value to the second value as the search score.
これにより、検索スコア算出装置は、第1の期間における所定の検索クエリの使用頻度を示す検索スコアを得ることができる。例えば、検索スコア算出装置は、所定の検索クエリ毎に検索スコアを比較することにより、第1の期間において使用頻度の高い検索クエリのランキングを作成することができる。また、検索スコア算出装置は、第1の期間に対する第2の期間において、所定の検索クエリを送信した端末の端末情報の数の割合に基づいて検索スコアを求めるので、所定の端末が所定の検索クエリを大量に送信した場合のような、特異な使用実態に起因する影響を受けずに検索スコアを求めることができる。 Thereby, the search score calculation apparatus can obtain a search score indicating the frequency of use of a predetermined search query in the first period. For example, the search score calculation device can create a ranking of search queries that are frequently used in the first period by comparing the search scores for each predetermined search query. In addition, since the search score calculation apparatus obtains a search score based on the ratio of the number of terminal information of the terminals that transmitted the predetermined search query in the second period relative to the first period, the predetermined terminal performs the predetermined search. The search score can be obtained without being affected by a specific usage situation such as when a large number of queries are transmitted.
(2)前記検索スコア算出手段は、前記第1の値及び前記第2の値それぞれの対数を用いて前記検索スコアを算出する(1)に記載の検索スコア算出装置。 (2) The search score calculation device according to (1), wherein the search score calculation means calculates the search score using the logarithm of each of the first value and the second value.
(2)に記載の検索スコア算出装置は、(1)に記載の検索スコア算出装置に加えて、第1の値及び第2の値のそれぞれの対数を用いて検索スコアを算出する。
これにより、第1の値及び第2の値が非常に大きな値であっても、取り得る値の範囲を小さくして検索スコアを算出することができる。
The search score calculation device described in (2) calculates a search score using the logarithm of each of the first value and the second value in addition to the search score calculation device described in (1).
Thereby, even if the first value and the second value are very large values, the range of possible values can be reduced and the search score can be calculated.
(3)前記第2の期間は、前記第1の期間より過去の期間である(1)又は(2)に記載の検索スコア算出装置。 (3) The search score calculation device according to (1) or (2), wherein the second period is a period before the first period.
(3)に記載の検索スコア算出装置は、(1)又は(2)に記載の検索スコア算出装置に加えて、第2の期間は、第1の期間よりも過去の期間であるとして、検索スコアを算出する。これにより、過去の検索スコアとの上昇度を検索スコアとして算出することができる。 The search score calculation apparatus according to (3) performs a search assuming that the second period is a period earlier than the first period in addition to the search score calculation apparatus according to (1) or (2). Calculate the score. Thereby, the degree of increase from the past search score can be calculated as the search score.
(4)前記第2の期間の一部は、前記第1の期間の一部と重複する(1)又は(2)に記載の検索スコア算出装置。 (4) The search score calculation apparatus according to (1) or (2), wherein a part of the second period overlaps with a part of the first period.
(4)に記載の検索スコア算出装置は、(1)又は(2)に記載の検索スコア算出装置に加えて、第2の期間の一部を、第1の期間の一部と重複させて、検索スコアを算出する。これにより、第2の期間と第1の期間とで重複する期間について、重複しない場合と比較して、当該重複する期間の端末情報の数の変化を検索スコアに反映しつつ、当該重複する期間における端末情報の数の変化による検索スコアへの影響度を軽減させることができる。 In addition to the search score calculation device according to (1) or (2), the search score calculation device according to (4) overlaps a part of the second period with a part of the first period. Calculate the search score. Thereby, about the period which overlaps with the 2nd period and the 1st period, compared with the case where it does not overlap, the change of the number of the terminal information of the overlap period is reflected in the search score, and the overlap period It is possible to reduce the influence on the search score due to the change in the number of terminal information.
(5)前記所定の検索クエリと前記第1の期間とについての入力を受け付ける入力手段を備える(1)から(4)のいずれかに記載の検索スコア算出装置。 (5) The search score calculation device according to any one of (1) to (4), further including an input unit that receives input regarding the predetermined search query and the first period.
(5)に記載の検索スコア算出装置は、(1)から(4)のいずれかに記載の検索スコア算出装置に加えて、所定の検索クエリと第1の期間についての入力を受け付ける入力手段を備える。これにより、検索スコア検出装置は、所定の検索クエリと第1の期間について入力を受け付けることができるため、入力手段が受け付けた任意の検索クエリについて検索スコアを求めることができる。また、検索スコア算出装置は、入力手段が受け付けた第1の期間の長さで検索スコアを求めることができる。例えば、検索スコア算出装置は、入力手段が受け付けた検索クエリについて、異なる長さの期間(第1の期間)についての検索スコアを求めることができる。 In addition to the search score calculation device according to any one of (1) to (4), the search score calculation device according to (5) includes an input unit that receives input regarding a predetermined search query and a first period. Prepare. Thereby, since the search score detection apparatus can accept inputs for a predetermined search query and the first period, it can obtain a search score for any search query accepted by the input means. Further, the search score calculation device can obtain the search score by the length of the first period received by the input means. For example, the search score calculation device can obtain search scores for periods (first periods) of different lengths for the search query received by the input means.
(6)検索サーバが端末から受信した所定の検索クエリの検索スコアを算出する検索スコア算出方法であって、コンピュータは、前記検索サーバが、前記端末から受信した検索クエリ、前記検索クエリを受信した時刻及び前記検索クエリを送信した端末を特定する端末情報を関連付けて記憶する検索ログ記憶手段を備え、前記コンピュータに、第1の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第1の値として計数するステップと、前記第1の期間とは異なる第2の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第2の値として計数するステップと、前記第1の値の前記第2の値に対する割合を検索スコアとして算出するステップと、前記検索スコアを出力するステップと、を実行させる検索スコア算出方法。 (6) A search score calculation method for calculating a search score of a predetermined search query received from a terminal by the search server, wherein the computer receives the search query and the search query received from the terminal by the search server Search log storage means for associating and storing time and terminal information for identifying the terminal that transmitted the search query, the computer having the search server received for the predetermined search query within a first period, Counting the number of terminal information of terminals that have transmitted a predetermined search query as a first value, and the predetermined search query received by the search server within a second period different from the first period The step of counting the number of the terminal information of the terminal that has transmitted the predetermined search query as a second value, and the second of the first value Calculating a ratio value as the search score, search score calculation method to execute, and outputting the search score.
(6)に記載の検索スコア算出方法は、(1)に記載の検索スコア算出装置と同様の効果を奏することができる。 The search score calculation method described in (6) can achieve the same effects as the search score calculation device described in (1).
本発明によれば、検索に使用されるキーワードについて、少数の者による特異な使用実態を集計結果に反映させない検索スコア算出装置及び方法を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the search score calculation apparatus and method which do not reflect the specific use actual condition by a few persons in a total result about the keyword used for a search can be provided.
以下、本発明の実施形態について図面を参照して説明する。なお、以下に説明する実施形態は、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。 Embodiments of the present invention will be described below with reference to the drawings. The embodiment described below is merely an example, and the technical scope of the present invention is not limited to this.
図1を参照して、本発明の一実施形態に係る検索スコア算出装置10について説明する。図1は、Web検索システム1の全体構成及び検索スコア算出装置10の機能ブロックを示す図である。
A search
検索スコア算出装置10は、通信ネットワークNに接続され、検索サーバ20から、検索サーバ20で受け付けられた検索クエリを受信して記憶する。そして、検索スコア算出装置10は、記憶した検索クエリについて、検索サーバ20における使用頻度を示す検索スコアを算出する。
The search
通信ネットワークNは、光回線やADSL(Asymmetric Digital Subscriber Line)等の有線通信網(公衆回線網)や、携帯電話あるいはPHS等を端末とした移動体通信網により形成される。通信ネットワークNは、具体的には、LAN(Local Area Network)やインターネット等のコンピュータネットワークにより構成される。 The communication network N is formed by an optical line, a wired communication network (public line network) such as an ADSL (Asymmetric Digital Subscriber Line), or a mobile communication network having a mobile phone or PHS as a terminal. Specifically, the communication network N is configured by a computer network such as a LAN (Local Area Network) or the Internet.
検索サーバ20は、検索エンジン21を有し、検索サービスを提供する。
The
端末30は、ユーザが使用する端末である。また、端末30は、いわゆるパーソナルコンピュータであり、端末30の動作を制御するCPU(Central Processing Unit、中央処理装置)、キーボード及びマウス等の入力手段、ディスプレイ等の表示手段を少なくとも備える。なお、図1に示す端末30は、2台であるがこれよりも多い台数でもよい。
The
検索スコア算出装置10は、検索サーバ20から受信した検索クエリについてのログ情報(以下、検索ログとする)を主として記憶する記憶部11と、検索スコア算出装置10への入力操作等を受け付ける操作部12と、検索スコア算出装置10における各種処理の処理結果を表示する表示部13と、検索スコア算出装置10における各種処理を実行する制御部14と、を備える。
The search
記憶部11は、ハードディスク装置や光磁気ディスク装置、ROM(Read Only Memory)等の不揮発性のメモリ、RAM(Random Access Memory)等の揮発性のメモリ、あるいはこれらの組み合わせによるコンピュータ読み取り可能及び書き込み可能な記憶媒体により構成される。
The
記憶部11は、検索ログ記憶手段として、検索スコア算出装置10が検索サーバ20から受信した検索ログを記憶する検索ログDB(Database;データベース)111を備える。検索ログDB111は、検索ログテーブル50を記憶する。
The
ここで、図2を参照して検索ログテーブル50について説明する。図2は、検索ログテーブル50を示す図である。 Here, the search log table 50 will be described with reference to FIG. FIG. 2 is a diagram showing the search log table 50.
検索ログテーブル50は、「検索クエリ」欄、「受信時刻」欄及び「端末IP」欄を有し、それぞれ関連付けられている。「検索クエリ」欄には、検索サーバ20が端末30から受け付けた検索クエリが格納される。また、「受信時刻」欄には、検索サーバ20が当該検索クエリを端末30から受信して受け付けた時刻が格納される。また、「端末IP」欄には、当該検索クエリを検索サーバ20に送信した端末のIP(Internet Protocol)アドレスが格納される。端末IPは、所定の検索クエリを検索サーバ20に送信した端末30を特定するための端末情報として用いられる情報である。
The search log table 50 has a “search query” column, a “reception time” column, and a “terminal IP” column, which are associated with each other. In the “search query” column, a search query received from the terminal 30 by the
図1に戻って、操作部12は、検索スコア算出装置10に対する入力の受付を行うものであり、キーボード、マウス、タッチペン、タッチパネル等により構成されるものとする。本実施形態では、操作部12は、検索スコアを算出させるための情報となる第1の期間、所定の検索クエリ及び第2の期間についての入力を受け付ける。
Returning to FIG. 1, the
表示部13は、データの入力を受け付ける画面を表示したり、検索スコア算出装置10による検索スコアの算出結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
The
制御部14は、CPU等により構成されており、検索スコア算出装置10の各処理の実行を制御する。制御部14は、下記の各部の機能を実現するためのプログラムを記憶部11から読み込んで実行することによりその機能を実現させるものであってもよいし、また、専用のハードウェアにより実現されるものであってもよい。
The
制御部14は、検索サーバ20から検索ログを受信し、受信した検索ログを検索ログDB111に記憶させる検索ログ取得部140と、第1の期間、第2の期間及び所定の検索クエリについて、操作部12から入力を受け付ける入力手段としての入力受付部141と、所定の検索クエリについて第1の期間における第1の値を求める第1集計手段としての第1集計部142と、所定の検索クエリについて、第2の期間における第2の値を求める第2集計手段としての第2集計部143と、第1の値及び第2の値から検索スコアを算出する検索スコア算出手段としての検索スコア算出部144と、検索スコアを出力する出力手段としての出力部145と、を備える。
The
検索ログ取得部140は、検索サーバ20が端末30から受信した検索クエリについてのログ情報を検索サーバ20から受信する。そして、検索ログ取得部140は、受信した検索ログを検索ログDB111に記憶させる。検索ログ取得部140は、所定期間毎に検索サーバ20に検索ログを送信する要求を送信し、検索サーバ20から検索ログを受信してもよく、また、検索ログを記憶する所定のデータベースから検索ログを受信してもよい。
The search
入力受付部141は、第1の期間、第2の期間及び所定の検索クエリについての入力を操作部12を介して受け付ける。ここで、第1の期間は、入力受付部141が受け付けた所定の長さを有する期間をいう。例えば、入力受付部141は、第1の期間、第2の期間及び所定の検索クエリそれぞれについての入力欄を表示部13に表示させ、操作部12による入力を受け付ける。なお、入力受付部141は、通信ネットワークNを介して、端末30から入力を受け付けてもよい。
The
第1集計部142は、所定の検索クエリについて第1の期間における第1の値を求める。詳細には、第1集計部142は、検索ログテーブル50を参照して、第1の期間において所定の検索クエリを検索サーバ20に送信した端末IPの数を第1の値として計数する。このとき、第1集計部142は、重複する端末IPを1つの端末IPにまとめて、所定の検索クエリを受信した回数を計数する。すなわち、第1集計部142は、第1の期間における所定の検索クエリを検索サーバ20に送信した端末30の数に基づいて第1の値を求める。
The
第2集計部143は、所定の検索クエリについて、第2の期間における第2の値を求める。第2の期間は、第1の期間と重複せず、かつ第1の期間よりも過去の期間であることが好ましく、例えば、第1の期間の長さよりも長い期間である。第2集計部143は、検索ログテーブル50を参照して、第2の期間内において所定の検索クエリを検索サーバ20に送信した端末IPの数を第2の値として計数する。このとき、第2集計部143は、第1集計部142と同様に、重複する端末IPを1つの端末IPにまとめて、所定の検索クエリを受信した回数を計数する。すなわち、第2集計部143は、第2の期間における所定の検索クエリを検索サーバ20に送信した端末30の数に基づいて第2の値を求める。
The 2nd totaling
なお、第2の期間は、第1の期間と重複しないこととしたが、これに限らない。例えば、第2の期間の一部を、第1の期間の一部と重複させてもよい。このようにすることで、第2の期間と第1の期間とで重複する期間について、後述の検索スコア算出部144により算出される検索スコアへの影響度を軽減させることができる。すなわち、第1の期間の一部と第2の期間の一部とが重複した場合、その重複した期間における第1の値及び第2の値には、重複する期間における変化量が反映されることになる。ただし、検索スコアとしては、当該重複した期間における変化量が互いに相殺されて、重複しない場合と比較して、当該変化量による検索スコアに対する影響を軽減させることができる。
Note that although the second period does not overlap with the first period, the present invention is not limited to this. For example, a part of the second period may overlap with a part of the first period. By doing in this way, the influence degree to the search score calculated by the search
検索スコア算出部144は、第1の値及び第2の値を用いて検索スコアを算出する。検索スコア算出部144は、以下の計算式により検索スコアを算出する。
この検索スコアの値は、第1の値と第2の値の積が大きい場合に、高くなる。例えば、第1の期間を所定の日とし、第2の期間を、所定の日の前日から前2週間として、複数の検索クエリの検索スコアを算出したとする。この場合、複数の検索クエリにおいて、相対的に検索スコアが高い検索クエリは、他の検索クエリに比べて、相対的に第1の値と第2の値の積が大きいものとなる。つまり、この検索クエリは、第1の値が相対的に大きく、第2の値が相対的に小さい可能性が高いものとなる。このように、検索スコアが高い検索クエリは、他の検索クエリに比べて所定の日において他の検索クエリに比べて急上昇した検索クエリである、と考えることができる。 The value of this search score becomes high when the product of the first value and the second value is large. For example, it is assumed that the search scores of a plurality of search queries are calculated by setting the first period as a predetermined day and the second period as two weeks before the previous day of the predetermined day. In this case, in a plurality of search queries, a search query having a relatively high search score has a relatively larger product of the first value and the second value than other search queries. That is, this search query has a high possibility that the first value is relatively large and the second value is relatively small. Thus, a search query with a high search score can be considered as a search query that has risen sharply compared to other search queries on a given day compared to other search queries.
ここで、正規化係数とは、第2の期間において検索サーバ20が受信した全検索クエリの検索数をいう。これにより、全検索クエリの検索数の変動に応じた検索スコアを求めることができる。
Here, the normalization coefficient means the number of searches of all search queries received by the
また、検索スコア算出部144は、検索スコアを算出する際に、上記式(1)を汎化させて、以下の計算式により検索スコアを算出してもよい。
ここで、検索スコア算出部144は、第1の値について、式(1)における第1の値、すなわち、第1の期間において所定の検索クエリを検索サーバ20に送信した端末IPの数を使用してもよい。また、検索スコア算出部144は、第1の値について、第1の期間において最も多く検索サーバ20が受信した検索クエリを、当該検索クエリを送信した端末IPの数で正規化した値を使用してもよい。すなわち、下記の式(5)で求めた値を使用してもよい。
また、検索スコア算出部144は、第2の値について、以下の式を使用して算出した値を使用してもよい。例えば、第2の期間において、第2の期間における端末IPの総数の半数以上の端末IPの端末30が送信した検索クエリに対して負の値を与えてもよい。すなわち、以下の式(6)を使用してもよい。
また、第2の値は、第2の期間における、最も使用回数の多い検索クエリの値と所定の検索クエリの使用回数との比率を使用してもよい。すなわち、以下の式(7)を使用してもよい。
また、正規化係数については、集計データの全クエリに対するスコアの二乗和を1にしてもよい。すなわち、以下の式(8)を使用して、第1の期間及び第2の期間を固定とした場合に、検索クエリ間で比較したいときにコサイン正規化を行うことができる。
出力部145は、検索スコア算出部144が算出した検索スコアを出力する。本実施形態では、出力部145は、検索スコアを表示部13に表示させる。また、出力部145は、通信ネットワークNを介して端末30に検索スコアを送信してもよい。
The
図3を参照して、検索スコア算出装置10が検索スコアを算出する処理について説明する。図3は、検索スコア算出装置10が検索スコアを算出する処理の流れを示すフローチャートである。
With reference to FIG. 3, the process in which the search
ステップS11では、制御部14の入力受付部141は、第1の期間、第2の期間、所定の検索クエリについての入力を受け付ける。
In step S11, the
ステップS12では、制御部14の第1集計部142は、第1の値を集計する。第1集計部142は、検索ログDB111を参照して、第1の期間における所定の検索クエリを検索サーバ20に送信した端末30の数(端末IPの数)を第1の値として計数する。
In step S12, the first totaling
ステップS13では、制御部14の第2集計部143は、第2の値を集計する。第2集計部143は、検索ログDB111を参照して、第2の期間における所定の検索クエリを検索サーバ20に送信した端末30の数(端末IPの数)を第2の値として計数する。
In step S13, the second totaling
ステップS14では、制御部14の検索スコア算出部144は、検索スコアを算出する。検索スコア算出部144は、第1集計部142が求めた第1の値及び第2集計部143が求めた第2の値から、検索スコアを算出する。
In step S14, the search
ステップS15では、制御部14の出力部145は、検索スコア算出部144が算出した検索スコアを表示部13に出力し、本フローチャートの処理を終了する。
In step S15, the
上述の実施形態によれば、検索スコア算出装置10は、検索クエリを検索サーバ20に送信した端末30を特定する端末情報と共に検索ログを記憶する検索ログDB111を備える。また、検索スコア算出装置10は、検索ログDB111に記憶された端末情報に基づいて、所定の検索クエリを検索サーバ20に送信した端末数を計数して第1の値を求める第1集計部142及び第2集計部143を備える。このため、例えばごく少数の端末から大量に同じ検索クエリを検索サーバ20が受信した場合に、検索スコア算出装置10は、同じ端末30から同じ検索クエリを受信した回数が検索スコアに反映するのを防止することができる。このような場合は、多くのユーザが着目している検索クエリとはいえないためである。本実施形態によれば、検索スコア算出装置10は、多数のユーザが使用した検索クエリについて正確に検索スコアを求めることができる。
According to the above-described embodiment, the search
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
1 検索システム
10 検索スコア算出装置
11 記憶部
12 操作部
13 表示部
14 制御部
20 検索サーバ
21 検索エンジン
30 端末
111 検索ログDB
140 検索ログ取得部
141 入力受付部
142 第1集計部
143 第2集計部
144 検索スコア算出部
145 出力部
N 通信ネットワーク
DESCRIPTION OF
140 Search
Claims (6)
前記検索サーバが、前記端末から受信した検索クエリ、前記検索クエリを受信した時刻及び前記検索クエリを送信した端末を特定する端末情報を関連付けて記憶する検索ログ記憶手段と、
第1の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第1の値として計数する第1集計手段と、
前記第1の期間とは異なる第2の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第2の値として計数する第2集計手段と、
前記第1の値の前記第2の値に対する割合を検索スコアとして算出する検索スコア算出手段と、
前記検索スコアを出力する出力手段と、を備える検索スコア算出装置。 A search score calculation device for calculating a search score of a predetermined search query received by a search server from a terminal,
A search log storage unit that stores the search query received from the terminal, the time when the search query is received, and the terminal information that identifies the terminal that transmitted the search query;
First counting means for counting, as a first value, the number of terminal information of terminals that have transmitted the predetermined search query for the predetermined search query received by the search server within a first period;
For the predetermined search query received by the search server within a second period different from the first period, the number of the terminal information of the terminal that has transmitted the predetermined search query is counted as a second value. A second counting means;
Search score calculating means for calculating a ratio of the first value to the second value as a search score;
A search score calculation device comprising: output means for outputting the search score.
請求項1に記載の検索スコア算出装置。 The search score calculation device according to claim 1, wherein the search score calculation means calculates the search score using the logarithm of each of the first value and the second value.
請求項1又は2に記載の検索スコア算出装置。 The search score calculation apparatus according to claim 1, wherein the second period is a period that is past the first period.
請求項1又は2に記載の検索スコア算出装置。 The search score calculation device according to claim 1 or 2, wherein a part of the second period overlaps with a part of the first period.
請求項1から4のいずれかに記載の検索スコア算出装置。 The search score calculation apparatus according to any one of claims 1 to 4, further comprising an input unit that receives an input regarding the predetermined search query and the first period.
コンピュータは、前記検索サーバが、前記端末から受信した検索クエリ、前記検索クエリを受信した時刻及び前記検索クエリを送信した端末を特定する端末情報を関連付けて記憶する検索ログ記憶手段を備え、
前記コンピュータに、
第1の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第1の値として計数するステップと、
前記第1の期間とは異なる第2の期間内に前記検索サーバが受信した前記所定の検索クエリについて、前記所定の検索クエリを送信した端末の前記端末情報の数を第2の値として計数するステップと、
前記第1の値の前記第2の値に対する割合を検索スコアとして算出するステップと、
前記検索スコアを出力するステップと、を実行させる検索スコア算出方法。 A search score calculation method in which a search server calculates a search score of a predetermined search query received from a terminal,
The computer includes a search log storage unit that stores the search query received from the terminal by the search server, the time when the search query is received, and the terminal information that identifies the terminal that transmitted the search query in association with each other.
In the computer,
For the predetermined search query received by the search server within a first period, counting the number of terminal information of the terminal that has transmitted the predetermined search query as a first value;
For the predetermined search query received by the search server within a second period different from the first period, the number of the terminal information of the terminal that has transmitted the predetermined search query is counted as a second value. Steps,
Calculating a ratio of the first value to the second value as a search score;
A search score calculation method for executing the step of outputting the search score.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010096588A JP5216042B2 (en) | 2010-04-20 | 2010-04-20 | Search score calculation apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010096588A JP5216042B2 (en) | 2010-04-20 | 2010-04-20 | Search score calculation apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011227689A true JP2011227689A (en) | 2011-11-10 |
JP5216042B2 JP5216042B2 (en) | 2013-06-19 |
Family
ID=45042963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010096588A Active JP5216042B2 (en) | 2010-04-20 | 2010-04-20 | Search score calculation apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5216042B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016042213A (en) * | 2014-08-13 | 2016-03-31 | ヤフー株式会社 | Extraction device, retrieval server, information processing device, extraction system, extraction method, and extraction program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004013417A (en) * | 2002-06-05 | 2004-01-15 | Matsushita Electric Ind Co Ltd | Output device and method of advertisement information |
JP2004206517A (en) * | 2002-12-26 | 2004-07-22 | Nifty Corp | Hot keyword presentation method and hot site presentation method |
JP2005309760A (en) * | 2004-04-21 | 2005-11-04 | Nippon Telegr & Teleph Corp <Ntt> | Search word ranking calculating method and device and program |
JP2007102588A (en) * | 2005-10-05 | 2007-04-19 | Keirin Hirabayashi | Ranking information providing device |
WO2008087728A1 (en) * | 2007-01-18 | 2008-07-24 | Fujitsu Limited | Keyword management program, keyword management system, and keyword management method |
-
2010
- 2010-04-20 JP JP2010096588A patent/JP5216042B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004013417A (en) * | 2002-06-05 | 2004-01-15 | Matsushita Electric Ind Co Ltd | Output device and method of advertisement information |
JP2004206517A (en) * | 2002-12-26 | 2004-07-22 | Nifty Corp | Hot keyword presentation method and hot site presentation method |
JP2005309760A (en) * | 2004-04-21 | 2005-11-04 | Nippon Telegr & Teleph Corp <Ntt> | Search word ranking calculating method and device and program |
JP2007102588A (en) * | 2005-10-05 | 2007-04-19 | Keirin Hirabayashi | Ranking information providing device |
WO2008087728A1 (en) * | 2007-01-18 | 2008-07-24 | Fujitsu Limited | Keyword management program, keyword management system, and keyword management method |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016042213A (en) * | 2014-08-13 | 2016-03-31 | ヤフー株式会社 | Extraction device, retrieval server, information processing device, extraction system, extraction method, and extraction program |
Also Published As
Publication number | Publication date |
---|---|
JP5216042B2 (en) | 2013-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11710054B2 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
US9380073B2 (en) | Reputation system in a default network | |
KR101956691B1 (en) | Presenting images as search results | |
US20180293278A1 (en) | Usability and resource efficiency using comment relevance | |
US20120290551A9 (en) | System And Method For Identifying Trending Targets Based On Citations | |
US10606895B2 (en) | Multiple entity aware typeahead in searches | |
WO2013066647A1 (en) | Ranking of entity properties and relationships | |
WO2011159992A1 (en) | A system and method for search of sources and targets based on relative expertise of the sources | |
WO2015066591A1 (en) | Ranking information providers | |
JP2015079395A (en) | Information processing device, method, and program | |
JP5985543B2 (en) | Information aggregation device, information aggregation method, and information aggregation program | |
US8682892B1 (en) | Ranking search results | |
US10298701B2 (en) | Systems and methods for timely propagation of network content | |
JP5139493B2 (en) | Question answer search apparatus, method and program | |
US10795894B2 (en) | Hybrid facet counting using different sampling rates | |
US20170323019A1 (en) | Ranking information providers | |
US20150169579A1 (en) | Associating entities based on resource associations | |
US20160132602A1 (en) | Guided search | |
US20110313988A1 (en) | System and method for search of sources and targets based on relative topicality specialization of the targets | |
JP5216042B2 (en) | Search score calculation apparatus and method | |
JP2013161472A (en) | Apparatus, method, and program for estimating difficulty of question and knowledge level of user in question/answer service | |
JP5290041B2 (en) | Information search apparatus and information search method | |
CN110442801A (en) | A kind of determination method and device of the concern user of object event | |
US20160092459A1 (en) | Translating a keyword search into a structured query | |
JP5068343B2 (en) | Article management device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120416 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20120416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120803 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120918 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121218 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20121225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5216042 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |