JP2009116422A - Query extraction method, query extractor, and query extraction program - Google Patents
Query extraction method, query extractor, and query extraction program Download PDFInfo
- Publication number
- JP2009116422A JP2009116422A JP2007285707A JP2007285707A JP2009116422A JP 2009116422 A JP2009116422 A JP 2009116422A JP 2007285707 A JP2007285707 A JP 2007285707A JP 2007285707 A JP2007285707 A JP 2007285707A JP 2009116422 A JP2009116422 A JP 2009116422A
- Authority
- JP
- Japan
- Prior art keywords
- query
- site
- clicks
- calculating
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 36
- 230000004931 aggregating effect Effects 0.000 claims 6
- 238000000034 method Methods 0.000 abstract description 15
- 230000008569 process Effects 0.000 abstract description 9
- 238000004364 calculation method Methods 0.000 description 28
- 230000005540 biological transmission Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Abstract
Description
本発明は、インターネットのポータルサイト等における検索技術に関する。 The present invention relates to a search technique in an Internet portal site or the like.
インターネット上には膨大な量の情報が存在するため、その中から所望の情報を効率的に発見するツールとして各種の検索サービスがポータルサイト等において提供されている。ユーザは、クエリ(キーワード、ターム)を入力して検索を行い、検索結果の一覧から所望のサイトを選択するといった検索操作によりサイトを閲覧する。 Since an enormous amount of information exists on the Internet, various search services are provided on portal sites and the like as tools for efficiently finding desired information from the information. The user performs a search by inputting a query (keyword, term), and browses the site by a search operation such as selecting a desired site from a list of search results.
ところで、検索サービスは、知りたい情報を掲載しているページ(記事)を探すためだけではなく、ある特定のサイトに移動するのが目的で用いられていることが多々ある。例えば、会社名、サイト名、大学名、個人名等を入力して、その主体が運営しているサイトを検索する場合である。このような場合に入力されるクエリをナビゲーショナルクエリという。 By the way, the search service is often used not only for searching a page (article) on which information desired to be found but also for the purpose of moving to a specific site. For example, when a company name, a site name, a university name, an individual name, etc. are input, a site operated by the subject is searched. A query input in such a case is called a navigational query.
また、ウェブブラウザには、ユーザが所望のウェブページのURLを予め登録しておくブックマーク機能がある。このブックマークへの登録は、一般には、ユーザが所望のウェブページをウェブブラウザ上に表示させた状態でブックマーク登録のメニュー操作を行うことで実行される。 In addition, the web browser has a bookmark function in which the URL of a desired web page is registered in advance by the user. Registration to the bookmark is generally performed by the user performing a menu operation for bookmark registration in a state where a user displays a desired web page on a web browser.
しかし、ユーザは複数のサイトを次々と辿って閲覧するため、他のウェブページへの遷移後にブックマークに登録する場合には、所望のウェブページを改めて表示させてから登録操作を行う必要があり、その操作が煩雑である。特に、ブックマークに登録されるウェブページは、そのサイトのトップページであることが多いため、ユーザの閲覧履歴を辿るのも時間がかかってしまう。 However, since the user browses a plurality of sites one after another, when registering in a bookmark after transition to another web page, it is necessary to perform a registration operation after displaying a desired web page again, The operation is complicated. In particular, since the web page registered in the bookmark is often the top page of the site, it takes time to trace the browsing history of the user.
そのため、ブックマークの代わりに検索サイトが用いられることがある。すなわち、ユーザが所望のサイトが検索結果として出力されるようなクエリを検索サイトにて選定して入力し、検索結果から所望のサイトを閲覧するのである。このことからも、ナビゲーショナルクエリは、ユーザがブックマークしていないサイトを閲覧するために入力するクエリとも換言することができる。 Therefore, a search site may be used instead of a bookmark. That is, the user selects and inputs a query that outputs a desired site as a search result at the search site, and browses the desired site from the search result. From this point of view, the navigational query can be rephrased as a query input for browsing a site that the user has not bookmarked.
検索サービスを提供するポータルサイト側でこのようなナビゲーショナルクエリと、そのナビゲーショナルクエリに対応するサイトの対応関係の情報を抽出できることは検索サービスの向上に有効である。例えば、ナビゲーショナルクエリで検索が行なわれた場合に、ナビゲーショナルクエリに対応するサイトを検索結果の先頭に持っていくこともできるし、ナビゲーショナルクエリに対応するサイトにユーザを誘導することもできるようになる。
上述したように、ナビゲーショナルクエリと対応するサイトの対応関係の情報を抽出できることは有用であるが、従来、そのための有効な方法が存在しなかった。すなわち、ナビゲーショナルクエリを抽出する方法としては、サイトのURL(Uniform Resource Locator)やサイトのタイトル等を静的に解析する方法が考えられるが、ナビゲーショナルクエリに対応するサイトは時間的に変動する可能性があり、上記のような静的な解析方法では十分に対応できないものであった。例えば、ある有名人の公式サイトとブログサイトがあり、通常であれば多くのユーザが有名人名のクエリで検索して公式サイトにアクセスしていたものが、ニュース等の時事的な影響によりユーザがブログサイトへアクセスするようになることがある。このように、ナビゲーショナルクエリは時期により変動する可能性がある。 As described above, it is useful to be able to extract information on the correspondence between sites corresponding to navigational queries, but there has been no effective method for this purpose. That is, as a method for extracting the navigational query, a method of statically analyzing the URL (Uniform Resource Locator) of the site, the title of the site, etc. can be considered, but the site corresponding to the navigational query varies with time. There is a possibility, and the static analysis method as described above is not sufficient. For example, there are official websites and blog sites of a celebrity. Normally, many users searched by celebrity name queries and accessed the official website. May come to access the site. Thus, the navigational query may vary depending on the time.
一方、特許文献1には、所定のキーワードに対して1つのURLが対応するように記憶されたデータベースを用いて検索を行ない、検索結果からのリンクに対してアクセス数をカウントすることで、ホームページに対するニーズをカウントできるようにした検索システムが開示されている。しかしながら、上述したナビゲーショナルクエリの性質を考慮したものではなく、ナビゲーショナルクエリを抽出する方法としては使用できない。
On the other hand, in
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、ナビゲーショナルクエリと対応するサイトの対応関係の情報を十分な精度で抽出することのできるクエリ抽出方法、クエリ抽出装置およびクエリ抽出プログラムを提供することにある。 The present invention has been proposed in view of the above-described conventional problems, and an object of the present invention is to provide a query extraction method capable of extracting information on correspondence between a navigational query and a corresponding site with sufficient accuracy. Another object of the present invention is to provide a query extraction device and a query extraction program.
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、クエリに対する検索一覧からの複数のサイトに対する個々の選択の履歴を示すクリックログを前記クエリ毎に集計する工程と、前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する工程と、算出された前記第1の分散値が所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する工程とを備えるクエリ抽出方法を要旨としている。
In order to solve the above problems, according to the present invention, as described in
また、請求項2に記載されるように、クエリに対する検索一覧からの複数のサイトに対する個々の選択の履歴を示すクリックログを前記クエリ毎に集計する工程と、前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する工程と、前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数率に基づく第2の分散値を算出する工程と、算出された前記第1の分散値および前記第2の分散値がそれぞれ所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する工程とを備えるクエリ抽出方法として構成することができる。
In addition, as described in
また、請求項3に記載されるように、請求項1または2のいずれか一項に記載のクエリ抽出方法において、前記第1の分散値を算出する工程は、最大クリック回数の偏差2乗からその他のクリック回数の偏差2乗和を差し引くことで前記第1の分散値を算出するようにすることができる。
Moreover, as described in
また、請求項4に記載されるように、請求項3に記載のクエリ抽出方法において、前記クエリに対する検索一覧を表示する画面には、当該検索一覧を変更するためのボタンが表示され、前記第1の分散値を算出する工程は、更に、前記表示されたボタンのクリック回数の偏差2乗を差し引くことで前記第1の分散値を算出するようにすることができる。
In addition, as described in
また、請求項5に記載されるように、請求項2に記載のクエリ抽出方法において、前記第2の分散値を算出する工程は、最大クリック回数率の偏差2乗からその他のクリック回数率の偏差2乗和を差し引くことで前記第2の分散値を算出するようにすることができる。
In addition, as described in
また、請求項6に記載されるように、請求項5に記載のクエリ抽出方法において、前記クエリに対する検索一覧と、表示された検索一覧を変更するためのボタンとが一画面上に表示され、前記第2の分散値を算出する工程は、更に、前記表示されたボタンのクリック回数率の偏差2乗を差し引くことで前記第2の分散値を算出するようにすることができる。
Further, as described in
また、請求項7に記載されるように、請求項1乃至6のいずれか一項に記載のクエリ抽出方法において、前記クリックログを集計する工程は、ユーザ毎に前記クリックログを集計し、前記分散値を算出する工程は、前記ユーザ毎のクリックログに基づいて、ユーザが2回目以降に入力したクエリに対応するクリックログを前記分散値の算出に用いるようにすることができる。
Moreover, as described in
また、請求項8、9に記載されるように、クエリ抽出装置として構成することができる。
Further, as described in
また、請求項10、11に記載されるように、クエリ抽出プログラムとして構成することができる。
Further, as described in
本発明のクエリ抽出方法、クエリ抽出装置およびクエリ抽出プログラムにあっては、検索サービスのクリックログに基づいて各クエリに対するサイト毎のクリック回数に基づく分散値を算出し、その分散値が所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出するようにしているので、ナビゲーショナルクエリと対応するサイトの対応関係の情報を十分な精度で抽出することができる。 In the query extraction method, the query extraction device, and the query extraction program of the present invention, a variance value based on the number of clicks for each site for each query is calculated based on the click log of the search service, and the variance value is equal to or greater than a predetermined value. And the site information with the highest number of clicks in the search list for the query is extracted, so the information on the correspondence between the navigational query and the corresponding site can be extracted with sufficient accuracy. .
以下、本発明の好適な実施形態につき説明する。 Hereinafter, preferred embodiments of the present invention will be described.
<システム構成>
図1は本発明の一実施形態にかかるシステムの構成例を示す図である。
<System configuration>
FIG. 1 is a diagram showing a configuration example of a system according to an embodiment of the present invention.
図1において、インターネット等のネットワーク2には、ユーザが利用する複数のクライアント端末1と、検索および閲覧の対象となるコンテンツを提供する複数のWebサーバ4と、本発明を適用した検索サーバ3とが接続されている。
In FIG. 1, a
クライアント端末1は、ユーザからクエリを入力するクエリ入力部101と、ユーザから検索実行指示を受け付ける検索実行指示受付部102と、クエリ入力部101でクエリが入力される都度に検索サーバ3に対してクエリを送信するとともに、検索実行指示受付部102で検索実行指示を受け付けた際に検索サーバ3に対してクエリを送信するクエリ送信部103とを備えている。
The
また、クライアント端末1は、検索サーバ3から推奨サイト(ナビゲーショナルクエリとして特に推奨するサイトの要約およびURL)を受信する推奨サイト受信部104と、検索サーバ3から検索一覧(検索によりヒットしたサイトの要約およびURLの一覧)を受信する検索一覧受信部105と、推奨サイト受信部104で受信した推奨サイトおよび検索一覧受信部105で受信した検索一覧に基づいて画面表示を制御する表示制御部106とを備えている。なお、推奨サイトおよび検索一覧に含まれるURLは、検索結果からのユーザによるサイト選択の履歴をクリックログとして検索サーバ3側で取得するため、サイトを直接に示すURLではなく、いったん検索サーバ3にアクセスし、そこから目的のサイトにリダイレクトするリダイレクトURLとなっている。このリダイレクトURLには、検索サーバ3へのエントリとなるURLのほか、検索に用いられたクエリや選択されたサイトを特定する情報が含まれている。
The
また、クライアント端末1は、表示制御部106によって表示された推奨サイトもしくは検索一覧からユーザによるサイト選択を受け付けるサイト選択受付部107と、このサイト選択受付部107で選択されたサイトのURL(リダイレクトURL)に応じて検索サーバ3にアクセスを行い、検索サーバ3から目的のサイトのURLへのアクセス切り替えを指示するリダイレクトレスポンスを受けて目的のサイトであるWebサーバ4にアクセスを行なうリダイレクト処理部108とを備えている。
The
クライアント端末1における機能部101〜108は、コンピュータハードウェア上で実行されるコンピュータソフトウェア(プログラム)により実現される。
The function units 101 to 108 in the
一方、検索サーバ3は、クライアント端末1からネットワーク2を介してクエリ(単にユーザにより入力されただけのクエリの場合と、検索実行指示を伴う場合とがある)を受信するクエリ受信部301と、このクエリ受信部301で受信したクエリに基づいて、単にユーザにより入力されただけのクエリの場合、ナビゲーショナルクエリDB312を検索してナビゲーショナルクエリが見つかった場合に推奨サイトとして出力するとともに、検索実行指示を伴うクエリの場合、コンテンツDB311を検索して検索一覧を出力する検索処理部302とを備えている。
On the other hand, the
また、検索サーバ3は、検索処理部302から出力された推奨サイトをネットワーク2を介してクライアント端末1に送信する推奨サイト送信部303と、検索処理部302から出力された検索一覧をネットワーク2を介してクライアント端末1に送信する検索一覧送信部304とを備えている。
In addition, the
また、検索サーバ3は、クライアント端末1からネットワーク2を介してリダイレクトURLによるアクセスを受け付け、リダイレクトレスポンスを返送するリダイレクト処理部305と、このリダイレクト処理部305が処理を行ったタイミングでリダイレクトURLからクエリおよび選択されたサイトを特定し、クリックログをクエリログDB313に記録するクリックログ収集部306とを備えている。
Further, the
また、検索サーバ3は、所定のタイミングで、クエリログDB313のクエリログに基づいて、クエリ毎にクリック回数によるナビゲーショナルクエリとしての確からしさを示す指標である第1スコア(第1の分散値)を算出してスコアリングDB314に登録する第1スコア算出部307と、クエリ毎にクリック回数率によるナビゲーショナルクエリとしての確からしさを示す指標である第2スコア(第2の分散値)を算出してスコアリングDB314に登録する第2スコア算出部308と、スコアリングDB314のスコアリング結果に基づいてナビゲーショナルクエリを抽出し、ナビゲーショナルクエリDB312に登録するナビゲーショナルクエリ抽出部309とを備えている。
Further, the
検索サーバ3における機能部301〜309は、コンピュータハードウェア上で実行されるコンピュータソフトウェア(プログラム)により実現される。
The
図2は検索サーバ3に設けられた各データベースのデータ構造例を示す図である。
FIG. 2 is a diagram showing an example of the data structure of each database provided in the
図2(a)はコンテンツDB311のデータ構造例を示しており、「クエリ」フィールドと、そのクエリに対応する「サイトURL」フィールドとを含んでいる。「サイトURL」フィールドには複数のURLが含まれてもよい。
FIG. 2A shows an example of the data structure of the
図2(b)はナビゲーショナルクエリDB312のデータ構造例を示しており、「ナビゲーショナルクエリ」フィールドと、そのナビゲーショナルクエリに対応する「サイトURL」フィールドとを含んでいる。ナビゲーショナルクエリに対応するサイトURLは原則として1つである。
FIG. 2B shows an example of the data structure of the
図2(c)はクエリログDB313のデータ構造例を示しており、「クエリ」フィールドと、そのクエリに対する検索一覧の表示順序に応じた、「1件目URLおよびクリック回数」フィールド、「1件目URLのクリック回数率」フィールド、・・・、「N件目URLおよびクリック回数」フィールド、「N件目URLのクリック回数率」フィールドと、「合計クリック回数」フィールドと、「平均クリック回数」フィールドと、「平均クリック回数率」フィールドと、「「次へ/再検索」クリック回数」フィールドと、「「次へ/再検索」クリック回数率」フィールドとを含んでいる。ここで、1〜N件目URLのクリック回数は、そのクエリに対する検索一覧から複数のユーザによりその順位のURLに対応するサイトが選択された回数の所定期間内における積算値である。合計クリック回数は、そのクエリに対する1〜N件目URLのクリック回数の合計値である。平均クリック回数は、そのクエリに対する1〜N件目URLのクリック回数の平均値である。「次へ/再検索」クリック回数は、検索時に最初に表示されるN件分の検索一覧からユーザによりサイトの選択が行なわれず、次の検索一覧ページへの切り替えや再検索が行なわれた回数である。また、「〜回数率」は、集計対象の全クエリの合計クリック回数の総和を母数にした比率である。
FIG. 2C shows an example of the data structure of the
なお、検索一覧の表示順序に応じた1〜N件目のURLについては別のテーブルで管理してもよい。また、1〜N件目URLのクリック回数率、合計クリック回数、平均クリック回数、平均クリック回数率、「次へ/再検索」クリック回数率等をテーブルに含めず、後述するスコア算出時に計算するようにしてもよい。 Note that the first to Nth URLs corresponding to the search list display order may be managed in a separate table. Also, the click frequency rate of the 1st to Nth URLs, the total click frequency, the average click frequency, the average click frequency rate, the “next / re-search” click frequency rate, etc. are not included in the table, and are calculated at the time of calculating the score described later. You may do it.
図2(d)はスコアリングDB314のデータ構造例を示しており、「クエリ」フィールドと、そのクエリに対する「第1スコア」フィールドと、「第2スコア」フィールドと、対応する「最大クリック回数(率)URL」フィールドとを含んでいる。最大クリック回数(率)URLは、第1/第2スコア計算にあたって最大クリック回数と把握したサイトに対応するURLである。なお、最大クリック回数(率)URLについては別のテーブルで管理してもよい。
FIG. 2D shows an example of the data structure of the
<動作>
図3は上述した実施形態の処理例を示すシーケンス図である。
<Operation>
FIG. 3 is a sequence diagram illustrating a processing example of the above-described embodiment.
図3において、ユーザがクライアント端末1に対してクエリ入力部101によりクエリを入力すると(ステップS101)、クライアント端末1のクエリ送信部103は検索サーバ3に対して検索実行指示を伴わないクエリを送信する(ステップS102)。
In FIG. 3, when a user inputs a query to the
検索サーバ3は、クエリ受信部301により検索実行指示を伴わないクエリを受信すると、検索処理部302によりナビゲーショナルクエリDB312を検索する(ステップS103)。この際、検索処理部302は入力されたクエリがナビゲーショナルクエリDB312に存在する場合、そのナビゲーショナルクエリに対応するサイトを推奨サイトとして出力する。そして、検索サーバ3の推奨サイト送信部303は検索処理部302の検索結果である推奨サイトをクライアント端末1に送信する(ステップS104)。
When the
クライアント端末1は、推奨サイト受信部104により推奨サイトを受信すると、表示制御部106により画面に推奨サイトを表示してユーザに提示する(ステップS105)。図4(a)は検索画面の例を示しており、クエリ入力欄11にクエリ「○○太郎」が入力された結果、推奨サイトを示す吹き出し12が表示された状態を示している。この場合、OKボタン13をクリックすることで、そのサイトにアクセスして閲覧を行なうことができる。
When the recommended site is received by the recommended
図3に戻り、その後、ユーザが検索実行指示を行なって検索実行指示受付部102により受け付けられると(ステップS106)、クライアント端末1のクエリ送信部103は検索サーバ3に対して検索実行指示を伴うクエリを送信する(ステップS107)。
Returning to FIG. 3, when the user issues a search execution instruction and is received by the search execution instruction reception unit 102 (step S106), the
検索サーバ3は、クエリ受信部301により検索実行指示を伴うクエリを受信すると、検索処理部302によりコンテンツDB311を検索し、検索一覧を出力する(ステップS108)。なお、ここでは検索処理部302がコンテンツDB311による通常の検索処理を行なうことを想定しているが、コンテンツDB311とともにナビゲーショナルクエリDB312を検索し、入力されたクエリがナビゲーショナルクエリである場合(ナビゲーショナルクエリDB312で検索にヒットしたものがある場合)には、検索一覧の最上位にナビゲーショナルクエリに対応するサイトを表示するよう表示順位の変更を行なうようにしてもよい。
When the
次いで、検索サーバ3の検索一覧送信部304は検索処理部302の検索結果である検索一覧をクライアント端末1に送信する(ステップS109)。
Next, the search
クライアント端末1は、検索一覧受信部105により検索一覧を受信すると、表示制御部106により画面に検索一覧を表示してユーザに提示する(ステップS110)。図4(b)は検索画面の例を示しており、クエリ入力欄11にクエリ「○○太郎」が入力され、検索実行指示ボタン14が押された結果、検索一覧15として「1.太郎のブログ 2.○○太郎公式サイト 3.○○太郎のファンクラブ ・・・」が表示された状態を示している。なお、検索画面の下部には検索一覧他ページ選択欄16が併せて表示され、「次へ」をクリックすることで検索一覧の次のページが表示され、ページ番号をクリックすることで任意のページの検索一覧が表示される。
When the search
図3に戻り、ユーザは検索一覧もしくは推奨サイトの表示から所望のサイトを選択し、これがサイト選択受付部107により受け付けられると(ステップS111)、クライアント端末1のリダイレクト処理部108は検索一覧もしくは推奨サイトに埋め込まれたリダイレクトURLに基づいて検索サーバ3にアクセスする(ステップS112)。検索サーバ3のリダイレクト処理部305はアクセスを受けると、目的のサイトの本来のURLへのアクセス切り替えを指示するリダイレクトレスポンスをクライアント端末1に送信する(ステップS113)。これと並行して、検索サーバ3のクリックログ収集部306はリダイレクトURLからクエリおよび選択されたサイトを特定し、クリックログをクエリログDB313に記録する(ステップS114)。なお、クリックログ収集部306は、クライアント端末1から検索サーバ3に対して検索一覧の他のページの表示が要求された場合や、再検索が要求された場合にも、クリックログをクエリログDB313に記録する。
Returning to FIG. 3, the user selects a desired site from the search list or recommended site display, and when this is received by the site selection receiving unit 107 (step S111), the
そして、クライアント端末1のリダイレクト処理部108はリダイレクトレスポンスに基づいてWebサーバ4にアクセスし(ステップS115)、Webサーバ4はクライアント端末1にページコンテンツを含むレスポンスを送信する(ステップS116)。クライアント端末1はこのレスポンスに基づいて表示を行い(ステップS117)、ユーザはコンテンツの閲覧を行なう。
Then, the
その後、所定のタイミングによるバッチ処理等により、検索サーバ3の第1スコア算出部307はクエリログDB313のクエリログに基づいて第1スコアを算出し、算出した第1スコアをスコアリングDB314に登録する(ステップS121)。また、第2スコア算出部308はクエリログDB313のクエリログに基づいて第2スコアを算出し、算出した第2スコアをスコアリングDB314に登録する(ステップS122)。スコアの算出の詳細については後述する。
After that, the first
次いで、ナビゲーショナルクエリ抽出部309はスコアリングDB314のスコアリング結果に基づいてナビゲーショナルクエリを抽出し、ナビゲーショナルクエリDB312に登録する(ステップS123)。ナビゲーショナルクエリの抽出の詳細については後述する。
Next, the navigational
このように、ユーザの入力するクエリおよびその検索結果からのサイトの選択の行動に基づいてナビゲーショナルクエリを抽出し、次回以降の検索に反映するようにしているため、時期により変動する可能性のあるナビゲーショナルクエリに適切に対応することができる。 In this way, because the navigational query is extracted based on the query entered by the user and the site selection behavior from the search result, and reflected in the subsequent search, the possibility of fluctuation depending on the time It can respond appropriately to a certain navigational query.
図5は第1スコア算出部307および第2スコア算出部308による第1スコアおよび第2スコアの算出の処理例を示す図である。
FIG. 5 is a diagram illustrating a processing example of calculation of the first score and the second score by the first
図5において、第1スコアおよび第2スコアの算出の処理を開始すると(ステップS201)、第1スコア算出部307はクエリログDB313から1つのクエリを選択する(ステップS202)。
In FIG. 5, when the calculation process of the first score and the second score is started (step S201), the first
次いで、1件目〜N件目URLのクリック回数の中で最大のものを変数$MAXに設定し(ステップS203)、平均クリック回数を変数$AVEに設定し(ステップS204)、「次へ/再検索」クリック回数を変数$BADに設定する(ステップS205)。 Next, the maximum number of clicks of the first to Nth URLs is set in the variable $ MAX (step S203), the average number of clicks is set in the variable $ AVE (step S204), and “next / The “re-search” click count is set in the variable $ BAD (step S205).
そして、クリック回数が最大のものを除く1件目〜N件目URLのクリック回数をΣの計算において毎回、変数$EACHとして、次式で第1スコアを計算する(ステップS206)。式の意味するところについては後述する。 Then, the first score is calculated by the following formula using the number of clicks of the first to Nth URLs except the one with the maximum number of clicks as the variable $ EACH in the calculation of Σ (step S206). The meaning of the formula will be described later.
第1スコア=($MAX−$AVE)2
−Σ($EACH−$AVE)2
−($BAD−$AVE)2
次いで、第2スコア算出部308は、1件目〜N件目URLのクリック回数率の中で最大のものを変数$MAXRに設定し(ステップS207)、平均クリック回数率を変数$AVERに設定し(ステップS208)、「次へ/再検索」クリック回数率を変数$BADRに設定する(ステップS209)。
First score = ($ MAX− $ AVE) 2
-Σ ($ EACH- $ AVE) 2
-($ BAD- $ AVE) 2
Next, the second
そして、クリック回数率が最大のものを除く1件目〜N件目URLのクリック回数率をΣの計算において毎回、変数$EACHRとして、次式で第2スコアを計算する(ステップS210)。式の意味するところについては後述する。 Then, the second score is calculated by the following equation using the click frequency rate of the first to Nth URLs except the one with the maximum click frequency rate as the variable $ EACH R in the calculation of Σ (step S210). The meaning of the formula will be described later.
第2スコア=($MAXR−$AVER)2
−Σ($EACHR−$AVER)2
−($BADR−$AVER)2
次いで、処理対象のクエリと算出された第1スコア、第2スコアとクリック回数(率)が最大のURLを、スコアリングDB314のクエリ、第1スコア、第2スコア、最大クリック回数(率)URLに登録する(ステップS211)。
Second score = ($ MAX R − $ AVE R ) 2
-Σ ($ EACH R- $ AVE R ) 2
- ($ BAD R - $ AVE R) 2
Next, the URL of the query to be processed and the calculated first score, second score, and the maximum number of clicks (rate), the query of the
次いで、対象となるクエリにつき処理済であるか否か判断し(ステップS212)、処理済でない場合(ステップS212のNo)は次のクエリの選択(ステップS202)に戻り、処理済である場合(ステップS212のYes)は第1スコアおよび第2スコアの算出の処理を終了する(ステップS213)。 Next, it is determined whether or not the target query has been processed (step S212). If it has not been processed (No in step S212), the process returns to the selection of the next query (step S202), and has been processed ( In step S212, Yes) ends the calculation of the first score and the second score (step S213).
図6はナビゲーショナルクエリ抽出部309によるナビゲーショナルクエリ抽出の処理例を示すフローチャートである。
FIG. 6 is a flowchart showing a processing example of navigational query extraction by the navigational
図6において、ナビゲーショナルクエリ抽出の処理を開始すると(ステップS301)、ナビゲーショナルクエリ抽出部309はスコアリングDB314から1つのクエリを選択する(ステップS302)。
In FIG. 6, when the navigational query extraction process is started (step S301), the navigational
次いで、第1スコアが所定値以上であるか否か判断し(ステップS303)、所定値以上である場合(ステップS303のYes)、続いて第2スコアが所定値以上であるか否か判断する(ステップS304)。 Next, it is determined whether or not the first score is greater than or equal to a predetermined value (step S303). If it is greater than or equal to the predetermined value (Yes in step S303), it is subsequently determined whether or not the second score is greater than or equal to the predetermined value. (Step S304).
第2スコアが所定値以上である場合(ステップS304のYes)、処理対象のクエリと最大クリック回数(率)のURLを、ナビゲーショナルクエリDB312のナビゲーショナルクエリとサイトURLに登録する(ステップS305)。 If the second score is greater than or equal to a predetermined value (Yes in step S304), the URL of the query to be processed and the maximum number of clicks (rate) is registered in the navigational query and site URL of the navigational query DB 312 (step S305). .
第1スコアが所定値以上でない場合(ステップS303のNo)、第2スコアが所定値以上でない場合(ステップS304のNo)、もしくは、ナビゲーショナルクエリDB312への登録(ステップS305)の後、対象となるクエリにつき処理済であるか否か判断し(ステップS306)、処理済でない場合(ステップS306のNo)は次のクエリの選択(ステップS302)に戻り、処理済である場合(ステップS306のYes)はナビゲーショナルクエリ抽出の処理を終了する(ステップS307)。 If the first score is not equal to or higher than the predetermined value (No in step S303), if the second score is not equal to or higher than the predetermined value (No in step S304), or after registration in the navigational query DB 312 (step S305), It is determined whether or not each query has been processed (step S306). If not processed (No in step S306), the process returns to the selection of the next query (step S302), and if processed (Yes in step S306). ) Ends the navigational query extraction process (step S307).
<第1スコアおよび第2スコアの意味>
以下、第1スコアおよび第2スコアの意味について説明する。
<The meaning of the first score and the second score>
Hereinafter, the meaning of the first score and the second score will be described.
本発明では、検索サービスにおけるクリックログのデータを解析し、ナビゲーショナルクエリと非ナビゲーショナルクエリの自動的な選別を行なっている。この際、上記の実施形態では、分散値の計算方法を応用して、ナビゲーショナルクエリとしての確からしさを示す指標である第1スコアおよび第2スコアを算出し(第1スコアおよび第2スコアは一種の分散値でもある。)、その両者が所定の閾値を超えるものをナビゲーショナルクエリとして抽出している。なお、ナビゲーショナルクエリを抽出する精度は若干低下するが、第1スコアのみを用い、その第1スコアが所定の閾値を超えるものをナビゲーショナルクエリとして抽出するようにしてもよい。 In the present invention, click log data in a search service is analyzed to automatically select a navigational query and a non-navigation query. At this time, in the above-described embodiment, the first score and the second score, which are indices indicating the probability of the navigational query, are calculated by applying the variance value calculation method (the first score and the second score are It is also a kind of variance value.), Those whose both exceed a predetermined threshold are extracted as navigational queries. Although the accuracy of extracting the navigational query is slightly lowered, only the first score may be used, and the first score exceeding a predetermined threshold may be extracted as the navigational query.
ナビゲーショナルクエリは、
(1)検索一覧における一箇所のサイトが集中してクリックされる。
(2)必ず検索一覧の1ページ目に目的のサイトが含まれる。
(3)「次へ」や「再検索」はクリックされない。
という特性を有している。
Navigational queries are
(1) One site in the search list is clicked in a concentrated manner.
(2) The target site is always included in the first page of the search list.
(3) “Next” and “Re-search” are not clicked.
It has the characteristic.
ここで、ナビゲーショナルクエリの場合は、上記の「検索一覧における一箇所のサイトが集中してクリックされる」という特性があるので、ナビゲーショナルクエリであるか否かの判定には、分散値の使用が適しているとも考えられる。分散値とは、「平均値との偏差2乗和」を「要素数」で割ったものである。一つの要素が他の要素と比べて突出していれば、分散値は高くなるので、ナビゲーショナルクエリである場合は分散値が高くなる。また、全ての要素が平均値に近ければ、分散値は小さくなる。 Here, in the case of a navigational query, since there is a characteristic that “one site in the search list is clicked in a concentrated manner”, the determination of whether or not it is a navigational query has a variance value. The use is also considered suitable. The variance value is obtained by dividing the “sum of squared deviations from the average value” by the “number of elements”. If one element is prominent compared to the other elements, the variance value is high. Therefore, in the case of a navigational query, the variance value is high. If all the elements are close to the average value, the variance value becomes small.
しかし、それぞれの要素がバラバラであれば、平均値との偏差が大きくなり、分散値も大きくなる。そのため、クリックされる箇所とされない箇所が数箇所に分かれる場合も分散値が高くなってしまい、ナビゲーショナルクエリであるか否かを正確に判定することができない。 However, if each element is disjoint, the deviation from the average value increases and the variance value also increases. For this reason, even when a portion that is not clicked is divided into several locations, the variance value becomes high, and it is not possible to accurately determine whether or not it is a navigational query.
そこで、本実施形態では、分散値をそのまま適用するのではなく、最大クリック回数の偏差2乗からその他のクリック回数の偏差2乗和を差し引くようにしている。これにより、「ある一箇所のサイトが集中してクリック」されるナビゲーショナルクエリの場合、クリック回数による偏差2乗の値は大きくなり、その他のクリック回数の偏差2乗和の値は相対的に小さくなり、全体のスコア値は大きくなる。また、クリックされる箇所とされない箇所が数箇所に分かれる場合(ナビゲーショナルクエリではない場合)、その他のクリック回数の偏差2乗和が大きくなり、スコア値を引き下げる。この手法の利点としては、クリック回数にバラつきがある場合は差分が小さくなり、さらに、均等にクリックされるような場合は、差分値が負の値となることである。その結果、一箇所のサイトのみが集中してクリックされている状態を示す指標とすることができる。 Therefore, in this embodiment, the variance value is not applied as it is, but the sum of deviation squares of other clicks is subtracted from the deviation square of the maximum clicks. As a result, in the case of a navigational query in which a certain site is clicked in a concentrated manner, the deviation squared value due to the number of clicks becomes larger, and the deviation squared sum of other clicks becomes relatively larger. It becomes smaller and the overall score value becomes larger. In addition, when the clicked part is not divided into several parts (in the case of not being a navigational query), the deviation sum of squares of other clicks becomes large, and the score value is lowered. The advantage of this method is that the difference becomes smaller when the number of clicks varies, and the difference value becomes a negative value when the number of clicks is evenly clicked. As a result, it can be used as an index indicating a state where only one site is clicked in a concentrated manner.
また、上述した「必ず検索一覧の1ページ目に目的のサイトが含まれる」というナビゲーショナルクエリの特性に基づき、計算に使用するクリック回数としては、検索一覧の最初の1ページ目に表示されるN件(例えば、10件)に制限することができる。 The number of clicks used for the calculation is displayed on the first page of the search list based on the characteristic of the navigational query that “the target site is always included in the first page of the search list” described above. The number can be limited to N (for example, 10).
図7は、横軸に、あるクエリに対する検索一覧の表示順位順のサイトをとり、縦軸に、各サイトに対する選択クリック数を示したものである。第1スコアの算出式の第1項「($MAX−$AVE)2」は図7では1番目のサイトに対応するものであり(常に1番目になるとは限らない)、第2項「−Σ($EACH−$AVE)2」は図7では2番目〜N番目のサイトについての総和である。 In FIG. 7, the horizontal axis indicates the sites in the order of display order of the search list for a certain query, and the vertical axis indicates the number of selected clicks for each site. The first term “($ MAX− $ AVE) 2 ” of the formula for calculating the first score corresponds to the first site in FIG. 7 (it is not always the first), and the second term “−” “Σ ($ EACH− $ AVE) 2 ” is the total sum for the second to Nth sites in FIG.
一方、第1スコアの算出式における第3項「−($BAD−$AVE)2」は、「「次へ」や「再検索」はクリックされない」というナビゲーショナルクエリの特性に基づき、「次へ/再検索」が行なわれたことによるナビゲーショナルクエリではないとのユーザの判断を反映させたものである。 On the other hand, the third term “− ($ BAD− $ AVE) 2 ” in the calculation formula of the first score is based on the characteristic of the navigational query that “next” or “re-search” is not clicked ”. This is a reflection of the user's judgment that the search is not a navigational query due to the “re-search / re-search”.
第2スコアは、第1スコアがクリック回数(絶対回数)に基づいて算出するのに対し、クリック回数率に基づいて算出するものである。すなわち、「検索要求が高いクエリではスコアが高くなりがち」になることから、その影響を除去するためのものである。例えば、検索回数のうちの1%がクリックされた場合を考えたとき、人気のあるサイトであるが故に検索回数が日頃から多いクエリの場合と、そうでないクエリ(検索回数が低い)の場合、クリック回数のみでスコアリングした場合では、検索回数が多いクエリの方がスコアが高くなってしまう。 The second score is calculated based on the click frequency rate, whereas the first score is calculated based on the number of clicks (absolute number). In other words, since the score tends to be high in a query with a high search request, this is to remove the influence. For example, when 1% of the number of searches is clicked, a query that is popular because it is a popular site, and a query that is not frequent (low search) In the case of scoring only by the number of clicks, a query with a higher number of searches has a higher score.
そこで、第1スコアの算出式と同様の式において、クリック回数をクリック回数率に置き換えて第2スコアを算出することで、「クリック分散の形状」に関してスコアリングを行なう。ただし、クリック回数率に基づいて算出する場合、インプレッションが低いクエリのスコアが高くなってしまうため、単独で用いるのではなく、第1スコアが所定の閾値より大きいものにつき、更に第2スコアが所定の閾値より大きいか否かを確認するのに用いる。これにより、ナビゲーショナルクエリの判定精度を高めることができる。 Therefore, scoring is performed with respect to the “shape of click distribution” by calculating the second score by replacing the click frequency with the click frequency rate in the same formula as the first score calculation formula. However, when calculating based on the click rate, the score of a query with a low impression will be high, so that it is not used alone, and a second score is predetermined for a case where the first score is larger than a predetermined threshold. It is used to confirm whether or not it is larger than the threshold value. Thereby, the determination accuracy of the navigational query can be increased.
<変形例>
ナビゲーショナルクエリがブックマークの代わりに用いられることに対応するため、ユーザが2回目以降に入力したクエリに対応するクリックログを第1スコアおよび第2スコアの算出に用いるようにすることができる。
<Modification>
Since the navigational query corresponds to being used instead of the bookmark, the click log corresponding to the query input by the user for the second time or later can be used for the calculation of the first score and the second score.
この場合の処理の流れは次のようになる。
(1)検索サーバ3は、ユーザIDによるログインにより、ユーザ毎の検索履歴を管理する。
(2)クリックログ収集部306は、クリックログをユーザID毎にクエリログDB313に記憶する。
(3)第1スコア算出部307および第2スコア算出部308は、ユーザが始めて入力したクエリに対するクリックログはスコアの算出には用いないで、第1スコアおよび第2スコアを算出する。
The flow of processing in this case is as follows.
(1) The
(2) The click
(3) The first
これにより、ユーザが一度閲覧したサイトに対するナビゲーショナルクエリを抽出することができる。 Thereby, the navigational query with respect to the site which the user browsed once can be extracted.
<総括>
以上説明したように、本発明の実施形態によれば、ナビゲーショナルクエリを精度よく自動的に抽出することができる。
<Summary>
As described above, according to the embodiment of the present invention, a navigational query can be automatically extracted with high accuracy.
そして、そのナビゲーショナルクエリを検索サービスにおいて用いることにより、例えば、
(1)ナビゲーショナルクエリに対応するサイトが検索結果の2番目以降にある場合には、表示順序を変更して先頭に移動させることで、ユーザのニーズに即応した検索結果とする。
(2)クライアント端末で入力されているクエリを取得し、そのクエリに対応するサイトをユーザにサジェストして誘導することで、ユーザの操作性を向上させる。
等の有用な用途に活用することができる。
And by using the navigational query in the search service, for example,
(1) When the site corresponding to the navigational query is in the second and subsequent search results, the display order is changed and moved to the top to obtain a search result that meets the user's needs.
(2) The user's operability is improved by acquiring a query input at the client terminal, and suggesting and guiding a site corresponding to the query to the user.
It can be used for useful applications such as.
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。 The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.
1 クライアント端末
101 クエリ入力部
102 検索実行指示受付部
103 クエリ送信部
104 推奨サイト受信部
105 検索一覧受信部
106 表示制御部
107 サイト選択受付部
108 リダイレクト処理部
2 ネットワーク
3 検索サーバ
301 クエリ受信部
302 検索処理部
303 推奨サイト送信部
304 検索一覧送信部
305 リダイレクト処理部
306 クリックログ収集部
307 第1スコア算出部
308 第2スコア算出部
309 ナビゲーショナルクエリ抽出部
311 コンテンツDB
312 ナビゲーショナルクエリDB
313 クエリログDB
314 スコアリングDB
4 Webサーバ
DESCRIPTION OF
312 Navigational Query DB
313 Query log DB
314 Scoring DB
4 Web server
Claims (11)
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する工程と、
算出された前記第1の分散値が所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する工程と
を備えたことを特徴とするクエリ抽出方法。 Aggregating a click log indicating the history of individual selections for a plurality of sites from a search list for a query for each query;
Calculating a first variance based on the number of clicks per site for each query based on the click log;
A query extraction method comprising: a query in which the calculated first variance value is equal to or greater than a predetermined value; and a step of extracting site information having the highest number of clicks in a search list for the query.
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する工程と、
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数率に基づく第2の分散値を算出する工程と、
算出された前記第1の分散値および前記第2の分散値がそれぞれ所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する工程と
を備えたことを特徴とするクエリ抽出方法。 Aggregating a click log indicating the history of individual selections for a plurality of sites from a search list for a query for each query;
Calculating a first variance based on the number of clicks per site for each query based on the click log;
Calculating a second variance value based on a click rate for each site for each query based on the click log;
A query in which the calculated first variance value and the second variance value are each equal to or greater than a predetermined value, and a step of extracting site information having the highest number of clicks in a search list for the query. Feature query extraction method.
前記第1の分散値を算出する工程は、最大クリック回数の偏差2乗からその他のクリック回数の偏差2乗和を差し引くことで前記第1の分散値を算出する
ことを特徴とするクエリ抽出方法。 In the query extraction method according to claim 1 or 2,
The step of calculating the first variance value includes calculating the first variance value by subtracting the sum of deviation squares of other clicks from the deviation square of the maximum number of clicks. .
前記クエリに対する検索一覧を表示する画面には、当該検索一覧を変更するためのボタンが表示され、
前記第1の分散値を算出する工程は、更に、前記表示されたボタンのクリック回数の偏差2乗を差し引くことで前記第1の分散値を算出する
ことを特徴とするクエリ抽出方法。 The query extraction method according to claim 3, wherein
On the screen displaying the search list for the query, a button for changing the search list is displayed.
The step of calculating the first variance value further includes calculating the first variance value by subtracting a deviation square of the number of clicks of the displayed button.
前記第2の分散値を算出する工程は、最大クリック回数率の偏差2乗からその他のクリック回数率の偏差2乗和を差し引くことで前記第2の分散値を算出する
ことを特徴とするクエリ抽出方法。 The query extraction method according to claim 2,
The step of calculating the second variance value calculates the second variance value by subtracting the sum of deviation squares of other click frequency rates from the square of the deviation of the maximum click frequency rate. Extraction method.
前記クエリに対する検索一覧と、表示された検索一覧を変更するためのボタンとが一画面上に表示され、
前記第2の分散値を算出する工程は、更に、前記表示されたボタンのクリック回数率の偏差2乗を差し引くことで前記第2の分散値を算出する
ことを特徴とするクエリ抽出方法。 The query extraction method according to claim 5, wherein
A search list for the query and a button for changing the displayed search list are displayed on one screen.
The step of calculating the second variance value further includes calculating the second variance value by subtracting the deviation square of the click frequency rate of the displayed button.
前記クリックログを集計する工程は、ユーザ毎に前記クリックログを集計し、
前記分散値を算出する工程は、前記ユーザ毎のクリックログに基づいて、ユーザが2回目以降に入力したクエリに対応するクリックログを前記分散値の算出に用いる
ことを特徴とするクエリ抽出方法。 In the query extraction method according to any one of claims 1 to 6,
The step of counting the click log includes counting the click log for each user,
The step of calculating the variance value uses the click log corresponding to the query input by the user for the second time or later on the basis of the click log for each user to calculate the variance value.
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する手段と、
算出された前記第1の分散値が所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する手段と
を備えたことを特徴とするクエリ抽出装置。 Means for aggregating, for each query, a click log indicating a history of individual selections for a plurality of sites from a search list for a query;
Means for calculating a first variance based on the number of clicks per site for each query based on the click log;
A query extraction apparatus comprising: a query in which the calculated first variance value is equal to or greater than a predetermined value; and means for extracting site information having the highest number of clicks in a search list for the query.
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する手段と、
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数率に基づく第2の分散値を算出する手段と、
算出された前記第1の分散値および前記第2の分散値がそれぞれ所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する手段と
を備えたことを特徴とするクエリ抽出装置。 Means for aggregating, for each query, a click log indicating a history of individual selections for a plurality of sites from a search list for a query;
Means for calculating a first variance based on the number of clicks per site for each query based on the click log;
Means for calculating a second variance based on the click rate for each site for each query based on the click log;
A query in which the calculated first variance value and the second variance value are each equal to or greater than a predetermined value, and means for extracting site information having the highest number of clicks in a search list for the query. A feature query extraction device.
クエリに対する検索一覧からの複数のサイトに対する個々の選択の履歴を示すクリックログを前記クエリ毎に集計する手段、
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する手段、
算出された前記第1の分散値が所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する手段、
として機能させるためのクエリ抽出プログラム。 A computer constituting the processing device,
Means for aggregating, for each query, a click log indicating a history of individual selections for a plurality of sites from a search list for a query;
Means for calculating a first variance based on the number of clicks per site for each query based on the click log;
Means for extracting a query in which the calculated first variance value is a predetermined value or more, and site information having the highest number of clicks in a search list for the query;
Query extraction program to function as.
クエリに対する検索一覧からの複数のサイトに対する個々の選択の履歴を示すクリックログを前記クエリ毎に集計する手段、
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数に基づく第1の分散値を算出する手段、
前記クリックログに基づいて、各クエリに対するサイト毎のクリック回数率に基づく第2の分散値を算出する手段、
算出された前記第1の分散値および前記第2の分散値がそれぞれ所定値以上のクエリと、当該クエリに対する検索一覧内におけるクリック回数が最上位のサイト情報を抽出する手段、
として機能させるためのクエリ抽出プログラム。
A computer constituting the processing device,
Means for aggregating, for each query, a click log indicating a history of individual selections for a plurality of sites from a search list for a query;
Means for calculating a first variance based on the number of clicks per site for each query based on the click log;
Means for calculating a second variance based on a click rate for each site for each query based on the click log;
Means for extracting a query in which the calculated first variance value and the second variance value are each equal to or greater than a predetermined value, and site information having the highest number of clicks in a search list for the query;
Query extraction program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007285707A JP4839295B2 (en) | 2007-11-02 | 2007-11-02 | Query extraction method, query extraction device, and query extraction program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007285707A JP4839295B2 (en) | 2007-11-02 | 2007-11-02 | Query extraction method, query extraction device, and query extraction program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009116422A true JP2009116422A (en) | 2009-05-28 |
JP4839295B2 JP4839295B2 (en) | 2011-12-21 |
Family
ID=40783533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007285707A Active JP4839295B2 (en) | 2007-11-02 | 2007-11-02 | Query extraction method, query extraction device, and query extraction program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4839295B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011043973A (en) * | 2009-08-20 | 2011-03-03 | Yahoo Japan Corp | Device and method for supporting information access |
JP2011191805A (en) * | 2010-03-11 | 2011-09-29 | Nippon Telegr & Teleph Corp <Ntt> | Method and device for calculation of query feature value, and program |
JP2013030113A (en) * | 2011-07-29 | 2013-02-07 | Rakuten Inc | Information processor, information processing method, information processing program, and recording medium having information processing program recorded therein |
JP2013054606A (en) * | 2011-09-05 | 2013-03-21 | Nippon Telegr & Teleph Corp <Ntt> | Document retrieval device, method and program |
JP2014099062A (en) * | 2012-11-14 | 2014-05-29 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device, information retrieval method and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090111A (en) * | 1998-09-14 | 2000-03-31 | Matsushita Electric Ind Co Ltd | Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device |
JP2000123105A (en) * | 1999-12-07 | 2000-04-28 | Adc Technology Kk | Site guidance system |
JP2005309998A (en) * | 2004-04-23 | 2005-11-04 | Fujitsu Ltd | Content navigation program, method and device |
-
2007
- 2007-11-02 JP JP2007285707A patent/JP4839295B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090111A (en) * | 1998-09-14 | 2000-03-31 | Matsushita Electric Ind Co Ltd | Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device |
JP2000123105A (en) * | 1999-12-07 | 2000-04-28 | Adc Technology Kk | Site guidance system |
JP2005309998A (en) * | 2004-04-23 | 2005-11-04 | Fujitsu Ltd | Content navigation program, method and device |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011043973A (en) * | 2009-08-20 | 2011-03-03 | Yahoo Japan Corp | Device and method for supporting information access |
JP2011191805A (en) * | 2010-03-11 | 2011-09-29 | Nippon Telegr & Teleph Corp <Ntt> | Method and device for calculation of query feature value, and program |
JP2013030113A (en) * | 2011-07-29 | 2013-02-07 | Rakuten Inc | Information processor, information processing method, information processing program, and recording medium having information processing program recorded therein |
JP2013054606A (en) * | 2011-09-05 | 2013-03-21 | Nippon Telegr & Teleph Corp <Ntt> | Document retrieval device, method and program |
JP2014099062A (en) * | 2012-11-14 | 2014-05-29 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device, information retrieval method and program |
Also Published As
Publication number | Publication date |
---|---|
JP4839295B2 (en) | 2011-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5170804B2 (en) | Related word registration device, information processing device, related word registration method, program for related word registration device, and recording medium | |
KR101708448B1 (en) | Predictive query suggestion caching | |
US9183277B1 (en) | Providing intent sensitive search results | |
US9146997B2 (en) | Customizing image search for user attributes | |
JP5084858B2 (en) | Summary creation device, summary creation method and program | |
US20110208712A1 (en) | Automated tool for human assisted mining and capturing of precise results | |
US20080104042A1 (en) | Personalized Search Using Macros | |
JP5269938B2 (en) | Soaring word association apparatus and method | |
JP4839295B2 (en) | Query extraction method, query extraction device, and query extraction program | |
US10262064B2 (en) | Information processing apparatus, information processing method, information processing program, recording medium having stored therein information processing program | |
JP5734332B2 (en) | Advertisement information providing device | |
JP2013054606A (en) | Document retrieval device, method and program | |
JP5230715B2 (en) | Search support device | |
EP2662785A2 (en) | A method and system for non-ephemeral search | |
JP5331166B2 (en) | Search server and method | |
JP2006277288A (en) | Display time measuring system, display time measuring method, retrieval system, and retrieval method | |
JP5222691B2 (en) | Search information provision system | |
KR100688344B1 (en) | Location Based Intelligent Serach Service Method | |
JP2011227572A (en) | Browsing terminal and method | |
JP2008171110A (en) | Site search system, search server, and program | |
JP5068304B2 (en) | Extraction apparatus, method and program | |
JP2011192222A (en) | Information processing apparatus, data extraction method, and program | |
KR20040074693A (en) | System and method for estimating web site | |
JP2010086180A (en) | Retrieval method for adjusting device, program and server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110927 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111003 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141007 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4839295 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |