JP2012008899A - Retrieval query recommendation method, retrieval query recommendation device and retrieval query recommendation program - Google Patents
Retrieval query recommendation method, retrieval query recommendation device and retrieval query recommendation program Download PDFInfo
- Publication number
- JP2012008899A JP2012008899A JP2010145863A JP2010145863A JP2012008899A JP 2012008899 A JP2012008899 A JP 2012008899A JP 2010145863 A JP2010145863 A JP 2010145863A JP 2010145863 A JP2010145863 A JP 2010145863A JP 2012008899 A JP2012008899 A JP 2012008899A
- Authority
- JP
- Japan
- Prior art keywords
- query
- change type
- search query
- search
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、検索クエリを推薦する技術に関する。 The present invention relates to a technique for recommending a search query.
インターネット上に大量に存在する文書から目的にあった文書を探し出すシステムとして、クエリによる検索機能を持った検索エンジンサービスが多数提供されている。これらの検索エンジンサービスにおいては、ユーザがクエリとして与えた語句群を元に、それらに適合するような内容をもった文書を探し出してユーザに提示する。この時に、ユーザの検索意図はクエリのみによってシステムに伝えられるため、ユーザは検索する際に自分の検索意図を表現しつつ、検索エンジンの処理に適したクエリを入力しなければならない。しかしながら、このような適切なクエリを作成することは、ある程度の知識や経験を必要とする作業であるため、検索エンジンに不慣れなユーザをサポートするための、ユーザにクエリを推薦するシステムのニーズが存在する。 A number of search engine services having a search function based on a query are provided as a system for searching a document suitable for a purpose from a large amount of documents existing on the Internet. In these search engine services, based on a group of words given as a query by a user, a document having contents suitable for them is searched for and presented to the user. At this time, since the search intention of the user is transmitted to the system only by the query, the user must input a query suitable for the processing of the search engine while expressing his / her search intention when searching. However, since creating such an appropriate query is a task that requires a certain amount of knowledge and experience, there is a need for a system that recommends queries to users in order to support users who are unfamiliar with search engines. Exists.
これまでクエリを推薦する手法は多数提案されている。例えば、特許文献1では、あるクエリに関するクリックログ中のアクセスの集中するサイトを特定し、それらのサイトのタイトルと概要文を解析して、当該クエリを拡張する語句を抽出する。
Many methods for recommending queries have been proposed so far. For example, in
また、非特許文献1では、クリックログを解析することにより得られるクエリと検索結果に含まれる文書のURLとの集合からなるグラフ構造を、あるクエリの周辺構造のみに注目して解析することにより、当該クエリに関連する語句を推薦クエリとして取得する。
Further, in
上記の従来の技術では、ユーザが入力したクエリのみに注目していたために、ユーザが現在より絞り込んだ検索結果が得たいのか、それとも関連した検索結果が得たいのか、といったユーザの検索傾向に関係なく推薦するクエリが決定してしまうという問題があった。 In the above conventional technology, only the query entered by the user is focused, so it is related to the user's search tendency, whether the user wants to obtain a more refined search result or a related search result. There was a problem that the recommended query was decided.
本発明は、上記に鑑みてなされたものであり、よりユーザの検索意図に沿った推薦クエリを提供することを目的とする。 The present invention has been made in view of the above, and an object of the present invention is to provide a recommendation query that more closely matches the user's search intention.
第1の本発明に係る検索クエリ推薦方法は、ユーザの検索クエリの履歴を入力し、検索クエリ間の関連性から導かれる当該検索クエリの変更意図を分類した変更タイプを判定するステップと、前記検索クエリの履歴のうちで最も新しい最後の検索クエリに対する複数の推薦クエリ候補を作成するステップと、前記最後の検索クエリから前記複数の推薦クエリ候補それぞれへ検索クエリを変更した場合の変更タイプを判定し、前記複数の推薦クエリ候補それぞれに当該変更タイプを付与するステップと、変更タイプの遷移の分布を記載した遷移テーブルを参照して前記検索クエリの履歴から判定された変更タイプから遷移する変更タイプの分布比率を取得するステップと、選択する推薦クエリに付与された変更タイプの分布比率が前記遷移テーブルから取得した分布比率と近くなるように、前記推薦クエリ候補から推薦クエリを選択するステップと、を有することを特徴とする。 The search query recommendation method according to the first aspect of the present invention includes a step of inputting a search query history of a user and determining a change type that classifies a change intention of the search query derived from a relationship between search queries, Creating a plurality of recommended query candidates for the latest search query in the search query history, and determining a change type when the search query is changed from the last search query to each of the plurality of recommended query candidates. A step of assigning the change type to each of the plurality of recommended query candidates, and a change type that transitions from the change type determined from the history of the search query with reference to a transition table that describes the distribution of the change type transition The distribution ratio of the change type assigned to the recommended query to be selected is obtained in the transition table. So close to the distribution ratio obtained from Le, and having the steps of: selecting a recommended query from the recommended query candidates.
第2の本発明に係る検索クエリ推薦装置は、時系列に並べられた検索クエリを入力し、検索クエリ間の関連性から導かれる当該検索クエリの変更意図を分類した変更タイプを判定する判定手段と、ユーザの検索クエリの履歴を入力し、前記判定手段を用いて現在の変更タイプを判定する検索タイプ判定手段と、前記検索クエリの履歴のうちで最も新しい最後の検索クエリに対する複数の推薦クエリ候補を作成し、前記判定手段を用いて前記最後の検索クエリから前記複数の推薦クエリ候補それぞれへ検索クエリを変更した場合の変更タイプを判定し、前記複数の推薦クエリ候補それぞれに当該変更タイプを付与する推薦クエリ作成手段と、変更タイプの遷移の分布を記載した遷移テーブルを参照して前記現在の変更タイプから遷移する変更タイプの分布比率を取得し、選択する推薦クエリに付与された変更タイプの分布比率が前記遷移テーブルから取得した分布比率と近くなるように、前記推薦クエリ候補から推薦クエリを選択する推薦クエリ選択手段と、を有することを特徴とする。 The search query recommendation device according to the second aspect of the present invention is a determination means for inputting a search query arranged in time series and determining a change type that classifies the change intention of the search query derived from the relationship between the search queries. A search type determination unit that inputs a search query history of the user and determines a current change type using the determination unit; and a plurality of recommended queries for the latest search query that is the latest in the search query history A candidate is created, a change type is determined when the search query is changed from the last search query to each of the plurality of recommended query candidates using the determination unit, and the change type is determined for each of the plurality of recommended query candidates. The change query that transitions from the current change type with reference to the transition table that describes the recommended query creation means to be assigned and the distribution of change type transitions Recommended query selection means for selecting a recommended query from the recommended query candidates so that the distribution ratio of the change type given to the recommended query to be selected is close to the distribution ratio acquired from the transition table. It is characterized by having.
第3の本発明に係る検索クエリ推薦プログラムは、上記検索クエリ推薦方法をコンピュータに実行させることを特徴とする。 A search query recommendation program according to a third aspect of the present invention causes a computer to execute the search query recommendation method.
本発明によれば、よりユーザの検索意図に沿った推薦クエリを提供することができる。 According to the present invention, it is possible to provide a recommendation query more in line with a user's search intention.
以下、本発明の実施の形態について図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本実施の形態における検索クエリ推薦装置の構成を示す機能ブロック図である。 FIG. 1 is a functional block diagram showing the configuration of the search query recommendation device in the present embodiment.
図1に示す検索クエリ推薦装置1は、判定部11、検索タイプ判定部12、推薦クエリ作成部13、および推薦クエリ選択部14を備える。検索クエリ推薦装置1が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは検索クエリ推薦装置1が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。
The search
判定部11は、時系列に並べられた検索クエリを入力し、検索行動の変更タイプを判定する。検索行動の変更タイプとは、検索クエリ間の関連性から導かれる、ユーザの検索クエリの変更意図を分類したものであり、例えば、検索クエリを「スポーツ」から「野球」に変更するような、より絞り込んだ情報を得ることを意図した「絞込」、検索クエリを「野球」から「スポーツ」に変更するような、より広い情報を得ることを意図した「汎化」、検索クエリを「野球」から「サッカー」に変更するような、関連した情報を得ることを意図した「関連」、上記のどれにも当てはまらない「切替」などがある。 The determination unit 11 inputs a search query arranged in time series, and determines a change type of search behavior. The search action change type is a classification of the user's intention to change the search query, which is derived from the relationship between the search queries. For example, the search query is changed from “sports” to “baseball”. “Narrow down” intended to obtain more refined information, “Generalization” intended to obtain broader information, such as changing the search query from “Baseball” to “Sports”, and “Baseball” "Relation" intended to obtain relevant information, such as changing from "soccer" to "soccer", "switching" not applicable to any of the above.
検索タイプ判定部12は、ユーザの検索クエリ履歴を入力し、判定部11を用いてユーザの検索行動の変更タイプを取得する。
The search
推薦クエリ作成部13は、ユーザの検索クエリ履歴のうち直近の検索クエリに対する複数の推薦クエリ候補を作成するとともに、直近の検索クエリを各推薦クエリ候補へ変更した場合の変更タイプを判定部11を用いて判定し、推薦クエリ候補それぞれに対して変更タイプを付与する。
The recommended
推薦クエリ選択部14は、ある変更タイプから次の変更タイプへの遷移分布を示す遷移テーブルを保持しており、検索タイプ判定部12からユーザの現在の変更タイプを入力して現在の変更タイプから遷移する変更タイプの分布比率を遷移テーブルから取得し、推薦クエリ候補から所定の数の推薦クエリを選択したときに、選択した推薦クエリに付与された変更タイプの分布比率が遷移テーブルから取得した分布比率と近くなるように推薦クエリを選択する。
The recommended
[実施例1]
図2は、実施例1の検索クエリ推薦装置の構成を示す機能ブロック図である。
[Example 1]
FIG. 2 is a functional block diagram illustrating the configuration of the search query recommendation device according to the first embodiment.
図2に示す検索クエリ推薦装置2は、判定部21、検索タイプ判定部22、推薦クエリ作成部23、推薦クエリ選択部24、およびクエリ変更集計部25を備える。クエリ変更集計部25には検索クエリログデータベース26が接続される。なお、検索クエリ推薦装置2が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは検索クエリ推薦装置2が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。
The search
まず、推薦クエリを選択する際に利用する遷移テーブルの作成について説明する。遷移テーブルは、検索クエリログデータベース26から連続する3つの検索クエリを取得して検索クエリの変更タイプの遷移を集計して作成する。
First, the creation of a transition table used when selecting a recommended query will be described. The transition table is created by acquiring three consecutive search queries from the search
検索クエリログデータベース26は、商用のウェブ検索エンジンや、ウェブサイトに設置されているサイト内検索機能に入力された検索クエリを、検索クエリを入力した入力時刻情報と入力したユーザID情報とともに格納している。ユーザID情報は、ウェブブラウザのクッキー情報等を用いて取得される情報を使用する。ユーザID情報は、検索クエリの前後関係が判定できればよいので、ウェブサーバ側に記録されるセッション情報等を用いてもよい。図3に検索クエリログデータベース26に格納される情報の例を示す。
The search
クエリ変更集計部25は、検索クエリログデータベース26にアクセスして検索クエリの変更タイプの遷移分布を集計し、集計結果である集計テーブルを推薦クエリ作成部23に送信する。具体的には、クエリ変更集計部25は、検索クエリログデータベース26から同一ユーザによって入力された時系列順に並んだ3つの検索クエリを取り出し、1番目の検索クエリから2番目の検索クエリへ、2番目の検索クエリから3番目の検索クエリへの変更タイプをそれぞれ求めて変更タイプの遷移を集計する。図4に集計テーブルの例を示す。クエリ変更集計部25は、1番目の検索クエリから2番目の検索クエリへの変更タイプを先行変更タイプ、2番目の検索クエリから3番目の検索クエリへの変更タイプを後続変更タイプとして、集計テーブル上の該当する欄の値に1を加算する。
The query
ここで、クエリ変更集計部25の処理の流れについて説明する。図5は、クエリ変更集計部25の処理の流れを示すフローチャートである。
Here, the flow of processing of the query
まず、クエリ変更集計部25は、検索クエリログデータベース26に含まれるユーザID情報を全て取得し、重複するユーザID情報を取り除いてユーザID情報の一覧を抽出する(ステップS101)。抽出したユーザID情報は、クエリ変更集計部25が備えるバッファに蓄積する。
First, the query
続いて、バッファからユーザID情報を1つ取り出し、そのユーザID情報と組となって格納されている検索クエリを検索クエリログデータベース26から入力時刻情報の昇順に抽出する(ステップS102)。
Subsequently, one piece of user ID information is extracted from the buffer, and search queries stored in pairs with the user ID information are extracted from the search
得られた検索クエリの集合の頭から順に3つの検索クエリを取り出し、1番目の検索クエリから2番目の検索クエリへの先行変更タイプと、2番目の検索クエリから3番目の検索クエリへの後続変更タイプを判定し、先行変更タイプ、後続変更タイプの組に対応する集計テーブルの値を1つ加算する(ステップS103)。そして、全ての検索クエリについて処理したか否か確認し、処理していない検索クエリが残っている場合はステップS103に戻り処理を続ける(ステップS104)。 The three search queries are extracted in order from the head of the set of obtained search queries, the type of advance change from the first search query to the second search query, and the succession from the second search query to the third search query. The change type is determined, and one value in the aggregation table corresponding to the combination of the preceding change type and the subsequent change type is added (step S103). Then, it is confirmed whether or not all search queries have been processed. If there are any search queries that have not been processed, the process returns to step S103 and continues (step S104).
例えば、あるユーザID情報に対応する時系列順に並んだ検索クエリの集合が、「東京駅,東京駅 レストラン,東京駅 フレンチ,東京駅 終電,タクシー 電話」であった場合、まず、「東京駅」「東京駅 レストラン」「東京駅 フレンチ」という3つの検索クエリの組が抽出される。そして、1番目の検索クエリ「東京駅」と2番目の検索クエリ「東京駅 レストラン」、2番目の検索クエリ「東京駅 レストラン」と3番目の検索クエリ「東京駅 フレンチ」の変更タイプを判定する。1番目の検索クエリから2番目の検索クエリへの先行変更タイプは語句が追加されているので「絞込」と、2番目の検索クエリから3番目の検索クエリへの後続変更タイプは語句の一部が変更されているので「関連」と判定される。その結果、集計テーブルの先行変更タイプが「絞込」、後続変更タイプが「関連」の箇所の値に1加算される。その後、「東京駅 レストラン」「東京駅 フレンチ」「東京駅 終電」の組、「東京駅 フレンチ」「東京駅 終電」「タクシー 電話」の組についても処理を行う。 For example, if the set of search queries arranged in chronological order corresponding to a certain user ID information is “Tokyo Station, Tokyo Station Restaurant, Tokyo Station French, Tokyo Station Last Train, Taxi Telephone”, first, “Tokyo Station” A set of three search queries “Tokyo Station Restaurant” and “Tokyo Station French” are extracted. The change type of the first search query “Tokyo Station”, the second search query “Tokyo Station Restaurant”, the second search query “Tokyo Station Restaurant” and the third search query “Tokyo Station French” is determined. . Since the preceding change type from the first search query to the second search query has a word added, “narrow down” and the subsequent change type from the second search query to the third search query are one of the words. Since the part has been changed, it is determined as “related”. As a result, 1 is added to the value of the location where the preceding change type is “squeezed” and the subsequent change type is “related” in the aggregation table. After that, the “Tokyo Station Restaurant”, “Tokyo Station French”, “Tokyo Station Last Train” group, and “Tokyo Station French”, “Tokyo Station Last Train”, “Taxi Telephone” group are also processed.
そして、ユーザID情報がバッファに残っているか否か確認し、残っている場合はステップS102に戻り処理を続ける(ステップS105)。 Then, it is confirmed whether or not the user ID information remains in the buffer. If it remains, the process returns to step S102 to continue the processing (step S105).
クエリ変更集計部25が作成した集計テーブルは推薦クエリ選択部24へ送信され、推薦クエリ選択部24により遷移テーブルに変換される。
The aggregation table created by the query
次に、推薦クエリの作成について説明する。推薦クエリは、ユーザが入力した検索クエリの履歴に基づいて、判定部21、検索タイプ判定部22、推薦クエリ作成部23、および推薦クエリ選択部24により作成される。
Next, creation of a recommendation query will be described. The recommended query is created by the determination unit 21, the search
判定部21は、時系列に並べられた第1、第2の検索クエリを入力し、第1、第2の検索クエリの構成語句を比較して変更タイプを判定する。実施例1では、変更タイプとして、「絞込」、「汎化」、「関連」、「切替」の4つを用いる。具体的には、第1の検索クエリに対して第2の検索クエリが、検索クエリを構成する語句が追加された変更がある場合は「絞込」、検索クエリを構成する語句が減らされた変更がある場合は「汎化」、検索クエリを構成する語句の一部が変更されている場合、あるいは、検索クエリを構成する語句が変更されていて、その語句間に関連性がある場合は「関連」、上記のいずれにも当てはまらない場合は「切替」と判定する。 The determination unit 21 inputs the first and second search queries arranged in time series, and compares the constituent words of the first and second search queries to determine the change type. In the first embodiment, four types of “restriction”, “generalization”, “relation”, and “switching” are used as change types. Specifically, when there is a change in which the second search query is added to the first search query and the words constituting the search query are “narrowed”, the words constituting the search query are reduced. “Generalization” if there is a change, if some of the words that make up the search query have changed, or if the words that make up the search query have changed and the words are related If neither “relevant” nor the above applies, it is determined as “switching”.
例えば、第1、第2の検索クエリがそれぞれ「東京駅」「東京駅 レストラン」の場合、第2の検索クエリは、第1の検索クエリ「東京駅」に「レストラン」の語句を追加したものであるので「絞込」と判定する。また、第1、第2の検索クエリがそれぞれ「東京駅 レストラン」「東京駅」の場合、第2の検索クエリは、第1の検索クエリ「東京駅 レストラン」から「レストラン」の語句を削除したものであるので「汎化」と判定する。第1、第2の検索クエリがそれぞれ「東京駅 レストラン」「東京駅 フレンチ」の場合、検索クエリの一部が変更されているので「関連」と判定する。第1、第2の検索クエリがそれぞれ「東京駅」「大手町」の場合、検索クエリの語句が変更されているが互いに関連性があるので「関連」と判定する。検索クエリの語句が変更されている場合については、既存の語句関連度技術を用いて2つの検索クエリ間の関連度を算出し、算出した関連度に基づいて「関連」あるいは「切替」と判定する。 For example, when the first and second search queries are “Tokyo Station” and “Tokyo Station Restaurant”, the second search query is obtained by adding the word “restaurant” to the first search query “Tokyo Station”. Therefore, it is determined as “narrow down”. When the first and second search queries are “Tokyo Station Restaurant” and “Tokyo Station”, the second search query deletes the word “restaurant” from the first search query “Tokyo Station Restaurant”. Therefore, it is determined as “generalization”. If the first and second search queries are “Tokyo Station Restaurant” and “Tokyo Station French”, respectively, it is determined as “related” because a part of the search query is changed. When the first and second search queries are “Tokyo Station” and “Otemachi”, respectively, the words of the search query are changed, but they are related to each other, so it is determined as “related”. When the search query word is changed, the relevance between the two search queries is calculated using the existing word relevance technology, and it is determined as “relevant” or “switched” based on the calculated relevance. To do.
検索タイプ判定部22は、ユーザから直近2回の検索クエリを入力し、判定部21を用いてユーザの検索行動の変更タイプを取得する。取得した変更タイプは推薦クエリ選択部14に送信する。
The search
推薦クエリ作成部23は、ユーザから入力した直近2回の検索クエリのうち新しいほうの検索クエリ(「最後の検索クエリ」と称する)に対応する複数の推薦クエリ候補を作成する。そして、作成された推薦クエリ候補それぞれについて、最後の検索クエリと各推薦クエリ候補を判定部21に入力し、最後の検索クエリから推薦クエリ候補に検索クエリが変更されたと仮定したときの変更タイプを取得する。変更タイプを推薦クエリ候補それぞれに付与して推薦クエリ候補情報として推薦クエリ選択部24に送信する。図6に推薦クエリ候補情報の例を示す。なお、推薦クエリ候補の作成に関しては、既存のクエリ推薦技術(例えば特許文献1、非特許文献1)を用いることができる。この際、複数のクエリ推薦技術を用いて幅広く推薦クエリを集めるとよい。
The recommended
推薦クエリ選択部24は、遷移テーブルを保持し、その遷移テーブルを参照し、選択する推薦クエリ候補に付与された変更タイプの分布比率が、検索タイプ判定部22から受信した変更タイプを先行変更タイプとしたときの後続変更タイプの分布比率と等しくなるように所定の数の推薦クエリを選択する。推薦クエリ選択部24は、クエリ変更集計部25から受信した集計テーブルから遷移テーブルを作成する。遷移テーブルは、集計テーブル中の先行変更タイプ毎に、後続変更タイプの値の和を取ってその和で後続変更タイプの値を割って作成する。図7に遷移テーブルの例を示す。同図に示す遷移テーブルでは4つの変更タイプを用い、先行変更タイプに続いて遷移した後続変更タイプの割合が記載されている。例えば、ユーザの検索行動の変更タイプが「絞込」であった場合、「切替」、「関連」、「汎化」、「絞込」それぞれの変更タイプが付与された推薦クエリが0.087,0.609,0.217,0.065の割合に近づくように推薦クエリを選択する。
The recommended
続いて、推薦クエリを作成する処理の流れについて説明する。図8は、推薦クエリを作成する処理の流れを示すフローチャートである。 Next, the flow of processing for creating a recommendation query will be described. FIG. 8 is a flowchart showing a flow of processing for creating a recommendation query.
検索タイプ判定部22は、ユーザから直近2回の検索クエリを入力し、判定部21を用いてユーザの検索行動の変更タイプを取得する(ステップS201)。そして、取得した変更タイプを推薦クエリ選択部14に送信する
推薦クエリ作成部23は、直近の検索クエリを入力し、その検索クエリに対応する推薦クエリ候補を作成する(ステップS202)。
The search
そして、直近の検索クエリから各推薦クエリ候補へ変更した場合の変更タイプを取得し(ステップS203)、各推薦クエリ候補に変更タイプを付与して推薦クエリ選択部24に送信する(ステップS204)。変更タイプの取得には、検索タイプ判定部22と同様に判定部21を用いる。
Then, a change type in the case of changing from the latest search query to each recommended query candidate is acquired (step S203), and the change type is assigned to each recommended query candidate and transmitted to the recommended query selection unit 24 (step S204). In order to acquire the change type, the determination unit 21 is used similarly to the search
推薦クエリ選択部24は、検索タイプ判定部22から受信した変更タイプを先行変更タイプとしたときの後続変更タイプの割合を遷移テーブルから取得する(ステップS205)。例えば、遷移テーブルが図7に示すものであったときに、検索タイプ判定部22から受信した変更タイプが「絞込」である場合、「切替」が0.087、「関連」が0.609、「汎化」が0.217、「絞込」が0.065という値を得る。
The recommended
そして、推薦クエリ選択部24は、選択する推薦クエリに付与された変更タイプの割合が遷移テーブルから取得した割合に等しくなるように所定の数の推薦クエリを選択して出力する(ステップS206,S207)。例えば、「切替」が0.087、「関連」が0.609、「汎化」が0.217、「絞込」が0.065という分布で、選択する推薦クエリの数が10と設定されていた場合、推薦クエリ候補の中から、「切替」の変更タイプが付与された推薦クエリを1つ、「関連」の変更タイプが付与された推薦クエリを6つ、「汎化」の変更タイプが付与された推薦クエリを2つ、「絞込」の変更タイプが付与された推薦クエリを1つ選択し、推薦クエリとして出力する。
Then, the recommended
[実施例2]
図9は、実施例2の検索クエリ推薦装置の構成を示す機能ブロック図である。
[Example 2]
FIG. 9 is a functional block diagram illustrating the configuration of the search query recommendation device according to the second embodiment.
図9に示す検索クエリ推薦装置3は、判定部31、検索タイプ判定部32、推薦クエリ作成部33、推薦クエリ選択部34、クエリ変更集計部35、および学習部37を備える。クエリ変更集計部35には検索クエリログデータベース36が接続され、学習部37には正解クエリ変更データベース38が接続される。なお、検索クエリ推薦装置3が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは検索クエリ推薦装置3が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。
The search query recommendation device 3 illustrated in FIG. 9 includes a
実施例2は、学習部37が検索クエリの変更タイプを分類するための変更タイプ判定モデルを学習し、その変更タイプ判定モデルを判定部31に適用して検索クエリの変更タイプを分類することで、実施例1に示した「絞込」「汎化」「関連」「切替」以外の様々な分類分けを用いる。
In the second embodiment, the
まず、学習部37の処理について説明する。
First, the processing of the
正解クエリ変更データベース38には、先行クエリと後続クエリの組に変更タイプが付与された正解クエリ変更情報が複数蓄積されている。図10に、正解クエリ変更情報の例を示す。
The correct
学習部37は、正解クエリ変更データベース38から正解クエリ変更情報を読み出し、Support Vector MachineやDecision Tree等の既存の機械学習アルゴリズムを用いて、検索クエリの変更タイプを分類するための変更タイプ判定モデルを学習する。判定部31は、この変更タイプ判定モデルを読み込み、入力された2つの検索クエリの変更タイプを判定する判定器を構成する。
The
ここで、学習部37の処理の流れについて説明する。図11は、学習部37が変更タイプ判定モデルを学習する処理の流れを示すフローチャートである。
Here, a processing flow of the
まず、学習部37は、正解クエリ変更データベース38から正解クエリ変更情報を1つ読み出し、読み出した正解クエリ変更情報の先行クエリと後続クエリについて語句の意味を表すベクトル表現を算出する(ステップS301)。
First, the
続いて、読み出した正解クエリ変更情報に含まれる先行クエリと後続クエリを用い、その正解クエリ変更情報の変更タイプを判定するのに有効な特徴量を算出する(ステップS302)。具体的には、先行クエリと後続クエリとの間で、共通する語句の数、共通する文字の数、追加された語句の数、追加された文字の数、ベクトル表現間のコサイン類似度、先行クエリから後続クエリへの skew divergence、後続クエリから先行クエリへの skew divergence を算出する。例えば、先行クエリが「東京駅」、後続クエリが「東京駅 ホテル」、それぞれのベクトル表現をv1,v2とすると、共通する語句の数は1、共通する文字の数は3、追加された語句の数は1、追加された文字の数は3、コサイン類似度、skew divergence は次式となる。
そして、正解クエリ変更データベース38中に特徴量の計算を行っていない正解クエリ変更情報が存在するか否かを判定し、存在する場合はステップS301に戻る(ステップS303)。
Then, it is determined whether or not there is correct query change information for which the feature quantity is not calculated in the correct
全ての正解クエリ変更情報について特徴量を計算した場合は、正解クエリ変更情報の変更タイプと計算した特徴量の集合を既存のDecision Tree等の機械学習アルゴリズムに適応して変更タイプ判定モデルを学習する(ステップS304)。 When feature amounts are calculated for all correct query change information, the change type determination model is learned by applying the change type of the correct query change information and the set of calculated feature amounts to an existing machine learning algorithm such as Decision Tree. (Step S304).
学習した変更タイプ判定モデルを判定部31に保存する(ステップS305)。 The learned change type determination model is stored in the determination unit 31 (step S305).
検索タイプ判定部32、推薦クエリ作成部33、およびクエリ変更集計部35は、変更タイプ判定モデルを適用した判定部31を用いて変更タイプの判定を行う。推薦クエリの作成処理、遷移テーブルの作成処理は実施例1と同様であるので説明は省略する。判定部31は、時系列順の検索クエリを入力し、検索クエリのベクトル表現を用い、学習部37が学習した変更タイプ判定モデルを用いて変更タイプを判定する。
The search
以上説明したように、本実施の形態によれば、時系列に並べられた検索クエリに基づいて検索行動の変更タイプを判定する判定部11を備え、検索タイプ判定部12が検索クエリの履歴を入力して現在の変更タイプを判定し、推薦クエリ作成部13が検索クエリの履歴のうち直近の検索クエリに対する推薦クエリ候補を作成するとともに、直近の検索クエリを各推薦クエリ候補へ変更した場合の変更タイプを判定して各推薦クエリ候補に付与し、推薦クエリ選択部14が変更タイプの遷移分布を示す遷移テーブルを保持し、現在の変更タイプから遷移する変更タイプの分布比率を取得し、推薦クエリ候補から所定の数の推薦クエリを選択したときに、選択した推薦クエリに付与された変更タイプの分布比率が遷移テーブルから取得した分布比率と近くなるように推薦クエリを選択することにより、ユーザの検索クエリの変更意図に応じて推薦するクエリを選択して提示できるので、推薦クエリの精度の向上が期待できる。
As described above, according to the present embodiment, the
1,2,3…検索クエリ推薦装置
11,21,31…判定部
12,22,32…検索タイプ判定部
13,23,33…推薦クエリ作成部
14,24,34…推薦クエリ選択部
25,35…クエリ変更集計部
26,36…検索クエリログデータベース
37…学習部
38…正解クエリ変更データベース
1, 2, 3 ... Search
Claims (9)
前記検索クエリの履歴のうちで最も新しい最後の検索クエリに対する複数の推薦クエリ候補を作成するステップと、
前記最後の検索クエリから前記複数の推薦クエリ候補それぞれへ検索クエリを変更した場合の変更タイプを判定し、前記複数の推薦クエリ候補それぞれに当該変更タイプを付与するステップと、
変更タイプの遷移の分布を記載した遷移テーブルを参照して前記検索クエリの履歴から判定された変更タイプから遷移する変更タイプの分布比率を取得するステップと、
選択する推薦クエリに付与された変更タイプの分布比率が前記遷移テーブルから取得した分布比率と近くなるように、前記推薦クエリ候補から推薦クエリを選択するステップと、
を有することを特徴とする検索クエリ推薦方法。 Entering a user's search query history and determining a change type that classifies the change intent of the search query derived from the relevance between the search queries;
Creating a plurality of recommended query candidates for the most recent last search query in the search query history;
Determining a change type when a search query is changed from the last search query to each of the plurality of recommended query candidates, and assigning the change type to each of the plurality of recommended query candidates;
Obtaining a distribution ratio of change types that transition from the change type determined from the history of the search query with reference to a transition table that describes the distribution of change type transitions;
Selecting a recommended query from the recommended query candidates so that the distribution ratio of the change type assigned to the recommended query to be selected is close to the distribution ratio acquired from the transition table;
A search query recommendation method characterized by comprising:
時系列に並べられた検索クエリにおいて、語句が追加されている場合は絞込、語句が削除された場合は汎化、一部の語句のみが変更されている場合、あるいは検索クエリ間に関連がある場合は関連、これらにあてはまらない場合は切替として変更タイプを判定することを特徴とする請求項1記載の検索クエリ推薦方法。 As the change type, four types of refinement, generalization, association, and switching are used,
In a search query arranged in chronological order, if a word is added, it is narrowed down, if a word is deleted, generalization is performed, if only a part of the word is changed, or if there is a relationship between the search queries The search query recommendation method according to claim 1, wherein a change type is determined as a relation if there is any, and a change type as a switch if the conditions do not apply.
当該判定モデルを用いて変更タイプを判定することを特徴とする請求項1記載の検索クエリ推薦方法。 The correct answer change type information from the correct answer change type information storing the correct answer change type information including the first search query, the second search query, and the change type when the first search query is changed to the second search query. And learning a determination model for determining a change type of a search query arranged in time series by a machine learning algorithm,
The search query recommendation method according to claim 1, wherein the change type is determined using the determination model.
ユーザの検索クエリの履歴を入力し、前記判定手段を用いて現在の変更タイプを判定する検索タイプ判定手段と、
前記検索クエリの履歴のうちで最も新しい最後の検索クエリに対する複数の推薦クエリ候補を作成し、前記判定手段を用いて前記最後の検索クエリから前記複数の推薦クエリ候補それぞれへ検索クエリを変更した場合の変更タイプを判定し、前記複数の推薦クエリ候補それぞれに当該変更タイプを付与する推薦クエリ作成手段と、
変更タイプの遷移の分布を記載した遷移テーブルを参照して前記現在の変更タイプから遷移する変更タイプの分布比率を取得し、選択する推薦クエリに付与された変更タイプの分布比率が前記遷移テーブルから取得した分布比率と近くなるように、前記推薦クエリ候補から推薦クエリを選択する推薦クエリ選択手段と、
を有することを特徴とする検索クエリ推薦装置。 A determination means for inputting a search query arranged in a time series and determining a change type that classifies the change intention of the search query derived from the relationship between the search queries,
A search type determination unit that inputs a history of a user search query and determines a current change type using the determination unit;
A plurality of recommended query candidates for the latest search query that is newest in the search query history are created, and the search query is changed from the last search query to each of the plurality of recommended query candidates using the determination unit. Determining a change type, and recommending query creating means for assigning the change type to each of the plurality of recommended query candidates,
The change type distribution ratio that transitions from the current change type is obtained with reference to the transition table that describes the distribution of the change type transition, and the change type distribution ratio assigned to the recommended query to be selected is obtained from the transition table. Recommended query selection means for selecting a recommended query from the recommended query candidates so as to be close to the acquired distribution ratio;
A search query recommendation device characterized by comprising:
前記判定手段は、時系列に並べられた検索クエリにおいて、語句が追加されている場合は絞込、語句が削除された場合は汎化、一部の語句のみが変更されている場合、あるいは検索クエリ間に関連がある場合は関連、これらにあてはまらない場合は切替として変更タイプを判定することを特徴とする請求項5記載の検索クエリ推薦装置。 As the change type, four types of refinement, generalization, association, and switching are used,
In the search query arranged in time series, the determination means narrows down when words are added, generalizes when words are deleted, searches only when some words are changed, or searches 6. The search query recommendation device according to claim 5, wherein when there is a relation between queries, the change type is determined as a relation, and when the relation does not apply, the change type is determined as switching.
前記正解変更タイプ格納手段から前記正解変更タイプ情報を読み出し、機械学習アルゴリズムにより時系列に並べられた検索クエリの変更タイプを判定するための判定モデルを学習する学習手段を有し、
前記判定手段は、前記判定モデルを用いて変更タイプを判定することを特徴とする請求項5記載の検索クエリ推薦装置。 Correct answer change type storage means for storing correct answer change type information consisting of a first search query, a second search query, and a change type when changed from the first search query to the second search query;
Reading the correct answer change type information from the correct answer change type storage means, and learning means for learning a determination model for determining a change type of a search query arranged in time series by a machine learning algorithm,
The search query recommendation device according to claim 5, wherein the determination unit determines a change type using the determination model.
前記検索クエリ格納手段から時系列順に検索クエリを読み出し、前記判定手段を用いて読み出した検索クエリ間の変更タイプを判定して変更タイプの遷移を求め、前記遷移テーブルを作成する遷移テーブル作成手段と、
を有することを特徴とする請求項5乃至7のいずれかに記載の検索クエリ推薦装置。 Search query storage means for storing a history of search queries;
Transition table creation means for reading search queries from the search query storage means in chronological order, determining a change type between search queries read using the determination means, obtaining a transition of the change type, and creating the transition table; ,
The search query recommendation device according to any one of claims 5 to 7, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010145863A JP5406794B2 (en) | 2010-06-28 | 2010-06-28 | Search query recommendation device and search query recommendation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010145863A JP5406794B2 (en) | 2010-06-28 | 2010-06-28 | Search query recommendation device and search query recommendation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012008899A true JP2012008899A (en) | 2012-01-12 |
JP5406794B2 JP5406794B2 (en) | 2014-02-05 |
Family
ID=45539340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010145863A Active JP5406794B2 (en) | 2010-06-28 | 2010-06-28 | Search query recommendation device and search query recommendation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5406794B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206070A (en) * | 2012-03-28 | 2013-10-07 | Zenrin Datacom Co Ltd | Information processor and information processing method |
JP2016038667A (en) * | 2014-08-06 | 2016-03-22 | 日本電信電話株式会社 | Information provision device, information provision method and information provision program |
CN103699574B (en) * | 2013-11-28 | 2017-01-11 | 科大讯飞股份有限公司 | Retrieval optimization method and system for complex retrieval formula |
KR20200014589A (en) * | 2018-08-01 | 2020-02-11 | 주식회사 마이셀럽스 | Apparatus and method of recommending items based on areas |
JP2020047125A (en) * | 2018-09-20 | 2020-03-26 | Zホールディングス株式会社 | Device, method, and program for processing information |
CN112115342A (en) * | 2020-09-22 | 2020-12-22 | 深圳市欢太科技有限公司 | Search method, search device, storage medium and terminal |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219955A (en) * | 2006-02-17 | 2007-08-30 | Fuji Xerox Co Ltd | Question and answer system, question answering processing method and question answering program |
JP2008535090A (en) * | 2005-03-29 | 2008-08-28 | グーグル インク. | Query modification using known high-ranked queries |
-
2010
- 2010-06-28 JP JP2010145863A patent/JP5406794B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008535090A (en) * | 2005-03-29 | 2008-08-28 | グーグル インク. | Query modification using known high-ranked queries |
JP2007219955A (en) * | 2006-02-17 | 2007-08-30 | Fuji Xerox Co Ltd | Question and answer system, question answering processing method and question answering program |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206070A (en) * | 2012-03-28 | 2013-10-07 | Zenrin Datacom Co Ltd | Information processor and information processing method |
CN103699574B (en) * | 2013-11-28 | 2017-01-11 | 科大讯飞股份有限公司 | Retrieval optimization method and system for complex retrieval formula |
JP2016038667A (en) * | 2014-08-06 | 2016-03-22 | 日本電信電話株式会社 | Information provision device, information provision method and information provision program |
KR20200014589A (en) * | 2018-08-01 | 2020-02-11 | 주식회사 마이셀럽스 | Apparatus and method of recommending items based on areas |
KR102195686B1 (en) * | 2018-08-01 | 2020-12-29 | 주식회사 마이셀럽스 | Apparatus and method of recommending items based on areas |
JP2020047125A (en) * | 2018-09-20 | 2020-03-26 | Zホールディングス株式会社 | Device, method, and program for processing information |
CN112115342A (en) * | 2020-09-22 | 2020-12-22 | 深圳市欢太科技有限公司 | Search method, search device, storage medium and terminal |
Also Published As
Publication number | Publication date |
---|---|
JP5406794B2 (en) | 2014-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kang et al. | based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach | |
JP6414956B2 (en) | Question generating device and computer program | |
US9785888B2 (en) | Information processing apparatus, information processing method, and program for prediction model generated based on evaluation information | |
US9418128B2 (en) | Linking documents with entities, actions and applications | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
KR20160067202A (en) | Contextual insights and exploration | |
JP5406794B2 (en) | Search query recommendation device and search query recommendation program | |
KR100892842B1 (en) | Method and system for user centered information searching | |
RU2731658C2 (en) | Method and system of selection for ranking search results using machine learning algorithm | |
Arguello | Aggregated search | |
CN103020049A (en) | Searching method and searching system | |
KR101254362B1 (en) | Method and system for providing keyword ranking using common affix | |
JP5952711B2 (en) | Prediction server, program and method for predicting future number of comments in prediction target content | |
JP2017021796A (en) | Ranking of learning material segment | |
JP2018504686A (en) | Method and apparatus for processing search data | |
US20160246886A1 (en) | Efficient retrieval of fresh internet content | |
Sajeev et al. | Effective web personalization system based on time and semantic relatedness | |
Tondulkar et al. | Get me the best: predicting best answerers in community question answering sites | |
JP6042790B2 (en) | Trend analysis apparatus, trend analysis method, and trend analysis program | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
JP2011501849A (en) | Information map management system and information map management method | |
Kim et al. | Topic-Driven SocialRank: Personalized search result ranking by identifying similar, credible users in a social network | |
Luo et al. | Query ambiguity identification based on user behavior information | |
JP2013054606A (en) | Document retrieval device, method and program | |
Kravi et al. | One query, many clicks: Analysis of queries with multiple clicks by the same user |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121024 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5406794 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |