JP2018097560A - Information processing device, information processing method, and program - Google Patents

Information processing device, information processing method, and program Download PDF

Info

Publication number
JP2018097560A
JP2018097560A JP2016240883A JP2016240883A JP2018097560A JP 2018097560 A JP2018097560 A JP 2018097560A JP 2016240883 A JP2016240883 A JP 2016240883A JP 2016240883 A JP2016240883 A JP 2016240883A JP 2018097560 A JP2018097560 A JP 2018097560A
Authority
JP
Japan
Prior art keywords
query
suggestion
information processing
ranking
queries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016240883A
Other languages
Japanese (ja)
Other versions
JP6783133B2 (en
Inventor
将晴 堀野
Masaharu Horino
将晴 堀野
山本 浩司
Koji Yamamoto
浩司 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016240883A priority Critical patent/JP6783133B2/en
Publication of JP2018097560A publication Critical patent/JP2018097560A/en
Application granted granted Critical
Publication of JP6783133B2 publication Critical patent/JP6783133B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information processing device capable of more suitably ranking a suggest query, an information processing method, and a program.SOLUTION: An information processing device includes a learning unit for learning weight of background of a suggest query on the basis of a set of suggest queries that are exhibited on the basis of a query input in an electronic store and in which positive examples and negative examples are distinguished, and a ranking unit for ranking the suggest query on the basis of the weight of the query learned by the learning unit.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and a program.

従来、ショッピングシステム(電子店舗)におけるサジェストクエリの順位付けを行う技術が開示されている(特許文献1参照)。この技術では、商品情報の表示順位が、リスティングスコアに基づいて決定される。リスティングスコアは、商品またはその商品の商品ページに対して決定された評価を示す値である。リスティングスコアは、商品ページに対するアクセス数(閲覧数)が多いほどリスティングスコアが高くなったり、商品の購入数が多いほどリスティングスコアが高くなったりするように決定される。   Conventionally, a technique for ranking suggest queries in a shopping system (electronic store) has been disclosed (see Patent Document 1). In this technique, the display order of product information is determined based on the listing score. The listing score is a value indicating an evaluation determined for a product or a product page of the product. The listing score is determined such that the listing score increases as the number of accesses (viewing number) to the product page increases, or the listing score increases as the number of purchases of the product increases.

特開2013−050905号公報JP 2013-050905 A

しかしながら、従来の技術では、例えば、複数の電子店舗が登録されたポータルサイトにおいて運用を行った場合、特定の店舗が意図的に、自身の商品ページのアクセス数が多くなるように操作を行う場合があり、サジェストクエリを適切に順位付けすることができない場合があった。   However, in the conventional technology, for example, when operation is performed on a portal site where a plurality of electronic stores are registered, a specific store intentionally performs an operation so that the number of accesses to its own product page increases. In some cases, suggesting queries could not be properly ranked.

本発明は、このような事情を考慮してなされたものであり、より適切にサジェストクエリを順位付けすることが可能な情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。   The present invention has been made in view of such circumstances, and an object of the present invention is to provide an information processing apparatus, an information processing method, and a program capable of appropriately ranking a suggestion query. To do.

本発明の一態様は、電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、を備える情報処理装置である。   One aspect of the present invention is a set of suggestion queries that are presented based on a query input at an electronic store, and based on the set of suggestion queries that are distinguished from positive examples and negative examples, An information processing apparatus comprising: a learning unit that learns feature weights; and a ranking unit that ranks the suggest queries based on the feature weights learned by the learning unit.

本発明の一態様によれば、より適切にサジェストクエリを順位付けすることができる。   According to one aspect of the present invention, it is possible to rank the suggest queries more appropriately.

情報処理装置の一例であるランキング管理装置100の構成および使用環境を示す図である。It is a figure which shows the structure and use environment of the ranking management apparatus 100 which is an example of information processing apparatus. 電子店舗サーバ20により提供されるインターフェース画面の一例を示す図である。It is a figure which shows an example of the interface screen provided by the electronic store server. 学習用データ154の内容の一例を模式的に示す図である。It is a figure which shows an example of the content of the data for learning 154 typically. 学習部120および順位付け部130により実行される処理の流れの一例を示すフローチャートである。6 is a flowchart illustrating an example of a flow of processing executed by a learning unit 120 and a ranking unit 130.

以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。実施形態の情報処理装置は、一以上のプロセッサによって実現される。情報処理装置は、ネットワークを介して商品またはサービス(以下、商品等)を販売する電子店舗において、入力されたクエリ(以下、入力クエリ)に対して提示されるサジェストクエリの順位付けを行う装置である。情報処理装置は、正例、負例の区別がなされたサジェストクエリの集合に基づいて、例えば入力クエリごとにサジェストクエリの素性の重みを学習し、学習した素性の重みに基づいて、例えば入力クエリごとにサジェストクエリを順位付けする。なお、情報処理装置と、電子店舗を運営する装置とは別体の装置である必要はなく、これらは一つのプロセッサによって実現されてもよい。以下、情報処理装置の機能について段階的に開示する。   Hereinafter, an information processing apparatus, an information processing method, and a program according to embodiments of the present invention will be described with reference to the drawings. The information processing apparatus according to the embodiment is realized by one or more processors. An information processing device is a device that ranks a suggestion query presented to an input query (hereinafter referred to as input query) in an electronic store that sells products or services (hereinafter referred to as products) via a network. is there. The information processing apparatus learns the feature weight of the suggestion query for each input query, for example, based on the set of suggestion queries in which the positive example and the negative example are distinguished, and, for example, the input query based on the learned feature weight Rank the suggestion query by each. Note that the information processing device and the device that operates the electronic store need not be separate devices, and may be realized by a single processor. Hereinafter, the functions of the information processing apparatus will be disclosed step by step.

図1は、情報処理装置の一例であるランキング管理装置100の構成および使用環境を示す図である。ランキング管理装置100は、ネットワークNWに接続される。ネットワークNWは、例えば、無線基地局、Wi−Fiアクセスポイント、通信回線、プロバイダ、インターネットなどを含む。ネットワークNWには、一以上の端末装置10および電子店舗サーバ20が接続される。なお、必ずしも端末装置10とランキング管理装置100が通信可能である必要は無く、ネットワークNWは幾つかのサブネットワークに分割されていてもよい。   FIG. 1 is a diagram illustrating a configuration and usage environment of a ranking management apparatus 100 that is an example of an information processing apparatus. The ranking management apparatus 100 is connected to the network NW. The network NW includes, for example, a wireless base station, a Wi-Fi access point, a communication line, a provider, the Internet, and the like. One or more terminal devices 10 and the electronic store server 20 are connected to the network NW. Note that the terminal device 10 and the ranking management device 100 do not necessarily need to be able to communicate with each other, and the network NW may be divided into several sub-networks.

端末装置10は、電子店舗を利用する利用者によって使用される端末装置である。端末装置10としては、例えば、スマートフォンなどの携帯電話、パーソナルコンピュータ、タブレット端末などが使用される。端末装置10では、ウェブブラウザやニュースアプリなどのUA(User Agent)が起動し、電子店舗サーバ20にアクセスする。   The terminal device 10 is a terminal device used by a user who uses an electronic store. As the terminal device 10, for example, a mobile phone such as a smartphone, a personal computer, a tablet terminal, or the like is used. In the terminal device 10, a user agent (UA) such as a web browser or a news application is activated and accesses the electronic store server 20.

電子店舗サーバ20は、電子店舗を運営するサーバ装置である。電子店舗サーバ20は、ウェブサーバ、アプリサーバ、その他の形態で動作する。電子店舗サーバ20は、端末装置10の利用者にネットワークNW上での買い物を可能とするためのインターフェース画面を、端末装置10に提供する。   The electronic store server 20 is a server device that operates an electronic store. The electronic store server 20 operates in a web server, an application server, or other forms. The electronic store server 20 provides the terminal device 10 with an interface screen for enabling the user of the terminal device 10 to shop on the network NW.

図2は、電子店舗サーバ20により提供されるインターフェース画面の一例を示す図である。この画面には、入力クエリを入力するためのクエリ入力窓QWが設定される。クエリ入力窓QWに入力クエリが入力されると、例えば、入力クエリに対して他のワードが追加されたサジェストクエリの一覧情報であるサジェストクエリ一覧SQLが表示される。サジェストクエリ一覧SQLに表示されるサジェストクエリの順序は、ランキング管理装置100により行われた順位付けに基づいて決定される。サジェストクエリが選択された状態で検索ボタンSBが操作されると、選択されたサジェストクエリを用いて検索した結果を表示する画面に遷移する。このようにして電子店舗における買い物が開始される。   FIG. 2 is a diagram illustrating an example of an interface screen provided by the electronic store server 20. In this screen, a query input window QW for inputting an input query is set. When an input query is input to the query input window QW, for example, a suggestion query list SQL that is list information of a suggestion query in which another word is added to the input query is displayed. The order of the suggest queries displayed in the suggest query list SQL is determined based on the ranking performed by the ranking management apparatus 100. When the search button SB is operated in a state where the suggestion query is selected, a transition is made to a screen that displays a search result using the selected suggestion query. In this way, shopping at the electronic store is started.

電子店舗サーバ20は、利用者によって検索が行われる度に、入力クエリに対して提示したサジェストクエリ、および、検索の度にサジェストクエリ一覧SQLの中で選択されたサジェストクエリの情報などを、ログ情報22として記憶部に蓄積する。ログ情報22には、これらの情報の他、最終的に商品の購入に至ったか、などの利用者の購買行動に関する情報が含まれてよい。   The electronic store server 20 logs the suggestion query presented to the input query each time a search is performed by the user, and information on the suggestion query selected in the suggestion query list SQL each time the search is performed. The information 22 is stored in the storage unit. In addition to these pieces of information, the log information 22 may include information related to the purchase behavior of the user, such as whether or not the product has finally been purchased.

図1に戻り、ランキング管理装置100は、例えば、情報管理部110と、学習部120と、順位付け部130とを備える。これらの機能部は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの機能部のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)などのハードウェアによって実現されてもよいし、ソフトウェアとハードウェアが協働するものであってもよい。   Returning to FIG. 1, the ranking management apparatus 100 includes, for example, an information management unit 110, a learning unit 120, and a ranking unit 130. These functional units are realized, for example, when a processor such as a CPU (Central Processing Unit) executes a program (software). Some or all of these functional units may be realized by hardware such as LSI (Large Scale Integration), ASIC (Application Specific Integrated Circuit), FPGA (Field-Programmable Gate Array), or software. And hardware may cooperate.

また、ランキング管理装置100は、記憶部150を備える。記憶部150は、例えば、HDD(Hard Disk Drive)やフラッシュメモリ、RAM(Random Access Memory)、ROM(Read Only Memory)などによって実現される。記憶部150には、ランキングデータ152、学習用データ154、重みデータ156などの情報が格納される。   The ranking management apparatus 100 includes a storage unit 150. The storage unit 150 is realized by, for example, an HDD (Hard Disk Drive), a flash memory, a RAM (Random Access Memory), a ROM (Read Only Memory), or the like. The storage unit 150 stores information such as ranking data 152, learning data 154, weight data 156, and the like.

図1に示すランキング管理装置100の構成は、適宜、分散化されてもよい。例えば、学習部120と順位付け部130は、独立したプロセッサによって実現されてもよいし、記憶部150は、ランキング管理装置100からネットワークNWを介してアクセス可能なNAS(Network Attached Storage)であってもよい。また、電子店舗サーバ20とランキング管理装置100は統合されて一つのプロセッサで実現されてもよい。   The configuration of the ranking management apparatus 100 shown in FIG. 1 may be distributed as appropriate. For example, the learning unit 120 and the ranking unit 130 may be realized by independent processors, and the storage unit 150 is a NAS (Network Attached Storage) accessible from the ranking management apparatus 100 via the network NW. Also good. Further, the electronic store server 20 and the ranking management apparatus 100 may be integrated and realized by a single processor.

情報管理部110は、電子店舗サーバ20からログ情報22を取得し、適宜、加工を加えて学習用データ154として記憶部150に記憶させる。   The information management unit 110 acquires the log information 22 from the electronic store server 20, processes the log information 22 as appropriate, and stores it in the storage unit 150 as learning data 154.

学習部120は、学習用データ154に基づいて、例えば入力クエリごとに、サジェストクエリの素性の重みを学習する。図3は、学習用データ154の内容の一例を模式的に示す図である。図示するように、学習用データ154は、入力クエリごとに、検索が行われた度に、提示されたサジェストクエリと、その中で選択されたサジェストクエリとを対応付けた情報である。選択されたサジェストクエリには正例である旨を示すフラグが、選択されなかったサジェストクエリには負例である旨を示すフラグが、それぞれ付されている。   The learning unit 120 learns the weight of the feature of the suggestion query, for example, for each input query based on the learning data 154. FIG. 3 is a diagram schematically illustrating an example of the content of the learning data 154. As shown in the drawing, the learning data 154 is information in which the suggested query and the suggested query selected therein are associated with each other when the search is performed for each input query. A flag indicating that it is a positive example is attached to the selected suggestion query, and a flag indicating that it is a negative example is attached to the suggestion query that is not selected.

サジェストクエリの素性とは、例えば、以下に示すもののうち一部または全部を含む。以下において、括弧内のバイナリ、対数値、実数値とは、説明文で表される内容をどのような数値形式で扱うかを示している。   The feature of the suggestion query includes, for example, part or all of the following features. In the following, the binary, logarithmic value, and real value in parentheses indicate in what numerical format the content represented by the explanatory text is handled.

1.編集距離(バイナリ)
この素性は、一文字の挿入・削除・置換によって、一方の文字列(入力クエリ)をもう一方の文字列(サジェストクエリ)に変形するのに必要な手順の最小回数である。編集距離は、例えば、編集距離が[0〜2,3〜4,5〜6,7〜8,9〜10,11〜12,13〜15,16〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
1. Edit distance (binary)
This feature is the minimum number of steps required to transform one character string (input query) into another character string (suggest query) by insertion / deletion / replacement of one character. For example, the edit distance is included in which range of values [0 to 2, 3 to 4, 5 to 6, 7 to 8, 9 to 10, 11 to 12, 13 to 15, 16 to]. Is represented by a vector in which the corresponding part is 1 and the non-applicable part is zero.

2.表示位置(バイナリ)
この素性は、固定数が提示されるサジェストクエリのうち、何番目のサジェストクエリが選択されたかを示す情報である。
2. Display position (binary)
This feature is information indicating the number of suggested queries selected from among the suggested queries to which a fixed number is presented.

3.サジェストクエリの文字長(バイナリ)
この素性は、サジェストクエリの文字数が所定数(例えば15)以上であるか、所定数未満であるかを示す情報である。
3. Suggest query character length (binary)
This feature is information indicating whether the number of characters in the suggestion query is a predetermined number (for example, 15) or more or less than the predetermined number.

4.サジェストクエリのトークン数(実数)
この素性は、サジェストクエリを形態素解析して得られるトークン数である。トークンとは、分解できない文字列の並びの最小単位である。
4). Number of tokens in the suggestion query (real number)
This feature is the number of tokens obtained by morphological analysis of the suggestion query. A token is the smallest unit of a sequence of character strings that cannot be decomposed.

5.入力クエリと選択されたサジェストクエリのペアをキーとして集計した検索数(バイナリ)
この素性は、例えば、検索数が、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
5. Number of searches aggregated using input query and selected suggestion query pairs as keys (binary)
For example, the number of searches is [0 to 2, 3 to 4, 5 to 6, 7 to 8, 9 to 10, 11 to 15, 16 to 20, 21 to 30, 31 to 50, 51 to 100. , 101-200, 201-], which is included in a range of values, is represented by a vector in which the corresponding part is 1 and the non-applicable part is zero.

6.サジェスト実績CTR(Click Through Ratio)(実数)
この素性は、サジェストクエリの選択回数を検索数で除算した値で表される。
6). Suggested CTR (Click Through Ratio) (real number)
This feature is represented by a value obtained by dividing the number of selections of the suggest query by the number of searches.

7.サジェストクエリが選択された前提での入力クエリの検索数(バイナリ)
この素性は、例えば、その検索数が、[0〜10,11〜50,51〜100,101〜1000,1001〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
7). Number of input query searches on the assumption that a suggest query is selected (binary)
This feature is obtained, for example, by determining which value range of [0 to 10, 11 to 50, 51 to 100, 101 to 1000, 1001] the number of searches is, It is expressed as a vector with zero not being taken.

8.サジェストクエリと入力クエリの差分の文字列で求めたCTR(実数)
この素性は、例えば、入力クエリを「スマートフォン」、サジェストクエリを「スマートフォン ケース」とした場合、「ケース」に関するCTRである。
8). CTR (real number) obtained from the character string of the difference between the suggestion query and the input query
This feature is, for example, a CTR related to “case” when the input query is “smartphone” and the suggestion query is “smartphone case”.

9.サジェストクエリを使わずに入力クエリが検索された検索数(バイナリ)
この素性は、例えば、検索数が、[0,1,2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
9. Number of searches where the input query was searched without using a suggestion query (binary)
For example, the number of searches is [0, 1, 2, 3 to 4, 5 to 6, 7 to 8, 9 to 10, 11 to 15, 16 to 20, 21 to 30, 31 to 50, 51. ˜100, 101-200, 201]], which is included in a range of values, is represented by a vector in which the corresponding part is 1 and the non-applicable part is zero.

10.検索クエリ(入力クエリのみで検索された場合と、サジェストクエリで検索された場合を含む)の検索数(バイナリ)
この素性は、例えば、その検索数が、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
10. Number of search queries (including binary search) (including search by input query only and search by suggestion query)
For example, the number of searches is [0 to 2, 3 to 4, 5 to 6, 7 to 8, 9 to 10, 11 to 15, 16 to 20, 21 to 30, 31 to 50, 51. [100, 101-200, 201]], which is included in a range of values, is represented by a vector in which the corresponding part is 1 and the non-applicable part is zero.

11.検索クエリで検索をした時の検索結果の商品リンクのクリック数(バイナリ)
この素性は、1リクエストに最大1クリックまで数えられ、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。
11. Clicks on product links in search results when searching with a search query (binary)
This feature is counted up to one click per request, [0 to 2, 3 to 4, 5 to 6, 7 to 8, 9 to 10, 11 to 15, 16 to 20, 21 to 30, 31 to 50. , 51-100, 101-200, 201]], which is included in a range of values, is represented by a vector in which the corresponding part is 1 and the non-applicable part is zero.

12.検索クエリで検索をした時の検索結果の商品リンクのクリック総数(バイナリ) この素性は、商品詳細ページのリンク数全てのクリックを数えたものである。最大値は表示された商品リンク数と同じ数になる。この数は、[0〜2,3〜4,5〜6,7〜8,9〜10,11〜15,16〜20,21〜30,31〜50,51〜100,101〜200,201〜]のどの値の範囲に含まれるかを求め、該当する箇所を1、該当しない箇所をゼロとしたベクトルで表される。   12 Total number of clicks on product links in search results when searching with search query (binary) This feature counts all clicks on the number of links on the product detail page. The maximum value is the same as the number of displayed product links. This number is [0 to 2, 3 to 4, 5 to 6, 7 to 8, 9 to 10, 11 to 15, 16 to 20, 21 to 30, 31 to 50, 51 to 100, 101 to 200, 201. To which value range is included, and is represented by a vector in which the corresponding part is 1 and the non-applicable part is zero.

13.検索クエリで検索をした時の商品詳細のCTR(実数)
この素性は、商品リンクのクリック数(複数リンクをクリックしても1としてカウント)を、リクエスト数で除算した値で表される。
13. Product details CTR when searching with a search query (real number)
This feature is represented by a value obtained by dividing the number of clicks of a product link (counting as 1 even if a plurality of links are clicked) by the number of requests.

14.検索クエリで検索をした時の商品詳細のiCTR(実数)
この素性は、商品リンクのクリック数を、商品詳細のリンク数で除算した値で表される。
14 Product details iCTR when searching with a search query (real number)
This feature is represented by a value obtained by dividing the number of clicks of the product link by the number of links of the product details.

15.検索クエリで検索をした時の商品詳細のClick Per Request(対数)
この素性は、1リクエストにどのくらいの商品詳細リンクがクリックされたかで表される。最大値はクリック数分となる。
15. Click Per Request (logarithm) of product details when searching with search query
This feature is represented by how many product detail links are clicked in one request. The maximum value is the number of clicks.

16.検索クエリで検索をした時の商品ヒット数(対数)   16. Product hits (logarithm) when searching with a search query

17.検索クエリが、検索数の多いクエリの上位所定数(例えば5000個)に該当するか否か(バイナリ)
この素性は、上記条件に該当する場合に1、該当しない場合にゼロで表される。
17. Whether or not the search query corresponds to the upper predetermined number (for example, 5000) of queries with a large number of searches (binary)
This feature is represented by 1 when the above condition is met and zero when it is not met.

18.検索クエリをスペース区切りにした文字列が、上位所定数(例えば5000個)に該当するか否か(バイナリ)
この素性は、上記条件に該当する場合に1、該当しない場合にゼロで表される。
18. Whether or not the character string obtained by separating the search query with a space corresponds to the upper predetermined number (for example, 5000) (binary)
This feature is represented by 1 when the above condition is met and zero when it is not met.

19.検索クエリを形態素解析して抜き出した名詞が、上位所定数(例えば5000個)に該当するか否か(バイナリ)
この素性は、上記条件に該当する場合に1、該当しない場合にゼロで表される。
19. Whether or not the noun extracted from the morphological analysis of the search query corresponds to the upper predetermined number (for example, 5000) (binary)
This feature is represented by 1 when the above condition is met and zero when it is not met.

学習部120は、上記説明したサジェストクエリの素性の重みを学習する。学習用データ154は、検索のログ情報に基づいているため、同じサジェストクエリであっても正例になったり負例になったりすることがある。このため、学習部120は、例えば、SVM(Support Vector Machine;サポートベクタマシン)を用いて、判定が間違ったサンプルの超平面からの距離の合計が少なくなるように超平面を求める。   The learning unit 120 learns the feature weight of the above-described suggestion query. Since the learning data 154 is based on search log information, even the same suggestion query may be a positive example or a negative example. For this reason, the learning unit 120 uses, for example, an SVM (Support Vector Machine) to obtain the hyperplane so that the total distance from the hyperplane of the sample with the wrong determination is reduced.

順位付け部130は、学習部120により学習された素性の重みに基づいて、例えば入力クエリごとに、サジェストクエリを順位付けする。順位付けした結果は、電子店舗サーバ20に提供される。電子店舗サーバ20は、提供された順位付けの結果に基づいて、入力クエリに対して提示するサジェストクエリを決定する。これによって、サジェストクエリのCTRなどを向上させることができる。   The ranking unit 130 ranks the suggest queries for each input query, for example, based on the feature weights learned by the learning unit 120. The ranking result is provided to the electronic store server 20. The electronic store server 20 determines a suggestion query to be presented for the input query based on the provided ranking result. As a result, the CTR of the suggestion query can be improved.

図4は、学習部120および順位付け部130により実行される処理の流れの一例を示すフローチャートである。まず、学習部120は、ランキングデータ152を読み込む(S100)。ランキングデータ152は、例えば入力クエリごとに、サジェストクエリを順位付けしたデータである。初期データとしてのランキングデータ152は、例えば、検索クエリの頻度順で並べられた所定数の(例えば200個の)サジェストクエリである。   FIG. 4 is a flowchart illustrating an example of the flow of processing executed by the learning unit 120 and the ranking unit 130. First, the learning unit 120 reads the ranking data 152 (S100). The ranking data 152 is data obtained by ranking the suggest queries for each input query, for example. The ranking data 152 as initial data is, for example, a predetermined number (for example, 200) of suggest queries arranged in the order of the frequency of the search query.

次に、学習部120が、SVMを学習用データ154に適用し、サジェストクエリの素性の重みを学習し(S102)、重みデータ156として記憶部150に記憶させる。順位付け部130は、学習された重みに基づいて、ランキングデータ152に含まれるサジェストクエリを順位付けし、ランキングデータを更新する(S104)。   Next, the learning unit 120 applies the SVM to the learning data 154, learns the weight of the feature of the suggestion query (S102), and stores it in the storage unit 150 as the weight data 156. The ranking unit 130 ranks the suggest queries included in the ranking data 152 based on the learned weights, and updates the ranking data (S104).

順位付け部130は、例えば、式(1)で表される評価値Scoreをサジェストクエリごとに算出し、評価値Scoreの高い順にサジェストクエリを順位付けする。式中、iは素性のインデックスであり、wは素性に対する重みであり、fはサジェストクエリの素性の値(例えば、前述した1〜19)である。
Score=Σw×f …(1)
For example, the ranking unit 130 calculates the evaluation value Score represented by the expression (1) for each suggestion query, and ranks the suggestion queries in descending order of the evaluation value Score. In the formula, i is a feature index, w i is a weight for the feature, and f i is a feature value of the suggestion query (for example, 1 to 19 described above).
Score = Σw i × f i (1)

以下に具体例を示す。例えば、入力クエリが「iPhone」(登録商標)であり、素性として[6.サジェスト実績CTR]および[16.検索クエリで検索をした時の商品ヒット数]が採用されたものとする。そして、学習部120は、[6.サジェスト実績CTR]に対する重みwを0.5、[16.検索クエリで検索をした時の商品ヒット数]に対する重みw16を0.3と学習したものとする。 Specific examples are shown below. For example, the input query is “iPhone” (registered trademark), and [6. Suggested track record CTR] and [16. Assume that the number of product hits when a search query is used is adopted. Then, the learning unit 120 [6. The weight w 6 for the suggest result CTR] is 0.5, [16. The weight w 16 for the goods number of hits] at the time of the search query and the search to those learning and 0.3.

この場合において、サジェストクエリ[iPhone ケース]について、[6.サジェスト実績CTR]が0.1、[16.検索クエリで検索をした時の商品ヒット数]が3(=log101000)であったとする。この場のサジェストクエリ[iPhone ケース]についての評価値Score(iPhone ケース)は、以下のように算出される。
Score(iPhone ケース)=0.5×0.1+0.3×3=0.95
In this case, for the suggestion query [iPhone case], [6. Suggested track record CTR] is 0.1, [16. Assume that the number of product hits when searching with a search query is 3 (= log 10 1000). The evaluation value Score (iPhone case) for the suggestion query [iPhone case] on this occasion is calculated as follows.
Score (iPhone case) = 0.5 × 0.1 + 0.3 × 3 = 0.95

一方、サジェストクエリ[iPhone 7]について、[6.サジェスト実績CTR]が0.2、[16.検索クエリで検索をした時の商品ヒット数]が2(=log10100)であったとする。この場のサジェストクエリ[iPhone 7]についての評価値Score(iPhone 7)は、以下のように算出される。
Score(iPhone 7)=0.5×0.2+0.3×2=0.7
On the other hand, for the suggestion query [iPhone 7], [6. Suggested track record CTR] is 0.2, [16. Assume that the number of product hits when searching with a search query is 2 (= log 10 100). The evaluation value Score (iPhone 7) for the suggestion query [iPhone 7] on this occasion is calculated as follows.
Score (iPhone 7) = 0.5 × 0.2 + 0.3 × 2 = 0.7

上記のケースでは、Score(iPhone ケース)の方がScore(iPhone 7)よりも高い値となっている。このため、順位付け部130は、サジェストクエリ[iPhone ケース]のランキングをサジェストクエリ[iPhone 7]のランキングよりも高くする。   In the above case, Score (iPhone case) is higher than Score (iPhone 7). For this reason, the ranking unit 130 sets the ranking of the suggestion query [iPhone case] higher than the ranking of the suggestion query [iPhone 7].

本出願の出願人は、単に検索クエリの頻度順で並べられたサジェストクエリのランキングと比較して、実施形態の手法により各種の指標値が有意に向上したことを確認した。指標値には、平均サジェストCTR、平均サジェストMRR(mean Reciprocal Rank)などがある。   The applicant of the present application has confirmed that various index values are significantly improved by the method of the embodiment as compared with the ranking of the suggestion query simply arranged in the order of the frequency of the search query. The index values include average suggest CTR, average suggest MRR (mean reciprocal rank), and the like.

以上説明した実施形態の情報処理装置、情報処理方法、およびプログラムによれば、電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、サジェストクエリの素性の重みを学習し、学習された素性の重みに基づいて、サジェストクエリを順位付けすることにより、より適切にサジェストクエリを順位付けすることができる。   According to the information processing apparatus, the information processing method, and the program according to the embodiments described above, it is a set of suggestion queries presented based on a query input in an electronic store, and a positive example and a negative example are distinguished. Based on the set of suggested queries, it is possible to rank the suggestion queries more appropriately by learning the feature weights of the suggestion queries and ranking the suggestion queries based on the learned feature weights. .

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。   As mentioned above, although the form for implementing this invention was demonstrated using embodiment, this invention is not limited to such embodiment at all, In the range which does not deviate from the summary of this invention, various deformation | transformation and substitution Can be added.

10 端末装置
20 電子店舗サーバ
22 ログ情報
100 ランキング管理装置(情報処理装置)
110 情報管理部
120 学習部
130 順位付け部
150 記憶部
152 ランキングデータ
154 学習用データ
156 重みデータ
10 terminal device 20 electronic store server 22 log information 100 ranking management device (information processing device)
110 Information management unit 120 Learning unit 130 Ranking unit 150 Storage unit 152 Ranking data 154 Learning data 156 Weight data

Claims (7)

電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習する学習部と、
前記学習部により学習された素性の重みに基づいて、前記サジェストクエリを順位付けする順位付け部と、
を備える情報処理装置。
Learning to learn feature weights of a suggestion query based on a set of suggestion queries that are presented based on a query input at an electronic store and are distinguished from positive examples and negative examples And
A ranking unit that ranks the suggestion queries based on weights of features learned by the learning unit;
An information processing apparatus comprising:
前記学習部は、前記クエリごとに前記サジェストクエリの素性の重みを学習し、
前記順位付け部は、前記クエリごとに前記サジェストクエリを順位付けする、
請求項1記載の情報処理装置。
The learning unit learns the feature weight of the suggestion query for each query,
The ranking unit ranks the suggestion query for each query.
The information processing apparatus according to claim 1.
前記サジェストクエリの集合は、利用者によって選択された場合に正例、選択されなかった場合に負例と区別がなされており、
前記学習部は、サポートベクタマシンを用いて素性の重みを学習し、判定が間違ったサンプルの超平面からの距離の合計が少なくなるように超平面を求める、
請求項1または2記載の情報処理装置。
The set of suggestion queries is distinguished from positive examples when selected by the user and negative examples when not selected.
The learning unit learns feature weights using a support vector machine, and determines a hyperplane so that the total distance from the hyperplane of a sample with a wrong determination is reduced.
The information processing apparatus according to claim 1 or 2.
前記素性は、検索数に依存しない情報を含む、
請求項1から3のうちいずれか1項記載の情報処理装置。
The feature includes information that does not depend on the number of searches.
The information processing apparatus according to any one of claims 1 to 3.
前記素性は、前記サジェストクエリから抜き出した名詞が検索数のランキングに入っているか否かを含む、
請求項1から4のうちいずれか1項記載の情報処理装置。
The feature includes whether or not the noun extracted from the suggestion query is in the ranking of the number of searches.
The information processing apparatus according to any one of claims 1 to 4.
コンピュータが、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習し、
前記学習した素性の重みに基づいて、前記サジェストクエリを順位付けする、
情報処理方法。
Computer
A set of suggestion queries presented based on a query input at an electronic store, and learning the weight of the feature of the suggestion query based on a set of suggestion queries in which positive examples and negative examples are distinguished,
Ranking the suggestion queries based on the learned feature weights;
Information processing method.
コンピュータに、
電子店舗において入力されたクエリに基づいて提示されるサジェストクエリの集合であって、正例、負例の区別がなされたサジェストクエリの集合に基づいて、前記サジェストクエリの素性の重みを学習させ、
前記学習させた素性の重みに基づいて、前記サジェストクエリを順位付けさせる、
プログラム。
On the computer,
A set of suggestion queries presented based on a query input at an electronic store, and based on a set of suggestion queries in which positive examples and negative examples are distinguished, the feature weights of the suggestion queries are learned,
Ranking the suggested queries based on the learned feature weights;
program.
JP2016240883A 2016-12-13 2016-12-13 Information processing equipment, information processing methods, and programs Active JP6783133B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016240883A JP6783133B2 (en) 2016-12-13 2016-12-13 Information processing equipment, information processing methods, and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016240883A JP6783133B2 (en) 2016-12-13 2016-12-13 Information processing equipment, information processing methods, and programs

Publications (2)

Publication Number Publication Date
JP2018097560A true JP2018097560A (en) 2018-06-21
JP6783133B2 JP6783133B2 (en) 2020-11-11

Family

ID=62632935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016240883A Active JP6783133B2 (en) 2016-12-13 2016-12-13 Information processing equipment, information processing methods, and programs

Country Status (1)

Country Link
JP (1) JP6783133B2 (en)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008538149A (en) * 2005-03-18 2008-10-09 ウィンク テクノロジ−ズ インコ−ポレイテッド Rating method, search result organizing method, rating system, and search result organizing system
US20090187515A1 (en) * 2008-01-17 2009-07-23 Microsoft Corporation Query suggestion generation
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
US8122011B1 (en) * 2008-03-12 2012-02-21 Google Inc. Identifying sibling queries
US8583675B1 (en) * 2009-08-28 2013-11-12 Google Inc. Providing result-based query suggestions
JP2014006620A (en) * 2012-06-22 2014-01-16 Yahoo Japan Corp Synonym estimation device, synonym estimation method, and synonym estimation program
WO2015132970A1 (en) * 2014-03-07 2015-09-11 楽天株式会社 Search device, search method, program, and storage medium
US9342626B1 (en) * 2013-06-22 2016-05-17 Google Inc. Query suggestions based on entity collections of one or more past queries

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008538149A (en) * 2005-03-18 2008-10-09 ウィンク テクノロジ−ズ インコ−ポレイテッド Rating method, search result organizing method, rating system, and search result organizing system
US20090187515A1 (en) * 2008-01-17 2009-07-23 Microsoft Corporation Query suggestion generation
US8122011B1 (en) * 2008-03-12 2012-02-21 Google Inc. Identifying sibling queries
US8583675B1 (en) * 2009-08-28 2013-11-12 Google Inc. Providing result-based query suggestions
US20110208730A1 (en) * 2010-02-23 2011-08-25 Microsoft Corporation Context-aware searching
JP2014006620A (en) * 2012-06-22 2014-01-16 Yahoo Japan Corp Synonym estimation device, synonym estimation method, and synonym estimation program
US9342626B1 (en) * 2013-06-22 2016-05-17 Google Inc. Query suggestions based on entity collections of one or more past queries
WO2015132970A1 (en) * 2014-03-07 2015-09-11 楽天株式会社 Search device, search method, program, and storage medium

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
原田 尚幸, 他3名: "評価値の離散変化追跡によるランキングモデルの最適化に関する一考察", 電子情報通信学会技術研究報告, vol. 第109巻, 第461号, JPN6012034119, 2 March 2010 (2010-03-02), pages 461 - 466, ISSN: 0004305086 *
橋本 泰平、外1名: "類似語の例示を用いた多義的クエリの曖昧性解消手法", 第8回データ工学と情報マネジメントに関するフォーラム (第14回日本データベース学会年次大会) [O, JPN6020024856, 2 March 2016 (2016-03-02), JP, pages 1 - 8, ISSN: 0004305087 *

Also Published As

Publication number Publication date
JP6783133B2 (en) 2020-11-11

Similar Documents

Publication Publication Date Title
JP6814298B2 (en) Methods and equipment for warning
CN109241431B (en) Resource recommendation method and device
US9767183B2 (en) Method and system for enhanced query term suggestion
US20150324868A1 (en) Query Categorizer
US11610246B2 (en) Product and content association
US20150347585A1 (en) Personalized Search Results
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
CN112136127B (en) Action indicator for search operation output element
JP6250106B1 (en) Information analysis apparatus, information analysis method, and information analysis program
US20160188684A1 (en) Consolidating Search Results
US20160125080A1 (en) Accessing Special Purpose Search Systems
US10474670B1 (en) Category predictions with browse node probabilities
KR20200011915A (en) Communication via simulated user
US10795648B2 (en) Systems and methods of developments, testing, and distribution of applications in a computer network
JP2019191686A (en) Information processing apparatus, information processing system, information processing method, and program
JP2022106948A (en) Information display method, device, electronic apparatus, storage media, and computer program
JP2011248762A (en) Classification device, content retrieval system, content classification method, content retrieval method, and program
JP2017151741A (en) Information processing device, information processing method, and program
JP6568284B1 (en) Providing device, providing method, and providing program
US20160378871A1 (en) Generating Search Results Using Current Software Application States
US20160124959A1 (en) System and method to recommend a bundle of items based on item/user tagging and co-install graph
JP2016110260A (en) Content search result provision system and content search result provision method
JP6783133B2 (en) Information processing equipment, information processing methods, and programs
JP2021108220A (en) Information processing device, information processing method, and program
US20170171292A1 (en) Generating Software Application Search Results Using Shared Application Connections

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190325

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200923

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201021

R150 Certificate of patent or registration of utility model

Ref document number: 6783133

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350