JP2019053525A - Generation device, generation method, and generation program - Google Patents

Generation device, generation method, and generation program Download PDF

Info

Publication number
JP2019053525A
JP2019053525A JP2017177410A JP2017177410A JP2019053525A JP 2019053525 A JP2019053525 A JP 2019053525A JP 2017177410 A JP2017177410 A JP 2017177410A JP 2017177410 A JP2017177410 A JP 2017177410A JP 2019053525 A JP2019053525 A JP 2019053525A
Authority
JP
Japan
Prior art keywords
group
search query
relevance
search
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017177410A
Other languages
Japanese (ja)
Other versions
JP6866266B2 (en
Inventor
伸次 池宮
Shinji Ikemiya
伸次 池宮
田村 健
Takeshi Tamura
健 田村
琢郎 森
Takuro Mori
琢郎 森
工藤 和也
Kazuya Kudo
和也 工藤
麻里 衣目
Mari Kinume
麻里 衣目
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017177410A priority Critical patent/JP6866266B2/en
Publication of JP2019053525A publication Critical patent/JP2019053525A/en
Priority to JP2021065463A priority patent/JP7073557B2/en
Application granted granted Critical
Publication of JP6866266B2 publication Critical patent/JP6866266B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To enable understanding the characteristics of users in a highly accurate manner.SOLUTION: A generation device according to an embodiment includes a calculation section and a generation section. The calculation section calculates a first degree of association among retrieval queries based on a retrieval query group inputted by users belonging to a first group, and a second degree of association among retrieval queries based on a retrieval query group inputted by users belonging to a second group different from the first group. The generation section generates, based on the first degree of association and the second degree of association calculated by the calculation section, indexes indicating the characteristics of users belonging to the second group.SELECTED DRAWING: Figure 3

Description

本発明は、生成装置、生成方法、及び生成プログラムに関する。   The present invention relates to a generation device, a generation method, and a generation program.

近年、インターネットの飛躍的な普及に伴い、ネットワークを介して取得される情報に基づいた情報配信が盛んに行われている。例えば、情報の配信先となる利用者の属性を示す属性情報を配信先情報として予め登録しておき、配信先となる利用者の属性情報と対応する広告を選択的に配信するターゲティング配信が行われている。   In recent years, with the rapid spread of the Internet, information distribution based on information acquired via a network is actively performed. For example, attribute distribution indicating the attribute of a user who is a distribution destination of information is registered in advance as distribution destination information, and targeted distribution that selectively distributes an advertisement corresponding to the attribute information of the user as a distribution destination is performed. It has been broken.

なお、広告の配信先となる利用者の属性情報を把握する技術として、例えば、広告と属性情報との見かけ上の関連性の程度、並びに、複数の広告と属性情報との平均的な関連性の程度に基づいて、広告と属性情報との真の関連性を算出する技術が知られている。   In addition, as a technique for grasping the attribute information of the user to whom the advertisement is distributed, for example, the apparent degree of association between the advertisement and the attribute information, and the average relation between the plurality of advertisements and the attribute information A technique for calculating a true relevance between an advertisement and attribute information based on the degree of the above is known.

特開2015−1956号公報Japanese Patent Laid-Open No. 2015-1956

しかしながら、上記の従来技術では、利用者の特徴を精度良く把握できるとは限らない。例えば、上記の従来技術では、利用者の属性情報として、利用者の性別や趣味に関する情報などといった定性的な分類によるデータを取得しているに過ぎないため、利用者の特徴を精度良く把握できるとは限らず、改善の余地があった。   However, with the above-described conventional technology, it is not always possible to accurately grasp the characteristics of the user. For example, in the above-described conventional technology, as user attribute information, data based on qualitative classification such as information on a user's sex and hobbies is only acquired, so that the characteristics of the user can be accurately grasped. However, there was room for improvement.

本願は、上記に鑑みてなされたものであって、利用者の特徴を精度良く把握することを可能にする生成装置、生成出方法、及び生成プログラムを提供することを目的とする。   The present application has been made in view of the above, and an object of the present invention is to provide a generation device, a generation method, and a generation program that make it possible to accurately grasp user characteristics.

本願に係る生成装置は、第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、前記第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する算出部と、前記算出部によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する生成部と、を備えたことを特徴とする。   The generating apparatus according to the present application includes a first relevance level between search queries based on a search query group input by a user belonging to a first group, and a search query group input by a user belonging to a second group different from the first group. An index indicating characteristics of users belonging to the second group based on the first relevance level and the second relevance level calculated by the calculation unit; And a generating unit that generates

実施形態の一態様によれば、利用者の特徴を精度良く把握することを可能にする。   According to one aspect of the embodiment, it is possible to accurately grasp the characteristics of the user.

図1は、実施形態に係る生成処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of a generation process according to the embodiment. 図2は、実施形態に係る生成システムの構成例を示す図である。FIG. 2 is a diagram illustrating a configuration example of the generation system according to the embodiment. 図3は、実施形態に係る生成装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of the generation apparatus according to the embodiment. 図4は、実施形態に係る関連度情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of the association degree information storage unit according to the embodiment. 図5は、実施形態に係る指標情報記憶部の一例を示す図である。FIG. 5 is a diagram illustrating an example of the index information storage unit according to the embodiment. 図6は、関連度及び指標値の一例を示す図である。FIG. 6 is a diagram illustrating an example of the degree of association and the index value. 図7は、指標の一例を示す図である。FIG. 7 is a diagram illustrating an example of an index. 図8は、実施形態に係る生成処理手順の一例を示すフローチャートである。FIG. 8 is a flowchart illustrating an example of a generation processing procedure according to the embodiment. 図9は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 9 is a hardware configuration diagram illustrating an example of a computer that realizes the function of the generation apparatus.

以下に本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, a generation apparatus, a generation method, and a mode for executing a generation program (hereinafter referred to as “embodiment”) according to the present application will be described in detail with reference to the drawings. The generation device, the generation method, and the generation program according to the present application are not limited by this embodiment. In the following embodiments, the same portions are denoted by the same reference numerals, and redundant description is omitted.

[1.生成処理]
まず、図1を用いて、実施形態に係る生成処理の一例について説明する。図1は、実施形態に係る生成処理の一例を示す図である。図1に示す例では、生成装置100が、検索クエリ「高級ブランドA」、並びに、他の各検索クエリ「高級ブランドB」、「高級ブランドC」及び「大衆向けブランドD」間の関連度を算出する場合を示す。ここで、実施形態において、高級ブランドA〜Cは、大衆向けブランドDと比べ、単価が高い商品を扱うブランドを示す。
[1. Generation process]
First, an example of the generation process according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a generation process according to the embodiment. In the example illustrated in FIG. 1, the generation device 100 indicates the degree of association between the search query “luxury brand A” and each of the other search queries “luxury brand B”, “luxury brand C”, and “popular brand D”. The case of calculating is shown. Here, in the embodiment, the luxury brands A to C indicate brands that handle products whose unit price is higher than the brand D for the public.

また、図1に示す例では、生成装置100が、グループU1に属するユーザが入力した検索クエリ群に基づいて算出した関連度と、グループU2に属するユーザが入力した検索クエリ群に基づいて算出した関連度とに基づいて、グループU2に属するユーザの特徴を示す指標を生成する場合を示す。ここで、実施形態において、グループU1は、後述する検索装置20が提供する所定の検索サービスのユーザ全体を示し、グループU2は、グループU1に比べ高級ブランドAを嗜好する傾向が強いユーザを示す。例えば、生成装置100は、検索クエリ「高級ブランドA」の入力回数が所定の閾値以上であるユーザをグループU2に属するユーザであると判定してもよい。   In the example illustrated in FIG. 1, the generation apparatus 100 calculates the relevance calculated based on the search query group input by the user belonging to the group U1 and the search query group input by the user belonging to the group U2. A case where an index indicating the characteristics of users belonging to the group U2 is generated based on the relevance level is shown. Here, in the embodiment, the group U1 indicates the entire users of a predetermined search service provided by the search device 20 described later, and the group U2 indicates users who tend to prefer the luxury brand A compared to the group U1. For example, the generating apparatus 100 may determine that a user whose number of inputs of the search query “luxury brand A” is equal to or greater than a predetermined threshold is a user belonging to the group U2.

[生成システムの構成]
図1の説明に先立って、図2を用いて生成システム1の構成について説明する。図2は、実施形態に係る生成システム1の構成例を示す図である。図2に示すように、実施形態に係る生成システム1は、端末装置10と、検索装置20と、生成装置100とを含む。端末装置10、検索装置20及び生成装置100は、ネットワークNを介して有線または無線により相互に通信可能に接続される。ネットワークNは、例えば、インターネットなどのWAN(Wide Area Network)である。なお、図2に示した生成システム1には、複数台の端末装置10、複数台の検索装置20及び複数台の生成装置100が含まれていてもよい。
[Configuration of generation system]
Prior to the description of FIG. 1, the configuration of the generation system 1 will be described with reference to FIG. FIG. 2 is a diagram illustrating a configuration example of the generation system 1 according to the embodiment. As illustrated in FIG. 2, the generation system 1 according to the embodiment includes a terminal device 10, a search device 20, and a generation device 100. The terminal device 10, the search device 20, and the generation device 100 are connected via a network N so that they can communicate with each other by wire or wirelessly. The network N is, for example, a WAN (Wide Area Network) such as the Internet. The generation system 1 illustrated in FIG. 2 may include a plurality of terminal devices 10, a plurality of search devices 20, and a plurality of generation devices 100.

端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。端末装置10は、ウェブブラウザやアプリケーションにより、検索装置20によって提供されるコンテンツを表示する。   The terminal device 10 is an information processing device used by a user. The terminal device 10 is realized by, for example, a smartphone, a tablet terminal, a notebook PC (Personal Computer), a desktop PC, a mobile phone, a PDA (Personal Digital Assistant), or the like. The terminal device 10 displays content provided by the search device 20 using a web browser or an application.

検索装置20は、端末装置10からの要求に応じて所定の検索サービス(例えば、ウェブページ)を提供する情報処理装置である。例えば、検索装置20は、ユーザが利用する端末装置10から検索クエリを取得し、その検索クエリに応じた検索結果を端末装置10に提供する。また、検索装置20は、端末装置10に配信したページにおいて、各ユーザが入力した検索クエリを収集し、検索装置20の記憶部に格納する。なお、検索装置20は、生成装置100と一体であってもよい。また、検索装置20は、端末装置10から検索クエリを受け付けるサービスを提供すればよく、例えば、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各ウェブページを配信してもよい。   The search device 20 is an information processing device that provides a predetermined search service (for example, a web page) in response to a request from the terminal device 10. For example, the search device 20 acquires a search query from the terminal device 10 used by the user, and provides a search result corresponding to the search query to the terminal device 10. In addition, the search device 20 collects search queries input by each user on the page distributed to the terminal device 10 and stores them in the storage unit of the search device 20. Note that the search device 20 may be integrated with the generation device 100. The search device 20 may provide a service for receiving a search query from the terminal device 10. For example, the search device 20 may provide a portal site, news site, auction site, weather forecast site, shopping site, finance (stock price) site, route search site, You may distribute each web page regarding a map provision site, a travel site, a restaurant introduction site, a web blog, etc.

検索装置20によって配信されるウェブページの情報には、例えば、マークアップ言語により記述されたファイル等が含まれる。マークアップ言語は、例えば、HTML(Hyper Text Markup Language)やXML(Extensible Markup Language)である。なお、以下においては、マークアップ言語により記述されたファイルがHTMLファイルであるものとして説明するが、マークアップ言語により記述されたファイルは、XMLファイルやその他のファイルであってもよい。   The web page information distributed by the search device 20 includes, for example, a file described in a markup language. The markup language is, for example, HTML (Hyper Text Markup Language) or XML (Extensible Markup Language). In the following description, it is assumed that the file described in the markup language is an HTML file. However, the file described in the markup language may be an XML file or other files.

生成装置100は、異なる検索クエリを入力したユーザの数を取得し、取得したユーザの数に基づいて所定の処理を行う情報処理装置である。なお、異なる検索クエリ(検索クエリXと検索クエリYとする)を入力したユーザとは、所定の期間で検索クエリXと検索クエリYとを入力したユーザを示す。例えば、ある時点で検索クエリXを入力し、その時点から所定の期間(例えば、1時間、24時間、1週間、など)内に検索クエリYを入力したユーザは、異なる検索クエリ(検索クエリXと検索クエリY)を入力したユーザに該当する。なお、1度に検索クエリXと検索クエリYの双方を入力したユーザも異なる検索クエリ(検索クエリXと検索クエリY)を入力したユーザとしてもよい。   The generation apparatus 100 is an information processing apparatus that acquires the number of users who input different search queries and performs a predetermined process based on the acquired number of users. The user who has input different search queries (referred to as search query X and search query Y) indicates a user who has input search query X and search query Y in a predetermined period. For example, a user who inputs a search query X at a certain point in time and inputs a search query Y within a predetermined period (for example, 1 hour, 24 hours, 1 week, etc.) from that point in time is a different search query (search query X And the search query Y). Note that the user who inputs both the search query X and the search query Y at one time may be a user who inputs a different search query (search query X and search query Y).

以下、図1に戻り、生成処理の一例を説明する。なお、生成装置100は、検索装置20の記憶部から、検索装置20が提供する所定の検索サービスにおいて、異なる検索クエリを入力したユーザの数を取得したものとする。具体的には、生成装置100は、検索クエリ「高級ブランドA」と「高級ブランドB」との双方を入力したユーザの数、検索クエリ「高級ブランドA」と「高級ブランドC」との双方を入力したユーザの数、並びに、検索クエリ「高級ブランドA」と「大衆向けブランドD」との双方を入力したユーザの数を取得する。   Hereinafter, returning to FIG. 1, an example of the generation process will be described. It is assumed that the generation apparatus 100 has acquired the number of users who input different search queries from a storage unit of the search apparatus 20 in a predetermined search service provided by the search apparatus 20. Specifically, the generation apparatus 100 determines the number of users who input both the search queries “luxury brand A” and “luxury brand B”, and both the search queries “luxury brand A” and “luxury brand C”. The number of input users and the number of users who input both the search queries “luxury brand A” and “popular brand D” are acquired.

まず、生成装置100は、検索クエリ間の関連度を算出する(ステップS11)。具体的には、生成装置100は、異なる検索クエリを入力したユーザの数に基づいて、検索クエリ間の関連度を算出する。より具体的には、生成装置100は、異なる検索クエリを入力したユーザの数が多いほど、異なる検索クエリ間の関連度を高く算出する。   First, the generation device 100 calculates the degree of association between search queries (step S11). Specifically, the generation device 100 calculates the degree of association between search queries based on the number of users who have input different search queries. More specifically, the generation device 100 calculates a higher degree of association between different search queries as the number of users who input different search queries increases.

図1に示す例において、生成装置100は、グループU1に属するユーザにおける、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を算出する。例えば、生成装置100は、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との双方を入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度を算出する。同様に、生成装置100は、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との双方を入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との関連度を算出し、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との双方を入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との関連度を算出する。図1の例では、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との双方を入力したユーザの数が、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との双方を入力したユーザの数よりも多く、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との双方を入力したユーザの数が、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との双方を入力したユーザの数よりも多い例を示している。そして、図1の例において、生成装置100は、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度「4.0」を算出し、検索クエリ「高級ブランドA」と検索クエリ「高級ブランドC」との関連度「2.5」を算出し、検索クエリ「高級ブランドA」と検索クエリ「大衆向けブランドD」との関連度「2.0」を算出する。また、同様に、生成装置100は、グループU2に属するユーザのうち、異なる検索クエリを入力したユーザの数に基づいて、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を算出する。   In the example illustrated in FIG. 1, the generation device 100 calculates the degree of association between the search query “luxury brand A” and other search queries for the users belonging to the group U1. For example, the generation apparatus 100 determines the search query “luxury brand A” and the search query “luxury brand B” based on the number of users who input both the search query “luxury brand A” and the search query “luxury brand B”. The degree of association with is calculated. Similarly, the generation apparatus 100 uses the search query “luxury brand A” and the search query “luxury brand C” based on the number of users who input both the search query “luxury brand A” and the search query “luxury brand C”. And the search query “luxury brand A” and the search query “popular” based on the number of users who input both the search query “luxury brand A” and the search query “popular brand D”. The degree of association with “brand D” is calculated. In the example of FIG. 1, the number of users who input both the search query “luxury brand A” and the search query “luxury brand B” are both the search query “luxury brand A” and the search query “luxury brand C”. The number of users who input both the search query “luxury brand A” and the search query “luxury brand C” is larger than the number of users who have entered the search query “luxury brand A” and the search query “popular brand”. D ”is an example that is larger than the number of users who input both. In the example of FIG. 1, the generation apparatus 100 calculates the degree of association “4.0” between the search query “luxury brand A” and the search query “luxury brand B”, and searches the search query “luxury brand A”. The degree of association “2.5” with the query “luxury brand C” is calculated, and the degree of association “2.0” between the search query “luxury brand A” and the search query “popular brand D” is calculated. Similarly, the generation apparatus 100 determines the degree of association between the search query “luxury brand A” and each of the other search queries based on the number of users who have entered different search queries among the users belonging to the group U2. calculate.

続いて、生成装置100は、ステップS11で算出した関連度に基づいて、グループU2に属するユーザの特徴を示す指標を生成する(ステップS12)。具体的には、生成装置100は、グループU1において算出された関連度よりもグループU2において算出された関連度の方が高い場合には、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有することを示す指標を生成する。一方、生成装置100は、グループU1において算出された関連度よりもグループU2において算出された関連度の方が低い場合には、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有しないことを示す指標を生成する。   Subsequently, the generation apparatus 100 generates an index indicating the characteristics of users belonging to the group U2 based on the relevance calculated in step S11 (step S12). Specifically, when the relevance degree calculated in the group U2 is higher than the relevance degree calculated in the group U1, the generation apparatus 100 searches for the search query corresponding to the relevance degree of the user belonging to the group U2. An index is generated to indicate that the feature is related to. On the other hand, when the relevance calculated in the group U2 is lower than the relevance calculated in the group U1, the generation apparatus 100 relates to the search query corresponding to the relevance of the user belonging to the group U2. An index indicating that no feature is present is generated.

以下、生成装置100が生成する指標の一例を説明する。生成装置100は、グループU2における検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度から、対応するグループU1の関連度を差し引いた数値を指標値として算出する。図1の例では、生成装置100は、グループU2における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度「6.0」から、グループU1における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度「4.0」を差し引くことで、指標値「2.0」を算出する。これは、グループU1に属するユーザよりも、高級ブランドAを嗜好する傾向が強いグループU2に属するユーザは、高級ブランドBを入力する傾向が高いことを示す。すなわち、グループU2に属するユーザは、グループU1に属するユーザよりも高級ブランドBを嗜好する傾向が強いといえる。同様にして、生成装置100は、グループU1とグループU2における各関連度の差分である指標値を算出する。そして、生成装置100は、図1に示す例のように、縦軸方向に検索クエリ「高級ブランドA」との関連度の算出対象となった各検索クエリ、横軸方向に指標値を示す値を設定したグラフG1を生成する。ここで、生成装置100は、中心軸「0」を点線で示し、中心軸から右の領域を正の領域、中心軸から左の領域を負の領域とし、算出した指標値に応じてグラフG1に丸印でマッピングする。例えば、グループU2における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度から、グループU1における検索クエリ「高級ブランドA」と検索クエリ「高級ブランドB」との関連度を差し引いた指標値が正の値であるため、生成装置100は、グラフG1の縦軸「高級ブランドB」の正の領域に丸印でマッピングする。同様にして、生成装置100は、算出した指標値に応じてグラフG1の縦軸に設定された検索クエリごとにマッピングを行う。   Hereinafter, an example of the index generated by the generation apparatus 100 will be described. The generation device 100 calculates, as an index value, a numerical value obtained by subtracting the degree of association of the corresponding group U1 from the degree of association between the search query “luxury brand A” in the group U2 and each other search query. In the example of FIG. 1, the generation apparatus 100 determines the search query “luxury brand A” in the group U1 based on the degree of association “6.0” between the search query “luxury brand A” and the search query “luxury brand B” in the group U2. The index value “2.0” is calculated by subtracting the degree of association “4.0” between the search query “luxury brand B”. This indicates that users belonging to the group U2 who tend to prefer the luxury brand A are more likely to input the luxury brand B than users belonging to the group U1. That is, it can be said that the user who belongs to the group U2 has a strong tendency to like the luxury brand B than the user who belongs to the group U1. Similarly, the generation device 100 calculates an index value that is a difference between the degrees of association between the group U1 and the group U2. Then, as in the example illustrated in FIG. 1, the generation device 100 includes each search query that is a calculation target of the degree of association with the search query “luxury brand A” in the vertical axis direction, and a value that indicates the index value in the horizontal axis direction. Is generated. Here, the generation device 100 indicates the central axis “0” by a dotted line, sets the right region from the central axis as a positive region, and sets the left region from the central axis as a negative region, and graph G1 according to the calculated index value. Map with a circle. For example, the relevance between the search query “luxury brand A” and the search query “luxury brand B” in the group U1 is subtracted from the relevance between the search query “luxury brand A” and the search query “luxury brand B” in the group U2. Since the index value is a positive value, the generation device 100 maps the positive region of the vertical axis “luxury brand B” in the graph G1 with a circle. Similarly, the generation device 100 performs mapping for each search query set on the vertical axis of the graph G1 according to the calculated index value.

このようにして、生成装置100は、グループU2のグループU1に対する特徴を示す指標を生成できる。   In this way, the generation apparatus 100 can generate an index indicating the characteristics of the group U2 with respect to the group U1.

以上のように、実施形態に係る生成装置100は、検索クエリを入力したユーザの数に基づいて、所定の属性等で特定されるグループの特徴を生成する。例えば、図1の例では、高級ブランドAを嗜好するユーザ、すなわち、高級嗜好のあるユーザは、大衆向けブランドD、すなわち低価格の商品に対して関心を示さないと考えられる。また、高級ブランドAを嗜好するユーザは、高級ブランドB及び高級ブランドCともに関心が高いが、高級ブランドの中でも特に高級ブランドBに対して関心が高いと考えられる。すなわち、実施形態に係る生成装置100は、利用者の特徴を精度良く把握することを可能にする。   As described above, the generating apparatus 100 according to the embodiment generates the characteristics of a group specified by a predetermined attribute or the like based on the number of users who input a search query. For example, in the example of FIG. 1, a user who likes the luxury brand A, that is, a user who has a luxury taste, is considered not to be interested in the popular brand D, that is, a low-priced product. A user who likes the luxury brand A is highly interested in both the luxury brand B and the luxury brand C, but is considered to be particularly interested in the luxury brand B among the luxury brands. That is, the generation apparatus 100 according to the embodiment makes it possible to accurately grasp the user's characteristics.

[2.生成装置の構成]
次に、図3を用いて、実施形態に係る生成装置100の構成について説明する。図3は、実施形態に係る生成装置100の構成例を示す図である。図3に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、生成装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[2. Configuration of generator]
Next, the configuration of the generation apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of the generation apparatus 100 according to the embodiment. As illustrated in FIG. 3, the generation device 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The generation device 100 includes an input unit (for example, a keyboard and a mouse) that receives various operations from an administrator of the generation device 100 and a display unit (for example, a liquid crystal display) for displaying various types of information. May be.

(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、生成装置100、端末装置10、検索装置20等との間で情報の送受信を行う。
(About the communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card). The communication unit 110 is connected to the network N in a wired or wireless manner, and transmits / receives information to / from the generation device 100, the terminal device 10, the search device 20, and the like.

(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、関連度情報記憶部121と、指標情報記憶部122とを有する。
(About the storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. As illustrated in FIG. 3, the storage unit 120 according to the embodiment includes a relevance information storage unit 121 and an index information storage unit 122.

(関連度情報記憶部121について)
関連度情報記憶部121に格納される関連度情報は、後述する算出部132が算出する検索クエリ間の関連度に関する各種情報をユーザグループ(図1の例における「グループU1」及び「グループU2」に相当)毎に含んだ情報である。
(Regarding Relevance Information Storage Unit 121)
The degree-of-association information stored in the degree-of-association information storage unit 121 is a user group (“group U1” and “group U2” in the example of FIG. 1) representing various types of information about the degree of association between search queries calculated by the calculation unit 132 described later. Is equivalent to each other).

ここで、図4を用いて、関連度情報記憶部121に格納される関連度情報の一例について説明する。図4は、実施形態に係る関連度情報記憶部121の一例を示す図である。図4に示すように、関連度情報記憶部121には、「ユーザグループID」、「検索クエリ」、「関連度」といった項目に属する情報が含まれる。   Here, an example of the relevance information stored in the relevance information storage unit 121 will be described with reference to FIG. FIG. 4 is a diagram illustrating an example of the association degree information storage unit 121 according to the embodiment. As illustrated in FIG. 4, the relevance information storage unit 121 includes information belonging to items such as “user group ID”, “search query”, and “relevance”.

「ユーザグループID」は、ユーザが属するグループを識別する情報を示す。例えば、図4の例では、「ユーザグループID」に、グループU1を識別する「U1」、グループU2を識別する「U2」といった情報が含まれる。「検索クエリ」は、ユーザが入力した異なる検索クエリを示す。例えば、図4の例では、「検索クエリ」に、検索クエリ「高級ブランドA」と、他の各検索クエリとの双方に関する情報が含まれる。「関連度」は、「検索クエリ」の項目に格納される検索クエリ間の関連度に関する情報を示す。例えば、図4の例では、「関連度」に、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度が格納される。   “User group ID” indicates information for identifying a group to which the user belongs. For example, in the example of FIG. 4, the “user group ID” includes information such as “U1” for identifying the group U1 and “U2” for identifying the group U2. “Search query” indicates a different search query input by the user. For example, in the example of FIG. 4, the “search query” includes information on both the search query “luxury brand A” and each of the other search queries. “Relevance” indicates information related to the relevance between search queries stored in the item “search query”. For example, in the example of FIG. 4, the “relevance” stores the relevance between the search query “luxury brand A” and each of the other search queries.

(指標情報記憶部122について)
指標情報記憶部122に格納される指標情報は、後述する生成部133が生成する情報であって、特定のユーザグループ(図1の例における「グループU2」に相当)に属するユーザの特徴を示す指標に関する各種情報を含んだ情報である。
(About the index information storage unit 122)
The index information stored in the index information storage unit 122 is information generated by the generation unit 133 to be described later, and indicates the characteristics of users belonging to a specific user group (corresponding to “group U2” in the example of FIG. 1). This information includes various information related to the index.

ここで、図5を用いて、指標情報記憶部122に格納される指標情報の一例について説明する。図5は、実施形態に係る指標情報記憶部122の一例を示す図である。図5に示すように、指標情報記憶部122には、「ユーザグループID」、「検索クエリ」、「指標値」といった項目に属する情報が含まれる。「ユーザグループID」は、指標の生成対象となったユーザグループを識別する情報を示す。例えば、図5の例では、「ユーザグループID」に、グループU2を識別する「U2」といった情報が含まれる。   Here, an example of the index information stored in the index information storage unit 122 will be described with reference to FIG. FIG. 5 is a diagram illustrating an example of the index information storage unit 122 according to the embodiment. As shown in FIG. 5, the index information storage unit 122 includes information belonging to items such as “user group ID”, “search query”, and “index value”. The “user group ID” indicates information for identifying a user group that is an index generation target. For example, in the example of FIG. 5, “user group ID” includes information such as “U2” for identifying the group U2.

「検索クエリ」は、ユーザが入力した異なる検索クエリを示す。例えば、図5の例では、「検索クエリ」に、検索クエリ「高級ブランドA」と、他の各検索クエリとの双方に関する情報が含まれる。「指標値」は、関連度情報記憶部121に格納される「関連度」に基づいて算出される値を示す。具体的には、かかる「関連度」に対応する検索クエリに関連する特徴を、「ユーザグループID」から特定されるユーザグループが有するか否かを示す値である。例えば、図5の例では、グループU2における検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度から、対応するグループU1の関連度を差し引いた数値を指標値とする。ここで、指標値が正の値である場合、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有することを示す。例えば、グループU1に属するユーザよりも、グループU2に属するユーザは、かかる関連度に対応する検索クエリを入力する傾向が高いという特徴を有することを示す。また、指標値が負の値である場合、グループU2に属するユーザがかかる関連度に対応する検索クエリに関連する特徴を有しないことを示す。例えば、グループU1に属するユーザよりも、グループU2に属するユーザは、かかる関連度に対応する検索クエリを入力する傾向が低いという特徴を有することを示す。また、指標値が0である場合、グループU1に属するユーザと、グループU2に属するユーザとは、かかる関連度に対応する検索クエリを入力する傾向が同一であることを示す。   “Search query” indicates a different search query input by the user. For example, in the example of FIG. 5, the “search query” includes information on both the search query “luxury brand A” and other search queries. The “index value” indicates a value calculated based on the “relevance level” stored in the relevance level information storage unit 121. Specifically, it is a value indicating whether or not the user group identified from the “user group ID” has a feature related to the search query corresponding to the “relevance”. For example, in the example of FIG. 5, a numerical value obtained by subtracting the degree of association of the corresponding group U1 from the degree of association between the search query “luxury brand A” in the group U2 and each other search query is used as the index value. Here, when the index value is a positive value, it indicates that the user belonging to the group U2 has a feature related to the search query corresponding to the related degree. For example, it shows that the user who belongs to the group U2 has the characteristic that the tendency which inputs the search query corresponding to this relevance is higher than the user who belongs to the group U1. Further, when the index value is a negative value, it indicates that the user belonging to the group U2 does not have a feature related to the search query corresponding to the related degree. For example, it shows that the user who belongs to the group U2 has the characteristic that the tendency which inputs the search query corresponding to this degree of association is lower than the user who belongs to the group U1. In addition, when the index value is 0, it indicates that the users belonging to the group U1 and the users belonging to the group U2 have the same tendency to input a search query corresponding to the degree of association.

(制御部130について)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(決定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部130は、図3に示すように、取得部131と、算出部132と、生成部133とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
(About the control unit 130)
Returning to the description of FIG. 3, the control unit 130 is a controller and is stored in a storage device inside the generation apparatus 100 by, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. Various programs (corresponding to an example of a determination program) are implemented by using the RAM as a work area. The control unit 130 is a controller, and is realized by an integrated circuit such as an application specific integrated circuit (ASIC) or a field programmable gate array (FPGA). As illustrated in FIG. 3, the control unit 130 according to the embodiment includes an acquisition unit 131, a calculation unit 132, and a generation unit 133, and implements or executes information processing functions and operations described below.

(取得部131について)
取得部131は、異なる検索クエリを入力したユーザの数を取得する。例えば、図1の例において、取得部131は、検索装置20が提供する所定の検索サービスにおいて異なる検索クエリを入力したユーザの数を検索装置20の記憶部から取得する。なお、以下の説明では、異なる検索クエリのうち、一方を「第1検索クエリ」(図1の例における検索クエリ「高級ブランドA」に相当)と記載し、もう一方の検索クエリであって第1検索クエリに対する関連度の算出対象となる検索クエリを「第2検索クエリ」(図1の例における検索クエリ「高級ブランドB」、「高級ブランドC」又は「大衆向けブランドD」のいずれかに相当)と記載する場合がある。
(About the acquisition unit 131)
The acquisition unit 131 acquires the number of users who input different search queries. For example, in the example of FIG. 1, the acquisition unit 131 acquires the number of users who input different search queries in a predetermined search service provided by the search device 20 from the storage unit of the search device 20. In the following description, one of the different search queries is described as “first search query” (corresponding to the search query “luxury brand A” in the example of FIG. 1). The search query for which the degree of relevance for one search query is calculated is “second search query” (search query “luxury brand B”, “luxury brand C” or “popular brand D” in the example of FIG. 1). Equivalent)).

また、取得部131は、第1検索クエリ又は第2検索クエリのいずれかを入力するユーザの数を取得し、第1検索クエリ及び第2検索クエリを両方とも入力するユーザの数を取得してもよい。   The acquisition unit 131 acquires the number of users who input either the first search query or the second search query, and acquires the number of users who input both the first search query and the second search query. Also good.

(算出部132について)
算出部132は、第1グループ(図1の例における「グループU1」に相当)に属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、第1グループと異なる第2グループ(図1の例における「グループU2」に相当)に属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する。具体的には、算出部132は、第1関連度として、第1グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出し、第2関連度として、第2グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出する。より具体的には、算出部132は、第1関連度として、第1グループに属するユーザのうち、第1検索クエリと、第1検索クエリとは異なる第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出し、第2関連度として、第2グループに属するユーザのうち、第1検索クエリと、第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出する。例えば、図1の例において、算出部132は、第1検索クエリ「高級ブランドA」と、他の各第2検索クエリとの関連度を算出する。具体的には、図1の例において、算出部132は、グループU1に属するユーザのうち、第1検索クエリ「高級ブランドA」と第2検索クエリ「高級ブランドB」との双方を入力したユーザの数に基づいて、第1検索クエリ「高級ブランドA」に対する第2検索クエリ「高級ブランドB」の関連度(第1関連度)を算出する。また、同様に、算出部132は、グループU2に属するユーザのうち、異なる検索クエリを入力したユーザの数に基づいて、第1検索クエリ「高級ブランドA」と、第2検索クエリである他の各検索クエリとの関連度(第2関連度)を算出する。
(About the calculation unit 132)
The calculation unit 132 includes a first relevance between search queries based on a search query group input by a user belonging to the first group (corresponding to “group U1” in the example of FIG. 1), and a second group different from the first group. A second degree of association between search queries based on a search query group input by a user belonging to (corresponding to “group U2” in the example of FIG. 1) is calculated. Specifically, the calculation unit 132 calculates the degree of association between different search queries based on the number of users who input different search queries among the users belonging to the first group as the first degree of association, As the relevance, the relevance between different search queries is calculated based on the number of users who input different search queries among the users belonging to the second group. More specifically, the calculation unit 132, as the first relevance, the number of users who input the first search query and the second search query different from the first search query among the users belonging to the first group. Based on the above, the relevance of the second search query to the first search query is calculated, and the user who inputs the first search query and the second search query among the users belonging to the second group as the second relevance The degree of relevance of the second search query to the first search query is calculated based on the number of. For example, in the example of FIG. 1, the calculation unit 132 calculates the degree of association between the first search query “luxury brand A” and each of the other second search queries. Specifically, in the example of FIG. 1, the calculation unit 132, among the users belonging to the group U1, inputs both the first search query “luxury brand A” and the second search query “luxury brand B”. The degree of relevance (first degree of relevance) of the second search query “luxury brand B” with respect to the first search query “luxury brand A” is calculated. Similarly, the calculation unit 132 selects the first search query “luxury brand A” and the other search queries based on the number of users who input different search queries among the users belonging to the group U2. The degree of association (second degree of association) with each search query is calculated.

なお、算出部132は、第1検索クエリ又は第2検索クエリのいずれかを入力した第1グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第1グループに属するユーザの数とに基づいて第1関連度を算出し、第1検索クエリ又は第2検索クエリのいずれかを入力した第2グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第2グループに属するユーザの数とに基づいて第2関連度を算出してもよい。例えば、算出部132は、下記式(1)に基づいて、第1検索クエリ(式(1)では、「検索クエリA」)と第2検索クエリ(式(1)では、「検索クエリB」)の第1関連度及び第2関連度を算出する。   The calculation unit 132 adds the number of users belonging to the first group that input either the first search query or the second search query and the first group that inputs both the first search query and the second search query. The first relevance is calculated based on the number of users belonging, and the number of users belonging to the second group to which either the first search query or the second search query is input, the first search query, and the second search query The second association degree may be calculated based on the number of users belonging to the second group both of which are input. For example, based on the following formula (1), the calculation unit 132 calculates the first search query (“search query A” in formula (1)) and the second search query (“search query B” in formula (1)). ) Of the first relevance and the second relevance.

Figure 2019053525
Figure 2019053525

上記式(1)において、例えば、第1関連度を算出する場合、「Score(A,B)」は、検索クエリAと検索クエリBの第1関連度の数値を示す。「Auser」は、第1グループに属するユーザのうち、検索クエリAを入力したユーザの数を示す。「Buser」は、第1グループに属するユーザのうち、検索クエリBを入力したユーザの数を示す。「ALLuser」は、第1グループに属するユーザの数を示す。そして、「Auser∧Buser」は、第1グループに属するユーザのうち、検索クエリA及び検索クエリBの両方を入力したユーザの数を示す。   In the above formula (1), for example, when calculating the first degree of association, “Score (A, B)” indicates the numerical value of the first degree of association between the search query A and the search query B. “Auser” indicates the number of users who input the search query A among the users belonging to the first group. “Buser” indicates the number of users who input the search query B among the users belonging to the first group. “ALLuser” indicates the number of users belonging to the first group. “Auser∧Buser” indicates the number of users who input both the search query A and the search query B among the users belonging to the first group.

算出部132は、上記式(1)を用いて、第1グループに属するユーザ群から入力された検索クエリの第1関連度を算出する。例えば、算出部132は、第1グループに属するユーザのうち、第1検索クエリである検索クエリAを入力したユーザが検索する検索クエリBを集計する。そして、算出部132は、第1検索クエリに対する全ての第2検索クエリに対して、上記式(1)を用いて第1関連度を算出する。   The calculation part 132 calculates the 1st relevance degree of the search query input from the user group which belongs to a 1st group using said Formula (1). For example, the calculation unit 132 aggregates the search query B searched by the user who has input the search query A that is the first search query among the users belonging to the first group. And the calculation part 132 calculates a 1st relevance degree using said Formula (1) with respect to all the 2nd search queries with respect to a 1st search query.

また、上記式(1)において、例えば、第2関連度を算出する場合、「Score(A,B)」は、検索クエリAと検索クエリBの第2関連度の数値を示す。「Auser」は、第2グループに属するユーザのうち、検索クエリAを入力したユーザの数を示す。「Buser」は、第2グループに属するユーザのうち、検索クエリBを入力したユーザの数を示す。「ALLuser」は、第2グループに属するユーザの数を示す。そして、「Auser∧Buser」は、第2グループに属するユーザのうち、検索クエリA及び検索クエリBの両方を入力したユーザの数を示す。   In the above formula (1), for example, when calculating the second relevance, “Score (A, B)” indicates the numerical value of the second relevance between the search query A and the search query B. “Auser” indicates the number of users who input the search query A among the users belonging to the second group. “Buser” indicates the number of users who input the search query B among the users belonging to the second group. “ALLuser” indicates the number of users belonging to the second group. “Auser∧Buser” indicates the number of users who input both the search query A and the search query B among the users belonging to the second group.

算出部132は、上記式(1)を用いて、第2グループに属するユーザ群から入力された検索クエリの第2関連度を算出する。例えば、算出部132は、第2グループに属するユーザのうち、第1検索クエリである検索クエリAを入力したユーザが検索する検索クエリBを集計する。そして、算出部132は、第1検索クエリに対する全ての第2検索クエリに対して、上記式(1)を用いて第2関連度を算出する。   The calculation part 132 calculates the 2nd relevance degree of the search query input from the user group which belongs to a 2nd group using said Formula (1). For example, the calculation unit 132 aggregates the search query B searched by the user who has input the search query A that is the first search query among the users belonging to the second group. And the calculation part 132 calculates a 2nd relevance degree using the said Formula (1) with respect to all the 2nd search queries with respect to a 1st search query.

また、算出部132は、第2関連度として、第1グループに含まれる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の関連度を算出してもよい。具体的には、算出部132は、第1グループのうち、所定の検索クエリの入力履歴、所定のサービスの利用履歴、または、所定の属性の少なくともいずれか一つに基づいて特定される第2グループにおける第2関連度を算出する。例えば、図1の例に示すように、算出部132は、検索装置20が提供する所定の検索サービスのユーザ全体を示す第1グループのうち、第1検索クエリ「高級ブランドA」の入力回数が所定の閾値以上であることによって特定されるユーザを第2グループに属するユーザとし、第2グループにおける第2関連度を算出してもよい。また、算出部132は、図1の例における検索装置20が提供する特定の検索サービス、又は、検索装置20以外の外部の情報処理装置が提供する種々のサービスの利用履歴によって特定されるユーザを第2グループに属するユーザとし、第2グループにおける第2関連度を算出してもよい。例えば、算出部132は、検索装置20、又は、検索装置20以外の外部の情報処理装置が提供するポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどのサービスにおける利用履歴に基づいて第2グループに属するユーザを特定してもよい。また、算出部132は、「性別」、「年代」などといった所定の属性で特定されるユーザを第2グループに属するユーザとし、第2グループにおける第2関連度を算出してもよい。   Further, the calculation unit 132 may calculate the degree of association between search queries based on a search query group input by a user belonging to the second group included in the first group as the second degree of association. Specifically, the calculation unit 132 is identified based on at least one of an input history of a predetermined search query, a usage history of a predetermined service, or a predetermined attribute in the first group. The second degree of association in the group is calculated. For example, as illustrated in the example of FIG. 1, the calculation unit 132 receives the first search query “luxury brand A” from the first group indicating the entire users of a predetermined search service provided by the search device 20. A user specified by being equal to or greater than a predetermined threshold may be a user belonging to the second group, and the second association degree in the second group may be calculated. Further, the calculation unit 132 selects a user specified by a use history of a specific search service provided by the search device 20 in the example of FIG. 1 or various services provided by an external information processing device other than the search device 20. It is assumed that the user belongs to the second group, and the second association degree in the second group may be calculated. For example, the calculation unit 132 includes a portal site, news site, auction site, weather forecast site, shopping site, finance (stock price) site, route search provided by the search device 20 or an external information processing device other than the search device 20. Users belonging to the second group may be specified based on the use history in services such as sites, map providing sites, travel sites, restaurant introduction sites, and web blogs. Further, the calculation unit 132 may calculate a second relevance level in the second group by setting a user specified by a predetermined attribute such as “gender” or “age” as a user belonging to the second group.

(生成部133について)
生成部133は、算出部132によって算出された第1関連度と第2関連度とに基づいて、第2グループに属するユーザの特徴を示す指標を生成する。具体的には、生成部133は、第1関連度と第2関連度との高低関係に基づいて第2グループに属するユーザの特徴を示す指標を生成する。例えば、図1の例において、生成部133は、グループU2における第1検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度から、対応するグループU1の関連度を差し引いた数値を、グループU2に属するユーザの特徴を示す指標値として算出する。
(About the generator 133)
The generation unit 133 generates an index indicating the characteristics of the users belonging to the second group based on the first relevance level and the second relevance level calculated by the calculation unit 132. Specifically, the generation unit 133 generates an index indicating the characteristics of the users belonging to the second group based on the level relationship between the first relevance level and the second relevance level. For example, in the example of FIG. 1, the generation unit 133 obtains a numerical value obtained by subtracting the degree of association of the corresponding group U1 from the degree of association between the first search query “luxury brand A” in the group U2 and each of the other search queries. The index value indicating the characteristics of the users belonging to the group U2 is calculated.

また、生成部133は、第1関連度よりも第2関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有することを示す指標を生成し、第2関連度よりも前記第1関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有しないことを示す指標を生成する。例えば、図1の例において、算出部132が算出したグループU2における第1検索クエリ「高級ブランドA」と第2検索クエリ「高級ブランドB」との関連度は「6.0」であり、グループU1における第1検索クエリ「高級ブランドA」と第2検索クエリ「高級ブランドB」との関連度は「4.0」である。すなわち、第1関連度よりも第2関連度が高いため、生成部133は、グループU2に属するユーザがグループU1に属するユーザよりも第2検索クエリ「高級ブランドB」に関連する特徴を有する指標を生成する。具体的には、生成部133は、グループU1に属するユーザよりも、高級ブランドAを嗜好する傾向が強いグループU2に属するユーザが、高級ブランドBを入力する傾向が高いという特徴を有することを示す指標(図1における「グラフG1」に相当)を生成する。また、図1の例において、算出部132が算出したグループU1における第1検索クエリ「高級ブランドA」と第2検索クエリ「大衆向けブランドD」との関連度は「2.0」であり、グループU2における第1検索クエリ「高級ブランドA」と第2検索クエリ「大衆向けブランドD」との関連度は「0.5」である。すなわち、第2関連度よりも第1関連度が高いため、生成部133は、グループU2に属するユーザがグループU1に属するユーザよりも第2検索クエリ「大衆向けブランドD」に関連する特徴を有しない指標を生成する。具体的には、生成部133は、グループU1に属するユーザよりも、高級ブランドAを嗜好する傾向が強いグループU2に属するユーザが、大衆向けブランドDを入力する傾向が低いという特徴を有することを示す指標を生成する。   In addition, when the second relevance level is higher than the first relevance level, the generation unit 133 indicates that the user belonging to the second group has a characteristic related to the second search query than the user belonging to the first group. If the first relevance level is higher than the second relevance level, a user belonging to the second group does not have a feature related to the second search query than a user belonging to the first group. An index indicating is generated. For example, in the example of FIG. 1, the relevance between the first search query “luxury brand A” and the second search query “luxury brand B” in the group U2 calculated by the calculation unit 132 is “6.0”. The degree of association between the first search query “luxury brand A” and the second search query “luxury brand B” in U1 is “4.0”. That is, since the second relevance degree is higher than the first relevance degree, the generation unit 133 has an index in which a user belonging to the group U2 has a characteristic related to the second search query “luxury brand B” rather than a user belonging to the group U1. Is generated. Specifically, the generation unit 133 indicates that a user who belongs to the group U2 who has a strong tendency to prefer the luxury brand A is more likely to input the luxury brand B than a user who belongs to the group U1. An index (corresponding to “graph G1” in FIG. 1) is generated. In the example of FIG. 1, the relevance between the first search query “luxury brand A” and the second search query “popular brand D” in the group U1 calculated by the calculation unit 132 is “2.0”. The degree of association between the first search query “luxury brand A” and the second search query “popular brand D” in the group U2 is “0.5”. That is, since the first relevance level is higher than the second relevance level, the generation unit 133 has a characteristic that the user belonging to the group U2 is related to the second search query “popular brand D” more than the user belonging to the group U1. Generate an indicator that does not. Specifically, the generation unit 133 has a feature that a user belonging to the group U2 who has a strong tendency to prefer the luxury brand A is less likely to input the brand D for the public than a user belonging to the group U1. Generate indicators to show.

また、生成部133は、第2グループに属するユーザの特徴を示す指標として、第2検索クエリが属するカテゴリへの嗜好性を有するか否かを示す指標を生成する。ここで、図6及び7を用いて、第1検索クエリが属するカテゴリと、第2検索クエリが属するカテゴリとに基づいて算出されたグループU1、グループU2の各グループに属するユーザにおける各関連度に基づいて生成部133が生成する指標の一例を説明する。図6は、関連度及び指標値の一例を示す図である。   Moreover, the production | generation part 133 produces | generates the parameter | index which shows whether it has the palatability to the category to which a 2nd search query belongs as a parameter | index which shows the user's characteristic which belongs to a 2nd group. Here, with reference to FIGS. 6 and 7, the relevance levels of the users belonging to each of the groups U1 and U2 calculated based on the category to which the first search query belongs and the category to which the second search query belongs are shown. An example of the index generated by the generation unit 133 based on the above will be described. FIG. 6 is a diagram illustrating an example of the degree of association and the index value.

なお、本説明において、算出部132は、第1検索クエリが属するカテゴリを「コスメ系クエリ群」とし、各第2検索クエリが属する各カテゴリとの関連度を算出したものとする。ここで、本説明において、グループU1は、図1に示す検索装置20が提供する所定の検索サービスのユーザ全体を示し、グループU2は、グループU1に比べ、カテゴリ「コスメ系クエリ群」に関する事項を嗜好する傾向が強いユーザを示す。例えば、算出部132は、カテゴリ「コスメ系クエリ群」に属する検索クエリの入力回数が所定の閾値以上であるユーザをグループU2に属するユーザとしてもよい。なお、カテゴリ「コスメ系クエリ群」には、例えば、「化粧水」、「香水」、「口紅」などといった検索クエリが含まれる。また、例えば、第2検索クエリが属するカテゴリの一例「動画系クエリ群」には、「ミュージックビデオ」、「ショートムービー」、「予告動画」などといった検索クエリが含まれる。   In this description, it is assumed that the calculation unit 132 calculates the degree of association with each category to which each second search query belongs, assuming that the category to which the first search query belongs is a “cosmetic query group”. Here, in this description, the group U1 indicates the entire users of the predetermined search service provided by the search device 20 shown in FIG. 1, and the group U2 includes items related to the category “cosmetic query group” as compared to the group U1. Indicates a user who has a strong tendency to like. For example, the calculation unit 132 may set a user whose number of input of a search query belonging to the category “cosmetic system query group” is equal to or greater than a predetermined threshold as a user belonging to the group U2. The category “cosmetic system query group” includes search queries such as “skin lotion”, “perfume”, “lipstick”, and the like. Further, for example, the “movie query group” of the category to which the second search query belongs includes a search query such as “music video”, “short movie”, “notice movie”, and the like.

また、図6に示す例において、算出部132は、グループU1に属するユーザにおける、カテゴリ「コスメ系クエリ群」に属する一の検索クエリと、第2検索クエリが属するカテゴリの各検索クエリとの関連度を算出したものとする。例えば、算出部132は、検索クエリ「化粧水」と検索クエリ「ミュージックビデオ」との双方を入力したユーザの数に基づいて、検索クエリ「化粧水」と検索クエリ「ミュージックビデオ」との関連度を算出する。同様に、算出部132は、検索クエリ「化粧水」と検索クエリ「ショートムービー」との双方を入力したユーザの数に基づいて、検索クエリ「化粧水」と検索クエリ「ショートムービー」との関連度を算出し、検索クエリ「化粧水」と検索クエリ「予告動画」との双方を入力したユーザの数に基づいて、検索クエリ「化粧水」と検索クエリ「予告動画」との関連度を算出する。同様に、算出部132は、カテゴリ「コスメ系クエリ群」に属する他の一の検索クエリと、第2検索クエリが属するカテゴリの各検索クエリとの関連度を算出する。そして、算出部132は、算出した関連度の平均値を算出し、算出した平均値をグループU1に属するユーザにおける、カテゴリ「コスメ系クエリ群」と「動画系クエリ群」との関連度とする。図6に示す例において、算出部132は、カテゴリ「コスメ系クエリ群」と「動画系クエリ群」との関連度を「4.0」と算出したものとする。また、同様に、算出部132は、「コスメ系クエリ群」と、第2検索クエリが属する各カテゴリとの関連度を算出したものとする。   Further, in the example illustrated in FIG. 6, the calculation unit 132 relates the relationship between one search query belonging to the category “cosmetic query group” and each search query of the category to which the second search query belongs, for users belonging to the group U1. Assume that the degree is calculated. For example, based on the number of users who input both the search query “skin lotion” and the search query “music video”, the calculation unit 132 determines the degree of association between the search query “skin lotion” and the search query “music video”. Is calculated. Similarly, based on the number of users who input both the search query “skin lotion” and the search query “short movie”, the calculation unit 132 associates the search query “skin lotion” with the search query “short movie”. The degree of relevance between the search query “skin lotion” and the search query “preliminary video” is calculated based on the number of users who input both the search query “skin lotion” and the search query “preliminary video”. To do. Similarly, the calculation unit 132 calculates the degree of association between another search query belonging to the category “cosmetic query group” and each search query of the category to which the second search query belongs. Then, the calculation unit 132 calculates the average value of the calculated relevance degrees, and uses the calculated average value as the relevance degree between the category “cosmetic query group” and the “movie query group” for the users belonging to the group U1. . In the example illustrated in FIG. 6, it is assumed that the calculation unit 132 calculates the degree of association between the category “cosmetic query group” and the “movie query group” as “4.0”. Similarly, it is assumed that the calculation unit 132 calculates the degree of association between the “cosmetic query group” and each category to which the second search query belongs.

また、同様に、算出部132は、グループU2に属するユーザにおける、「コスメ系クエリ群」と、第2検索クエリが属する各カテゴリとの関連度を算出したものとする。   Similarly, it is assumed that the calculation unit 132 calculates the degree of association between the “cosmetic query group” and each category to which the second search query belongs in the users belonging to the group U2.

生成部133は、算出部132が算出した第1検索クエリが属するカテゴリと、第2検索クエリが属する各カテゴリとの関連度に基づいて、グループU2に属するユーザの指標値を算出する。図6の例では、生成部133は、グループU2におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度「5.5」から、グループU1におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度「4.0」を差し引くことで、指標値「+1.5」を算出する。これは、グループU1に属するユーザよりも、カテゴリ「コスメ系クエリ群」に関する事項を嗜好する傾向が強いグループU2に属するユーザは、カテゴリ「動画系クエリ群」に属する検索クエリを入力する傾向が高いことを示す。すなわち、グループU2に属するユーザは、グループU1に属するユーザよりもカテゴリ「動画系クエリ群」に関する事項を嗜好する傾向が強いといえる。同様にして、生成部133は、グループU1とグループU2における各関連度の差分である指標値を算出する。   The generation unit 133 calculates the index value of the user belonging to the group U2 based on the degree of association between the category to which the first search query belongs calculated by the calculation unit 132 and each category to which the second search query belongs. In the example of FIG. 6, the generation unit 133 determines the category “cosmetic query group” in the group U1 based on the degree of association “5.5” between the category “cosmetic query group” and the category “video query group” in the group U2. The index value “+1.5” is calculated by subtracting the degree of association “4.0” between the category and the “movie query group”. This is because users who belong to the group U2, who tend to prefer items related to the category “cosmetic query group”, are more likely to input search queries that belong to the category “movie query group” than users who belong to the group U1. It shows that. That is, it can be said that the user who belongs to the group U2 has a strong tendency to like the matter regarding the category “moving picture system query group” than the user who belongs to the group U1. Similarly, the generation unit 133 calculates an index value that is a difference between the degrees of association between the group U1 and the group U2.

そして、生成部133は、図7に示すように、縦軸方向にカテゴリ「コスメ系クエリ群」との関連度の算出対象となった各カテゴリに関する事項、横軸方向に指標値を示す値を設定したグラフG11を生成する。図7は、指標の一例を示す図である。ここで、生成部133は、中心軸「0」を点線で示し、中心軸から右の領域を正の領域、中心軸から左の領域を負の領域とし、算出した指標値に応じてグラフG11に丸印でマッピングする。例えば、グループU2におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度から、グループU1におけるカテゴリ「コスメ系クエリ群」とカテゴリ「動画系クエリ群」との関連度を差し引いた指標値が正の値であるため、生成部133は、グラフG11の縦軸「動画好き」の正の領域に丸印でマッピングする。同様にして、生成部133は、算出した指標値に応じてグラフG11の縦軸に設定されたカテゴリに関する事項ごとにマッピングを行う。   Then, as illustrated in FIG. 7, the generation unit 133 displays items related to each category for which the degree of association with the category “cosmetic query group” is calculated in the vertical axis direction, and values indicating index values in the horizontal axis direction. The set graph G11 is generated. FIG. 7 is a diagram illustrating an example of an index. Here, the generation unit 133 indicates the central axis “0” with a dotted line, sets the right region from the central axis as a positive region, and sets the left region from the central axis as a negative region, and graph G11 according to the calculated index value. Map with a circle. For example, the degree of association between the category “cosmetic query group” and the category “video system query group” in the group U1 is subtracted from the degree of association between the category “cosmetic system query group” and the category “video system query group” in the group U2. Since the index value is a positive value, the generation unit 133 maps the positive region of the vertical axis “moving image like” on the graph G11 with a circle. Similarly, the generation unit 133 performs mapping for each item related to the category set on the vertical axis of the graph G11 according to the calculated index value.

なお、生成部133は、算出部132が算出した第1検索クエリと、第2検索クエリが属するカテゴリとの関連度に基づいて指標を生成してもよい。   Note that the generation unit 133 may generate an index based on the degree of association between the first search query calculated by the calculation unit 132 and the category to which the second search query belongs.

[3.決定処理のフロー]
ここで、図8を用いて、実施形態に係る生成処理の手順について説明する。図8は、実施形態に係る生成処理手順の一例を示すフローチャートである。
[3. Decision process flow]
Here, the procedure of the generation process according to the embodiment will be described with reference to FIG. FIG. 8 is a flowchart illustrating an example of a generation processing procedure according to the embodiment.

図8に示すように、生成装置100は、検索装置20から、異なる検索クエリを入力したユーザの数を取得する(ステップS101)。続いて、生成装置100は、第1関連度を算出する(ステップS102)。例えば、図1に示す例において、生成装置100は、グループU1に属するユーザにおける、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を第1関連度として算出する。続いて、生成装置100は、第2関連度を算出する(ステップS103)。図1に示す例において、グループU2に属するユーザにおける、検索クエリ「高級ブランドA」と、他の各検索クエリとの関連度を第2関連度として算出する。   As illustrated in FIG. 8, the generation device 100 acquires the number of users who input different search queries from the search device 20 (step S101). Subsequently, the generation device 100 calculates a first relevance level (step S102). For example, in the example illustrated in FIG. 1, the generation device 100 calculates the degree of association between the search query “high-end brand A” and each of the other search queries as the first degree of association for the users belonging to the group U1. Subsequently, the generating apparatus 100 calculates a second relevance level (step S103). In the example illustrated in FIG. 1, the degree of association between the search query “luxury brand A” and other search queries for the users belonging to the group U2 is calculated as the second degree of association.

続いて、生成装置100は、第1関連度及び第2関連度に基づいて指標値を算出する(ステップS104)。続いて、生成装置100は、算出した指標値に基づいて指標を生成し(ステップS105)、処理を終了する。例えば、図1に示す例において、生成装置100は、算出した指標値が正の値である場合、指標を示すグラフの正の領域にマッピングする。具体的には、生成装置100は、グラフG1の中心軸「0」から右の領域に丸印でマッピングする。また、生成装置100は、第1関連度及び第2関連度に基づいて算出した指標値が負の値である場合、指標を示すグラフの負の領域にマッピングする。具体的には、生成装置100は、グラフG1の中心軸「0」から左の領域に丸印でマッピングする。また、生成装置100は、算出した指標値が0である場合、グラフG1の中心軸「0」に丸印でマッピングする。   Subsequently, the generation device 100 calculates an index value based on the first relevance level and the second relevance level (step S104). Subsequently, the generation device 100 generates an index based on the calculated index value (step S105), and ends the process. For example, in the example illustrated in FIG. 1, when the calculated index value is a positive value, the generation apparatus 100 maps to a positive area of a graph indicating the index. Specifically, the generation device 100 maps a circle to the right region from the central axis “0” of the graph G1. Moreover, the production | generation apparatus 100 maps to the negative area | region of the graph which shows an parameter | index, when the index value calculated based on the 1st relevance level and the 2nd relevance level is a negative value. Specifically, the generation device 100 maps a circle to the left region from the central axis “0” of the graph G1. Further, when the calculated index value is 0, the generation apparatus 100 maps the central axis “0” of the graph G1 with a circle.

[4.効果]
上述してきたように、実施形態に係る生成装置100は、算出部132と、生成部133とを有する。算出部132は、第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する。生成部133は、算出部132によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する。
[4. effect]
As described above, the generation device 100 according to the embodiment includes the calculation unit 132 and the generation unit 133. The calculation unit 132 includes a first relevance between search queries based on a search query group input by a user belonging to the first group, and a search query based on a search query group input by a user belonging to a second group different from the first group. And a second relevance level between them. The generation unit 133 generates an index indicating the characteristics of the users belonging to the second group based on the first relevance level and the second relevance level calculated by the calculation unit 132.

これにより、実施形態に係る生成装置100は、利用者が入力した検索クエリ群、すなわち、定量的なデータに基づいて利用者の特徴を示す指標を生成できるため、利用者の特徴を精度良く把握することを可能にする。   Thereby, since the generation apparatus 100 according to the embodiment can generate an index indicating the user characteristics based on the search query group input by the user, that is, quantitative data, the user characteristics can be accurately grasped. Make it possible to do.

また、算出部132は、第1関連度として、第1グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出し、第2関連度として、第2グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、異なる検索クエリ間の関連度を算出する。   In addition, the calculation unit 132 calculates the degree of association between different search queries based on the number of users who input different search queries among the users belonging to the first group as the first degree of association, The relevance between different search queries is calculated based on the number of users who input different search queries among the users belonging to the second group.

これにより、実施形態に係る生成装置100は、各検索クエリ間の関連度に基づいて利用者の特徴を示す指標を生成できるため、第2グループに属する利用者の特徴を精度良く把握することを可能にする。   Thereby, since the production | generation apparatus 100 which concerns on embodiment can produce | generate the parameter | index which shows a user's characteristic based on the relevance degree between each search query, it can grasp | ascertain the characteristic of the user who belongs to a 2nd group accurately. to enable.

また、生成部133は、第1関連度と第2関連度との高低関係に基づいて第2グループに属するユーザの特徴を示す指標を生成する。   In addition, the generation unit 133 generates an index indicating the characteristics of users belonging to the second group based on the level relationship between the first relevance level and the second relevance level.

これにより、実施形態に係る生成装置100は、第1関連度と第2関連度との相対的な関係に基づいて第2グループの第2関連度に属する利用者の特徴を示す指標を生成できるため、第2グループの利用者の特徴をより精度良く把握することを可能にする。   Thereby, the production | generation apparatus 100 which concerns on embodiment can produce | generate the parameter | index which shows the characteristic of the user who belongs to the 2nd relevance degree of a 2nd group based on the relative relationship of a 1st relevance degree and a 2nd relevance degree. Therefore, it is possible to grasp the characteristics of the users of the second group with higher accuracy.

また、算出部132は、第1グループに属するユーザのうち、第1検索クエリと、第1検索クエリとは異なる第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出し、第2関連度として、第2グループに属するユーザのうち、第1検索クエリと、第2検索クエリとを入力するユーザの数に基づいて、第1検索クエリに対する第2検索クエリの関連度を算出し、生成部133は、第1関連度よりも第2関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有することを示す指標を生成し、第2関連度よりも第1関連度が高い場合には、第2グループに属するユーザが第1グループに属するユーザよりも第2検索クエリに関連する特徴を有しないことを示す指標を生成する。   In addition, the calculation unit 132 selects the first search query based on the number of users who input the first search query and the second search query different from the first search query among the users belonging to the first group. The first search query is calculated based on the number of users who input the first search query and the second search query among the users belonging to the second group as the second relevance level. When the second relevance level is higher than the first relevance level, the generation unit 133 determines that the user belonging to the second group is second than the user belonging to the first group. When an index indicating that the search query has characteristics related to the search query is generated and the first relevance is higher than the second relevance, the second search is more likely than the user belonging to the first group. The query Generating an indication that has no associated features.

これにより、実施形態に係る生成装置100は、第1関連度を基準として指標を生成することにより、第2グループに属する利用者の特徴をより精度良く把握することを可能にする。   Thereby, the production | generation apparatus 100 which concerns on embodiment makes it possible to grasp | ascertain the characteristic of the user who belongs to a 2nd group more accurately by producing | generating a parameter | index on the basis of a 1st relevance degree.

また、生成部133は、第2グループに属するユーザの特徴を示す指標として、第2検索クエリが属するカテゴリへの嗜好性を有するか否かを示す指標を生成する。   Moreover, the production | generation part 133 produces | generates the parameter | index which shows whether it has the palatability to the category to which a 2nd search query belongs as a parameter | index which shows the user's characteristic which belongs to a 2nd group.

これにより、実施形態に係る生成装置100は、検索クエリが属するカテゴリへの嗜好性を示す指標を生成するため、第2グループに属する利用者の特徴をカテゴリ単位で精度良く把握することを可能にする。   Thereby, since the production | generation apparatus 100 which concerns on embodiment produces | generates the parameter | index which shows the palatability to the category to which a search query belongs, it becomes possible to grasp | ascertain the characteristic of the user which belongs to a 2nd group with a category unit accurately. To do.

また、算出部132は、第1検索クエリ又は第2検索クエリのいずれかを入力した第1グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第1グループに属するユーザの数とに基づいて第1関連度を算出し、第1検索クエリ又は第2検索クエリのいずれかを入力した第2グループに属するユーザの数と、第1検索クエリ及び第2検索クエリを両方とも入力した第2グループに属するユーザの数とに基づいて第2関連度を算出する。   In addition, the calculation unit 132 adds the number of users belonging to the first group to which either the first search query or the second search query is input and the first group to which both the first search query and the second search query are input. The first relevance is calculated based on the number of users belonging, and the number of users belonging to the second group to which either the first search query or the second search query is input, the first search query, and the second search query The second relevance level is calculated based on the number of users belonging to the second group both of which are input.

これにより、実施形態に係る生成装置100は、各検索クエリ間の関連度をより精度よく算出し、算出した関連度に基づいて利用者の特徴を示す指標を生成できるため、第2グループに属する利用者の特徴を精度良く把握することを可能にする。   Thereby, since the generation apparatus 100 according to the embodiment can calculate the degree of association between the search queries more accurately and can generate an index indicating the characteristics of the user based on the calculated degree of association, the generation apparatus 100 belongs to the second group. It is possible to accurately grasp the characteristics of users.

また、算出部132は、第2関連度として、第1グループに含まれる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の関連度を算出する。   Moreover, the calculation part 132 calculates the relevance degree between the search queries based on the search query group input by the user who belongs to the 2nd group contained in the 1st group as a 2nd relevance degree.

これにより、実施形態に係る生成装置100は、例えば利用者全体を対象とする第1グループに含まれる第2グループに属する利用者の特徴を示す指標を生成するため、利用者全体のうち所定の属性等を有する利用者の特徴を精度良く把握することを可能にする。   Accordingly, the generation apparatus 100 according to the embodiment generates, for example, an index indicating the characteristics of the users belonging to the second group included in the first group for the entire user. It is possible to accurately grasp the characteristics of users having attributes and the like.

また、算出部132は、所定の検索クエリの入力履歴、所定のサービスの利用履歴、または、所定の属性の少なくともいずれか一つに基づいて特定される第2グループにおける第2関連度を算出する。   In addition, the calculation unit 132 calculates the second relevance level in the second group specified based on at least one of a predetermined search query input history, a predetermined service usage history, and a predetermined attribute. .

これにより、実施形態に係る生成装置100は、行動情報又は属性情報等により特定される第2グループに属する利用者の特徴を示す指標を生成するため、所定の情報によって特定される第2グループに属する利用者の特徴を精度良く把握することを可能にする。   Accordingly, the generation apparatus 100 according to the embodiment generates an index indicating the characteristics of the users belonging to the second group specified by the behavior information or the attribute information, and thus the second group specified by the predetermined information. It is possible to accurately grasp the characteristics of the user to which the user belongs.

[5.ハードウェア構成]
また、上述してきた各実施形態に係る生成装置は、例えば図9に示すような構成のコンピュータ1000によって実現される。以下、生成装置100を例に挙げて説明する。図9は、生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[5. Hardware configuration]
Further, the generation apparatus according to each embodiment described above is realized by a computer 1000 having a configuration as shown in FIG. 9, for example. Hereinafter, the generation apparatus 100 will be described as an example. FIG. 9 is a hardware configuration diagram illustrating an example of a computer 1000 that implements the functions of the generation apparatus 100. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。   The HDD 1400 stores a program executed by the CPU 1100, data used by the program, and the like. The communication interface 1500 receives data from other devices via the communication network 500 (corresponding to the network N in the embodiment) and sends the data to the CPU 1100, and the data generated by the CPU 1100 via the communication network 500 is sent to the other devices. Send to device.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the data generated via the input / output interface 1600 to the output device.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

例えば、コンピュータ1000が生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。   For example, when the computer 1000 functions as the generation apparatus 100, the CPU 1100 of the computer 1000 implements the function of the control unit 130 by executing a program loaded on the RAM 1200. In addition, each data in the storage unit 120 is stored in the HDD 1400. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them, but as another example, these programs may be obtained from other devices via a predetermined communication network.

[6.その他]
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
[6. Others]
As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. However, these are merely examples, and various modifications, including the aspects described in the disclosure section of the invention, based on the knowledge of those skilled in the art, It is possible to implement the present invention in other forms with improvements.

また、上述した生成装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。   Further, the generation apparatus 100 described above may be realized by a plurality of server computers, and depending on functions, an external platform or the like may be realized by calling an API (Application Programming Interface), network computing, or the like. Can be changed flexibly.

また、特許請求の範囲に記載した「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。   Further, “section (module, unit)” described in the claims can be read as “means”, “circuit”, and the like. For example, the generation unit can be read as generation means or a generation circuit.

1 生成システム
20 検索装置
100 生成装置
110 通信部
120 記憶部
121 関連度情報記憶部
122 指標情報記憶部
130 制御部
131 取得部
132 算出部
133 生成部
DESCRIPTION OF SYMBOLS 1 Generation system 20 Search apparatus 100 Generation apparatus 110 Communication part 120 Storage part 121 Relevance information storage part 122 Index information storage part 130 Control part 131 Acquisition part 132 Calculation part 133 Generation part

Claims (10)

第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、前記第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する算出部と、
前記算出部によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する生成部と、
を備えたことを特徴とする生成装置。
A second relevance between search queries based on a search query group input by a user belonging to the first group and a search query based on a search query group input by a user belonging to a second group different from the first group. A calculation unit for calculating relevance;
A generating unit that generates an index indicating characteristics of users belonging to the second group based on the first relevance level and the second relevance level calculated by the calculation unit;
A generating apparatus comprising:
前記算出部は、
前記第1関連度として、前記第1グループに属するユーザのうち異なる検索クエリを入力するユーザの数に基づいて、前記異なる検索クエリ間の関連度を算出し、前記第2関連度として、前記第2グループに属するユーザのうち前記異なる検索クエリを入力するユーザの数に基づいて、前記異なる検索クエリ間の関連度を算出する、
ことを特徴とする請求項1に記載の生成装置。
The calculation unit includes:
As the first relevance, the relevance between the different search queries is calculated based on the number of users who input different search queries among the users belonging to the first group, and the second relevance is the first relevance Calculating a relevance between the different search queries based on the number of users who input the different search queries among the users belonging to two groups;
The generating apparatus according to claim 1, wherein:
前記生成部は、
前記第1関連度と前記第2関連度との高低関係に基づいて前記第2グループに属するユーザの特徴を示す指標を生成する、
ことを特徴とする請求項1又は2に記載の生成装置。
The generator is
Generating an index indicating characteristics of users belonging to the second group based on a height relationship between the first relevance level and the second relevance level;
The generating apparatus according to claim 1 or 2, wherein
前記算出部は、
前記第1関連度として、前記第1グループに属するユーザのうち、第1検索クエリと、当該第1検索クエリとは異なる第2検索クエリとを入力するユーザの数に基づいて、前記第1検索クエリに対する前記第2検索クエリの関連度を算出し、前記第2関連度として、前記第2グループに属するユーザのうち、前記第1検索クエリと、前記第2検索クエリとを入力するユーザの数に基づいて、前記第1検索クエリに対する前記第2検索クエリの関連度を算出し、
前記生成部は、
前記第1関連度よりも前記第2関連度が高い場合には、前記第2グループに属するユーザが前記第1グループに属するユーザよりも前記第2検索クエリに関連する特徴を有することを示す指標を生成し、前記第2関連度よりも前記第1関連度が高い場合には、前記第2グループに属するユーザが前記第1グループに属するユーザよりも前記第2検索クエリに関連する特徴を有しないことを示す指標を生成する、
ことを特徴とする請求項1〜3のいずれか一つに記載の生成装置。
The calculation unit includes:
Based on the number of users who input the first search query and the second search query different from the first search query among the users belonging to the first group as the first relevance level, the first search The degree of relevance of the second search query to the query is calculated, and the number of users who input the first search query and the second search query among the users belonging to the second group as the second relevance degree And calculating the relevance of the second search query to the first search query,
The generator is
When the second relevance level is higher than the first relevance level, an index indicating that a user belonging to the second group has characteristics related to the second search query than a user belonging to the first group When the first relevance level is higher than the second relevance level, the user belonging to the second group has a characteristic related to the second search query than the user belonging to the first group. Generate an indicator of not
The generating apparatus according to claim 1, wherein
前記生成部は、
前記第2グループに属するユーザの特徴を示す指標として、前記第2検索クエリが属するカテゴリへの嗜好性を有するか否かを示す指標を生成する、
ことを特徴とする請求項4に記載の生成装置。
The generator is
Generating an index indicating whether or not the user has a preference for the category to which the second search query belongs, as an index indicating characteristics of users belonging to the second group;
The generating apparatus according to claim 4.
前記算出部は、
前記第1検索クエリ又は前記第2検索クエリのいずれかを入力した前記第1グループに属するユーザの数と、前記第1検索クエリ及び前記第2検索クエリを両方とも入力した前記第1グループに属するユーザの数とに基づいて前記第1関連度を算出し、前記第1検索クエリ又は前記第2検索クエリのいずれかを入力した前記第2グループに属するユーザの数と、前記第1検索クエリ及び前記第2検索クエリを両方とも入力した前記第2グループに属するユーザの数とに基づいて前記第2関連度を算出する、
ことを特徴とする請求項4又は5に記載の生成装置。
The calculation unit includes:
The number of users belonging to the first group who input either the first search query or the second search query and the first group where both the first search query and the second search query are input The first relevance is calculated based on the number of users, and the number of users belonging to the second group that input either the first search query or the second search query, the first search query, and Calculating the second relevance based on the number of users belonging to the second group both of which input the second search query.
The generating apparatus according to claim 4 or 5, wherein
前記算出部は、
前記第2関連度として、前記第1グループに含まれる前記第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の関連度を算出する、
ことを特徴とする請求項1〜6のいずれか一つに記載の生成装置。
The calculation unit includes:
Calculating the degree of association between search queries based on a group of search queries input by a user belonging to the second group included in the first group, as the second degree of association;
The generating apparatus according to claim 1, wherein
前記算出部は、
所定の検索クエリの入力履歴、所定のサービスの利用履歴、または、所定の属性の少なくともいずれか一つに基づいて特定される前記第2グループにおける前記第2関連度を算出する、
ことを特徴とする請求項1〜7のいずれか一つに記載の生成装置。
The calculation unit includes:
Calculating the second relevance level in the second group specified based on at least one of an input history of a predetermined search query, a usage history of a predetermined service, or a predetermined attribute;
The generating apparatus according to claim 1, wherein
コンピュータが実行する生成方法であって、
第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、前記第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する算出工程と、
前記算出工程によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する生成工程と、
を含むことを特徴とする生成方法。
A generation method executed by a computer,
A second relevance between search queries based on a search query group input by a user belonging to the first group and a search query based on a search query group input by a user belonging to a second group different from the first group. A calculation process for calculating the relevance;
A generating step of generating an index indicating characteristics of users belonging to the second group based on the first degree of association and the second degree of association calculated by the calculating step;
A generation method comprising:
第1グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第1関連度と、前記第1グループと異なる第2グループに属するユーザが入力した検索クエリ群に基づく検索クエリ間の第2関連度とを算出する算出手順と、
前記算出手順によって算出された第1関連度と第2関連度とに基づいて、前記第2グループに属するユーザの特徴を示す指標を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
A second relevance between search queries based on a search query group input by a user belonging to the first group and a search query based on a search query group input by a user belonging to a second group different from the first group. A calculation procedure for calculating relevance,
A generation procedure for generating an index indicating characteristics of users belonging to the second group based on the first relevance and the second relevance calculated by the calculation procedure;
A program for causing a computer to execute.
JP2017177410A 2017-09-15 2017-09-15 Generation device, generation method, and generation program Active JP6866266B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017177410A JP6866266B2 (en) 2017-09-15 2017-09-15 Generation device, generation method, and generation program
JP2021065463A JP7073557B2 (en) 2017-09-15 2021-04-07 Generator, generation method, and generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017177410A JP6866266B2 (en) 2017-09-15 2017-09-15 Generation device, generation method, and generation program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021065463A Division JP7073557B2 (en) 2017-09-15 2021-04-07 Generator, generation method, and generation program

Publications (2)

Publication Number Publication Date
JP2019053525A true JP2019053525A (en) 2019-04-04
JP6866266B2 JP6866266B2 (en) 2021-04-28

Family

ID=66015053

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017177410A Active JP6866266B2 (en) 2017-09-15 2017-09-15 Generation device, generation method, and generation program
JP2021065463A Active JP7073557B2 (en) 2017-09-15 2021-04-07 Generator, generation method, and generation program

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021065463A Active JP7073557B2 (en) 2017-09-15 2021-04-07 Generator, generation method, and generation program

Country Status (1)

Country Link
JP (2) JP6866266B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149682A (en) * 2020-03-19 2021-09-27 ヤフー株式会社 Learning device, learning method, and learning program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320419A (en) * 1997-05-22 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> Device and method for relating information
JP2010244187A (en) * 2009-04-02 2010-10-28 Canon Inc Document retrieval system and method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3669167B2 (en) 1998-08-12 2005-07-06 日本電信電話株式会社 Information providing method and information providing apparatus using others group preference information, and recording medium recording information providing program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320419A (en) * 1997-05-22 1998-12-04 Nippon Telegr & Teleph Corp <Ntt> Device and method for relating information
JP2010244187A (en) * 2009-04-02 2010-10-28 Canon Inc Document retrieval system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149682A (en) * 2020-03-19 2021-09-27 ヤフー株式会社 Learning device, learning method, and learning program
JP7312134B2 (en) 2020-03-19 2023-07-20 ヤフー株式会社 LEARNING DEVICE, LEARNING METHOD AND LEARNING PROGRAM

Also Published As

Publication number Publication date
JP2021101391A (en) 2021-07-08
JP6866266B2 (en) 2021-04-28
JP7073557B2 (en) 2022-05-23

Similar Documents

Publication Publication Date Title
US10664509B1 (en) Processing non-uniform datasets
US9098541B2 (en) Semantic user profiles for targeting user segments
US9065727B1 (en) Device identifier similarity models derived from online event signals
JP6023129B2 (en) Extraction apparatus, extraction method, and extraction program
CN106471537B (en) Indirection-based content selection
JP6827305B2 (en) Selection device, selection method and selection program
CA2944652A1 (en) Inference model for traveler classification
JP2020035068A (en) Device, method, and program for processing information
JP2019191659A (en) Information processing device, information processing method, and information processing program
TW201510901A (en) Strength based modeling for recommendation system
JP2013254334A (en) Advertisement distribution control system
JP7073557B2 (en) Generator, generation method, and generation program
JP2016062358A (en) Extractor, and method and program for extraction
JP2014222474A (en) Information processor, method and program
KR101861828B1 (en) Method of providing personalized content and computer program for the same
US20190034474A1 (en) Resolving Inconsistencies in Information Graphs
JP6585998B2 (en) Content determination device
US20140164136A1 (en) Broad matching algorithm for display advertisements
JP2019020930A (en) Learning device, learning method, learning program, learning data, and model
JP2017076376A (en) Calculation device, calculation method and calculation program
JP2017215647A (en) Selection device, selection method and selection program
JP6007300B1 (en) Calculation device, calculation method, and calculation program
JP2019028741A (en) Determination apparatus, determination method, and determination program
JP7184947B2 (en) Specific device, specific method and specific program
JP2019139722A (en) Determination device, determination method, and determination program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210407

R150 Certificate of patent or registration of utility model

Ref document number: 6866266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250