JP7354195B2 - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP7354195B2
JP7354195B2 JP2021150449A JP2021150449A JP7354195B2 JP 7354195 B2 JP7354195 B2 JP 7354195B2 JP 2021150449 A JP2021150449 A JP 2021150449A JP 2021150449 A JP2021150449 A JP 2021150449A JP 7354195 B2 JP7354195 B2 JP 7354195B2
Authority
JP
Japan
Prior art keywords
user
information
information processing
list information
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021150449A
Other languages
Japanese (ja)
Other versions
JP2023042995A (en
Inventor
元希 寺中
孝太 坪内
修司 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021150449A priority Critical patent/JP7354195B2/en
Publication of JP2023042995A publication Critical patent/JP2023042995A/en
Application granted granted Critical
Publication of JP7354195B2 publication Critical patent/JP7354195B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

従来、インターネット上におけるユーザ行動の予測をする手法が知られている。例えば、特許文献1には、ユーザの行動を従来よりも高い精度で予測することを目的として、インターネット上のユーザの検索クエリの傾向を学習し、学習した検索クエリの傾向とその後のユーザの行動との関連性スコアを算出してモデルを生成し、このモデルを用いて他のユーザの行動を予測する技術が提案されている。 Conventionally, methods for predicting user behavior on the Internet have been known. For example, in Patent Document 1, with the aim of predicting user behavior with higher accuracy than before, the tendency of search queries of users on the Internet is learned, and the learned tendency of search queries and subsequent user behavior are disclosed. A technique has been proposed in which a model is generated by calculating a relevance score with a user, and this model is used to predict the behavior of other users.

特開2016-177377号公報Japanese Patent Application Publication No. 2016-177377

しかしながら、上述した技術では、生成した情報を信頼してもよいかどうかの確証を得ることが難しい。たとえば、結果論として有効な成果を上げるモデルが含まれている可能性があり、仮にABテストを行ったとしても、テストの内容に応じて適切ではないモデルが採用されてしまう場合もある。 However, with the above-mentioned techniques, it is difficult to obtain certainty as to whether or not the generated information can be trusted. For example, there is a possibility that a model that produces effective results may be included, and even if an AB test is conducted, an inappropriate model may be adopted depending on the content of the test.

本願は、上記に鑑みてなされたものであって、生成した情報の信頼性を確かめることができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and aims to provide an information processing device, an information processing method, and an information processing program that can confirm the reliability of generated information.

本願に係る情報処理装置は、第1生成部と、第2生成部と、分類部と、評価部とを備える。第1生成部は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部は、シードユーザを含む各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第2リスト情報を生成する。分類部は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部は、分類部による分類結果を用いて、第2リスト情報の信頼性を評価する。 The information processing device according to the present application includes a first generation section, a second generation section, a classification section, and an evaluation section. The first generation unit quantifies the relationship between the search query input by each seed user and the predetermined action based on the commonality of the search queries entered by multiple seed users who have performed the predetermined action. Generate first list information. The second generation unit quantifies the relationship between the predetermined behavior and each user based on the search query input by each user including the seed user and the first list information, and provides a value indicating the quantified relationship. Second list information is generated in which each user is ranked based on the second list information. The classification unit classifies each user into a plurality of clusters based on the commonality of the sensor information of each user. The evaluation section evaluates the reliability of the second list information using the classification results by the classification section.

実施形態の態様の1つによれば、生成した情報の信頼性を確かめることができる。 According to one aspect of the embodiment, the reliability of the generated information can be verified.

図1は、実施形態に係る情報処理システムの一例を説明する図である。FIG. 1 is a diagram illustrating an example of an information processing system according to an embodiment. 図2は、実施形態に係るユーザ分類方法および第2リスト情報評価方法の一例を示す図である。FIG. 2 is a diagram illustrating an example of a user classification method and a second list information evaluation method according to the embodiment. 図3は、実施形態に係る情報処理装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of an information processing device according to an embodiment. 図4は、実施形態に係る第1リスト情報の概要を示す図である。FIG. 4 is a diagram showing an overview of first list information according to the embodiment. 図5は、実施形態に係る第2リスト情報の概要を示す図である。FIG. 5 is a diagram illustrating an overview of second list information according to the embodiment. 図6は、実施形態に係るセンサ情報の概要を示す図である。FIG. 6 is a diagram showing an overview of sensor information according to the embodiment. 図7は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。FIG. 7 is a flowchart illustrating an example of a processing procedure by the information processing apparatus according to the embodiment. 図8は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 8 is a hardware configuration diagram showing an example of a computer that implements the functions of the information processing device according to the embodiment.

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 DESCRIPTION OF THE PREFERRED EMBODIMENTS An information processing apparatus, an information processing method, and an embodiment of an information processing program (hereinafter referred to as "embodiments") according to the present application will be described in detail below with reference to the drawings. Note that the information processing apparatus, information processing method, and information processing program according to the present application are not limited to the embodiments described below. Furthermore, the embodiments described below can be combined as appropriate within the range that does not conflict with the processing contents. Further, in the embodiments described below, the same parts are given the same reference numerals, and redundant explanations will be omitted.

また、以下の説明において、端末装置10をシードユーザU-1またはユーザU-2と表記して説明する場合がある。すなわち、シードユーザU-1またはユーザU-2を端末装置10と読み替えることができる。また、シードユーザU-1やユーザU-2を「ユーザU」と総称する場合がある。 Furthermore, in the following description, the terminal device 10 may be referred to as a seed user U-1 or a user U-2. That is, the seed user U-1 or the user U-2 can be read as the terminal device 10. Further, seed user U-1 and user U-2 may be collectively referred to as "user U."

[1.情報処理システム]
図1は、実施形態に係る情報処理システムの一例を説明する図である。図1に示すように、実施形態に係る情報処理システムSYSは、端末装置10、及び情報処理装置100を有する。なお、情報処理システムSYSは、図1に示す例に限られず、複数の端末装置10や複数の情報処理装置100を有していてもよい。
[1. Information processing system]
FIG. 1 is a diagram illustrating an example of an information processing system according to an embodiment. As shown in FIG. 1, the information processing system SYS according to the embodiment includes a terminal device 10 and an information processing device 100. Note that the information processing system SYS is not limited to the example shown in FIG. 1, and may include multiple terminal devices 10 and multiple information processing devices 100.

端末装置10、及び情報処理装置100は、それぞれ有線又は無線によりネットワークN(たとえば、図3参照)に接続される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網、固定電話網等)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。端末装置10、及び情報処理装置100は、ネットワークNを通じて、相互に通信できる。 The terminal device 10 and the information processing device 100 are each connected to a network N (see FIG. 3, for example) by wire or wirelessly. The network N is a communication network such as a LAN (Local Area Network), a WAN (Wide Area Network), a telephone network (mobile phone network, fixed telephone network, etc.), a local IP (Internet Protocol) network, or the Internet. . The network N may include a wired network or a wireless network. The terminal device 10 and the information processing device 100 can communicate with each other through the network N.

図1に示す端末装置10は、検索クエリを用いた各種サービスを利用するユーザUが使用する情報処理装置である。たとえば、端末装置10は、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、PDA(Personal Digital Assistant)などにより実現される。 A terminal device 10 shown in FIG. 1 is an information processing device used by a user U who uses various services using search queries. For example, the terminal device 10 is realized by a smartphone, a tablet terminal, a notebook PC (Personal Computer), a desktop PC, a PDA (Personal Digital Assistant), or the like.

また、端末装置10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)などの無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)などの近距離無線通信を介してネットワークNに接続できる。 The terminal device 10 also supports wireless communication networks such as LTE (Long Term Evolution), 4G (4th Generation), and 5G (5th Generation), Bluetooth (registered trademark), and wireless LAN (Local Area It is possible to connect to the network N via short-range wireless communication such as Network).

また、端末装置10は、各種サービスを利用するための情報を、ウェブブラウザやアプリケーションにより表示できる。なお、端末装置10は、情報の表示処理を実現する制御情報を情報処理装置100などから受け取った場合には、制御情報に従って表示処理を実現する。 Further, the terminal device 10 can display information for using various services using a web browser or an application. Note that when the terminal device 10 receives control information for realizing information display processing from the information processing device 100 or the like, it realizes the display processing according to the control information.

また、ユーザUは、各種サービスの利用を通じて、情報処理装置100に対し、センサ情報を提供する。センサ情報は、端末装置10に搭載される各種センサにより取得される情報である。たとえば、位置センサにより取得される位置情報や、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される角速度情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などを含み得る。 Further, the user U provides sensor information to the information processing device 100 through the use of various services. The sensor information is information acquired by various sensors installed in the terminal device 10. For example, position information acquired by a position sensor, acceleration information detected by an acceleration sensor, angular velocity information detected by a gyro sensor, operation information acquired by a touch panel, illuminance information acquired by an illuminance sensor, etc. , atmospheric pressure information acquired by an atmospheric pressure sensor, sound information acquired by a microphone, and the like.

図1に示す情報処理装置100は、検索クエリを用いた各種サービスなどを提供する情報処理装置である。情報処理装置100が提供する各種サービスには、各種アプリケーションに対応するAPI(Application Programming Interface)サービスや、各種オンラインサービスが含まれていてもよい。オンラインサービスとしては、インターネット接続や、検索サービスや、SNS(Social Networking Service)や、電子商取引サービスや、電子決済サービスや、オンラインゲームや、オンラインバンキングサービスや、オンライントレーディングサービスや、宿泊予約サービスや、チケット予約サービスや、動画配信サービスや、音楽配信サービスや、ニュース配信サービスや、地図情報サービスや、ルート検索サービスや、経路案内サービスや、路線情報サービスや、運行情報サービスや、天気情報サービスなどのサービスが該当し得る。 The information processing apparatus 100 shown in FIG. 1 is an information processing apparatus that provides various services using search queries. The various services provided by the information processing device 100 may include API (Application Programming Interface) services corresponding to various applications and various online services. Online services include Internet connectivity, search services, SNS (Social Networking Services), electronic commerce services, electronic payment services, online games, online banking services, online trading services, accommodation reservation services, etc. Ticket reservation services, video distribution services, music distribution services, news distribution services, map information services, route search services, route guidance services, route information services, operation information services, weather information services, etc. Services may be applicable.

また、情報処理装置100は、各種サービスの提供を通じて収集したセンサ情報を用いて、実施形態に係る情報処理を実行する情報処理装置である。情報処理装置100は、典型的にはサーバ装置であるが、メインフレームやワークステーションなどにより実現されてもよい。 Further, the information processing device 100 is an information processing device that executes information processing according to the embodiment using sensor information collected through provision of various services. The information processing device 100 is typically a server device, but may also be realized by a mainframe, a workstation, or the like.

情報処理装置100がサーバ装置で実現される場合、単独のサーバにより実現されてもよいし、複数のサーバ装置及び複数のストレージ装置が協働して動作するクラウドシステムなどにより実現されてもよい。なお、情報処理装置100は、ユーザUが使用する端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)などのスクリプト言語やCSS(Cascading Style Sheets)などのスタイルシート言語により記述される。なお、情報処理装置100から配信されるアプリケーションそのものを制御情報とみなしてもよい。 When the information processing device 100 is implemented as a server device, it may be implemented as a single server, or may be implemented as a cloud system in which multiple server devices and multiple storage devices operate cooperatively. Note that the information processing device 100 may function as a distribution device that distributes control information to the terminal device 10 used by the user U. Here, the control information is written in, for example, a script language such as JavaScript (registered trademark) or a style sheet language such as CSS (Cascading Style Sheets). Note that the application itself distributed from the information processing device 100 may be regarded as control information.

[2.情報処理]
以下、情報処理システムSYSにおける情報処理の一例を説明する。なお、以下の説明において、実施形態に係る情報処理の対象は、各種サービスを利用するユーザUである。また、以下の説明において、シードユーザU-1の一群を「ユーザ群UG-1」と総称し、シードユーザを含む全てのユーザU-2の一群を「ユーザ群UG-2」と総称する。シードユーザU-1は、「〇〇を買った」、「〇〇に行った」、「〇〇している」といった所定の行動を行ったユーザや、特定の属性(興味嗜好など)を有するユーザなど、特定のユーザコンテキストを有するユーザに該当する。
[2. Information processing]
An example of information processing in the information processing system SYS will be described below. In the following description, the target of information processing according to the embodiment is the user U who uses various services. Furthermore, in the following description, a group of seed users U-1 will be collectively referred to as a "user group UG-1", and a group of all users U-2 including the seed users will be collectively referred to as a "user group UG-2". Seed user U-1 is a user who has performed a predetermined action such as ``bought 〇〇,'' ``went to 〇〇,'' or ``do 〇〇,'' or a user who has specific attributes (such as interests and preferences). It corresponds to a user with a specific user context, such as a user.

なお、以下に説明する情報処理は、情報処理の対象がユーザUである場合に限られず、商品や、街や、サービスなど、情報を収集可能な対象であれば、どのような対象に対しても適用できる。 Note that the information processing described below is not limited to the case where the information processing target is the user U, but can be applied to any target for which information can be collected, such as products, towns, and services. can also be applied.

まず、図1に示す例において、情報処理装置100は、所定の行動をとった複数のシードユーザU-1からなるユーザ群UG-1を特定する。そして、情報処理装置100は、ユーザ群UG-1に含まれる各シードユーザU-1が入力した検索クエリの共通性に基づいて、各シードユーザU-1が入力した検索クエリと所定の行動との関係性を数値化した第1リスト情報を生成し、記憶する。 First, in the example shown in FIG. 1, the information processing device 100 identifies a user group UG-1 consisting of a plurality of seed users U-1 who have taken a predetermined action. The information processing device 100 then associates the search query input by each seed user U-1 with a predetermined action based on the commonality of the search queries input by each seed user U-1 included in the user group UG-1. First list information that quantifies the relationships between the two is generated and stored.

たとえば、情報処理装置100は、「〇〇を買った」「〇〇に興味がある」という条件(タイトル)を満たすユーザをシードユーザU-1として収集し、シードユーザU-1が入力した検索クエリの共通性に基づいたスコアを付与した第1リスト情報を作成する。具体的には、「眼鏡をかけている」というシードユーザU-1を収集し、検索クエリ:「眼鏡」に「70点」、検索クエリ:「眼鏡ふき」に「50点」、検索クエリ:「リンゴ」にスコア「-50点」といったようなスコアを付与し、検索クエリとスコアとの組である第1リスト情報を作成する。 For example, the information processing device 100 collects users who meet the conditions (titles) such as "bought XX" and "I am interested in XX" as seed users U-1, and searches for information input by the seed user U-1. First list information is created to which a score is assigned based on the commonality of the queries. Specifically, we collect seed users U-1 who say ``wear glasses,'' search query: ``70 points'' for ``eyeglasses,'' search query: ``50 points'' for ``glass cloth,'' and search query: A score such as "-50 points" is assigned to "apple" and first list information that is a combination of a search query and a score is created.

上述したシードユーザU-1の一群であるユーザ群UG-1の特定は、任意の方法を用いて行うことができる。たとえば、情報処理装置100は、購買履歴や利用履歴、位置履歴などの各種の情報に基づいて、想定される行動を行ったユーザをシードユーザU-1であると推定し、ユーザ群UG-1を特定してもよい。具体的には、ある所定の店舗の名称を検索クエリとして入力し、その後、その所定の店舗を実際に訪問した訪問者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、別の例として、イベントの名称を検索クエリとして入力し、その後、そのイベントに実際に参加した参加者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、更に別の例として、ある商品の名称を検索クエリとして入力し、その後、その名称の商品を実際に購入した購入者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、情報処理装置100は、実際に所定の店舗(たとえば、配信済みの広告と対応する店舗)を利用した利用者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、情報処理装置100は、所定の広告やウェブページ、映画や音楽などのコンテンツを視聴した視聴者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。 The above-described user group UG-1, which is a group of seed users U-1, can be identified using any method. For example, the information processing device 100 estimates that the user who has performed the expected behavior is the seed user U-1 based on various information such as purchase history, usage history, location history, etc. may be specified. Specifically, the user group UG-1 is identified by inputting the name of a certain predetermined store as a search query and then estimating the number of visitors (seed users U-1) who actually visited the predetermined store. You may. As another example, user group UG-1 may be identified by inputting the name of an event as a search query and then estimating the participants (seed users U-1) who actually participated in the event. good. As yet another example, the user group UG-1 is obtained by inputting the name of a certain product as a search query and then estimating the purchasers (seed users U-1) who actually purchased the product with that name. May be specified. Further, the information processing device 100 identifies the user group UG-1 by estimating the number of users (seed users U-1) who have actually used a predetermined store (for example, a store corresponding to a distributed advertisement). It's okay. Furthermore, the information processing device 100 may identify the user group UG-1 by estimating the number of viewers (seed users U-1) who have viewed content such as a predetermined advertisement, web page, movie, or music.

また、情報処理装置100は、第1リストにおける検索クエリのスコアは、以下のような機械学習により生成される行動モデルから求めることができる。たとえば、情報処理装置100は、シードユーザU-1が入力した検索クエリを正例とし、ランダムに選択したシードユーザU-1以外の他のユーザが入力した検索クエリを負例としたときに、正例を入力した際により高い値を出力し、負例を入力した際により低い値を出力するように学習モデルの学習を行う。このとき、学習には任意の手法が採用可能である。たとえば、モデルとしてニューラルネットワークが採用される場合は、バックプロパゲーションなどにより実現可能である。 Furthermore, the information processing device 100 can obtain the score of the search query in the first list from a behavioral model generated by machine learning as described below. For example, when the information processing device 100 takes a search query input by seed user U-1 as a positive example and takes a randomly selected search query input by a user other than seed user U-1 as a negative example, The learning model is trained to output a higher value when a positive example is input, and a lower value when a negative example is input. At this time, any method can be adopted for learning. For example, if a neural network is used as the model, it can be realized by backpropagation or the like.

また、情報処理装置100は、シードユーザU1が共通して入力している検索クエリについては、より高い値の数値が出力されるようにモデルを学習してもよい。たとえば、正例となる検索クエリを入力したシードユーザU-1の数が多ければ多い程、より高い値を出力するようにモデルを学習してもよい。また、負例となる検索クエリを入力した他のユーザの数が多い程、より小さい値(負の値)を出力するようにモデルを学習してもよい。そして、情報処理装置100は、各検索クエリと、このような学習モデルに検索クエリを入力した際に出力したスコアとの組のリストを「第1リスト情報」として生成する。すなわち、情報処理装置100は、所定の行動を行ったシードユーザU-1が入力した各検索クエリと、検索クエリの各々に対応する上述のスコア(検索クエリと所定の行動との間の関係性を示すスコア)との組を「第1リスト情報」として生成する。なお、この第1リスト情報は、情報処理装置100により、所定の行動ごとに生成された行動モデルを用いて、それぞれの行動に対応した第1リスト情報が生成される。 Furthermore, the information processing device 100 may learn the model so that higher numerical values are output for search queries that are commonly input by the seed users U1. For example, the model may be trained to output a higher value as the number of seed users U-1 that input positive example search queries increases. Furthermore, the model may be trained to output a smaller value (negative value) as the number of other users who input negative example search queries increases. Then, the information processing device 100 generates a list of sets of each search query and a score output when the search query is input to such a learning model as "first list information." That is, the information processing device 100 calculates each search query input by the seed user U-1 who has performed a predetermined action, and the above-mentioned score (relationship between the search query and the predetermined action) corresponding to each search query. (score indicating 1) is generated as "first list information". Note that this first list information is generated by the information processing device 100 using a behavior model generated for each predetermined behavior, and first list information corresponding to each behavior is generated.

続いて、情報処理装置100は、ユーザ群UG-2が入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザU-2との関係性を数値化し、数値化した関係性を示す値に基づいて、各ユーザU-2を順位付けした第2リスト情報を生成し、記憶する。 Subsequently, the information processing device 100 quantifies the relationship between the predetermined behavior and each user U-2 based on the search query input by the user group UG-2 and the first list information. Second list information in which each user U-2 is ranked based on the value indicating the relationship is generated and stored.

たとえば、情報処理装置100は、シードユーザU-1を含むユーザ群UG-2から各ユーザU-2を選定し、選定した各ユーザU-2が入力した検索クエリと対応付けられたスコアを第1リスト情報から特定する。なお、情報処理装置100は、ユーザ群UG-2に含まれる各ユーザU-2を無作為に選定してもよいし、所定の条件に基づいて選定してもよい。そして、情報処理装置100は、特定したスコアの合計から、シードユーザU-1を収集する際の条件として設定した所定の行動と、各ユーザU-2との間の関係性を示す第2リスト情報を導出する。たとえば、第2リスト情報において、所定の行動と関係性が高いユーザU-2はスコアが高く、所定の行動と関係性が低いユーザU-2はスコアが低くなる。 For example, the information processing device 100 selects each user U-2 from the user group UG-2 including the seed user U-1, and calculates the score associated with the search query input by each selected user U-2. 1 Specify from list information. Note that the information processing apparatus 100 may select each user U-2 included in the user group UG-2 at random, or may select them based on predetermined conditions. Then, the information processing device 100 generates a second list indicating the relationship between each user U-2 and a predetermined behavior set as a condition for collecting seed users U-1 from the total of the identified scores. Derive information. For example, in the second list information, user U-2 who has a high relationship with the predetermined behavior has a high score, and user U-2 who has a low relationship with the predetermined behavior has a low score.

以下、情報処理装置100による第2リスト情報の生成について具体的に説明する。シードユーザU-1を含む各ユーザU-2が入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値を算出する。このようにすれば、各ユーザU-2が入力した複数の検索クエリと所定の行動との関係性を数値として表すことができるため、単一の検索クエリの数値化と比較してより信頼性の高い数値化を実現できる。 Hereinafter, generation of the second list information by the information processing device 100 will be specifically described. For each of the plurality of search queries input by each user U-2 including the seed user U-1, the associated score is acquired from the first list information, and the total value of the acquired scores is calculated. In this way, the relationship between multiple search queries entered by each user U-2 and a predetermined behavior can be expressed numerically, which is more reliable than quantifying a single search query. It is possible to achieve high quantification of

次に、情報処理装置100は、各ユーザU-2についてスコアの合計値を計算した後、スコアの高い順に各ユーザU-2を順位付けするとともに、順位順に各ユーザU-2が入力した検索クエリを対応付けた第2リスト情報を生成する。この第2リスト情報は、どのような検索クエリを入力したユーザU-2が、所定の行動との関連性が強いかを示すリストとして機能する。この第2リスト情報は、検索クエリと所定の行動との関連性の分析や、ユーザU-2の分析などに用いられる。なお、この第2リストは、シードユーザU-1を選定する際に設定される行動(たとえば、「〇〇を買った」、「〇〇に行った」、「〇〇している」など)といった所定の行動ごとに作成される。 Next, the information processing device 100 calculates the total score for each user U-2, and then ranks each user U-2 in descending order of the score, and searches input by each user U-2 in order of ranking. Second list information associated with the queries is generated. This second list information functions as a list indicating what kind of search query the user U-2 has input is strongly related to a predetermined action. This second list information is used for analyzing the relationship between a search query and a predetermined action, and for analyzing user U-2. This second list includes actions set when selecting seed user U-1 (for example, "bought 〇〇", "went to 〇〇", "doing 〇〇", etc.) It is created for each predetermined action.

上述した第2リスト情報を用いることにより、ユーザU-2が興味を有する可能性が高い情報の提供を実現できると考えられる。たとえば、ある店舗を訪問したという行動と対応する第2リスト情報には、その行動と関連性が高いユーザU-2のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第2リスト情報を用いることにより、ランキングの順位が高いユーザU-2に対し、その店舗に関する広告を提供することで、広告効果を向上させることができると考えられる。また、ある商品を購入したという行動と対応する第2リスト情報には、その行動と関連性が高いユーザU-2のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第2リスト情報を用いることにより、ランキングの順位が高いユーザU-2に対し、その商品またはその商品と関連する商品に関する広告を提供することで、広告効果を向上させることができると考えられる。 By using the second list information described above, it is possible to provide information that is likely to be of interest to the user U-2. For example, the second list information corresponding to the action of visiting a certain store includes a ranking of user U-2 that is highly relevant to the action. Therefore, for example, by using the second list information, the distribution server that distributes advertisements can improve the advertisement effectiveness by providing advertisements related to the store to user U-2 who has a high ranking. It seems possible. Further, the second list information corresponding to the action of purchasing a certain product includes a ranking of user U-2 that is highly relevant to the action. Therefore, for example, the distribution server that distributes the advertisement uses the second list information to provide user U-2 with a high ranking with an advertisement regarding the product or a product related to the product. It is thought that advertising effectiveness can be improved.

一方、上述した第2リスト情報について、ユーザU-2の行動を正確に反映したリストであるかどうかの確証を得ることは難しい。すなわち、スコアに基づいてユーザU-2を順位付けした際に、果たしてどの順位までのユーザU-2が所定の行動との関係性を有するのかという点について、実際には定かではない。たとえば、スコアが高いほど、所定の行動を取る可能性が高いという推測が働くが、スコアがどの程度高ければ所定の行動と関連性が高いのかを見極めることは難しい。また、スコアの高さと、所定の行動との関係性の高さとの相関関係の検証も十分とは言い切れない。 On the other hand, with respect to the second list information mentioned above, it is difficult to obtain certainty as to whether the list accurately reflects the behavior of user U-2. That is, when ranking users U-2 based on their scores, it is not actually certain as to which ranking user U-2 has a relationship with a predetermined behavior. For example, it is inferred that the higher the score, the higher the possibility of taking a certain action, but it is difficult to determine how high the score has to be related to the given action. Furthermore, it cannot be said that verification of the correlation between the high score and the high relationship with a predetermined behavior is sufficient.

そこで、実施形態に係る情報処理装置100は、以下に説明する情報処理により、第2リスト情報の信頼性を確かめるための情報処理方法を提案する。 Therefore, the information processing apparatus 100 according to the embodiment proposes an information processing method for confirming the reliability of the second list information through information processing described below.

まず、情報処理装置100は、信頼性の評価を行う第2リスト情報を選定するための所定の行動を設定する(ステップS1)。次に、情報処理装置100は、ユーザ群UG-2から収集されるセンサ情報の共通性に基づいて、第2リスト情報内の各ユーザU-2を分類する(ステップS2)。以下、図2を用いて、ユーザ分類方法および第2リスト情報評価方法の一例について説明する。図2は、実施形態に係るユーザ分類方法および第2リスト情報評価方法の一例を示す図である。なお、図2に示す第2リスト情報内に順位付けされたユーザの数は一例であり、図2に示す例よりも多くのユーザが含まれていてもよい。 First, the information processing device 100 sets a predetermined action for selecting second list information whose reliability is to be evaluated (step S1). Next, the information processing device 100 classifies each user U-2 in the second list information based on the commonality of the sensor information collected from the user group UG-2 (step S2). Hereinafter, an example of a user classification method and a second list information evaluation method will be described using FIG. 2. FIG. 2 is a diagram illustrating an example of a user classification method and a second list information evaluation method according to the embodiment. Note that the number of users ranked in the second list information shown in FIG. 2 is an example, and more users than the example shown in FIG. 2 may be included.

まず、情報処理装置100は、第2リスト情報LT(図2参照)内において、スコア順位が1位であるユーザU-2(以下、「参照ユーザ」と称する。)に対応するセンサ情報#EX-1を取得する。次に、情報処理装置100は、取得したセンサ情報#EX-1を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンXを特定する。 First, the information processing apparatus 100 selects sensor information #EX corresponding to user U-2 (hereinafter referred to as "reference user") whose score rank is first in the second list information LT (see FIG. 2). Get -1. Next, the information processing device 100 specifies the behavior pattern X by analyzing the behavior pattern of the reference user using the acquired sensor information #EX-1.

続いて、情報処理装置100は、第2リストLTに列挙された参照ユーザ以外の他のユーザU-2(以下、「比較ユーザ」と称する。)について、センサ情報#EX-1に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報を用いて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。 Subsequently, the information processing apparatus 100 selects a sensor corresponding to sensor information #EX-1 for a user U-2 (hereinafter referred to as a "comparison user") other than the reference user listed in the second list LT. Each piece of information is acquired, behavior pattern analysis is performed using the acquired sensor information, and a behavior pattern corresponding to each comparison user is acquired.

以下、情報処理装置100による行動パターンの特定方法について一例を説明する。たとえば、情報処理装置100は、センサ情報EX-1として、位置履歴とSNSなどのメッセージ送信履歴を取得する。また、情報処理装置100は、位置履歴の中から、所定時間以上滞在していた位置を特定する。また、情報処理装置100は、特定した位置の記録日時に対応する送信メッセージがあるかメッセージ送信履歴内を検索する。そして、情報処理装置100は、所定時間以上滞在していた位置と、メッセージの内容とを突き合わせて、たとえば、送信メッセージが「ハンバーガー美味しい」という内容であれば、所定時間滞在していた位置に対応するエリアのハンバーガーショップに位置したと推定する。このようにして、情報処理装置100は、位置履歴とメッセージ送信履歴とに基づいて特定した行動を1つずつ繋ぎ合わせていくことにより、参照ユーザの時系列の行動パターンを特定できる。なお、情報処理装置100は、比較ユーザについても同様に行動パターンを特定できる。 An example of a method for identifying behavior patterns by the information processing apparatus 100 will be described below. For example, the information processing device 100 acquires a position history and a message transmission history such as SNS as sensor information EX-1. Furthermore, the information processing device 100 identifies a location where the user has stayed for a predetermined period of time or more from the location history. Further, the information processing apparatus 100 searches the message transmission history for a transmission message corresponding to the recording date and time of the specified position. Then, the information processing device 100 matches the content of the message with the location where it has been staying for a predetermined time or longer, and if the transmitted message is "Hamburger is delicious", the information processing device 100 corresponds to the location where it has been staying for a predetermined time. It is estimated that it was located at a hamburger shop in the area. In this way, the information processing device 100 can identify the chronological behavior pattern of the reference user by connecting the behaviors identified based on the location history and message transmission history one by one. Note that the information processing apparatus 100 can similarly identify behavior patterns for comparison users.

そして、情報処理装置100は、参照ユーザの行動パターンXと、比較ユーザの行動パターンとをそれぞれ比較し、行動パターンの類似性(比較ユーザの行動パターンが行動パターンXに類似するかどうか)に基づいて、クラスタリングを行う。たとえば、図2に示すように、情報処理装置100は、行動パターンが行動パターンXに類似する比較ユーザをクラスタX-1に振り分け、行動パターンが行動パターンXに類似しない比較ユーザをクラスタX-2に振り分ける。 The information processing device 100 then compares the reference user's behavior pattern X and the comparison user's behavior pattern, and based on the similarity of the behavior patterns (whether or not the comparison user's behavior pattern is similar to the behavior pattern X). and perform clustering. For example, as shown in FIG. 2, the information processing device 100 sorts comparison users whose behavior patterns are similar to behavior pattern X into cluster X-1, and classifies comparison users whose behavior patterns are not similar to behavior pattern X into cluster X-2. Allocate to.

そして、情報処理装置100は、所定の行動に紐づく各ユーザU-2の分類結果に基づいて、第2リスト情報LTの信頼性を評価する。たとえば、情報処理装置100は、第2リスト情報LTにおける所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報LTの信頼性を評価する。なお、第2リスト情報LTにおける所定の順位層は、情報処理装置100のオペレータが任意に設定できる。 Then, the information processing device 100 evaluates the reliability of the second list information LT based on the classification results of each user U-2 associated with a predetermined action. For example, the information processing device 100 derives the ratio at which each user U-2 located in a predetermined rank layer in the second list information LT is assigned to the same cluster, and based on the derived ratio, Evaluate the reliability of Note that the predetermined ranking layer in the second list information LT can be arbitrarily set by the operator of the information processing device 100.

具体的には、情報処理装置100は、第2リスト情報LTにおいて、スコア順位が1位~10位までの順位層に位置する各ユーザU-2が、クラスタX-1に振り分けられる割合である振分率を算出する。次に、たとえば、情報処理装置100は、算出した振分率が、予め規定される信頼性判定閾値以上であると判定した場合、第2リスト情報LTにおいて、スコア順位が1位~10位までの順位層に位置する各ユーザU-2と、所定の行動との関連性について信頼性ありとする判定結果を導出する。 Specifically, the information processing device 100 determines the rate at which each user U-2 whose score rank is located in a ranking layer from 1st to 10th is assigned to cluster X-1 in the second list information LT. Calculate the distribution rate. Next, for example, if the information processing device 100 determines that the calculated distribution rate is equal to or higher than a predefined reliability determination threshold, the information processing device 100 determines that the score ranking is from 1st to 10th in the second list information LT. A determination result is derived that determines that the relationship between each user U-2 located in the ranking layer of and a predetermined action is reliable.

図2に示す例では、信頼性判定閾値が含有率90%に設定されており、スコア順位が1位~10位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が90%である場合が示されている。このため、情報処理装置100は、第2リスト情報LTの1位~10位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性ありとする判定結果を導出することになる。 In the example shown in FIG. 2, the reliability determination threshold is set to a content rate of 90%, and each user U-2 whose score rank is located in a ranking layer from 1st to 10th is assigned to cluster X-1. A case where the ratio (distribution rate) is 90% is shown. Therefore, the information processing device 100 determines that the relationship between each user U-2 located in the 1st to 10th ranking layer of the second list information LT and the predetermined behavior is reliable. This will be derived.

一方、図2に示す例では、スコア順位が11位~20位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が60%である場合が示されている。このため、情報処理装置100は、第2リスト情報LTの11位~20位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性なしとする判定結果を導出することになる。 On the other hand, in the example shown in FIG. 2, the proportion (distribution rate) of each user U-2 whose score ranks are located in the 11th to 20th ranks is 60%. It is shown. Therefore, the information processing device 100 determines that the relationship between each user U-2 located in the 11th to 20th ranking layer of the second list information LT and the predetermined behavior is unreliable. This will be derived.

また、情報処理装置100は、複数の行動パターンを用いて、行動パターンごとに各ユーザU-2を複数のクラスタに分類してもよい。そして、情報処理装置100は、複数の行動パターンごとに、第2リスト情報LTにおいて所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報LTの信頼性を評価してもよい。 Further, the information processing device 100 may use a plurality of behavioral patterns to classify each user U-2 into a plurality of clusters for each behavioral pattern. Then, the information processing device 100 derives, for each of the plurality of behavior patterns, the proportion at which each user U-2 located in a predetermined rank layer in the second list information LT is assigned to the same cluster, and each of the derived proportions. The reliability of the second list information LT may be evaluated by comprehensively considering the following.

たとえば、図2に示すように、情報処理装置100は、参照ユーザから取得したセンサ情報#EX-2を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンXとは別の行動パターンYをさらに特定する。 For example, as shown in FIG. 2, the information processing device 100 uses the sensor information #EX-2 acquired from the reference user to perform pattern analysis of the reference user's behavior. Pattern Y is further specified.

続いて、情報処理装置100は、比較ユーザについて、センサ情報#EX-2に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報に基づいて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。 Next, the information processing device 100 acquires sensor information corresponding to sensor information #EX-2 for each comparison user, performs behavioral pattern analysis based on the acquired sensor information, and determines the behavior corresponding to each comparison user. Get each pattern.

続いて、情報処理装置100は、行動パターンXの場合と同様に、参照ユーザの行動パターンYと、比較ユーザの行動パターンとをそれぞれ照合し、行動パターンの類似性に基づいて、クラスタリングを行う。たとえば、図2に示すように、情報処理装置100は、行動パターンが行動パターンYに類似する比較ユーザをクラスタY-1に振り分け、行動パターンが行動パターンYに類似しない比較ユーザをクラスタY-2に振り分ける。 Subsequently, as in the case of the behavior pattern X, the information processing device 100 compares the behavior pattern Y of the reference user and the behavior pattern of the comparison user, and performs clustering based on the similarity of the behavior patterns. For example, as shown in FIG. 2, the information processing device 100 sorts comparison users whose behavior patterns are similar to behavior pattern Y into cluster Y-1, and classifies comparison users whose behavior patterns are not similar to behavior pattern Y into cluster Y-2. Allocate to.

そして、情報処理装置100は、行動パターンXおよび行動パターンYのそれぞれについて、第2リスト情報LTにおいて所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報LTの信頼性を評価する。 Then, the information processing device 100 derives, for each of the behavior pattern The reliability of the second list information LT is evaluated by comprehensively considering each derived ratio.

図2に示す例では、スコア順位が1位~10位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が90%であり、また、クラスタY-1に振り分けられる割合が90%である場合が示されている。この場合、情報処理装置100は、行動パターンXおよび行動パターンYの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしているので、第2リスト情報LTの1位~10位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性ありとする判定結果を導出する。 In the example shown in FIG. 2, the proportion (distribution rate) at which each user U-2 whose score rank ranks from 1st to 10th is assigned to cluster X-1 is 90%, and A case is shown in which the ratio of allocation to Y-1 is 90%. In this case, the information processing device 100 determines that the distribution rate of the comparison user satisfies the reliability determination threshold for both the behavior pattern X and the behavior pattern Y, so that the information processing device 100 determines that A determination result indicating that the relationship between each user U-2 located in the top 10 ranks and a predetermined action is reliable is derived.

一方、図2に示す例では、スコア順位が11位~20位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が60%であり、また、クラスタY-1に振り分けられる割合が80%である場合が示されている。この場合、情報処理装置100は、行動パターンXおよび行動パターンYの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしていないので、第2リスト情報LTの11位~20位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性なしとする判定結果を導出する。 On the other hand, in the example shown in FIG. 2, the proportion (distribution rate) of each user U-2 whose score ranks are located in the 11th to 20th ranks is 60%, and , a case is shown in which the ratio of allocation to cluster Y-1 is 80%. In this case, the information processing device 100 determines that the distribution rate of the comparison user does not satisfy the reliability determination threshold for both the behavior pattern X and the behavior pattern Y, so the information processing device 100 determines that A determination result is derived that there is no reliability regarding the relationship between each user U-2 located in the top 20 ranks and a predetermined action.

なお、情報処理装置100は、参照ユーザの行動パターンと、比較ユーザの行動パターンの類似性に基づいて、第2リスト情報の各ユーザU-2を分類する場合に限られない。たとえば、情報処理装置100は、各順位層に位置する各ユーザU-2の行動パターンを、各ユーザU-2に対応するセンサ情報に基づいて個別に特定する。そして、情報処理装置100は、特定した各行動パターンを総当たりで比較し、各行動パターンが相互に類似している各ユーザU-2を同一のクラスタに分類してもよい。この場合、情報処理装置100は、各クラスタに含まれる順位がまとまるように、分類時のパラメータを自動的に設定してもよい。たとえば、情報処理装置100は、各クラスタに分類される順位の数(すなわち、ユーザの数)が所定の下限閾値を下回る場合には、行動パターン間の類似性を判定するための閾値をより低い値に再調整する。また、情報処理装置100は、各クラスタに分類される順位の数(すなわち、ユーザの数)が所定の上限閾値を上回る場合には、行動パターン間の類似性を判定するための閾値をより高い値に再調整する。 Note that the information processing device 100 is not limited to classifying each user U-2 in the second list information based on the similarity between the reference user's behavior pattern and the comparison user's behavior pattern. For example, the information processing device 100 individually identifies the behavior patterns of each user U-2 located in each ranking layer based on sensor information corresponding to each user U-2. The information processing device 100 may then perform a round-robin comparison of the identified behavior patterns and classify the users U-2 whose behavior patterns are similar to each other into the same cluster. In this case, the information processing apparatus 100 may automatically set parameters during classification so that the ranks included in each cluster are unified. For example, if the number of ranks classified into each cluster (i.e., the number of users) is below a predetermined lower threshold, the information processing device 100 sets a lower threshold for determining the similarity between behavior patterns. Readjust the value. In addition, when the number of ranks (i.e., the number of users) classified into each cluster exceeds a predetermined upper threshold, the information processing device 100 sets a higher threshold for determining the similarity between behavior patterns. Readjust the value.

また、情報処理装置100は、センサ情報を用いて特定される行動パターンの類似性に基づいて、各ユーザU-2を複数のクラスタに分類する場合に限られず、センサ情報そのものの共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。たとえば、情報処理装置100は、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される傾きの情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などの共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。 Furthermore, the information processing device 100 is not limited to classifying each user U-2 into a plurality of clusters based on the similarity of behavioral patterns identified using sensor information, but also based on the commonality of the sensor information itself. Accordingly, each user U-2 may be classified into a plurality of clusters. For example, the information processing device 100 can process acceleration information detected by an acceleration sensor, tilt information detected by a gyro sensor, operation information obtained by a touch panel, illuminance information obtained by an illuminance sensor, and atmospheric pressure sensor. Each user U-2 may be classified into a plurality of clusters based on commonalities such as atmospheric pressure information acquired by the microphone and sound information acquired by the microphone.

また、情報処理装置100は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。たとえば、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に撮影された画像情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。また、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に記録された音情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。また、情報処理装置100は、行動パターンを特定する際、所定の行動と関連性を有するセンサ情報を用いてもよい。つまり、情報処理装置100は、所定の行動と関連性を有するセンサ情報を用いて特定した行動パターンの類似性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。 Further, the information processing device 100 may classify each user U-2 into a plurality of clusters using sensor information that is related to a predetermined behavior. For example, if the predetermined action is to visit a predetermined store, each user U-2 may be classified into multiple clusters using image information taken on the day of visiting the predetermined store. . Furthermore, if the predetermined action is to visit a predetermined store, each user U-2 may be classified into a plurality of clusters using sound information recorded on the day of visiting the predetermined store. . Further, the information processing device 100 may use sensor information that is related to a predetermined behavior when identifying a behavior pattern. In other words, the information processing device 100 may classify each user U-2 into a plurality of clusters based on the similarity of behavior patterns identified using sensor information that is related to a predetermined behavior.

また、情報処理装置100は、センサ情報から推定される各ユーザU-2に関する情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。センサ情報から推定される情報の一例について説明すると、たとえば、情報処理装置100は、加速度情報や角速度情報から推定される動作状態の情報や、音情報から抽出した環境音から推定される環境(場所)の情報や、気圧情報から推定される天候や高度の情報などが想定される。情報処理装置100は、これらの情報の共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。 Further, the information processing device 100 may classify each user U-2 into a plurality of clusters using information regarding each user U-2 estimated from the sensor information. To explain an example of information estimated from sensor information, for example, the information processing device 100 may collect information about operating states estimated from acceleration information and angular velocity information, and environment (location) estimated from environmental sounds extracted from sound information. ) information, weather and altitude information estimated from atmospheric pressure information, etc. The information processing device 100 may classify each user U-2 into a plurality of clusters based on the commonality of these pieces of information.

なお、情報処理装置100は、第2リスト情報の信頼性の評価結果を示す情報をオペレータに対して視認可能に提供してもよい。このとき、情報処理装置100は、第2リスト情報に含まれる各ユーザU-2の分類に用いたセンサ情報や、センサ情報に基づく行動パターンの情報を合わせて提供できる。 Note that the information processing apparatus 100 may visually provide the operator with information indicating the evaluation result of the reliability of the second list information. At this time, the information processing apparatus 100 can also provide sensor information used to classify each user U-2 included in the second list information and information on behavior patterns based on the sensor information.

[3.情報処理装置の構成]
図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置の構成例を示す図である。
[3. Configuration of information processing device]
The configuration of the information processing device 100 according to the embodiment will be described using FIG. 3. FIG. 3 is a diagram illustrating a configuration example of an information processing device according to an embodiment.

図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを備える。なお、図3は、情報処理装置100の構成例を示すものであり、図3に示す形態には限られず、図3に示す以外の他の機能部を備える形態であってもよい。 As shown in FIG. 3, the information processing device 100 includes a communication section 110, a storage section 120, and a control section 130. Note that FIG. 3 shows an example of the configuration of the information processing apparatus 100, and the information processing apparatus 100 is not limited to the configuration shown in FIG. 3, and may have a configuration including other functional units other than those shown in FIG.

(通信部110)
通信部110は、例えば、ネットワークNと有線または無線で接続され、ネットワークNを介して、端末装置10などの他の装置との間で情報の送受信を行う。通信部110は、例えば、NIC(Network Interface Card)やアンテナなどによって実現される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網や固定電話網など)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
(Communication Department 110)
The communication unit 110 is connected to the network N by wire or wirelessly, for example, and transmits and receives information to and from other devices such as the terminal device 10 via the network N. The communication unit 110 is realized by, for example, a NIC (Network Interface Card), an antenna, or the like. The network N is a communication network such as a LAN (Local Area Network), a WAN (Wide Area Network), a telephone network (such as a mobile phone network or a fixed telephone network), a local IP (Internet Protocol) network, or the Internet. . The network N may include a wired network or a wireless network.

通信部110は、端末装置10から、撮影画像などの情報を受信する。また、通信部110は、提案情報を端末装置10に送信する。 The communication unit 110 receives information such as captured images from the terminal device 10. Furthermore, the communication unit 110 transmits proposal information to the terminal device 10.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部120は、制御部130の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。
(Storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 120 stores programs and data for implementing information processing executed by each unit of the control unit 130.

図3に示すように、記憶部120は、第1リスト情報記憶部121と、第2リスト情報記憶部122と、ユーザ情報記憶部123とを有する。 As shown in FIG. 3, the storage section 120 includes a first list information storage section 121, a second list information storage section 122, and a user information storage section 123.

(第1リスト情報記憶部121)
第1リスト情報記憶部121には、第1リスト情報が任意の形式で記憶されている。第1リスト情報は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した情報である。図4は、実施形態に係る第1リスト情報の概要を示す図である。
(First list information storage unit 121)
The first list information storage unit 121 stores first list information in an arbitrary format. The first list information quantifies the relationship between the search query entered by each seed user and the predetermined action, based on the commonality of the search queries entered by multiple seed users who performed the predetermined action. It is information. FIG. 4 is a diagram showing an overview of first list information according to the embodiment.

図4に示すように、第1リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。第1リスト情報は、「検索クエリ」の項目と、「スコア」の項目とを有する。第1リスト情報が有するこれらの項目は、相互に対応付けられている。 As shown in FIG. 4, the first list information is provided for each predetermined action that is set in advance when the first list information is created. The first list information includes a "search query" item and a "score" item. These items included in the first list information are associated with each other.

「検索クエリ」の項目には、所定の行動を行ったシードユーザにより入力された検索クエリの情報が記憶される。また、「スコア」の項目には、検索クエリと所定の行動との間の関係性を示すスコアの情報が記憶される。 The "search query" item stores information on a search query input by a seed user who has performed a predetermined action. Further, in the "Score" item, score information indicating the relationship between the search query and a predetermined action is stored.

(第2リスト情報記憶部122)
第2リスト情報記憶部122には、第2リスト情報が任意の形式で記憶されている。第2リスト情報は、シードユーザ以外の各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした情報である。図5は、実施形態に係る第2リスト情報の概要を示す図である。
(Second list information storage unit 122)
The second list information storage unit 122 stores second list information in an arbitrary format. The second list information is a value that quantifies the relationship between a predetermined action and each user based on the search query input by each user other than the seed user and the first list information, and indicates the quantified relationship. This is information that ranks each user based on. FIG. 5 is a diagram illustrating an overview of second list information according to the embodiment.

図5に示すように、第2リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。また、図5に示すように、第2リスト情報は、「順位」の項目と、「ユーザID」の項目と、「検索クエリ」の項目とを有する。第2リスト情報が有するこれらの項目は相互に対応付けられている。 As shown in FIG. 5, the second list information is provided for each predetermined action that is set in advance when the first list information is created. Further, as shown in FIG. 5, the second list information includes a "rank" item, a "user ID" item, and a "search query" item. These items included in the second list information are associated with each other.

「順位」の項目には、シードユーザ以外のユーザが入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値により順位付けを行った順位の情報が記憶される。 In the "rank" item, for each of the multiple search queries entered by users other than the seed user, the associated score is obtained from the first list information, and the ranking is determined based on the total value of the obtained scores. information is stored.

「ユーザID」には、各種サービスの提供に際して、各種サービスを利用するユーザを識別するために、情報処理装置100によりユーザごとに個別に付与される識別情報が記憶される。なお、図5に示す例に限られず、「ユーザID」の項目には、順位が同じ複数のユーザIDが記憶され得る。 The "user ID" stores identification information that is individually assigned to each user by the information processing apparatus 100 in order to identify users who use various services when providing various services. It should be noted that, without being limited to the example shown in FIG. 5, a plurality of user IDs having the same rank may be stored in the "user ID" item.

「検索クエリ」の項目には、「ユーザID」の項目に記憶されている識別情報に紐づく各ユーザが入力した検索クエリの情報が記憶される。 The "Search Query" item stores information on a search query input by each user that is associated with the identification information stored in the "User ID" item.

(ユーザ情報記憶部123)
ユーザ情報記憶部123には、各ユーザから提供されるセンサ情報などのユーザ情報が任意の形式で記憶されている。図6は、実施形態に係るユーザ情報の概要を示す図である。
(User information storage unit 123)
The user information storage unit 123 stores user information such as sensor information provided by each user in an arbitrary format. FIG. 6 is a diagram showing an overview of user information according to the embodiment.

図6に示すように、ユーザ情報は、「ユーザID」の項目や、「センサ情報」の項目などを有する。 As shown in FIG. 6, the user information includes items such as "user ID" and "sensor information."

「ユーザID」の項目には、センサ情報の提供元であるユーザに付与されている識別情報が記憶される。「ユーザID」の項目に記憶される識別情報は、図5に例示する第2リスト情報において「ユーザID」の項目に記憶される識別情報に対応する。 The “user ID” item stores identification information given to a user who is a provider of sensor information. The identification information stored in the "User ID" item corresponds to the identification information stored in the "User ID" item in the second list information illustrated in FIG.

「センサ情報」の項目には、各ユーザから提供されるセンサ情報が記憶される。なお、「センサ情報」の項目に記憶されるセンサ情報は、各ユーザから提供された生データであってもよいし、正規化などの処理を施して処理しやすいように加工した情報であってもよい。 The "sensor information" item stores sensor information provided by each user. Note that the sensor information stored in the "sensor information" item may be raw data provided by each user, or may be information processed such as normalization to make it easier to process. Good too.

なお、ユーザ情報記憶部123は、「ユーザID」の項目などに対応付けて、センサ情報から推定される情報を記憶してもよい。 Note that the user information storage unit 123 may store information estimated from the sensor information in association with an item such as "user ID".

(制御部130)
図3に示す制御部130は、情報処理装置100を制御するコントローラ(controller)である。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、GPU(Graphics Processing Unit)などによって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(例えば、情報処理プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現されてもよい。
(Control unit 130)
The control unit 130 shown in FIG. 3 is a controller that controls the information processing device 100. The control unit 130 uses a CPU (Central Processing Unit), an MPU (Micro Processing Unit), a GPU (Graphics Processing Unit), etc. to execute various programs (for example, information processing programs) stored in a storage device inside the information processing device 100. This is realized by executing using RAM as a work area. Further, the control unit 130 may be realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図3に示すように、制御部130は、第1生成部131と、第2生成部132と、分類部133と、評価部134とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。 As shown in FIG. 3, the control unit 130 includes a first generation unit 131, a second generation unit 132, a classification unit 133, and an evaluation unit 134. The control unit 130 uses these units to realize or execute information processing functions and operations described below. Note that the internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 3, and may be any other configuration as long as it performs information processing to be described later. Further, the connection relationship between the respective units included in the control unit 130 is not limited to the connection relationship shown in FIG. 3, and may be other connection relationships.

(第1生成部131)
第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。
(First generation unit 131)
The first generation unit 131 quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by the plurality of seed users who have performed the predetermined behavior. first list information is generated.

(第2生成部132)
第2生成部132は、シードユーザ以外の各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値(スコア)に基づいて各ユーザを順位付けした第2リスト情報を生成する。
(Second generation unit 132)
The second generation unit 132 quantifies the relationship between the predetermined behavior and each user based on the search query input by each user other than the seed user and the first list information, and indicates the quantified relationship. Second list information is generated that ranks each user based on the value (score).

(分類部133)
分類部133は、各ユーザのセンサ情報の共通性に基づいて、所定の行動に紐づく各ユーザを複数のクラスタに分類する。たとえば、分類部133は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、センサ情報から推定される各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類できる。
(Classification unit 133)
The classification unit 133 classifies each user associated with a predetermined behavior into a plurality of clusters based on the commonality of each user's sensor information. For example, the classification unit 133 can classify each user into a plurality of clusters based on the similarity of the behavior patterns of each user identified using sensor information. Further, for example, the classification unit 133 can classify each user into a plurality of clusters for each behavior pattern using a plurality of behavior patterns. Furthermore, for example, the classification unit 133 can classify each user into a plurality of clusters using sensor information that is related to a predetermined behavior. Further, for example, the classification unit 133 can classify each user into a plurality of clusters using information regarding each user estimated from the sensor information.

(評価部134)
評価部134は、分類部133による分類結果を用いて、第2リスト情報の信頼性を評価する。たとえば、評価部134は、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報の信頼性を評価できる。
(Evaluation unit 134)
The evaluation unit 134 uses the classification results by the classification unit 133 to evaluate the reliability of the second list information. For example, the evaluation unit 134 can derive the rate at which each user located in a predetermined ranking layer is assigned to the same cluster in the second list information, and evaluate the reliability of the second list information based on the derived rate. .

また、評価部134は、分類部133により、複数の行動パターンを用いて行動パターンごとに各ユーザが複数のクラスタに分類された場合、複数の行動パターンごとに、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報の信頼性を評価できる。 Furthermore, when the classification unit 133 classifies each user into a plurality of clusters for each behavior pattern using a plurality of behavior patterns, the evaluation unit 134 assigns a predetermined rank in the second list information for each of the plurality of behavior patterns. The reliability of the second list information can be evaluated by respectively deriving the ratios at which each user located in a layer is assigned to the same cluster, and by comprehensively considering each derived ratio.

[4.処理手順]
以下、図7を用いて、実施形態に係る情報処理装置100による処理手順について説明する。図7は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。図7に示す処理手順は、情報処理装置100の制御部130により実行される。図7に示す処理手順は、情報処理装置100の稼働中、繰り返し実行される。
[4. Processing procedure]
Hereinafter, a processing procedure by the information processing apparatus 100 according to the embodiment will be described using FIG. 7. FIG. 7 is a flowchart illustrating an example of a processing procedure by the information processing apparatus according to the embodiment. The processing procedure shown in FIG. 7 is executed by the control unit 130 of the information processing device 100. The processing procedure shown in FIG. 7 is repeatedly executed while the information processing device 100 is in operation.

図7に示すように、分類部133は、オペレータの操作に応じて、所定の行動を設定する(ステップS101)。 As shown in FIG. 7, the classification unit 133 sets a predetermined action according to the operator's operation (step S101).

続いて、分類部133は、ステップS101で設定した所定の行動に関する第2リスト情報を第2リスト情報記憶部122から取得するとともに、ステップS101で設定した所定の行動に関するセンサ情報をユーザ情報記憶部123から取得する(ステップS102)。 Subsequently, the classification unit 133 acquires second list information regarding the predetermined behavior set in step S101 from the second list information storage unit 122, and also acquires sensor information regarding the predetermined behavior set in step S101 from the user information storage unit. 123 (step S102).

続いて、分類部133は、ステップS102で取得したセンサ情報の共通性に基づいて、ステップS102で取得した第2リスト情報内の各ユーザを複数のクラスタに分類する(ステップS103)。 Subsequently, the classification unit 133 classifies each user in the second list information acquired in step S102 into a plurality of clusters based on the commonality of the sensor information acquired in step S102 (step S103).

そして、評価部134は、分類部133による分類結果に基づいて、第2リスト情報の信頼性を評価して(ステップS104)、図7に示す処理手順を終了する。 Then, the evaluation unit 134 evaluates the reliability of the second list information based on the classification result by the classification unit 133 (step S104), and ends the processing procedure shown in FIG. 7.

[5.変形例]
上述した情報処理装置100は、上述した実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
[5. Modified example]
The information processing device 100 described above may be implemented in various different forms other than the embodiments described above. Therefore, a modification of the embodiment will be described below.

(5-1.第1リスト情報および第2リスト情報について)
上述した実施形態において、情報処理装置100は、複数の所定の行動それぞれについて第1リスト情報および第2リスト情報を生成する例を説明したが、この例には特に限定される必要はない。たとえば、情報処理装置100は、ターゲットとするユーザの行動以外のコンテキスト(たとえば、デモグラフィック属性や興味嗜好など)に基づいて、第1リスト情報および第2リスト情報を作成してもよい。
(5-1. Regarding first list information and second list information)
In the embodiment described above, an example has been described in which the information processing device 100 generates first list information and second list information for each of a plurality of predetermined actions, but there is no need to be particularly limited to this example. For example, the information processing device 100 may create the first list information and the second list information based on context other than the target user's behavior (for example, demographic attributes, interests and preferences, etc.).

(5-2.クラスタの構成ユーザについて)
上述の実施形態において、情報処理装置100は、分類部133により分類されたクラスタの情報、たとえば、クラスタの構成ユーザの情報を記録してもよい。そして、所定のタイミングで、情報処理装置100は、第1リスト情報および第2リスト情報を更新し、更新した第2リスト情報に基づいて各ユーザのクラスタを作成して、作成したクラスタの構成ユーザと、記録済みのクラスタの構成ユーザとの間に大幅な変化がないかどうかを確かめてもよい。また、情報処理装置100は、クラスタの構成ユーザにシードユーザが含まれているかどうかを確かめてもよい。
(5-2. Regarding cluster configuration users)
In the embodiment described above, the information processing device 100 may record information on clusters classified by the classification unit 133, for example, information on users forming the cluster. Then, at a predetermined timing, the information processing apparatus 100 updates the first list information and the second list information, creates a cluster for each user based on the updated second list information, and creates a cluster for each user who is a member of the created cluster. You may check whether there are any significant changes between the user and the recorded users of the cluster. Further, the information processing apparatus 100 may check whether the seed user is included in the cluster users.

[6.ハードウェア構成]
実施形態に係る情報処理装置100は、たとえば、図8に示すような構成のコンピュータ1000によって実現される。図8は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
[6. Hardware configuration]
The information processing apparatus 100 according to the embodiment is realized, for example, by a computer 1000 having a configuration as shown in FIG. FIG. 8 is a hardware configuration diagram showing an example of a computer that implements the functions of the information processing device according to the embodiment.

コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。 The computer 1000 is connected to an output device 1010 and an input device 1020, and has an arithmetic device 1030, a primary storage device 1040, a secondary storage device 1050, an output IF (Interface) 1060, an input IF 1070, and a network IF 1080 connected by a bus 1090. has.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。 The arithmetic unit 1030 operates based on programs stored in the primary storage device 1040 and the secondary storage device 1050, programs read from the input device 1020, and performs various processes. The primary storage device 1040 is a memory device such as a RAM that temporarily stores data used by the arithmetic unit 1030 for various calculations. Further, the secondary storage device 1050 is a storage device in which data used by the arithmetic device 1030 for various calculations and various databases are registered, and is realized by a ROM (Read Only Memory), an HDD, a flash memory, or the like.

出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェイスであり、例えば、USB等により実現される。 The output IF 1060 is an interface for transmitting information to be output to the output device 1010 that outputs various information such as a monitor or printer, and is, for example, a USB (Universal Serial Bus), a DVI (Digital Visual Interface), This is realized using a connector compliant with standards such as HDMI (registered trademark) (High Definition Multimedia Interface). Further, the input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, a keyboard, and a scanner, and is realized by, for example, a USB or the like.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。 Note that the input device 1020 is, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), or a PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), or a tape. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. Furthermore, the input device 1020 may be an external storage medium such as a USB memory.

ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 Network IF 1080 receives data from other devices via network N and sends it to computing device 1030, and also sends data generated by computing device 1030 to other devices via network N.

演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。 Arithmetic device 1030 controls output device 1010 and input device 1020 via output IF 1060 and input IF 1070. For example, the arithmetic device 1030 loads a program from the input device 1020 or the secondary storage device 1050 onto the primary storage device 1040, and executes the loaded program.

例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)を実行することにより、制御部130と同様の機能を実現する。すなわち、演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)との協働により、実施形態に係る情報処理装置100による処理を実現する。 For example, when the computer 1000 functions as the information processing device 100, the arithmetic device 1030 of the computer 1000 executes a program (for example, an information processing program) loaded on the primary storage device 1040, thereby performing the same operation as the control unit 130. Realize the functions of That is, the arithmetic device 1030 realizes processing by the information processing device 100 according to the embodiment in cooperation with a program (for example, an information processing program) loaded onto the primary storage device 1040.

[7.その他]
上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[7. others]
Among the processes described in the embodiments described above, all or part of the processes described as being performed automatically can be performed manually, or all of the processes described as being performed manually can be performed manually. Alternatively, some of the steps can be performed automatically using known methods. In addition, information including the processing procedures, specific names, and various data and parameters shown in the above documents and drawings may be changed arbitrarily, unless otherwise specified.

上述の実施形態において、情報処理装置100による情報処理方法(たとえば、図7参照)を実現するために、情報処理装置100が有する制御部130の各部(第1生成部131、第2生成部132、分類部133、及び評価部134)に対応する処理機能は、情報処理装置100に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の提供プログラムとして柔軟に記述することにより実現されてもよい。 In the embodiment described above, in order to realize the information processing method by the information processing apparatus 100 (for example, see FIG. 7), each part of the control unit 130 (the first generation unit 131, the second generation unit 132 , classification unit 133, and evaluation unit 134) may be realized as an add-on to an information processing program preinstalled in the information processing device 100, or may be implemented as a dedicated program using a lightweight programming language or the like. This may be realized by flexibly writing it as a providing program.

また、情報処理装置100は、各ユーザの情報として、各ユーザが入力した検索クエリの履歴だけでなく、各ユーザの購買履歴、電子商店街で閲覧した取引対象の履歴、購入した取引対象の履歴である購買履歴、閲覧したニュース等のコンテンツの履歴である閲覧履歴、SNS(Social Networking Service)に投稿したテキストや画像等の履歴である投稿履歴、位置履歴などを収集してもよい。また、情報処理装置100は、たとえば、各ユーザが保有するスマートフォンを用いて店舗に設置されたQRコード(登録商標)を読み取り、読み取り結果を用いて実現する決済サービスの利用履歴や、各ユーザが保有するスマートフォンにQRコードを表示させ、かかるQRコードを店舗端末が読み込むことで行われる決済サービスの利用履歴(たとえば、購入日時や購入商品、購入額など)を収集してもよい。また、情報処理装置100は、各ユーザが保有するクレジットカードの利用履歴や銀行口座の利用履歴などを収集してもよい。 The information processing device 100 also stores, as information about each user, not only the history of search queries entered by each user, but also the purchase history of each user, the history of transaction objects viewed on the online shopping mall, and the history of transaction objects purchased. Purchase history, which is the history of content such as news that has been viewed, posting history, which is the history of texts, images, etc. posted on SNS (Social Networking Service), location history, etc. may be collected. In addition, the information processing device 100 reads, for example, a QR code (registered trademark) installed in a store using a smartphone owned by each user, and records usage history of payment services realized using the reading results and information about each user's usage history. A QR code may be displayed on a smartphone owned by the user, and the usage history of the payment service (for example, purchase date and time, purchased product, purchase amount, etc.) may be collected by having a store terminal read the QR code. Further, the information processing apparatus 100 may collect credit card usage history, bank account usage history, etc. held by each user.

また、情報処理装置100は、収集した情報に基づいて推定された情報を各ユーザの情報としてもよい。たとえば、情報処理装置100は、購買履歴から、毎月の食料品の平均的な購入総額が10万円以上である場合、たとえば、世帯月収若しくは個人月収が30万円以上であるといった収入や、3人家族であるといった家族構成、もしくは同居人構成などを推定し、各ユーザの情報としてもよい。また、情報処理装置100は、たとえば、位置履歴や購入履歴から、各ユーザが所有する物品や、各ユーザの居住地や職場などを推定し、推定した情報を各ユーザの情報としてもよい。 Further, the information processing apparatus 100 may use information estimated based on the collected information as information for each user. For example, if the average monthly grocery purchase total is 100,000 yen or more based on the purchase history, the information processing device 100 determines whether the household monthly income or individual monthly income is 300,000 yen or more; It is also possible to estimate the family structure, such as a family of two people, or the structure of people living together, and use this information as information for each user. Further, the information processing device 100 may estimate the items owned by each user, the place of residence and workplace of each user, and use the estimated information as the information of each user, for example, based on the location history and purchase history.

また、情報処理装置100は、たとえば、各種サービスを提供するサーバ装置から、サービスの利用履歴を各ユーザの情報として取得してもよい。また、情報処理装置100は、このようなサービスを提供するサーバ装置もしくは単独のサーバ装置が、サービスの利用履歴から推定した各種情報を各ユーザの情報として収集してもよい。また、情報処理装置100は、各ユーザが登録、又は各ユーザについて推定された各種のジオグラフィック属性や趣味嗜好といったサイコグラフィック属性を示す情報を各ユーザの情報として収集してもよい。 Further, the information processing device 100 may obtain service usage history as information about each user, for example, from a server device that provides various services. Further, in the information processing device 100, a server device or a single server device that provides such a service may collect various information estimated from the usage history of the service as information about each user. Further, the information processing apparatus 100 may collect information indicating psychographic attributes such as various geographic attributes and hobbies and preferences registered by each user or estimated for each user as information about each user.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の分類部133と評価部134とは機能的に統合されていてもよい。 Furthermore, each component of each device shown in the drawings is functionally conceptual, and does not necessarily need to be physically configured as shown in the drawings. In other words, the specific form of distributing and integrating each device is not limited to what is shown in the diagram, and all or part of the devices can be functionally or physically distributed or integrated in arbitrary units depending on various loads and usage conditions. Can be integrated and configured. For example, the classification section 133 and the evaluation section 134 of the control section 130 may be functionally integrated.

また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modified examples can be combined as appropriate within the range that does not conflict with the processing contents.

[8.効果]
上述の実施形態に係る情報処理装置100は、第1生成部131と、第2生成部132と、分類部133と、評価部134とを備える。第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部132は、シードユーザを含む各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第2リスト情報を生成する。分類部133は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部134は、分類部133による分類結果を用いて、第2リスト情報の信頼性を評価する。
[8. effect]
The information processing device 100 according to the embodiment described above includes a first generation section 131, a second generation section 132, a classification section 133, and an evaluation section 134. The first generation unit 131 quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by the plurality of seed users who have performed the predetermined behavior. first list information is generated. The second generation unit 132 quantifies the relationship between the predetermined behavior and each user based on the search query input by each user including the seed user and the first list information, and indicates the quantified relationship. Second list information is generated that ranks each user based on the values. The classification unit 133 classifies each user into a plurality of clusters based on the commonality of the sensor information of each user. The evaluation unit 134 uses the classification results by the classification unit 133 to evaluate the reliability of the second list information.

このようなことから、実施形態に係る情報処理装置100は、たとえば、第2リスト情報に含まれる各ユーザを検索クエリとは無関係のセンサ情報に基づいてクラスタリングすることにより、第2リスト情報に含まれる各ユーザが一定の関連性を有するかを客観的に確かめることができ、第2リスト情報の信頼性を間接的に評価できる。 For this reason, the information processing apparatus 100 according to the embodiment clusters each user included in the second list information based on sensor information unrelated to the search query. It can be objectively confirmed whether each user listed has a certain degree of relevance, and the reliability of the second list information can be indirectly evaluated.

また、実施形態に係る情報処理装置100において、評価部134は、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置100は、たとえば、第2リスト情報において、どの順位までのユーザが所定の行動との関係性を有するのかについて確かめることができる。 Furthermore, in the information processing apparatus 100 according to the embodiment, the evaluation unit 134 derives the ratio at which each user located in a predetermined rank layer in the second list information is assigned to the same cluster, and based on the derived ratio, Evaluate the reliability of the second list information. Thereby, the information processing apparatus 100 according to the embodiment can confirm, for example, in the second list information, up to which ranking users have a relationship with a predetermined behavior.

また、実施形態に係る情報処理装置100において、分類部133は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類する。これにより、実施形態に係る情報処理装置100は、各ユーザの具体的な行動内容が類似する各ユーザを同一のクラスタに分類できる。 Furthermore, in the information processing apparatus 100 according to the embodiment, the classification unit 133 classifies each user into a plurality of clusters based on the similarity of the behavior patterns of each user identified using sensor information. Thereby, the information processing apparatus 100 according to the embodiment can classify users whose specific actions are similar to each other into the same cluster.

また、実施形態に係る情報処理装置100において、分類部133は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類し、評価部134は、複数の行動パターンごとに、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置100は、信頼性の評価精度を高めることができる。 Furthermore, in the information processing apparatus 100 according to the embodiment, the classification unit 133 classifies each user into a plurality of clusters for each behavioral pattern using a plurality of behavioral patterns, and the evaluation unit 134 classifies each user into a plurality of clusters for each behavioral pattern. , derive the percentage of each user located in a predetermined ranking layer in the second list information being assigned to the same cluster, and evaluate the reliability of the second list information by comprehensively considering each derived percentage. . Thereby, the information processing apparatus 100 according to the embodiment can improve reliability evaluation accuracy.

また、実施形態に係る情報処理装置100において、分類部133は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類する。 Furthermore, in the information processing device 100 according to the embodiment, the classification unit 133 classifies each user into a plurality of clusters using sensor information that is related to a predetermined behavior.

また、実施形態に係る情報処理装置100において、分類部133は、センサ情報から推定される前記各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類する。 Furthermore, in the information processing apparatus 100 according to the embodiment, the classification unit 133 classifies each user into a plurality of clusters using the information regarding each user estimated from the sensor information.

これらにより、実施形態に係る情報処理装置100は、様々な基準で各ユーザを分類できる。 With these, the information processing apparatus 100 according to the embodiment can classify each user based on various criteria.

以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As mentioned above, the embodiments of the present application have been described in detail based on several drawings, but these are merely examples, and various modifications and variations can be made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure section of the invention. It is possible to carry out the invention in other forms with modifications.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means", "circuit", etc. For example, the control section can be read as a control means or a control circuit.

10 端末装置
100 情報処理装置
110 通信部
120 記憶部
121 第1リスト情報記憶部
122 第2リスト情報記憶部
123 ユーザ情報記憶部
130 制御部
131 第1生成部
132 第2生成部
133 分類部
134 評価部
10 Terminal device 100 Information processing device 110 Communication unit 120 Storage unit 121 First list information storage unit 122 Second list information storage unit 123 User information storage unit 130 Control unit 131 First generation unit 132 Second generation unit 133 Classification unit 134 Evaluation Department

Claims (8)

所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成部と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成部と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類部と、
前記分類部による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価部と
を備えることを特徴とする情報処理装置。
First list information that quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by a plurality of seed users who have performed a predetermined behavior. a first generation unit that generates;
Based on a search query input by each user including the seed user and the first list information, the relationship between the predetermined action and each user is quantified, and a value indicating the quantified relationship is set. a second generation unit that generates second list information ranking each user based on the second list information;
a classification unit that classifies each user into a plurality of clusters based on the commonality of sensor information of each user;
An information processing device comprising: an evaluation section that evaluates reliability of the second list information using classification results by the classification section.
前記評価部は、
前記第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、前記第2リスト情報の信頼性を評価する
ことを特徴とする請求項1に記載の情報処理装置。
The evaluation department is
The method is characterized by deriving a proportion of users located in a predetermined ranking layer in the second list information and being assigned to the same cluster, and evaluating reliability of the second list information based on the derived proportion. The information processing device according to claim 1.
前記分類部は、
前記センサ情報を用いて特定される前記各ユーザの行動パターンの類似性に基づいて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1又は2に記載の情報処理装置。
The classification section is
The information processing device according to claim 1 or 2, wherein each of the users is classified into a plurality of clusters based on similarity of behavior patterns of each of the users identified using the sensor information.
前記分類部は、
複数の前記行動パターンを用いて、前記行動パターンごとに前記各ユーザを複数のクラスタに分類し、
前記評価部は、
複数の前記行動パターンごとに、前記第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、前記第2リスト情報の信頼性を評価する
ことを特徴とする請求項3に記載の情報処理装置。
The classification section is
Classifying each user into a plurality of clusters for each of the behavioral patterns using the plurality of behavioral patterns,
The evaluation department is
For each of the plurality of behavioral patterns, the proportion of each user located in a predetermined ranking layer in the second list information is assigned to the same cluster is derived, and the derived proportions are comprehensively taken into consideration. 4. The information processing device according to claim 3, wherein reliability of the 2-list information is evaluated.
前記分類部は、
前記所定の行動と関連性を有するセンサ情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1~4のいずれか1つに記載の情報処理装置。
The classification section is
The information processing device according to any one of claims 1 to 4, wherein each of the users is classified into a plurality of clusters using sensor information that is related to the predetermined behavior.
前記分類部は、
前記センサ情報から推定される前記各ユーザに関する情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1~5のいずれか1つに記載の情報処理装置。
The classification section is
The information processing apparatus according to any one of claims 1 to 5, wherein the information processing apparatus classifies each user into a plurality of clusters using information regarding each user estimated from the sensor information.
コンピュータが実行する情報処理方法であって、
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成工程と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成工程と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類工程と、
前記分類工程による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価工程と
を含むことを特徴とする情報処理方法。
An information processing method performed by a computer, the method comprising:
First list information that quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by a plurality of seed users who have performed a predetermined behavior. a first generation step of generating;
Based on a search query input by each user including the seed user and the first list information, the relationship between the predetermined action and each user is quantified, and a value indicating the quantified relationship is set. a second generation step of generating second list information ranking each of the users based on the
a classification step of classifying each of the users into a plurality of clusters based on the commonality of the sensor information of each of the users;
and an evaluation step of evaluating reliability of the second list information using the classification results obtained in the classification step.
コンピュータに、
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成手順と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成手順と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類手順と、
前記分類手順による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価手順と
を実行させることを特徴とする情報処理プログラム。
to the computer,
First list information that quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by a plurality of seed users who have performed a predetermined behavior. a first generation procedure for generating;
Based on a search query input by each user including the seed user and the first list information, the relationship between the predetermined action and each user is quantified, and a value indicating the quantified relationship is set. a second generation procedure of generating second list information in which each of the users is ranked based on the second list information;
a classification procedure for classifying each user into a plurality of clusters based on the commonality of sensor information of each user;
and an evaluation procedure for evaluating reliability of the second list information using classification results obtained by the classification procedure.
JP2021150449A 2021-09-15 2021-09-15 Information processing device, information processing method, and information processing program Active JP7354195B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021150449A JP7354195B2 (en) 2021-09-15 2021-09-15 Information processing device, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021150449A JP7354195B2 (en) 2021-09-15 2021-09-15 Information processing device, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP2023042995A JP2023042995A (en) 2023-03-28
JP7354195B2 true JP7354195B2 (en) 2023-10-02

Family

ID=85724359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021150449A Active JP7354195B2 (en) 2021-09-15 2021-09-15 Information processing device, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP7354195B2 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080281809A1 (en) 2007-05-10 2008-11-13 Microsoft Corporation Automated analysis of user search behavior
US20080281808A1 (en) 2007-05-10 2008-11-13 Microsoft Corporation Recommendation of related electronic assets based on user search behavior

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5481295B2 (en) * 2010-07-15 2014-04-23 エヌ・ティ・ティ・コムウェア株式会社 Object recommendation device, object recommendation method, object recommendation program, and object recommendation system
JP5577385B2 (en) * 2012-06-26 2014-08-20 ヤフー株式会社 Content distribution device
JP2017068765A (en) * 2015-10-01 2017-04-06 株式会社Sassor Information processing method, information processing device and program
JP7231322B2 (en) * 2017-07-13 2023-03-01 ヤフー株式会社 LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080281809A1 (en) 2007-05-10 2008-11-13 Microsoft Corporation Automated analysis of user search behavior
US20080281808A1 (en) 2007-05-10 2008-11-13 Microsoft Corporation Recommendation of related electronic assets based on user search behavior

Also Published As

Publication number Publication date
JP2023042995A (en) 2023-03-28

Similar Documents

Publication Publication Date Title
US10937089B2 (en) Machine learning classification and prediction system
KR101955508B1 (en) Recommending additional users for an event using a social networking system
US8583471B1 (en) Inferring household income for users of a social networking system
US20140172545A1 (en) Learned negative targeting features for ads based on negative feedback from users
TW201610884A (en) Advertisement method and apparatus using user analyzing platform and marketing platform based on cohort
JP2009193465A (en) Information processor, information providing system, information processing method, and program
JP2017534124A (en) Use of visitor metrics by ad targeting criteria
JP6899805B2 (en) Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc.
JP2021089485A (en) Advertisement notification system, advertisement notification method, and information processing device
KR102218235B1 (en) method and system for providing customized advertisement service
KR102193737B1 (en) System for displaying personalized advertisements based on social networks
Ibrahim et al. Extracting behavioural features from smartphone notifications
JP7354195B2 (en) Information processing device, information processing method, and information processing program
JP6320353B2 (en) Digital marketing system
KR102218238B1 (en) method and apparatus for recommending advertisements using information obtained through Social Network Service
JP7174743B2 (en) Information selection device, information selection method and information selection program
JP7418379B2 (en) Information processing device, information processing method, and information processing program
JP6910515B1 (en) Analytical instruments, analytical methods and analytical programs
JP7407779B2 (en) Information processing device, information processing method, and information processing program
JP6043840B1 (en) Classification device, classification method, and classification program
JP2022087835A (en) Community categorization method, computer program, and computer device
JP7419313B2 (en) Information processing device, information processing method, and information processing program
JP7453191B2 (en) Information processing device, information processing method, and information processing program
JP7260439B2 (en) Extraction device, extraction method and extraction program
KR102218236B1 (en) Online advertising system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220916

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230920

R150 Certificate of patent or registration of utility model

Ref document number: 7354195

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350