JP7354195B2 - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP7354195B2 JP7354195B2 JP2021150449A JP2021150449A JP7354195B2 JP 7354195 B2 JP7354195 B2 JP 7354195B2 JP 2021150449 A JP2021150449 A JP 2021150449A JP 2021150449 A JP2021150449 A JP 2021150449A JP 7354195 B2 JP7354195 B2 JP 7354195B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- information
- information processing
- list information
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 180
- 238000003672 processing method Methods 0.000 title claims description 8
- 230000009471 action Effects 0.000 claims description 37
- 238000000034 method Methods 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 25
- 230000003542 behavioural effect Effects 0.000 claims description 11
- 230000006399 behavior Effects 0.000 description 85
- 238000012545 processing Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101000618467 Hypocrea jecorina (strain ATCC 56765 / BCRC 32924 / NRRL 11460 / Rut C-30) Endo-1,4-beta-xylanase 2 Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 235000015220 hamburgers Nutrition 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101100014539 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) get-1 gene Proteins 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
従来、インターネット上におけるユーザ行動の予測をする手法が知られている。例えば、特許文献1には、ユーザの行動を従来よりも高い精度で予測することを目的として、インターネット上のユーザの検索クエリの傾向を学習し、学習した検索クエリの傾向とその後のユーザの行動との関連性スコアを算出してモデルを生成し、このモデルを用いて他のユーザの行動を予測する技術が提案されている。
Conventionally, methods for predicting user behavior on the Internet have been known. For example, in
しかしながら、上述した技術では、生成した情報を信頼してもよいかどうかの確証を得ることが難しい。たとえば、結果論として有効な成果を上げるモデルが含まれている可能性があり、仮にABテストを行ったとしても、テストの内容に応じて適切ではないモデルが採用されてしまう場合もある。 However, with the above-mentioned techniques, it is difficult to obtain certainty as to whether or not the generated information can be trusted. For example, there is a possibility that a model that produces effective results may be included, and even if an AB test is conducted, an inappropriate model may be adopted depending on the content of the test.
本願は、上記に鑑みてなされたものであって、生成した情報の信頼性を確かめることができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and aims to provide an information processing device, an information processing method, and an information processing program that can confirm the reliability of generated information.
本願に係る情報処理装置は、第1生成部と、第2生成部と、分類部と、評価部とを備える。第1生成部は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部は、シードユーザを含む各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第2リスト情報を生成する。分類部は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部は、分類部による分類結果を用いて、第2リスト情報の信頼性を評価する。 The information processing device according to the present application includes a first generation section, a second generation section, a classification section, and an evaluation section. The first generation unit quantifies the relationship between the search query input by each seed user and the predetermined action based on the commonality of the search queries entered by multiple seed users who have performed the predetermined action. Generate first list information. The second generation unit quantifies the relationship between the predetermined behavior and each user based on the search query input by each user including the seed user and the first list information, and provides a value indicating the quantified relationship. Second list information is generated in which each user is ranked based on the second list information. The classification unit classifies each user into a plurality of clusters based on the commonality of the sensor information of each user. The evaluation section evaluates the reliability of the second list information using the classification results by the classification section.
実施形態の態様の1つによれば、生成した情報の信頼性を確かめることができる。 According to one aspect of the embodiment, the reliability of the generated information can be verified.
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 DESCRIPTION OF THE PREFERRED EMBODIMENTS An information processing apparatus, an information processing method, and an embodiment of an information processing program (hereinafter referred to as "embodiments") according to the present application will be described in detail below with reference to the drawings. Note that the information processing apparatus, information processing method, and information processing program according to the present application are not limited to the embodiments described below. Furthermore, the embodiments described below can be combined as appropriate within the range that does not conflict with the processing contents. Further, in the embodiments described below, the same parts are given the same reference numerals, and redundant explanations will be omitted.
また、以下の説明において、端末装置10をシードユーザU-1またはユーザU-2と表記して説明する場合がある。すなわち、シードユーザU-1またはユーザU-2を端末装置10と読み替えることができる。また、シードユーザU-1やユーザU-2を「ユーザU」と総称する場合がある。
Furthermore, in the following description, the
[1.情報処理システム]
図1は、実施形態に係る情報処理システムの一例を説明する図である。図1に示すように、実施形態に係る情報処理システムSYSは、端末装置10、及び情報処理装置100を有する。なお、情報処理システムSYSは、図1に示す例に限られず、複数の端末装置10や複数の情報処理装置100を有していてもよい。
[1. Information processing system]
FIG. 1 is a diagram illustrating an example of an information processing system according to an embodiment. As shown in FIG. 1, the information processing system SYS according to the embodiment includes a
端末装置10、及び情報処理装置100は、それぞれ有線又は無線によりネットワークN(たとえば、図3参照)に接続される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網、固定電話網等)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNは、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。端末装置10、及び情報処理装置100は、ネットワークNを通じて、相互に通信できる。
The
図1に示す端末装置10は、検索クエリを用いた各種サービスを利用するユーザUが使用する情報処理装置である。たとえば、端末装置10は、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、PDA(Personal Digital Assistant)などにより実現される。
A
また、端末装置10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)などの無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)などの近距離無線通信を介してネットワークNに接続できる。
The
また、端末装置10は、各種サービスを利用するための情報を、ウェブブラウザやアプリケーションにより表示できる。なお、端末装置10は、情報の表示処理を実現する制御情報を情報処理装置100などから受け取った場合には、制御情報に従って表示処理を実現する。
Further, the
また、ユーザUは、各種サービスの利用を通じて、情報処理装置100に対し、センサ情報を提供する。センサ情報は、端末装置10に搭載される各種センサにより取得される情報である。たとえば、位置センサにより取得される位置情報や、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される角速度情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などを含み得る。
Further, the user U provides sensor information to the
図1に示す情報処理装置100は、検索クエリを用いた各種サービスなどを提供する情報処理装置である。情報処理装置100が提供する各種サービスには、各種アプリケーションに対応するAPI(Application Programming Interface)サービスや、各種オンラインサービスが含まれていてもよい。オンラインサービスとしては、インターネット接続や、検索サービスや、SNS(Social Networking Service)や、電子商取引サービスや、電子決済サービスや、オンラインゲームや、オンラインバンキングサービスや、オンライントレーディングサービスや、宿泊予約サービスや、チケット予約サービスや、動画配信サービスや、音楽配信サービスや、ニュース配信サービスや、地図情報サービスや、ルート検索サービスや、経路案内サービスや、路線情報サービスや、運行情報サービスや、天気情報サービスなどのサービスが該当し得る。
The
また、情報処理装置100は、各種サービスの提供を通じて収集したセンサ情報を用いて、実施形態に係る情報処理を実行する情報処理装置である。情報処理装置100は、典型的にはサーバ装置であるが、メインフレームやワークステーションなどにより実現されてもよい。
Further, the
情報処理装置100がサーバ装置で実現される場合、単独のサーバにより実現されてもよいし、複数のサーバ装置及び複数のストレージ装置が協働して動作するクラウドシステムなどにより実現されてもよい。なお、情報処理装置100は、ユーザUが使用する端末装置10に制御情報を配信する配信装置として機能してもよい。ここで、制御情報は、例えば、JavaScript(登録商標)などのスクリプト言語やCSS(Cascading Style Sheets)などのスタイルシート言語により記述される。なお、情報処理装置100から配信されるアプリケーションそのものを制御情報とみなしてもよい。
When the
[2.情報処理]
以下、情報処理システムSYSにおける情報処理の一例を説明する。なお、以下の説明において、実施形態に係る情報処理の対象は、各種サービスを利用するユーザUである。また、以下の説明において、シードユーザU-1の一群を「ユーザ群UG-1」と総称し、シードユーザを含む全てのユーザU-2の一群を「ユーザ群UG-2」と総称する。シードユーザU-1は、「〇〇を買った」、「〇〇に行った」、「〇〇している」といった所定の行動を行ったユーザや、特定の属性(興味嗜好など)を有するユーザなど、特定のユーザコンテキストを有するユーザに該当する。
[2. Information processing]
An example of information processing in the information processing system SYS will be described below. In the following description, the target of information processing according to the embodiment is the user U who uses various services. Furthermore, in the following description, a group of seed users U-1 will be collectively referred to as a "user group UG-1", and a group of all users U-2 including the seed users will be collectively referred to as a "user group UG-2". Seed user U-1 is a user who has performed a predetermined action such as ``bought 〇〇,'' ``went to 〇〇,'' or ``do 〇〇,'' or a user who has specific attributes (such as interests and preferences). It corresponds to a user with a specific user context, such as a user.
なお、以下に説明する情報処理は、情報処理の対象がユーザUである場合に限られず、商品や、街や、サービスなど、情報を収集可能な対象であれば、どのような対象に対しても適用できる。 Note that the information processing described below is not limited to the case where the information processing target is the user U, but can be applied to any target for which information can be collected, such as products, towns, and services. can also be applied.
まず、図1に示す例において、情報処理装置100は、所定の行動をとった複数のシードユーザU-1からなるユーザ群UG-1を特定する。そして、情報処理装置100は、ユーザ群UG-1に含まれる各シードユーザU-1が入力した検索クエリの共通性に基づいて、各シードユーザU-1が入力した検索クエリと所定の行動との関係性を数値化した第1リスト情報を生成し、記憶する。
First, in the example shown in FIG. 1, the
たとえば、情報処理装置100は、「〇〇を買った」「〇〇に興味がある」という条件(タイトル)を満たすユーザをシードユーザU-1として収集し、シードユーザU-1が入力した検索クエリの共通性に基づいたスコアを付与した第1リスト情報を作成する。具体的には、「眼鏡をかけている」というシードユーザU-1を収集し、検索クエリ:「眼鏡」に「70点」、検索クエリ:「眼鏡ふき」に「50点」、検索クエリ:「リンゴ」にスコア「-50点」といったようなスコアを付与し、検索クエリとスコアとの組である第1リスト情報を作成する。
For example, the
上述したシードユーザU-1の一群であるユーザ群UG-1の特定は、任意の方法を用いて行うことができる。たとえば、情報処理装置100は、購買履歴や利用履歴、位置履歴などの各種の情報に基づいて、想定される行動を行ったユーザをシードユーザU-1であると推定し、ユーザ群UG-1を特定してもよい。具体的には、ある所定の店舗の名称を検索クエリとして入力し、その後、その所定の店舗を実際に訪問した訪問者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、別の例として、イベントの名称を検索クエリとして入力し、その後、そのイベントに実際に参加した参加者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、更に別の例として、ある商品の名称を検索クエリとして入力し、その後、その名称の商品を実際に購入した購入者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、情報処理装置100は、実際に所定の店舗(たとえば、配信済みの広告と対応する店舗)を利用した利用者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。また、情報処理装置100は、所定の広告やウェブページ、映画や音楽などのコンテンツを視聴した視聴者(シードユーザU-1)を推定することによりユーザ群UG-1を特定してもよい。
The above-described user group UG-1, which is a group of seed users U-1, can be identified using any method. For example, the
また、情報処理装置100は、第1リストにおける検索クエリのスコアは、以下のような機械学習により生成される行動モデルから求めることができる。たとえば、情報処理装置100は、シードユーザU-1が入力した検索クエリを正例とし、ランダムに選択したシードユーザU-1以外の他のユーザが入力した検索クエリを負例としたときに、正例を入力した際により高い値を出力し、負例を入力した際により低い値を出力するように学習モデルの学習を行う。このとき、学習には任意の手法が採用可能である。たとえば、モデルとしてニューラルネットワークが採用される場合は、バックプロパゲーションなどにより実現可能である。
Furthermore, the
また、情報処理装置100は、シードユーザU1が共通して入力している検索クエリについては、より高い値の数値が出力されるようにモデルを学習してもよい。たとえば、正例となる検索クエリを入力したシードユーザU-1の数が多ければ多い程、より高い値を出力するようにモデルを学習してもよい。また、負例となる検索クエリを入力した他のユーザの数が多い程、より小さい値(負の値)を出力するようにモデルを学習してもよい。そして、情報処理装置100は、各検索クエリと、このような学習モデルに検索クエリを入力した際に出力したスコアとの組のリストを「第1リスト情報」として生成する。すなわち、情報処理装置100は、所定の行動を行ったシードユーザU-1が入力した各検索クエリと、検索クエリの各々に対応する上述のスコア(検索クエリと所定の行動との間の関係性を示すスコア)との組を「第1リスト情報」として生成する。なお、この第1リスト情報は、情報処理装置100により、所定の行動ごとに生成された行動モデルを用いて、それぞれの行動に対応した第1リスト情報が生成される。
Furthermore, the
続いて、情報処理装置100は、ユーザ群UG-2が入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザU-2との関係性を数値化し、数値化した関係性を示す値に基づいて、各ユーザU-2を順位付けした第2リスト情報を生成し、記憶する。
Subsequently, the
たとえば、情報処理装置100は、シードユーザU-1を含むユーザ群UG-2から各ユーザU-2を選定し、選定した各ユーザU-2が入力した検索クエリと対応付けられたスコアを第1リスト情報から特定する。なお、情報処理装置100は、ユーザ群UG-2に含まれる各ユーザU-2を無作為に選定してもよいし、所定の条件に基づいて選定してもよい。そして、情報処理装置100は、特定したスコアの合計から、シードユーザU-1を収集する際の条件として設定した所定の行動と、各ユーザU-2との間の関係性を示す第2リスト情報を導出する。たとえば、第2リスト情報において、所定の行動と関係性が高いユーザU-2はスコアが高く、所定の行動と関係性が低いユーザU-2はスコアが低くなる。
For example, the
以下、情報処理装置100による第2リスト情報の生成について具体的に説明する。シードユーザU-1を含む各ユーザU-2が入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値を算出する。このようにすれば、各ユーザU-2が入力した複数の検索クエリと所定の行動との関係性を数値として表すことができるため、単一の検索クエリの数値化と比較してより信頼性の高い数値化を実現できる。
Hereinafter, generation of the second list information by the
次に、情報処理装置100は、各ユーザU-2についてスコアの合計値を計算した後、スコアの高い順に各ユーザU-2を順位付けするとともに、順位順に各ユーザU-2が入力した検索クエリを対応付けた第2リスト情報を生成する。この第2リスト情報は、どのような検索クエリを入力したユーザU-2が、所定の行動との関連性が強いかを示すリストとして機能する。この第2リスト情報は、検索クエリと所定の行動との関連性の分析や、ユーザU-2の分析などに用いられる。なお、この第2リストは、シードユーザU-1を選定する際に設定される行動(たとえば、「〇〇を買った」、「〇〇に行った」、「〇〇している」など)といった所定の行動ごとに作成される。
Next, the
上述した第2リスト情報を用いることにより、ユーザU-2が興味を有する可能性が高い情報の提供を実現できると考えられる。たとえば、ある店舗を訪問したという行動と対応する第2リスト情報には、その行動と関連性が高いユーザU-2のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第2リスト情報を用いることにより、ランキングの順位が高いユーザU-2に対し、その店舗に関する広告を提供することで、広告効果を向上させることができると考えられる。また、ある商品を購入したという行動と対応する第2リスト情報には、その行動と関連性が高いユーザU-2のランキングが含まれる。そこで、たとえば、広告を配信する配信サーバは、第2リスト情報を用いることにより、ランキングの順位が高いユーザU-2に対し、その商品またはその商品と関連する商品に関する広告を提供することで、広告効果を向上させることができると考えられる。 By using the second list information described above, it is possible to provide information that is likely to be of interest to the user U-2. For example, the second list information corresponding to the action of visiting a certain store includes a ranking of user U-2 that is highly relevant to the action. Therefore, for example, by using the second list information, the distribution server that distributes advertisements can improve the advertisement effectiveness by providing advertisements related to the store to user U-2 who has a high ranking. It seems possible. Further, the second list information corresponding to the action of purchasing a certain product includes a ranking of user U-2 that is highly relevant to the action. Therefore, for example, the distribution server that distributes the advertisement uses the second list information to provide user U-2 with a high ranking with an advertisement regarding the product or a product related to the product. It is thought that advertising effectiveness can be improved.
一方、上述した第2リスト情報について、ユーザU-2の行動を正確に反映したリストであるかどうかの確証を得ることは難しい。すなわち、スコアに基づいてユーザU-2を順位付けした際に、果たしてどの順位までのユーザU-2が所定の行動との関係性を有するのかという点について、実際には定かではない。たとえば、スコアが高いほど、所定の行動を取る可能性が高いという推測が働くが、スコアがどの程度高ければ所定の行動と関連性が高いのかを見極めることは難しい。また、スコアの高さと、所定の行動との関係性の高さとの相関関係の検証も十分とは言い切れない。 On the other hand, with respect to the second list information mentioned above, it is difficult to obtain certainty as to whether the list accurately reflects the behavior of user U-2. That is, when ranking users U-2 based on their scores, it is not actually certain as to which ranking user U-2 has a relationship with a predetermined behavior. For example, it is inferred that the higher the score, the higher the possibility of taking a certain action, but it is difficult to determine how high the score has to be related to the given action. Furthermore, it cannot be said that verification of the correlation between the high score and the high relationship with a predetermined behavior is sufficient.
そこで、実施形態に係る情報処理装置100は、以下に説明する情報処理により、第2リスト情報の信頼性を確かめるための情報処理方法を提案する。
Therefore, the
まず、情報処理装置100は、信頼性の評価を行う第2リスト情報を選定するための所定の行動を設定する(ステップS1)。次に、情報処理装置100は、ユーザ群UG-2から収集されるセンサ情報の共通性に基づいて、第2リスト情報内の各ユーザU-2を分類する(ステップS2)。以下、図2を用いて、ユーザ分類方法および第2リスト情報評価方法の一例について説明する。図2は、実施形態に係るユーザ分類方法および第2リスト情報評価方法の一例を示す図である。なお、図2に示す第2リスト情報内に順位付けされたユーザの数は一例であり、図2に示す例よりも多くのユーザが含まれていてもよい。
First, the
まず、情報処理装置100は、第2リスト情報LT(図2参照)内において、スコア順位が1位であるユーザU-2(以下、「参照ユーザ」と称する。)に対応するセンサ情報#EX-1を取得する。次に、情報処理装置100は、取得したセンサ情報#EX-1を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンXを特定する。
First, the
続いて、情報処理装置100は、第2リストLTに列挙された参照ユーザ以外の他のユーザU-2(以下、「比較ユーザ」と称する。)について、センサ情報#EX-1に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報を用いて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。
Subsequently, the
以下、情報処理装置100による行動パターンの特定方法について一例を説明する。たとえば、情報処理装置100は、センサ情報EX-1として、位置履歴とSNSなどのメッセージ送信履歴を取得する。また、情報処理装置100は、位置履歴の中から、所定時間以上滞在していた位置を特定する。また、情報処理装置100は、特定した位置の記録日時に対応する送信メッセージがあるかメッセージ送信履歴内を検索する。そして、情報処理装置100は、所定時間以上滞在していた位置と、メッセージの内容とを突き合わせて、たとえば、送信メッセージが「ハンバーガー美味しい」という内容であれば、所定時間滞在していた位置に対応するエリアのハンバーガーショップに位置したと推定する。このようにして、情報処理装置100は、位置履歴とメッセージ送信履歴とに基づいて特定した行動を1つずつ繋ぎ合わせていくことにより、参照ユーザの時系列の行動パターンを特定できる。なお、情報処理装置100は、比較ユーザについても同様に行動パターンを特定できる。
An example of a method for identifying behavior patterns by the
そして、情報処理装置100は、参照ユーザの行動パターンXと、比較ユーザの行動パターンとをそれぞれ比較し、行動パターンの類似性(比較ユーザの行動パターンが行動パターンXに類似するかどうか)に基づいて、クラスタリングを行う。たとえば、図2に示すように、情報処理装置100は、行動パターンが行動パターンXに類似する比較ユーザをクラスタX-1に振り分け、行動パターンが行動パターンXに類似しない比較ユーザをクラスタX-2に振り分ける。
The
そして、情報処理装置100は、所定の行動に紐づく各ユーザU-2の分類結果に基づいて、第2リスト情報LTの信頼性を評価する。たとえば、情報処理装置100は、第2リスト情報LTにおける所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報LTの信頼性を評価する。なお、第2リスト情報LTにおける所定の順位層は、情報処理装置100のオペレータが任意に設定できる。
Then, the
具体的には、情報処理装置100は、第2リスト情報LTにおいて、スコア順位が1位~10位までの順位層に位置する各ユーザU-2が、クラスタX-1に振り分けられる割合である振分率を算出する。次に、たとえば、情報処理装置100は、算出した振分率が、予め規定される信頼性判定閾値以上であると判定した場合、第2リスト情報LTにおいて、スコア順位が1位~10位までの順位層に位置する各ユーザU-2と、所定の行動との関連性について信頼性ありとする判定結果を導出する。
Specifically, the
図2に示す例では、信頼性判定閾値が含有率90%に設定されており、スコア順位が1位~10位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が90%である場合が示されている。このため、情報処理装置100は、第2リスト情報LTの1位~10位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性ありとする判定結果を導出することになる。
In the example shown in FIG. 2, the reliability determination threshold is set to a content rate of 90%, and each user U-2 whose score rank is located in a ranking layer from 1st to 10th is assigned to cluster X-1. A case where the ratio (distribution rate) is 90% is shown. Therefore, the
一方、図2に示す例では、スコア順位が11位~20位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が60%である場合が示されている。このため、情報処理装置100は、第2リスト情報LTの11位~20位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性なしとする判定結果を導出することになる。
On the other hand, in the example shown in FIG. 2, the proportion (distribution rate) of each user U-2 whose score ranks are located in the 11th to 20th ranks is 60%. It is shown. Therefore, the
また、情報処理装置100は、複数の行動パターンを用いて、行動パターンごとに各ユーザU-2を複数のクラスタに分類してもよい。そして、情報処理装置100は、複数の行動パターンごとに、第2リスト情報LTにおいて所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報LTの信頼性を評価してもよい。
Further, the
たとえば、図2に示すように、情報処理装置100は、参照ユーザから取得したセンサ情報#EX-2を用いて、参照ユーザの行動のパターン分析を行うことにより、行動パターンXとは別の行動パターンYをさらに特定する。
For example, as shown in FIG. 2, the
続いて、情報処理装置100は、比較ユーザについて、センサ情報#EX-2に対応するセンサ情報をそれぞれ取得し、取得したセンサ情報に基づいて行動のパターン分析を行い、各比較ユーザに対応する行動パターンをそれぞれ取得する。
Next, the
続いて、情報処理装置100は、行動パターンXの場合と同様に、参照ユーザの行動パターンYと、比較ユーザの行動パターンとをそれぞれ照合し、行動パターンの類似性に基づいて、クラスタリングを行う。たとえば、図2に示すように、情報処理装置100は、行動パターンが行動パターンYに類似する比較ユーザをクラスタY-1に振り分け、行動パターンが行動パターンYに類似しない比較ユーザをクラスタY-2に振り分ける。
Subsequently, as in the case of the behavior pattern X, the
そして、情報処理装置100は、行動パターンXおよび行動パターンYのそれぞれについて、第2リスト情報LTにおいて所定の順位層に位置する各ユーザU-2が同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報LTの信頼性を評価する。
Then, the
図2に示す例では、スコア順位が1位~10位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が90%であり、また、クラスタY-1に振り分けられる割合が90%である場合が示されている。この場合、情報処理装置100は、行動パターンXおよび行動パターンYの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしているので、第2リスト情報LTの1位~10位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性ありとする判定結果を導出する。
In the example shown in FIG. 2, the proportion (distribution rate) at which each user U-2 whose score rank ranks from 1st to 10th is assigned to cluster X-1 is 90%, and A case is shown in which the ratio of allocation to Y-1 is 90%. In this case, the
一方、図2に示す例では、スコア順位が11位~20位までの順位層に位置する各ユーザU-2がクラスタX-1に振り分けられる割合(振分率)が60%であり、また、クラスタY-1に振り分けられる割合が80%である場合が示されている。この場合、情報処理装置100は、行動パターンXおよび行動パターンYの各行動パターンの双方について、比較ユーザの振分率が信頼性判定閾値を満たしていないので、第2リスト情報LTの11位~20位までの順位層に位置する各ユーザU-2と所定の行動との関連性について、信頼性なしとする判定結果を導出する。
On the other hand, in the example shown in FIG. 2, the proportion (distribution rate) of each user U-2 whose score ranks are located in the 11th to 20th ranks is 60%, and , a case is shown in which the ratio of allocation to cluster Y-1 is 80%. In this case, the
なお、情報処理装置100は、参照ユーザの行動パターンと、比較ユーザの行動パターンの類似性に基づいて、第2リスト情報の各ユーザU-2を分類する場合に限られない。たとえば、情報処理装置100は、各順位層に位置する各ユーザU-2の行動パターンを、各ユーザU-2に対応するセンサ情報に基づいて個別に特定する。そして、情報処理装置100は、特定した各行動パターンを総当たりで比較し、各行動パターンが相互に類似している各ユーザU-2を同一のクラスタに分類してもよい。この場合、情報処理装置100は、各クラスタに含まれる順位がまとまるように、分類時のパラメータを自動的に設定してもよい。たとえば、情報処理装置100は、各クラスタに分類される順位の数(すなわち、ユーザの数)が所定の下限閾値を下回る場合には、行動パターン間の類似性を判定するための閾値をより低い値に再調整する。また、情報処理装置100は、各クラスタに分類される順位の数(すなわち、ユーザの数)が所定の上限閾値を上回る場合には、行動パターン間の類似性を判定するための閾値をより高い値に再調整する。
Note that the
また、情報処理装置100は、センサ情報を用いて特定される行動パターンの類似性に基づいて、各ユーザU-2を複数のクラスタに分類する場合に限られず、センサ情報そのものの共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。たとえば、情報処理装置100は、加速度センサにより検出される加速度情報や、ジャイロセンサにより検出される傾きの情報や、タッチパネルにより取得される操作情報や、照度センサにより取得される照度情報や、気圧センサにより取得される気圧情報や、マイクにより取得される音情報などの共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。
Furthermore, the
また、情報処理装置100は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。たとえば、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に撮影された画像情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。また、所定の行動が所定の店舗へ来店するという行為である場合、所定の店舗へ来店した日に記録された音情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。また、情報処理装置100は、行動パターンを特定する際、所定の行動と関連性を有するセンサ情報を用いてもよい。つまり、情報処理装置100は、所定の行動と関連性を有するセンサ情報を用いて特定した行動パターンの類似性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。
Further, the
また、情報処理装置100は、センサ情報から推定される各ユーザU-2に関する情報を用いて、各ユーザU-2を複数のクラスタに分類してもよい。センサ情報から推定される情報の一例について説明すると、たとえば、情報処理装置100は、加速度情報や角速度情報から推定される動作状態の情報や、音情報から抽出した環境音から推定される環境(場所)の情報や、気圧情報から推定される天候や高度の情報などが想定される。情報処理装置100は、これらの情報の共通性に基づいて、各ユーザU-2を複数のクラスタに分類してもよい。
Further, the
なお、情報処理装置100は、第2リスト情報の信頼性の評価結果を示す情報をオペレータに対して視認可能に提供してもよい。このとき、情報処理装置100は、第2リスト情報に含まれる各ユーザU-2の分類に用いたセンサ情報や、センサ情報に基づく行動パターンの情報を合わせて提供できる。
Note that the
[3.情報処理装置の構成]
図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置の構成例を示す図である。
[3. Configuration of information processing device]
The configuration of the
図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを備える。なお、図3は、情報処理装置100の構成例を示すものであり、図3に示す形態には限られず、図3に示す以外の他の機能部を備える形態であってもよい。
As shown in FIG. 3, the
(通信部110)
通信部110は、例えば、ネットワークNと有線または無線で接続され、ネットワークNを介して、端末装置10などの他の装置との間で情報の送受信を行う。通信部110は、例えば、NIC(Network Interface Card)やアンテナなどによって実現される。ネットワークNは、LAN(Local Area Network)や、WAN(Wide Area Network)や、電話網(携帯電話網や固定電話網など)や、地域IP(Internet Protocol)網や、インターネットなどの通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。
(Communication Department 110)
The communication unit 110 is connected to the network N by wire or wirelessly, for example, and transmits and receives information to and from other devices such as the
通信部110は、端末装置10から、撮影画像などの情報を受信する。また、通信部110は、提案情報を端末装置10に送信する。
The communication unit 110 receives information such as captured images from the
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子、または、ハードディスクや光ディスクなどの記憶装置によって実現される。記憶部120は、制御部130の各部により実行される情報処理を実現するためのプログラム及びデータを記憶する。
(Storage unit 120)
The
図3に示すように、記憶部120は、第1リスト情報記憶部121と、第2リスト情報記憶部122と、ユーザ情報記憶部123とを有する。
As shown in FIG. 3, the
(第1リスト情報記憶部121)
第1リスト情報記憶部121には、第1リスト情報が任意の形式で記憶されている。第1リスト情報は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した情報である。図4は、実施形態に係る第1リスト情報の概要を示す図である。
(First list information storage unit 121)
The first list
図4に示すように、第1リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。第1リスト情報は、「検索クエリ」の項目と、「スコア」の項目とを有する。第1リスト情報が有するこれらの項目は、相互に対応付けられている。 As shown in FIG. 4, the first list information is provided for each predetermined action that is set in advance when the first list information is created. The first list information includes a "search query" item and a "score" item. These items included in the first list information are associated with each other.
「検索クエリ」の項目には、所定の行動を行ったシードユーザにより入力された検索クエリの情報が記憶される。また、「スコア」の項目には、検索クエリと所定の行動との間の関係性を示すスコアの情報が記憶される。 The "search query" item stores information on a search query input by a seed user who has performed a predetermined action. Further, in the "Score" item, score information indicating the relationship between the search query and a predetermined action is stored.
(第2リスト情報記憶部122)
第2リスト情報記憶部122には、第2リスト情報が任意の形式で記憶されている。第2リスト情報は、シードユーザ以外の各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした情報である。図5は、実施形態に係る第2リスト情報の概要を示す図である。
(Second list information storage unit 122)
The second list
図5に示すように、第2リスト情報は、第1リスト情報の作成時に予め設定される所定の行動ごとに設けられる。また、図5に示すように、第2リスト情報は、「順位」の項目と、「ユーザID」の項目と、「検索クエリ」の項目とを有する。第2リスト情報が有するこれらの項目は相互に対応付けられている。 As shown in FIG. 5, the second list information is provided for each predetermined action that is set in advance when the first list information is created. Further, as shown in FIG. 5, the second list information includes a "rank" item, a "user ID" item, and a "search query" item. These items included in the second list information are associated with each other.
「順位」の項目には、シードユーザ以外のユーザが入力した複数の検索クエリひとつひとつについて、対応付けられたスコアを第1リスト情報から取得し、取得したスコアの合計値により順位付けを行った順位の情報が記憶される。 In the "rank" item, for each of the multiple search queries entered by users other than the seed user, the associated score is obtained from the first list information, and the ranking is determined based on the total value of the obtained scores. information is stored.
「ユーザID」には、各種サービスの提供に際して、各種サービスを利用するユーザを識別するために、情報処理装置100によりユーザごとに個別に付与される識別情報が記憶される。なお、図5に示す例に限られず、「ユーザID」の項目には、順位が同じ複数のユーザIDが記憶され得る。
The "user ID" stores identification information that is individually assigned to each user by the
「検索クエリ」の項目には、「ユーザID」の項目に記憶されている識別情報に紐づく各ユーザが入力した検索クエリの情報が記憶される。 The "Search Query" item stores information on a search query input by each user that is associated with the identification information stored in the "User ID" item.
(ユーザ情報記憶部123)
ユーザ情報記憶部123には、各ユーザから提供されるセンサ情報などのユーザ情報が任意の形式で記憶されている。図6は、実施形態に係るユーザ情報の概要を示す図である。
(User information storage unit 123)
The user
図6に示すように、ユーザ情報は、「ユーザID」の項目や、「センサ情報」の項目などを有する。 As shown in FIG. 6, the user information includes items such as "user ID" and "sensor information."
「ユーザID」の項目には、センサ情報の提供元であるユーザに付与されている識別情報が記憶される。「ユーザID」の項目に記憶される識別情報は、図5に例示する第2リスト情報において「ユーザID」の項目に記憶される識別情報に対応する。 The “user ID” item stores identification information given to a user who is a provider of sensor information. The identification information stored in the "User ID" item corresponds to the identification information stored in the "User ID" item in the second list information illustrated in FIG.
「センサ情報」の項目には、各ユーザから提供されるセンサ情報が記憶される。なお、「センサ情報」の項目に記憶されるセンサ情報は、各ユーザから提供された生データであってもよいし、正規化などの処理を施して処理しやすいように加工した情報であってもよい。 The "sensor information" item stores sensor information provided by each user. Note that the sensor information stored in the "sensor information" item may be raw data provided by each user, or may be information processed such as normalization to make it easier to process. Good too.
なお、ユーザ情報記憶部123は、「ユーザID」の項目などに対応付けて、センサ情報から推定される情報を記憶してもよい。
Note that the user
(制御部130)
図3に示す制御部130は、情報処理装置100を制御するコントローラ(controller)である。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、GPU(Graphics Processing Unit)などによって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(例えば、情報処理プログラム)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現されてもよい。
(Control unit 130)
The
図3に示すように、制御部130は、第1生成部131と、第2生成部132と、分類部133と、評価部134とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
As shown in FIG. 3, the
(第1生成部131)
第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。
(First generation unit 131)
The
(第2生成部132)
第2生成部132は、シードユーザ以外の各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値(スコア)に基づいて各ユーザを順位付けした第2リスト情報を生成する。
(Second generation unit 132)
The
(分類部133)
分類部133は、各ユーザのセンサ情報の共通性に基づいて、所定の行動に紐づく各ユーザを複数のクラスタに分類する。たとえば、分類部133は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類できる。また、たとえば、分類部133は、センサ情報から推定される各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類できる。
(Classification unit 133)
The
(評価部134)
評価部134は、分類部133による分類結果を用いて、第2リスト情報の信頼性を評価する。たとえば、評価部134は、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報の信頼性を評価できる。
(Evaluation unit 134)
The
また、評価部134は、分類部133により、複数の行動パターンを用いて行動パターンごとに各ユーザが複数のクラスタに分類された場合、複数の行動パターンごとに、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報の信頼性を評価できる。
Furthermore, when the
[4.処理手順]
以下、図7を用いて、実施形態に係る情報処理装置100による処理手順について説明する。図7は、実施形態に係る情報処理装置による処理手順の一例を示すフローチャートである。図7に示す処理手順は、情報処理装置100の制御部130により実行される。図7に示す処理手順は、情報処理装置100の稼働中、繰り返し実行される。
[4. Processing procedure]
Hereinafter, a processing procedure by the
図7に示すように、分類部133は、オペレータの操作に応じて、所定の行動を設定する(ステップS101)。
As shown in FIG. 7, the
続いて、分類部133は、ステップS101で設定した所定の行動に関する第2リスト情報を第2リスト情報記憶部122から取得するとともに、ステップS101で設定した所定の行動に関するセンサ情報をユーザ情報記憶部123から取得する(ステップS102)。
Subsequently, the
続いて、分類部133は、ステップS102で取得したセンサ情報の共通性に基づいて、ステップS102で取得した第2リスト情報内の各ユーザを複数のクラスタに分類する(ステップS103)。
Subsequently, the
そして、評価部134は、分類部133による分類結果に基づいて、第2リスト情報の信頼性を評価して(ステップS104)、図7に示す処理手順を終了する。
Then, the
[5.変形例]
上述した情報処理装置100は、上述した実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
[5. Modified example]
The
(5-1.第1リスト情報および第2リスト情報について)
上述した実施形態において、情報処理装置100は、複数の所定の行動それぞれについて第1リスト情報および第2リスト情報を生成する例を説明したが、この例には特に限定される必要はない。たとえば、情報処理装置100は、ターゲットとするユーザの行動以外のコンテキスト(たとえば、デモグラフィック属性や興味嗜好など)に基づいて、第1リスト情報および第2リスト情報を作成してもよい。
(5-1. Regarding first list information and second list information)
In the embodiment described above, an example has been described in which the
(5-2.クラスタの構成ユーザについて)
上述の実施形態において、情報処理装置100は、分類部133により分類されたクラスタの情報、たとえば、クラスタの構成ユーザの情報を記録してもよい。そして、所定のタイミングで、情報処理装置100は、第1リスト情報および第2リスト情報を更新し、更新した第2リスト情報に基づいて各ユーザのクラスタを作成して、作成したクラスタの構成ユーザと、記録済みのクラスタの構成ユーザとの間に大幅な変化がないかどうかを確かめてもよい。また、情報処理装置100は、クラスタの構成ユーザにシードユーザが含まれているかどうかを確かめてもよい。
(5-2. Regarding cluster configuration users)
In the embodiment described above, the
[6.ハードウェア構成]
実施形態に係る情報処理装置100は、たとえば、図8に示すような構成のコンピュータ1000によって実現される。図8は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
[6. Hardware configuration]
The
コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
The
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
The arithmetic unit 1030 operates based on programs stored in the primary storage device 1040 and the
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェイスであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to the output device 1010 that outputs various information such as a monitor or printer, and is, for example, a USB (Universal Serial Bus), a DVI (Digital Visual Interface), This is realized using a connector compliant with standards such as HDMI (registered trademark) (High Definition Multimedia Interface). Further, the input IF 1070 is an interface for receiving information from
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
Note that the
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 Network IF 1080 receives data from other devices via network N and sends it to computing device 1030, and also sends data generated by computing device 1030 to other devices via network N.
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
Arithmetic device 1030 controls output device 1010 and
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)を実行することにより、制御部130と同様の機能を実現する。すなわち、演算装置1030は、一次記憶装置1040上にロードされたプログラム(たとえば、情報処理プログラム)との協働により、実施形態に係る情報処理装置100による処理を実現する。
For example, when the
[7.その他]
上述した実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[7. others]
Among the processes described in the embodiments described above, all or part of the processes described as being performed automatically can be performed manually, or all of the processes described as being performed manually can be performed manually. Alternatively, some of the steps can be performed automatically using known methods. In addition, information including the processing procedures, specific names, and various data and parameters shown in the above documents and drawings may be changed arbitrarily, unless otherwise specified.
上述の実施形態において、情報処理装置100による情報処理方法(たとえば、図7参照)を実現するために、情報処理装置100が有する制御部130の各部(第1生成部131、第2生成部132、分類部133、及び評価部134)に対応する処理機能は、情報処理装置100に予めインストールされている情報処理プログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて、専用の提供プログラムとして柔軟に記述することにより実現されてもよい。
In the embodiment described above, in order to realize the information processing method by the information processing apparatus 100 (for example, see FIG. 7), each part of the control unit 130 (the
また、情報処理装置100は、各ユーザの情報として、各ユーザが入力した検索クエリの履歴だけでなく、各ユーザの購買履歴、電子商店街で閲覧した取引対象の履歴、購入した取引対象の履歴である購買履歴、閲覧したニュース等のコンテンツの履歴である閲覧履歴、SNS(Social Networking Service)に投稿したテキストや画像等の履歴である投稿履歴、位置履歴などを収集してもよい。また、情報処理装置100は、たとえば、各ユーザが保有するスマートフォンを用いて店舗に設置されたQRコード(登録商標)を読み取り、読み取り結果を用いて実現する決済サービスの利用履歴や、各ユーザが保有するスマートフォンにQRコードを表示させ、かかるQRコードを店舗端末が読み込むことで行われる決済サービスの利用履歴(たとえば、購入日時や購入商品、購入額など)を収集してもよい。また、情報処理装置100は、各ユーザが保有するクレジットカードの利用履歴や銀行口座の利用履歴などを収集してもよい。
The
また、情報処理装置100は、収集した情報に基づいて推定された情報を各ユーザの情報としてもよい。たとえば、情報処理装置100は、購買履歴から、毎月の食料品の平均的な購入総額が10万円以上である場合、たとえば、世帯月収若しくは個人月収が30万円以上であるといった収入や、3人家族であるといった家族構成、もしくは同居人構成などを推定し、各ユーザの情報としてもよい。また、情報処理装置100は、たとえば、位置履歴や購入履歴から、各ユーザが所有する物品や、各ユーザの居住地や職場などを推定し、推定した情報を各ユーザの情報としてもよい。
Further, the
また、情報処理装置100は、たとえば、各種サービスを提供するサーバ装置から、サービスの利用履歴を各ユーザの情報として取得してもよい。また、情報処理装置100は、このようなサービスを提供するサーバ装置もしくは単独のサーバ装置が、サービスの利用履歴から推定した各種情報を各ユーザの情報として収集してもよい。また、情報処理装置100は、各ユーザが登録、又は各ユーザについて推定された各種のジオグラフィック属性や趣味嗜好といったサイコグラフィック属性を示す情報を各ユーザの情報として収集してもよい。
Further, the
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。たとえば、制御部130の分類部133と評価部134とは機能的に統合されていてもよい。
Furthermore, each component of each device shown in the drawings is functionally conceptual, and does not necessarily need to be physically configured as shown in the drawings. In other words, the specific form of distributing and integrating each device is not limited to what is shown in the diagram, and all or part of the devices can be functionally or physically distributed or integrated in arbitrary units depending on various loads and usage conditions. Can be integrated and configured. For example, the
また、上述の実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modified examples can be combined as appropriate within the range that does not conflict with the processing contents.
[8.効果]
上述の実施形態に係る情報処理装置100は、第1生成部131と、第2生成部132と、分類部133と、評価部134とを備える。第1生成部131は、所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと所定の行動との間の関係性を数値化した第1リスト情報を生成する。第2生成部132は、シードユーザを含む各ユーザが入力した検索クエリと、第1リスト情報とに基づいて、所定の行動と各ユーザとの関係性を数値化し、数値化した関係性を示す値に基づいて各ユーザを順位付けした第2リスト情報を生成する。分類部133は、各ユーザのセンサ情報の共通性に基づいて、各ユーザを複数のクラスタに分類する。評価部134は、分類部133による分類結果を用いて、第2リスト情報の信頼性を評価する。
[8. effect]
The
このようなことから、実施形態に係る情報処理装置100は、たとえば、第2リスト情報に含まれる各ユーザを検索クエリとは無関係のセンサ情報に基づいてクラスタリングすることにより、第2リスト情報に含まれる各ユーザが一定の関連性を有するかを客観的に確かめることができ、第2リスト情報の信頼性を間接的に評価できる。
For this reason, the
また、実施形態に係る情報処理装置100において、評価部134は、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、第2リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置100は、たとえば、第2リスト情報において、どの順位までのユーザが所定の行動との関係性を有するのかについて確かめることができる。
Furthermore, in the
また、実施形態に係る情報処理装置100において、分類部133は、センサ情報を用いて特定される各ユーザの行動パターンの類似性に基づいて、各ユーザを複数のクラスタに分類する。これにより、実施形態に係る情報処理装置100は、各ユーザの具体的な行動内容が類似する各ユーザを同一のクラスタに分類できる。
Furthermore, in the
また、実施形態に係る情報処理装置100において、分類部133は、複数の行動パターンを用いて、行動パターンごとに各ユーザを複数のクラスタに分類し、評価部134は、複数の行動パターンごとに、第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、第2リスト情報の信頼性を評価する。これにより、実施形態に係る情報処理装置100は、信頼性の評価精度を高めることができる。
Furthermore, in the
また、実施形態に係る情報処理装置100において、分類部133は、所定の行動と関連性を有するセンサ情報を用いて、各ユーザを複数のクラスタに分類する。
Furthermore, in the
また、実施形態に係る情報処理装置100において、分類部133は、センサ情報から推定される前記各ユーザに関する情報を用いて、各ユーザを複数のクラスタに分類する。
Furthermore, in the
これらにより、実施形態に係る情報処理装置100は、様々な基準で各ユーザを分類できる。
With these, the
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As mentioned above, the embodiments of the present application have been described in detail based on several drawings, but these are merely examples, and various modifications and variations can be made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure section of the invention. It is possible to carry out the invention in other forms with modifications.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means", "circuit", etc. For example, the control section can be read as a control means or a control circuit.
10 端末装置
100 情報処理装置
110 通信部
120 記憶部
121 第1リスト情報記憶部
122 第2リスト情報記憶部
123 ユーザ情報記憶部
130 制御部
131 第1生成部
132 第2生成部
133 分類部
134 評価部
10
Claims (8)
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成部と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類部と、
前記分類部による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価部と
を備えることを特徴とする情報処理装置。 First list information that quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by a plurality of seed users who have performed a predetermined behavior. a first generation unit that generates;
Based on a search query input by each user including the seed user and the first list information, the relationship between the predetermined action and each user is quantified, and a value indicating the quantified relationship is set. a second generation unit that generates second list information ranking each user based on the second list information;
a classification unit that classifies each user into a plurality of clusters based on the commonality of sensor information of each user;
An information processing device comprising: an evaluation section that evaluates reliability of the second list information using classification results by the classification section.
前記第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合を導出し、導出した割合に基づいて、前記第2リスト情報の信頼性を評価する
ことを特徴とする請求項1に記載の情報処理装置。 The evaluation department is
The method is characterized by deriving a proportion of users located in a predetermined ranking layer in the second list information and being assigned to the same cluster, and evaluating reliability of the second list information based on the derived proportion. The information processing device according to claim 1.
前記センサ情報を用いて特定される前記各ユーザの行動パターンの類似性に基づいて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1又は2に記載の情報処理装置。 The classification section is
The information processing device according to claim 1 or 2, wherein each of the users is classified into a plurality of clusters based on similarity of behavior patterns of each of the users identified using the sensor information.
複数の前記行動パターンを用いて、前記行動パターンごとに前記各ユーザを複数のクラスタに分類し、
前記評価部は、
複数の前記行動パターンごとに、前記第2リスト情報において所定の順位層に位置する各ユーザが同一のクラスタに振り分けられる割合をそれぞれ導出し、導出した各割合を総合的に勘案して、前記第2リスト情報の信頼性を評価する
ことを特徴とする請求項3に記載の情報処理装置。 The classification section is
Classifying each user into a plurality of clusters for each of the behavioral patterns using the plurality of behavioral patterns,
The evaluation department is
For each of the plurality of behavioral patterns, the proportion of each user located in a predetermined ranking layer in the second list information is assigned to the same cluster is derived, and the derived proportions are comprehensively taken into consideration. 4. The information processing device according to claim 3, wherein reliability of the 2-list information is evaluated.
前記所定の行動と関連性を有するセンサ情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1~4のいずれか1つに記載の情報処理装置。 The classification section is
The information processing device according to any one of claims 1 to 4, wherein each of the users is classified into a plurality of clusters using sensor information that is related to the predetermined behavior.
前記センサ情報から推定される前記各ユーザに関する情報を用いて、前記各ユーザを複数のクラスタに分類する
ことを特徴とする請求項1~5のいずれか1つに記載の情報処理装置。 The classification section is
The information processing apparatus according to any one of claims 1 to 5, wherein the information processing apparatus classifies each user into a plurality of clusters using information regarding each user estimated from the sensor information.
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成工程と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成工程と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類工程と、
前記分類工程による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価工程と
を含むことを特徴とする情報処理方法。 An information processing method performed by a computer, the method comprising:
First list information that quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by a plurality of seed users who have performed a predetermined behavior. a first generation step of generating;
Based on a search query input by each user including the seed user and the first list information, the relationship between the predetermined action and each user is quantified, and a value indicating the quantified relationship is set. a second generation step of generating second list information ranking each of the users based on the
a classification step of classifying each of the users into a plurality of clusters based on the commonality of the sensor information of each of the users;
and an evaluation step of evaluating reliability of the second list information using the classification results obtained in the classification step.
所定の行動を行った複数のシードユーザが入力した検索クエリの共通性に基づいて、各シードユーザが入力した検索クエリと前記所定の行動との間の関係性を数値化した第1リスト情報を生成する第1生成手順と、
前記シードユーザを含む各ユーザが入力した検索クエリと、前記第1リスト情報とに基づいて、前記所定の行動と前記各ユーザとの関係性を数値化し、数値化した前記関係性を示す値に基づいて前記各ユーザを順位付けした第2リスト情報を生成する第2生成手順と、
前記各ユーザのセンサ情報の共通性に基づいて、前記各ユーザを複数のクラスタに分類する分類手順と、
前記分類手順による分類結果を用いて、前記第2リスト情報の信頼性を評価する評価手順と
を実行させることを特徴とする情報処理プログラム。 to the computer,
First list information that quantifies the relationship between the search query input by each seed user and the predetermined behavior based on the commonality of the search queries input by a plurality of seed users who have performed a predetermined behavior. a first generation procedure for generating;
Based on a search query input by each user including the seed user and the first list information, the relationship between the predetermined action and each user is quantified, and a value indicating the quantified relationship is set. a second generation procedure of generating second list information in which each of the users is ranked based on the second list information;
a classification procedure for classifying each user into a plurality of clusters based on the commonality of sensor information of each user;
and an evaluation procedure for evaluating reliability of the second list information using classification results obtained by the classification procedure.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021150449A JP7354195B2 (en) | 2021-09-15 | 2021-09-15 | Information processing device, information processing method, and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021150449A JP7354195B2 (en) | 2021-09-15 | 2021-09-15 | Information processing device, information processing method, and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023042995A JP2023042995A (en) | 2023-03-28 |
JP7354195B2 true JP7354195B2 (en) | 2023-10-02 |
Family
ID=85724359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021150449A Active JP7354195B2 (en) | 2021-09-15 | 2021-09-15 | Information processing device, information processing method, and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7354195B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080281809A1 (en) | 2007-05-10 | 2008-11-13 | Microsoft Corporation | Automated analysis of user search behavior |
US20080281808A1 (en) | 2007-05-10 | 2008-11-13 | Microsoft Corporation | Recommendation of related electronic assets based on user search behavior |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5481295B2 (en) * | 2010-07-15 | 2014-04-23 | エヌ・ティ・ティ・コムウェア株式会社 | Object recommendation device, object recommendation method, object recommendation program, and object recommendation system |
JP5577385B2 (en) * | 2012-06-26 | 2014-08-20 | ヤフー株式会社 | Content distribution device |
JP2017068765A (en) * | 2015-10-01 | 2017-04-06 | 株式会社Sassor | Information processing method, information processing device and program |
JP7231322B2 (en) * | 2017-07-13 | 2023-03-01 | ヤフー株式会社 | LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM |
-
2021
- 2021-09-15 JP JP2021150449A patent/JP7354195B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080281809A1 (en) | 2007-05-10 | 2008-11-13 | Microsoft Corporation | Automated analysis of user search behavior |
US20080281808A1 (en) | 2007-05-10 | 2008-11-13 | Microsoft Corporation | Recommendation of related electronic assets based on user search behavior |
Also Published As
Publication number | Publication date |
---|---|
JP2023042995A (en) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10937089B2 (en) | Machine learning classification and prediction system | |
KR101955508B1 (en) | Recommending additional users for an event using a social networking system | |
US8583471B1 (en) | Inferring household income for users of a social networking system | |
US20140172545A1 (en) | Learned negative targeting features for ads based on negative feedback from users | |
TW201610884A (en) | Advertisement method and apparatus using user analyzing platform and marketing platform based on cohort | |
JP2009193465A (en) | Information processor, information providing system, information processing method, and program | |
JP2017534124A (en) | Use of visitor metrics by ad targeting criteria | |
JP6899805B2 (en) | Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. | |
JP2021089485A (en) | Advertisement notification system, advertisement notification method, and information processing device | |
KR102218235B1 (en) | method and system for providing customized advertisement service | |
KR102193737B1 (en) | System for displaying personalized advertisements based on social networks | |
Ibrahim et al. | Extracting behavioural features from smartphone notifications | |
JP7354195B2 (en) | Information processing device, information processing method, and information processing program | |
JP6320353B2 (en) | Digital marketing system | |
KR102218238B1 (en) | method and apparatus for recommending advertisements using information obtained through Social Network Service | |
JP7174743B2 (en) | Information selection device, information selection method and information selection program | |
JP7418379B2 (en) | Information processing device, information processing method, and information processing program | |
JP6910515B1 (en) | Analytical instruments, analytical methods and analytical programs | |
JP7407779B2 (en) | Information processing device, information processing method, and information processing program | |
JP6043840B1 (en) | Classification device, classification method, and classification program | |
JP2022087835A (en) | Community categorization method, computer program, and computer device | |
JP7419313B2 (en) | Information processing device, information processing method, and information processing program | |
JP7453191B2 (en) | Information processing device, information processing method, and information processing program | |
JP7260439B2 (en) | Extraction device, extraction method and extraction program | |
KR102218236B1 (en) | Online advertising system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220916 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230825 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7354195 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |