JP6278918B2 - データ解析装置、方法、及びプログラム - Google Patents
データ解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6278918B2 JP6278918B2 JP2015056581A JP2015056581A JP6278918B2 JP 6278918 B2 JP6278918 B2 JP 6278918B2 JP 2015056581 A JP2015056581 A JP 2015056581A JP 2015056581 A JP2015056581 A JP 2015056581A JP 6278918 B2 JP6278918 B2 JP 6278918B2
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- matrix
- user
- feature matrix
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
ユーザ商品情報テーブル81は、図6に示すように、ユーザIDフィールド、商品IDフィールド、及び購買数フィールドを有する。ユーザIDフィールドは、ユーザ商品情報処理部30により追加されたユーザを特定する識別子が設定される。商品IDフィールドは、後述するユーザ商品情報処理部30により追加されたユーザの購入した商品を特定する識別子が設定される。購買数フィールドは、ユーザ商品情報処理部30により1、又は当該商品の当該ユーザの購入数が設定される。なお、購買数の値には0または正の整数値を設定できるが、負の数を設定することはできない。
属性商品情報テーブル82は、図7に示すように、属性IDフィールド、商品IDフィールド、及び購買数フィールドを有する。属性IDフィールドは、後述する属性商品情報処理部32により追加された属性を特定する識別子が設定される。商品IDフィールドは、属性商品情報処理部32により追加された商品を特定する識別子が設定される。購買数フィールドは、属性商品情報処理部32により1、または当該商品の当該属性の購入数が設定される。なお、購買数の値には0又は正の整数値を設定できるが、負の数を設定することはできない。
ユーザ属性情報テーブル83は、図8に示すように、ユーザIDフィールド、属性IDフィールド、及び所属値フィールドを有する。ユーザIDフィールドは、後述するユーザ属性情報処理部34によりユーザを特定する識別子が設定される。属性IDフィールドは、ユーザ属性情報処理部34により属性を特定する識別子が設定される。所属値フィールドには、ユーザ属性情報処理部34によって当該ユーザが当該属性に所属する場合には1、そうでなければ0が設定される。
属性人数情報テーブル84は、図9に示すように、属性IDフィールド、及び人数値フィールドを有する。属性IDフィールドは、後述する属性人数情報処理部36により属性を特定する識別子が設定される。人数値フィールドには、属性人数情報処理部36によって当該属性に所属するユーザ数が設定される。
属性比率情報テーブル85は、図10に示すように、属性IDフィールド、及び比率値フィールドを有する。属性IDフィールドは、後述する属性比率情報計算部38により属性を特定する識別子が設定される。比率値フィールドには、属性比率情報計算部38によって算出された値が設定される。
ユーザ特徴テーブル86は、図11に示すように、ユーザIDフィールドと、クラスタIDフィールドと、ユーザ特徴値フィールドとを有する。ユーザIDフィールドには、後述する特徴行列推定部40によりユーザを特定する識別子が設定される。クラスタIDフィールドには、特徴行列推定部40によりクラスタを特定する識別子が設定される。ユーザ特徴値フィールドには、特徴行列推定部40により算出された当該ユーザの当該クラスタに対する特徴値が設定される。
商品特徴テーブル87は、図12に示すように、商品IDフィールドと、クラスタIDフィールドと、商品特徴値フィールドとを有する。商品IDフィールドには、特徴行列推定部40により商品を特定する識別子が設定される。クラスタIDフィールドには、特徴行列推定部40によりクラスタを特定する識別子が設定される。商品特徴値フィールドには、特徴行列推定部40により算出された当該商品の当該クラスタに対する特徴値が設定される。
属性特徴テーブル88は、図13に示すように、属性IDフィールドと、クラスタIDフィールドと、属性特徴値フィールドとを有する。属性IDフィールドには、特徴行列推定部40により属性を特定する識別子が設定される。クラスタIDフィールドには、特徴行列推定部40によりクラスタを特定する識別子が設定される。属性特徴値フィールドには、特徴行列推定部40により算出された当該属性の当該クラスタに対する特徴値が設定される。
ユーザ商品情報処理部30は、入力部1によって受け付けたユーザ商品行列Xに基づいて、ユーザID毎及び商品ID毎の購買数を、記憶部2のユーザ商品情報テーブル81に格納する。また、ユーザ商品情報テーブル81を更新するときにユーザ商品情報処理部30は、記憶部2に格納されたユーザ商品情報テーブル81に、追加されたユーザ、商品、購入数に応じて、ユーザIDフィールド、商品IDフィールド、及び購入数フィールドの値を設定した行を挿入する。なお、ユーザ商品情報処理部30による更新のタイミングは、例えば、システム管理者が外部装置200から供給されるデータをもとに手動で管理できるようにしてもよいし、新たな購買が発生した場合に外部装置200が自動的に処理を起動するようにしてもよい。
属性商品情報処理部32は、入力部1によって受け付けた属性商品行列Yに基づいて、属性ID毎及び商品ID毎の購買数を、記憶部2の属性商品情報テーブル82に格納する。また、属性商品情報テーブル82を更新するときに、属性商品情報処理部32は、記憶部2に格納された属性商品情報テーブル82に、追加された属性、商品、購入数に応じて、属性IDフィールド、商品IDフィールド、購買数フィールドの値を設定した行を挿入する。なお、属性商品情報処理部32による属性商品情報更新のタイミングは、例えば、外部装置200から供給されるPOSデータをもとにシステム管理者が手動で管理できるようにしてもよいし、新たな購買が発生した場合に外部装置200から自動的に処理を起動するようにしてもよい。
ユーザ属性情報処理部34は、入力部1によって受け付けたユーザ属性行列Vに基づいて、ユーザID毎及び属性ID毎の所属値を、記憶部2のユーザ属性情報テーブル83に格納する。
属性人数情報処理部36は、個々を識別不能な第2のユーザ群についての属性kを有するユーザ数を表す要素wkを持つK次元の属性人数ベクトルWに基づいて、属性ID毎の人数値を、記憶部2の属性人数情報テーブル84に格納する。また、属性人数情報テーブル84を更新するときに、属性人数情報処理部36は、記憶部2に格納された属性人数情報テーブル84に、追加された属性とその人数に応じて、属性IDフィールド、及び人数値フィールドの値を設定した行を挿入する。なお、属性人数情報処理部36によるユーザ属性情報更新のタイミングは、例えば外部装置200から供給されるPOSデータをもとにシステム管理者が手動で管理できるようにしてもよいし、新たな商品が出現した場合に外部装置200から自動的に処理を起動するようにしてもよい。
属性比率情報計算部38は、ユーザ属性行列Vと、属性人数ベクトルWとに基づいて、第2のユーザ群についての属性kを有するユーザ数と第1のユーザ群についての属性kを有するユーザ数との比率を表す要素pkkを持つ属性比率行列Pを計算する。
特徴行列推定部40は、以下に説明するように、ユーザ商品行列X、属性商品行列Y、ユーザ属性行列V、属性比率行列P、ユーザ特徴テーブル86に格納されたユーザ特徴行列A、商品特徴テーブル87に格納された商品特徴行列B、及び属性特徴テーブル88に格納された属性特徴行列Cに基づいて、属性特徴行列Cが、属性比率行列Pとユーザ属性行列Vとユーザ特徴行列Aとで表される、PVTA=Cの線形制約の下で、ユーザ特徴行列A、商品特徴行列B、及び属性特徴行列Cを推定する。なお、特徴行列推定部40の処理は、例えば、外部装置200から特徴出力のリクエストが入力されたときや、予め定めた定期処理などにより、任意のタイミングで実行すればよい。
特徴行列処理部44は、特徴行列推定部40の更新処理が終了した場合に、記憶部2に格納された更新済みの各テーブルの値を出力する。例えば、外部装置200から特徴出力のリクエストが入力された場合に実行すればよい。出力は全特徴を出力する場合には、ユーザ特徴テーブル86、商品特徴テーブル87、及び属性特徴テーブル88の全ての行を出力すればよい。また、クラスタの商品特徴のみを利用する場合には、例えばリクエストの引数をクラスタIDとして、商品特徴テーブル87から、当該クラスタIDを持つ行の商品IDフィールド、商品特徴値フィールドを出力した後、商品特徴値フィールドの値の大きい順に商品ID10件を表示することで当該クラスタを特徴づける商品を求めることができる。
2 記憶部
3 演算部
4 出力部
30 ユーザ商品情報処理部
32 属性商品情報処理部
34 ユーザ属性情報処理部
36 属性人数情報処理部
38 属性比率情報計算部
40 特徴行列推定部
42 反復判定部
44 特徴行列処理部
81 ユーザ商品情報テーブル
82 属性商品情報テーブル
83 ユーザ属性情報テーブル
84 属性人数情報テーブル
85 属性比率情報テーブル
86 ユーザ特徴テーブル
87 商品特徴テーブル
88 属性特徴テーブル
100 データ解析装置
200 外部装置
Claims (5)
- 個々を識別可能な第1の個体群に含まれる個体i(1≦i≦I,Iは1以上の整数)とオブジェクトj(1≦j≦J,Jは1以上の整数)との関連度を表した要素xijを持つI×Jの個体オブジェクト行列X、及び個々を識別不能な第2の個体群についての、個体の属性k(1≦k≦K,Kは1以上の整数)と前記オブジェクトjとの関連度を表した要素ykjを持つK×Jの属性オブジェクト行列Yを、
前記個体iが、クラスタr(1≦r≦R,Rは1以上の整数)に所属することを表す非負値の要素airを持つI×Rの第1の特徴行列Aと、前記オブジェクトjが、前記クラスタrに所属することを表す非負値の要素bjrを持つJ×Rの第2の特徴行列Bと、前記属性kが、前記クラスタrに所属することを表す非負値の要素ckrを持つK×Rの第3の特徴行列Cと、に分解するデータ解析装置であって、
前記第1の個体群に含まれる前記個体iと前記属性kとの関連度を表した要素vikを持つI×Kの個体属性行列Vと、前記第2の個体群についての前記属性kを有する個体数を表す要素wkを持つK次元の属性ベクトルWとに基づいて、前記第2の個体群についての前記属性kを有する個体の数と前記第1の個体群についての前記属性kを有する個体の数との比率を表す要素pkkを持つ属性比率行列Pを計算する属性比率情報計算部と、
前記個体オブジェクト行列X、前記属性オブジェクト行列Y、前記第1の特徴行列A、前記第2の特徴行列B、及び前記第3の特徴行列Cに基づいて、前記第3の特徴行列Cが、前記属性比率行列Pと前記個体属性行列Vと前記第1の特徴行列Aとで表わされる線形制約の下で、前記第1の特徴行列A、前記第2の特徴行列B、及び前記第3の特徴行列Cを推定する特徴行列推定部と、
予め定められた反復終了条件を満足するまで、前記特徴行列推定部による推定を繰り返す反復判定部と、
を含むデータ解析装置。 - 前記個体オブジェクト行列Xの要素xijは非負値であり、前記属性オブジェクト行列Yの要素ykjは非負値であり、前記第1の特徴行列Aの要素airは非負値であり、前記第2の特徴行列Bの要素bjrは非負値であり、前記第3の特徴行列Cの要素ckrは非負値であり、
前記特徴行列推定部は、非負値分解により、前記第1の特徴行列A、前記第2の特徴行列B、及び前記第3の特徴行列Cを推定する請求項1記載のデータ解析装置。 - 個々を識別可能な第1のユーザ群に含まれるユーザi(1≦i≦I,Iは1以上の整数)による商品j(1≦j≦J,Jは1以上の整数)の購買数を表した要素xijを持つI×Jのユーザ商品行列X、及び個々を識別不能な第2のユーザ群についての、ユーザの属性k(1≦k≦K,Kは1以上の整数)を有するユーザによる前記商品jの購買数を表した要素Ykjを持つK×Jの属性商品行列Yを、
前記ユーザiが、クラスタr(1≦r≦R,Rは1以上の整数)に所属することを表す非負値の要素airを持つI×Rのユーザ特徴行列Aと、前記商品jが、前記クラスタrに所属することを表す非負値の要素bjrを持つJ×Rの商品特徴行列Bと、前記属性kが、前記クラスタrに所属することを表す非負値の要素ckrを持つK×Rの属性特徴行列Cと、に分解するデータ解析装置であって、
前記第1のユーザ群に含まれる前記ユーザiと前記属性kとの関連度を表した要素vikを持つI×Kのユーザ属性行列Vと、前記第2のユーザ群についての前記属性kを有するユーザ数を表す要素wkを持つK次元の属性人数ベクトルWとに基づいて、前記第2のユーザ群についての前記属性kを有するユーザ数と前記第1のユーザ群についての前記属性kを有するユーザ数との比率を表す要素pkkを持つ属性比率行列Pを計算する属性比率情報計算部と、
前記ユーザ商品行列X、前記属性商品行列Y、前記ユーザ特徴行列A、前記商品特徴行列B、及び前記属性特徴行列Cに基づいて、前記属性特徴行列Cが、前記属性比率行列Pと前記ユーザ属性行列Vと前記ユーザ特徴行列Aとで表わされる線形制約の下で、前記ユーザ特徴行列A、前記商品特徴行列B、及び前記属性特徴行列Cを推定する特徴行列推定部と、
予め定められた反復終了条件を満足するまで、前記特徴行列推定部による推定を繰り返す反復判定部と、
を含むデータ解析装置。 - 個々を識別可能な第1の個体群に含まれる個体i(1≦i≦I,Iは1以上の整数)とオブジェクトj(1≦j≦J,Jは1以上の整数)との関連度を表した要素xijを持つI×Jの個体オブジェクト行列X、及び個々を識別不能な第2の個体群についての、個体の属性k(1≦k≦K,Kは1以上の整数)と前記オブジェクトjとの関連度を表した要素Ykjを持つK×Jの属性オブジェクト行列Yを、
前記個体iが、クラスタr(1≦r≦R,Rは1以上の整数)に所属することを表す非負値の要素airを持つI×Rの第1の特徴行列Aと、前記オブジェクトjが、前記クラスタrに所属することを表す非負値の要素bjrを持つJ×Rの第2の特徴行列Bと、前記属性kが、前記クラスタrに所属することを表す非負値の要素ckrを持つK×Rの第3の特徴行列Cと、に分解するデータ解析装置におけるデータ解析方法であって、
属性比率情報計算部が、前記第1の個体群に含まれる前記個体iと前記属性kとの関連度を表した要素vikを持つI×Kの個体属性行列Vと、前記第2の個体群についての前記属性kを有する個体数を表す要素wkを持つK次元の属性ベクトルWとに基づいて、前記第2の個体群についての前記属性kを有する個体の数と前記第1の個体群についての前記属性kを有する個体の数との比率を表す要素pkkを持つ属性比率行列Pを計算するステップと、
特徴行列推定部が、前記個体オブジェクト行列X、前記属性オブジェクト行列Y、前記第1の特徴行列A、前記第2の特徴行列B、及び前記第3の特徴行列Cに基づいて、前記第3の特徴行列Cが、前記属性比率行列Pと前記個体属性行列Vと前記第1の特徴行列Aとで表わされる線形制約の下で、前記第1の特徴行列A、前記第2の特徴行列B、及び前記第3の特徴行列Cを推定するステップと、
反復判定部が、予め定められた反復終了条件を満足するまで、前記特徴行列推定部による推定を繰り返すステップと、
を含むデータ解析方法。 - コンピュータを、請求項1〜請求項3のいずれか1項に記載のデータ解析装置の各部として機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015056581A JP6278918B2 (ja) | 2015-03-19 | 2015-03-19 | データ解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015056581A JP6278918B2 (ja) | 2015-03-19 | 2015-03-19 | データ解析装置、方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016177485A JP2016177485A (ja) | 2016-10-06 |
| JP6278918B2 true JP6278918B2 (ja) | 2018-02-14 |
Family
ID=57069171
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015056581A Expired - Fee Related JP6278918B2 (ja) | 2015-03-19 | 2015-03-19 | データ解析装置、方法、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6278918B2 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6499372B1 (ja) * | 2017-07-31 | 2019-04-10 | 楽天株式会社 | 処理システム、処理装置、処理方法、プログラム、ならびに、情報記録媒体 |
| US11755624B2 (en) * | 2017-07-31 | 2023-09-12 | Rakuten Group, Inc. | Processing system, processing device, processing method, program, and information storage medium |
| JP6829370B2 (ja) * | 2018-09-19 | 2021-02-10 | 株式会社エー・アンド・ビー・コンピュータ | 情報処理装置、情報処理方法、およびコンピュータプログラム |
| JP7767249B2 (ja) * | 2022-09-13 | 2025-11-11 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008102331A2 (en) * | 2007-02-21 | 2008-08-28 | Nds Limited | Method for content presentation |
| JP2013029872A (ja) * | 2009-10-19 | 2013-02-07 | Nec Corp | 情報推薦システム、方法、及び、プログラム |
-
2015
- 2015-03-19 JP JP2015056581A patent/JP6278918B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2016177485A (ja) | 2016-10-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Beck | Estimating grouped data models with a binary-dependent variable and fixed effects via a logit versus a linear probability model: The impact of dropped units | |
| Eppstein et al. | The h-index of a graph and its application to dynamic subgraph statistics | |
| EP3401828B1 (en) | Information processing device, information processing system, information processing method and program | |
| US8458182B2 (en) | Method and system for clustering data arising from a database | |
| CN108665293B (zh) | 特征重要性获取方法及装置 | |
| JP6278918B2 (ja) | データ解析装置、方法、及びプログラム | |
| KR20190084866A (ko) | 시간 인자와 결합한 협업 필터링 방법, 장치, 서버 및 저장 매체 | |
| CN110390014B (zh) | 一种主题挖掘方法、装置及存储介质 | |
| Eyal et al. | Predicting and identifying missing node information in social networks | |
| Fairbanks et al. | Behavioral clusters in dynamic graphs | |
| Liu et al. | Detecting multiple stochastic network motifs in network data | |
| JP6175037B2 (ja) | クラスタ抽出装置及び方法及びプログラム | |
| WO2019159845A1 (ja) | 動的分布推定装置、方法、及びプログラム | |
| JP6383688B2 (ja) | データ解析装置、方法、及びプログラム | |
| JP6243314B2 (ja) | 分析装置、分析方法、及び分析プログラム | |
| JP7014069B2 (ja) | データ解析装置、方法、及びプログラム | |
| Haque et al. | Distributed adaptive importance sampling on graphical models using mapreduce | |
| Elaziz et al. | Discrete generalized inverted exponential distribution: Case study color image segmentation | |
| Lee et al. | Modelling bivariate count series with excess zeros | |
| Huang et al. | Spatial autoregression with repeated measurements for social networks | |
| Maity et al. | A comparative numerical study of the spectral theory approach of Nishimura and the roots method based on the analysis of BDMMAP/G/1 queue | |
| JP6166688B2 (ja) | データ解析方法、装置、及びプログラム | |
| Hajian et al. | On measurement of influence in social networks | |
| JP6092072B2 (ja) | データ解析装置、方法、及びプログラム | |
| Huang et al. | Learning bi-clustered vector autoregressive models |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170217 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171222 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180116 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6278918 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |