JP5833068B2 - 系列データ分析装置及プログラム - Google Patents
系列データ分析装置及プログラム Download PDFInfo
- Publication number
- JP5833068B2 JP5833068B2 JP2013182229A JP2013182229A JP5833068B2 JP 5833068 B2 JP5833068 B2 JP 5833068B2 JP 2013182229 A JP2013182229 A JP 2013182229A JP 2013182229 A JP2013182229 A JP 2013182229A JP 5833068 B2 JP5833068 B2 JP 5833068B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- data
- series data
- result
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007405 data analysis Methods 0.000 title claims description 15
- 238000011156 evaluation Methods 0.000 claims description 151
- 238000000605 extraction Methods 0.000 claims description 35
- 238000013500 data storage Methods 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 25
- 239000000284 extract Substances 0.000 claims description 16
- 230000001364 causal effect Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 36
- 238000012545 processing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
以下の説明において、
「系列データ」とは、複数のアイテムないしアイテム集合が系列的に、すなわち前後関係を有して直列的に並べられるデータであり、アイテム集合の前後関係を規定するために「→」記号を使って表現する。すなわち、矢印「→」の左側のアイテム集合が「前」側、右側のアイテム集合が「後」側となる。
また、「アイテム」とは、属性及び属性値の対のデータであり、例えば属性「天気」に対して、「晴れ」、「雨」、「曇り」のいずれかの属性値が対になって一つのアイテムとなる。
さらに、「アイテム集合」とは、1以上のアイテムの集合であり、一つのアイテム集合を{ }で括って表現している。
さらにまた、「パターン」とは、系列データの中から何らかの条件を指定されることによって取り出された系列データの部分集合と定義される。
支持度(s)=sを含む系列データの個数/系列データの個数
信頼度(s|t)=sを含む系列データの個数/tを含む系列データの個数
(1){天気:晴れ,気温:高い}
(2){天気:晴れ,気温:普通1}
(3){天気:晴れ,気温:低い}
(4){天気:雨,気温:高い}
(5){天気:雨,気温:普通1}
(6){天気:雨,気温:低い}
(7){天気:曇り,気温:高い}
(8){天気:曇り,気温:普通1}
(9){天気:曇り,気温:低い}
の9種類のアイテム集合を生成することができる。
(1){日種別:平日}→{人出:多い}
(2){日種別:平日}→{人出:普通2}
(3){日種別:平日}→{人出:少ない}
(4){日種別:休日}→{人出:多い}
(5){日種別:休日}→{人出:普通2}
(6){日種別:休日}→{人出:少ない}
の6種類のパターンを生成することができる。
結論部評価値(結論部j)=Σi=1,n_j 評価値ij
リフト(s|t)=((s−t)を含む系列データの個数×tを含む系列データの個数)/sを含む系列データの個数×系列データの個数
結論部評価値(結論部j)=1−Πi(1−評価値ij)
10 学習データ格納部
20 評価データ格納部
30 パターン抽出部
40 特徴パターン選択部
50 関連パターン生成部
60 評価値算出部
70 予測モデル生成部
80 結果予測部
Claims (8)
- 複数の異なるアイテムからなる系列データから条件を満たすパターンを抽出し、該パターンに基づいて、新たに与えられた系列データが特定の結果に達する可能性を予測するための系列データ分析装置であって、
複数の相互に異なるアイテム集合が並べられるとともに、少なくとも最後のアイテム集合が他のアイテム集合に対する因果関係の結果として時系列に並べられた第1の系列データの群を学習データとして格納する学習データ格納部と、
前記アイテム集合の出現頻度に基づいて、前記第1の系列データから2以上のアイテム集合のパターンを抽出するパターン抽出部と、
該抽出されたパターンから、該パターンの一部からなる部分パターンの出現頻度に基づいて、2以上のアイテム集合のパターンを特徴パターンとして選択するパターン選択部と、
該選択された特徴パターンに対して、最後のアイテム集合が同一で他のアイテム集合が相違する関連パターンを生成する関連パターン生成部と、
前記特徴パターン及び関連パターンのデータを纏めた予測モデルを生成する予測モデル生成部と、
前記学習データの部分集合である第2の系列データを前記予測モデルとマッチングし、前記特徴パターンに対する該パターンの一部からなる部分パターンの出現頻度または前記関連パターンに対する該パターンの一部からなる部分パターンの出現頻度に基づいて、前記予測モデルに含まれる最後のアイテム集合に基づく第2の系列データの到達可能性の高い結果を抽出する結果予測部と、
を備えることを特徴とする系列データ分析装置。 - 前記パターン抽出部によって抽出されたパターンに対する評価値を、該パターンの一部からなる部分パターンの出現頻度に基づいて算出する評価値算出部を備え、
前記パターン選択部は、前記評価値が所定値以上のパターンを前記特徴パターンとして選択するとともに、
前記評価値算出部は、生成された関連パターンに対する評価値を、該パターンの一部からなる部分パターンの出現頻度に基づいて算出し、
前記予測モデル生成部は、前記特徴パターン及び関連パターンと該パターン毎の評価値とを含む前記予測モデルを生成し、
前記結果予測部は、前記学習データの部分集合である第2の系列データを前記予測モデルとマッチングし、前記特徴パターンの評価値または前記関連パターンの評価値に基づいて、前記予測モデルに含まれる最後のアイテム集合に基づく第2の系列データの到達可能性の高い結果を抽出することを特徴とする請求項1記載の系列データ分析装置。 - 前記結果予測部は、前記予測モデル中の前記特徴パターン及び関連パターンの最後のアイテム集合以外のアイテム集合を参照し、該アイテム集合が前記第2の系列データに含まれている前記特徴パターン及び/又は前記関連パターンを抽出し、該抽出されたパターンの最後のアイテム集合及び評価値に基づいて、第2の系列データの到達可能性の高い結果を抽出する、
ことを特徴とする請求項2記載の系列データ分析装置。 - 前記結果予測部は、複数の前記抽出されたパターンのうち、最後のアイテム集合である結論部が相互に同一であるパターンの各評価値を積算した結論部評価値を算出し、結論部評価値に基づいて抽出されるパターンの最後のアイテム集合の内容を、第2の系列データの到達可能性の高い結果として出力する、
ことを特徴とする請求項3記載の系列データ分析装置。 - 前記結果予測部は、第2の系列データの到達可能性の高い結果として、前記最後のアイテム集合の内容と、該内容を判断する根拠となった前記予測モデル中のパターンを示す情報と、を出力する、
ことを特徴とする請求項4記載の系列データ分析装置。 - 通信網を介してクライアント端末とデータの送受信を行う送受信部をさらに備え、
前記学習データ格納部は、前記送受信部を介して前記クライアント端末から送信された学習データを格納することを特徴とする請求項1乃至5のいずれか1つに記載の系列データ分析装置。 - 複数の異なるアイテムからなる系列データから条件を満たすパターンを抽出し、該パターンに基づいて、新たに与えられた系列データが特定の結果に達する可能性を予測するための系列データ分析プログラムであって、コンピュータに、
学習データとして格納され複数の相互に異なるアイテム集合が並べられるとともに、少なくとも最後のアイテム集合が他のアイテム集合に対する因果関係の結果として時系列に並べられた第1の系列データの群を読み出して、前記第1の系列データから、前記アイテム集合の出現頻度に基づいた第1の条件を満たす2以上のアイテム集合のパターンを複数個抽出するパターン抽出段階と、
該抽出されたパターンに対する評価値を、該抽出されたパターンの一部からなる部分パターンの出現頻度に基づいて算出するパターン評価値算出段階と、
前記抽出されたパターンから、前記評価値が第2の条件を満たすパターンを特徴パターンとして選択する特徴パターン選択段階と、
該選択された特徴パターンに対して、最後のアイテム集合が同一で他のアイテム集合が相違する関連パターンを生成する関連パターン生成段階と、
生成された前記関連パターンに対する評価値を、該パターンの一部からなる部分パターンの出現頻度に基づいて算出する関連パターン評価値算出段階と、
前記特徴パターン及び関連パターンのデータを纏めた予測モデルを生成する予測モデル生成段階と、
前記学習データの部分集合である第2の系列データを前記予測モデルとマッチングし、前記特徴パターン及び前記関連パターンの各評価値に基づいて、前記予測モデルに含まれる最後のアイテム集合に基づく第2の系列データの到達可能性の高い結果を抽出する結果予測段階と、を実行させ、
前記特徴パターン選択段階では、算出された前記評価値が前記第2の条件として指定された閾値に達しているパターンを特徴パターンとして選択させ、
前記結果予測段階では、予測した結果の根拠となった前記予測モデル中の前記特徴パターン及び/又は前記関連パターンのデータを、予測した結果とともに出力させるための系列データ分析プログラム。 - 複数の異なるアイテムからなる系列データから条件を満たすパターンを抽出し、該パターンに基づいて、新たに与えられた系列データが特定の結果に達する可能性を予測するための系列データ分析装置であって、
複数の相互に異なるアイテム集合が時系列に並べられるとともに、因果関係の結果となる第1アイテム集合と、第1アイテム集合に対する原因となる1つ以上のアイテム集合とを少なくとも含む第1の系列データの群を学習データとして格納する学習データ格納部と、
前記アイテム集合の出現頻度に基づいて、前記第1の系列データから2以上のアイテム集合のパターンを抽出するパターン抽出部と、
該抽出されたパターンから、該パターンの一部からなる部分パターンの出現頻度に基づいて、2以上のアイテム集合のパターンを特徴パターンとして選択するパターン選択部と、
該選択された特徴パターンに対して、第1アイテム集合が同一で他のアイテム集合が相違する関連パターンを生成する関連パターン生成部と、
前記特徴パターン及び関連パターンのデータを纏めた予測モデルを生成する予測モデル生成部と、
前記学習データの部分集合である第2の系列データを前記予測モデルとマッチングし、前記特徴パターンに対する該パターンの一部からなる部分パターンの出現頻度または前記関連パターンに対する該パターンの一部からなる部分パターンの出現頻度に基づいて、前記予測モデルに含まれる第1アイテム集合に基づく第2の系列データの到達可能性の高い結果を抽出する結果予測部と、
を備えることを特徴とする系列データ分析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013182229A JP5833068B2 (ja) | 2013-09-03 | 2013-09-03 | 系列データ分析装置及プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013182229A JP5833068B2 (ja) | 2013-09-03 | 2013-09-03 | 系列データ分析装置及プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015049790A JP2015049790A (ja) | 2015-03-16 |
JP5833068B2 true JP5833068B2 (ja) | 2015-12-16 |
Family
ID=52699727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013182229A Active JP5833068B2 (ja) | 2013-09-03 | 2013-09-03 | 系列データ分析装置及プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5833068B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6223889B2 (ja) | 2014-03-31 | 2017-11-01 | 株式会社東芝 | パターン発見装置、およびプログラム |
JP6181134B2 (ja) | 2015-11-02 | 2017-08-16 | 株式会社東芝 | 要因解析装置、要因解析方法、及びプログラム |
WO2017199445A1 (ja) * | 2016-05-20 | 2017-11-23 | 株式会社Ubic | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3762840B2 (ja) * | 1998-11-24 | 2006-04-05 | 富士通株式会社 | 類似事例に基づく予測を行う予測装置および方法 |
JP4698328B2 (ja) * | 2005-08-12 | 2011-06-08 | 中国電力株式会社 | データ分析方法、データ分析システム、およびプログラム |
JP2008220511A (ja) * | 2007-03-09 | 2008-09-25 | Toshiba Corp | 時系列パターン発見装置、方法およびプログラム |
-
2013
- 2013-09-03 JP JP2013182229A patent/JP5833068B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015049790A (ja) | 2015-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Origin-destination matrix prediction via graph convolution: a new perspective of passenger demand modeling | |
US20210073283A1 (en) | Machine learning and prediction using graph communities | |
CN108804633B (zh) | 基于行为语义知识网络的内容推荐方法 | |
US11521221B2 (en) | Predictive modeling with entity representations computed from neural network models simultaneously trained on multiple tasks | |
De Winter et al. | Combining temporal aspects of dynamic networks with node2vec for a more efficient dynamic link prediction | |
CN110555469B (zh) | 处理交互序列数据的方法及装置 | |
TWI525460B (zh) | 電子計算裝置、其個人化資訊推薦方法及其電腦程式產品 | |
CN107644047B (zh) | 标签预测生成方法及装置 | |
JP5833068B2 (ja) | 系列データ分析装置及プログラム | |
JP3813837B2 (ja) | データ分析装置及びデータ分析方法並びにプログラム | |
WO2016116958A1 (ja) | 系列データ分析装置及プログラム | |
CN114298783A (zh) | 基于矩阵分解融合用户社交信息的商品推荐方法及系统 | |
Bansal et al. | Htfm: Hybrid traffic-flow forecasting model for intelligent vehicular ad hoc networks | |
Park et al. | The Geo/G/1 queue with negative customers and disasters | |
JP7291100B2 (ja) | 複数の投稿時系列データを用いた異常・変化推定方法、プログラム及び装置 | |
Dudas | Cooperative, dynamic Twitter parsing and visualization for dark network analysis | |
CN111159515B (zh) | 数据处理方法、装置及电子设备 | |
CN116934380A (zh) | 一种异常事件下的电商物资供需联合预测方法 | |
CN113535939A (zh) | 文本处理方法和装置、电子设备以及计算机可读存储介质 | |
US20160117400A1 (en) | System, method and apparatus for automatic topic relevant content filtering from social media text streams using weak supervision | |
US11748435B2 (en) | Content-free system and method to recommend news and articles | |
CN115618079A (zh) | 会话推荐方法、装置、电子设备及存储介质 | |
CN115456708A (zh) | 推荐模型的训练方法、装置、电子设备和存储介质 | |
JP6414321B2 (ja) | 人数予測システム、人数予測方法および人数予測プログラム | |
JP5463775B2 (ja) | スケジューリング装置およびスケジューリング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5833068 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |