JP2016115359A - データセットの解釈方法 - Google Patents
データセットの解釈方法 Download PDFInfo
- Publication number
- JP2016115359A JP2016115359A JP2015246186A JP2015246186A JP2016115359A JP 2016115359 A JP2016115359 A JP 2016115359A JP 2015246186 A JP2015246186 A JP 2015246186A JP 2015246186 A JP2015246186 A JP 2015246186A JP 2016115359 A JP2016115359 A JP 2016115359A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- rules
- data
- representative
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 238000005065 mining Methods 0.000 claims description 7
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 230000001186 cumulative effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 235000008429 bread Nutrition 0.000 description 3
- 235000014121 butter Nutrition 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
本願は2014年12月17日に提出されたインド仮特許出願第4066/MUM/2014号の優先権を主張し、その全体が参照によって本願に組み込まれる。
Claims (15)
- 複数のアイテムを含むデータセットを解釈するための方法であって、
ルール生成モジュール(120)を使用して、前記データセットに関するルールセットを演算する工程であって、前記ルールセットの中の各ルールは1つ以上の先例に基づくあらかじめ定められた結末を含む工程、および、複数のルールを含むルールカバーを生成する工程であって、前記ルールカバーは前記ルールセットのサブセットに対応する工程と、
解釈モジュール(122)を使用して、複数のルールペア間の複数の距離を演算し、および前記ルールカバーの複数の前記ルールペア間で演算された複数の距離に基づいて距離マトリックスを生成し、および、複数の前記ルールペア間で演算された複数の距離を記憶する工程と、
前記距離マトリックスを使用して前記ルールカバー内の重複するルールをクラスタリングする工程であって、重複する前記ルールはデータのトランザクションの共通セットに対応する工程と、
各クラスタから代表的ルールを選択する工程であって、前記代表的ルールは各クラスタに含まれる前記ルールによってカバーされるトランザクションを示す工程と、
各クラスタから選択される前記ルールセットの前記代表的ルールのそれぞれに対して少なくとも1つの例外を決定する工程であって、1つ以上の前記先例があらかじめ定められた結末とは異なる結果を提供する場合に、少なくとも1つの前記例外が決定される工程、および
前記ルールセットの前記代表的ルールおよび前記代表的ルールのそれぞれに対して決定される少なくとも1つの前記例外を使用して前記データセットを解釈する工程を含み、上記各工程はプロセッサ(110)によって実行される方法。 - 前記複数のアイテムはトランザクションデータベースの複数の特有の分野に対応するものである請求項1に記載の方法。
- 前記データセットに対応する前記ルールセットを演算する工程は、
複数の前記ルール生成モジュール(120)を使用して、前記データセットの複数の頻発するアイテムセットを特定する工程であって、頻発する前記アイテムセットのそれぞれが前記ルールセット内にルールを形成する工程、および、前記ルールセット内の前記ルールに対応する少なくとも1つのパラメータの値を推定する工程をさらに含む請求項1に記載の方法。 - 前記ルールセットの演算は関連するルールマイニング技術に基づく請求項1に記載の方法。
- 前記ルールセットは少なくとも1つのパラメータを使用してあらかじめ定められた結末のために演算される請求項1に記載の方法。
- 少なくとも1つの前記パラメータは、前記ルールのサポート、前記ルールの信頼度、および前記ルールのリフトを含む請求項5に記載の方法。
- 前記データセットの複数の頻発する前記アイテムセットは頻発パターンマイニング技術を採用して決定される請求項3に記載の方法。
- 前記ルールカバーは前記データセットの前記ルールの累積サポートを示す請求項1に記載の方法。
- 前記クラスタリングは、重複するルール間のオーバラップの程度を定量化する工程を含む請求項1に記載の方法。
- 前記代表的ルールはバッチモード技術あるいはインタラクティブモード技術によって選択される請求項1に記載の方法。
- 少なくとも1つの前記例外はあらかじめ定められた信頼度しきい値に基づいて決定される請求項1に記載の方法。
- 前記データセットをデータベース(108)に記憶する工程をさらに含む請求項1に記載の方法。
- 複数のアイテムを含むデータセットを解釈するためのデータ解釈システム(102)であって、
プロセッサ(110)と、
前記データセットに関するルールセットを演算する工程であって、前記ルールセットの中の各ルールは1つ以上の先例に基づくあらかじめ定められた結末を含む工程と、
複数のルールを含むルールカバーを生成する工程であって、前記ルールカバーは前記ルールセットのサブセットに対応する工程に適用されるルール生成モジュール(120)と、
前記ルールカバーの複数のルールペア間の複数の距離を演算し、および、複数の前記ルールペア間で演算された複数の距離に基づいて距離マトリックスを生成し、および、複数の前記ルールペア間で演算された複数の距離を記憶する工程と、
前記距離マトリックスを使用して前記ルールカバー内の重複するルールをクラスタリングする工程であって、前記重複するルールは前記データのトランザクションの共通セットに対応する工程と、
各クラスタから代表的ルールを選択する工程であって、前記代表的ルールは各クラスタに含まれる前記ルールによってカバーされるトランザクションを示す工程と、
各クラスタから選択される前記ルールセットの代表的ルールのそれぞれに対して少なくとも1つの例外を決定する工程であって、1つ以上の前記先例があらかじめ定められた結末とは異なる結果を提供する場合に、少なくとも1つの前記例外が決定される工程、および
前記ルールセットの前記代表的なルールおよび前記代表的ルールのそれぞれに対して決定される少なくとも1つの前記例外を使用して解釈する工程に適用される解釈モジュール(122)と、
前記データセットを記憶するために適用されるデータベース(108)を含むデータ解釈システム(102)。 - 前記ルール生成モジュール(120)は、前記データセットの複数の頻発するアイテムセットを特定する工程であって、複数の頻発する前記アイテムセットのそれぞれが前記ルールセット内にルールを形成する工程、および、前記ルールセット内の前記ルールに対応する少なくとも1つのパラメータの値を推定する工程のために適用される請求項13に記載のデータ解釈システム(102)。
- 複数のアイテムを含むデータセットを解釈する方法を実行するためのコンピュータプログラムが記憶された非一時的コンピュータ読み取り可能媒体であって、前記方法は、
前記データセットに関するルールセットを演算する工程であって、前記ルールセットの中の各ルールは1つ以上の先例に基づくあらかじめ定められた結末を含む工程、および、複数のルールを含むルールカバーを生成する工程であって、前記ルールカバーは前記ルールセットのサブセットに対応する工程と、
複数のルールペア間の複数の距離を演算し、および前記ルールカバーの複数の前記ルールペア間で演算された複数の距離に基づいて距離マトリックスを生成し、および、複数の前記ルールペア間で演算された複数の距離を記憶する工程と、
前記距離マトリックスを使用して前記ルールカバー内の重複するルールをクラスタリングする工程であって、前記重複するルールは前記データのトランザクションの共通セットに対応する工程と、
各クラスタから代表的ルールを選択する工程であって、前記代表的ルールは各クラスタに含まれる前記ルールによってカバーされるトランザクションを示す工程と、
各クラスタから選択される前記ルールセットの代表的ルールのそれぞれに対して少なくとも1つの例外を決定する工程であって、1つ以上の前記先例があらかじめ定められた結末とは異なる結果を提供する場合に、少なくとも1つの前記例外が決定される工程、および、
前記ルールセットの前記代表的なルールおよび前記代表的ルールのそれぞれに対して決定される少なくとも1つの前記例外を使用して前記データセットを解釈する工程を含む非一時的コンピュータ読み取り可能媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN4066/MUM/2014 | 2014-12-17 | ||
IN4066MU2014 | 2014-12-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016115359A true JP2016115359A (ja) | 2016-06-23 |
JP6647849B2 JP6647849B2 (ja) | 2020-02-14 |
Family
ID=55027296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015246186A Active JP6647849B2 (ja) | 2014-12-17 | 2015-12-17 | データセットの解釈方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10579931B2 (ja) |
EP (1) | EP3035274A1 (ja) |
JP (1) | JP6647849B2 (ja) |
AU (2) | AU2015268759A1 (ja) |
BR (1) | BR102015031789B1 (ja) |
CA (1) | CA2915563C (ja) |
MX (1) | MX2015017587A (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991141B (zh) * | 2017-03-21 | 2020-12-11 | 北京邮电大学 | 一种基于深度剪枝策略的关联规则挖掘方法 |
US20190197428A1 (en) * | 2017-12-27 | 2019-06-27 | Cerner Innovation, Inc. | Systems and methods for refactoring a knowledge model to increase domain knowledge and reconcile electronic records |
US11451554B2 (en) * | 2019-05-07 | 2022-09-20 | Bank Of America Corporation | Role discovery for identity and access management in a computing system |
CN111598153B (zh) * | 2020-05-13 | 2023-02-24 | 腾讯科技(深圳)有限公司 | 数据聚类的处理方法、装置、计算机设备和存储介质 |
CN113641726B (zh) * | 2021-08-06 | 2024-01-30 | 国网北京市电力公司 | 基于生成对抗网络的无监督护层电流数据挖掘系统 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6651049B1 (en) | 1999-10-22 | 2003-11-18 | International Business Machines Corporation | Interactive mining of most interesting rules |
US6651048B1 (en) * | 1999-10-22 | 2003-11-18 | International Business Machines Corporation | Interactive mining of most interesting rules with population constraints |
US6415287B1 (en) * | 2000-01-20 | 2002-07-02 | International Business Machines Corporation | Method and system for mining weighted association rule |
US9785953B2 (en) * | 2000-12-20 | 2017-10-10 | International Business Machines Corporation | System and method for generating demand groups |
US7103222B2 (en) * | 2002-11-01 | 2006-09-05 | Mitsubishi Electric Research Laboratories, Inc. | Pattern discovery in multi-dimensional time series using multi-resolution matching |
US8401986B1 (en) * | 2004-08-05 | 2013-03-19 | Versata Development Group, Inc. | System and method for efficiently generating association rules |
WO2006090781A1 (ja) * | 2005-02-24 | 2006-08-31 | Nec Corporation | フィルタリングルール分析方法及びシステム |
US7672865B2 (en) * | 2005-10-21 | 2010-03-02 | Fair Isaac Corporation | Method and apparatus for retail data mining using pair-wise co-occurrence consistency |
US7711734B2 (en) * | 2006-04-06 | 2010-05-04 | Sas Institute Inc. | Systems and methods for mining transactional and time series data |
US7870149B2 (en) | 2007-07-09 | 2011-01-11 | International Business Machines Corproation | Data mining method for finding deviations in data |
US7979362B2 (en) * | 2007-08-10 | 2011-07-12 | Motorola Solutions, Inc. | Interactive data mining system |
US7840506B1 (en) * | 2008-01-09 | 2010-11-23 | The United States Of America As Represented By The Secretary Of The Navy | System and method for geodesic data mining |
US8688480B1 (en) * | 2009-04-28 | 2014-04-01 | Accretive Health, Inc. | Automated accounts receivable management system with a self learning engine driven by current data |
US9021409B2 (en) * | 2011-07-11 | 2015-04-28 | The Board Of Trustees Of The University Of Illinois | Integration of data mining and static analysis for hardware design verification |
US9489627B2 (en) | 2012-11-19 | 2016-11-08 | Bottomline Technologies (De), Inc. | Hybrid clustering for data analytics |
CA2907208C (en) * | 2013-03-15 | 2023-10-24 | Trans Union Llc | System and method for developing business rules for decision engines |
-
2015
- 2015-12-15 EP EP15200083.2A patent/EP3035274A1/en not_active Ceased
- 2015-12-16 AU AU2015268759A patent/AU2015268759A1/en not_active Abandoned
- 2015-12-16 US US14/970,726 patent/US10579931B2/en active Active
- 2015-12-16 CA CA2915563A patent/CA2915563C/en active Active
- 2015-12-17 JP JP2015246186A patent/JP6647849B2/ja active Active
- 2015-12-17 MX MX2015017587A patent/MX2015017587A/es unknown
- 2015-12-17 BR BR102015031789-1A patent/BR102015031789B1/pt active IP Right Grant
-
2021
- 2021-05-28 AU AU2021203512A patent/AU2021203512B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
AU2015268759A1 (en) | 2016-07-07 |
CA2915563A1 (en) | 2016-06-17 |
CA2915563C (en) | 2023-09-26 |
AU2021203512B2 (en) | 2022-05-26 |
JP6647849B2 (ja) | 2020-02-14 |
BR102015031789A2 (ja) | 2016-09-27 |
BR102015031789B1 (pt) | 2023-04-11 |
EP3035274A1 (en) | 2016-06-22 |
US20160180229A1 (en) | 2016-06-23 |
AU2021203512A1 (en) | 2021-07-01 |
US10579931B2 (en) | 2020-03-03 |
MX2015017587A (es) | 2017-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670267B (zh) | 一种数据处理方法和装置 | |
JP6647849B2 (ja) | データセットの解釈方法 | |
JP6412550B2 (ja) | データアップロード、処理及び予測クエリapi公開を実施するシステム、方法及び装置 | |
US8217945B1 (en) | Social annotation of a single evolving visual representation of a changing dataset | |
Steiniger et al. | OpenJUMP HoRAE—A free GIS and toolbox for home‐range analysis | |
US20160103750A1 (en) | Application programming interface monitoring tool notification and escalation method and system | |
US20140095231A1 (en) | Guided analytics | |
US11875408B2 (en) | Techniques for accurate evaluation of a financial portfolio | |
CN105493085B (zh) | 创建数据库表的样本的方法、系统和计算机可读存储介质 | |
US11392845B2 (en) | Method and system for multi-core processing based time series management with pattern detection based forecasting | |
US11456932B2 (en) | System capacity heatmap | |
CN111444256A (zh) | 一种数据可视化的实现方法和装置 | |
US10740361B2 (en) | Clustering and analysis of commands in user interfaces | |
US11182436B2 (en) | Predicting locations based on transaction records | |
JP6704089B2 (ja) | ライブラリ検索装置、ライブラリ検索システム、及びライブラリ検索方法 | |
JP6995909B2 (ja) | 1以上のプロセスを監視しセンサデータを提供する複数のセンサを含むシステムのための方法 | |
Gillan et al. | Expediting assessments of database performance for streams of respiratory parameters | |
WO2009006028A2 (en) | Explaining changes in measures thru data mining | |
US11907267B2 (en) | User interface for frequent pattern analysis | |
KR20180004739A (ko) | 비즈니스의 운영을 모니터링하는데 사용되는 시스템 및 방법 | |
CN115619261A (zh) | 一种作业标签画像数据处理方法、装置、计算机设备 | |
US20210064631A1 (en) | Methods And Apparatus For Monitoring Configurable Performance Indicators | |
LU101632B1 (en) | Computer performance defect detection based on energy consumption telemetry | |
JP5444282B2 (ja) | データ整形システム、方法、及びプログラム | |
US10496948B1 (en) | Computer trend visualization using quadratic simplified closed form linear regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6647849 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |