JP5228461B2 - パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 - Google Patents
パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 Download PDFInfo
- Publication number
- JP5228461B2 JP5228461B2 JP2007315028A JP2007315028A JP5228461B2 JP 5228461 B2 JP5228461 B2 JP 5228461B2 JP 2007315028 A JP2007315028 A JP 2007315028A JP 2007315028 A JP2007315028 A JP 2007315028A JP 5228461 B2 JP5228461 B2 JP 5228461B2
- Authority
- JP
- Japan
- Prior art keywords
- combination
- explanatory variable
- cases
- case
- pattern extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Description
実施例1に係るパターン抽出装置は、各説明変数の条件を示した説明変数値の組み合わせと、目的変数の条件を示した目的変数値とを対応付けて構成される複数の事例を含んでなる事例集合から、所定の説明変数値の組み合わせを構成要素とする全事例において特定の目的変数値を構成要素とする事例を含んだ割合が所定の満足度を満たす説明変数値の組み合わせをパターンとして抽出することを概要とする。
次に、図1〜図8を用いて、パターン抽出装置10の構成を説明する。図1は、パターン抽出装置の構成を示すブロック図である。図2は、事例集合記憶部に記憶される情報の一例を示す図である。図3は、確信度記憶部に記憶される情報の一例を示す図である。図4は、高確信度組合記憶部に記憶される情報の一例を示す図である。図5は、類似事例記憶部に記憶される情報の一例を示す図である。図6は、影響度記憶部に記憶される情報の一例を示す図である。図7は、新組合記憶部に記憶される情報の一例を示す図である。図8は、パターン記憶部に記憶される情報の一例を示す図である。図1に示すように、パターン抽出装置10は、入力部11と、出力部12と、記憶部13と、処理部14とを備える。
次に、図9を用いて、パターン抽出装置10による処理の流れを説明する。図9は、パターン抽出装置による処理の流れを示すフローチャート図である。
次に、実施例1に係るパターン抽出装置10による処理の一例として、事例の数が20件以上であり、目的変数値「不正利用」を構成要素とする事例を含んだ割合が75%以上である、クレジットカードを不正利用しているユーザの商品購入パターンを抽出する場合を説明する。
まず、実施例1に係るパターン抽出装置10による具体的な処理の一例を説明するために用いる主たる用語を説明する。
次に、実施例1に係るパターン抽出装置10による影響度および確信度の算出方式の一例として、記憶に基づく推論(Memory-Based Reasoning :MBR)の計算方式を説明する(特開2000−155681号公報参照)。なお、説明の簡略化のために式の一部を変更しているが、本発明はこれに限定されるものではない。
次に、実施例1に係るパターン抽出装置10による具体的な処理の一例を説明する。まず、パターン抽出装置10は、入力部11を介して事例集合を受け付けると、事例集合を事例集合記憶部13aに格納する(図2参照)(図9に示した、ステップS1001肯定に対応)。
上記したように、実施例1によれば、構成要素として含まれる割合が少ない目的変数値のパターンを容易に抽出することが可能である。
実施例2に係るパターン抽出装置10の構成は、実施例1に係るパターン抽出装置10と以下に説明する点が異なる。
次に、図10を用いて、パターン抽出装置10による処理の流れを説明する。図10は、実施例2に係るパターン抽出装置による処理の流れを示すフローチャート図である。
上記したように、実施例2によれば、構成要素として含まれる割合が少ない目的変数値のパターンを単純な構成で抽出することが可能である。
実施例3に係るパターン抽出装置10の構成は、実施例1に係るパターン抽出装置10と以下に説明する点が異なる。
次に、図15を用いて、パターン抽出装置10による処理の流れを説明する。図15は、実施例3に係るパターン抽出装置による処理の流れを示すフローチャート図である。なお、実施例1に係るパターン抽出装置10による処理の流れと異なる点についてのみ詳細に説明する。
上記したように、実施例3によれば、構成要素として含まれる割合が少ない目的変数値のパターンとして、多様なパターンを抽出することが可能である。
実施例4に係るパターン抽出装置10の構成は、実施例1に係るパターン抽出装置10と以下に説明する点が異なる。
次に、図16を用いて、パターン抽出装置10による処理の流れを説明する。図16は、実施例4に係るパターン抽出装置による処理の流れを示すフローチャート図である。なお、実施例1に係るパターン抽出装置10による処理の流れと異なる点についてのみ詳細に説明する。
上記したように、実施例4によれば、簡単な構成で構成要素として含まれる割合が少ない目的変数値のパターンを抽出することが可能である。
前記所定の説明変数値の組み合わせを構成要素とする全事例の中に、特定の目的変数値を構成要素とする事例を含む信頼度を示す確信度を事例ごとに算出する確信度算出手段と、
前記確信度算出手段によって算出された確信度が所定の閾値を満たす事例について、当該事例を構成する前記説明変数値の組み合わせを高確信度組合として選択する高確信度組合選択手段と、
前記高確信度組合選択手段によって選択された高確信度組合を構成要素とする全事例において、特定の目的変数値を構成要素とする事例が含まれる割合が所定の満足度を満たした場合に、当該高確信度組合として選択された前記説明変数値の組み合わせを前記パターンとして抽出するパターン抽出手段と、
を備えたことを特徴とするパターン抽出装置。
前記パターン抽出手段は、前記影響度算出手段によって算出された影響度を用いて新たなる説明変数値の組み合わせを生成し、当該新たなる説明変数値の組み合わせを構成要素とする全事例において特定の目的変数値を構成要素とする事例が含まれる割合が所定の満足度を満たした場合に、当該新たなる説明変数値の組み合わせを前記パターンとして抽出することを特徴とする付記1〜5のいずれか1つに記載のパターン抽出装置。
前記影響度算出手段は、前記類似事例集合抽出手段によって抽出された類似事例の集合から前記影響度を算出することを特徴とする付記6〜8のいずれか1つに記載のパターン抽出装置。
前記所定の説明変数値の組み合わせを構成要素とする全事例の中に、特定の目的変数値を構成要素とする事例を含む信頼度を示す確信度を事例ごとに算出する確信度算出手順と、
前記確信度算出手順によって算出された確信度が所定の閾値を満たす事例について、当該事例を構成する前記説明変数値の組み合わせを高確信度組合として選択する高確信度組合選択手順と、
前記高確信度組合選択手順によって選択された高確信度組合を構成要素とする全事例において、特定の目的変数値を構成要素とする事例が含まれる割合が所定の満足度を満たした場合に、当該高確信度組合として選択された前記説明変数値の組み合わせを前記パターンとして抽出するパターン抽出手順と、
をコンピュータに実行させることを特徴とするパターン抽出プログラム。
前記所定の説明変数値の組み合わせを構成要素とする全事例の中に、特定の目的変数値を構成要素とする事例を含む信頼度を示す確信度を事例ごとに算出する確信度算出工程と、
前記確信度算出工程によって算出された確信度が所定の閾値を満たす事例について、当該事例を構成する前記説明変数値の組み合わせを高確信度組合として選択する高確信度組合選択工程と、
前記高確信度組合選択工程によって選択された高確信度組合を構成要素とする全事例において、特定の目的変数値を構成要素とする事例が含まれる割合が所定の満足度を満たした場合に、当該高確信度組合として選択された前記説明変数値の組み合わせを前記パターンとして抽出するパターン抽出工程と、
を含んだことを特徴とするパターン抽出方法。
11 入力部
12 出力部
13 記憶部
13a 事例集合記憶部
13b 確信度記憶部
13c 高確信度組合記憶部
13d 類似事例記憶部
13e 影響度記憶部
13f 新組合記憶部
13g パターン記憶部
14 処理部
14a 確信度算出部
14b 高確信度組合選択部
14c 類似事例抽出部
14d 影響度算出部
14e パターン抽出部
110 コンピュータ
120 入力部
130 ROM(Read Only Memory)
130a 確信度算出プログラム
130b 高確信度組合選択プログラム
130c 類似事例抽出プログラム
130d 影響度算出プログラム
130e パターン抽出プログラム
140 CPU(Central Processing Unit)
140a 確信度算出プロセス
140b 高確信度組合選択プロセス
140c 類似事例抽出プロセス
140d 影響度算出プロセス
140e パターン抽出プロセス
150 HDD(Hard disk drive)
150a 事例集合データテーブル
150b 確信度データテーブル
150c 高確信度組合データテーブル
150d 類似事例データテーブル
150e 影響度データテーブル
150f 新組合データテーブル
150g パターンデータテーブル
160 RAM(Random Access Memory)
160a 事例集合データ
160b 確信度データ
160c 高確信度組合データ
160d 類似事例データ
160e 影響度データ
160f 新組合データ
160g パターンデータ
170 出力部
180 バス
Claims (7)
- 各説明変数の条件を示した説明変数値の組み合わせと、目的変数の条件を示した目的変数値とを対応付けて構成される複数の事例を含んでなる事例集合から、所定の説明変数値の組み合わせを構成要素とする全事例において特定の目的変数値を構成要素とする事例を含んだ割合が第1の閾値を満たした説明変数値の組み合わせをパターンとして抽出するパターン抽出装置であって、
前記所定の説明変数値の組み合わせを構成要素とする全事例の件数の中で、特定の目的変数値を構成要素とする事例の件数が占める割合を示す確信度を事例ごとに算出する確信度算出手段と、
前記確信度算出手段によって算出された確信度が第2の閾値を満たす事例について、当該事例を構成する前記説明変数値の組み合わせを高確信度組合として選択する高確信度組合選択手段と、
前記高確信度組合選択手段によって選択された高確信度組合を構成要素とする全事例において、特定の目的変数値を構成要素とする事例が含まれる割合が前記第1の閾値を満たした場合に、当該高確信度組合として選択された前記説明変数値の組み合わせを前記パターンとして抽出するパターン抽出手段と、
を備えたことを特徴とするパターン抽出装置。 - 前記高確信度組合選択手段は、前記パターン抽出手段によって抽出されたパターンを構成する前記説明変数値の組み合わせ以外の前記説明変数値の組み合わせから高確信度組合を選択することを特徴とする請求項1に記載のパターン抽出装置。
- 前記高確信度組合選択手段によって選択された前記高確信度組合内の説明変数値ごとに、前記説明変数値自体が前記説明変数値の組み合わせを構成要素とする事例の目的変数値に影響を及ぼす度合を示す影響度を算出する影響度算出手段をさらに備え、
前記パターン抽出手段は、前記影響度算出手段によって算出された影響度を用いて新たなる説明変数値の組み合わせを生成し、当該新たなる説明変数値の組み合わせを構成要素とする全事例において特定の目的変数値を構成要素とする事例が含まれる割合が前記第1の閾値を満たした場合に、当該新たなる説明変数値の組み合わせを前記パターンとして抽出することを特徴とする請求項1または2に記載のパターン抽出装置。 - 前記パターン抽出手段は、前記高確信度組合が有する各説明変数値の組み合わせから前記影響度算出手段によって算出された影響度が低い順に説明変数値を削除することで前記新たなる説明変数値の組み合わせを生成することを特徴とする請求項3に記載のパターン抽出装置。
- 前記高確信度組合選択手段によって選択された前記高確信度組合を構成要素とする各事例内の説明変数値の一部が共通する事例を類似事例の集合として前記事例集合から抽出する類似事例集合抽出手段をさらに備え、
前記影響度算出手段は、前記類似事例集合抽出手段によって抽出された類似事例の集合から前記影響度を算出することを特徴とする請求項3または4に記載のパターン抽出装置。 - 各説明変数の条件を示した説明変数値の組み合わせと、目的変数の条件を示した目的変数値とを対応付けて構成される複数の事例を含んでなる事例集合を記憶する記憶部から、所定の説明変数値の組み合わせを構成要素とする全事例において特定の目的変数値を構成要素とする事例を含んだ割合が第1の閾値を満たした説明変数値の組み合わせをパターンとして抽出するパターン抽出処理をコンピュータに実行させるパターン抽出プログラムであって、
前記記憶部を参照して、前記所定の説明変数値の組み合わせを構成要素とする全事例の件数の中で、特定の目的変数値を構成要素とする事例の件数が占める割合を示す確信度を事例ごとに算出する確信度算出手順と、
前記確信度算出手順によって算出された確信度が第2の閾値を満たす事例について、当該事例を構成する前記説明変数値の組み合わせを高確信度組合として選択する高確信度組合選択手順と、
前記高確信度組合選択手順によって選択された高確信度組合を構成要素とする全事例において、特定の目的変数値を構成要素とする事例が含まれる割合が前記第1の閾値を満たした場合に、当該高確信度組合として選択された前記説明変数値の組み合わせを前記パターンとして抽出するパターン抽出手順と、
をコンピュータに実行させることを特徴とするパターン抽出プログラム。 - 各説明変数の条件を示した説明変数値の組み合わせと、目的変数の条件を示した目的変数値とを対応付けて構成される複数の事例を含んでなる事例集合から、所定の説明変数値の組み合わせを構成要素とする全事例において特定の目的変数値を構成要素とする事例を含んだ割合が第1の閾値を満たした説明変数値の組み合わせをパターンとして抽出するパターン抽出装置のパターン抽出方法であって、
前記パターン抽出装置は、
前記所定の説明変数値の組み合わせを構成要素とする全事例の件数の中で、特定の目的変数値を構成要素とする事例の件数が占める割合を示す確信度を事例ごとに算出し、
算出された確信度が第2の閾値を満たす事例について、当該事例を構成する前記説明変数値の組み合わせを高確信度組合として選択し、
選択された高確信度組合を構成要素とする全事例において、特定の目的変数値を構成要素とする事例が含まれる割合が前記第1の閾値を満たした場合に、当該高確信度組合として選択された前記説明変数値の組み合わせを前記パターンとして抽出する
各処理を実行することを特徴とするパターン抽出方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007315028A JP5228461B2 (ja) | 2007-12-05 | 2007-12-05 | パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 |
US12/326,640 US8086626B2 (en) | 2007-12-05 | 2008-12-02 | Rare pattern extracting device and rare pattern extracting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007315028A JP5228461B2 (ja) | 2007-12-05 | 2007-12-05 | パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009140178A JP2009140178A (ja) | 2009-06-25 |
JP5228461B2 true JP5228461B2 (ja) | 2013-07-03 |
Family
ID=40722705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007315028A Expired - Fee Related JP5228461B2 (ja) | 2007-12-05 | 2007-12-05 | パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8086626B2 (ja) |
JP (1) | JP5228461B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6003561B2 (ja) * | 2012-11-15 | 2016-10-05 | 富士通株式会社 | 抽出プログラム、抽出装置及び抽出方法 |
JP5967017B2 (ja) * | 2013-05-31 | 2016-08-10 | Jfeスチール株式会社 | 影響因子抽出方法およびプログラム |
JP6208259B2 (ja) * | 2013-12-25 | 2017-10-04 | 株式会社日立製作所 | 要因抽出システム、要因抽出方法 |
JP7168095B2 (ja) * | 2019-08-29 | 2022-11-09 | 富士通株式会社 | パターン抽出プログラム、装置、及び方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251131A (en) * | 1991-07-31 | 1993-10-05 | Thinking Machines Corporation | Classification of data records by comparison of records to a training database using probability weights |
US6092064A (en) * | 1997-11-04 | 2000-07-18 | International Business Machines Corporation | On-line mining of quantitative association rules |
JP3762840B2 (ja) | 1998-11-24 | 2006-04-05 | 富士通株式会社 | 類似事例に基づく予測を行う予測装置および方法 |
US7574652B2 (en) * | 2002-06-20 | 2009-08-11 | Canon Kabushiki Kaisha | Methods for interactively defining transforms and for generating queries by manipulating existing query data |
US7644361B2 (en) * | 2002-12-23 | 2010-01-05 | Canon Kabushiki Kaisha | Method of using recommendations to visually create new views of data across heterogeneous sources |
JP2007109012A (ja) | 2005-10-13 | 2007-04-26 | Hitachi Ltd | 情報処理装置、事例出力方法、及びプログラム |
-
2007
- 2007-12-05 JP JP2007315028A patent/JP5228461B2/ja not_active Expired - Fee Related
-
2008
- 2008-12-02 US US12/326,640 patent/US8086626B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009140178A (ja) | 2009-06-25 |
US20090150391A1 (en) | 2009-06-11 |
US8086626B2 (en) | 2011-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230342848A1 (en) | Systems and methods of detecting manipulations on a binary options exchange | |
JP4918937B2 (ja) | 帳票種識別プログラム、帳票種識別方法および帳票種識別装置 | |
JP6744882B2 (ja) | 行動パターン探索システム、および行動パターン探索方法 | |
US20180225683A1 (en) | Systems and methods for tagging transactions with emotions | |
JP5683758B1 (ja) | レコメンド情報提示装置、レコメンド情報提示方法及びレコメンド情報提示プログラム | |
KR101782120B1 (ko) | 상담정보 및 군집화에 기반한 금융상품추천장치 및 방법 | |
JP5228461B2 (ja) | パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 | |
JP2018147280A (ja) | データ分析装置及びデータ分析方法 | |
CN105095306A (zh) | 基于关联对象进行操作的方法及装置 | |
JP2022105052A (ja) | 情報処理システム、顧客特定装置、情報処理方法及びプログラム | |
JP2011014174A (ja) | 電子決済システム、個人用端末、加盟店用端末、認証・決済装置、電子決済方法、および電子決済プログラム | |
CN111414533A (zh) | 推荐信息的生成方法、装置、电子设备、存储介质 | |
CN110909247B (zh) | 文本信息的推送方法、电子设备及计算机存储介质 | |
JP7275591B2 (ja) | 評価支援プログラム、評価支援方法および情報処理装置 | |
WO2013157603A1 (ja) | 検索クエリ分析装置、検索クエリ分析方法、及びコンピュータ読み取り可能な記録媒体 | |
JP6325407B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2008225846A (ja) | 単語意味タグ付与装置および方法、プログラム並びに記録媒体 | |
JP2005222445A (ja) | データマイニングにおける情報処理方法及び解析装置 | |
RU2689816C2 (ru) | Способ для классифицирования последовательности действий пользователя (варианты) | |
JP2003323601A (ja) | 信頼性尺度付き予測装置 | |
CN112465611A (zh) | 向用户推送物品信息的方法、装置和电子设备 | |
JP5125071B2 (ja) | スケール算出プログラム、スケール算出装置およびスケール算出方法 | |
WO2021024882A1 (ja) | 商品売上予測に用いる複数の商品情報を対応付ける判定サーバ及び判定方法 | |
JP7302107B1 (ja) | 学習システム、学習方法、及びプログラム | |
Krishna et al. | Use of Big Data Technologies for Credit Card Fraud Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100715 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130304 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |