JP6061439B2 - データ処理システム、コンピュータ可読の媒体、データ・マイニング結果を分析する方法、データ・モデルを処理する方法(統計技術を使用するデータ・マイニング・モデル解釈、最適化、及びカスタマイゼーション) - Google Patents
データ処理システム、コンピュータ可読の媒体、データ・マイニング結果を分析する方法、データ・モデルを処理する方法(統計技術を使用するデータ・マイニング・モデル解釈、最適化、及びカスタマイゼーション) Download PDFInfo
- Publication number
- JP6061439B2 JP6061439B2 JP2009268710A JP2009268710A JP6061439B2 JP 6061439 B2 JP6061439 B2 JP 6061439B2 JP 2009268710 A JP2009268710 A JP 2009268710A JP 2009268710 A JP2009268710 A JP 2009268710A JP 6061439 B2 JP6061439 B2 JP 6061439B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- model
- test
- group
- computer system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007418 data mining Methods 0.000 title claims description 55
- 238000000034 method Methods 0.000 title claims description 30
- 238000013499 data model Methods 0.000 title claims description 25
- 238000005457 optimization Methods 0.000 title claims description 5
- 238000012545 processing Methods 0.000 title description 26
- 238000004458 analytical method Methods 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 19
- 238000000551 statistical hypothesis test Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 13
- 238000000546 chi-square test Methods 0.000 claims description 8
- 238000005065 mining Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 6
- 238000000692 Student's t-test Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000012353 t test Methods 0.000 claims description 5
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 claims description 4
- 238000000585 Mann–Whitney U test Methods 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000000528 statistical test Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000014759 maintenance of location Effects 0.000 description 5
- 238000001347 McNemar's test Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000011985 exploratory data analysis Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010237 hybrid technique Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
データ・マイニングにおける主なタスクの1つは、データをクラスタ化あるいは分割して、各グループのメンバが同様の特徴を共有するデータ・グループ、すなわちサブセットまたはクラスタ、とすることである。クラスタ化タスクの結果を解釈することは、所与のクラスタが他の全てのエンティティ(例えば、レコード)あるいは他のクラスタとどのように異なるかを評価することに関して困難であり得る。分類モデルもグループを構築し得るけれども、分類アルゴリズムはクラスタ化アルゴリズムとは異なる仕方で異なる目的のために動作する。データ・グループは、例えば回帰モデル(例えば、レコードを10分位数、4分位数などにより格付けし分割してグループとする)あるいはクエリ(例えば、特定の基準または属性のセットを満たすグループを構築する)などの他のアルゴリズムを用いて構築されることもできる。
その顧客維持計画の一部として、クレジット・カード会社は欠落しそうな(自発的に自分の口座を閉じそうな)顧客のプロフィールを発見することに関心を持つことがある。欠落は、Y(イエス)またはN(ノー)という可能な値を有する断定的変数により表される。その探求的研究の一部として、その会社は、クレジット・スコア、支払い遅滞、延滞料支払い、その顧客がクレジット限度を超えたか否か、などの幾つかの顧客クレジット特性に従って顧客を分けるためにクラスタ化アルゴリズムを使用する。会社は9個のクラスタを発見する。会社がそれらのクラスタを特定したならば、次のステップは、特定のクラスタに属する顧客が、そのクラスタに属さない顧客よりもっと欠落しそうか欠落しそうもないかを判定することである。
相対リスク(RR)についての95%CIについての上限:
その顧客分割(例えば、クラスタ化)分析から得られた見識に基づいて、クレジット・カード会社は、該会社が欠落リスクの高い顧客をより良く特定するのに役立つデータ・マイニング・モデルを構築している。この例では、図3に示されている決定木分類モデルがデータセットの入れ子式分割を提供する。決定ノードで分割があれば、そのノードに存する2つのグループにおける差異の有意性に関する質問が、クラスタ化について記載されたのと同様の仕方で処理され得る。
これまでに論じられた2つの例は、断定的変数についてのものである。しかしテーブル2またはテーブル5などのデシジョン・テーブルは、年齢、身長、収入などの数値変数について構築され得る。例えば、小売り促進シナリオにおいて、私たちが、クラスタ化を通して2つの興味ある顧客セグメントを特定し、その2つのグループについて観察された年間支出の差異が有意に異なるかどうかを知りたいと仮定しよう。私たちは、その2つのセグメントの間の支出の差が統計的に有意であるか否かを判定するために2標本t検定を実行することができる。もしその2つの母集団における分布が標準的であるとは想定され得ないならば、マン・ホイットニーのU検定(ディストリビューション・フリーでノン・パラメトリックな検定)が実行され得る。
予測モデリングは、データ・マイニングにおける他の1つの主要なタスクである。この第2の例では、クレジット・カード欠落の決定木モデルについての検定結果は図5のテーブル5においてコンフュージョン・マトリックスとして提示されている。そのコンフュージョン・マトリックスは、検定データセットにおける顧客の実際の欠落状態を予測するためにモデルがどれだけ良く実行されたかを示す。
....興味の対象である変数についてデータ・マイニング・モデルから有意なグループをリストする
FOR TARGET VARIABLE(ターゲット変数について)
LIST SIGNIFICANT GROUPS(TARGET VARIABLE)(有意なグループをリストする(ターゲット変数))
....興味の対象である変数についてデータ・マイニング・モデルから統計的に有意なグループのランク付きリストを生成する
LIST SIGNIFICANT GROUPS(VARIABLE_OF_INTEREST)(有意なグループをリストする(興味の対象である変数))
....グループIにおける興味の対象である変数の分布を母集団の残余におけるそれと比較する
FOR EACH GROUP I, I=1,...,N(各グループI、I=1,..,N,について)
GROUP COMPARISON WITH REST(GROUP I,REST)(残余とのグループ比較(グループI、残余))
COMPUTE STATISTICAL SIGNIFICANCE STATISTIC & DIAGNOSTICS(統計的有意性スタティスティック&ダイアグノスティクスを計算する)
RANK GROUP I BY STATISTIC(グループIをスタティスティックによってランク付けする)
....ペアワイズ比較を行う
FOR ALL GROUPS J>1(J>1の全てのグループについて)
PAIRWISE GROUP COMPARISON(ペアワイズなグループ比較)
(VARIABLE_OF_INTEREST,GROUP I,GROUP J)(興味の対象である変数、グループI、グループJ)
COMPUTE STATISTICAL SIGNIFICANCE STATISTIC,DIAGNOSTICS(統計的有意性スタティスティック、ダイアグノスティクスを計算する)
RANK GROUP J BY STATISTIC(グループJをスタティスティックによりランク付けする)
RETURN STATISTICAL SIGNIFICANCE MEASURES,DIAGNOSTICS FOR BOTH TYPES OF COMPARISON(両タイプの比較のために統計的有意性尺度、ダイアグノスティクスを戻す)
}....グループIにおける興味の対象である変数の分布と母集団の残余におけるそれとのペアワイズ比較を行う)PAIRWISE GROUP COMPARISON(ペアワイズなグループ比較)(VARIABLE_OF_INTEREST,GROUP I,GROUP J)(興味の対象である変数、グループI、グループJ)
{IF VARIABLE_OF_INTEREST IS CATEGORICAL(もし興味の対象である変数が断定的であるならば)
PERFORM CHI−SQUARE TEST(カイ二乗検定を行う)
COMPUTE CHI−SQUARE VALUE,SIGNIFICANT_95%(HIGHLY SIGNIFICANT,SIGNIFICANT,NOT SIGNIFICANT)(カイ二乗値、95%有意を計算する(非常に有意、有意、有意でない))
COMPUTE DIAGNOSTICS、e.g.,ODDS RATIO,95%_CI,REMARKS(例えばオッズ比などのダイアグノスティクス,95%CI、リマークを計算する)
IF VARIABLE_OF_INTEREST IS NUMERICAL(もし興味の対象である変数が数値であるならば)
PERFORM TWO−SANPLE T−TEST(2標本t検定を実行する)
OUTPUT T−Statistic,SIGNIFICANT_95%(HIGHLY SIGNIFICANT,SIGNIFICANT,NOT SIGNIFICANT)(tスタティック、有意性95%(非常に有意、有意、有意でない)を出力する)
OPTIONAL MANN−WHITNEY U STATISTIC(オプションのマン・ホイットニーUスタティスティック
RETURN STATISTICAL SIGNIFICANCE MEASURES,DIAGNOSTICS(統計的有意性尺度、ダイアグノスティクスを戻す)
....ユーザ指定された選択基準に基づいて最善の予測モデルを選択する
SELECT MODEL(MODEL 1,MODEL 2,...,MODEL N,SELECT_CRITERIA)(モデルを選択する(モデル1、モデル2、...、モデルN、選択基準))
FOR SELECTED_MODEL(選択されたモデルについて)
OUTPUT STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS(統計的有意性尺度&ダイアグノスティクスを出力する)
SELECT MODEL(MODEL 1,MODEL 2,...,MODEL N,SELECT_CRITERIA)(モデルを選択する(モデル1、モデル2、...、モデルN、選択基準))
{
...ROC技術を用いることにより最善の予測モデルを選択する
SELECT_CRITERIA.MODE GLOBAL(選択基準.モード・グローバル)
GENERATE ROC CURVES(MODEL 1,...,MODEL N)(ROC曲線を生成する(モデル1,...,モデルN))
FOR I=1,...,N(I=1,...,Nについて)
IF AUC_MODEL_I>0.5 AND STATISTICALLY SIGNIFICANT ACCEPT(もしAUCモデルI>0.5で統計的に有意ならば容認する)
ELSE REJECT(そうでなければ拒絶する)
RANK ACCEPTED MODELS BY AUC(容認されたモデルをAUCによりランク付けする)
IF MODEL_WITH_HIGHEST_AUC STATISTICALLY SIGNIFICANTLY DIFFERENT FROM OTHER MODELS(もし最高のAUCを有するモデルが他のモデルと統計的に有意に異なるならば)
IDENTIFY OPTIMAL DECISION_POINT BY SELECT_CRITERIA_WEIGHTS_FOR_DIAGNOSTICS_MEASURES(ダイアグノスティクス尺度についての選択基準ウェイトにより最適決定点を特定する)
RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR MODEL_WITH_HIGHEST_AUC(最高のAUCを有するモデルについて統計的有意性尺度&ダイアグノスティクスを戻す)
ELSE(そうでなければ)
IDENTIFY OPTIMAL DECISION_POINT BY SELECT_CRITERIA_WEIGHTS_FOR_DIAGNOSTICS_MEASURES FOR MODEL_WITH_HIGHEST_AUC AND MODELS WITH SIMILAR ROC PERFORMANCE(最高のAUCを有するモデルおよび同様のROCパフォーマンスを有するモデルについてダイアグノスティクス尺度についての選択基準ウェイトにより最適決定点を特定する)
RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR THESE MODELS(これらのモデルについての統計的有意性尺度&ダイアグノスティクスを戻す)
...各モデルを全体的に評価するためにROC曲線を用いるハイブリッド技術を用いることにより最善の予測モデルを選択し、統計的に有意なモデルを容認し、それらの各々について最適決定点を選択し、ダイアグノスティクスを計算し、ユーザ指定されたウェイトを用いて各ダイアグノスティクに重み付けをすることによって総合尺度(an aggregated measure)を構築し、総合尺度を用いてモデルを比較し、統計的有意性について検定をし、最善のモデル(1つまたは複数)を選択する
SELECT_CRITERIA.MODE HYBRID(選択基準.モード・ハイブリッド)
GENERATE ROC CURVES(MODEL 1,...,MODEL N)(ROC曲線を生成する(モデル1、...,モデルN))
FOR I=1,...N(I=1,...Nについて)
IF AUC_MODEL_I>0.5 AND STATISTICALLY SIGNIFICANT(AUCモデルI>0.5で統計的に有意ならば)
IDENTIFY OPTIMAL DECISION_POINT BY SELECT_CRITERIA_WEIGHTS_FOR_DIAGNOSTICS_MEASURES(ダイアグノスティクス尺度についての選択基準ウェイトにより最適決定点を特定する)
COMPARE MODELS USING WEIGHTED DIAGNOSTICS MEASURES,(重み付けされた診断尺度を用いてモデルを比較する、)
TEST FOR STATISTICAL SIGNIFICANCE STORE BEST MODEL(S)(統計的有意性について検定し最善のモデル(1つまたは複数)を格納する)
ELSE REJECT(そうでなければ拒絶する)
RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR BEST MODEL(S)(最善のモデル(1つまたは複数)について統計的有意性尺度&ダイアグノスティクスを戻す)
...固定された所定決定点でマクネマー検定を用いて最善の予測モデルを選択する
SELECT_CRITERIA.MODE FIXED(選択基準.モード固定)
IF SELECT_CRITERIA.DIAGNOSTIC_TO_RANK ACCURACY(もし選択基準が精度をランク付けするダイアグノスティクならば)
RANK MODELS BY ACCURACY(モデルを精度によりランク付けする)
FOR MODEL WITH HIGHEST ACCURACY(最高の精度を有するモデルについて)
PERFORM PAIRWISE McNEMAR’S TEST(ペアワイズなマクネマー検定を実行する)
IF MODEL WITH HIGHEST ACCURACY STATISTICALLY SIGNIFICANTLY DIFFERENT RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR MODEL WITH HIGHEST ACCURACY(もし最高の精度を有するモデルが統計的に有意に異なるならば最高の精度を有するモデルについての統計的有意性尺度&ダイアグノスティクスを戻す)
ELSE(そうでなければ)
RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR MODEL WITH HIGHEST ACCURACY AND STATISTICALLY SIMILAR MODELS(最高の精度を有するモデルおよび統計的に同様のモデルについて統計的有意性尺度&ダイアグノスティクスを戻す)
...前のステップと同様に固定された所定決定点で最善の予測モデルを選択するけれどもモデルをランク付けし比較するために特定の診断尺度または重み付けされた診断尺度を使用する...コードは、重み付けされた診断尺度を用いるランク付けについてだけ示されているけれども、もし特定の診断尺度が選択されたならば構造的に同じであろう
ELSE(そうでなければ)
RANK MODELS USING WEIGHTED DIAGNOSTIC MEASURE(重み付けされた診断尺度を用いてモデルを格付けする)
FOR MODELS WITH HIGHEST RANKING(最高の格付けを有するモデルについて)
PERFORM PAIRWISE STATISTICAL SIGNIFICANCE TEST(ペアワイズな統計的有意性検定を実行する)
IF MODEL WITH HIGHEST RANKING STATISTICALLY SIGNIFICANTLY DIFFERENT RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR MODEL WITH HIGHEST RANKING(もし最高の格付けを有するモデルが統計的に有意に異なるならば、最高の格付けを有するモデルについての統計的有意性尺度&ダイアグノスティクスを戻す)
ELSE(そうでなければ)
RETURN STATISTICAL SIGNIFICANCE MEASURES & DIAGNOSTICS FOR MODEL WITH HIGHEST RANKING AND STATISTICALLY SIMILAR MODELS(最高の格付けを有するモデルおよび統計的に同様のモデルについての統計的有意性尺度&ダイアグノスティクスを戻す)
}
12 プロセッサ
14 I/O
16 メモリ
17 バス
18 データ処理システム
20 データ・マイニング・システム
22 データ・グループ分析システム
24 モデル分析システム
26 統計的有意性処理システム
28 統計的有意性処理システム
29 モデル最適化システム
30 モデル・カスタマイゼーション・システム
32 ビジネス・プロセス
34 データ・ウェアハウス
36 入力
38 出力
40 データ・モデル(1つまたは複数)
Claims (7)
- プロセッサと、
前記プロセッサにより実行されるプログラムを格納するメモリと、
を含むコンピュータ・システムであって、
前記プログラムは、前記プロセッサにより実行されると、当該コンピュータ・システムを、
データ・グループがどのように分割され得るかを定義するデータ・モデルに従ってデータ・ウェアハウスからデータをマイニングするためのデータ・マイニング・システムと、
定義されたデータ・グループのために診断尺度のセットを計算し統計的有意性検定を実行するデータ・グループ分析システムと、
複数のデータ・モデルから、ROC曲線を用いて、どのデータ・モデルが統計的に最も有意な結果を生じさせるかを判定することによって最善のデータ・モデルを選択するモデル分析システムと、
して機能させる、
コンピュータ・システム。 - 前記データ・グループ分析システムは第1データ・グループを第2データ・グループと比較し、前記統計的有意性検定は、カイ二乗検定、2標本t検定、マン・ホイットニーU検定、コルモゴロフ・スミルノフ(KS)検定、および2標本KS検定から成るグループから選択され、診断尺度は、効果および関連する信頼区間のサイズを測定するための相対リスクまたはオッズ比を含む、請求項1に記載のコンピュータ・システム。
- 前記データ・グループ分析システムは、第1データ・グループを他の全てのデータと比較する、請求項1に記載のコンピュータ・システム。
- 利用され得る統計的検定は、カイ二乗検定、2標本t検定、マン・ホイットニーU検定、コルモゴロフ・スミルノフ(KS)検定、および2標本KS検定から成るグループから選択され、診断尺度は、効果および関連する信頼区間のサイズを測定するための相対リスクまたはオッズ比を含む、請求項1に記載のコンピュータ・システム。
- 前記データ・グループは、クラスタ化、回帰モデリング、問合せ、決定木モデリングから成るグループから選択された技術を用いて分割される、請求項1に記載のコンピュータ・システム。
- 前記プログラムは、複数のデータ・グループについての計算された診断尺度および実行された統計的有意性検定のセットに基づいてデータ・グループ分割を洗練するモデル最適化システムをさらに含む、請求項1に記載のコンピュータ・システム。
- 前記プログラムは、データ・マイニング結果を評価するために診断尺度および統計的有意性検定の前記セットを自動的に使用する少なくとも1つのビジネス・プロセスをさらに含む、請求項6に記載のコンピュータ・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/336927 | 2008-12-17 | ||
US12/336,927 US8095498B2 (en) | 2008-12-17 | 2008-12-17 | Data mining model interpretation, optimization, and customization using statistical techniques |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010146554A JP2010146554A (ja) | 2010-07-01 |
JP6061439B2 true JP6061439B2 (ja) | 2017-01-18 |
Family
ID=42241735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009268710A Active JP6061439B2 (ja) | 2008-12-17 | 2009-11-26 | データ処理システム、コンピュータ可読の媒体、データ・マイニング結果を分析する方法、データ・モデルを処理する方法(統計技術を使用するデータ・マイニング・モデル解釈、最適化、及びカスタマイゼーション) |
Country Status (2)
Country | Link |
---|---|
US (1) | US8095498B2 (ja) |
JP (1) | JP6061439B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10572827B2 (en) | 2017-08-08 | 2020-02-25 | International Business Machines Corporation | Prediction quality assessment |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8694368B2 (en) * | 2006-12-08 | 2014-04-08 | American Express Travel Related Services Company, Inc. | Method, system, and computer program product for spend mapping tool |
US8312324B2 (en) * | 2010-01-28 | 2012-11-13 | Xerox Corporation | Remote diagnostic system and method based on device data classification |
US9002773B2 (en) | 2010-09-24 | 2015-04-07 | International Business Machines Corporation | Decision-support application and system for problem solving using a question-answering system |
US20120191639A1 (en) * | 2011-01-26 | 2012-07-26 | International Business Machines Corporation | Statistics forecast for range partitioned tables |
US9153142B2 (en) | 2011-05-26 | 2015-10-06 | International Business Machines Corporation | User interface for an evidence-based, hypothesis-generating decision support system |
US9135245B1 (en) * | 2012-01-09 | 2015-09-15 | Cox Communications, Inc. | Filtering content based on acquiring data associated with language identification |
US10395215B2 (en) * | 2012-10-19 | 2019-08-27 | International Business Machines Corporation | Interpretation of statistical results |
US20170373988A1 (en) * | 2012-12-13 | 2017-12-28 | Nav Technologies, Inc. | Systems for proactive modification of resource utilization and demand |
US10909561B2 (en) | 2013-03-13 | 2021-02-02 | Eversight, Inc. | Systems and methods for democratized coupon redemption |
US10438230B2 (en) * | 2013-03-13 | 2019-10-08 | Eversight, Inc. | Adaptive experimentation and optimization in automated promotional testing |
US10984441B2 (en) | 2013-03-13 | 2021-04-20 | Eversight, Inc. | Systems and methods for intelligent promotion design with promotion selection |
US9984387B2 (en) | 2013-03-13 | 2018-05-29 | Eversight, Inc. | Architecture and methods for promotion optimization |
US10438231B2 (en) | 2013-03-13 | 2019-10-08 | Eversight, Inc. | Automatic offer generation using concept generator apparatus and methods therefor |
US11288696B2 (en) | 2013-03-13 | 2022-03-29 | Eversight, Inc. | Systems and methods for efficient promotion experimentation for load to card |
US11068929B2 (en) | 2013-03-13 | 2021-07-20 | Eversight, Inc. | Highly scalable internet-based controlled experiment methods and apparatus for obtaining insights from test promotion results |
US10445763B2 (en) | 2013-03-13 | 2019-10-15 | Eversight, Inc. | Automated promotion forecasting and methods therefor |
US9940639B2 (en) | 2013-03-13 | 2018-04-10 | Eversight, Inc. | Automated and optimal promotional experimental test designs incorporating constraints |
US10789609B2 (en) | 2013-03-13 | 2020-09-29 | Eversight, Inc. | Systems and methods for automated promotion to profile matching |
US10915912B2 (en) | 2013-03-13 | 2021-02-09 | Eversight, Inc. | Systems and methods for price testing and optimization in brick and mortar retailers |
US10991001B2 (en) | 2013-03-13 | 2021-04-27 | Eversight, Inc. | Systems and methods for intelligent promotion design with promotion scoring |
US10176491B2 (en) | 2013-03-13 | 2019-01-08 | Eversight, Inc. | Highly scalable internet-based randomized experiment methods and apparatus for obtaining insights from test promotion results |
US11270325B2 (en) | 2013-03-13 | 2022-03-08 | Eversight, Inc. | Systems and methods for collaborative offer generation |
US10140629B2 (en) | 2013-03-13 | 2018-11-27 | Eversight, Inc. | Automated behavioral economics patterns in promotion testing and methods therefor |
US10706438B2 (en) | 2013-03-13 | 2020-07-07 | Eversight, Inc. | Systems and methods for generating and recommending promotions in a design matrix |
US10846736B2 (en) | 2013-03-13 | 2020-11-24 | Eversight, Inc. | Linkage to reduce errors in online promotion testing |
US9940640B2 (en) | 2013-03-13 | 2018-04-10 | Eversight, Inc. | Automated event correlation to improve promotional testing |
US11288698B2 (en) | 2013-03-13 | 2022-03-29 | Eversight, Inc. | Architecture and methods for generating intelligent offers with dynamic base prices |
US10636052B2 (en) | 2013-03-13 | 2020-04-28 | Eversight, Inc. | Automatic mass scale online promotion testing |
US11138628B2 (en) | 2013-03-13 | 2021-10-05 | Eversight, Inc. | Promotion offer language and methods thereof |
US11183300B2 (en) * | 2013-06-05 | 2021-11-23 | Nuance Communications, Inc. | Methods and apparatus for providing guidance to medical professionals |
CN104346372B (zh) | 2013-07-31 | 2018-03-27 | 国际商业机器公司 | 用于评估预测模型的方法和装置 |
WO2015049797A1 (ja) * | 2013-10-04 | 2015-04-09 | 株式会社日立製作所 | データ管理方法、データ管理装置及び記憶媒体 |
WO2015136885A1 (ja) * | 2014-03-10 | 2015-09-17 | 日本電気株式会社 | 評価システム、評価方法およびコンピュータ読み取り可能な記憶媒体 |
US10460339B2 (en) | 2015-03-03 | 2019-10-29 | Eversight, Inc. | Highly scalable internet-based parallel experiment methods and apparatus for obtaining insights from test promotion results |
CN107025596B (zh) * | 2016-02-01 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 一种风险评估方法和系统 |
WO2018018025A1 (en) | 2016-07-21 | 2018-01-25 | Ayasdi, Inc. | Topological data analysis of data from a fact table and related dimension tables |
JPWO2018047251A1 (ja) * | 2016-09-07 | 2019-06-24 | 株式会社日立ハイテクノロジーズ | データ分析システム、データ分析端末、及び、データ分析方法 |
US10579663B2 (en) * | 2017-05-02 | 2020-03-03 | International Business Machines Corporation | Data insight discovery using a clustering technique |
US11941659B2 (en) | 2017-05-16 | 2024-03-26 | Maplebear Inc. | Systems and methods for intelligent promotion design with promotion scoring |
US10878403B1 (en) * | 2017-10-18 | 2020-12-29 | Mastercard International Incorporated | Generating peer benchmark datasets |
CN107919983B (zh) * | 2017-11-01 | 2020-07-10 | 中国科学院软件研究所 | 一种基于数据挖掘的天基信息网络效能评估系统及方法 |
US11768852B2 (en) * | 2017-12-27 | 2023-09-26 | Marlabs Incorporated | System and method for data analysis and presentation of data |
WO2019189249A1 (ja) * | 2018-03-29 | 2019-10-03 | 日本電気株式会社 | 学習装置、学習方法、及びコンピュータ読み取り可能な記録媒体 |
US11222176B2 (en) | 2019-05-24 | 2022-01-11 | International Business Machines Corporation | Method and system for language and domain acceleration with embedding evaluation |
US11386276B2 (en) | 2019-05-24 | 2022-07-12 | International Business Machines Corporation | Method and system for language and domain acceleration with embedding alignment |
US20210318944A1 (en) * | 2020-04-13 | 2021-10-14 | UiPath, Inc. | Influence analysis of processes for reducing undesirable behavior |
TR2021008369A2 (tr) * | 2020-12-21 | 2022-03-21 | T C Erciyes Ueniversitesi | Laboratuvar testleri̇ni̇n tani doğruluğunu değerlendi̇rmek i̇çi̇n güvenli̇ ve gi̇zli̇li̇k korumali bi̇r si̇stem |
CN113780582B (zh) * | 2021-09-15 | 2023-04-07 | 杭银消费金融股份有限公司 | 基于机器学习模型的风控特征筛选方法及系统 |
CN114535142B (zh) * | 2022-01-11 | 2023-09-26 | 华南理工大学 | 基于数据驱动的注塑制品尺寸合格性智能判定方法 |
CN117648294A (zh) * | 2024-01-26 | 2024-03-05 | 中国矿业大学(北京) | 一种智能化矿山数据融合共享方法和系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5809499A (en) * | 1995-10-20 | 1998-09-15 | Pattern Discovery Software Systems, Ltd. | Computational method for discovering patterns in data sets |
US6820070B2 (en) * | 2000-06-07 | 2004-11-16 | Insyst Ltd. | Method and tool for data mining in automatic decision making systems |
JP2001306999A (ja) * | 2000-02-18 | 2001-11-02 | Fujitsu Ltd | データ解析装置およびデータ解析方法 |
JP2002109208A (ja) * | 2000-09-29 | 2002-04-12 | Acom Co Ltd | 信用リスク管理方法、分析モデル決定方法、分析サーバ及び分析モデル決定装置 |
US6684208B2 (en) * | 2001-03-07 | 2004-01-27 | Rockwell Technologies, Llc | System and method for quantifying an extent to which a data mining algorithm captures useful information in input data |
US7043476B2 (en) * | 2002-10-11 | 2006-05-09 | International Business Machines Corporation | Method and apparatus for data mining to discover associations and covariances associated with data |
JP2008048733A (ja) * | 2006-07-27 | 2008-03-06 | Okayama Univ | 癌の発症危険率を予測する方法 |
-
2008
- 2008-12-17 US US12/336,927 patent/US8095498B2/en active Active
-
2009
- 2009-11-26 JP JP2009268710A patent/JP6061439B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10572827B2 (en) | 2017-08-08 | 2020-02-25 | International Business Machines Corporation | Prediction quality assessment |
Also Published As
Publication number | Publication date |
---|---|
US20100153332A1 (en) | 2010-06-17 |
US8095498B2 (en) | 2012-01-10 |
JP2010146554A (ja) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6061439B2 (ja) | データ処理システム、コンピュータ可読の媒体、データ・マイニング結果を分析する方法、データ・モデルを処理する方法(統計技術を使用するデータ・マイニング・モデル解釈、最適化、及びカスタマイゼーション) | |
Cabrera et al. | FairVis: Visual analytics for discovering intersectional bias in machine learning | |
Aïvodji et al. | Fairwashing: the risk of rationalization | |
Paredes et al. | Machine learning or discrete choice models for car ownership demand estimation and prediction? | |
Bahnsen et al. | A novel cost-sensitive framework for customer churn predictive modeling | |
Hur et al. | A variable impacts measurement in random forest for mobile cloud computing | |
US20210390457A1 (en) | Systems and methods for machine learning model interpretation | |
CN112329874B (zh) | 数据业务的决策方法、装置、电子设备和存储介质 | |
US20170032270A1 (en) | Method for predicting personality trait and device therefor | |
Bueff et al. | Machine learning interpretability for a stress scenario generation in credit scoring based on counterfactuals | |
Britton | Vine: Visualizing statistical interactions in black box models | |
Yung et al. | A quality framework for statistical algorithms | |
Yang et al. | Data analysis framework of sequential clustering and classification using non-dominated sorting genetic algorithm | |
Chermiti | Establishing Risk and Targeting Profiles Using Dara Mining: Decision Trees | |
CN114997916A (zh) | 潜在用户的预测方法、系统、电子设备和存储介质 | |
WO2017203672A1 (ja) | アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置 | |
CN114139725A (zh) | 业务对象的预测方法、设备及存储介质 | |
Papoušková et al. | Modelling loss given default in peer-to-peer lending using random forests | |
Lavalle et al. | A methodology based on rebalancing techniques to measure and improve fairness in artificial intelligence algorithms | |
Sung et al. | Data-driven sales leads prediction for everything-as-a-service in the cloud | |
Koç et al. | Consumer loans' first payment default detection: a predictive model | |
Kostić et al. | Data mining and modeling use case in banking industry | |
Portela et al. | The search of conditional outliers | |
KR102397882B1 (ko) | 정보 처리 방법 및 장치 | |
Nair et al. | Performance comparison of association rule algorithms with SPMF on automotive industry data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120611 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141111 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151105 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20151112 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20151225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6061439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |