JP6376865B2 - 並列ツリー・ベースの予測のための、コンピュータにより実行される方法、ストレージ媒体、およびコンピュータ・システム - Google Patents
並列ツリー・ベースの予測のための、コンピュータにより実行される方法、ストレージ媒体、およびコンピュータ・システム Download PDFInfo
- Publication number
- JP6376865B2 JP6376865B2 JP2014139306A JP2014139306A JP6376865B2 JP 6376865 B2 JP6376865 B2 JP 6376865B2 JP 2014139306 A JP2014139306 A JP 2014139306A JP 2014139306 A JP2014139306 A JP 2014139306A JP 6376865 B2 JP6376865 B2 JP 6376865B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- tree
- input data
- nodes
- trees
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9027—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
− アンサンブル・モデル中のツリーの各々について割り当てテーブルを生成するステップであって、各割り当てテーブルは、入力データ・セット中の全てのデータ記録をツリーのそれぞれの一つのルート・ノードに割り当てる、該生成するステップと、
− 割り当てテーブルの各々を、互いに素なサブテーブルに分割するステップと、
− サブテーブルの各々をそれぞれデータ・スライスの一つに格納するステップであって、これにより、各データ・スライスは、相異なる割り当てテーブルから得られた二つ以上のサブテーブルを含むことができる、該格納するステップと、
− 全てのツリーのルート・ノードを、全ツリーの現在レベルに対応する現在ノードのセットとして用いるステップと、
を含む。
a)前記処理ユニットのデータ・スライス中に格納されたサブテーブルを通して単一パスを実施し、これにより、前記データ・スライスの一つ以上のデータ記録(これらはサブテーブル中に含められるか、またはサブテーブル中に示されることができる)に割り当てられている一つ以上の現在ノードを識別するステップであって、識別された現在ノードは一つ以上のツリーに所属し得る、ステップと、
b)識別された現在ノードの各々に割り当てられたデータ記録について、前記現在ノードの分岐条件を評価するステップであって、評価が行われたデータ記録は、前記データ・スライスに格納されたサブテーブル中に含められるかまたは提示されることが可能である、ステップと、
c)前記評価に基づいて、入力データ記録を前記現在ノードの各々から割り当て解除し、前記入力データ記録を前記現在ノードの一つ以上の子ノードの一つに再割り当てするステップと、
d)全ての現在ノードの子ノードを、全ツリーの現在レベルに対応する現在ノードのセットとして用いるステップと、
e)全ての割り当てテーブルの全ての入力データ記録が、これらツリーの葉ノードに割り当てられるまで、ステップa)〜d)を繰り返すステップと、
を並行して実行する。
− 割り当てテーブルに従って、前記データ記録が割り当てられたツリーの各々の中の一つの葉ノードを識別するステップと、
− 識別された葉ノード群の全クラス・ラベルまたは全クラス確率分布から、予測されるクラスを計算するステップであって、該予測されるクラスは複数の所定クラスのうちの一つであり、他の所定のクラスのいずれのものよりも高い確率を有する前記データ記録を含むと予測されているものである、該計算するステップと、
− 該予測されるクラスのクラス・ラベルを前記入力データ記録に割り当てるステップと、
を含み、
入力データ・セットの全入力データ記録の、それらのそれぞれに計算された予測されるクラスのクラス・ラベルへの割り当てが、最終的予測結果として返される。
− 割り当てテーブルに従って、前記データ記録が割り当てられたツリーの各々の中の一つの葉ノードを識別するステップと、
− 全ての識別された葉ノードの数値ターゲット属性値から派生属性値を計算するステップと、
− その派生属性値を入力データ・セットの前記データ記録に割り当てるステップと、
を含み、
入力データ・セットの全入力データ記録の、それらのそれぞれに計算された派生属性値への割り当てが、最終的予測結果として返される。例えば、データ記録に割り当てられる派生属性値は、前記データ記録について識別された全ての葉ノードに割り当てられた属性値から計算された平均値とすることができる。あるいは、この派生属性値は、各ツリーに相異なる重み付けを割り当て、その重み付けをそれぞれのツリーの葉ノードの属性値に乗ずる、重み付け平均化アプローチを用いて計算することも可能である。派生属性値を計算するための複数のさらなるアプローチを同様に適用することができる。
定義:
x:入力データ記録
n:ノード
nl:葉ノード
Q:現在の森レベルの(処理前の)現在ノードのセット(アンサンブル・モデル中のツリーの各々からの一つ以上の現在ノードを含む)
Q’:次の反復オペレーションで処理されることになる森レベルの(処理前の)現在ノードのセット(アンサンブル・モデル中のツリーの各々からの一つ以上の現在ノードを含む)
ncur,t:ツリーtの現在ノード
分散データを用いる森レベルに対する反復オペレーションによる複数ツリー式予測
1:ツリーの各々t=1;2;:::;mに対し、関連テーブルを生成し、各関連テーブルは、入力データ・セットIDSの全データ記録を前記ツリーtのルート・ノードに割り当てる;
2:関連テーブルの各々を互いに素なサブテーブルに分割する;
3:割り当てテーブルのいずれか一つから導出された全サブテーブルを相異なるデータ・スライスDSLd;d=1;2;:::;pの間で分配するが、データ・スライスはそれぞれ別個の処理ユニットによって処理可能である;
4:ツリーt=1;2;:::mのいずれか一つの現在処理されているノードのセットQを生成し、このQは全ツリーのルート・ノードから成る;
//ツリー群に対し並行して反復オペレーション処理し、これにより、全入力データ記録がこれらツリーの葉ノードに割り当てられるまで、森レベル方式で入力データ記録を再割り当てする:
5:実施条件(While) nが葉でなく、一つ以上の入力データ記録xがnに割り当てられているような一部のツリー−ノードのペア<t;n>が残っている
6: 全データ・スライスDSLd;d=1;2;:::;pに対し並行して:
//DSLd中の全サブテーブルに対し連続的にスキャンする:
7: ツリーtのいずれか1つへの入力データ記録x∈DSLdの全ての割り当てaxtに対し
8: xに割り当てられたツリーtの現在ノードncur,tを識別し、ここでncur,t∈Q;
9: xの一つ以上の属性値についてncur,tの分岐基準を評価し;
10: 前記評価に基づいて、ncur,tの一つ以上の子ノードからターゲット子ノードnctar,tを識別し;
11: ツリーtの現在ノードncur,tからxを割り当て解除し、xをツリーtのターゲット子ノードnctar,tに再割り当てし;
12: ツリーtのターゲット子ノードnctar,tをQ’に加える;
13: この段終了
14: この段終了
15: Q:=Q’;
16:実施条件終了
17:全データ・スライスDSLd;d=1;2;:::;pについて並行して:
18: ツリーtのいずれか1つへの入力データ記録x∈DSLdの全ての割り当てaxtに対し//DSLd中の全サブテーブルに対し連続的にスキャンする
19: xに割り当てられている全てのツリー−葉ノードのペア<t;nl>を識別し、個別のツリーによってxについて予測されたクラス・ラベルまたは数値ターゲット属性値を累積する:
20: この段終了
21:この段終了
22:入力データ・セットIDSの入力データ記録の各々に対し、全てのツリーによって予測されたクラス・ラベルまたは数値ターゲット属性値の累積結果から、最終的予測結果を計算する
a)ステップ514で、前記処理ユニットのデータ・スライス中に格納されたサブテーブルを通して単一回のパスを行い、これにより、前記データ・スライスの一つ以上のデータ記録に割り当てられている一つ以上の現在ノードを識別し、
b)ステップ516で、識別された現在ノード各々に割り当てられたデータ記録について、前記現在ノードの分岐条件を評価し、
c)ステップ580で、前記評価に基づいて、前記現在ノードの各々から入力データ記録を割り当て解除し、前記入力データ記録を前記現在ノードの一つ以上の子ノードの一つに再割り当てすることを行い、
d)ステップ520で、全現在ノードの子ノードを、全ツリーの現在レベルに対応する現在ノードのセットとして用い、
e)全ての割り当てテーブルの全入力データ記録がツリーの葉ノードに割り当てられるまで、ステップa)〜d)を繰り返す
ことを実行する。最終の計算ステップ524で、全ツリーの葉ノードへのデータ記録の割り当てから、最終的な合成予測結果が計算される。前記割り当ては、例えば、個別のデータ記録の分類を可能にするクラス・ラベル情報を含むものであってもよいし、あるいは、一つ以上の最終的予測データ値の計算を可能にする数値ターゲット属性値であってもよい。
356 ツリーT3の現在ノードの識別子
358 ツリーT2の現在ノードの識別子
360 ツリーT1の現在ノードの識別子
AT1〜AT3 割り当てテーブル
AXT1.1〜AXT3.10 サブテーブル
CPU1〜CPU10 処理ユニット
DSL1〜DSL10 データ・スライス
Claims (15)
- 入力データ記録のセット(IDS)についてアンサンブル・モデル(100)ベースの予測を行うための、コンピュータにより実行される方法であって、前記アンサンブル・モデルは複数のツリー(T1〜T3)を含み、前記ツリーはディシジョン・ツリーまたは回帰ツリーであり、前記方法は、複数の処理ユニット(CPU1〜CPU10)および複数のデータ・スライスを(DSL1〜DSL10)を制御するデータベース管理システムの態様で実装されており、前記データベース管理システムは、前記データ・スライスのいずれか一つに格納されているデータをそれぞれ前記処理ユニットの一つによって処理するよう動作可能であり、前記方法は、
− 前記アンサンブル・モデル中の前記ツリー(T1〜T3)の各々について割り当てテーブル(AT1〜AT3)を生成するステップ(502)であって、各割り当てテーブルは、前記入力データ・セット中の全てのデータ記録を前記ツリーのルート・ノード(NOT1、NOT2、NOT3)に割り当てる、前記生成するステップと、
− 前記割り当てテーブルの各々を、互いに素なサブテーブル(AXT1.1〜AXT1.10;AXT2.1〜AXT2.10;AXT3.1〜AXT3.10)に分割するステップ(504)と、
− 前記サブテーブルの各々をそれぞれ前記データ・スライスの一つに格納するステップ(506)と、
− 全てのツリーの前記ルート・ノード(NOT1、NOT2、NOT3)を、前記全ツリーの現在レベルに対応する現在ノードのセットとして用いるステップ(510)と、
− それぞれ自分のデータ・スライスが一つ以上の前記サブテーブルを含む、全ての前記処理ユニットによって、
a)前記処理ユニットの前記データ・スライス中に格納された前記サブテーブルを通して単一パスを実施し(514)、これにより、前記データ・スライスの一つ以上の前記データ記録に割り当てられている一つ以上の前記現在ノードを識別するステップ、
b)前記識別された現在ノード各々に割り当てられた前記データ記録に対し、前記現在ノードの分岐条件を評価するステップ(516)、
c)前記評価に基づいて、入力データ記録を前記現在ノードの各々から割り当て解除し(518)、前記入力データ記録を前記現在ノードの一つ以上の子ノードの一つに再割り当てするステップ、
d)全現在ノードの前記子ノードを、全ての前記ツリーの現在レベルに対応する現在ノードのセットとして用いるステップ(520)、および
e)全ての前記割り当てテーブルの全ての入力データ記録が、前記ツリーの葉ノードに割り当てられるまで、ステップa)〜d)を繰り返すステップ、
を並行して実行するステップ(512)と、
− 全ての前記ツリーの前記葉ノードへのデータ記録の前記割り当てから予測結果を計算するステップ(524)と、
を含む、
コンピュータにより実行される方法。 - 前記割り当てテーブルの各々が、データ記録識別子と関連するポインタとだけを含み、各割り当てテーブルの前記データ記録識別子群が、前記入力データ・セット(IDS)の全入力データ記録の前記識別子から成り、前記関連するポインタの各々が、前記ツリーのうちの一つのツリーの、前記一つ以上の現在ノードの一つをポイントし、前記識別子の一つに関連付けられた前記ポインタの各々が、前記識別子の前記データ記録を前記ポインタによって参照される前記現在ノードに割り当てる、請求項1に記載のコンピュータにより実行される方法。
- 前記互いに素なサブテーブルの各々が、入力データ記録の前記セット(IDS)の前記データ記録識別子の互いに素なサブセットを含む、請求項1または2に記載のコンピュータにより実行される方法。
- 前記データベース管理システムによって、前記サブテーブルを前記データ・スライスに転送し、それらを前記データ・スライスに格納するステップをさらに含む、請求項1〜3のいずれか一項に記載のコンピュータにより実行される方法。
- 前記転送するステップがネットワーク接続を介して実行される、請求項4に記載のコンピュータにより実行される方法。
- 同一の前記割り当てテーブルから導出された全てのサブテーブル(AXT1.1〜AXT1.10;AXT2.1〜AXT2.10;AXT3.1〜AXT3.10)を、前記データ・スライスの相異なるものに格納するステップをさらに含み、前記ステップc)の実行は、前記同一の割り当てテーブルから導出された前記サブテーブルの各々の中に包含された、データ記録の前記割り当ておよび現在ノードを並行して更新するステップを含む、請求項1〜5のいずれか一項に記載のコンピュータにより実行される方法。
- 前記データ・スライス中の前記データ記録の一つ以上を割り当てられている前記一つ以上の前記現在ノードを識別することは、前記それぞれのデータ・スライスの前記処理ユニットにより、前記データ・スライス中に格納された前記サブテーブル(AXT1.1〜AXT3.10)を並行して評価することによって実施される、請求項1〜6のいずれか一項に記載のコンピュータにより実行される方法。
- 前記予測結果を計算するステップが、
− 前記ツリーの各々について、前記ツリーの前記葉ノードへの入力データ記録の前記割り当ての派生として、ツリー固有の予測を計算するステップと、
− 前記ツリー固有の予測から最終的予測結果を計算するステップと、
を含む、請求項1〜7のいずれか一項に記載のコンピュータにより実行される方法。 - 前記ツリーの前記葉ノードが、割り当てられたクラス・ラベルまたはクラス確率分布を有し、前記ツリーはディシジョン・ツリーであり、前記ツリー固有の予測を計算するステップは、
− 前記葉ノードの前記クラス・ラベルまたは前記クラス確率分布を、前記葉ノード群に割り当てられた全ての入力データ記録に割り当てるステップ、
を含み、
前記最終的予測結果を計算するステップは、前記入力データ・セット(IDS)の前記データ記録の各々について、
− 前記割り当てテーブルに従って、前記データ記録が割り当てられた前記ツリーの各々の中の一つの葉ノードを識別するステップと、
− 前記識別された葉ノード群の全クラス・ラベルまたは全クラス確率分布から、予測されるクラスを計算するステップであって、前記予測されるクラスは複数の所定クラスのうちの一つであり、他の所定のクラスのいずれよりも高い確率を有する前記データ記録を含むように計算されるものである、前記計算するステップと、
− 前記予測されるクラスのクラス・ラベルを前記入力データ記録に割り当てるステップと、
を含み、
前記入力データ・セットの全入力データ記録の、それらのそれぞれに計算されたクラス・ラベルへの前記割り当てが、前記最終的予測結果として返される、
請求項8に記載のコンピュータにより実行される方法。 - 前記ツリーの前記葉ノードが、割り当てられた数値ターゲット属性値を有し、前記ツリーは回帰ツリーであり、前記ツリー固有の予測を計算するステップは、
− 前記葉ノードの前記数値ターゲット属性値を、前記葉ノードに割り当てられた全ての入力データ記録に割り当てるステップ、
を含み、
前記最終的予測結果を計算するステップは、前記入力データ・セット(IDS)の前記データ記録の各々について、
− 前記割り当てテーブルに従って、前記データ記録が割り当てられたツリーの各々の中の一つの葉ノードを識別するステップと、
− 全ての識別された葉ノードの前記数値ターゲット属性値から派生属性値を計算するステップと、
− 前記派生属性値を前記入力データ・セットの前記データ記録に割り当てるステップと、
を含み、
前記入力データ・セットの全入力データ記録の、それらのそれぞれに計算された派生属性値への割り当てが、前記最終的予測結果として返される、
請求項8に記載のコンピュータにより実行される方法。 - 前記方法が、前記データベース管理システムのモジュールによって実行され、前記モジュールは、並列のデータベース・エンジンまたはデータ・マイニング・モジュールである、請求項1〜10のいずれか一項に記載のコンピュータにより実行される方法。
- 前記識別された現在ノードの一つに割り当てられた前記データ記録について前記現在ノードの前記分岐条件を評価するステップが、
− 前記割り当てテーブルまたは前記割り当てテーブルのサブテーブルにアクセスすることにより、前記入力データ・セット(IDS)中の、前記現在ノードに現在割り当てられている全データ記録を識別するステップと、
− 前記識別されたデータ記録の各々の一つ以上の属性値について前記分岐条件を評価するステップと、
を含む、請求項1〜11のいずれか一項に記載のコンピュータにより実行される方法。 - ストレージ媒体上に具現化されたコンピュータ可読プログラム・コードを含むストレージ媒体であって、前記プログラム・コードは、複数の処理ユニット(CPU1〜CPU10)によって実行されると、前記処理ユニットに請求項1〜12のいずれか一項に記載の方法を実行させる、ストレージ媒体。
- − 複数の処理ユニット(CPU1〜CPU10)と、
− それぞれがデータ・スライス(DSL1〜DSL10)を含む複数のストレージ・ユニットであって、前記データ・スライスのいずれか一つに格納されたデータは、前記処理ユニットの一つによってそれぞれ選択的に処理される、前記ストレージ・ユニットと、
− 前記処理ユニットを制御しているデータベース管理システム(310)と、
を含むコンピュータ・システム(300)であって、
前記データベース管理システムは、入力データ記録のセット(IDS)についてアンサンブル・モデル(100)ベースの予測を行うための方法を実行するよう動作可能であり、前記アンサンブル・モデルは複数のツリー(T1〜T3)を含み、前記ツリーはディシジョン・ツリーまたは回帰ツリーであり、前記方法は、
− 前記アンサンブル・モデル中の前記ツリー(T1〜T3)の各々について割り当てテーブル(AT1〜AT3)を生成するステップ(502)であって、各割り当てテーブルは、前記入力データ・セット中の全てのデータ記録を前記ツリーのルート・ノード(NOT1、NOT2、NOT3)に割り当てる、前記生成するステップ(502)と、
− 前記割り当てテーブルの各々を、互いに素なサブテーブル(AXT1.1〜AXT1.10;AXT2.1〜AXT2.10;AXT3.1〜AXT3.10)に分割するステップ(504)と、
− 前記サブテーブルの各々をそれぞれ前記データ・スライスの一つに格納するステップ(506)と、
− 全てのツリーの前記ルート・ノード(NOT1、NOT2、NOT3)を、前記全ツリーの現在レベルに対応する現在ノードのセットとして用いるステップ(510)と、
− それぞれ自分のデータ・スライスが一つ以上の前記サブテーブルを含む、全ての前記処理ユニットによって、
a)前記処理ユニットの前記データ・スライス中に格納された前記サブテーブルを通して単一パスを実施し(514)、これにより、前記データ・スライスの一つ以上の前記データ記録に割り当てられている一つ以上の前記現在ノードを識別するステップ、
b)前記識別された現在ノード各々に割り当てられた前記データ記録について、前記現在ノードの分岐条件を評価するステップ(516)、
c)前記評価に基づいて、入力データ記録を前記現在ノードの各々から割り当て解除し(518)、前記入力データ記録を前記現在ノードの一つ以上の子ノードの一つに再割り当てするステップ、
d)全現在ノードの前記子ノードを、前記全ツリーの現在レベルに対応する現在ノードのセットとして用いるステップ(520)、および
e)全ての前記割り当てテーブルの全ての入力データ記録が、前記ツリーの葉ノードに割り当てられるまで、ステップa)〜d)を繰り返すステップ、
を並行して実行するステップ(512)と、
− 全ての前記ツリーの前記葉ノードへのデータ記録の前記割り当てから予測結果を計算するステップ(524)と、
を含む、
コンピュータ・システム(300)。 - 前記入力データ・セットは、前記データベース管理システムによって管理されるデータベース中に一元的に格納され、前記データ・スライスの一つをそれぞれ含む前記ストレージ・ユニットの少なくとも一部は、ネットワークを介して前記データ管理システムに接続され、前記サブテーブルの少なくとも一部は、前記ネットワークを介して前記データ・スライスに転送される、請求項14に記載のコンピュータ・システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1313245.1A GB2516493A (en) | 2013-07-25 | 2013-07-25 | Parallel tree based prediction |
GB1313245.1 | 2013-07-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015026372A JP2015026372A (ja) | 2015-02-05 |
JP6376865B2 true JP6376865B2 (ja) | 2018-08-22 |
Family
ID=49166883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014139306A Expired - Fee Related JP6376865B2 (ja) | 2013-07-25 | 2014-07-07 | 並列ツリー・ベースの予測のための、コンピュータにより実行される方法、ストレージ媒体、およびコンピュータ・システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US9710751B2 (ja) |
JP (1) | JP6376865B2 (ja) |
CN (1) | CN104345974B (ja) |
GB (1) | GB2516493A (ja) |
TW (1) | TW201512864A (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10762517B2 (en) * | 2015-07-01 | 2020-09-01 | Ebay Inc. | Subscription churn prediction |
US10394779B2 (en) | 2015-09-14 | 2019-08-27 | International Business Machines Corporation | Detecting interesting decision rules in tree ensembles |
KR20180070103A (ko) | 2016-12-16 | 2018-06-26 | 삼성전자주식회사 | 인식 방법 및 인식 장치 |
US20180373760A1 (en) * | 2017-06-23 | 2018-12-27 | Xilinx, Inc. | Parallel compute offload to database accelerator |
US10325022B1 (en) * | 2018-03-13 | 2019-06-18 | Appian Corporation | Automated expression parallelization |
KR102062531B1 (ko) | 2018-06-25 | 2020-01-06 | 주식회사 티맥스 소프트 | 결정 테이블을 결정 트리로 변환하는 데이터베이스 서버 및 컴퓨터 판독 가능 매체에 저장된 컴퓨터 프로그램 |
US10990575B2 (en) | 2019-03-22 | 2021-04-27 | Richard E Barry | Reorganization of databases by sectioning |
CN110210233B (zh) * | 2019-04-19 | 2024-05-24 | 平安科技(深圳)有限公司 | 预测模型的联合构建方法、装置、存储介质及计算机设备 |
CN110944011B (zh) * | 2019-12-16 | 2021-12-07 | 支付宝(杭州)信息技术有限公司 | 一种基于树模型的联合预测方法和系统 |
CN111178408B (zh) * | 2019-12-19 | 2023-06-20 | 中国科学院计算技术研究所 | 基于联邦随机森林学习的健康监护模型构建方法、系统 |
US11568272B2 (en) | 2020-06-09 | 2023-01-31 | International Business Machines Corporation | Generating native code with dynamic reoptimization for ensemble tree model prediction |
US11551099B1 (en) * | 2020-06-27 | 2023-01-10 | Unicorn Labs Llc | Smart sensor |
US11823077B2 (en) | 2020-08-13 | 2023-11-21 | International Business Machines Corporation | Parallelized scoring for ensemble model |
US20220092437A1 (en) * | 2020-09-21 | 2022-03-24 | International Business Machines Corporation | Efficient execution of a decision tree |
KR20240035663A (ko) * | 2022-09-08 | 2024-03-18 | 재단법인 아산사회복지재단 | 트리 기반의 앙상블 모델을 이용하여 시퀀스 모델의 입력 데이터의 피처를 선택하는 방법 및 장치 |
KR20240054645A (ko) | 2022-10-19 | 2024-04-26 | 주식회사 케이티 | 복수의 단일 모델에 대한 앙상블 모델을 관리하는 서버, 방법 및 컴퓨터 프로그램 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0764793A (ja) * | 1993-08-30 | 1995-03-10 | Nippon Telegr & Teleph Corp <Ntt> | 多数決型クラスタリング装置 |
US5870735A (en) * | 1996-05-01 | 1999-02-09 | International Business Machines Corporation | Method and system for generating a decision-tree classifier in parallel in a multi-processor system |
US6546379B1 (en) | 1999-10-26 | 2003-04-08 | International Business Machines Corporation | Cascade boosting of predictive models |
US6938049B2 (en) | 2002-06-11 | 2005-08-30 | The Regents Of The University Of California | Creating ensembles of decision trees through sampling |
CN1145901C (zh) | 2003-02-24 | 2004-04-14 | 杨炳儒 | 一种基于信息挖掘的智能决策支持构造方法 |
JP2006155344A (ja) | 2004-11-30 | 2006-06-15 | Toshiba Corp | データ分析装置、データ分析プログラム及びデータ分析方法 |
US8290882B2 (en) * | 2008-10-09 | 2012-10-16 | Microsoft Corporation | Evaluating decision trees on a GPU |
US8078642B1 (en) * | 2009-07-24 | 2011-12-13 | Yahoo! Inc. | Concurrent traversal of multiple binary trees |
US8768944B2 (en) * | 2010-08-18 | 2014-07-01 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
US8571924B2 (en) * | 2011-07-05 | 2013-10-29 | Yahoo! Inc. | High performance personalized advertisement serving by exploiting thread assignments in a multiple core computing environment |
US9547830B2 (en) * | 2013-05-07 | 2017-01-17 | Wise.Io, Inc. | Scalable, memory-efficient machine learning and prediction for ensembles of decision trees for homogeneous and heterogeneous datasets |
-
2013
- 2013-07-25 GB GB1313245.1A patent/GB2516493A/en not_active Withdrawn
-
2014
- 2014-06-20 TW TW103121445A patent/TW201512864A/zh unknown
- 2014-07-07 JP JP2014139306A patent/JP6376865B2/ja not_active Expired - Fee Related
- 2014-07-10 US US14/327,918 patent/US9710751B2/en not_active Expired - Fee Related
- 2014-07-25 CN CN201410359973.4A patent/CN104345974B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
GB2516493A (en) | 2015-01-28 |
GB201313245D0 (en) | 2013-09-11 |
CN104345974B (zh) | 2017-10-13 |
US9710751B2 (en) | 2017-07-18 |
JP2015026372A (ja) | 2015-02-05 |
US20150032680A1 (en) | 2015-01-29 |
TW201512864A (zh) | 2015-04-01 |
CN104345974A (zh) | 2015-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6376865B2 (ja) | 並列ツリー・ベースの予測のための、コンピュータにより実行される方法、ストレージ媒体、およびコンピュータ・システム | |
KR102198680B1 (ko) | 확장 가능한 멀티-스테이지 데이터 처리 시스템들에서의 효율적인 데이터 캐싱 관리 | |
US11372869B2 (en) | Frequent pattern mining | |
US11175953B2 (en) | Determining an allocation of computing resources for a job | |
US7941804B1 (en) | Allocating resources among tiered partitions of different types | |
CN107239335B (zh) | 分布式系统的作业调度系统及方法 | |
US9740706B2 (en) | Management of intermediate data spills during the shuffle phase of a map-reduce job | |
US9684874B2 (en) | Parallel decision or regression tree growing | |
CN113015970B (zh) | 划分知识图谱的方法、系统和介质 | |
WO2016078008A1 (zh) | 调度数据流任务的方法和装置 | |
US20130151535A1 (en) | Distributed indexing of data | |
EP1524599B1 (en) | A method of reassigning objects to processing units | |
CN115564204B (zh) | 供应链中的需求资源配置并行处理方法 | |
US10296227B2 (en) | System and method for dynamic cache distribution for in-memory data grids | |
US20210397485A1 (en) | Distributed storage system and rebalancing processing method | |
JPH0844577A (ja) | データ分割方法及びマルチプロセッサシステム | |
Shabeera et al. | A novel approach for improving data locality of mapreduce applications in cloud environment through intelligent data placement | |
Noon et al. | Scheduling parallel data transfers in multi-tiered persistent storage | |
CN116755893B (zh) | 面向深度学习的分布式计算系统的作业调度方法和装置 | |
US20230075114A1 (en) | Resource allocation in cloud computing systems | |
Idris et al. | In-map/in-reduce: Concurrent job execution in MapReduce | |
Ghannane | Mapping Neural Network Inference Onto Heterogeneous Hardware Platforms | |
Moni et al. | AI Based Cloud Failure Detection and Prevention Algorithm | |
Martınez | Parallel Task Graphs Scheduling Based on the Internal Structure | |
Velarde Martínez | Parallel Task Graphs Scheduling Based on the Internal Structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180724 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6376865 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |