JP5159368B2 - 変化分析システム、方法及びプログラム - Google Patents
変化分析システム、方法及びプログラム Download PDFInfo
- Publication number
- JP5159368B2 JP5159368B2 JP2008049729A JP2008049729A JP5159368B2 JP 5159368 B2 JP5159368 B2 JP 5159368B2 JP 2008049729 A JP2008049729 A JP 2008049729A JP 2008049729 A JP2008049729 A JP 2008049729A JP 5159368 B2 JP5159368 B2 JP 5159368B2
- Authority
- JP
- Japan
- Prior art keywords
- classifier
- data
- change
- data set
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・変化の度合いを、仮想ラベルに対する分類器の精度を使って評価する方法、
・その変化の度合いを、2項分布の信頼区間から導かれる閾値と比較することで、変化の有意さを評価する方法、
・仮想ラベルに対する分類器の属性選択機能により、変化分析問題を解く方法、
が提供される。
そうして、p >= pbi(1+γ) のとき変化は有意とみなし、そうでなければ、変化なし、と判定する。
なお、pbiは、下記の式で与えられる。
分類器とは、一般的に、yを予測する関数F(x,w)とあらわされる。
ここで、xは、ある多次元ベクトル、
yは、データのクラス(ラベル)で、例えば、集合{-1, +1}
wは、分類器のパラメータで、多次元ベクトル、行列などであらわされる。
テスト集合訓練集合Xs: {(x'1,y'1), ..., (x'm,y'm)}に対して、分類器の性能を測るのが、次のステップである。すなわち、2乗誤差関数の例で言えば、
F(x,w) < 0なら、xのクラスを-1と予測し、
F(x,w) >= 0なら、xのクラスを+1と予測するようなものである。
w' = w + yi * xi
この式の意味は、次のようにしてみると理解しやすい。
w'*xi = w*xi + yi * |xi|2
この式において、yi = -1の場合、w'*xiから値が|xi|2だけ減り、
F(x,w) < 0になりやすく、
yi = +1の場合、w'*xiから値が|xi|2だけ増え、
F(x,w) >= 0になりやすい。
これは、最も単純な線形判別器の例である。この例の場合、パラメータwは、スカラーではなく、データxと同じ、d次元のベクトルである。
すなわち、w・x < 0なら、xのクラスを-1と予測し、
w・x >= 0なら、xのクラスを、+1と予測する。
ロジスティック回帰は、線形判別器の確率版の拡張と考えることもできる。ここでも、パラメータwは、スカラーではなく、データxと同じ、次元数のベクトルである。
SVM(Support Vector Machine)は、訓練データ同士の類似度に基づいてパラメータwを決定し、F(x, w)の符号でテストデータの分類を行う。類似度の計算部分において、データの内積の代わりに何らかの非線形関数用いるカーネル・トリックにより、非線形な境界面による判別が可能となる。パラメータwは任意の非線形関数のパラメータであり、データxと同じ次元とは限らない。
ここでは、w = {W1(行列), w1(ベクトル)}である。
F(x,w)は、非線形であり、好適には、二次関数である。
すなわち、
x・W1・x + w1・x < 0なら、xのクラスを-1と予測し、
x・W1・x + w1・x >= 0なら、xのクラスを+1と予測する。
決定木は、上述の、線形判別器を変形または拡張した分類器とは、全く異なる概念の分類器である。すなわち、wは、各データxを2分割するルールの集合である。書き表すと次のとおりである。
w = {(次元数、閾値、クラス),(次元数、閾値、クラス),...}
ここで、次元数とは、ベクトルであるデータxの成分の番号である。閾値とは、その成分の値を判断するための値であり、すなわち、(次元数、閾値、クラス)とは、データxの対応する次元数の成分が、その閾値より小さいとき、当該クラスに属する、という意味である。すなわち、wがそのまま、決定木の形に対応している。
次に、図2の仮想ラベル付与部204の処理を説明する。仮想ラベル付与部204では、下記の式に示すように、データセットXA311の各データに、+1のラベルが付与され、データセットXB312の各データに、-1のラベルが付与される。
次に、図2の変化検出部206の処理を説明する。変化検出部206には予め、分割数kと有意水準αが与えられる。
p = CV(L,k,Xバー)
p >= pbi(1 + γ)
(1) Xバーを、上記分割数kで、k等分する。Xバーのデータ数が、kで割り切れないとき、k番目の分割されたグループのデータ数が半端になっても構わないが、なるべく均一な分割数になるように、上記分割数kは選ばれる。
そうして、そのそれぞれを、
X(1)バー、X(2)バー、・・・X(k)バーとする。
(2) ある 1 <= j <= kについて、X(j)バーを選び、
残りの{X(i)バー | i≠j, 1 <= i <= k}を用いて、分類器Lを訓練する。分類器Lの学習または訓練については、上述のとおりである。
(3) こうして訓練された分類器Lに、X(j)バーを通し、その分類精度pjを計算する。ここでいう分類精度pjとは、X(j)バーの個々のデータを通した結果、分類器Lによって予測されるラベルと、そのデータのラベルが一致する度合いである。
(4) こうして、k通りのjに対して、pjを求める。
(5) 下記の式で、戻り値pを求める。
変化分析部208では、図3のステップ332に示すように、Xバーを使って、分類器Lを訓練する。ステップ334では、分類器Lの特徴選択機能を用いて、分類に寄与する属性を、その寄与度と共にランク付けして出力する。
<分布の一致の条件>
XAとXBの分布が同一であるという条件は、「2値分類器の分類精度がPbi(1+γ)未満である」という条件に言い換えられる。このことを説明する。
XAとXBが同一の分布に従うと考え、先に定義した仮想ラベル付きデータで2値分類器を訓練した時の精度がどうなるかを考える。仮定より、ラベルy を与えた時のデータの分布について、p(x|y=+1) = p(x|y=-1)が成り立つ。この関数をf(x)と表す。生成モデルの観点で見れば、分類器を学習するとは、本質的にはデータxを与えた時のラベルyの確率分布を与えることである。
NA/(NA + NB)もしくはNB/(NA + NB)となる。分類精度としてはこれらのうち大きいほうを取るべきだから、結局、数12で定義されたpbiを得る。
q = NA / (NA + NB) を得る。分類精度としては、qと(1-q) のうち大きい方を取るべきだから、結局は上と同様に、数12で定義されたpbiを得る。
変化検出部のp >= pbi(1 + γ)における、パラメータγの値は、有意水準αを適当に定めることにより合理的に決めることができるので、そのことを説明する。
話を簡単にするため、以下NA > NBと仮定する。変化検出部における分岐条件は、Aの出現回数NAを確率変数にした2項検定により実現できる。すなわちpが
なお、一般に、正例もしくは負例の出現回数の期待値が5以上ならば2項分布の正規近似が妥当とされるので、正規分布
NA 〜 N(NA|Npbi,Npbi(1-pbi))
を用いて、検定を行ってもよい。
なお、最近傍検定については、Norbert Henze, "A multivariate two-sample test based on the number of nearest neighbor type coincidences," Annals of Statistics Vol.16, No.2, pp.772-783 (1988)などの文献を参照されたい。
今まで説明した例の手順は、基本的に、ラベルなしデータに対する変化解析を行うものである。しかし、以下に説明する前処理とともに用いることにより、本発明は、離散ラベル付きデータの変化分析にも適用できる。離散ラベル付きデータの変化分析は、2つの、仮想分類器ではない本物の分類器があったとき、その差異の詳細を得る目的にも使うことができるため、実用上重要である。コンセプトドリフトに関する従来研究の多くは、ドリフトを検知することに主眼が置かれ、変化の質を説明する能力に難があった。本発明によれば、ラベル付きデータの比較問題を、ラベルなしのデータの比較問題に帰着させることにより、分類器に対する変化分析問題を解くことができる。
(1) データセットXAバーと、XBバーを、空に初期化する。
(2) Dtを用いてL'を訓練し、分類器Mtを作る。
(3) Dsを用いてL'を訓練し、分類器Msを作る。
(4) DtをMsで分類し、誤分類したxをXAバーに加え、正答したものをXBバーに加える。
(5) DsをMtで分類し、誤分類したxをXAバーに加え、正答したものをXBバーに加える。
(6) XAバーのサイズをNA、XBバーのサイズをNBとしたとき、誤分類率ρ = NA/(NA + NB)が、所定の値以下なら、「相違なし」を出力。それ以外なら、XAバーと、XBバーを出力。
本発明は、3つ以上のデータセットの比較にも使うことができる。例えば、データセットXAバー、XBバー、XCバーがあったとすると、3値分類器を使うことによって、3つのデータセットの違いを特徴付けることができる。これは、上述の分類器同士の比較問題で重要である。なぜなら、例えば+1を-1と誤ったものをXA1バー、-1を+1と誤ったものをXA2バーのように分け、3クラス問題とすれば、より詳細な変化分析ができるからである。
データセットXAバーとして、d =10次元正規分布から抽出した500個のサンプルを考える。ただし平均はゼロ(d 次元ゼロベクトル)とし、第1番目の変数(Attr1と表す)は標準偏差4、他は標準偏差1である。一方、データセットXBバーは、同じく、d=10次元のゼロ平均正規分布から抽出した500個のサンプルであるが、今度は第2番目の変数(Attr2と表す)だけが標準偏差4、他は標準偏差1である。
実験によれば、サブルーチンCVにより得られた分類精度は約80%であり、大幅に有意水準を越えた。変化分析部で生成された変化モデルを図9に示す。四角の内部の177/3などは、(そのノードに入ったサンプル数)/(誤分類されたサンプル数)を表している。図は、明らかに、最上位の4つまでの分岐規則がAtt1とAttr2によることを示しており、正しく二つの属性が同定されていることが分かる。
実データの例として、ある破綻した会社の電子メールデータの変化分析を行った。この会社は、2001年末に破綻した。その過程の電子メールのデータが研究用に公開されている。データセットは約27万件の電子メールを含み、各電子メールはいわゆるBag-Of-Words表現で表されている。頻度の多い順に100ないし150の単語を選び、そのいわゆるTF-IDF(term frequency-inverse document frequency)のヒューリスティックスを用いて頻度を特徴ベクトルとを生成した。
実験では素朴に頻度上位の語から特徴ベクトルを作ったので、emailやWeektodayといった一般語が見かけ上分類に大きく寄与しているように見える。この傾向はd =100の分析でより強い。これはd が小さいと、一般語の占める割合が相対的に高く、それゆえ、変化分析モデルにもそのような傾向が現れるためと理解できる。一方、dを大きく取ると、より限定的な意味を持つ語の数が増える。
以下、<ラベル付きデータへの応用>の節で述べた、ラベル付きデータの変化解析問題について、具体例を示す。ある組織における学会活動を管理するデータベースにおいて、各活動の重要度の変化分析を考える。このデータベースには、入力された各活動について(ある観点から)重要であるか否かという2値のラベルが付与されている。入力される各活動は、レコードID、日付、社員番号、社員名、タイトル、カテゴリー、組織、グループなど15次元(d =15)で表現される。重要性というカラムには、入力された活動データが重要度の高いデータであるか否かという情報が含まれている。ここで、重要性カラムに入力される値は、Yes または No の2値であるとし、この値は機械的に入力されるのではなく、データベース管理担当者が年度毎に変更されるガイドラインやこれまでの慣例に従い入力しているものとする。従って、同じ内容の活動を行った場合であっても入力された時期により、Yes と入力されるか No と入力されるかが異なるということが発生する(DB管理担当者の交代なども原因の一つである)。
(1) Dtを用いて2値分類器L'を訓練して分類器Mtを作成し、
(2) Dsに対して、L'を訓練し、分類器Msを作成する。具体的にはMt、Msとして決定木を作成した。続けて、
(3) Dtに対して、Msで分類を行った。但し、ここでは、2値ではなく4値に分類するので、正しい値Yesに対してNoと誤分類したデータをXAバーに、Yesと分類したデータをXBバーに加え、また、正しい値Noに対して、Yesと誤分類したデータをXCバーに、Noと分類したデータをXDバーに加えた。同様に、
(4) DsをMtで分類し、それぞれ、XAバー、XBバー、XCバー、XDバーに加えた。得られたサイズNA、NB、NC、NDのXAバー、XBバー、XCバー、XDバーを加えたものをXバーとする。
Claims (20)
- コンピュータの機能により、変化を比較すべき2つのデータセットの変化分析を行うための変化分析システムであって、
第1のデータセットの各々のデータに第1の仮想ラベルを付与し、第2のデータセットの各々のデータに、該第1の仮想ラベルとは異なる第2の仮想ラベルを付与して、ラベル付きデータセットを用意するための仮想ラベル付与部と、
前記仮想ラベルを使用して分類を行う分類器と、
前記ラベル付きデータセットによって、前記分類器を訓練し、該分類器の分類に寄与する属性の寄与度を出力するための変化分析部とを有する、
変化分析システム。 - 前記分類器が、ロジスティック回帰である、請求項1のシステム。
- 前記分類器が、SVM(support vector machine)である、請求項1のシステム。
- 前記分類器が、決定木である、請求項1のシステム。
- 前記第1及び第2の仮想ラベルが、それぞれ、+1と-1である、請求項1のシステム。
- コンピュータの機能により、変化を比較すべき2つのデータセットの変化分析を行うための変化分析システムであって、
第1のデータセットの各々のデータに第1の仮想ラベルを付与し、第2のデータセットの各々のデータに、該第1の仮想ラベルとは異なる第2の仮想ラベルを付与して、ラベル付きデータセットを用意するための仮想ラベル付与部と、
前記ラベル付きデータセットの間の有意な変化を検出するための変化検出部と、
前記仮想ラベルを使用して分類を行う分類器と、
前記変化検出部が有意な変化を検出したことに応答して、前記ラベル付きデータセットによって、前記分類器を訓練し、該分類器の分類に寄与する属性の寄与度を出力するための変化分析部とを有する、
変化分析システム。 - 前記分類器が、ロジスティック回帰である、請求項6のシステム。
- 前記分類器が、SVMである、請求項6のシステム。
- 前記分類器が、決定木である、請求項6のシステム。
- 前記第1及び第2の仮想ラベルが、それぞれ、+1と-1である、請求項6のシステム。
- コンピュータの機能により、変化を比較すべき2つのデータセットの変化分析を行うための変化分析方法であって、
第1のデータセットの各々のデータに第1の仮想ラベルを付与し、第2のデータセットの各々のデータに、該第1の仮想ラベルとは異なる第2の仮想ラベルを付与して、ラベル付きデータセットを用意するステップと、
前記ラベル付きデータセットの間の有意な変化を検出する変化検出ステップと、
前記変化検出ステップで有意な変化が検出されたことに応答して、前記ラベル付きデータセットによって、前記仮想ラベルを使用して分類を行う分類器を訓練し、該分類器の分類に寄与する属性の寄与度を出力するためのステップとを有する、
変化分析方法。 - 前記分類器が、ロジスティック回帰である、請求項11の方法。
- 前記分類器が、SVMである、請求項11の方法。
- 前記分類器が、決定木である、請求項11の方法。
- 前記第1及び第2の仮想ラベルが、それぞれ、+1と-1である、請求項11の方法。
- コンピュータの機能により、変化を比較すべき2つのデータセットの変化分析を行うための変化分析プログラムあって、
前記コンピュータに、
第1のデータセットの各々のデータに第1の仮想ラベルを付与し、第2のデータセットの各々のデータに、該第1の仮想ラベルとは異なる第2の仮想ラベルを付与して、ラベル付きデータセットを用意するステップと、
前記ラベル付きデータセットの有意な変化を検出する変化検出ステップと、
前記変化検出ステップで有意な変化が検出されたことに応答して、前記ラベル付きデータセットによって、前記仮想ラベルを使用して分類を行う分類器を訓練し、該分類器の分類に寄与する属性の寄与度を出力するためのステップとを実行させる、
変化分析プログラム。 - 前記分類器が、ロジスティック回帰である、請求項16のプログラム。
- 前記分類器が、SVMである、請求項16のプログラム。
- 前記分類器が、決定木である、請求項16のプログラム。
- 前記第1及び第2の仮想ラベルが、それぞれ、+1と-1である、請求項16のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008049729A JP5159368B2 (ja) | 2008-02-29 | 2008-02-29 | 変化分析システム、方法及びプログラム |
US12/372,545 US8417648B2 (en) | 2008-02-29 | 2009-02-17 | Change analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008049729A JP5159368B2 (ja) | 2008-02-29 | 2008-02-29 | 変化分析システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009205615A JP2009205615A (ja) | 2009-09-10 |
JP5159368B2 true JP5159368B2 (ja) | 2013-03-06 |
Family
ID=41013916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008049729A Active JP5159368B2 (ja) | 2008-02-29 | 2008-02-29 | 変化分析システム、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8417648B2 (ja) |
JP (1) | JP5159368B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9626631B2 (en) | 2014-06-20 | 2017-04-18 | International Business Machines Corporation | Analysis device, analysis method, and program |
CN107728476A (zh) * | 2017-09-20 | 2018-02-23 | 浙江大学 | 一种基于SVM‑forest的从非平衡类数据中提取敏感数据的方法 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5974325B2 (ja) * | 2012-09-11 | 2016-08-23 | 東海光学株式会社 | 光学レンズのクラス判別方法 |
CN104750734B (zh) * | 2013-12-30 | 2018-05-11 | 华为技术有限公司 | 基于线性支持向量机的分类方法及装置 |
WO2016056095A1 (ja) * | 2014-10-08 | 2016-04-14 | 株式会社Ubic | データ分析システム、データ分析システムの制御方法、およびデータ分析システムの制御プログラム |
US10504035B2 (en) | 2015-06-23 | 2019-12-10 | Microsoft Technology Licensing, Llc | Reasoning classification based on feature pertubation |
CN106096736B (zh) * | 2016-05-27 | 2020-03-24 | 大连楼兰科技股份有限公司 | 基于FP-Tree序列模式挖掘的故障诊断与估价的平台 |
CN106056221B (zh) * | 2016-05-27 | 2019-10-29 | 大连楼兰科技股份有限公司 | 基于FP-Tree序列模式挖掘和故障码分类的车辆远程诊断与备件检索的方法 |
CN106095785B (zh) * | 2016-05-27 | 2020-03-24 | 大连楼兰科技股份有限公司 | 基于决策树分类的故障码诊断车辆工项与备件检索方法 |
CN106056222B (zh) * | 2016-05-27 | 2020-03-24 | 大连楼兰科技股份有限公司 | 基于FP-Tree序列模式挖掘的故障诊断与估价的方法 |
CN106056223B (zh) * | 2016-05-27 | 2020-04-14 | 大连楼兰科技股份有限公司 | 用于车辆远程诊断与备件检索的平台 |
CN106021545B (zh) * | 2016-05-27 | 2019-12-24 | 大连楼兰科技股份有限公司 | 用于车辆远程诊断与备件检索的方法 |
CN106227768B (zh) * | 2016-07-15 | 2019-09-03 | 国家计算机网络与信息安全管理中心 | 一种基于互补语料的短文本观点挖掘方法 |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
CN106650815A (zh) * | 2016-12-28 | 2017-05-10 | 北京航天测控技术有限公司 | 动态粒子群算法优化的多核支持向量机吊舱故障诊断方法及装置 |
JP6838510B2 (ja) * | 2017-07-03 | 2021-03-03 | 富士通株式会社 | 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム |
CN107844799B (zh) * | 2017-10-17 | 2021-06-08 | 西安建筑科技大学 | 一种集成svm机制的冷水机组故障诊断方法 |
CN108021931A (zh) | 2017-11-20 | 2018-05-11 | 阿里巴巴集团控股有限公司 | 一种数据样本标签处理方法及装置 |
US11423052B2 (en) * | 2017-12-14 | 2022-08-23 | International Business Machines Corporation | User information association with consent-based class rules |
CN108537260A (zh) * | 2018-03-29 | 2018-09-14 | 上海交通大学 | 一种起重机传动轴故障诊断方法和系统 |
CN108830302B (zh) * | 2018-05-28 | 2022-06-07 | 苏州大学 | 一种图像分类方法、训练方法、分类预测方法及相关装置 |
CN108829088B (zh) * | 2018-07-20 | 2021-11-05 | 深圳市道通科技股份有限公司 | 汽车诊断方法、装置及存储介质 |
CN109032872B (zh) * | 2018-08-13 | 2021-08-10 | 广东电网有限责任公司广州供电局 | 基于贝叶斯网络的设备故障诊断方法及系统 |
CN109165687B (zh) * | 2018-08-28 | 2021-06-15 | 哈尔滨理工大学 | 基于多分类支持向量机算法的车用锂电池故障诊断方法 |
CN109299732B (zh) * | 2018-09-12 | 2020-05-05 | 北京三快在线科技有限公司 | 无人驾驶行为决策及模型训练的方法、装置及电子设备 |
EP3807821A1 (en) * | 2018-09-28 | 2021-04-21 | Apple Inc. | Distributed labeling for supervised learning |
US11481667B2 (en) * | 2019-01-24 | 2022-10-25 | International Business Machines Corporation | Classifier confidence as a means for identifying data drift |
CN109947086B (zh) * | 2019-04-11 | 2020-07-28 | 清华大学 | 基于对抗学习的机械故障迁移诊断方法及系统 |
US11537915B2 (en) * | 2020-05-14 | 2022-12-27 | International Business Machines Corporation | Targeted data acquisition for model training |
US20240161005A1 (en) * | 2021-03-01 | 2024-05-16 | Medial Earlysign Ltd. | Add-on to a machine learning model for interpretation thereof |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4194697B2 (ja) * | 1998-10-22 | 2008-12-10 | 株式会社野村総合研究所 | 分類ルール探求式クラスター分析装置 |
JP2001022776A (ja) | 1999-07-09 | 2001-01-26 | Hitachi Ltd | ルール生成結果通知システム |
JP2003316797A (ja) | 2002-04-26 | 2003-11-07 | Hitachi Ltd | 情報分析システムおよび方法 |
JP3897169B2 (ja) * | 2002-11-07 | 2007-03-22 | 富士電機ホールディングス株式会社 | 決定木生成方法およびモデル構造生成装置 |
JP2005208709A (ja) * | 2004-01-20 | 2005-08-04 | Fuji Xerox Co Ltd | データ分類処理装置、およびデータ分類処理方法、並びにコンピュータ・プログラム |
US20070021918A1 (en) * | 2004-04-26 | 2007-01-25 | Georges Natsoulis | Universal gene chip for high throughput chemogenomic analysis |
US7223234B2 (en) * | 2004-07-10 | 2007-05-29 | Monitrix, Inc. | Apparatus for determining association variables |
US8095389B2 (en) * | 2006-07-17 | 2012-01-10 | H. Lee Moffitt Cancer Center And Research Institute, Inc. | Computer systems and methods for selecting subjects for clinical trials |
US7899625B2 (en) * | 2006-07-27 | 2011-03-01 | International Business Machines Corporation | Method and system for robust classification strategy for cancer detection from mass spectrometry data |
-
2008
- 2008-02-29 JP JP2008049729A patent/JP5159368B2/ja active Active
-
2009
- 2009-02-17 US US12/372,545 patent/US8417648B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9626631B2 (en) | 2014-06-20 | 2017-04-18 | International Business Machines Corporation | Analysis device, analysis method, and program |
CN107728476A (zh) * | 2017-09-20 | 2018-02-23 | 浙江大学 | 一种基于SVM‑forest的从非平衡类数据中提取敏感数据的方法 |
CN107728476B (zh) * | 2017-09-20 | 2020-05-22 | 浙江大学 | 一种基于SVM-forest的从非平衡类数据中提取敏感数据的方法 |
Also Published As
Publication number | Publication date |
---|---|
US20090222389A1 (en) | 2009-09-03 |
JP2009205615A (ja) | 2009-09-10 |
US8417648B2 (en) | 2013-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5159368B2 (ja) | 変化分析システム、方法及びプログラム | |
US10990901B2 (en) | Training, validating, and monitoring artificial intelligence and machine learning models | |
Wallace et al. | Class probability estimates are unreliable for imbalanced data (and how to fix them) | |
Sarazin et al. | Expert system dedicated to condition-based maintenance based on a knowledge graph approach: Application to an aeronautic system | |
Poole et al. | On statistic alignment for domain adaptation in structural health monitoring | |
Khan et al. | Robustness of AI-based prognostic and systems health management | |
Shabestari et al. | A survey on the applications of machine learning in the early phases of product development | |
Sakhrawi et al. | Software enhancement effort prediction using machine-learning techniques: A systematic mapping study | |
Munger et al. | The use of domain knowledge models for effective data mining of unstructured customer service data in engineering applications | |
Noroozi | Data Heterogeneity and Its Implications for Fairness | |
Viktoriia et al. | Machine learning methods in medicine diagnostics problem | |
Pombo et al. | Contribution of temporal sequence activities to predict bug fixing time | |
Priya et al. | Data analytics: feature extraction for application with small sample in classification algorithms | |
Jabbari et al. | Obtaining accurate probabilistic causal inference by post-processing calibration | |
Arshad et al. | Using CNN to Predict the Resolution Status of Bug Reports | |
Ueda et al. | Mitigating voter attribute bias for fair opinion aggregation | |
Humble et al. | Coincident learning for unsupervised anomaly detection of scientific instruments | |
Ersöz et al. | Data mining and machine learning approaches in data science: Predictive modeling of traffic accident causes | |
Qazi et al. | Discovering temporal patterns from insurance interaction data | |
Burgard et al. | Mixed-Integer Linear Optimization for Semi-Supervised Optimal Classification Trees | |
Turkoglu et al. | Application of data mining in failure estimation of cold forging machines: An industrial research | |
Assefa et al. | Software Risk Prediction at Requirement and Design Phase: An Ensemble Machine Learning Approach | |
Kocyigit | Process of machine learning methods | |
US20240062079A1 (en) | Assigning trust rating to ai services using causal impact analysis | |
Steinberger et al. | Comprehensive variability analysis of requirements and testing artifacts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101027 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120601 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5159368 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |