JP2005524124A - システムの診断構成要素を識別するための方法および装置 - Google Patents
システムの診断構成要素を識別するための方法および装置 Download PDFInfo
- Publication number
- JP2005524124A JP2005524124A JP2003536930A JP2003536930A JP2005524124A JP 2005524124 A JP2005524124 A JP 2005524124A JP 2003536930 A JP2003536930 A JP 2003536930A JP 2003536930 A JP2003536930 A JP 2003536930A JP 2005524124 A JP2005524124 A JP 2005524124A
- Authority
- JP
- Japan
- Prior art keywords
- model
- distribution
- components
- sample
- subset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioethics (AREA)
- Computational Mathematics (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- General Engineering & Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Complex Calculations (AREA)
Abstract
Description
(a)構成要素と構成要素加重との線形結合を発生し、この線形結合において、各訓練サンプルが1つの既知の特徴を有している複数の訓練サンプルから発生されたデータから各構成要素に対する値が決定され、
(b)ある特徴の確率分布に対するモデルを規定し、このモデルは線形結合を条件付けし、また、このモデルは2クラス反応に対する二項分布を、線形結合とこの反応の期待値とをリンクするプロビット関数と組合せたものではなく、
(c)ゼロに近い高い確率密度を有するハイパープライア(hyperprior)を含む線形結合の構成要素加重に対して事前(prior)分布を構成し、
(d)この事前分布とモデルとを組合せて事後(posterior)分布を生成し、
(e)この事後分布を最大にする構成要素加重を有する構成要素の部分集合を識別するステップを含んでいる。
xi Tβgは、構成要素加重βgを有する訓練サンプルiからの入力データから発生された線形結合であり、
xi Tは、Xのi番目の行に対する構成要素であり、βgはサンプルクラスgに対する構成要素加重のセットであり、
訓練サンプルiがクラスgのメンバーである場合、eig=1であり、そうでない場合にはeig=0であり、
Xは、p個の構成要素を含むn個の訓練サンプルからのデータである。
γikは、訓練サンプルiがk以下である識別子を有するクラスに属している確率であり(ここで、順序付けられたクラスの合計はGである)、
xi Tβ*は、構成要素加重β* iを有する訓練サンプルiからの入力データから発生された線形結合であり、
xi Tは、Xのi番目の行に対する構成要素であり、
rijは、
観察iがクラスj中のものである場合はcij=1であり、そうでない場合はcij=0である。
y=(y1,・・・,yn)Tであり、yiはi番目のサンプルに関して測定された特性であり、
ai(φ)=φ/wiであり、wiは既知の加重の固定されたセットであり、φは単一の
スケールパラメータであり、
関数b(.)およびc(.)はNelderおよびWedderburn氏等による文献(1972)において定義されたものであり、
E{yi}=b’(θi)
Var{y}=b’’(θi)ai(φ)=τi 2ai(φ)であることが好ましい。
E{yi}=b’(θi)=h(ηi)
であることが好ましい。
ZはXの行の再配列であるマトリックスであることが好ましく、ここでZの行の順序付けは生存時間の順序付けにより誘発された順序付けに対応し、dは生存時間を順序付けるために必要とされる同じ置換により検閲削除インデックスを順序付けた結果である。また、ZjはマトリックスZのj番目の行であり、djはdのj番目のエレメントであり、ここで、
ここで、vはハイパーパラメータのp×1ベクトルであり、また、p(β|v2)はN(0,diag{v2})であり、p(v2)はv2に対するあるハイパープライア分布である。このハイパープライア分布(この方法の全ての実施形態に対して同じであることが好ましい)は、種々の表記規定を使用して表現されてもよく、好ましい実施形態の詳細な説明(以下、参照)においては、以下の表記規定は単に特定の好ましい実施形態に対する便宜性のために採用されたに過ぎない。
ハイパープライアは、ジェフェリーのハイパープライアである(KotzおよびJohnson氏等の文献、1983)。
(a)複数の被験者をテスト治療に露出し、その治療に対する反応に基づいて被験者を反応グループにグループ化し、
(b)被験者の構成要素を測定し、
(c)統計的解析方法を使用して被験者を反応グループに分類することのできる構成要素の部分集合を識別するステップを含むテスト治療に対する反応によって規定される。
統計的解析方法は、本発明の第1の特徴による方法であることが好ましい。
(a)被験者の測定された構成要素を受取る手段と、
(b)統計的解析方法を使用して被験者を反応グループに分類することのできる構成要素の部分集合を識別する手段とを備えている。
統計的解析方法は、本発明の第1または第2の特徴による方法であることが好ましい。
第4の特徴において、本発明は、被験者をテスト化合物による治療に反応した者あるいは反応しなかった者として分類することのできる被験者の構成要素の部分集合を識別する方法を提供し、この方法は、
(a)複数の被験者を化合物に露出し、その化合物に対する各被験者の反応に基づいて被験者を反応グループにグループ化し、
(b)被験者の構成要素を測定し、
(c)統計的解析方法を使用して被験者を反応グループに分類することのできる構成要素の部分集合を識別するステップを含んでいる。
統計的解析方法は、第1の特徴による方法であることが好ましい。
(c)被験者の測定された構成要素を受取る手段と、
(d)統計的解析方法を使用して被験者を反応グループに分類することのできる構成要素の部分集合を識別する手段とを備えている。
統計的解析方法は、本発明の第1または第2の特徴による方法であることが好ましい。
本発明の第2乃至第5の特徴において測定された構成要素は、たとえば、その被験者の遺伝子または小さいヌクレオチド多型(SNPs)、蛋白質、抗体、炭水化物、脂質、あるいは任意の別の測定可能な構成要素であることができる。
(a)各訓練サンプルが1つの既知の特徴を有している複数の訓練サンプルから発生されたデータから各構成要素に対する値が導かれる、構成要素と構成要素加重との線形結合を発生する手段と、
(b)線形結合を条件とし、また、2クラス反応に対する二項分布を、線形結合とこの反応の期待値とをリンクするプロビット関数と組合せたものではない、ある特徴の確率分布に対するモデルを規定する手段と、
(c)ゼロに近い高い確率密度を有するハイパープライアを含む線形結合の構成要素加重に対して事前分布を構成する手段と、
(d)この事前分布とモデルとを組合せて事後分布を生成する手段と、
(e)この事後分布を最大にする構成要素加重を有する構成要素の部分集合を識別する手段とを具備している。
この装置は、適切にプログラムされた計算装置を備えていてもよい。
システムは生物学的システムであることが好ましい。
(a)構成要素と構成要素加重との線形結合を発生し、この線形結合において、各訓練サンプルが1つの既知の特徴を有している複数の訓練サンプルから発生されたデータから各構成要素に対する値が決定され、
(b)ある特徴の確率分布に対するモデルを規定し、このモデルは線形結合を条件とし、
(c)ゼロに近い高い確率密度を有するハイパープライアを含む線形結合の構成要素加重に対して事前分布を構成し、
(d)この事前分布とモデルとを組合せて事後分布を生成し、
この事後分布を最大にする構成要素加重を有する構成要素の部分集合を識別するステップを含んでいる。
A.多クラスロジスティック回帰モデル
この実施形態の方法は、訓練サンプルを予め規定されたグループに分類することのできる構成要素の部分集合を識別するために訓練サンプルを使用する。続いて、たとえば、臨床テストのようなテストに対して構成要素の部分集合の情報を使用して、サンプルに病気クラスのようなグループに分類することができる。たとえば、DNAマイクロアレイの構成要素の部分集合は、臨床サンプルを、たとえば、健康または病気のような臨床的に適切なクラスにグループ化するために使用されることができる。
各サンプルクラス(グループ)にはあるクラスラベルyiが関連付けられており、ここでyi=k,k∈{1,・・・,G}であり、これは、訓練サンプルがGのサンプルクラスのいずれに属しているかを示す。エレメントyiを有するn×lベクトルをyと書く。そのベクトル:
yi=gならば、eig=1
その他場合、eig=0 (1A)
pigは、入力データXiを有する訓練サンプルがサンプルクラスg中に存在する確率であり、
xi Tβgは、構成要素加重βgを有する訓練サンプルiからの入力データから発生された線形結合であり、
xi TはXのi番目の行に対する構成要素であり、βgはサンプルクラスgに対する構成要素加重のセットである。
h=gならば、δhg=1
そうでない場合、δhg=0である。
βg=Pgγg;
ここで、Pgはゼロと1との、PT gβgがβgのゼロでないエレメントを選択するようなマトリックスである;
γ=(γg,g=1,・・・,G−1)
g=hの場合、 δgh=1
それ以外の場合、δgh=0
および
Xg T=Pg TXT , g=1,・・・,G−1 (17A)
(a)p(g)≧nであるとき、式(19A)に式(20A)を代入したものを使用して、δt g=γt+1 g−γt g
(b)δt=(δt g,g=1,・・・,G−1)と書く。式(12A)をαtの関数として最大化する(あるいは単に増加させる)
収斂するまでステップ(a)乃至(c)を繰り返す。
これによって、たとえば、現在のQ関数をγの関数として最大化するγ*n+1が生成される。
g=1,・・・,G−1に対して、
このステップにより、小さい係数を有する変数がモデルから除去される。
B.順序付けられたカテゴリー的モデル
この実施形態の方法は訓練サンプルを使用して、あるテストサンプルが特定のクラスに属しているか否かを決定するために使用されることのできる構成要素の部分集合を識別することができる。たとえば、マイクロアレイ解析を使用して組織生検サンプルを評価するために遺伝子を識別するために、正常な組織、良性の組織、局所化した腫瘍および転移した腫瘍組織のような、前に病気の重大度が増加するまたは減少するクラスに順序付けられた組織からの一連のサンプルからのマイクロアレイデータは、訓練サンプルに関連した病気の重大度を示すことのできる構成要素の部分集合を識別するために訓練サンプルとして使用される。その後、構成要素の部分集合は、以前分類されていなかったテストサンプルが正常、良性、局所化した腫瘍、または転移した腫瘍組織のいずれとして分類されるかを決定するために後続的に使用されることができる。したがって、構成要素の部分集合は、テストサンプルが順序付けられたクラスセット内の特定のクラスに属するかどうかの診断に役立つ。構成要素の部分集合がひとたび識別されると、将来の診断処理手続きにおいて、あるサンプルが順序付けられたクラスのどれに属しているのかを決定するのに、その構成要素の部分集合がテストされるだけでよいことが認識される。
観察iがクラスj中のものである場合、cij=1
そうでない場合、cij=0
により与えられるエレメントcijを有するn×pマトリックスとし、Rを
これらは、行内におけるCの列の累積的な和である。
ここにおいて、vec{ }はマトリックスをとり、ベクトル行×行を成す。
上記の順序付けられたカテゴリーに関して、
1.n=0,S0={1,2,・・・,p},φ(0) および(たとえば)ε=10-5を設定する。レギュラリゼーション(regularization)パラメータκを1よりはるかに大きい値、たとえば、100に設定する。これは、1/κ2を第2の微分マトリックスの第1のG−1対角エレメントに以下のMステップで加算することに対応する。
γ(n)=Pn Tβ(n) , β(n)=Pnγ(n)
γ=Pn Tβ , β=Pnγ
を満足させるような0と1とのマトリックスとする。
それ以外の場合、wβi=0
であるようにwβ=(wβi,i=1,p)と定義し、wγ=Pnwβとする。
Q(γr+1|γ(n))>Q(γr|γ(n))
を保証するようにラインサーチアルゴリズムによって選択される。
ガウスのラジアル基礎関数 exp(−||x−y||2/a),a>0
逆マルチクアドリック(multiquadric) (||x−y||2+c2)-1/2
マルチクアドリック (||x−y||2+c2)1/2
薄板スプライン ||x−y||2n+1
||x−y||2nln(||x−y||)
マルチレーヤ知覚 適切なθに対して、tanh(x’y−θ)
度数dの多項式 (1+x’y)d
Bスプライン B2n+1(x−y)
三角多項式 sin((d+1/2)(x−y))/sin((x−
y)/2)
表1:カーネル関数の例
C.一般化された線形モデル
この実施形態の方法は、あるサンプルの特徴を予測することのできる構成要素の部分集合を識別するために訓練サンプルを使用する。後続的に、構成要素の部分集合の知識は、重要な特徴の未知の値を予測するための、たとえば、臨床テスト等の、テストのために使用されることができる。たとえば、DNAマイクロアレイの構成要素の部分集合は、たとえば、血液グルコースレベル、白血球細胞数、腫瘍の寸法、腫瘍の成長速度または生存時間等の、臨床的に関連した特徴を予測するために使用されることができる。
μi==b’(θi)=h(ηi)
である。
・尤度または(スケールされた)逸脱関数
・リンク関数
・リンク関数の微分
・分散関数。
(c)n=0,S0={1,2,・・・,p}を設定することによりアルゴリズムを初期化し、φ(0) ,β*を初期化し、たとえばε=10-5のようなεに対する値を適用する;
(d)iεSnのときは、βi (n) =βi *,
それ以外のときは、βi (n) =0 (5C)
と定義し、pnを、β(n)のゼロでないエレメントγ(n)が
γ(n)=Pn Tβ(n) , β(n)=Pnγ(n)
γ=Pn Tβ , β=Pnγ
を満足させるような0と1とのマトリックスとする。
(e)以下の関数を使用して構成要素加重の事後分布の条件付き期待値を計算することにより推定(E)ステップを行う:
Q(γr+1|γ(n),φ(n))>Q(γr|γ(n),φ(n))
を保証するようにラインサーチアルゴリズムによって選択され、また、
(j)収斂をチェックする。||γ*−γ(n)||<ε2である場合、ε2は適切に小さく、停止し、その他の場合、上記のステップ(b)に進む。
(a)n=0,S0={1,2,・・・,p},φ(0) を設定することによりアルゴリズムを初期化し、たとえばε=10-5のようなεに対する値を適用し、
p≦Nである場合、
それ以外のときは、βi (n) =0
と定義し、pnを、β(n)のゼロでないエレメントγ(n)が
γ(n)=Pn Tβ(n) , β(n)=Pnγ(n)
γ=Pn Tβ , β=Pnγ
を満足させるような0と1とのマトリックスとする。
(c)以下の関数を使用して構成要素加重の事後分布の条件付き期待値を計算することにより推定(E)ステップを行う:
Q(γr+1|γ(n),φ(n))>Q(γr|γ(n),φ(n))
を確実にするようにラインサーチアルゴリズムによって選択され、また、
p≦Nである場合、
ガウスのラジアル基礎関数 exp(−||x−y||2/a),a>0
逆マルチクアドリック(multiquadric) (||x−y||2+c2)-1/2
マルチクアドリック (||x−y||2+c2)1/2
薄板スプライン ||x−y||2n+1
||x−y||2nln(||x−y||)
マルチレーヤ知覚 適切なθに対して、tanh(x’y−θ)
度数dの多項式 (1+x’y)d
Bスプライン B2n+1(x−y)
三角多項式 sin((d+1/2)(x−y))/sin((x−
y)/2)
表3:カーネル関数の例
D.比例ハザードモデル
この実施形態の方法は、規定された事象(たとえば、死、回復等)がある時間期間内に発生する確率に影響を与えることのできる構成要素の部分集合を識別するために訓練サンプルを使用することができる。訓練サンプルはシステムと、その訓練サンプルが得られたときからその事象が発生したときまで測定された時間とから得られる。統計的方法を使用して、複数の訓練サンプルから得られたデータにより時間を事象に関連付けることにより、事象までの時間の分布を予想することのできる構成要素の部分集合が識別されることができる。後続的に、その構成要素の部分集合の情報は、たとえば、死までの時間または病気の再発までの時間の統計的特徴を予測するために、たとえば、臨床テスト等のテストに対して使用されることができる。たとえば、システムの構成要素の部分集合からのデータは、DNAマイクロアレイから得られることができる。このデータは、たとえば、期待されるまたは中間的な患者の生存時間のような臨床的に関連した事象を予測するために、あるいはある症状の始まりまたは病気の再発を予測するために使用されることができる。
yiが検閲削除されていない場合、ci=1、
yiが検閲削除された場合、ci=0
を表す。
1実施形態において、尤度関数によって規定されたモデルは、コックスの比例ハザードモデルである。コックスの比例ハザードモデルはコックス氏によって導入され(1972年)、好ましいことに、生存データに対する回帰モデルとして使用されることができる。コックスの比例ハザードモデル:
j<iである場合、ζi,j=0
j≧iである場合、ζi,j=1
このモデルは、生存分布のパラメトリック形態が特定されておらず、生存時間の通常の特性だけが使用されることが好ましい(リスクセットの決定において)ため、非パラメトリックであることに注意されたい。これは非パラメトリックなケースであるため、
1.n=0,S0={1,2,・・・,p}を設定する。vを、構成要素Viを有するベクトルとする。ここで、たとえば0.001のような、ある小さいεに対して、
ci=1である場合、Vi=1−ε,
ci=0である場合、Vi=ε
である。fはlog(v/t)であると定義する。
||γr−γr+1||<ε(たとえば、10-5)
であるときのγrの値とする。
ci=1である場合、Vi=1−ε,
ci=0である場合、Vi=ε
である。fはlog(v/Λ(y,φ))であると定義する。
p≦Nである場合、
||γr−γr+1||<ε(たとえば、10-5)
であるときのγrの値とする。
例1:対数回帰モデルを使用する前立腺癌に対する2グループ分類
組織を前立腺および非前立腺グループに分類することのできる遺伝子の部分集合を識別するために、Luo氏他の文献(2001)で報告され、解析されたマイクロアレイデータセットは、二項ロジスティック回帰がモデルとして使用される本発明の方法を使用して解析された。このデータセットは6500の人の遺伝子に関するマイクロアレイを含んでいる。研究対象には、前立腺癌を有することが知られている16人の被験者と、良性の前立腺細胞過形成である9人の被験者が含まれている。しかしながら、表現を単に簡潔にするために、50の遺伝子が解析のために選択された。この50の全ての遺伝子の遺伝子発現率(行)および25人の患者(列)は表4に示されている。
組織を異なった臨床タイプのリンパ腫に分類することのできる遺伝子の部分集合を識別するために、Alizadeh,A.A.氏他の文献[Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling,Nature 403:503-511(2000)]で報告され、解析されたデータセットは、二項ロジスティック回帰がモデルとして使用される本発明の方法を使用して解析された。
予測されたクラス1 予測されたクラス2
真のクラス1 20 1
真のクラス2 0 21
サンプルを多数のクラスの1つに分類することのできる遺伝子を識別するために、Yeoh氏他の文献[Cancer Cell v1 : 133-143(2002)]で報告され、解析されたデータセットは、尤度が多項ロジスティック回帰に基づいて使用される本発明の方法を使用して解析された。Yeoh氏他の文献に記載されているものと同じ予備処理が適用されている。これは、以下から構成されている:
・8つのアレイ:BCR.ABL.R4,MLL.R5,Normal.R4,T.ALL.R7,T.ALL.R8,Hyperdip.50.2M.3,Hypodip.2M.3,およびHypodip.2M.2をドロップする
・各アレイの平均反応値を2500に設定する
・しきい値化する;100より小さい45000個の値に設定された45000個を越える値が1に設定される
・存在が0.01未満の遺伝子が除去される;これは合計1607個の遺伝子である
・最大値と最小値との間の差が100未満であった遺伝子(1604個)が除去される
1.BCR−ABL;
2.E2A−PBX1;
3.Hyperdip>50;
4.MLL;
5.T−ALLおよび
6.TEL−AML1
この例は、この方法が一般化された線形モデルフレームワークでどのようにして実施されることができるかを示す。この例は、200の観察および41の変数(基礎関数)に関する標準回帰問題である。真の曲線はエラー(または雑音)を伴なって観察され、変数の一部だけに依存することが知られている。反応は連続し、正規分布される。これらのデータは、一般化された線形モデル変数選択のために本発明のアルゴリズムを使用して解析される。
EM反復:1 期待事後分布:-55.45434 基礎関数 41 シグマの2乗 0.5607509
EM反復:2 期待事後分布:-43.96193 基礎関数 41 シグマの2乗 0.5773566
EM反復:3 期待事後分布:-48.87198 基礎関数 39 シグマの2乗 0.5943395
EM反復:4 期待事後分布:-52.79632 基礎関数 31 シグマの2乗 0.6072137
EM反復:5 期待事後分布:-55.18578 基礎関数 28 シグマの2乗 0.6161707
EM反復:6 期待事後分布:-56.5303 基礎関数 23 シグマの2乗 0.6224545
EM反復:7 期待事後分布:-57.47589 基礎関数 17 シグマの2乗 0.626674
EM反復:8 期待事後分布:-58.0566 基礎関数 15 シグマの2乗 0.6293923
EM反復:9 期待事後分布:-58.41912 基礎関数 13 シグマの2乗 0.6315789
EM反復:10 期待事後分布:-58.6923 基礎関数 11 シグマの2乗 0.633089
EM反復:11 期待事後分布:-58.88766 基礎関数 10 シグマの2乗 0.6343793
EM反復:12 期待事後分布:-59.05261 基礎関数 10 シグマの2乗 0.635997
EM反復:13 期待事後分布:-59.24126 基礎関数 9 シグマの2乗 0.6381456
EM反復:14 期待事後分布:-59.47668 基礎関数 9 シグマの2乗 0.640962
EM反復:15 期待事後分布:-59.7677 基礎関数 9 シグマの2乗 0.6443392
EM反復:16 期待事後分布:-60.10277 基礎関数 9 シグマの2乗 0.6477088
EM反復:17 期待事後分布:-60.44193 基礎関数 9 シグマの2乗 0.6508144
EM反復:18 期待事後分布:-60.7684 基礎関数 9 シグマの2乗 0.6539145
EM反復:19 期待事後分布:-61.09251 基礎関数 9 シグマの2乗 0.6565873
EM反復:20 期待事後分布:-61.38427 基礎関数 8 シグマの2乗 0.6589498
EM反復:21 期待事後分布:-61.65061 基礎関数 8 シグマの2乗 0.6615976
EM反復:22 期待事後分布:-61.92217 基礎関数 8 シグマの2乗 0.664281
EM反復:23 期待事後分布:-62.17683 基礎関数 7 シグマの2乗 0.6663748
EM反復:24 期待事後分布:-62.37402 基礎関数 7 シグマの2乗 0.6679655
EM反復:25 期待事後分布:-62.51645 基礎関数 7 シグマの2乗 0.6689011
EM反復:26 期待事後分布:-62.59567 基礎関数 6 シグマの2乗 0.6689011
EM反復:27 期待事後分布:-62.6151 基礎関数 6 シグマの2乗 0.6690962
EM反復:28 期待事後分布:-62.61717 基礎関数 6 シグマの2乗 0.6691031
EM反復:29 期待事後分布:-62.61739 基礎関数 5 シグマの2乗 0.6691035
この例は例4に類似しているが、しかし簡潔にするために、少数の変数(10)が使用される。これによって、全データセットが一覧表にされることが可能になる(表7参照)。従属変数は最初の4つの変数だけの関数であり、残りの変数は雑音である。
この例は、http://llmpp.nih.gov/lymphoma/data.shtml からの実際の生存データを使用する。
文書による証明を完全なものにするために、ランダムに選択された47個の遺伝子と全データセットの解析で意味のあるものとして識別された3個の遺伝子とを含む50個の遺伝子が、Alizadeh氏他の文献に記載されている遺伝子の部分集合に基づいて選択された例もまた示されている。データは以下の表9に示されている。
1.NAP正常な
2.BPH良性の
3.PCA局所化した
4.MET転移した
カテゴリーが存在する。
この例は、データセットが50個の選択された遺伝子に減少されていることを除いて、例9のものと同一である。これらの遺伝子の1つは例9において重要であると認められた遺伝子であり、その他のものはランダムに選択された。この例の目的は、完全に表にされたデータセット(表10)に基づいて例証を行うことである。
1.NAP正常な
2.BPH良性の
3.PCA局所化した
4.MET転移した
カテゴリーが存在する。
図5を参照とすると、本発明の実施形態による方法を実施するのに適したパーソナルコンピュータ20が示されている。コンピュータ20は、ハードディスクデータ記憶装置21上に記憶されたソフトウェアタプログラムの命令の下で動作する。コンピュータ20はさらに、プロセッサ22、メモリ23、表示スクリーン24、プリンタ25、ならびにマウス26およびキーボード27のような入力装置を備えている。コンピュータはインターネット28へのネットワーク接続27のような通信手段、またはデータのダウンロードまたは収集および共用を容易にするデータ収集手段28を有していてもよい。
Claims (35)
- テストサンプルの特徴を予測することのできるシステムの構成要素の部分集合を識別する方法において、
(a)構成要素と構成要素加重との線形結合を発生し、この線形結合において、各訓練サンプルが1つの既知の特徴を有している複数の訓練サンプルから発生されたデータから各構成要素に対する値が導かれ、
(b)ある特徴の確率分布に対するモデルを規定し、このモデルは線形結合を条件付けし、また、このモデルは2クラス反応に対する二項分布を、線形結合とこの反応の期待値とをリンクするプロビット関数と組合せたものではなく、
(c)ゼロに近い高い確率密度を有するハイパープライア(hyperprior)を含む線形結合の構成要素加重に対して事前(prior)分布を構成し、
(d)この事前分布とモデルとを組合せて事後(posterior)分布を生成し、
(e)この事後分布を最大にする構成要素加重を有する構成要素の部分集合を識別するステップを含んでいる方法。 - モデルは、多項または二項ロジスティック回帰、一般化された線形モデル、コックスの比例ハザードモデル、およびパラメトリック生存モデルを含むグループから選択されたモデルに基づいた尤度関数である請求項1記載の方法。
- モデルは、多項または二項ロジスティック回帰に基づいた尤度関数である項1または2記載の方法。
- ロジスティック回帰は、多項または二項分布を有する特徴をモデル化する請求項2または3記載の方法。
- 構成要素の部分集合はロジスティック回帰を規定することによってサンプルを複数の予め規定されたグループの1つに分類することが可能であり、このロジスティック回帰はサンプルを複数のサンプルグループにグループ化することを含んでおり、各サンプルグループは共通のグループ識別子を有している請求項1乃至4のいずれか1項記載の方法。
- 構成要素の部分集合は、ロジスティック回帰を規定することによってサンプルをクラスに分類することができ、このクラスは複数の予め規定された順序付けられたクラスの1つであり、前記ロジスティック回帰は、各グループ識別子が順序付けられたクラスのメンバーに対応している一連のグループ識別子を規定し、サンプルを順序付けられたクラスの1つにグループ化することを含んでいる請求項1または2記載の方法。
- モデルは、一般化された線形モデルに基づいた尤度関数である請求項1または2記載の方法。
- 一般化された線形モデルは、分布の正規指数族として分布された特徴をモデル化する請求項9記載の方法。
- 分布の正規指数族は、正規分布、ガウス分布、ポアソン分布、指数分布、ガンマ分布、x2分布、および逆ガンマ分布からなるグループから選択される請求項10記載の方法。
- 構成要素の部分集合は、一般化された線形モデルを規定することによってサンプルの予め規定された特性を予測することができ、この一般化された線形モデルは予測される特性をモデル化することを含んでいる請求項1または2記載の方法。
- 一般化された線形モデルは、
y=(y1,・・・,yn)Tであり、yiはi番目のサンプルに関して測定された特性であり、
ai(φ)=φ/wiであり、wiは既知の加重の固定されたセットであり、φは単一の
スケールパラメータであり、
関数b(.)およびc(.)はNelderおよびWedderburn氏等による文献(1972)において定義されたものであり、
E{yi}=b’(θi)
Var{y}=b’’(θi)ai(φ)=τi 2ai(φ)であり、
ここで、各観察はコバリエイト(covariate)xiと線形予測子ηi=xi Tβとのセットを有している請求項9または10記載の方法。 - モデルは、コックスの比例ハザードモデル、パラメトリック生存モデルおよび加速された生存時間モデルからなるグループから選択されたモデルに基づいた尤度関数である請求項1または2記載の方法。
- 構成要素の部分集合は、コックスの比例ハザードモデル、パラメトリック生存モデルまたは加速された生存時間モデルに基づいて尤度を規定することにより、あるサンプルに対するある事象までの時間を予測することができ、この尤度は、複数のサンプルに対して、そのサンプルが得られた時間からその事象の時間までに経過した時間を測定することを含んでいる請求項1記載の方法。
- 事後分布は、反復的な処理手続きを使用して最大化される請求項1乃至20のいずれか1項記載の方法。
- 反復的な処理手続きは、EMアルゴリズムである請求項21記載の方法。
- システムは、生物学的システムである請求項1乃至22のいずれか1項記載の方法。
- 生物学的システムは、バイオテクノロジーアレイである請求項23記載の方法。
- バイオテクノロジーアレイは、DNAアレイ、蛋白質アレイ、抗体アレイ、RNAアレイ、炭水化物アレイ、化学物質アレイ、脂質アレイからなるグループから選択される請求項24記載の方法。
- 各グループがテスト治療に対する反応によって規定されている複数の予め規定されたグループの1つに部分集合を分類することのできる被験者の構成要素の部分集合を識別する方法において、
(d)複数の被験者をテスト治療に露出し、そのテスト治療に対する反応に基づいて被験者を反応グループにグループ化し、
(e)被験者の構成要素を測定し、
(f)請求項1乃至25のいずれか1項記載の方法を使用して被験者を反応グループに分類することのできる構成要素の部分集合を識別するステップを含んでいる方法。 - 構成要素は、遺伝子、小さいヌクレオチド多型(SNPs)、蛋白質、抗体、炭水化物、脂質からなるグループから選択される請求項26記載の方法。
- システムから発生されたデータからのテストサンプルの特徴を、そのシステムからの複数のサンプルから予測することのできるシステムの構成要素の部分集合を識別する装置において、
(a)各訓練サンプルが1つの既知の特徴を有している複数の訓練サンプルから発生されたデータから各構成要素に対する値が導かれる、構成要素と構成要素加重との線形結合を発生する手段と、
(b)線形結合を条件付けし、また、2クラス反応に対する二項分布を、線形結合とこの反応の期待値とをリンクするプロビット関数と組合せたものではない、ある特徴の確率分布に対するモデルを規定する手段と、
(c)ゼロに近い高い確率密度を有するハイパープライアを含む線形結合の構成要素加重に対して事前分布を構成する手段と、
(d)この事前分布とモデルとを組合せて事後分布を生成する手段と、
(e)この事後分布を最大にする構成要素加重を有する構成要素の部分集合を識別する手段とを具備している装置。 - 計算装置にロードされたときにこの計算装置を制御して、請求項1乃至27のいずれか1項記載の方法を実行するように構成されているコンピュータプログラム。
- 請求項1乃至27のいずれか1項記載の方法により実施される請求項29記載のコンピュータプログラム。
- 請求項29または30記載のコンピュータプログラムを提供するコンピュータ読出し可能な媒体。
- システムからのサンプルをテストしてそのサンプルの特徴を識別する方法において、
特徴の診断に役立つ構成要素の部分集合をテストするステップを含んでおり、
構成要素の部分集合は請求項1乃至27のいずれか1項記載の方法によって決定されている方法。 - サンプルの特徴を決定するためにシステムからのサンプルをテストする装置において、
請求項1乃至27のいずれか1項記載の方法にしたがって識別された構成要素をテストする手段を備えている装置。 - 計算装置上で実行されたときに、システムからのテストサンプルの特徴を予測することのできるそのシステムからの構成要素を識別する方法でこの計算装置を制御するように構成されており、構成要素と構成要素加重との線形結合は、各訓練サンプルが1つの既知の特徴を有する複数の訓練サンプルから発生されたデータから発生され、ゼロに近い高い確率密度を有するハイパープライアを含む構成要素加重に対する事前分布と、線形結合に条件付けするモデルとを組合せることによって事後分布が発生され、それによって事後分布を最大にする構成要素加重を推定し、前記モデルは2つのクラス反応に対する二項分布を、線形結合とこの反応の期待値とをリンクするプロビット関数と組合せたものではないコンピュータプログラム。
- 生物学的システムからのテストサンプルの特徴を予測することのできる生物学的システムの構成要素の部分集合を識別する方法において、
(a)構成要素と構成要素加重との線形結合を発生し、この線形結合において、各訓練サンプルが1つの既知の特徴を有している複数の訓練サンプルから発生されたデータから各構成要素に対する値が決定され、
(b)ある特徴の確率分布に対するモデルを規定し、このモデルは線形結合に条件付けし、
(c)ゼロに近い高い確率密度を有するハイパープライアを含む線形結合の構成要素加重に対して事前分布を構成し、
(d)この事前分布とモデルとを組合せて事後分布を生成し、
(e)この事後分布を最大にする構成要素加重を有する構成要素の部分集合を識別するステップを含んでいる方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AUPR8321A AUPR832101A0 (en) | 2001-10-17 | 2001-10-17 | Method and apparatus for identifying diagnostic components of a sys tem |
AUPS0556A AUPS055602A0 (en) | 2002-02-15 | 2002-02-15 | Method and apparatus for identifying diagnostic components of a system |
AUPS1844A AUPS184402A0 (en) | 2002-04-19 | 2002-04-19 | Method and apparatus for identifying predictive components of a system |
PCT/AU2002/001417 WO2003034270A1 (en) | 2001-10-17 | 2002-10-17 | Method and apparatus for identifying diagnostic components of a system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005524124A true JP2005524124A (ja) | 2005-08-11 |
Family
ID=27158321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003536930A Pending JP2005524124A (ja) | 2001-10-17 | 2002-10-17 | システムの診断構成要素を識別するための方法および装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050171923A1 (ja) |
JP (1) | JP2005524124A (ja) |
AU (1) | AU2002332967B2 (ja) |
CA (1) | CA2464364A1 (ja) |
WO (1) | WO2003034270A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101517898B1 (ko) * | 2013-05-06 | 2015-05-07 | 서울시립대학교 산학협력단 | 도시형태결정요소 기반의 공간개발 패턴 추정 시스템 및 방법 |
KR20210124710A (ko) * | 2020-04-07 | 2021-10-15 | 강만수 | 광고 제공 시스템 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7395253B2 (en) | 2001-06-18 | 2008-07-01 | Wisconsin Alumni Research Foundation | Lagrangian support vector machine |
AU2003902589A0 (en) * | 2003-05-26 | 2003-06-12 | Commonwealth Scientific And Industrial Research Organisation | A method for identifying a subset of components of a system |
US7421417B2 (en) * | 2003-08-28 | 2008-09-02 | Wisconsin Alumni Research Foundation | Input feature and kernel selection for support vector machine classification |
US20060149713A1 (en) * | 2005-01-06 | 2006-07-06 | Sabre Inc. | System, method, and computer program product for improving accuracy of cache-based searches |
CA2597947C (en) * | 2005-02-16 | 2014-05-13 | Genetic Technologies Limited | Methods of genetic analysis involving the amplification of complementary duplicons |
US7894568B2 (en) * | 2005-04-14 | 2011-02-22 | Koninklijke Philips Electronics N.V. | Energy distribution reconstruction in CT |
US20060241904A1 (en) * | 2005-04-26 | 2006-10-26 | Middleton John S | Determination of standard deviation |
US20070269818A1 (en) * | 2005-12-28 | 2007-11-22 | Affymetrix, Inc. | Carbohydrate arrays |
JPWO2008111349A1 (ja) * | 2007-03-09 | 2010-06-24 | 日本電気株式会社 | 生存分析システム、生存分析方法および生存分析用プログラム |
US9275353B2 (en) * | 2007-11-09 | 2016-03-01 | Oracle America, Inc. | Event-processing operators |
JP4810552B2 (ja) * | 2008-04-25 | 2011-11-09 | 株式会社東芝 | 故障確率算出に用いられる生存曲線を生成する装置および方法 |
US9361274B2 (en) * | 2013-03-11 | 2016-06-07 | International Business Machines Corporation | Interaction detection for generalized linear models for a purchase decision |
US8912512B1 (en) | 2013-06-26 | 2014-12-16 | General Electric Company | System and method for optical biopsy tissue characterization |
EP3251024A4 (en) * | 2015-01-27 | 2018-06-06 | National ICT Australia Limited | Group infrastructure components |
US10817796B2 (en) * | 2016-03-07 | 2020-10-27 | D-Wave Systems Inc. | Systems and methods for machine learning |
KR101747783B1 (ko) * | 2016-11-09 | 2017-06-15 | (주) 바이오인프라생명과학 | 특정 항목이 속하는 클래스를 예측하기 위한 2-클래스 분류 방법 및 이를 이용하는 컴퓨팅 장치 |
CN109323876B (zh) * | 2018-09-17 | 2020-10-16 | 中国人民解放军海军工程大学 | 一种估计伽玛型单元可靠性参数的方法 |
WO2020180424A1 (en) | 2019-03-04 | 2020-09-10 | Iocurrents, Inc. | Data compression and communication using machine learning |
US10691528B1 (en) * | 2019-07-23 | 2020-06-23 | Core Scientific, Inc. | Automatic repair of computing devices in a data center |
CN111984626A (zh) * | 2020-08-25 | 2020-11-24 | 西安建筑科技大学 | 一种基于统计模式的能耗数据识别与修复方法 |
CN113609785B (zh) * | 2021-08-19 | 2023-05-09 | 成都数融科技有限公司 | 基于贝叶斯优化的联邦学习超参数选择系统及方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4573354A (en) * | 1982-09-20 | 1986-03-04 | Colorado School Of Mines | Apparatus and method for geochemical prospecting |
US5159249A (en) * | 1989-05-16 | 1992-10-27 | Dalila Megherbi | Method and apparatus for controlling robot motion at and near singularities and for robot mechanical design |
CU22179A1 (es) * | 1990-11-09 | 1994-01-31 | Neurociencias Centro | Metodo y sistema para la evaluacion y graficacion de la actividad fisiologica electromagnetica anormal del cerebro y corazon |
US6018587A (en) * | 1991-02-21 | 2000-01-25 | Applied Spectral Imaging Ltd. | Method for remote sensing analysis be decorrelation statistical analysis and hardware therefor |
DE69227545T2 (de) * | 1991-07-12 | 1999-04-29 | Mark R Robinson | Oximeter zur zuverlässigen klinischen Bestimmung der Blutsauerstoffsättigung in einem Fötus |
DE4221807C2 (de) * | 1992-07-03 | 1994-07-14 | Boehringer Mannheim Gmbh | Verfahren zur analytischen Bestimmung der Konzentration eines Bestandteiles einer medizinischen Probe |
US5596992A (en) * | 1993-06-30 | 1997-01-28 | Sandia Corporation | Multivariate classification of infrared spectra of cell and tissue samples |
US5435309A (en) * | 1993-08-10 | 1995-07-25 | Thomas; Edward V. | Systematic wavelength selection for improved multivariate spectral analysis |
US5983251A (en) * | 1993-09-08 | 1999-11-09 | Idt, Inc. | Method and apparatus for data analysis |
US5416750A (en) * | 1994-03-25 | 1995-05-16 | Western Atlas International, Inc. | Bayesian sequential indicator simulation of lithology from seismic data |
GB2292605B (en) * | 1994-08-24 | 1998-04-08 | Guy Richard John Fowler | Scanning arrangement and method |
US6035246A (en) * | 1994-11-04 | 2000-03-07 | Sandia Corporation | Method for identifying known materials within a mixture of unknowns |
US5569588A (en) * | 1995-08-09 | 1996-10-29 | The Regents Of The University Of California | Methods for drug screening |
US5713016A (en) * | 1995-09-05 | 1998-01-27 | Electronic Data Systems Corporation | Process and system for determining relevance |
US6031232A (en) * | 1995-11-13 | 2000-02-29 | Bio-Rad Laboratories, Inc. | Method for the detection of malignant and premalignant stages of cervical cancer |
EP0991932A1 (en) * | 1997-06-27 | 2000-04-12 | Pacific Northwest Research Institute | Methods of differentiating metastatic and non-metastatic tumors |
FR2768818B1 (fr) * | 1997-09-22 | 1999-12-03 | Inst Francais Du Petrole | Methode statistique de classement d'evenements lies au proprietes physiques d'un milieu complexe tel que le sous-sol |
US20020102553A1 (en) * | 1997-10-24 | 2002-08-01 | University Of Rochester | Molecular markers for the diagnosis of alzheimer's disease |
US6324531B1 (en) * | 1997-12-12 | 2001-11-27 | Florida Department Of Citrus | System and method for identifying the geographic origin of a fresh commodity |
US6216049B1 (en) * | 1998-11-20 | 2001-04-10 | Becton, Dickinson And Company | Computerized method and apparatus for analyzing nucleic acid assay readings |
US6298315B1 (en) * | 1998-12-11 | 2001-10-02 | Wavecrest Corporation | Method and apparatus for analyzing measurements |
US6341257B1 (en) * | 1999-03-04 | 2002-01-22 | Sandia Corporation | Hybrid least squares multivariate spectral analysis methods |
US6415233B1 (en) * | 1999-03-04 | 2002-07-02 | Sandia Corporation | Classical least squares multivariate spectral analysis |
US6349265B1 (en) * | 1999-03-24 | 2002-02-19 | International Business Machines Corporation | Method and apparatus for mapping components of descriptor vectors for molecular complexes to a space that discriminates between groups |
US6853920B2 (en) * | 2000-03-10 | 2005-02-08 | Smiths Detection-Pasadena, Inc. | Control for an industrial process using one or more multidimensional variables |
GB0007788D0 (en) * | 2000-03-30 | 2000-05-17 | Pharmacia & Upjohn Spa | Method to evaluate the therapeutic and toxic effects related to drug administration |
US20020077775A1 (en) * | 2000-05-25 | 2002-06-20 | Schork Nicholas J. | Methods of DNA marker-based genetic analysis using estimated haplotype frequencies and uses thereof |
GB0013010D0 (en) * | 2000-05-26 | 2000-07-19 | Ncr Int Inc | Method and apparatus for predicting whether a specified event will occur after a specified trigger event has occurred |
AU2001296266A1 (en) * | 2000-09-19 | 2002-04-02 | The Regents Of The University Of California | Method for determining measurement error for gene expression microarrays |
WO2002025405A2 (en) * | 2000-09-19 | 2002-03-28 | The Regents Of The University Of California | Methods for classifying high-dimensional biological data |
US20020042681A1 (en) * | 2000-10-03 | 2002-04-11 | International Business Machines Corporation | Characterization of phenotypes by gene expression patterns and classification of samples based thereon |
US6996472B2 (en) * | 2000-10-10 | 2006-02-07 | The United States Of America As Represented By The Department Of Health And Human Services | Drift compensation method for fingerprint spectra |
US6714897B2 (en) * | 2001-01-02 | 2004-03-30 | Battelle Memorial Institute | Method for generating analyses of categorical data |
US9856533B2 (en) * | 2003-09-19 | 2018-01-02 | Biotheranostics, Inc. | Predicting breast cancer treatment outcome |
-
2002
- 2002-10-17 WO PCT/AU2002/001417 patent/WO2003034270A1/en active Application Filing
- 2002-10-17 CA CA002464364A patent/CA2464364A1/en not_active Abandoned
- 2002-10-17 JP JP2003536930A patent/JP2005524124A/ja active Pending
- 2002-10-17 AU AU2002332967A patent/AU2002332967B2/en not_active Ceased
- 2002-10-17 US US10/492,886 patent/US20050171923A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101517898B1 (ko) * | 2013-05-06 | 2015-05-07 | 서울시립대학교 산학협력단 | 도시형태결정요소 기반의 공간개발 패턴 추정 시스템 및 방법 |
KR20210124710A (ko) * | 2020-04-07 | 2021-10-15 | 강만수 | 광고 제공 시스템 |
KR102419034B1 (ko) * | 2020-04-07 | 2022-07-08 | 주식회사 하이퍼리서치 | 광고 제공 시스템 |
Also Published As
Publication number | Publication date |
---|---|
AU2002332967B2 (en) | 2008-07-17 |
WO2003034270A1 (en) | 2003-04-24 |
CA2464364A1 (en) | 2003-04-24 |
US20050171923A1 (en) | 2005-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Whalen et al. | Navigating the pitfalls of applying machine learning in genomics | |
JP2005524124A (ja) | システムの診断構成要素を識別するための方法および装置 | |
Sharma et al. | C-HMOSHSSA: Gene selection for cancer classification using multi-objective meta-heuristic and machine learning methods | |
Statnikov et al. | GEMS: a system for automated cancer diagnosis and biomarker discovery from microarray gene expression data | |
JP2007513391A (ja) | システムの複数の構成要素のうちのサブセットを識別する方法 | |
Krawczuk et al. | The feature selection bias problem in relation to high-dimensional gene data | |
Huerta et al. | A hybrid LDA and genetic algorithm for gene selection and classification of microarray data | |
EP2864919B1 (en) | Systems and methods for generating biomarker signatures with integrated dual ensemble and generalized simulated annealing techniques | |
US20020095260A1 (en) | Methods for efficiently mining broad data sets for biological markers | |
EP1498825A1 (en) | Apparatus and method for analyzing data | |
AU2002332967A1 (en) | Method and apparatus for identifying diagnostic components of a system | |
Zheng et al. | Gene selection using independent variable group analysis for tumor classification | |
Cuperlovic-Culf et al. | Determination of tumour marker genes from gene expression data | |
US20140180599A1 (en) | Methods and apparatus for analyzing genetic information | |
Mittal et al. | Large‐scale parametric survival analysis | |
Hong et al. | Gene boosting for cancer classification based on gene expression profiles | |
Mallick et al. | Bayesian analysis of gene expression data | |
Huynh et al. | Performance comparison of SLFN training algorithms for DNA microarray classification | |
Osseni et al. | MOT: a Multi-Omics Transformer for multiclass classification tumour types predictions | |
US20090006055A1 (en) | Automated Reduction of Biomarkers | |
US20050209838A1 (en) | Fast microarray expression data analysis method for network exploration | |
D'Souza et al. | A phenomic algorithm for reconstruction of gene networks | |
EP1436726A1 (en) | Method and apparatus for identifying diagnostic components of a system | |
Reyes | Glioma Brain Cancer Classification Using Microarrays and Support Vector Machines | |
Cheung | Classification approaches for microarray gene expression data analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071101 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080520 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080820 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080827 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090203 |