JP2006048429A - 解析エンジン交換型システム及びデータ解析プログラム - Google Patents

解析エンジン交換型システム及びデータ解析プログラム Download PDF

Info

Publication number
JP2006048429A
JP2006048429A JP2004229532A JP2004229532A JP2006048429A JP 2006048429 A JP2006048429 A JP 2006048429A JP 2004229532 A JP2004229532 A JP 2004229532A JP 2004229532 A JP2004229532 A JP 2004229532A JP 2006048429 A JP2006048429 A JP 2006048429A
Authority
JP
Japan
Prior art keywords
analysis
analysis engine
explanatory variables
data
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004229532A
Other languages
English (en)
Other versions
JP4421971B2 (ja
Inventor
Masaki Ando
正貴 安東
Akira Saito
彰 斎藤
Yuichi Ishibashi
雄一 石橋
Masaaki Matsuura
正明 松浦
Satoshi Miyata
敏 宮田
Masaru Ushijima
大 牛嶋
Shinmin Nakamura
親民 中村
Yoshio Miki
義男 三木
Tetsuo Noda
哲生 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japanese Foundation for Cancer Research
NEC Corp
Japan Biological Informatics Consortium
Original Assignee
Japanese Foundation for Cancer Research
NEC Corp
Japan Biological Informatics Consortium
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japanese Foundation for Cancer Research, NEC Corp, Japan Biological Informatics Consortium filed Critical Japanese Foundation for Cancer Research
Priority to JP2004229532A priority Critical patent/JP4421971B2/ja
Publication of JP2006048429A publication Critical patent/JP2006048429A/ja
Application granted granted Critical
Publication of JP4421971B2 publication Critical patent/JP4421971B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】効率的に説明変数の全体の解析を終了可能とする。
【解決手段】解析エンジン制御部21は、1個の目的変数とp個の説明変数とを受け、p個の説明変数から1つの説明変数を取り出す全ての組合せを順次目的変数と共に解析エンジン部22にp=p個の組みのデータとして渡し、解析エンジン部は、p個の組みのデータに対し解析をそれぞれ実行し解析結果を解析エンジン制御部に送り、解析エンジン制御部は、解析結果に基づいてp個の説明変数の中から上位のp’個の説明変数を選択し、p’個の説明変数から2つの説明変数を取り出す全ての組合せを順次目的変数と共に解析エンジン部にp’2個の組みのデータとして渡し、解析エンジン部は、p’2個の組みのデータに対し別の解析をそれぞれ実行し別の解析結果を解析エンジン制御部に送り、解析エンジン制御部は、別の解析結果に基づいてp’個の説明変数の中から上位の少数個の説明変数を選択する解析エンジン交換型システム。
【選択図】図1

Description

本発明は、t−検定、マン・ホイットニのU検定、フィッシャーの直接確率検定などの単変量の解析から始まり、回帰分析、ロジスティック回帰分析、分散分析、判別分析、主成分分析などの多変量解析などの統計手法、ニューラルネットワーク、二分木解析法やサポートベクターマシン(SVM)などのデータマイニング手法に関し、特に遺伝子データなどのように大量変数の分析データから効率的に有意な変数を絞り込む解析エンジン交換型システム及び解析エンジン交換型システム用プログラム(データ解析プログラム)に関する。
まず、第1の関連技術を説明する。
一般に、実際の現象を統計的に解析する目的の一つは、種々の特性間の関係を見いだし、予測を行うことである。このような場合、回帰分析やロジスティック回帰分析、判別関数などを含む一般化線型モデルを用いたり、SVMなどのデータマイニングの手法を用いたりして、データから何らかの関係を見いだし、ある変数に対して予測を行うことがよく行われる。例えば、目的変数yに対して複数の説明変数x,x,...,xの関係を解析する場合である。もし、データの持つすべての変数を使ったモデル式を作った場合は、モデルの汎用性が失われ、別のデータに適用した場合に当てはまらなくなるおそれが大きい。特にデータの持つ変数が多い場合は、目的変数yをうまく説明できるように、できるだけ少数の最適な変数を選び、モデル式を作らなければならない。一般にモデル式内の説明変数の個数は、数個〜数十個程度になるように変数の選択を行う。一般の統計解析システムでは、このような場合、変数選択法や総あたり法を用意して、様々な変数の組み合わせのモデルから最適と考えられるモデルを選択できるようになっている。
次に、第2の関連技術を説明する。
一般の統計解析システムや遺伝子解析システムは、様々な解析手法、例えば回帰分析やロジスティック回帰分析、判別関数などを含む一般化線型モデルなどの統計手法やSVMなどのデータマイニングの手法、を用意している。しかし、変数の組合せを1回だけ指定して解析することを想定しているため、何万個もの変数を持つデータに対して、変数の様々な組合せを繰り返し解析するためには、解析システムの持つプログラミング機能やマクロ機能を用いて、特別な処理を加える必要がある。
さらに、やみくもに変数の組合せを調べても、現実的な時間内に処理を終了することができないため、なるべく変数の組合せの個数を少なくして、さらに有意な変数の組合せが含まれるように、効率的に組合せ方を調査する必要があるが、上記の解析システムでは、このようなアルゴリズムは用意されていない。例えば、5個程度の変数のモデルを推定しようとした場合、10000個の変数に対して、5個の変数の組合せは以下のようになり、全ての組み合わせを計算するのは現実的に困難である。
10000=(10000×9999×9998×9997×9996)/5!≒1020/5!
また、多くの推定された様々な変数の組合せに対するモデルから、どのように最適なモデルの組合せ、あるいは、有意な変数の組合せを選んだらよいのかという基準が用意されていない。このため、上記の一般の解析システム内で最適なモデルあるいは変数の組合せを選ぶためには、プログラミング機能やマクロ機能により、特別な処理を組み込まなくてはならない。
更に、第3の関連技術を説明する。
最適なモデルの組合せ、あるいは、有意な変数の組合せを選ぶためには、1種類の手法だけを用いるだけよりは、一般化線型モデルなどの統計手法やSVMなどのデータマイニングの手法を横断的に用いる必要もでてきている。例えば、図8のように異なる解析手法A及びBを用いて、変数を絞り込んでいくためには、解析システムの中でプログラミング機能やマクロ機能により、特別な処理を組み込まなくてはならない。
特許文献1の請求項1には、「1つの説明変数以外は全て入力値を所定の一定値とし、その際に出力されるニューラルネットワークの出力値と目的変数との影響関係を統計解析で用いられるF値またはt値で評価することを全ての説明変数について順次実施し、所定の値以下の不要な説明変数を全て破棄する」ことが記載されている。
特許文献2の第8欄の第16行〜第21行には、「ステップ54(図3)で基準値が最大となった変数(x)を選び、ステップ51(図3)でこの変数xを含んだ2個の変数の組み合わせ(x,x)、(x,x)、(x,x)を順にループしてくるたびにつくり、ステップ52で基準値を計算する。」ことが記載されている。しかし、2個の変数の組み合わせ(x,x)、(x,x)、(x,x)を構成しているのは、選択された(絞られた)変数は、xのみであり、x、x、xは、選択された(絞られた)変数ではない。すなわち、はじめに、全ての変数の中から有意な変数を複数個選択し、次に、複数個の選択された(絞られた)変数中から、少なくとも2個ずつの全ての組み合わせをつくることは開示がない。
特許文献3の第2欄の第39行〜第44行には、「1回の解析で用いる説明変数の数を一定にして、公知の変数増減法を用いて自動的に異常項目(説明変数)を絞り込む、という解析を複数回行ない、各解析で絞り込まれた項目だけで最終の解析を行なう多段階多変量解析手法」が開示されている。特許文献3にて用いている、公知の変数増減法は、はじめに、全ての変数の中から有意な変数を一つ選択し、次に、一つの選択された変数を固定して残りの変数の中から、1つの変数を選択して、2つずつの組み合わせをつくるものである。従って、この特許文献3にも、はじめに、全ての変数の中から有意な変数を複数個選択し、次に、複数個の選択された(絞られた)変数中から、少なくとも2個ずつの全ての組み合わせをつくることは開示がない。
特許文献4の要約には、「遺伝子多型サイト情報と表現型の関連を解析する」との記載がある。
特開2000−31511号公報 特開平7−93284号公報 特開2002−110493号公報 特開2003−67389号公報 コックス著「二値データの解析」朝倉書店
上記した関連技術における第1の問題点は、説明変数の数がサンプル数より多くなり、(変数選択法や総当たり法など)統計学的多変量解析で用いられているアルゴリズムが遺伝子発現解析用DNAチップやマイクロアレイなどの大量の変数を持つデータに適用できないことである。従来の変数選択法における変数増加法(forward selection)や変数増減法(stepwise selection)においては、変数がモデルに追加されたり外されたりする場合、追加・削除することによって統計的に有意となる変数が1つずつ追加・削除されるだけであり、大量の変数から候補となる変数を絞り込むスクリーニングなどにおいては効率的に変数を選択することができない。また、変数減少法(backward selection)においては、はじめに全ての変数を取り込んだモデルが必要となるが、1万個の説明変数からなるモデルを考慮することは不可能である。また、総当たり法は、すべての変数の組み合わせを調べるために、変数の個数がp個の場合、2−1通りの組み合わせのモデルを試すことになる。pが10000と大きな場合、現実的に計算することができない。
第2の問題点としては、ハイスループットに調べた遺伝子発現解析のデータに対し、個々の遺伝子の発現解析結果に対して単変量的統計解析を行い、各遺伝子発現結果を評価していくことが重要であるが、数万の遺伝子に対して指定した解析を自動的に繰り返して行うための専用の装置は開発されていない。
第3の問題点としては、DNAチップやマイクロアレイに適用する統計解析手法は、t−検定、マン・ホイットニのU検定、フィッシャーの直接確率検定などの単変量の解析から始まり、回帰分析、ロジスティック回帰分析、分散分析、判別分析、主成分分析などの多変量解析だけではなく、データマイニング手法であるニューラルネットワーク、二分木解析法やサポートベクターマシン(SVM)など多岐に渡る。これらの手法を組み合わせたり、交換したりしながらDNAチップやマイクロアレイなどの大量変数からなるデータを効率的に処理するための装置は開発されていない。はじめに、全ての変数の中から有意な変数を複数個選択し、次に、複数個の選択された(絞られた)変数中から、少なくとも2個ずつの全ての組み合わせをつくることは開示がない。
本発明の課題は、上記問題点を除去できる解析エンジン交換型システム及び解析エンジン交換型システム用のデータ解析プログラムを提供することにある。
本発明の課題は、はじめに、全ての説明変数の中から有意な説明変数を複数個選択し、次に、複数個の選択された(絞られた)変数中から、少なくとも2個ずつの全ての組み合わせをつくるようにした解析エンジン交換型システム及び解析エンジン交換型システム用のデータ解析プログラムを提供することにある。
本発明による解析エンジン交換型システム及び本発明によるデータ解析プログラムは、以下のとおりである。
[請求項1] データ解析装置と、解析対象となるデータファイルを前記データ解析装置に入力する入力装置とを有し、
前記データ解析装置は、解析エンジン制御部と、解析エンジン部とを有し、
前記解析エンジン制御部は、1個の目的変数yとp個の説明変数x,x,…,xとからなる、前記解析対象となるデータファイルを受け取ると、前記p個の説明変数から1つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp(=p)個の組みのデータ(y,x),(y,x),…,(y,x)として渡していき、
前記解析エンジン部は、送られたp個の組みのデータに対し、予め定められた解析をそれぞれ実行し、解析結果を前記解析エンジン制御部に送り、
前記解析エンジン制御部は、前記解析結果に基づいて、前記p個の説明変数の中から、結果上位のp’個(p’<p)の説明変数x’,…,x’を選択し、次に、前記p’個の説明変数から2つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp’2(=p’×(p’−1)/2)個の組みのデータ(y,x’,x’),(y,x’,x’),…,(y,x’p’−1,x’p’)として渡していき、
前記解析エンジン部は、送られた(p’×(p’−1)/2)個の組みのデータに対し、別の予め定められた解析をそれぞれ実行し、別の解析結果を前記解析エンジン制御部に送り、
前記解析エンジン制御部は、前記別の解析結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択することを特徴とする解析エンジン交換型システム。
[請求項2] 請求項1に記載の解析エンジン交換型システムにおいて、
前記データ解析装置の前記解析エンジン制御部に接続された出力装置を、更に有し、
前記解析エンジン制御部は、前記解析結果及び前記別の表示結果を前記出力装置に表示させる機能を有することを特徴とする解析エンジン交換型システム。
[請求項3] 請求項1に記載の解析エンジン交換型システムにおいて、
前記解析エンジン部は、送られたp個の組みのデータに対し、前記予め定められた解析として、
y=f(x), i=1,2,…,p
で表される、p個のモデルの推定をそれぞれ実行し、解析結果として、p個のモデルに対する当てはまりの度合い及びp個の説明変数に対する有意さを、前記解析エンジン制御部に送り、
前記解析エンジン制御部は、前記p個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記p個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p個の説明変数の中から、結果上位のp’個の説明変数x’,…,x’を選択することを特徴とする解析エンジン交換型システム。
[請求項4] 請求項3に記載の解析エンジン交換型システムにおいて、
前記解析エンジン部は、送られた(p’×(p’−1)/2)個の組みのデータに対し、前記別の予め定められた解析として、
y=f(x,x), i,j=1,2,…,p’, i≠j
で表される、(p’×(p’−1)/2)個のモデルの推定をそれぞれ実行し、前記別の解析結果として、(p’×(p’−1)/2)個のモデルに対する当てはまりの度合い及び(p’×(p’−1)/2)個の説明変数に対する有意さを、前記解析エンジン制御部に送り、
前記解析エンジン制御部は、前記(p’×(p’−1)/2)個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記(p’×(p’−1)/2)個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択することを特徴とする解析エンジン交換型システム。
[請求項5] 請求項4に記載の解析エンジン交換型システムにおいて、
前記解析エンジン制御部は、前記p’個よりも少数個の説明変数を選択すると共に、前記解析エンジン部に、選択された少数個の説明変数を用いて、次のモデルの説明変数の個数を1個増やした状態で次のモデルの推定を実行させ、実行結果に基づいて、前記選択された少数個の説明変数の中から、より少数個の説明変数を選択することを特徴とする解析エンジン交換型システム。
[請求項6] 請求項1に記載の解析エンジン交換型システムにおいて、
前記データ解析装置に接続され、データ解析プログラムを記録した記録媒体を、更に有し、
前記データ解析プログラムは、前記記録媒体から前記データ解析装置に読み込まれ、前記データ解析装置の前記解析エンジン制御部及び前記解析エンジン部の前述した動作を制御することを特徴とする解析エンジン交換型システム。
[請求項7] 解析エンジン制御部及び解析エンジン部を有するデータ解析装置と、解析対象となるデータファイルを前記データ解析装置に入力する入力装置と、前記データ解析装置に所定の処理を実行させるためのデータ解析プログラムを記録した記録媒体とを有する解析エンジン交換型システムにおける前記データ解析プログラムであって、
前記所定の処理は、
前記解析エンジン制御部が、1個の目的変数yとp個の説明変数x,x,…,xとからなる、前記解析対象となるデータファイルを受け取ると、前記p個の説明変数から1つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp(=p)個の組みのデータ(y,x),(y,x),…,(y,x)として渡していく第1のステップと、
前記解析エンジン部が、送られたp個の組みのデータに対し、予め定められた解析をそれぞれ実行し、解析結果を前記解析エンジン制御部に送る第2のステップと、
前記解析エンジン制御部が、前記解析結果に基づいて、前記p個の説明変数の中から、結果上位のp’個(p’<p)の説明変数x’,…,x’を選択し、次に、前記p’個の説明変数から2つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp’2(=p’×(p’−1)/2)個の組みのデータ(y,x’,x’),(y,x’,x’),…,(y,x’p’−1,x’p’)として渡していく第3のステップと、
前記解析エンジン部が、送られた(p’×(p’−1)/2)個の組みのデータに対し、別の予め定められた解析をそれぞれ実行し、別の解析結果を前記解析エンジン制御部に送る第4のステップと、
前記解析エンジン制御部が、前記別の解析結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択する第5のステップとを有することを特徴とすることを特徴とするデータ解析プログラム。
[請求項8] 請求項7に記載のデータ解析プログラムにおいて、
前記解析エンジン交換型システムが前記データ解析装置の前記解析エンジン制御部に接続された出力装置を、更に有している場合に、前記解析エンジン制御部が、前記解析結果及び前記別の表示結果を前記出力装置に表示させるステップを、更に有することを特徴とするデータ解析プログラム。
[請求項9] 請求項7に記載のデータ解析プログラムにおいて、
前記第2のステップは、前記解析エンジン部が、送られたp個の組みのデータに対し、前記予め定められた解析として、
y=f(x), i=1,2,…,p
で表される、p個のモデルの推定をそれぞれ実行し、解析結果として、p個のモデルに対する当てはまりの度合い及びp個の説明変数に対する有意さを、前記解析エンジン制御部に送るステップであり、
前記第3のステップは、前記解析エンジン制御部が、前記p個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記p個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p個の説明変数の中から、結果上位のp’個の説明変数x’,…,x’を選択するステップであることを特徴とするデータ解析プログラム。
[請求項10] 請求項9に記載のデータ解析プログラムにおいて、
前記第4のステップは、前記解析エンジン部が、送られた(p’×(p’−1)/2)個の組みのデータに対し、前記別の予め定められた解析として、
y=f(x,x), i,j=1,2,…,p’, i≠j
で表される、(p’×(p’−1)/2)個のモデルの推定をそれぞれ実行し、前記別の解析結果として、(p’×(p’−1)/2)個のモデルに対する当てはまりの度合い及び(p’×(p’−1)/2)個の説明変数に対する有意さを、前記解析エンジン制御部に送るステップであり、
前記第5のステップは、前記解析エンジン制御部が、前記(p’×(p’−1)/2)個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記(p’×(p’−1)/2)個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択するステップであることを特徴とするデータ解析プログラム。
[請求項11] 請求項10に記載のデータ解析プログラムにおいて、
前記解析エンジン制御部が、前記p’個よりも少数個の説明変数を選択すると共に、前記解析エンジン部に、選択された少数個の説明変数を用いて、次のモデルの説明変数の個数を1個増やした状態で次のモデルの推定を実行させ、実行結果に基づいて、前記選択された少数個の説明変数の中から、より少数個の説明変数を選択するステップを、更に有することを特徴とするデータ解析プログラム。
本発明によれば、はじめに、全ての説明変数の中から有意な説明変数を複数個選択し、次に、複数個の選択された(絞られた)変数中から、少なくとも2個ずつの全ての組み合わせをつくるようにした解析エンジン交換型システム及び解析エンジン交換型システム用のデータ解析プログラムが得られ、効率的に説明変数の全体の解析を終了することが可能となる。
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。
図1を参照すると、本発明の第1の実施の形態による解析エンジン交換型システムは、プログラム制御により動作するデータ解析装置2と、解析対象となるデータファイルをデータ解析装置2に入力する入力装置1と、ディスプレイ装置や印刷装置等の出力装置3とを含む。この際の解析対象となるデータファイルは、1個の目的変数とp個の説明変数からなる。データ解析装置2は、解析エンジン制御部21と、解析エンジン部22とを備えている。
解析エンジン制御部21は、与えられたデータファイルの目的変数と選択された説明変数を取り出して、解析エンジン部22へデータを送る。解析エンジン部22は送られたデータに対し、あらかじめ定められた解析を実行し、解析結果を解析エンジン制御部21に送る。出力装置3では、解析エンジン制御部21から送られた解析結果を統計量やパラメータ(例えば、説明変数ごとの統計量にもとづいた有意確率)を用いてソートして表示する。その解析結果に基づいて、解析エンジン制御部21は、上位p’個(p’<p)の説明変数を選択し、次のモデルに含める説明変数の個数は増やして、入力装置1からの解析を再度実行する。その解析結果に基づいて、選択する説明変数の個数を減らしていく。処理を繰り返すことにより、モデルに含める説明変数の個数を増やしていくが、解析の対象となる説明変数の個数は減らしていくために、解析実行の回数は総当たり法より少ないので、効率的に変数の全体の解析を終了することが可能となる。
次に、図2を参照して本実施の形態の動作について詳細に説明する。
解析対象となるデータファイルにおけるデータは、下記の数式1に示すように、1個の目的変数とp個の説明変数から成り立っている。
Figure 2006048429
解析エンジン制御部21はデータファイルを入力装置1から受け取り、p個の説明変数から1つの説明変数を取り出す全ての組み合わせを、順次、1個の目的変数と共に、解析エンジン部22に渡していく。つまり、下記の数式2に示すp個の組みのデータを渡す。
Figure 2006048429
解析エンジン部22は、1組ごとのデータに対して、回帰分析やロジスティック回帰分析などの解析を行う。この場合、下記の数式3のp個のモデルを推定する。つまり、p回繰り返して計算を行う。
Figure 2006048429
回帰分析の場合は、回帰モデル式は上記の数式3に示されている通りで、説明変数の回帰係数とその有意さを表す統計量、モデルの当てはまりのよさを表す統計量を計算する。モデルのあてはまりを表す統計量および回帰係数の有意さを表す統計量は任意のものを定義できるが、例として、下記の数式4に示す、各モデルの回帰係数と、モデルのあてはまりを表す統計量として重相関係数と、回帰係数の有意さを表す統計量としてt値およびp値とを、定義する。
Figure 2006048429
p個の組のデータを解析した結果は、p個のモデルに対する当てはまりの度合い、p個の説明変数に対する有意さである。解析エンジン制御部21は、これらの結果を、下記の数式5に示すような基準を設けて、モデルおよび変数を選択する。
Figure 2006048429
これにより、p個の説明変数の内のp’個の説明変数(p’<p)に絞りこまれる。
ここで、データファイルは、下記の数式6に示すように、1個の目的変数と上記p’個の説明変数とから成り立っている。
Figure 2006048429
解析エンジン制御部21は、上記データファイルを入力装置1から受け取る。或いは、解析エンジン制御部21は、上記データファイルを解析エンジン制御部21内で作る。そして、解析エンジン制御部21は、p’個の説明変数から2つ取り出す全ての組み合わせを、順次、1個の目的変数と共に、解析エンジン部22に渡していく。つまり、下記の数式7に示す、p’2=[p’×(p’−1)/2!]=[p’×(p’−1)/2]個の組みのデータを渡す。
Figure 2006048429
解析エンジン部22は、1組ごとのデータに対して、回帰分析やロジスティック回帰分析などの解析を行う。この場合、下記の数式8に示す、p’×(p’−1)/2個のモデルを推定する。
Figure 2006048429
回帰分析およびロジスティック回帰の各統計量およびモデルのあてはまりの度合いを示す統計量および各説明変数の有意さを示す統計量は、上記の数式4により同様に求めることができる。ただし、p=2とする。
さらに同様に、下記の数式9に示す基準により、説明変数を数十個に絞り込む。
Figure 2006048429
次に絞り込まれた説明変数を用いて、モデルの説明変数の個数を1個増やして推定を行い、処理を繰り返す。このようにして、説明変数を10個乃至20個程度に絞り込んでいき、個々の説明変数と目的変数との関係を個別に調査できるようにする。
上記の内容を図に示すと、図2のようになる。
解析エンジン部22は、回帰分析だけではなく、ロジスティック回帰分析、判別関数、t−検定、マン・ホイットニのU検定など様々な統計手法に置き換えることにより、任意の解析手法を用いることができる。これを可能にするのが、解析エンジン部22と解析エンジン制御部21とのインタフェースである。
解析エンジン部22と解析エンジン制御部21とのインタフェースを、図3に示す。
図3において、解析エンジン制御部21は、繰り返し制御ブロックとして作用し、繰り返しの番号などのパラメータの分析1回分の個数とそのリスト31を、パラメータおよびデータ入力部22aを介して、統計解析計算部として作用する解析エンジン部22に送る。解析エンジン部22は、統計量、検定統計量などの結果出力部22bを介して統計量、検定統計量などの結果35を解析エンジン制御部21に送る。解析エンジン制御部21は、ブロック21aにおいて、結果編集及び出力を行い、結果の表示33を出力装置3(図1)に表示させる。解析エンジン制御部21は、ブロック21aにおいて、更に、基準値による変数(説明変数)の抽出を行い、抽出された変数の一覧を、繰り返しごとの変数一覧表示36として出力装置3に表示させる。
図4に、図3の31のデータ構造と、図3の35のデータ構造とを示す。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
図5を参照すると、本発明の第2の実施の形態による解析エンジン交換型システムは、典型的にはコンピュータのCPU(Central Processing Unit)であるデータ解析装置5と、図1と同様の入力装置1及び出力装置3とを備えている。更に、解析エンジン交換型システムは、データ解析プログラムを記録した記録媒体4を備える。この記録媒体4は可搬形あるいは固定型のいずれであってもよく、磁気ディスク、半導体メモリ、CD-ROMその他の記録媒体であってもよい。
また、本手法を実行できるコンピュータプログラム(上記データ解析プログラム)を、ネットワークに接続されたコンピュータの記録装置に格納しておき、ネットワークを介して他のコンピュータに転送することもできる。本アルゴリズムを実行するコンピュータプログラム(上記データ解析プログラム)を提供する提供媒体としては、様々な形式のコンピュータに読み出し可能な媒体として頒布可能であって、特定のタイプの媒体に限定されるものではない。
上記データ解析プログラムは記録媒体4からデータ解析装置5に読み込まれ、データ解析装置5の動作を制御し、データ解析装置5に、入力装置1から入力されたデータファイルに対して、図1のデータ解析装置2による処理と同一の処理を実行する。
次に、本発明の実施例を、実データを参照して具体的に説明する。かかる実施例は、図1の第1の実施の形態による解析エンジン交換型システムに対応するものである。図6に示すように、分析データはSNP(Single Nucleotide Polymorphism:シングル・ヌクレオチド(塩基)ポリモルフィズ(多型))データ及び臨床データで、目的変数(Y)として副作用の有/無(1 or 0)、説明変数(X)としてSNPデータを用いる。ここで、SNPデータにおいては、例えば、(A/A,A/T,T/T)=(10,11,01)のように1SNPに対して2変数を割り当てる。これにより、解析に対して用いた説明変数の個数は約5500個、ケース数は54である。
このデータをロジスティック回帰モデルにあてはめて分析を行う。n個の個体についてp個の説明変数を含むロジスティック回帰モデルは、以下の数式10を仮定する。
Figure 2006048429
ここで、θiは個体に関する成功確率、λiはθiのロジスティック変換である。αikは個体iに関するk番目の説明変数の値、βはk番目の説明変数のロジスティック尺度上の回帰係数である。
n個の個体について二値反応観測値y1, y2, …, yn,が与えられると、対数尤度は下記の数式11となる。
Figure 2006048429
ここで、
Figure 2006048429
とすると、この数式12で定義された、L(β)を最大にするβの値を、求めるためには、L(β)を目的関数とする非線形最適化問題を解く必要がある。この解法としてここでは、Newton-Raphson法を用いる(非特許文献1を参照)。
説明変数が1つの場合のモデルは、図7に示したような解析結果になる。
図7において、1行ごとに1回の解析結果を表している。各列においては、「R_Variable No.」は目的変数を表す番号、「E_Variable No.」は説明変数を表す番号である。「Status」は解析処理がエラーになかったかどうかを表している「X2L」はロジスティック回帰モデルの検定統計量である。「B0」および「B」はそれぞれ、定数項と回帰係数である。「t値」および「P値」はそれぞれ説明変数の検定統計量である。
また、図7では、計算されたロジスティック回帰係数の検定統計量t値に対するp値の大きさを小さな順にならべかえられており、ロジスティック回帰係数の影響度の大きい順に見ることができる。
ロジスティック回帰モデルの検定統計量であるピアソンのχ統計量は以下の数式13により計算する。
Figure 2006048429
各説明変数のt値は、下記の数式14のように計算する。
Figure 2006048429
ここで、s.e.( )は( )内の要素の標準誤差(standard error)である。
P値については、上記数式14のt値が自由度N−p−1のt分布に従うので、t分布のt値に対応する上側確率を求めることにより計算することができる。
上記の結果により、副作用の有/無がどの遺伝子と関連が強いかということが分かり、関連の強い遺伝子を絞り込むことが可能となる。
上記第1及び上記第2の実施の形態によれば、各種の統計分析手法が遺伝子発現解析用DNAチップやマイクロアレイなどの大量の変数を持つデータに適用できるようになる。変数の総数を約30000個とした場合、繰り返しの回数においても、
説明変数が1個:3万回
説明変数が2個:50万回(1説明変数時に約1000個の説明変数を抽出)
説明変数が3個:17万回(2説明変数時に約100個の説明変数を抽出)


というようになり、現実的な時間内において処理を終えることができる。
更に、上記第1及び上記第2の実施の形態によれば、既存の変数選択法よりも効率的に大量変数の中から候補となる変数を絞り込むことができる。その理由は、モデルに含まれる説明変数の個数ごとに独立して候補となる変数を選択することができるからである。さらに、上記の数式3を、下記の数式15のように特定の説明変数を固定したモデルに拡張することによって、既存の変数増加法や変数増減法なども適用することができる。
Figure 2006048429
また、上記第1及び上記第2の実施の形態によれば、多くの推定された様々な変数の組合せに対するモデルから、どのように最適なモデルの組合せ、あるいは、有意な変数の組合せを選んだらよいのかという基準を簡単に設定できる。推定されたモデル自体の重相関係数やF値などの統計量や、変数毎のt値やp値などの統計量を任意に選んで、基準値以上(あるいは以下)の変数の組合せを選択することができる。
更に、上記第1及び上記第2の実施の形態によれば、既存の変数選択法よりも幅広い変数の候補からモデルを抽出することが可能である。既存の変数増減法、減少法、増加法などにおいては、抽出されるモデルは1個のみである。しかし、本発明においては計算されたモデルの結果をすべて保存しているので、モデルに対する基準を設けて、上位K個の解析結果をユーザーに表示して結果の検討を行うことができる。さらに、この上位K個のモデルに含まれる説明変数を使って次のモデル選択のステップに進むことができ、既存の変数選択法よりも幅広い変数の候補からモデルを抽出することが可能となる。
また、上記第1及び上記第2の実施の形態によれば、複数の解析手法を横断的に組み合わせて使うことができることである。DNAチップやマイクロアレイに適用する手法は、t−検定、マン・ホイットニのU検定、フィッシャーの直接確率検定などの単変量の解析から始まり、回帰分析、ロジスティック回帰分析、分散分析、判別分析、主成分分析などの多変量解析などの統計手法、ニューラルネットワーク、二分木解析法やサポートベクターマシン(SVM)などのデータマイニング手法など多岐に渡るが、解析エンジン部をこれらの手法に置き換えることにより、説明変数の絞り込み時に異なる手法を組み合わせて解析することができる。
本発明の第1の実施の形態による解析エンジン交換型システムのブロック図である。 図1の解析エンジン交換型システムの解析エンジン制御部における、変数の絞り込みの過程を示す流れ図である。 図1の解析エンジン交換型システムの解析エンジン部と解析エンジン制御部とのインタフェースを示すブロック図である。 図3の部分31のデータ構造と図3の部分35のデータ構造とを示す図である。 本発明の第2の実施の形態による解析エンジン交換型システムのブロック図である。 図1の解析エンジン交換型システムに対応する実施例の動作の説明に使用する分析データの構造を示した図である。 上記実施例における解析結果を示した図である。 異なる解析手法を用いて変数を絞り込んでいくための処理を示す流れ図である。
符号の説明
1 入力装置
2 データ解析装置
3 出力装置
4 記録媒体
5 データ解析装置
21 解析エンジン制御部
22 解析エンジン部

Claims (11)

  1. データ解析装置と、解析対象となるデータファイルを前記データ解析装置に入力する入力装置とを有し、
    前記データ解析装置は、解析エンジン制御部と、解析エンジン部とを有し、
    前記解析エンジン制御部は、1個の目的変数yとp個の説明変数x,x,…,xとからなる、前記解析対象となるデータファイルを受け取ると、前記p個の説明変数から1つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp(=p)個の組みのデータ(y,x),(y,x),…,(y,x)として渡していき、
    前記解析エンジン部は、送られたp個の組みのデータに対し、予め定められた解析をそれぞれ実行し、解析結果を前記解析エンジン制御部に送り、
    前記解析エンジン制御部は、前記解析結果に基づいて、前記p個の説明変数の中から、結果上位のp’個(p’<p)の説明変数x’,…,x’を選択し、次に、前記p’個の説明変数から2つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp’2(=p’×(p’−1)/2)個の組みのデータ(y,x’,x’),(y,x’,x’),…,(y,x’p’−1,x’p’)として渡していき、
    前記解析エンジン部は、送られた(p’×(p’−1)/2)個の組みのデータに対し、別の予め定められた解析をそれぞれ実行し、別の解析結果を前記解析エンジン制御部に送り、
    前記解析エンジン制御部は、前記別の解析結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択することを特徴とする解析エンジン交換型システム。
  2. 請求項1に記載の解析エンジン交換型システムにおいて、
    前記データ解析装置の前記解析エンジン制御部に接続された出力装置を、更に有し、
    前記解析エンジン制御部は、前記解析結果及び前記別の表示結果を前記出力装置に表示させる機能を有することを特徴とする解析エンジン交換型システム。
  3. 請求項1に記載の解析エンジン交換型システムにおいて、
    前記解析エンジン部は、送られたp個の組みのデータに対し、前記予め定められた解析として、
    y=f(x), i=1,2,…,p
    で表される、p個のモデルの推定をそれぞれ実行し、解析結果として、p個のモデルに対する当てはまりの度合い及びp個の説明変数に対する有意さを、前記解析エンジン制御部に送り、
    前記解析エンジン制御部は、前記p個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記p個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p個の説明変数の中から、結果上位のp’個の説明変数x’,…,x’を選択することを特徴とする解析エンジン交換型システム。
  4. 請求項3に記載の解析エンジン交換型システムにおいて、
    前記解析エンジン部は、送られた(p’×(p’−1)/2)個の組みのデータに対し、前記別の予め定められた解析として、
    y=f(x,x), i,j=1,2,…,p’, i≠j
    で表される、(p’×(p’−1)/2)個のモデルの推定をそれぞれ実行し、前記別の解析結果として、(p’×(p’−1)/2)個のモデルに対する当てはまりの度合い及び(p’×(p’−1)/2)個の説明変数に対する有意さを、前記解析エンジン制御部に送り、
    前記解析エンジン制御部は、前記(p’×(p’−1)/2)個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記(p’×(p’−1)/2)個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択することを特徴とする解析エンジン交換型システム。
  5. 請求項4に記載の解析エンジン交換型システムにおいて、
    前記解析エンジン制御部は、前記p’個よりも少数個の説明変数を選択すると共に、前記解析エンジン部に、選択された少数個の説明変数を用いて、次のモデルの説明変数の個数を1個増やした状態で次のモデルの推定を実行させ、実行結果に基づいて、前記選択された少数個の説明変数の中から、より少数個の説明変数を選択することを特徴とする解析エンジン交換型システム。
  6. 請求項1に記載の解析エンジン交換型システムにおいて、
    前記データ解析装置に接続され、データ解析プログラムを記録した記録媒体を、更に有し、
    前記データ解析プログラムは、前記記録媒体から前記データ解析装置に読み込まれ、前記データ解析装置の前記解析エンジン制御部及び前記解析エンジン部の前述した動作を制御することを特徴とする解析エンジン交換型システム。
  7. 解析エンジン制御部及び解析エンジン部を有するデータ解析装置と、解析対象となるデータファイルを前記データ解析装置に入力する入力装置と、前記データ解析装置に所定の処理を実行させるためのデータ解析プログラムを記録した記録媒体とを有する解析エンジン交換型システムにおける前記データ解析プログラムであって、
    前記所定の処理は、
    前記解析エンジン制御部が、1個の目的変数yとp個の説明変数x,x,…,xとからなる、前記解析対象となるデータファイルを受け取ると、前記p個の説明変数から1つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp(=p)個の組みのデータ(y,x),(y,x),…,(y,x)として渡していく第1のステップと、
    前記解析エンジン部が、送られたp個の組みのデータに対し、予め定められた解析をそれぞれ実行し、解析結果を前記解析エンジン制御部に送る第2のステップと、
    前記解析エンジン制御部が、前記解析結果に基づいて、前記p個の説明変数の中から、結果上位のp’個(p’<p)の説明変数x’,…,x’を選択し、次に、前記p’個の説明変数から2つの説明変数を取り出す全ての組み合わせを、順次、前記目的変数と共に、前記解析エンジン部にp’2(=p’×(p’−1)/2)個の組みのデータ(y,x’,x’),(y,x’,x’),…,(y,x’p’−1,x’p’)として渡していく第3のステップと、
    前記解析エンジン部が、送られた(p’×(p’−1)/2)個の組みのデータに対し、別の予め定められた解析をそれぞれ実行し、別の解析結果を前記解析エンジン制御部に送る第4のステップと、
    前記解析エンジン制御部が、前記別の解析結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択する第5のステップとを有することを特徴とすることを特徴とするデータ解析プログラム。
  8. 請求項7に記載のデータ解析プログラムにおいて、
    前記解析エンジン交換型システムが前記データ解析装置の前記解析エンジン制御部に接続された出力装置を、更に有している場合に、前記解析エンジン制御部が、前記解析結果及び前記別の表示結果を前記出力装置に表示させるステップを、更に有することを特徴とするデータ解析プログラム。
  9. 請求項7に記載のデータ解析プログラムにおいて、
    前記第2のステップは、前記解析エンジン部が、送られたp個の組みのデータに対し、前記予め定められた解析として、
    y=f(x), i=1,2,…,p
    で表される、p個のモデルの推定をそれぞれ実行し、解析結果として、p個のモデルに対する当てはまりの度合い及びp個の説明変数に対する有意さを、前記解析エンジン制御部に送るステップであり、
    前記第3のステップは、前記解析エンジン制御部が、前記p個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記p個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p個の説明変数の中から、結果上位のp’個の説明変数x’,…,x’を選択するステップであることを特徴とするデータ解析プログラム。
  10. 請求項9に記載のデータ解析プログラムにおいて、
    前記第4のステップは、前記解析エンジン部が、送られた(p’×(p’−1)/2)個の組みのデータに対し、前記別の予め定められた解析として、
    y=f(x,x), i,j=1,2,…,p’, i≠j
    で表される、(p’×(p’−1)/2)個のモデルの推定をそれぞれ実行し、前記別の解析結果として、(p’×(p’−1)/2)個のモデルに対する当てはまりの度合い及び(p’×(p’−1)/2)個の説明変数に対する有意さを、前記解析エンジン制御部に送るステップであり、
    前記第5のステップは、前記解析エンジン制御部が、前記(p’×(p’−1)/2)個のモデルに対する当てはまりの度合いの基準値に対する比較結果及び前記(p’×(p’−1)/2)個の説明変数に対する有意さの別の基準値に対する比較結果に基づいて、前記p’個の説明変数の中から、結果上位の、p’個よりも少数個の説明変数を選択するステップであることを特徴とするデータ解析プログラム。
  11. 請求項10に記載のデータ解析プログラムにおいて、
    前記解析エンジン制御部が、前記p’個よりも少数個の説明変数を選択すると共に、前記解析エンジン部に、選択された少数個の説明変数を用いて、次のモデルの説明変数の個数を1個増やした状態で次のモデルの推定を実行させ、実行結果に基づいて、前記選択された少数個の説明変数の中から、より少数個の説明変数を選択するステップを、更に有することを特徴とするデータ解析プログラム。



JP2004229532A 2004-08-05 2004-08-05 解析エンジン交換型システム及びデータ解析プログラム Expired - Fee Related JP4421971B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004229532A JP4421971B2 (ja) 2004-08-05 2004-08-05 解析エンジン交換型システム及びデータ解析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004229532A JP4421971B2 (ja) 2004-08-05 2004-08-05 解析エンジン交換型システム及びデータ解析プログラム

Publications (2)

Publication Number Publication Date
JP2006048429A true JP2006048429A (ja) 2006-02-16
JP4421971B2 JP4421971B2 (ja) 2010-02-24

Family

ID=36026904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004229532A Expired - Fee Related JP4421971B2 (ja) 2004-08-05 2004-08-05 解析エンジン交換型システム及びデータ解析プログラム

Country Status (1)

Country Link
JP (1) JP4421971B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226639A (ja) * 2006-02-24 2007-09-06 Mitsubishi Electric Corp 多変量データ判別装置
JP2012173899A (ja) * 2011-02-18 2012-09-10 Scsk Corp ロジスティック回帰分析システム及びロジスティック回帰分析プログラム
JP2014139787A (ja) * 2013-01-21 2014-07-31 International Business Maschines Corporation 表現型予測のためのエピスタシスの効率的なモデル化のための特徴選択方法、情報処理システム、及びコンピュータ・プログラム
WO2015045282A1 (ja) * 2013-09-27 2015-04-02 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
WO2015045318A1 (ja) * 2013-09-27 2015-04-02 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
WO2015097773A1 (ja) * 2013-12-25 2015-07-02 株式会社日立製作所 要因抽出システム、要因抽出方法
WO2016148107A1 (ja) * 2015-03-16 2016-09-22 国立大学法人東京農工大学 データ処理装置、データ処理方法、および、データ処理用プログラム
US9811373B2 (en) 2011-02-09 2017-11-07 Nec Corporation Analysis engine control device
KR20180108810A (ko) * 2016-03-03 2018-10-04 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 서비스 파라미터 선택 방법 및 관련된 디바이스
WO2019013196A1 (ja) * 2017-07-14 2019-01-17 パナソニックIpマネジメント株式会社 製造管理装置、製造システム及び製造管理方法
JP2022017405A (ja) * 2017-05-04 2022-01-25 ヴァイアヴィ・ソリューションズ・インコーポレイテッド 近赤外分光法及び機械学習技術による、製造工程におけるエンドポイント検出

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226639A (ja) * 2006-02-24 2007-09-06 Mitsubishi Electric Corp 多変量データ判別装置
US9811373B2 (en) 2011-02-09 2017-11-07 Nec Corporation Analysis engine control device
JP2012173899A (ja) * 2011-02-18 2012-09-10 Scsk Corp ロジスティック回帰分析システム及びロジスティック回帰分析プログラム
US10102333B2 (en) 2013-01-21 2018-10-16 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
JP2014139787A (ja) * 2013-01-21 2014-07-31 International Business Maschines Corporation 表現型予測のためのエピスタシスの効率的なモデル化のための特徴選択方法、情報処理システム、及びコンピュータ・プログラム
US11335434B2 (en) 2013-01-21 2022-05-17 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
US11335433B2 (en) 2013-01-21 2022-05-17 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
US10108775B2 (en) 2013-01-21 2018-10-23 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
WO2015045282A1 (ja) * 2013-09-27 2015-04-02 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
WO2015045318A1 (ja) * 2013-09-27 2015-04-02 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
JPWO2015045318A1 (ja) * 2013-09-27 2017-03-09 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
JPWO2015045282A1 (ja) * 2013-09-27 2017-03-09 日本電気株式会社 情報処理システム、情報処理方法およびプログラムを記憶する記録媒体
WO2015097773A1 (ja) * 2013-12-25 2015-07-02 株式会社日立製作所 要因抽出システム、要因抽出方法
JPWO2015097773A1 (ja) * 2013-12-25 2017-03-23 株式会社日立製作所 要因抽出システム、要因抽出方法
WO2016148107A1 (ja) * 2015-03-16 2016-09-22 国立大学法人東京農工大学 データ処理装置、データ処理方法、および、データ処理用プログラム
KR20180108810A (ko) * 2016-03-03 2018-10-04 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 서비스 파라미터 선택 방법 및 관련된 디바이스
JP2019511773A (ja) * 2016-03-03 2019-04-25 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド サービス・パラメータ選択方法及び関連するデバイス
KR102104193B1 (ko) 2016-03-03 2020-04-23 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 서비스 파라미터 선택 방법 및 관련된 디바이스
JP2022017405A (ja) * 2017-05-04 2022-01-25 ヴァイアヴィ・ソリューションズ・インコーポレイテッド 近赤外分光法及び機械学習技術による、製造工程におけるエンドポイント検出
JP7237124B2 (ja) 2017-05-04 2023-03-10 ヴァイアヴィ・ソリューションズ・インコーポレイテッド 近赤外分光法及び機械学習技術による、製造工程におけるエンドポイント検出
WO2019013196A1 (ja) * 2017-07-14 2019-01-17 パナソニックIpマネジメント株式会社 製造管理装置、製造システム及び製造管理方法

Also Published As

Publication number Publication date
JP4421971B2 (ja) 2010-02-24

Similar Documents

Publication Publication Date Title
Kerschke et al. Automated algorithm selection on continuous black-box problems by combining exploratory landscape analysis and machine learning
Diaz-Mejia et al. Evaluation of methods to assign cell type labels to cell clusters from single-cell RNA-sequencing data
Stork et al. Open issues in surrogate-assisted optimization
Harman et al. The impact of input domain reduction on search-based test data generation
JP7353946B2 (ja) アノテーション装置および方法
JP4421971B2 (ja) 解析エンジン交換型システム及びデータ解析プログラム
Georgoulakos et al. Evolutionary multi-objective optimization of business process designs with pre-processing
JP2018147280A (ja) データ分析装置及びデータ分析方法
Stoyanov et al. Predictive analytics methodology for smart qualification testing of electronic components
KR20220069943A (ko) 단일 세포 rna-seq 데이터 처리
Shafiq et al. Retracted: Scientific programming using optimized machine learning techniques for software fault prediction to improve software quality
JP6658507B2 (ja) 負荷推定システム、情報処理装置、負荷推定方法、及び、コンピュータ・プログラム
EP2043030A2 (en) Segmented modeling of large data sets
TWI772023B (zh) 資訊處理裝置、資訊處理方法及資訊處理程序
JP7479251B2 (ja) 計算機システムおよび情報処理方法
Groß A prediction system for evolutionary testability applied to dynamic execution time analysis
JP6371981B2 (ja) 業務支援システム、業務支援システムを実行するプログラム及びそれを記録した媒体
Karthika et al. Genetic Algorithm-Based Feature Selection and Self-Organizing Auto-Encoder (Soae) for Snp Genomics Data Classifications
Cheng et al. An integrated modeling mechanism for optimizing the simulation model of the construction operation
KR101609292B1 (ko) 연구 개발 프로젝트 관리 장치 및 방법
Trubiani et al. VisArch: Visualisation of Performance-based Architectural Refactorings
KR101649913B1 (ko) 연구 개발 프로젝트 관리 장치 및 방법
JP6547341B2 (ja) 情報処理装置、方法及びプログラム
Samet et al. Building Risk Prediction Models for Diabetes Decision Support System
Álvarez-Machancoses et al. Prediction of Functional Effects of Protein Amino Acid Mutations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees