JP2008090833A - 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム - Google Patents
判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム Download PDFInfo
- Publication number
- JP2008090833A JP2008090833A JP2007230142A JP2007230142A JP2008090833A JP 2008090833 A JP2008090833 A JP 2008090833A JP 2007230142 A JP2007230142 A JP 2007230142A JP 2007230142 A JP2007230142 A JP 2007230142A JP 2008090833 A JP2008090833 A JP 2008090833A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- subset
- samples
- discriminant
- accuracy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 73
- 230000006978 adaptation Effects 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims description 82
- 238000003860 storage Methods 0.000 claims description 45
- 238000000605 extraction Methods 0.000 claims description 30
- 238000012795 verification Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 201000010099 disease Diseases 0.000 claims description 11
- 206010028980 Neoplasm Diseases 0.000 claims description 9
- 201000011510 cancer Diseases 0.000 claims description 8
- 210000000056 organ Anatomy 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 206010027476 Metastases Diseases 0.000 claims description 6
- 230000009401 metastasis Effects 0.000 claims description 6
- 210000001519 tissue Anatomy 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 3
- 238000004393 prognosis Methods 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 claims description 3
- 206010059866 Drug resistance Diseases 0.000 claims description 2
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 claims description 2
- 108091092878 Microsatellite Proteins 0.000 claims description 2
- 238000001574 biopsy Methods 0.000 claims description 2
- 239000008280 blood Substances 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 claims description 2
- 150000001875 compounds Chemical class 0.000 claims description 2
- 230000037213 diet Effects 0.000 claims description 2
- 235000005911 diet Nutrition 0.000 claims description 2
- 239000003814 drug Substances 0.000 claims description 2
- 229940079593 drug Drugs 0.000 claims description 2
- 230000001605 fetal effect Effects 0.000 claims description 2
- 239000012634 fragment Substances 0.000 claims description 2
- 210000002200 mouth mucosa Anatomy 0.000 claims description 2
- 102000004169 proteins and genes Human genes 0.000 claims description 2
- 238000001356 surgical procedure Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims 3
- 210000001726 chromosome structure Anatomy 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 17
- 230000000052 comparative effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 71
- 230000008859 change Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000010365 information processing Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000010208 microarray analysis Methods 0.000 description 2
- 238000010827 pathological analysis Methods 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 238000010876 biochemical test Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】コンピュータシステムの制御手段によって、サンプルデータファイルから、指定された次元数のサンプル及び判別因子を抽出してサブセットを生成する工程と、サブセットのサンプル及び判別因子の説明変数とサンプルの群データとを抽出する工程と、抽出した複数の判別因子をパラメータとする関数に、特定の群に属するサンプルの説明変数を代入して基準判別精度を算出する工程と、複数のサンプルの群データを置換する工程と、置換後の特定の群に属するサンプルの説明変数を前記関数に代入して比較判別精度を算出する工程と、比較判別精度と基準判別精度とを比較して過剰適応に該当しないかを判断する工程と、過剰適応に該当しないと判断されたサブセットの複数の判別因子を判別因子セットとして出力する工程とを実行する。
【選択図】図3
Description
利用者用クライアントシステム2は、汎用のパーソナルコンピュータであり、制御手段としてのCPU5に、RAM6、HDDやROMなどの記憶装置7、及び入出力インタフェース(I/F)8が通信バス9を介して接続され、この入出力I/F8に、LEDディスプレイなどのディスプレイ装置10、マウスやキーボードなどの入力装置11、モデム等の通信デバイス12、CD−ROMやDVD−ROMなどのリムーバブル記録媒体用のドライブ13等が接続されたハードウェア構成を有する。後述する本発明の特徴的な処理機能は、前記記憶装置7のプログラム格納部14にインストールされたコンピュータソフトウェア(情報表示ソフトウェア15やクライアントシステムソフトウェア16)がCPU5によってRAM6上に呼び出され、OS(オペレーションシステム)と協働して実行されることで実現される。
・ドライブ13やネットワークを介して利用者クライアントシステム2にサンプルデータを読み込み利用者情報格納部17に格納する機能
・利用情報格納部17からサンプルデータを読み出してクライアントシステムソフトウェア16を介して解析提供サーバシステム3の後述する解析提供ソフトウェア22にデータを送信する機能
・解析ソフトウェア23が解析した結果を受け取って利用情報格納部17に格納する機能
・サンプルデータや前記解析結果を利用情報格納部17から読み出して利用者用クライアントシステム2のディスプレイ装置10に表示する機能
前記クライアントシステムソフトウェア16は、以下の各機能を備えている。これらの機能のうちの一部は、前記情報表示ソフトウェア15や解析提供ソフトウェア22に行わせることもできる。
・ユーザが前記入力装置11から入力したサンプルデータの所在、すなわち、外部の分析機器や測定機器、情報解析ソフトウェア等によって生成されたサンプルデータを、インターネットやドライブ13によってファイルシステムを介して取得し、利用情報格納部17に格納するサンプルデータ取得機能
・パラメータ入力画面(図5参照)をディスプレイ装置10に表示させて、ユーザから解析対象サンプルデータや解析パラメータ(サンプルや判別因子の次元数など)の入力を受け付け、入力された情報を解析提供サーバシステム3に送信し、解析提供サーバシステム3から解析結果を受信して利用情報格納部17に格納する解析実行機能(次元数指定受付手段)
・利用情報格納部17に格納したサンプル情報(サンプルIDや膨大な説明変数データなどの図5に例示するデータ)や解析結果(図6参照)を選択的に読み出してディスプレイ装置に表示すると共に、表示されたサンプルデータの加工や解析結果について、群データやフラグ、検証結果などの情報を利用情報格納部17に登録する情報表示機能
前記解析提供サーバシステム3は、WWWネットワークを通じて利用者用クライアントシステム2に対して判別器生成のための解析機能を提供するWEBサーバである。この解析提供サーバシステム3は、解析工程において一時的にデータを保持する補助記憶装置である解析情報一時格納部20と、ユーザログイン情報や利用履歴等、解析提供サーバシステム3の利用者に関する情報を格納するユーザ情報格納部21と、利用者用クライアントシステム2の情報表示ソフトウェア15からアクセスされた場合に、前記解析情報一時格納部20から必要な情報を検索し、必要に応じて加工して受け渡す解析提供ソフトウェア22と、判別器生成のための解析を実施する解析ソフトウェア23とを備えている。この解析ソフトウェア23は、具体的に以下の諸機能を備えている。なお、以下の機能の一部は、前記情報表示ソフトウェア15やクライアントシステムソフトウェア16に実行させることもできる。
次に、図2を参照して本システムが解析の対象とするサンプルデータの内容を具体的に説明する。サンプルデータは、サンプル1〜mで表されるm個のサンプルについて、解析対象となるサンプルのサブグループ(群データ)を示す外部基準変数(特徴)と、1〜nで表されるn個の判別因子ごとの説明変数(変量)と、を有する。
次に、図3のフローチャートを参照して、前記解析ソフトウェア23が実行する情報処理の工程を説明する。以下の説明においては、サンプルとしてヒト、外部基準変数としてある疾患の健常者/罹患者の情報、判別因子として網羅的な遺伝子と遺伝子発現パターンが与えられ、ヒトサンプルのデータを解析することで罹患者かどうかの判別が可能な判別器を生成する例を示す。すなわち、多数のヒトサンプルのデータ(外的基準変数、判別因子ごとの説明変数の値など)を解析することで、評価対象のヒトサンプル(未知のサンプル)が外的基準変数の何れに該当するかを高い精度で判別できる、複数の判別因子を組み合わせたセットを生成する場合の処理工程である。
次に、図4のフローチャートを参照して、前記判別解析の情報処理プロセス(ステップM4)を詳細に説明する。
まず、判別因子候補の選択までにかかるステップS2〜S10の実行回数をカウントするための判別因子候補選択処理試行回数カウンタnを初期化する(ステップS1)。
次に、図5の情報入力画面等の例を参照して、本発明の動作及び機能を具体的に説明する。
次に、図6の表示画面等の例を参照して、本発明の動作及び機能を説明する。
なお、この発明は上記の実施形態に限定されるものではなく、発明の要旨を変更しない範囲で種々変形可能である。
2…利用者用クライアントシステム
3…解析提供サーバシステム
5…CPU
6…RAM
7…記憶装置
8…入出力インタフェース
9…通信バス
10…ディスプレイ装置
11…入力装置
12…通信デバイス
13…ドライブ
14…プログラム格納部
15…情報表示ソフトウェア
16…クライアントシステムソフトウェア
17…利用情報格納部
20…解析情報一時格納部
21…ユーザ情報格納部
22…解析提供ソフトウェア
23…データ格納部
Claims (11)
- 入力手段、コンピュータプログラムを記憶する記憶装置、及びコンピュータプログラムを呼び出してサンプルのデータを分析する制御手段を備えたコンピュータシステムによって実行され、任意の外的基準変数(特徴)に従って評価対象のサンプルをあるアルゴリズムの基で複数の群の何れかに分類するための1以上の判別因子(変量の項目)の組み合わせ(判別因子セット)を特定する方法であって、
前記記憶装置は、多数のサンプルについて観測・計測された多数の判別因子ごとの説明変数(変量)であって分析に適さないノイズを含む可能性があるものと、各サンプルが前記外的基準変数に従って分類された群のデータとを含むサンプルデータファイルを備え、
この方法は、前記制御手段が、
前記入力手段を介して、多数のサンプルからなるサンプル集合の中から分析対象とするサンプルの次元数の指定、及び多数の判別因子群の中から分析対象とする判別因子の次元数の指定を夫々受け付ける次元数指定受付工程と、
前記サンプルデータファイルの中から、所定の抽出基準に従って、前記指定された各次元数のサンプル及び判別因子を夫々抽出し、これらを組み合わせて複数のサンプル及び複数の判別因子からなるサブセットを生成するサブセット生成工程と、
前記サンプルデータファイルから、前記生成されたサブセットに含まれる複数のサンプル及び複数の判別因子における説明変数と、当該複数のサンプルの群のデータとを夫々抽出する抽出工程と、
抽出した複数の判別因子をパラメータとする関数を作成し、その関数に前記抽出した複数の説明変数のうち、特定の群に分類されたサンプルの説明変数を代入して当該サブセットの基準判別精度として出力する基準判別精度算出工程と、
前記サブセットに含まれる複数のサンプルの群のデータをランダムに置換(シャッフル)する群データ置換工程と、
前記置換後の群データに基づいて、特定の群に分類されたサンプルの説明変数を前記作成した関数に代入して当該サブセットの比較判別精度として出力する比較判別精度算出工程と、
前記比較判別精度が、前記基準判別精度と比べて有意に低くなっていることの統計的判定に基づいて、当該サブセットが、前記サンプルの次元数に対して判別因子の次元数が多いことにより発生する過剰適応に該当しないかを判断する過剰適応判断工程と、
過剰適応に該当しないと判断された前記サブセットの判別因子を判別因子セットとして出力する判別因子セット出力工程と
を実行することを特徴とする方法。 - 請求項1の方法において、
前記サンプルは、生物個体や、生物個体の血液、口腔粘膜、毛髪、毛根、爪、生体検査や手術によって摘出された臓器断片などの臓器組織、それ以外の生物個体の部分、若しくは生物個体の部分から回収可能な染色体構造であり、
前記説明変数は、絶対量、相対量若しくは有無によって特定される、生物個体のバイオメトリクス(体長、体重、年齢など)、ゲノム転写物、タンパク質、化合物若しくはその他の分子の量の指標となる生化学的検査数値、マイクロサテライトやSNP(1塩基多様性)などの生物多様性因子、若しくは生物個体の疾患履歴、食事・生活状態などの生体情報であり、
前記外的基準変数(特徴)は、特定の疾患における健常者と罹患者、特定の疾患の罹患者における特定の合併症の有無、特定の疾患の罹患者の予後における同疾患の再発の有無、ガン疾患における転移の有無、ガン疾患における特定臓器組織への転移の有無、特定の薬剤に対する効果や薬剤抵抗性若しくは副作用の有無、特定の生物の昼と夜の状態、特定の生物の胎児齢の何れかである
ことを特徴とする方法。 - 請求項1の方法において、
さらに、前記制御手段が、前記判別因子セット出力工程において出力された判別因子セットの基準判別精度を、前記記憶装置に格納された過剰適応による判別精度の標準値と比較して、サンプル及び判別因子の次元数の組合せの信頼性を示す信頼性指標を出力する信頼性指標出力工程を実行することを特徴とする方法。 - 請求項1の方法において、
前記比較精度算出工程は、統計的判断が可能な個数の比較判別精度を算出するまで処理を繰り返し実行することを特徴とする方法。 - 請求項1の方法において、
前記群データ置換工程は、群データの置換に加えて、若しくはこれに代えて、前記サブセットに含まれる1以上の判別因子の説明変数をランダムに置換(シャッフル)することを特徴とする方法。 - 請求項1の方法において、
前記サブセット生成工程は、指定された次元数のサンプル及び判別因子を異なる抽出基準に従って夫々抽出するものであることを特徴とする方法。 - 請求項1の方法において、
さらに、前記制御手段が、
前記サブセット生成工程で抽出されなかったサンプルを含む検証用サブセットを生成する検証用サブセット生成工程と、
前記サブセット生成工程で作成された関数に、前記検証用サブセットに含まれるサンプルの説明変数を適用して検証用判別精度を算出する検証用判別精度算出工程と、
前記判別因子セット出力工程で出力された判別因子セットの基準判別精度と前記検証用判別精度とを比較照合して、当該基準判別精度の信頼性を検証する基準判別精度検証工程と
を実行することを特徴とする方法。 - 請求項7の方法において、
前記検証用サブセット生成工程は、多数の検証用サブセットを生成するものであり、
前記検証用判別精度算出工程は、生成された多数の検証用サブセットについて検証用判別精度を夫々算出するものであり、
前記基準判別精度検証工程は、算出された多数の検証用判別精度の中で所定の基準精度よりも高いものの全て又は一部の多数決に従って特定した検証用判別精度の範囲に前記判別因子セットの基準判別精度が含まれるか、若しくは前記算出された多数の検証用判別精度の中で所定の基準精度よりも高いものの全て又は一部の平均値と比較して前記判別因子セットの基準判別精度が統計的に有意に近似するか、に基づいて、当該基準判別精度の信頼性を検証するものである
ことを特徴とする方法。 - 請求項7の方法において、
前記基準判別精度検証工程は、前記サンプルが複数の抽出基準に従って夫々選択される場合に、その抽出基準毎の複数のサブセットの基準判別精度を比較することで、判別精度に寄与する副次的な判別因子の有無を判定して出力することを特徴とする方法。 - 入力装置、コンピュータプログラムを記憶する記憶装置、コンピュータプログラムを呼び出してサンプルのデータを解析する制御手段を備え、任意の外的基準変数(特徴)に従って評価対象のサンプルをあるアルゴリズムの基で複数の群の何れかに分類するための1以上の判別因子(変量の項目)の組み合わせ(判別因子セット)を特定するシステムであって、
多数のサンプルについて観測・計測された多数の判別因子ごとの説明変数(変量)であって分析に適さないノイズを含む可能性があるものと、各サンプルが前記外的基準変数に従って分類された群のデータとを含むサンプルデータファイルと、
前記入力手段を介して、多数のサンプルからなるサンプル集合の中から分析対象とするサンプルの次元数の指定、及び多数の判別因子群の中から分析対象とする判別因子の次元数の指定を夫々受け付ける次元数指定受付手段と、
前記サンプルデータファイルの中から、所定の抽出基準に従って、前記指定された各次元数のサンプル及び判別因子を夫々抽出し、これらを組み合わせて複数のサンプル及び複数の判別因子からなるサブセットを生成するサブセット生成手段と、
前記サンプルデータファイルから、前記生成されたサブセットに含まれる複数のサンプル及び複数の判別因子における説明変数と、当該複数のサンプルの群のデータとを夫々抽出する抽出手段と、
抽出した複数の判別因子をパラメータとする関数を作成し、その関数に前記抽出した複数の説明変数のうち、特定の群に分類されたサンプルの説明変数を代入して当該サブセットの基準判別精度として出力する基準判別精度算出手段と、
前記サブセットに含まれる複数のサンプルの群のデータをランダムに置換(シャッフル)する群データ置換手段と、
前記置換後の群データに基づいて、特定の群に分類されたサンプルの説明変数を前記作成した関数に代入して当該サブセットの比較判別精度として出力する比較判別精度算出手段と、
前記比較判別精度が、前記基準判別精度と比べて有意に低くなっていることの統計的判定に基づいて、当該サブセットが、前記サンプルの次元数に対して判別因子の次元数が多いことにより発生する過剰適応に該当しないかを判断する過剰適応判断手段と、
過剰適応に該当しないと判断された前記サブセットの判別因子を判別因子セットとして出力する判別因子セット出力手段と
を備えたことを特徴とするシステム。 - 入力手段、記憶装置及び制御手段を備えたコンピュータシステムの前記記憶装置に格納され、このコンピュータシステムに任意の外的基準変数(特徴)に従って評価対象のサンプルをあるアルゴリズムの基で複数の群の何れかに分類するための1以上の判別因子(変量の項目)の組み合わせ(判別因子セット)を特定させるためのコンピュータソフトウェアプログラムであって、
前記記憶装置は、多数のサンプルについて観測・計測された多数の判別因子ごとの説明変数(変量)であって分析に適さないノイズを含む可能性があるものと、各サンプルが前記外的基準変数に従って分類された群のデータとを含むサンプルデータファイルを備え、
このソフトウェアプログラムは、
前記入力手段を介して、多数のサンプルからなるサンプル集合の中から分析対象とするサンプルの次元数の指定、及び多数の判別因子群の中から分析対象とする判別因子の次元数の指定を夫々受け付ける次元数指定受付工程と、
前記サンプルデータファイルの中から、所定の抽出基準に従って、前記指定された各次元数のサンプル及び判別因子を夫々抽出し、これらを組み合わせて複数のサンプル及び複数の判別因子からなるサブセットを生成するサブセット生成工程と、
前記サンプルデータファイルから、前記生成されたサブセットに含まれる複数のサンプル及び複数の判別因子における説明変数と、当該複数のサンプルの群のデータとを夫々抽出する抽出工程と、
抽出した複数の判別因子をパラメータとする関数を作成し、その関数に前記抽出した複数の説明変数のうち、特定の群に分類されたサンプルの説明変数を代入して当該サブセットの基準判別精度として出力する基準判別精度算出工程と、
前記サブセットに含まれる複数のサンプルの群のデータをランダムに置換(シャッフル)する群データ置換工程と、
前記置換後の群データに基づいて、特定の群に分類されたサンプルの説明変数を前記作成した関数に代入して当該サブセットの比較判別精度として出力する比較判別精度算出工程と、
前記比較判別精度が、前記基準判別精度と比べて有意に低くなっていることの統計的判定に基づいて、当該サブセットが、前記サンプルの次元数に対して判別因子の次元数が多いことにより発生する過剰適応に該当しないかを判断する過剰適応判断工程と、
過剰適応に該当しないと判断された前記サブセットの判別因子を判別因子セットとして出力する判別因子セット出力工程と
を前記コンピュータシステムに実行させることを特徴とするソフトウェアプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007230142A JP5307996B2 (ja) | 2006-09-06 | 2007-09-05 | 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006241203 | 2006-09-06 | ||
JP2006241203 | 2006-09-06 | ||
JP2007230142A JP5307996B2 (ja) | 2006-09-06 | 2007-09-05 | 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008090833A true JP2008090833A (ja) | 2008-04-17 |
JP5307996B2 JP5307996B2 (ja) | 2013-10-02 |
Family
ID=39374863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007230142A Active JP5307996B2 (ja) | 2006-09-06 | 2007-09-05 | 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5307996B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010134773A (ja) * | 2008-12-05 | 2010-06-17 | Dna Chip Research Inc | 生理的状態分析方法、生理的状態分析システム、及びコンピュータシステムに生理的状態を分析するための処理を実行させるコンピュータプログラム |
JP2012256182A (ja) * | 2011-06-08 | 2012-12-27 | Sharp Corp | データ解析装置、データ解析方法およびデータ解析プログラム |
JP2015527635A (ja) * | 2012-06-21 | 2015-09-17 | フィリップ モリス プロダクツ エス アー | 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000517447A (ja) * | 1996-09-03 | 2000-12-26 | シーメンス アクチエンゲゼルシヤフト | ニューラルネットワーク用の少なくとも1つの人工的トレーニングデータベクトルをコンピュータ支援により生成するための方法及び装置 |
JP2003529131A (ja) * | 1999-10-27 | 2003-09-30 | バイオウルフ テクノロジーズ エルエルスィー | 生物学的システムにおいてパターンを同定するための方法およびデバイスならびにその使用方法 |
WO2003085548A1 (fr) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Dispositif et procede d'analyse de donnees |
-
2007
- 2007-09-05 JP JP2007230142A patent/JP5307996B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000517447A (ja) * | 1996-09-03 | 2000-12-26 | シーメンス アクチエンゲゼルシヤフト | ニューラルネットワーク用の少なくとも1つの人工的トレーニングデータベクトルをコンピュータ支援により生成するための方法及び装置 |
JP2003529131A (ja) * | 1999-10-27 | 2003-09-30 | バイオウルフ テクノロジーズ エルエルスィー | 生物学的システムにおいてパターンを同定するための方法およびデバイスならびにその使用方法 |
WO2003085548A1 (fr) * | 2002-04-04 | 2003-10-16 | Ishihara Sangyo Kaisha, Ltd. | Dispositif et procede d'analyse de donnees |
Non-Patent Citations (2)
Title |
---|
CSNJ200710001048; 坂本 康徳 外3名: 'パターン分類のための改良Cross-validation法' 電子情報通信学会2006年総合大会講演論文集 基礎・境界 , 20060308, p.48(A-2-12) * |
JPN6012066825; 坂本 康徳 外3名: 'パターン分類のための改良Cross-validation法' 電子情報通信学会2006年総合大会講演論文集 基礎・境界 , 20060308, p.48(A-2-12) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010134773A (ja) * | 2008-12-05 | 2010-06-17 | Dna Chip Research Inc | 生理的状態分析方法、生理的状態分析システム、及びコンピュータシステムに生理的状態を分析するための処理を実行させるコンピュータプログラム |
JP2012256182A (ja) * | 2011-06-08 | 2012-12-27 | Sharp Corp | データ解析装置、データ解析方法およびデータ解析プログラム |
JP2015527635A (ja) * | 2012-06-21 | 2015-09-17 | フィリップ モリス プロダクツ エス アー | 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 |
US10373708B2 (en) | 2012-06-21 | 2019-08-06 | Philip Morris Products S.A. | Systems and methods for generating biomarker signatures with integrated dual ensemble and generalized simulated annealing techniques |
Also Published As
Publication number | Publication date |
---|---|
JP5307996B2 (ja) | 2013-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112020565A (zh) | 用于确保基于测序的测定的有效性的质量控制模板 | |
US20020095260A1 (en) | Methods for efficiently mining broad data sets for biological markers | |
EP2510116A2 (en) | Biomarker assay for diagnosis and classification of cardiovascular disease | |
EP2864918B1 (en) | Systems and methods for generating biomarker signatures | |
US20150199477A1 (en) | Method, an arrangement and a computer program product for analysing a biological or medical sample | |
JP7275334B2 (ja) | 個人の生物学的ステータスを予測するためのシステム、方法および遺伝子シグネチャ | |
Chicco et al. | An enhanced Random Forests approach to predict heart failure from small imbalanced gene expression data | |
JP5307996B2 (ja) | 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム | |
KR102124193B1 (ko) | 기계 학습을 이용한 우울증 또는 자살 위험 예측용 마커 발굴 방법, 우울증 또는 자살 위험 예측용 마커, 및 기계 학습을 이용한 우울증 또는 자살 위험 예측 방법 | |
CN111540410B (zh) | 用于预测个体的吸烟状况的系统和方法 | |
AU2019446735B2 (en) | Method for discovering marker for predicting risk of depression or suicide using multi-omics analysis, marker for predicting risk of depression or suicide, and method for predicting risk of depression or suicide using multi-omics analysis | |
Jung et al. | A machine learning method for selection of genetic variants to increase prediction accuracy of type 2 diabetes mellitus using sequencing data | |
CN116312800A (zh) | 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质 | |
CN111164701A (zh) | 针对靶标定序的定点噪声模型 | |
CN108182347B (zh) | 一种大规模跨平台基因表达数据分类方法 | |
Deng et al. | Cross-platform analysis of cancer biomarkers: a Bayesian network approach to incorporating mass spectrometry and microarray data | |
Tsai et al. | Significance analysis of ROC indices for comparing diagnostic markers: applications to gene microarray data | |
Lauria | Rank‐Based miRNA Signatures for Early Cancer Detection | |
Aljouie et al. | Cross-validation and cross-study validation of chronic lymphocytic leukaemia with exome sequences and machine learning | |
Deng et al. | Introduction to the development and validation of predictive biomarker models from high-throughput data sets | |
Arslan | A Novel Bayesian Rank-Based Framework for the Classification of High-Dimensional Biological Data | |
CN111944901A (zh) | 一种特征mRNA表达谱组合及肾乳头状细胞癌早期预测方法 | |
KR20220111847A (ko) | 복합 생체 표지 네트워크 기반 질병 위험도 진단 방법 | |
CN111944898A (zh) | 一种特征mRNA表达谱组合及肾透明细胞癌早期预测方法 | |
Blazadonakis et al. | Revealing Significant Biological Knowledge via Gene Ontologies and Pathways |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080125 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130628 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5307996 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |