JP6253644B2 - 統合バイアス補正およびクラス予測を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 - Google Patents
統合バイアス補正およびクラス予測を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP6253644B2 JP6253644B2 JP2015517783A JP2015517783A JP6253644B2 JP 6253644 B2 JP6253644 B2 JP 6253644B2 JP 2015517783 A JP2015517783 A JP 2015517783A JP 2015517783 A JP2015517783 A JP 2015517783A JP 6253644 B2 JP6253644 B2 JP 6253644B2
- Authority
- JP
- Japan
- Prior art keywords
- test
- data set
- class
- training
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 132
- 239000000090 biomarker Substances 0.000 title description 63
- 238000012937 correction Methods 0.000 title description 10
- 238000012360 testing method Methods 0.000 claims description 178
- 238000012549 training Methods 0.000 claims description 112
- 230000014509 gene expression Effects 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 31
- 201000010099 disease Diseases 0.000 claims description 29
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 29
- 238000010801 machine learning Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000007639 printing Methods 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 description 25
- 238000004891 communication Methods 0.000 description 19
- 230000015654 memory Effects 0.000 description 15
- 239000000523 sample Substances 0.000 description 15
- 239000000091 biomarker candidate Substances 0.000 description 14
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 12
- 238000004590 computer program Methods 0.000 description 12
- 230000004547 gene signature Effects 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 9
- 108090000765 processed proteins & peptides Proteins 0.000 description 9
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 8
- 238000013500 data storage Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 238000007596 consolidation process Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002974 pharmacogenomic effect Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241000212384 Bifora Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000012362 drug development process Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000006126 farnesylation Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108091005981 phosphorylated proteins Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012085 transcriptional profiling Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioethics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Primary Health Care (AREA)
- Pathology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、米国仮特許出願第61/662,792号(発明の名称「Systems and Methods for Generating Biomarker Signatures with Integrated Bias Correction and Class Prediction」、2012年6月21日出願)に対する35 U.S.C § 119の下での優先権を主張し、それは、本明細書にその全体が援用される。
生物医学分野において、特定の生物学的状態を示す物質、すなわち、バイオマーカを識別することが重要である。ゲノミクスおよびプロテオミクスの新しい技術が出現するにつれて、バイオマーカは、生物学的発見、薬剤開発、および、ヘルスケアにおいてますます重要になりつつある。バイオマーカは、多くの疾患の診断および予後のためだけではなく、治療法の開発のための基礎を理解するためにも有用である。バイオマーカの成功した効果的な識別は、新薬開発プロセスを加速させることができる。診断および予後と治療法との組み合わせによって、バイオマーカ識別はまた、現在の薬物治療の品質を向上し、したがって、薬理遺伝学、薬理ゲノム学、および、薬理プロテオミクスの使用において重要な役割を果たす。
例えば、本発明は、下記の項目を提供する。
(項目1)
プロセッサによって実行される、2つ以上のクラスにデータセットを分類するコンピュータ実装方法であって、前記方法は、
(a)トレーニングデータセットおよびトレーニングクラスセットを受信するステップであって、前記トレーニングクラスセットは、前記トレーニングデータセット中の要素の各々と関連付けられるクラスを識別する、ステップと、
(b)テストデータセットを受信するステップと、
(c)前記トレーニングデータセットおよび前記トレーニングクラスセットに機械学習技法を適用することによって、前記トレーニングデータセットについての第1の分類器を生成するステップと、
(d)前記第1の分類器に従って、前記テストデータセット中の要素を分類することによって、第1のテストクラスセットを生成するステップと、
(e)複数の反復の各々について、
(i)前記トレーニングクラスセットおよび前記テストクラスセットのうちの少なくとも1つに基づいて、前記トレーニングデータセットを変換するステップと、
(ii)前記テストデータセットを変換するステップと、
(iii)前記変換されたトレーニングデータセットおよび前記トレーニングクラスセットに基づいて、第2の分類器に従って前記変換されたテストデータセット中の前記要素を分類することによって、第2のテストクラスセットを生成するステップと、
(iv)前記第1のテストクラスセットと前記第2のテストクラスセットとが異なる場合、前記第2のクラスセットを前記第1のクラスセットとして記憶し、前記変換されたテストデータセットを前記テストデータセットとして記憶し、ステップ(i)に戻るステップと
を含む、方法。
(項目2)
前記第1のテストクラスセットと前記第2のテストクラスセットとが異ならない場合に、前記第2のクラスセットを出力するステップをさらに含む、項目1に記載の方法。
(項目3)
前記トレーニングデータセットの要素は、疾患を有する患者についての、前記疾患に耐性がある患者についての、または、前記疾患がない患者についての遺伝子発現データを表す、項目1〜2のいずれかに記載の方法。
(項目4)
前記トレーニングデータセットおよび前記テストデータセットは、集約データセット中のサンプルを前記トレーニングデータセットまたは前記テストデータセットにランダムに割り当てることによって、生成される、項目1〜3のいずれかに記載の方法。
(項目5)
ステップ(i)、ステップ(ii)、または、ステップ(i)とステップ(ii)との両方の前記変換は、前記データセットの重心に基づいて前記データセットの要素を調整することによって、バイアス補正技法を行うステップを含む、項目1〜4のいずれかに記載の方法。
(項目6)
前記バイアス補正技法は、前記データセットの各要素から前記重心の成分を差し引くステップを含む、項目5に記載の方法。
(項目7)
ステップ(i)、ステップ(ii)、または、ステップ(i)とステップ(ii)との両方における前記変換は、回転、シアー、線形変換、または、非線形変換を適用するステップを含む、項目1〜6のいずれかに記載の方法。
(項目8)
前記複数の反復の各々について、前記第1のテストクラスセットを前記第2のテストクラスセットと比較するステップをさらに含む、項目1〜7のいずれかに記載の方法。
(項目9)
前記複数の反復の各々について、前記変換されたトレーニングデータセットおよび前記トレーニングデータセットに機械学習技法を適用することによって、前記変換されたトレーニングデータセットについての前記第2の分類器を生成するステップをさらに含む、項目1〜8のいずれかに記載の方法。
(項目10)
ステップ(ii)での前記変換は、ステップ(i)の同一の変換を適用することによって行われる、項目1〜9のいずれかに記載の方法。
(項目11)
前記第2のテストクラスセットを表示デバイス、印刷デバイス、または、記憶デバイスに提供するステップをさらに含む、項目1〜10のいずれかに記載の方法。
(項目12)
前記第1のテストクラスセットおよび前記第2のテストクラスセットは、前記第1のテストクラスセットの任意の要素が前記第2のテストクラスセットの対応する要素と異なる場合に、異なる、項目1〜11のいずれかに記載の方法。
(項目13)
エラー率に基づいて、前記第2の分類器の性能測定基準を計算するステップをさらに含む、項目1〜12のいずれかに記載の方法。
(項目14)
コンピュータ可読命令を備えるコンピュータプログラム製品であって、前記コンピュータ可読命令は、少なくとも1つのプロセッサを備えるコンピュータ化システムにおいて実行される場合、前記少なくとも1つのプロセッサに項目1〜13のいずれかに記載の方法の1つ以上のステップを実行させる、コンピュータプログラム製品。
(項目15)
非一時的なコンピュータ可読命令を伴って構成される少なくとも1つのプロセッサを備えるコンピュータ化システムであって、前記非一時的なコンピュータ可読命令は、実行される場合、前記プロセッサに項目1〜13のいずれかに記載の方法を実行させる非一時的なコンピュータ可読命令を伴って構成される少なくとも1つのプロセッサを備える、コンピュータ化システム。
Claims (15)
- プロセッサによって実行される、2つ以上のクラスにデータセットを分類するコンピュータ実装方法であって、前記方法は、
(a)トレーニングデータセットおよびトレーニングクラスセットを受信することであって、前記トレーニングクラスセットは、既知のラベルのセットを含み、各既知のラベルは、前記トレーニングデータセット中の各要素と関連付けられるクラスを識別する、ことと、
(b)テストデータセットを受信することと、
(c)前記トレーニングデータセットおよび前記トレーニングクラスセットに第1の機械学習技法を適用することによって、前記トレーニングデータセットについての第1の分類器を生成することと、
(d)前記第1の分類器に従って、前記テストデータセット中の要素を分類することによって、第1のテストクラスセットを生成することと、
(e)トレーニングクラス重心のセットの中心に対応する量だけ前記トレーニングデータセット中の前記要素を偏移させることによって、前記トレーニングデータセットを変換することであって、各トレーニングクラス重心は、前記トレーニングデータセット中の要素のサブセットの中心を表す、ことと、
(f)複数の反復の各々について、
(i)テストクラス重心のセットの中心に対応する量だけ前記テストデータセット中の前記要素を偏移させることによって、前記テストデータセットを変換することであって、各テストクラス重心は、前記テストデータセット中の要素のサブセットの中心を表す、こと、
(ii)第2の分類器に従って前記変換されたテストデータセット中の前記要素を分類することによって、第2のテストクラスセットを生成することであって、前記第2の分類器は、前記変換されたトレーニングデータセットおよび前記トレーニングクラスセットに第2の機械学習技法を適用することによって生成される、こと、および、
(iii)前記第1のテストクラスセットと前記第2のテストクラスセットとが異なる場合、前記第2のテストクラスセットを前記第1のテストクラスセットとして記憶し、前記変換されたテストデータセットを前記テストデータセットとして記憶し、ステップ(i)に戻ること
を行うことと
を含む、方法。 - 前記第1のテストクラスセットと前記第2のテストクラスセットとが異ならない場合に、前記第2のテストクラスセットを出力することをさらに含む、請求項1に記載の方法。
- 前記トレーニングデータセットの前記要素は、疾患を有する患者についての、前記疾患に耐性がある患者についての、または、前記疾患がない患者についての遺伝子発現データを表す、請求項1〜2のいずれかに記載の方法。
- 前記トレーニングデータセットは、集約データセット中のサンプルのランダムなサブセットから形成され、前記テストデータセットは、前記集約データセット中のサンプルの残っているサブセットから形成される、請求項1〜3のいずれかに記載の方法。
- ステップ(e)における前記偏移させることは、前記変換されたトレーニングデータセットを取得するように、前記トレーニングデータセットに回転、シアー、線形変換、または、非線形変換を適用することを含む、請求項1〜4のいずれかに記載の方法。
- ステップ(i)における前記偏移させることは、前記変換されたテストデータセットを取得するように、前記テストデータセットに回転、シアー、線形変換、または、非線形変換を適用することを含む、請求項1〜5のいずれかに記載の方法。
- 前記テストデータセットは、既知のラベルのテストセットを含み、各既知のラベルは、前記テストデータセット中の各要素と関連付けられるクラスを識別し、
前記第1のテストクラスセットは、前記テストデータセットについての予測されるラベルのセットを含み、
前記第2のテストクラスセットは、前記変換されたテストデータセットについての予測されるラベルのセットを含む、
請求項1〜6のいずれかに記載の方法。 - 前記複数の反復の各々について、前記第1のテストクラスセットを前記第2のテストクラスセットと比較することをさらに含む、請求項1〜7のいずれかに記載の方法。
- 前記第1の機械学習技法と前記第2の機械学習技法は同一である、請求項1〜8のいずれかに記載の方法。
- ステップ(e)での前記変換は、ステップ(i)の同一の変換を適用することによって行われる、請求項1〜9のいずれかに記載の方法。
- 前記第2のテストクラスセットを表示デバイス、印刷デバイス、または、記憶デバイスに提供することをさらに含む、請求項1〜10のいずれかに記載の方法。
- 前記第1のテストクラスセットおよび前記第2のテストクラスセットは、前記第1のテストクラスセットの任意の要素が前記第2のテストクラスセットの対応する要素と異なる場合に、異なる、請求項1〜11のいずれかに記載の方法。
- 前記第2のテストクラスセットは、前記変換されたテストデータセットについての予測されるラベルのセットを含み、前記方法は、予測されるラベルの総数によって除算された前記第2のテストクラスセット中の正確な予測されるラベルの数を表す性能測定基準を計算することによって、前記第2の分類器を評価することをさらに含む、請求項1〜12のいずれかに記載の方法。
- コンピュータ可読命令を記憶したコンピュータ可読記憶媒体であって、前記コンピュータ可読命令は、少なくとも1つのプロセッサを備えるコンピュータ化システムにおいて実行される場合、前記少なくとも1つのプロセッサに請求項1〜13のいずれかに記載の方法を実行させる、コンピュータ可読記憶媒体。
- 非一時的なコンピュータ可読命令を伴って構成される少なくとも1つのプロセッサを備えるコンピュータ化システムであって、前記非一時的なコンピュータ可読命令は、実行される場合、前記プロセッサに請求項1〜13のいずれかに記載の方法を実行させる、コンピュータ化システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261662792P | 2012-06-21 | 2012-06-21 | |
US61/662,792 | 2012-06-21 | ||
PCT/EP2013/062980 WO2013190084A1 (en) | 2012-06-21 | 2013-06-21 | Systems and methods for generating biomarker signatures with integrated bias correction and class prediction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015525413A JP2015525413A (ja) | 2015-09-03 |
JP6253644B2 true JP6253644B2 (ja) | 2017-12-27 |
Family
ID=48746446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015517783A Active JP6253644B2 (ja) | 2012-06-21 | 2013-06-21 | 統合バイアス補正およびクラス予測を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10339464B2 (ja) |
EP (1) | EP2864920B1 (ja) |
JP (1) | JP6253644B2 (ja) |
CN (1) | CN104508671B (ja) |
CA (1) | CA2877429C (ja) |
HK (1) | HK1209203A1 (ja) |
WO (1) | WO2013190084A1 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2877429C (en) | 2012-06-21 | 2020-11-03 | Philip Morris Products S.A. | Systems and methods for generating biomarker signatures with integrated bias correction and class prediction |
WO2013190085A1 (en) | 2012-06-21 | 2013-12-27 | Philip Morris Products S.A. | Systems and methods for generating biomarker signatures with integrated dual ensemble and generalized simulated annealing techniques |
CN104331642B (zh) * | 2014-10-28 | 2017-04-12 | 山东大学 | 用于识别细胞外基质蛋白的集成学习方法 |
WO2016175990A1 (en) * | 2015-04-30 | 2016-11-03 | Biodesix, Inc. | Bagged filtering method for selection and deselection of features for classification |
WO2017023416A1 (en) * | 2015-07-31 | 2017-02-09 | Northrop Grumman Systems Corporation | System and method for in-situ classifier retraining for malware identification and model heterogeneity |
US11403550B2 (en) | 2015-09-04 | 2022-08-02 | Micro Focus Llc | Classifier |
CN106250836B (zh) * | 2016-07-26 | 2018-09-14 | 山东师范大学 | 一种小样本条件下的两阶段人脸图像分类方法及系统 |
CN106503386A (zh) * | 2016-11-07 | 2017-03-15 | 上海思源弘瑞自动化有限公司 | 评估光功率预测算法性能优劣的方法及装置 |
US20200034367A1 (en) * | 2017-03-13 | 2020-01-30 | Nec Corporation | Relation search system, information processing device, method, and program |
US10984334B2 (en) * | 2017-05-04 | 2021-04-20 | Viavi Solutions Inc. | Endpoint detection in manufacturing process by near infrared spectroscopy and machine learning techniques |
CN108229676B (zh) * | 2017-05-18 | 2022-02-25 | 北京市商汤科技开发有限公司 | 神经网络模型的训练方法和装置、电子设备和计算机存储介质 |
CN110709705A (zh) | 2017-05-31 | 2020-01-17 | 马斯公司 | 诊断和治疗慢性肾脏病的方法 |
US11062792B2 (en) * | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
US10990901B2 (en) * | 2017-11-13 | 2021-04-27 | Accenture Global Solutions Limited | Training, validating, and monitoring artificial intelligence and machine learning models |
CN109993047A (zh) * | 2017-12-28 | 2019-07-09 | 杭州海康威视系统技术有限公司 | 城市乱堆物料的违规识别方法、装置及电子设备 |
EP3740760B1 (en) * | 2018-01-19 | 2023-05-31 | Mars, Incorporated | Biomarkers and classification algorithms for chronic kidney disease in cats |
US10925481B2 (en) * | 2018-03-02 | 2021-02-23 | Ohio State Innovation Foundation | Systems and methods for measuring visual function maps |
CN110320197A (zh) * | 2018-03-31 | 2019-10-11 | 重庆大学 | 基于Raman光谱分析的微小型拉曼血液专用分析仪 |
CN112714871A (zh) * | 2018-07-14 | 2021-04-27 | 马斯公司 | 用于慢性肾脏病的生物标志物和测试模型 |
JP6559850B1 (ja) * | 2018-07-27 | 2019-08-14 | Karydo TherapeutiX株式会社 | ヒトにおける被験物質の作用を予測するための人工知能モデル |
US10783068B2 (en) | 2018-10-11 | 2020-09-22 | International Business Machines Corporation | Generating representative unstructured data to test artificial intelligence services for bias |
WO2020078235A1 (en) | 2018-10-15 | 2020-04-23 | Huawei Technologies Co., Ltd. | Boosting ai identification learning |
US10928831B2 (en) | 2018-12-05 | 2021-02-23 | Here Global B.V. | Method and apparatus for de-biasing the detection and labeling of objects of interest in an environment |
JP7232122B2 (ja) * | 2019-05-10 | 2023-03-02 | 株式会社日立製作所 | 物性予測装置及び物性予測方法 |
US10515715B1 (en) | 2019-06-25 | 2019-12-24 | Colgate-Palmolive Company | Systems and methods for evaluating compositions |
JP7231829B2 (ja) * | 2019-07-25 | 2023-03-02 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
IT201900019556A1 (it) * | 2019-10-22 | 2021-04-22 | Consiglio Nazionale Ricerche | Metodo per selezionare un gruppo di marcatori biologici e di un vettore di parametri utili nella predizione della probabilità di sopravvivenza a lungo termine al tumore del seno nelle pazienti affetti da tumore al seno |
CN111275204B (zh) * | 2020-02-25 | 2023-04-07 | 西安工程大学 | 一种基于混合采样和集成学习的变压器状态识别方法 |
JP7489059B2 (ja) * | 2020-04-21 | 2024-05-23 | 国立大学法人横浜国立大学 | 画像生成装置、表示装置、画像生成方法、提示方法およびプログラム |
CN111652095A (zh) * | 2020-05-21 | 2020-09-11 | 骏实生物科技(上海)有限公司 | 一种基于人工智能的ctc图像识别方法和系统 |
CN112465152B (zh) * | 2020-12-03 | 2022-11-29 | 中国科学院大学宁波华美医院 | 一种适用于情绪脑-机接口的在线迁移学习方法 |
US11742059B1 (en) * | 2022-09-06 | 2023-08-29 | Refana Biomarks Inc. | System and method for non-invasive quantification of blood biomarkers |
WO2024127396A1 (en) * | 2022-12-12 | 2024-06-20 | Refana, Inc. | System and method for generating a prediction model based on an input dataset |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005003368A2 (de) | 2003-07-04 | 2005-01-13 | Siemens Aktiengesellschaft | Verfahren, computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse eines regulatorischen genetischen netzwerks einer zelle |
US20050086035A1 (en) | 2003-09-02 | 2005-04-21 | Pioneer Hi-Bred International, Inc. | Computer systems and methods for genotype to phenotype mapping using molecular network models |
CA2546391A1 (en) | 2003-11-24 | 2005-06-09 | Gene Logic, Inc. | Methods for molecular toxicology modeling |
WO2005060608A2 (en) * | 2003-12-11 | 2005-07-07 | Correlogic Systems, Inc. | Method of diagnosing biological states through the use of a centralized, adaptive model, and remote sample processing |
US20060074826A1 (en) | 2004-09-14 | 2006-04-06 | Heumann John M | Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers |
EP1815433A1 (en) | 2004-11-23 | 2007-08-08 | Eastman Kodak Company | Method for recognizing projection views of radiographs |
US20070198653A1 (en) | 2005-12-30 | 2007-08-23 | Kurt Jarnagin | Systems and methods for remote computer-based analysis of user-provided chemogenomic data |
DE102006031979A1 (de) | 2006-07-11 | 2008-01-17 | Bayer Technology Services Gmbh | Verfahren zur Bestimmung des Verhaltens eines biologischen Systems nach einer reversiblen Störung |
RU2473555C2 (ru) | 2006-12-19 | 2013-01-27 | ДжинГоу, Инк. | Новые способы функционального анализа большого количества экспериментальных данных и групп генов, идентифицированных из указанных данных |
JP2009075737A (ja) | 2007-09-19 | 2009-04-09 | Nec Corp | 半教師あり学習方法、半教師あり学習装置及び半教師あり学習プログラム |
US7756678B2 (en) * | 2008-05-29 | 2010-07-13 | General Electric Company | System and method for advanced condition monitoring of an asset system |
JP2012501183A (ja) | 2008-08-28 | 2012-01-19 | ダームテック インターナショナル | 皮膚サンプルの年齢範囲の決定方法 |
US20120143805A1 (en) | 2008-09-09 | 2012-06-07 | Somalogic, Inc. | Cancer Biomarkers and Uses Thereof |
WO2011005893A2 (en) | 2009-07-07 | 2011-01-13 | Abbott Laboratories | Biomarkers and methods for detecting alzheimer's disease |
US20110190657A1 (en) | 2009-08-10 | 2011-08-04 | Carl Zeiss Meditec, Inc. | Glaucoma combinatorial analysis |
US9165051B2 (en) * | 2010-08-24 | 2015-10-20 | Board Of Trustees Of The University Of Illinois | Systems and methods for detecting a novel data class |
CN101944122A (zh) | 2010-09-17 | 2011-01-12 | 浙江工商大学 | 一种融合增量学习的支持向量机多类分类方法 |
CN102135979B (zh) * | 2010-12-08 | 2013-10-09 | 华为技术有限公司 | 数据清洗方法及装置 |
CN102214213B (zh) | 2011-05-31 | 2013-06-19 | 中国科学院计算技术研究所 | 一种采用决策树的数据分类方法和系统 |
CN107391961B (zh) | 2011-09-09 | 2020-11-17 | 菲利普莫里斯生产公司 | 用于基于网络的生物活性评估的系统与方法 |
US8880525B2 (en) * | 2012-04-02 | 2014-11-04 | Xerox Corporation | Full and semi-batch clustering |
EP2864915B8 (en) | 2012-06-21 | 2022-06-15 | Philip Morris Products S.A. | Systems and methods relating to network-based biomarker signatures |
WO2013190085A1 (en) | 2012-06-21 | 2013-12-27 | Philip Morris Products S.A. | Systems and methods for generating biomarker signatures with integrated dual ensemble and generalized simulated annealing techniques |
CA2877429C (en) | 2012-06-21 | 2020-11-03 | Philip Morris Products S.A. | Systems and methods for generating biomarker signatures with integrated bias correction and class prediction |
-
2013
- 2013-06-21 CA CA2877429A patent/CA2877429C/en active Active
- 2013-06-21 EP EP13733985.9A patent/EP2864920B1/en active Active
- 2013-06-21 JP JP2015517783A patent/JP6253644B2/ja active Active
- 2013-06-21 US US14/409,681 patent/US10339464B2/en active Active
- 2013-06-21 WO PCT/EP2013/062980 patent/WO2013190084A1/en active Application Filing
- 2013-06-21 CN CN201380039806.5A patent/CN104508671B/zh active Active
-
2015
- 2015-10-08 HK HK15109834.4A patent/HK1209203A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
HK1209203A1 (en) | 2016-03-24 |
EP2864920A1 (en) | 2015-04-29 |
CA2877429C (en) | 2020-11-03 |
CA2877429A1 (en) | 2013-12-27 |
CN104508671B (zh) | 2018-10-19 |
WO2013190084A1 (en) | 2013-12-27 |
CN104508671A (zh) | 2015-04-08 |
JP2015525413A (ja) | 2015-09-03 |
EP2864920B1 (en) | 2023-05-10 |
US10339464B2 (en) | 2019-07-02 |
US20150178639A1 (en) | 2015-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6253644B2 (ja) | 統合バイアス補正およびクラス予測を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 | |
JP6313757B2 (ja) | 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法 | |
Binder et al. | Big data in medical science—a biostatistical view: Part 21 of a series on evaluation of scientific publications | |
JP6208227B2 (ja) | バイオマーカシグネチャを生成するためのシステムおよび方法 | |
JP7361187B2 (ja) | 医療データの自動化された検証 | |
US9940383B2 (en) | Method, an arrangement and a computer program product for analysing a biological or medical sample | |
Nuhić et al. | Comparative study on different classification techniques for ovarian cancer detection | |
Simsek et al. | Leukemia sub-type classification by using machine learning techniques on gene expression | |
US20140309122A1 (en) | Knowledge-driven sparse learning approach to identifying interpretable high-order feature interactions for system output prediction | |
Sakellariou et al. | Investigating the minimum required number of genes for the classification of neuromuscular disease microarray data | |
Schwarz | Identification and clinical translation of biomarker signatures: statistical considerations | |
US20230116904A1 (en) | Selecting a cell line for an assay | |
Abdullah et al. | Molecular Classification of Breast Cancer Subtypes Based on Proteome Data | |
Nowicka et al. | A framework for designing miRNA-based distributed cell classifier circuits | |
KR20230008020A (ko) | 분자 바이오마커 데이터세트 전반에 걸친 예측 서명의 견고성 및 전송가능성 평가 | |
Poncelas | Preprocess and data analysis techniques for affymetrix DNA microarrays using bioconductor: a case study in Alzheimer disease | |
KR20150027938A (ko) | 마이크로어레이 데이터를 분석하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160620 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20161122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20161122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6253644 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |