JPWO2020112478A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2020112478A5 JPWO2020112478A5 JP2021530139A JP2021530139A JPWO2020112478A5 JP WO2020112478 A5 JPWO2020112478 A5 JP WO2020112478A5 JP 2021530139 A JP2021530139 A JP 2021530139A JP 2021530139 A JP2021530139 A JP 2021530139A JP WO2020112478 A5 JPWO2020112478 A5 JP WO2020112478A5
- Authority
- JP
- Japan
- Prior art keywords
- class
- data
- data set
- imbalance
- minority
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004083 survival Effects 0.000 claims 13
- 201000010099 disease Diseases 0.000 claims 9
- 238000002790 cross-validation Methods 0.000 claims 8
- 238000005259 measurement Methods 0.000 claims 8
- 230000035533 AUC Effects 0.000 claims 5
- 239000000203 mixture Substances 0.000 claims 5
- 230000035945 sensitivity Effects 0.000 claims 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N (3β)-Cholest-5-en-3-ol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims 2
- 229940107161 Cholesterol Drugs 0.000 claims 1
- 230000036772 blood pressure Effects 0.000 claims 1
- 235000012000 cholesterol Nutrition 0.000 claims 1
- 238000002705 metabolomic Methods 0.000 claims 1
- 230000001431 metabolomic Effects 0.000 claims 1
- 102000004169 proteins and genes Human genes 0.000 claims 1
- 108090000623 proteins and genes Proteins 0.000 claims 1
- 238000000575 proteomic Methods 0.000 claims 1
- 238000007637 random forest analysis Methods 0.000 claims 1
Claims (25)
- 疾患のリスクを判定するための方法であって、
a)クラス不均衡データセットを取得することであって、前記クラス不均衡データセットは、複数の対象からの生物学的データを含み、各対象の前記生物学的データは、観察結果、時間の値、及び複数の臨床測定値を含み、前記生物学的データは、多数派データクラスまたは少数派データクラスの一部として分類され、前記多数派データクラスは前記少数派データクラスよりも多くの観察結果を含む、前記取得すること、
b)前記クラス不均衡データセットをダウンサンプリングして、ダウンサンプリングされたデータセットを生成することであって、前記ダウンサンプリングが、前記少数派データクラスと同等の数の観察結果を含む前記多数派データクラスを生成する、前記生成すること、及び
c)生存モデルを生成するために、生存分析を使用して前記ダウンサンプリングされたデータセットに対して交差検証を実行することを含み、
前記観察結果は、特定の時間の値でイベントを含むか、またはイベントを含まず、並びに
AUC、感度、特異度、及び/または前記生存モデルのC-indexは、前記クラス不均衡データセットが前記生存分析の前にダウンサンプリングされなかったAUC、感度、特異度、及び/または生存モデルのC-indexよりも1に近い、
前記方法。 - 前記クラス不均衡データセットが生存データセットである、請求項1に記載の方法。
- 前記イベントが、対象の疾患、障害、または状態である、請求項1又は2に記載の方法。
- 前記生存分析は、コックス比例ハザード分析、ランダムフォレスト分析、加速故障時間分析、及びそれらの任意の組み合わせからなる群から選択される、請求項1~3のいずれか一項に記載の方法。
- エラスティックネットペナルティをさらに含む、請求項4に記載の方法。
- 前記交差検証は、2分割、3分割、4分割、5分割、6分割、7分割、8分割、9分割、10分割、11分割、12分割、13分割、14分割、15分割、16分割、17分割、18分割、19分割、または20分割の交差検証である、請求項1~5のいずれか一項に記載の方法。
- 前記生存モデルは5から1000の特徴を含み、各特徴は、タンパク質の測定、臨床因子、及びそれらの組み合わせからなる群から選択される、請求項1~6のいずれか一項に記載の方法。
- 前記臨床因子は、年齢、体重、血圧、身長、BMI、コレステロール、性別、及びそれらの組み合わせからなる群から選択される、請求項7に記載の方法。
- 前記臨床測定値は、プロテオミクス測定値、ゲノム測定値、トランスクリプトーム測定値、メタボロミクス測定値、またはそれらの組み合わせから選択される、請求項1~8のいずれか一項に記載の方法。
- 前記交差検証が、k分割交差検証、モンテカルロ交差検証、及びN個抜き交差検証から選択される、請求項1~9のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの95%であり、前記少数派データクラスが前記クラス不均衡データセットの5%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの90%であり、前記少数派データクラスが前記クラス不均衡データセットの10%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの85%であり、前記少数派データクラスが前記クラス不均衡データセットの15%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの80%であり、前記少数派データクラスが前記クラス不均衡データセットの20%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの75%であり、前記少数派データクラスが前記クラス不均衡データセットの25%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの70%であり、前記少数派データクラスが前記クラス不均衡データセットの30%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの65%であり、前記少数派データクラスが前記クラス不均衡データセットの35%である、請求項1~10のいずれか一項に記載の方法。
- 前記多数派データクラスが前記クラス不均衡データセットの60%であり、前記少数派データクラスが前記クラス不均衡データセットの40%である、請求項1~10のいずれか一項に記載の方法。
- 疾患のリスクを判定するための方法であって、
a)クラス不均衡データセットをダウンサンプリングして、ダウンサンプリングされたデータセットを生成することであって、前記ダウンサンプリングが、少数派データクラスと同等の数の観察結果を含む多数派データクラスを生成する、前記生成すること、及び
b)生存モデルを生成するために、生存分析を使用して前記ダウンサンプリングされたデータセットに対して交差検証を実行することを含み、
前記観察結果は、特定の時間の値でイベントを含むか、またはイベントを含まず、
前記クラス不均衡データセットは、複数の対象からの生物学的データを含み、各対象の前記生物学的データは、観察結果、時間の値、及び複数の臨床測定値を含み、前記生物学的データは、前記多数派データクラスまたは前記少数派データクラスの一部として分類され、前記多数派データクラスは前記少数派データクラスよりも多くの観察結果を含み、並びに
AUC、感度、特異度、及び/または前記生存モデルのC-indexは、前記クラス不均衡データセットが前記生存分析の前にダウンサンプリングされなかったAUC、感度、特異度、及び/または生存モデルのC-indexよりも1に近い、
前記方法。 - 前記AUCは、対象が特定の時点までにイベントを有するかどうかの判定に基づいて計算される、請求項19に記載の方法。
- 請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法のコンピュータ実装方法であって、
ステップb)及びステップc)は、コンピュータシステムを用いて計算される、前記方法。 - ステップa)におけるクラス不均衡データセットが、コンピュータシステムによって受信される、請求項21に記載の方法。
- コンピュータによって読み取り可能なプログラム記憶装置であって、前記コンピュータによって実行可能な命令のプログラムを触知的に具現化して、
請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法の方法ステップを実行する、前記装置。 - 疾患のリスクを判定するためのコンピューティングシステムであって、プログラムされた命令を格納するためのメモリ;及び操作を実行するため前記プログラムされた命令を実行するように構成されたプロセッサを含み、
前記操作が、請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法を実行するものである、前記システム。 - 非一時的なコンピュータ可読媒体であって、
操作を実行するためにプロセッサによって実行可能な命令が格納され、
前記操作が、請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法を実行するものである、前記非一時的なコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862773028P | 2018-11-29 | 2018-11-29 | |
US62/773,028 | 2018-11-29 | ||
US201862783733P | 2018-12-21 | 2018-12-21 | |
US62/783,733 | 2018-12-21 | ||
PCT/US2019/062561 WO2020112478A1 (en) | 2018-11-29 | 2019-11-21 | Methods for determining disease risk combining downsampling of class-imbalanced sets with survival analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022509835A JP2022509835A (ja) | 2022-01-24 |
JPWO2020112478A5 true JPWO2020112478A5 (ja) | 2022-11-24 |
Family
ID=70852605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021530139A Pending JP2022509835A (ja) | 2018-11-29 | 2019-11-21 | 生存分析によるクラス不均衡セットのダウンサンプリングを組み合わせた疾患リスクを判定するための方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20220015714A1 (ja) |
EP (1) | EP3886696A4 (ja) |
JP (1) | JP2022509835A (ja) |
KR (1) | KR20210099605A (ja) |
CN (1) | CN113271849A (ja) |
AU (1) | AU2019385818A1 (ja) |
CA (1) | CA3120716A1 (ja) |
IL (1) | IL283467A (ja) |
SG (1) | SG11202105063QA (ja) |
WO (1) | WO2020112478A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11996201B2 (en) * | 2021-03-04 | 2024-05-28 | Abbott Laboratories | Technology to automatically identify the most relevant health failure risk factors |
JP7322918B2 (ja) * | 2021-03-29 | 2023-08-08 | 横河電機株式会社 | プログラム、情報処理装置、及び学習モデルの生成方法 |
KR102393367B1 (ko) | 2021-11-15 | 2022-05-03 | 오브젠 주식회사 | 생존 분석 시스템 및 그 제어방법 |
KR102424884B1 (ko) | 2021-11-18 | 2022-07-27 | 오브젠 주식회사 | 생존 데이터 정제 서버와 생존 데이터 분석 서버를 포함하는 시스템 및 그 제어방법 |
CN114548327A (zh) * | 2022-04-27 | 2022-05-27 | 湖南工商大学 | 基于平衡子集的软件缺陷预测方法、系统、设备及介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7982066B2 (en) * | 2005-12-09 | 2011-07-19 | Novalife, Inc. | High protein supplement |
WO2011072177A2 (en) * | 2009-12-09 | 2011-06-16 | Aviir, Inc. | Biomarker assay for diagnosis and classification of cardiovascular disease |
US20120271553A1 (en) * | 2011-04-22 | 2012-10-25 | Ge Global Research | Analyzing the expression of biomarkers in cells with clusters |
CN104573708A (zh) * | 2014-12-19 | 2015-04-29 | 天津大学 | 组合降采样极限学习机 |
EP3356560A4 (en) * | 2015-09-30 | 2019-06-12 | Inform Genomics, Inc. | SYSTEMS AND METHODS FOR PREDICTING EVENTS RELATED TO A THERAPEUTIC REGIME |
AU2018100796A4 (en) * | 2018-06-14 | 2018-07-19 | Macau University Of Science And Technology | A genetic feature identifying system and a search method for identifying features of genetic information |
-
2019
- 2019-11-21 EP EP19888405.8A patent/EP3886696A4/en active Pending
- 2019-11-21 US US17/297,669 patent/US20220015714A1/en active Pending
- 2019-11-21 CA CA3120716A patent/CA3120716A1/en active Pending
- 2019-11-21 SG SG11202105063QA patent/SG11202105063QA/en unknown
- 2019-11-21 AU AU2019385818A patent/AU2019385818A1/en active Pending
- 2019-11-21 KR KR1020217020120A patent/KR20210099605A/ko active Search and Examination
- 2019-11-21 JP JP2021530139A patent/JP2022509835A/ja active Pending
- 2019-11-21 WO PCT/US2019/062561 patent/WO2020112478A1/en unknown
- 2019-11-21 CN CN201980078901.3A patent/CN113271849A/zh active Pending
-
2021
- 2021-05-26 IL IL283467A patent/IL283467A/en unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fishman et al. | A method for analyzing temporal patterns of variability of a time series from Poincare plots | |
CN109493933B (zh) | 一种基于注意力机制的不良心血管事件的预测装置 | |
US9295397B2 (en) | Method and apparatus for beat-space frequency domain prediction of cardiovascular death after acute coronary event | |
US20220015714A1 (en) | Methods For Determining Disease Risk Combining Downsampling of Class-Imbalanced Sets With Survival Analysis | |
WO2018106146A2 (ru) | Способ и система неинвазивной скрининговой оценки физиологических параметров и патологий | |
Fathima et al. | Comparison of classification techniques-SVM and naives bayes to predict the Arboviral disease-Dengue | |
JP6038727B2 (ja) | 分析システム及び分析方法 | |
US20230095492A1 (en) | Methods and systems using fractional rank precision and mean average precision as test-retest reliability measures | |
Herrgårdh et al. | Hybrid modelling for stroke care: Review and suggestions of new approaches for risk assessment and simulation of scenarios | |
JP2011065283A (ja) | 有意性評価プログラム及び記録媒体 | |
US11238959B2 (en) | Biomarker search method, biomarker search device, and program | |
JPWO2020112478A5 (ja) | ||
Wilson et al. | Evolving anisotropy and degree of elastolytic insult in abdominal aortic aneurysms: potential clinical relevance? | |
KL et al. | Coronary artery disease prediction using data mining techniques | |
WO2015173917A1 (ja) | 分析システム | |
Shree et al. | Diagnosis of Alzheimer’s disease using rule based approach | |
Wosiak et al. | On integrating clustering and statistical analysis for supporting cardiovascular disease diagnosis | |
Daza et al. | Stacking ensemble approach to diagnosing the disease of diabetes | |
Shalaby et al. | Simulating the effect of sodium channel blockage on cardiac electromechanics | |
Gajos-Balińska et al. | High performance optimization of independent component analysis algorithm for EEG data | |
Juhan et al. | Bayesian MCMC Approach in Prognostic Modelling of Cardiovascular Disease in Malaysia: A Convergence Diagnostic | |
Ma et al. | Identification of essential plasma protein using manifold regularized sparse group-lasso for prediction of Alzheimer’s disease | |
JP6960369B2 (ja) | 分析システム及び分析方法 | |
US20150134311A1 (en) | Modeling Effectiveness of Verum | |
JP7266349B1 (ja) | インシリコ心疾患データベース活用方法、インシリコ心疾患データベース活用プログラム、および情報処理装置 |