JPWO2020112478A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020112478A5
JPWO2020112478A5 JP2021530139A JP2021530139A JPWO2020112478A5 JP WO2020112478 A5 JPWO2020112478 A5 JP WO2020112478A5 JP 2021530139 A JP2021530139 A JP 2021530139A JP 2021530139 A JP2021530139 A JP 2021530139A JP WO2020112478 A5 JPWO2020112478 A5 JP WO2020112478A5
Authority
JP
Japan
Prior art keywords
class
data
data set
imbalance
minority
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021530139A
Other languages
English (en)
Other versions
JP2022509835A (ja
Publication date
Application filed filed Critical
Priority claimed from PCT/US2019/062561 external-priority patent/WO2020112478A1/en
Publication of JP2022509835A publication Critical patent/JP2022509835A/ja
Publication of JPWO2020112478A5 publication Critical patent/JPWO2020112478A5/ja
Pending legal-status Critical Current

Links

Claims (25)

  1. 疾患のリスクを判定するための方法であって、
    a)クラス不均衡データセットを取得することであって、前記クラス不均衡データセットは、複数の対象からの生物学的データを含み、各対象の前記生物学的データは、観察結果、時間の値、及び複数の臨床測定値を含み、前記生物学的データは、多数派データクラスまたは少数派データクラスの一部として分類され、前記多数派データクラスは前記少数派データクラスよりも多くの観察結果を含む、前記取得すること、
    b)前記クラス不均衡データセットをダウンサンプリングして、ダウンサンプリングされたデータセットを生成することであって、前記ダウンサンプリングが、前記少数派データクラスと同等の数の観察結果を含む前記多数派データクラスを生成する、前記生成すること、及び
    c)生存モデルを生成するために、生存分析を使用して前記ダウンサンプリングされたデータセットに対して交差検証を実行することを含み、
    前記観察結果は、特定の時間の値でイベントを含むか、またはイベントを含ま並びに
    AUC、感度、特異度、及び/または前記生存モデルのC-indexは、前記クラス不均衡データセットが前記生存分析の前にダウンサンプリングされなかったAUC、感度、特異度、及び/または生存モデルのC-indexよりも1に近い、
    前記方法。
  2. 前記クラス不均衡データセットが生存データセットである、請求項1に記載の方法。
  3. 前記イベントが、対象の疾患、障害、または状態である、請求項1又は2に記載の方法。
  4. 前記生存分析は、コックス比例ハザード分析、ランダムフォレスト分析、加速故障時間分析、及びそれらの任意の組み合わせからなる群から選択される、請求項1~3のいずれか一項に記載の方法。
  5. エラスティックネットペナルティをさらに含む、請求項に記載の方法。
  6. 前記交差検証は、2分割、3分割、4分割、5分割、6分割、7分割、8分割、9分割、10分割、11分割、12分割、13分割、14分割、15分割、16分割、17分割、18分割、19分割、または20分割の交差検証である、請求項1~5のいずれか一項に記載の方法。
  7. 前記生存モデルは5から1000の特徴を含み、各特徴は、タンパク質の測定、臨床因子、及びそれらの組み合わせからなる群から選択される、請求項1~6のいずれか一項に記載の方法。
  8. 前記臨床因子は、年齢、体重、血圧、身長、BMI、コレステロール、性別、及びそれらの組み合わせからなる群から選択される、請求項に記載の方法。
  9. 前記臨床測定値は、プロテオミクス測定値、ゲノム測定値、トランスクリプトーム測定値、メタボロミクス測定値、またはそれらの組み合わせから選択される、請求項1~8のいずれか一項に記載の方法。
  10. 前記交差検証が、k分割交差検証、モンテカルロ交差検証、及びN個抜き交差検証から選択される、請求項1~9のいずれか一項に記載の方法。
  11. 前記多数派データクラスが前記クラス不均衡データセットの95%であり、前記少数派データクラスが前記クラス不均衡データセットの5%である、請求項1~10のいずれか一項に記載の方法。
  12. 前記多数派データクラスが前記クラス不均衡データセットの90%であり、前記少数派データクラスが前記クラス不均衡データセットの10%である、請求項1~10のいずれか一項に記載の方法。
  13. 前記多数派データクラスが前記クラス不均衡データセットの85%であり、前記少数派データクラスが前記クラス不均衡データセットの15%である、請求項1~10のいずれか一項に記載の方法。
  14. 前記多数派データクラスが前記クラス不均衡データセットの80%であり、前記少数派データクラスが前記クラス不均衡データセットの20%である、請求項1~10のいずれか一項に記載の方法。
  15. 前記多数派データクラスが前記クラス不均衡データセットの75%であり、前記少数派データクラスが前記クラス不均衡データセットの25%である、請求項1~10のいずれか一項に記載の方法。
  16. 前記多数派データクラスが前記クラス不均衡データセットの70%であり、前記少数派データクラスが前記クラス不均衡データセットの30%である、請求項1~10のいずれか一項に記載の方法。
  17. 前記多数派データクラスが前記クラス不均衡データセットの65%であり、前記少数派データクラスが前記クラス不均衡データセットの35%である、請求項1~10のいずれか一項に記載の方法。
  18. 前記多数派データクラスが前記クラス不均衡データセットの60%であり、前記少数派データクラスが前記クラス不均衡データセットの40%である、請求項1~10のいずれか一項に記載の方法。
  19. 疾患のリスクを判定するための方法であって、
    a)クラス不均衡データセットをダウンサンプリングして、ダウンサンプリングされたデータセットを生成することであって、前記ダウンサンプリングが、少数派データクラスと同等の数の観察結果を含む多数派データクラスを生成する、前記生成すること、及び
    b)生存モデルを生成するために、生存分析を使用して前記ダウンサンプリングされたデータセットに対して交差検証を実行することを含み、
    前記観察結果は、特定の時間の値でイベントを含むか、またはイベントを含まず、
    前記クラス不均衡データセットは、複数の対象からの生物学的データを含み、各対象の前記生物学的データは、観察結果、時間の値、及び複数の臨床測定値を含み、前記生物学的データは、前記多数派データクラスまたは前記少数派データクラスの一部として分類され、前記多数派データクラスは前記少数派データクラスよりも多くの観察結果を含み、並びに
    AUC、感度、特異度、及び/または前記生存モデルのC-indexは、前記クラス不均衡データセットが前記生存分析の前にダウンサンプリングされなかったAUC、感度、特異度、及び/または生存モデルのC-indexよりも1に近い
    前記方法。
  20. 前記AUCは、対象が特定の時点までにイベントを有するかどうかの判定に基づいて計算される、請求項19に記載の方法。
  21. 請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法のコンピュータ実装方法であって
    テップb)及びステップc)は、コンピュータシステムを用いて計算される、前記方法。
  22. ステップa)におけるクラス不均衡データセットが、コンピュータシステムによって受信される、請求項21に記載の方法。
  23. コンピュータによって読み取り可能なプログラム記憶装置であって、前記コンピュータによって実行可能な命令のプログラムを触知的に具現化して、
    請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法の方法ステップを実行する、前記装置。
  24. 疾患のリスクを判定するためのコンピューティングシステムであって、プログラムされた命令を格納するためのメモリ;及び操作を実行するため前記プログラムされた命令を実行するように構成されたプロセッサを含み、
    前記操作が、請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法を実行するものである、前記システム。
  25. 非一時的なコンピュータ可読媒体であって
    作を実行するためにプロセッサによって実行可能な命令が格納され、
    前記操作が、請求項1~18のいずれか一項に記載の疾患のリスクを判定するための方法を実行するものである、前記非一時的なコンピュータ可読媒体。
JP2021530139A 2018-11-29 2019-11-21 生存分析によるクラス不均衡セットのダウンサンプリングを組み合わせた疾患リスクを判定するための方法 Pending JP2022509835A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862773028P 2018-11-29 2018-11-29
US62/773,028 2018-11-29
US201862783733P 2018-12-21 2018-12-21
US62/783,733 2018-12-21
PCT/US2019/062561 WO2020112478A1 (en) 2018-11-29 2019-11-21 Methods for determining disease risk combining downsampling of class-imbalanced sets with survival analysis

Publications (2)

Publication Number Publication Date
JP2022509835A JP2022509835A (ja) 2022-01-24
JPWO2020112478A5 true JPWO2020112478A5 (ja) 2022-11-24

Family

ID=70852605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021530139A Pending JP2022509835A (ja) 2018-11-29 2019-11-21 生存分析によるクラス不均衡セットのダウンサンプリングを組み合わせた疾患リスクを判定するための方法

Country Status (10)

Country Link
US (1) US20220015714A1 (ja)
EP (1) EP3886696A4 (ja)
JP (1) JP2022509835A (ja)
KR (1) KR20210099605A (ja)
CN (1) CN113271849A (ja)
AU (1) AU2019385818A1 (ja)
CA (1) CA3120716A1 (ja)
IL (1) IL283467A (ja)
SG (1) SG11202105063QA (ja)
WO (1) WO2020112478A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11996201B2 (en) * 2021-03-04 2024-05-28 Abbott Laboratories Technology to automatically identify the most relevant health failure risk factors
JP7322918B2 (ja) * 2021-03-29 2023-08-08 横河電機株式会社 プログラム、情報処理装置、及び学習モデルの生成方法
KR102393367B1 (ko) 2021-11-15 2022-05-03 오브젠 주식회사 생존 분석 시스템 및 그 제어방법
KR102424884B1 (ko) 2021-11-18 2022-07-27 오브젠 주식회사 생존 데이터 정제 서버와 생존 데이터 분석 서버를 포함하는 시스템 및 그 제어방법
CN114548327A (zh) * 2022-04-27 2022-05-27 湖南工商大学 基于平衡子集的软件缺陷预测方法、系统、设备及介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7982066B2 (en) * 2005-12-09 2011-07-19 Novalife, Inc. High protein supplement
WO2011072177A2 (en) * 2009-12-09 2011-06-16 Aviir, Inc. Biomarker assay for diagnosis and classification of cardiovascular disease
US20120271553A1 (en) * 2011-04-22 2012-10-25 Ge Global Research Analyzing the expression of biomarkers in cells with clusters
CN104573708A (zh) * 2014-12-19 2015-04-29 天津大学 组合降采样极限学习机
EP3356560A4 (en) * 2015-09-30 2019-06-12 Inform Genomics, Inc. SYSTEMS AND METHODS FOR PREDICTING EVENTS RELATED TO A THERAPEUTIC REGIME
AU2018100796A4 (en) * 2018-06-14 2018-07-19 Macau University Of Science And Technology A genetic feature identifying system and a search method for identifying features of genetic information

Similar Documents

Publication Publication Date Title
Fishman et al. A method for analyzing temporal patterns of variability of a time series from Poincare plots
CN109493933B (zh) 一种基于注意力机制的不良心血管事件的预测装置
US9295397B2 (en) Method and apparatus for beat-space frequency domain prediction of cardiovascular death after acute coronary event
US20220015714A1 (en) Methods For Determining Disease Risk Combining Downsampling of Class-Imbalanced Sets With Survival Analysis
WO2018106146A2 (ru) Способ и система неинвазивной скрининговой оценки физиологических параметров и патологий
Fathima et al. Comparison of classification techniques-SVM and naives bayes to predict the Arboviral disease-Dengue
JP6038727B2 (ja) 分析システム及び分析方法
US20230095492A1 (en) Methods and systems using fractional rank precision and mean average precision as test-retest reliability measures
Herrgårdh et al. Hybrid modelling for stroke care: Review and suggestions of new approaches for risk assessment and simulation of scenarios
JP2011065283A (ja) 有意性評価プログラム及び記録媒体
US11238959B2 (en) Biomarker search method, biomarker search device, and program
JPWO2020112478A5 (ja)
Wilson et al. Evolving anisotropy and degree of elastolytic insult in abdominal aortic aneurysms: potential clinical relevance?
KL et al. Coronary artery disease prediction using data mining techniques
WO2015173917A1 (ja) 分析システム
Shree et al. Diagnosis of Alzheimer’s disease using rule based approach
Wosiak et al. On integrating clustering and statistical analysis for supporting cardiovascular disease diagnosis
Daza et al. Stacking ensemble approach to diagnosing the disease of diabetes
Shalaby et al. Simulating the effect of sodium channel blockage on cardiac electromechanics
Gajos-Balińska et al. High performance optimization of independent component analysis algorithm for EEG data
Juhan et al. Bayesian MCMC Approach in Prognostic Modelling of Cardiovascular Disease in Malaysia: A Convergence Diagnostic
Ma et al. Identification of essential plasma protein using manifold regularized sparse group-lasso for prediction of Alzheimer’s disease
JP6960369B2 (ja) 分析システム及び分析方法
US20150134311A1 (en) Modeling Effectiveness of Verum
JP7266349B1 (ja) インシリコ心疾患データベース活用方法、インシリコ心疾患データベース活用プログラム、および情報処理装置