JPWO2021216477A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2021216477A5
JPWO2021216477A5 JP2022564030A JP2022564030A JPWO2021216477A5 JP WO2021216477 A5 JPWO2021216477 A5 JP WO2021216477A5 JP 2022564030 A JP2022564030 A JP 2022564030A JP 2022564030 A JP2022564030 A JP 2022564030A JP WO2021216477 A5 JPWO2021216477 A5 JP WO2021216477A5
Authority
JP
Japan
Prior art keywords
genomic regions
genomic
subset
regions
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022564030A
Other languages
English (en)
Other versions
JP2023522940A (ja
Publication date
Priority claimed from US17/233,548 external-priority patent/US20210324477A1/en
Application filed filed Critical
Publication of JP2023522940A publication Critical patent/JP2023522940A/ja
Publication of JPWO2021216477A5 publication Critical patent/JPWO2021216477A5/ja
Pending legal-status Critical Current

Links

Claims (15)

  1. 疾病分類のための縮小遺伝子パネルを生成する、コンピュータシステムによって実行される方法であって、
    ゲノム領域の第1セットに対するシークエンシングデータを取得することと、
    前記ゲノム領域の第1セットに対する前記シークエンシングデータから複数の特徴量を導出することと、
    前記複数の特徴量に基づいて疾病分類を予測する分類モデルを適用することであって、前記分類モデルは、前記ゲノム領域の第1セットに対応するモデル係数のセットを生成することと、
    前記モデル係数のセットに従って前記ゲノム領域の第1セットをランク付けすることと、
    前記ランク付けを使用して、前記疾病分類を最適化する、前記ゲノム領域の第1セットの第1サブセットを同定することと、
    前記ゲノム領域の第1サブセットを含む前記縮小遺伝子パネルを生成することと
    を含み、
    前記ゲノム領域の第1セットは、所定の特異度レベルにおける感度レベルを含む性能測定基準を最適化する、方法。
  2. 前記シークエンシングデータは、複数の患者から取得された生体試料に存在するシークエンシングセルフリー核酸分子から取得される、及び/又は前記ゲノム領域の第1セットは、がん関連遺伝子、変異ホットスポット、およびウイルス領域の少なくとも1つを含む、請求項1の方法。
  3. 前記ゲノム領域の第1セットは、高シグナルのがんまたは液状がんと関連しているゲノム領域を含む、及び/又は前記複数の特徴量は、前記ゲノム領域の第1セットにおける各ゲノム領域においてバリアントの最大アレル頻度を含む、請求項1又は2に記載の方法。
  4. 前記複数の特徴量は、バリアントの有無、平均アレル頻度、小バリアントの総数、および真のバリアントのアレル頻度の少なくとも1つに対応する特徴を表す、及び/又は前記バリアントは、一塩基バリアント、挿入、および欠失の少なくとも1つを含む、請求項1~のいずれか一項に記載の方法。
  5. 前記分類モデルは、ロジスティック回帰モデルを含み、前記モデル係数のセットは、前記複数の特徴量により前記ロジスティック回帰モデルを訓練することにより取得された回帰係数を含む、請求項1~のいずれか一項に記載の方法。
  6. 前記ゲノム領域の第1サブセットを同定することは、
    最初の反復において、前記分類モデルを訓練し、第1ゲノム領域に対応する特徴量に基づいて疾病分類を予測することであって、前記第1ゲノム領域は、最も高くランク付けされたゲノム領域に対応することと、
    前記第1ゲノム領域に対して訓練された前記分類モデルの性能測定基準を判定することと、
    後続の反復において、残りのランク付けされたゲノム領域を取り込み、各追加的なゲノム領域が取り込まれた後に前記性能測定基準を評価することにより、前記分類モデルを再訓練することであって、各後続の反復は、
    欲張りアルゴリズムを適用し、残りのランク付けされたゲノム領域の内、次に高くランク付けされたゲノム領域を前記分類モデルに追加することと、
    前記追加された次に高くランク付けされたゲノム領域および先の反復で前もって追加されたゲノム領域と関連している特徴量を使用して前記分類モデルを再訓練することと、
    前記再訓練された分類モデルに対する性能測定基準を判定することと
    を含むことと、
    各反復に対して取得された前記性能測定基準を評価し、最適化された性能測定基準をもたらす前記ゲノム領域の第1サブセットを同定することと
    を含む、請求項1~のいずれか一項に記載の方法。
  7. 前記最適化された性能測定基準は、前記分類モデルにより得られた最大性能測定基準を含む、請求項6に記載の方法。
  8. 前記疾病分類は、がんまたは非がんを予測するための二項分類およびがんの種類を予測するための多クラス分類の少なくとも1つを含む、及び/又は前記縮小遺伝子パネルにより取得された性能測定基準は、完全なゲノム領域の第1セットを含む完全な遺伝子パネルにより取得された性能測定基準と、実質的に同様である、請求項1~のいずれか一項に記載の方法。
  9. 前記ゲノム領域の第1セットは、高シグナルのがんと関連しているゲノム領域を含み、約2Mbのセットサイズを有し、前記ゲノム領域の第1サブセットは、300kb未満のサブセットサイズを有する、及び/又は前記縮小遺伝子パネルは、300kbを超えない総パネルサイズを有する、請求項1~のいずれか一項に記載の方法。
  10. 前記ゲノム領域の第1サブセットにより得られた前記疾病分類を更に改善するゲノム領域の第2サブセットを同定することと、
    前記ゲノム領域の第1サブセットと前記ゲノム領域の第2サブセットとを含む前記縮小遺伝子パネルを生成することと
    を更に含む、請求項1~のいずれか一項に記載の方法。
  11. ゲノム領域の第2セットに対するシークエンシングデータの第2セットを取得することと、
    患者ごとの体細胞変異の頻度およびコード領域の長さにより正規化された頻度の少なくとも1つにより前記ゲノム領域の第2セットをランク付けすることと、
    前記ランク付けされたゲノム領域の第2セットに基づいて前記ゲノム領域の第2サブセットを同定することと
    を更に含む、請求項10に記載の方法。
  12. 前記縮小遺伝子パネルにより得られた前記疾病分類を更に改善するゲノム領域の第3サブセットを同定することであって、前記ゲノム領域の第3サブセットは、疾病の種類の予測精度を最適化することと、
    前記縮小遺伝子パネルに前記ゲノム領域の第3サブセットを含むことと
    を更に含む、及び/又は前記ゲノム領域の第3セットは、さらに、がん特異的遺伝子および変異ホットスポットである、請求項1~11のいずれか一項に記載の方法。
  13. 追加的なホットスポット領域を前記縮小遺伝子パネルに追加することであって、前記ホットスポット領域は、一塩基バリアント、挿入、または欠失に対応することを更に含む、及び又は追加的なウイルス標的領域を前記縮小遺伝子パネルに追加することであって、前記ウイルス標的領域は、ウイルス関連がんに対応することを更に含む、請求項1~12のいずれか一項に記載の方法。
  14. プロセッサを含む電子デバイスにより実行されたときに前記デバイスに請求項1~13のいずれか一項に記載の方法を実行させる指示を含む1つまたは複数のプログラムを保管する非一時的コンピュータ可読媒体。
  15. 1つまたは複数のプロセッサと、
    メモリと、
    前記メモリに保管され、前記1つまたは複数のプロセッサにより実行されるように構成され、請求項1~13のいずれか一項に記載の方法を実行するための指示を含む、1つまたは複数のプログラムと
    を備える電子デバイス。
JP2022564030A 2020-04-21 2021-04-20 性能測定基準に従ったがん検出パネルの生成 Pending JP2023522940A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063013512P 2020-04-21 2020-04-21
US63/013,512 2020-04-21
US17/233,548 US20210324477A1 (en) 2020-04-21 2021-04-19 Generating cancer detection panels according to a performance metric
US17/233,548 2021-04-19
PCT/US2021/028035 WO2021216477A1 (en) 2020-04-21 2021-04-20 Generating cancer detection panels according to a performance metric

Publications (2)

Publication Number Publication Date
JP2023522940A JP2023522940A (ja) 2023-06-01
JPWO2021216477A5 true JPWO2021216477A5 (ja) 2024-02-22

Family

ID=78081562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022564030A Pending JP2023522940A (ja) 2020-04-21 2021-04-20 性能測定基準に従ったがん検出パネルの生成

Country Status (7)

Country Link
US (1) US20210324477A1 (ja)
EP (1) EP4128269A1 (ja)
JP (1) JP2023522940A (ja)
CN (1) CN115699205A (ja)
AU (1) AU2021259295A1 (ja)
CA (1) CA3174294A1 (ja)
WO (1) WO2021216477A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3801623A4 (en) 2018-06-01 2022-03-23 Grail, LLC NEURAL CONVOLUTIONAL NETWORK SYSTEMS AND DATA CLASSIFICATION METHODS
US11581062B2 (en) * 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
CN115997035A (zh) 2020-06-30 2023-04-21 通用诊断股份公司 用于检测多种癌症类型的系统和方法
CN115713971B (zh) * 2022-09-28 2024-01-23 上海睿璟生物科技有限公司 靶向序列捕获探针设计策略选择方法、系统及终端
CN116646010B (zh) * 2023-07-27 2024-03-29 深圳赛陆医疗科技有限公司 人源性病毒检测方法及装置、设备、存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9805918D0 (en) * 1998-03-19 1998-05-13 Nycomed Amersham Plc Sequencing by hybridisation
US20180045727A1 (en) * 2015-03-03 2018-02-15 Caris Mpi, Inc. Molecular profiling for cancer
WO2018064547A1 (en) * 2016-09-30 2018-04-05 The Trustees Of Columbia University In The City Of New York Methods for classifying somatic variations
CN111278993A (zh) * 2017-09-15 2020-06-12 加利福尼亚大学董事会 从无细胞核酸中检测体细胞单核苷酸变体并应用于微小残留病变监测
EP3776555A2 (en) * 2018-04-13 2021-02-17 Grail, Inc. Multi-assay prediction model for cancer detection

Similar Documents

Publication Publication Date Title
Liu et al. A multi-tissue atlas of regulatory variants in cattle
Palamara et al. High-throughput inference of pairwise coalescence times identifies signals of selection and enriched disease heritability
Telenti et al. Deep learning of genomic variation and regulatory network data
Scheet et al. A fast and flexible statistical model for large-scale population genotype data: applications to inferring missing genotypes and haplotypic phase
Delaneau et al. Haplotype estimation using sequencing reads
Kelley et al. Quake: quality-aware detection and correction of sequencing errors
Speed et al. MultiBLUP: improved SNP-based prediction for complex traits
Davydov et al. Identifying a high fraction of the human genome to be under selective constraint using GERP++
Taylor et al. ESPERR: learning strong and weak signals in genomic sequence alignments to identify functional elements
Wang et al. Next generation sequencing has lower sequence coverage and poorer SNP-detection capability in the regulatory regions
Derrien et al. Fast computation and applications of genome mappability
Elnitski et al. Distinguishing regulatory DNA from neutral sites
Cowperthwaite et al. The ascent of the abundant: how mutational networks constrain evolution
Racimo et al. Approximation to the distribution of fitness effects across functional categories in human segregating polymorphisms
US20200239965A1 (en) Source of origin deconvolution based on methylation fragments in cell-free dna samples
He et al. Alignment and prediction of cis-regulatory modules based on a probabilistic model of evolution
CN113228191A (zh) 识别胚胎中染色体异常的系统和方法
Chen et al. A hybrid likelihood model for sequence-based disease association studies
Zhang Feature selection using approximate conditional entropy based on fuzzy information granule for gene expression data classification
JPWO2021216477A5 (ja)
Sun et al. HS-MMGKG: a fast multi-objective harmony search algorithm for two-locus model detection in GWAS
Elmas et al. Discovering genome-wide tag SNPs based on the mutual information of the variants
Gong et al. Prediction of early breast cancer patient survival using ensembles of hypoxia signatures
Lao et al. GAGA: a new algorithm for genomic inference of geographic ancestry reveals fine level population substructure in Europeans
Chen et al. Identify alternative splicing events based on position-specific evolutionary conservation