JPWO2021216477A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021216477A5 JPWO2021216477A5 JP2022564030A JP2022564030A JPWO2021216477A5 JP WO2021216477 A5 JPWO2021216477 A5 JP WO2021216477A5 JP 2022564030 A JP2022564030 A JP 2022564030A JP 2022564030 A JP2022564030 A JP 2022564030A JP WO2021216477 A5 JPWO2021216477 A5 JP WO2021216477A5
- Authority
- JP
- Japan
- Prior art keywords
- genomic regions
- genomic
- subset
- regions
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims 12
- 108090000623 proteins and genes Proteins 0.000 claims 11
- 238000013145 classification model Methods 0.000 claims 10
- 206010028980 Neoplasm Diseases 0.000 claims 9
- 201000011510 cancer Diseases 0.000 claims 9
- 201000010099 disease Diseases 0.000 claims 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims 8
- 238000012163 sequencing technique Methods 0.000 claims 5
- 108700028369 Alleles Proteins 0.000 claims 3
- 230000003612 virological effect Effects 0.000 claims 3
- 230000037430 deletion Effects 0.000 claims 2
- 238000012217 deletion Methods 0.000 claims 2
- 230000037431 insertion Effects 0.000 claims 2
- 238000003780 insertion Methods 0.000 claims 2
- 238000007477 logistic regression Methods 0.000 claims 2
- 239000002773 nucleotide Substances 0.000 claims 2
- 125000003729 nucleotide group Chemical group 0.000 claims 2
- 206010069754 Acquired gene mutation Diseases 0.000 claims 1
- 108091026890 Coding region Proteins 0.000 claims 1
- 241000700605 Viruses Species 0.000 claims 1
- 239000012472 biological sample Substances 0.000 claims 1
- 239000007788 liquid Substances 0.000 claims 1
- 230000035772 mutation Effects 0.000 claims 1
- 230000000869 mutational effect Effects 0.000 claims 1
- 108020004707 nucleic acids Proteins 0.000 claims 1
- 150000007523 nucleic acids Chemical class 0.000 claims 1
- 102000039446 nucleic acids Human genes 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 claims 1
- 230000037439 somatic mutation Effects 0.000 claims 1
Claims (15)
- 疾病分類のための縮小遺伝子パネルを生成する、コンピュータシステムによって実行される方法であって、
ゲノム領域の第1セットに対するシークエンシングデータを取得することと、
前記ゲノム領域の第1セットに対する前記シークエンシングデータから複数の特徴量を導出することと、
前記複数の特徴量に基づいて疾病分類を予測する分類モデルを適用することであって、前記分類モデルは、前記ゲノム領域の第1セットに対応するモデル係数のセットを生成することと、
前記モデル係数のセットに従って前記ゲノム領域の第1セットをランク付けすることと、
前記ランク付けを使用して、前記疾病分類を最適化する、前記ゲノム領域の第1セットの第1サブセットを同定することと、
前記ゲノム領域の第1サブセットを含む前記縮小遺伝子パネルを生成することと
を含み、
前記ゲノム領域の第1セットは、所定の特異度レベルにおける感度レベルを含む性能測定基準を最適化する、方法。 - 前記シークエンシングデータは、複数の患者から取得された生体試料に存在するシークエンシングセルフリー核酸分子から取得される、及び/又は前記ゲノム領域の第1セットは、がん関連遺伝子、変異ホットスポット、およびウイルス領域の少なくとも1つを含む、請求項1の方法。
- 前記ゲノム領域の第1セットは、高シグナルのがんまたは液状がんと関連しているゲノム領域を含む、及び/又は前記複数の特徴量は、前記ゲノム領域の第1セットにおける各ゲノム領域においてバリアントの最大アレル頻度を含む、請求項1又は2に記載の方法。
- 前記複数の特徴量は、バリアントの有無、平均アレル頻度、小バリアントの総数、および真のバリアントのアレル頻度の少なくとも1つに対応する特徴を表す、及び/又は前記バリアントは、一塩基バリアント、挿入、および欠失の少なくとも1つを含む、請求項1~3のいずれか一項に記載の方法。
- 前記分類モデルは、ロジスティック回帰モデルを含み、前記モデル係数のセットは、前記複数の特徴量により前記ロジスティック回帰モデルを訓練することにより取得された回帰係数を含む、請求項1~4のいずれか一項に記載の方法。
- 前記ゲノム領域の第1サブセットを同定することは、
最初の反復において、前記分類モデルを訓練し、第1ゲノム領域に対応する特徴量に基づいて疾病分類を予測することであって、前記第1ゲノム領域は、最も高くランク付けされたゲノム領域に対応することと、
前記第1ゲノム領域に対して訓練された前記分類モデルの性能測定基準を判定することと、
後続の反復において、残りのランク付けされたゲノム領域を取り込み、各追加的なゲノム領域が取り込まれた後に前記性能測定基準を評価することにより、前記分類モデルを再訓練することであって、各後続の反復は、
欲張りアルゴリズムを適用し、残りのランク付けされたゲノム領域の内、次に高くランク付けされたゲノム領域を前記分類モデルに追加することと、
前記追加された次に高くランク付けされたゲノム領域および先の反復で前もって追加されたゲノム領域と関連している特徴量を使用して前記分類モデルを再訓練することと、
前記再訓練された分類モデルに対する性能測定基準を判定することと
を含むことと、
各反復に対して取得された前記性能測定基準を評価し、最適化された性能測定基準をもたらす前記ゲノム領域の第1サブセットを同定することと
を含む、請求項1~5のいずれか一項に記載の方法。 - 前記最適化された性能測定基準は、前記分類モデルにより得られた最大性能測定基準を含む、請求項6に記載の方法。
- 前記疾病分類は、がんまたは非がんを予測するための二項分類およびがんの種類を予測するための多クラス分類の少なくとも1つを含む、及び/又は前記縮小遺伝子パネルにより取得された性能測定基準は、完全なゲノム領域の第1セットを含む完全な遺伝子パネルにより取得された性能測定基準と、実質的に同様である、請求項1~7のいずれか一項に記載の方法。
- 前記ゲノム領域の第1セットは、高シグナルのがんと関連しているゲノム領域を含み、約2Mbのセットサイズを有し、前記ゲノム領域の第1サブセットは、300kb未満のサブセットサイズを有する、及び/又は前記縮小遺伝子パネルは、300kbを超えない総パネルサイズを有する、請求項1~8のいずれか一項に記載の方法。
- 前記ゲノム領域の第1サブセットにより得られた前記疾病分類を更に改善するゲノム領域の第2サブセットを同定することと、
前記ゲノム領域の第1サブセットと前記ゲノム領域の第2サブセットとを含む前記縮小遺伝子パネルを生成することと
を更に含む、請求項1~9のいずれか一項に記載の方法。 - ゲノム領域の第2セットに対するシークエンシングデータの第2セットを取得することと、
患者ごとの体細胞変異の頻度およびコード領域の長さにより正規化された頻度の少なくとも1つにより前記ゲノム領域の第2セットをランク付けすることと、
前記ランク付けされたゲノム領域の第2セットに基づいて前記ゲノム領域の第2サブセットを同定することと
を更に含む、請求項10に記載の方法。 - 前記縮小遺伝子パネルにより得られた前記疾病分類を更に改善するゲノム領域の第3サブセットを同定することであって、前記ゲノム領域の第3サブセットは、疾病の種類の予測精度を最適化することと、
前記縮小遺伝子パネルに前記ゲノム領域の第3サブセットを含むことと
を更に含む、及び/又は前記ゲノム領域の第3セットは、さらに、がん特異的遺伝子および変異ホットスポットである、請求項1~11のいずれか一項に記載の方法。 - 追加的なホットスポット領域を前記縮小遺伝子パネルに追加することであって、前記ホットスポット領域は、一塩基バリアント、挿入、または欠失に対応することを更に含む、及び又は追加的なウイルス標的領域を前記縮小遺伝子パネルに追加することであって、前記ウイルス標的領域は、ウイルス関連がんに対応することを更に含む、請求項1~12のいずれか一項に記載の方法。
- プロセッサを含む電子デバイスにより実行されたときに前記デバイスに請求項1~13のいずれか一項に記載の方法を実行させる指示を含む1つまたは複数のプログラムを保管する非一時的コンピュータ可読媒体。
- 1つまたは複数のプロセッサと、
メモリと、
前記メモリに保管され、前記1つまたは複数のプロセッサにより実行されるように構成され、請求項1~13のいずれか一項に記載の方法を実行するための指示を含む、1つまたは複数のプログラムと
を備える電子デバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063013512P | 2020-04-21 | 2020-04-21 | |
US63/013,512 | 2020-04-21 | ||
US17/233,548 US20210324477A1 (en) | 2020-04-21 | 2021-04-19 | Generating cancer detection panels according to a performance metric |
US17/233,548 | 2021-04-19 | ||
PCT/US2021/028035 WO2021216477A1 (en) | 2020-04-21 | 2021-04-20 | Generating cancer detection panels according to a performance metric |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023522940A JP2023522940A (ja) | 2023-06-01 |
JPWO2021216477A5 true JPWO2021216477A5 (ja) | 2024-02-22 |
Family
ID=78081562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022564030A Pending JP2023522940A (ja) | 2020-04-21 | 2021-04-20 | 性能測定基準に従ったがん検出パネルの生成 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210324477A1 (ja) |
EP (1) | EP4128269A1 (ja) |
JP (1) | JP2023522940A (ja) |
CN (1) | CN115699205A (ja) |
AU (1) | AU2021259295A1 (ja) |
CA (1) | CA3174294A1 (ja) |
WO (1) | WO2021216477A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3801623A4 (en) | 2018-06-01 | 2022-03-23 | Grail, LLC | NEURAL CONVOLUTIONAL NETWORK SYSTEMS AND DATA CLASSIFICATION METHODS |
US11581062B2 (en) * | 2018-12-10 | 2023-02-14 | Grail, Llc | Systems and methods for classifying patients with respect to multiple cancer classes |
US11898199B2 (en) | 2019-11-11 | 2024-02-13 | Universal Diagnostics, S.A. | Detection of colorectal cancer and/or advanced adenomas |
CN115997035A (zh) | 2020-06-30 | 2023-04-21 | 通用诊断股份公司 | 用于检测多种癌症类型的系统和方法 |
CN115713971B (zh) * | 2022-09-28 | 2024-01-23 | 上海睿璟生物科技有限公司 | 靶向序列捕获探针设计策略选择方法、系统及终端 |
CN116646010B (zh) * | 2023-07-27 | 2024-03-29 | 深圳赛陆医疗科技有限公司 | 人源性病毒检测方法及装置、设备、存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9805918D0 (en) * | 1998-03-19 | 1998-05-13 | Nycomed Amersham Plc | Sequencing by hybridisation |
US20180045727A1 (en) * | 2015-03-03 | 2018-02-15 | Caris Mpi, Inc. | Molecular profiling for cancer |
WO2018064547A1 (en) * | 2016-09-30 | 2018-04-05 | The Trustees Of Columbia University In The City Of New York | Methods for classifying somatic variations |
CN111278993A (zh) * | 2017-09-15 | 2020-06-12 | 加利福尼亚大学董事会 | 从无细胞核酸中检测体细胞单核苷酸变体并应用于微小残留病变监测 |
EP3776555A2 (en) * | 2018-04-13 | 2021-02-17 | Grail, Inc. | Multi-assay prediction model for cancer detection |
-
2021
- 2021-04-19 US US17/233,548 patent/US20210324477A1/en active Pending
- 2021-04-20 CA CA3174294A patent/CA3174294A1/en active Pending
- 2021-04-20 EP EP21724883.0A patent/EP4128269A1/en active Pending
- 2021-04-20 JP JP2022564030A patent/JP2023522940A/ja active Pending
- 2021-04-20 AU AU2021259295A patent/AU2021259295A1/en active Pending
- 2021-04-20 WO PCT/US2021/028035 patent/WO2021216477A1/en unknown
- 2021-04-20 CN CN202180036132.8A patent/CN115699205A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | A multi-tissue atlas of regulatory variants in cattle | |
Palamara et al. | High-throughput inference of pairwise coalescence times identifies signals of selection and enriched disease heritability | |
Telenti et al. | Deep learning of genomic variation and regulatory network data | |
Scheet et al. | A fast and flexible statistical model for large-scale population genotype data: applications to inferring missing genotypes and haplotypic phase | |
Delaneau et al. | Haplotype estimation using sequencing reads | |
Kelley et al. | Quake: quality-aware detection and correction of sequencing errors | |
Speed et al. | MultiBLUP: improved SNP-based prediction for complex traits | |
Davydov et al. | Identifying a high fraction of the human genome to be under selective constraint using GERP++ | |
Taylor et al. | ESPERR: learning strong and weak signals in genomic sequence alignments to identify functional elements | |
Wang et al. | Next generation sequencing has lower sequence coverage and poorer SNP-detection capability in the regulatory regions | |
Derrien et al. | Fast computation and applications of genome mappability | |
Elnitski et al. | Distinguishing regulatory DNA from neutral sites | |
Cowperthwaite et al. | The ascent of the abundant: how mutational networks constrain evolution | |
Racimo et al. | Approximation to the distribution of fitness effects across functional categories in human segregating polymorphisms | |
US20200239965A1 (en) | Source of origin deconvolution based on methylation fragments in cell-free dna samples | |
He et al. | Alignment and prediction of cis-regulatory modules based on a probabilistic model of evolution | |
CN113228191A (zh) | 识别胚胎中染色体异常的系统和方法 | |
Chen et al. | A hybrid likelihood model for sequence-based disease association studies | |
Zhang | Feature selection using approximate conditional entropy based on fuzzy information granule for gene expression data classification | |
JPWO2021216477A5 (ja) | ||
Sun et al. | HS-MMGKG: a fast multi-objective harmony search algorithm for two-locus model detection in GWAS | |
Elmas et al. | Discovering genome-wide tag SNPs based on the mutual information of the variants | |
Gong et al. | Prediction of early breast cancer patient survival using ensembles of hypoxia signatures | |
Lao et al. | GAGA: a new algorithm for genomic inference of geographic ancestry reveals fine level population substructure in Europeans | |
Chen et al. | Identify alternative splicing events based on position-specific evolutionary conservation |