JP2017520821A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2017520821A5 JP2017520821A5 JP2016565058A JP2016565058A JP2017520821A5 JP 2017520821 A5 JP2017520821 A5 JP 2017520821A5 JP 2016565058 A JP2016565058 A JP 2016565058A JP 2016565058 A JP2016565058 A JP 2016565058A JP 2017520821 A5 JP2017520821 A5 JP 2017520821A5
- Authority
- JP
- Japan
- Prior art keywords
- variant
- sample
- allele
- samples
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000523 sample Substances 0.000 claims 23
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims 7
- 230000001186 cumulative Effects 0.000 claims 3
- 229920000160 (ribonucleotides)n+m Polymers 0.000 claims 1
- 229920000453 Consensus sequence Polymers 0.000 claims 1
- 239000012472 biological sample Substances 0.000 claims 1
- 230000001276 controlling effect Effects 0.000 claims 1
- 230000000875 corresponding Effects 0.000 claims 1
- 238000005315 distribution function Methods 0.000 claims 1
- 230000001131 transforming Effects 0.000 claims 1
Claims (15)
- 第一の試料中の標的領域における低頻度バリアントを検出するための、コンピュータで実行される方法であって、コンピュータシステムにおいて、
− 1又は2以上の試料からのDNA断片のシークエンシングから得られる複数の配列リードを受け取り、ここで前記1又は2以上の試料は第一の試料を含み、前記シークエンシングは前記DNA断片中の標的領域を標的化することを含み;
− 前記複数の配列リードを、参照配列の標的領域にアラインメントし;
− 第一の試料の配列リードに基づいて、標的領域の第一の位置において第一のバリアントアレルを有する第一の候補バリアントを同定し、ここで前記第一のバリアントアレルは、前記参照配列の第一の位置の参照アレルとは異なり;
− 前記参照配列の第一の位置にアラインメントする第一の試料の配列リードに基づいて、第一の位置における第一のバリアントアレルに関する第一のバリアント頻度を決定し、
− 前記参照アレルを有する前記参照配列の標的領域中の1セットの第二の位置を同定し、ここで前記1セットの第二の位置は前記第一の位置を含み;
前記1セットの第二の位置の各々の位置において、かつ前記1又は2以上の試料の各々に関して:
− 前記参照配列の1セットの第二の位置の各々の位置にアラインメントする試料の配列リードに基づいて、第一のバリアントアレルの第二のバリアント頻度を決定し、ここで前記第二のバリアント頻度は統計分布を形成し;
− 前記第一のバリアント頻度を前記統計分布の統計値と比較して、前記統計分布の統計値に対する第一のバリアント頻度の確率値を決定し;そして
− 前記第一の位置における第一のバリアントアレルに関して、第一の試料において第一の候補バリアントが真陽性であるか否かを決定する一部として、前記確率値を閾値と比較すること、ここで前記閾値は前記第一のバリアントアレルに関して偽陽性と真陽性とを区別する、
含む、方法。 - 前記参照配列は、正常細胞から決定されるとおりのコンセンサス配列に対応する、請求項1に記載の方法。
- 前記1又は2以上の試料は無細胞DNA断片由来である、請求項1又は2に記載の方法。
- 前記1又は2以上の試料は生物試料のRNA由来である、請求項1又は2に記載の方法。
- 複数の試料は、単一のシークエンシングランにおいてシークエンシングされる、請求項1〜4のいずれか1項に記載の方法。
- 前記確率値は、zスコア、修正されたzスコア、累積確率、フレッド(Phred)クオリティスコア又は修正されたフレッドクオリティスコアである、請求項1〜5のいずれか1項に記載の方法。
- 前記統計分布は、前記第二のバリアント頻度の対数変換の統計分布である、請求項1〜6のいずれか1項に記載の方法。
- 前記閾値は、既知の真陽性と偽陽性とを有するトレーニングデータに基づいて、サポートベクターマシン分類器を用いて決定される、請求項1〜7のいずれか1項に記載の方法。
- 第一の試料中の標的領域における第一の位置に第一のバリアントアレルを有するバリアントを検出するための、コンピュータで実行される方法であって、コンピュータシステムにおいて、
− 少なくとも2つの試料からのDNA断片のシークエンシングから得られる複数の配列リードを受け取り、ここで前記少なくとも2つの試料は第一の試料を含み、前記シークエンシングは前記DNA断片中の標的領域を標的化することを含み;
− 前記複数の配列リードを、参照配列の標的領域にアラインメントし;
− 第一の位置において各試料のアラインメントされた配列リードに基づいて、前記第一のバリアントアレルが、前記少なくとも2つの試料の各々の試料中の第一の位置に存在するか否かを同定し、ここで前記第一のバリアントアレルは、前記参照配列の第一の位置における参照アレルとは異なり;
− 前記少なくとも2つの試料の各試料に関する第一の位置にアラインメントされた配列リードを用いて、前記第一の位置における第一のバリアントアレルのバリアント数及び前記第一の位置における参照アレルの野生型数を決定し;
− 前記少なくとも2つの試料から、1つ又は2つ以上の試料を1つ又は2つ以上の参照試料として選択し;
− 第一の試料に関する第一の位置における第一のバリアントアレルの第一のバリアント数及び第一の位置における参照アレルの第一の野生型数と、前記1つ又は2つ以上の参照試料に関する第一の位置における第一のバリアントアレルの第二のバリアント数及び第一の位置における参照アレルの第二の野生型数とを比較して、第一の試料に関する第一の位置に第一のバリアントアレルを有するバリアントが発生する確率値を決定し;そして
− 第一のバリアントアレルに関して第一の試料中の第一の位置における第一のバリアントアレルが真陽性を含むか否かを決定する一部として、前記確率値を閾値と比較すること、ここで前記閾値は第一の位置の第一のバリアントアレルに関して偽陽性と真陽性とを区別する、
含む、方法。 - 前記確率値は、2つの比率であるp1及びp2に基づいて決定され、ここでp1=a1/n1であり、p2=a2/n2であり、a2は第一のバリアント数であり、a1は第二のバリアント数であり、n2は第一のバリアント数及び第一の野生型数の合計であり、そしてn1は第二のバリアント数及び第二の野生型数の合計である、請求項9に記載の方法。
- 前記確率値は、zスコア、修正されたzスコア、p値、カイ二乗値、累積確率値及び信頼水準を示すクオリティスコアの1つ又は2つ以上である、請求項9に記載の方法。
- 前記クオリティスコアはルックアップテーブルを用いて決定され、ここで前記ルックアップテーブルの入力は、カイ二乗値又は正規クオンタイル値の少なくとも1つである、請求項12に記載の方法。
- 前記閾値は、既知の真陽性と偽陽性とを有するトレーニングデータに基づいて、サポートベクターマシン分類器を用いて決定される、請求項9〜13のいずれか1項に記載の方法。
- 実施されるときにコンピュータシステムを制御して第一の試料の標的領域における真のバリアントを検出する複数の指示を記憶する、非一過性のコンピュータ可読媒体を含むコンピュータ製品であって、前記指示は、
− 1又は2以上の試料からのDNA断片のシークエンシングから得られる複数の配列リードを受け取り、ここで前記1又は2以上の試料は第一の試料を含み、前記シークエンシングは前記DNA断片中の標的領域を標的化することを含み;
− 前記複数の配列リードを、参照配列の標的領域にアラインメントし;
− 複数のバリアントクラス中の1つのバリアントクラス中のバリアントの参照アレルを各々が有する参照配列の標的領域における1セットの配列位置を同定し、ここで、前記複数のバリアントクラスの各々は、1又は2以上のバリアントを含むように定義され、各々のバリアントは対応する参照アレルとは異なるバリアントアレルを有し、そして前記1セットの配列位置は第一の位置を含み、
前記1セットの配列位置の各々の位置において、かつ前記1又は2以上の試料の各々の試料に関して:
− 各試料に関する各位置におけるリード数を決定し;
− 各試料の配列リードに基づいて、前記バリアントクラス中のバリアントに関するバリアントアレルを有する候補バリアントを同定し、ここで前記バリアントアレルは、前記参照配列の同一の位置における参照アレルとは異なり、そして各試料中の各位置における候補バリアントの総数は、各試料に関する各位置中のバリアント数であり;
− 前記リード数及びバリアント数に基づいてバリアントクラス中のバリアントのバリアント頻度を決定し、ここで各試料中の各位置に関するバリアント頻度は、統計分布を形成し、第一の試料に関する前記1セットの配列位置中の第一の位置におけるバリアント頻度は、第一のバリアント頻度であり;
− 前記第一のバリアント頻度を統計分布の値と比較して、前記統計分布の値に対する前記第一のバリアント頻度の確率値を決定し;そして
− 第一の試料中の候補バリアントが真陽性であるか否かを決定する一部として、前記確率値を閾値と比較すること、ここで前記閾値は、前記バリアントクラス中のバリアントに関して偽陽性と真陽性とを区別する、
を含む、コンピュータ製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461991820P | 2014-05-12 | 2014-05-12 | |
US61/991,820 | 2014-05-12 | ||
PCT/EP2015/060442 WO2015173222A1 (en) | 2014-05-12 | 2015-05-12 | Rare variant calls in ultra-deep sequencing |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017520821A JP2017520821A (ja) | 2017-07-27 |
JP2017520821A5 true JP2017520821A5 (ja) | 2018-06-21 |
JP6618929B2 JP6618929B2 (ja) | 2019-12-11 |
Family
ID=53264628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016565058A Active JP6618929B2 (ja) | 2014-05-12 | 2015-05-12 | ウルトラディープシークエンシングにおける希少バリアントコール |
Country Status (5)
Country | Link |
---|---|
US (1) | US10216895B2 (ja) |
EP (1) | EP3143537B1 (ja) |
JP (1) | JP6618929B2 (ja) |
CN (1) | CN106462670B (ja) |
WO (1) | WO2015173222A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2625288T3 (es) | 2011-04-15 | 2017-07-19 | The Johns Hopkins University | Sistema de secuenciación segura |
ES2701742T3 (es) | 2012-10-29 | 2019-02-25 | Univ Johns Hopkins | Prueba de Papanicolaou para cánceres de ovario y de endometrio |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
WO2017127741A1 (en) * | 2016-01-22 | 2017-07-27 | Grail, Inc. | Methods and systems for high fidelity sequencing |
KR102425257B1 (ko) | 2016-06-01 | 2022-07-27 | 퀀텀-에스아이 인코포레이티드 | 펄스 호출자 및 베이스 호출자 |
US10600499B2 (en) | 2016-07-13 | 2020-03-24 | Seven Bridges Genomics Inc. | Systems and methods for reconciling variants in sequence data relative to reference sequence data |
US20190287647A1 (en) * | 2016-11-16 | 2019-09-19 | Illumina, Inc. | Methods of sequencing data read realignment |
WO2018093780A1 (en) * | 2016-11-16 | 2018-05-24 | Illumina, Inc. | Validation methods and systems for sequence variant calls |
US11978535B2 (en) * | 2017-02-01 | 2024-05-07 | The Translational Genomics Research Institute | Methods of detecting somatic and germline variants in impure tumors |
US20190005192A1 (en) * | 2017-02-14 | 2019-01-03 | Bahram Ghaffarzadeh Kermani | Reliable and Secure Detection Techniques for Processing Genome Data in Next Generation Sequencing (NGS) |
CN108660252B (zh) * | 2017-04-01 | 2021-11-26 | 北京博尔晟科技发展有限公司 | 一种基于焦磷酸测序的人类免疫缺陷病毒耐药性分析方法 |
KR102035615B1 (ko) * | 2017-08-07 | 2019-10-23 | 연세대학교 산학협력단 | 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 |
CA3072195A1 (en) | 2017-08-07 | 2019-04-04 | The Johns Hopkins University | Methods and materials for assessing and treating cancer |
WO2019071219A1 (en) * | 2017-10-06 | 2019-04-11 | Grail, Inc. | SPECIFIC SITE NOISE MODEL FOR TARGETED SEQUENCING |
SG10202108020VA (en) | 2017-10-16 | 2021-09-29 | Illumina Inc | Deep learning-based techniques for training deep convolutional neural networks |
US11861491B2 (en) | 2017-10-16 | 2024-01-02 | Illumina, Inc. | Deep learning-based pathogenicity classifier for promoter single nucleotide variants (pSNVs) |
JP7067896B2 (ja) * | 2017-10-27 | 2022-05-16 | シスメックス株式会社 | 品質評価方法、品質評価装置、プログラム、および記録媒体 |
CA3080170A1 (en) * | 2017-11-28 | 2019-06-06 | Grail, Inc. | Models for targeted sequencing |
EP3718113A1 (en) * | 2017-11-30 | 2020-10-07 | Illumina, Inc. | Validation methods and systems for sequence variant calls |
IL300049B2 (en) | 2018-01-08 | 2023-11-01 | Illumina Inc | Systems and devices for high-throughput sequencing for sequential CMOS |
WO2019136388A1 (en) | 2018-01-08 | 2019-07-11 | Illumina, Inc. | Systems and devices for high-throughput sequencing with semiconductor-based detection |
TWI812671B (zh) | 2018-01-26 | 2023-08-21 | 美商寬騰矽公司 | 用於識別核酸之核苷酸之方法、系統及非暫時性電腦可讀儲存媒體以及用於訓練深度學習模型之方法及系統 |
US20190259468A1 (en) * | 2018-02-16 | 2019-08-22 | Illumina, Inc. | System and Method for Correlated Error Event Mitigation for Variant Calling |
SE541799C2 (en) * | 2018-04-11 | 2019-12-17 | David Yudovich | Determination of frequency distribution of nucleotide sequence variants |
JP2019191952A (ja) * | 2018-04-25 | 2019-10-31 | 特定非営利活動法人North East Japan Study Group | プログラム、情報処理方法および情報処理装置 |
CN113168886A (zh) * | 2018-08-13 | 2021-07-23 | 豪夫迈·罗氏有限公司 | 用于使用神经网络进行种系和体细胞变体调用的系统和方法 |
MX2021004434A (es) * | 2018-10-17 | 2021-09-10 | Quest Diagnostics Invest Llc | Sistema de seleccion de secuenciacion genomica. |
JP7232433B2 (ja) * | 2018-10-19 | 2023-03-03 | エフ. ホフマン-ラ ロシュ アーゲー | 配列決定のための電場補助型接合部 |
CN111073961A (zh) * | 2019-12-20 | 2020-04-28 | 苏州赛美科基因科技有限公司 | 一种基因稀有突变的高通量检测方法 |
US11361194B2 (en) | 2020-10-27 | 2022-06-14 | Illumina, Inc. | Systems and methods for per-cluster intensity correction and base calling |
US11538555B1 (en) | 2021-10-06 | 2022-12-27 | Illumina, Inc. | Protein structure-based protein language models |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2875149B1 (en) | 2012-07-20 | 2019-12-04 | Verinata Health, Inc. | Detecting and classifying copy number variation in a cancer genome |
US20140066317A1 (en) * | 2012-09-04 | 2014-03-06 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US20140143188A1 (en) * | 2012-11-16 | 2014-05-22 | Genformatic, Llc | Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy |
US9218450B2 (en) * | 2012-11-29 | 2015-12-22 | Roche Molecular Systems, Inc. | Accurate and fast mapping of reads to genome |
-
2015
- 2015-05-12 CN CN201580024749.2A patent/CN106462670B/zh active Active
- 2015-05-12 JP JP2016565058A patent/JP6618929B2/ja active Active
- 2015-05-12 US US14/709,958 patent/US10216895B2/en active Active
- 2015-05-12 EP EP15724196.9A patent/EP3143537B1/en active Active
- 2015-05-12 WO PCT/EP2015/060442 patent/WO2015173222A1/en active Application Filing
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017520821A5 (ja) | ||
JP6618929B2 (ja) | ウルトラディープシークエンシングにおける希少バリアントコール | |
KR102638152B1 (ko) | 서열 변이체 호출을 위한 검증 방법 및 시스템 | |
Racimo et al. | Approximation to the distribution of fitness effects across functional categories in human segregating polymorphisms | |
EP3914736A2 (en) | Detecting cancer, cancer tissue of origin, and/or a cancer cell type | |
CN106033502B (zh) | 鉴定病毒的方法和装置 | |
CN107480470B (zh) | 基于贝叶斯与泊松分布检验的已知变异检出方法和装置 | |
JP2014502155A5 (ja) | ||
CA3080170A1 (en) | Models for targeted sequencing | |
Qian et al. | Radiogenomics of lower-grade gliomas: a radiomic signature as a biological surrogate for survival prediction | |
US20180312928A1 (en) | Method and system for selecting customized drug using genomic nucleotide sequence variation information and survival information of cancer patient | |
Moussa et al. | Locality sensitive imputation for single cell RNA-seq data | |
US20190362807A1 (en) | Genomic variant ranking system for clinical trial matching | |
Kuo et al. | Illuminating the dark side of the human transcriptome with TAMA Iso-Seq analysis | |
Gong et al. | MethCP: differentially methylated region detection with change point models | |
US20230072300A1 (en) | Chromosomal assessment to differentiate histiocytic malignancy from lymphoma and hemangiosarcoma in dogs | |
JP2004272350A (ja) | クラスタリング装置、クラスタリング方法、クラスタリングプログラム | |
EP4367668A1 (en) | Methylation fragment probabilistic noise model with noisy region filtration | |
Li et al. | Alternative polyadenylation modification patterns reveal essential posttranscription regulatory mechanisms of tumorigenesis in multiple tumor types | |
Davis et al. | POWRS: position-sensitive motif discovery | |
JP2016184185A5 (ja) | ||
CA3090743A1 (en) | Patient classification and prognostic method | |
Bharadwaj | Characterizing Alterations to Chromatin Accessibility in Crohn’s Disease Patients by Identifying Potential Causal Variants in Regulatory Regions Through a QTL Approach | |
EP4297037A1 (en) | Device for determining an indicator of presence of hrd in a genome of a subject | |
Yang et al. | Detection of non-structural outliers for microarray experiments |