JP2017520821A5 - - Google Patents

Download PDF

Info

Publication number
JP2017520821A5
JP2017520821A5 JP2016565058A JP2016565058A JP2017520821A5 JP 2017520821 A5 JP2017520821 A5 JP 2017520821A5 JP 2016565058 A JP2016565058 A JP 2016565058A JP 2016565058 A JP2016565058 A JP 2016565058A JP 2017520821 A5 JP2017520821 A5 JP 2017520821A5
Authority
JP
Japan
Prior art keywords
variant
sample
allele
samples
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016565058A
Other languages
English (en)
Other versions
JP2017520821A (ja
JP6618929B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/EP2015/060442 external-priority patent/WO2015173222A1/en
Publication of JP2017520821A publication Critical patent/JP2017520821A/ja
Publication of JP2017520821A5 publication Critical patent/JP2017520821A5/ja
Application granted granted Critical
Publication of JP6618929B2 publication Critical patent/JP6618929B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (15)

  1. 第一の試料中の標的領域における低頻度バリアントを検出するための、コンピュータで実行される方法であって、コンピュータシステムにおいて、
    − 1又は2以上の試料からのDNA断片のシークエンシングから得られる複数の配列リードを受け取り、ここで前記1又は2以上の試料は第一の試料を含み、前記シークエンシングは前記DNA断片中の標的領域を標的化することを含み;
    − 前記複数の配列リードを、参照配列の標的領域にアラインメントし;
    − 第一の試料の配列リードに基づいて、標的領域の第一の位置において第一のバリアントアレルを有する第一の候補バリアントを同定し、ここで前記第一のバリアントアレルは、前記参照配列の第一の位置の参照アレルとは異なり;
    − 前記参照配列の第一の位置にアラインメントする第一の試料の配列リードに基づいて、第一の位置における第一のバリアントアレルに関する第一のバリアント頻度を決定し、
    − 前記参照アレルを有する前記参照配列の標的領域中の1セットの第二の位置を同定し、ここで前記1セットの第二の位置は前記第一の位置を含み;
    前記1セットの第二の位置の各々の位置において、かつ前記1又は2以上の試料の各々に関して:
    − 前記参照配列の1セットの第二の位置の各々の位置にアラインメントする試料の配列リードに基づいて、第一のバリアントアレルの第二のバリアント頻度を決定し、ここで前記第二のバリアント頻度は統計分布を形成し;
    − 前記第一のバリアント頻度を前記統計分布の統計値と比較して、前記統計分布の統計値に対する第一のバリアント頻度の確率値を決定し;そして
    − 前記第一の位置における第一のバリアントアレルに関して、第一の試料において第一の候補バリアントが真陽性であるか否かを決定する一部として、前記確率値を閾値と比較すること、ここで前記閾値は前記第一のバリアントアレルに関して偽陽性と真陽性とを区別する、
    含む、方法。
  2. 前記参照配列は、正常細胞から決定されるとおりのコンセンサス配列に対応する、請求項1に記載の方法。
  3. 前記1又は2以上の試料は無細胞DNA断片由来である、請求項1又は2に記載の方法。
  4. 前記1又は2以上の試料は生物試料のRNA由来である、請求項1又は2に記載の方法。
  5. 複数の試料は、単一のシークエンシングランにおいてシークエンシングされる、請求項1〜4のいずれか1項に記載の方法。
  6. 前記確率値は、zスコア、修正されたzスコア、累積確率、フレッド(Phred)クオリティスコア又は修正されたフレッドクオリティスコアである、請求項1〜のいずれか1項に記載の方法。
  7. 前記統計分布は、前記第二のバリアント頻度の対数変換の統計分布である、請求項1〜6のいずれか1項に記載の方法。
  8. 前記閾値は、既知の真陽性と偽陽性とを有するトレーニングデータに基づいて、サポートベクターマシン分類器を用いて決定される、請求項1〜7のいずれか1項に記載の方法。
  9. 第一の試料中の標的領域における第一の位置に第一のバリアントアレルを有するバリアントを検出するための、コンピュータで実行される方法であって、コンピュータシステムにおいて、
    − 少なくとも2つの試料からのDNA断片のシークエンシングから得られる複数の配列リードを受け取り、ここで前記少なくとも2つの試料は第一の試料を含み、前記シークエンシングは前記DNA断片中の標的領域を標的化することを含み;
    − 前記複数の配列リードを、参照配列の標的領域にアラインメントし;
    − 第一の位置において各試料のアラインメントされた配列リードに基づいて、前記第一のバリアントアレルが、前記少なくとも2つの試料の各々の試料中の第一の位置に存在するか否かを同定し、ここで前記第一のバリアントアレルは、前記参照配列の第一の位置における参照アレルとは異なり;
    − 前記少なくとも2つの試料の各試料に関する第一の位置にアラインメントされた配列リードを用いて、前記第一の位置における第一のバリアントアレルのバリアント数及び前記第一の位置における参照アレルの野生型数を決定し;
    − 前記少なくとも2つの試料から、1つ又は2つ以上の試料を1つ又は2つ以上の参照試料として選択し;
    − 第一の試料に関する第一の位置における第一のバリアントアレルの第一のバリアント数及び第一の位置における参照アレルの第一の野生型数と、前記1つ又は2つ以上の参照試料に関する第一の位置における第一のバリアントアレルの第二のバリアント数及び第一の位置における参照アレルの第二の野生型数とを比較して、第一の試料に関する第一の位置に第一のバリアントアレルを有するバリアントが発生する確率値を決定し;そして
    − 第一のバリアントアレルに関して第一の試料中の第一の位置における第一のバリアントアレルが真陽性を含むか否かを決定する一部として、前記確率値を閾値と比較すること、ここで前記閾値は第一の位置の第一のバリアントアレルに関して偽陽性と真陽性とを区別する、
    含む、方法。
  10. 前記確率値は、以下の式:
    Figure 2017520821
    [式中、
    a2は第一のバリアント数であり、w2は第一の野生型数であり、a1は第二のバリアント数であり、w1は第二の野生型数であり、aはa1及びa2の合計であり、wはw1及びw2の合計であり、n1はa1及びw1の合計であり、n2はa2及びw2の合計であり、nはn1及びn2の合計である]
    によって定義されるカイ二乗統計値に基づくカイ二乗累積分布関数を用いて決定される、請求項に記載の方法。
  11. 前記確率値は、2つの比率であるp1及びp2に基づいて決定され、ここでp1=a1/n1であり、p2=a2/n2であり、a2は第一のバリアント数であり、a1は第二のバリアント数であり、n2は第一のバリアント数及び第一の野生型数の合計であり、そしてn1は第二のバリアント数及び第二の野生型数の合計である、請求項に記載の方法。
  12. 前記確率値は、zスコア、修正されたzスコア、p値、カイ二乗値、累積確率値及び信頼水準を示すクオリティスコアの1つ又は2つ以上である、請求項に記載の方法。
  13. 前記クオリティスコアはルックアップテーブルを用いて決定され、ここで前記ルックアップテーブルの入力は、カイ二乗値又は正規クオンタイル値の少なくとも1つである、請求項12に記載の方法。
  14. 前記閾値は、既知の真陽性と偽陽性とを有するトレーニングデータに基づいて、サポートベクターマシン分類器を用いて決定される、請求項13のいずれか1項に記載の方法。
  15. 実施されるときにコンピュータシステムを制御して第一の試料の標的領域における真のバリアントを検出する複数の指示を記憶する、非一過性のコンピュータ可読媒体を含むコンピュータ製品であって、前記指示は、
    − 1又は2以上の試料からのDNA断片のシークエンシングから得られる複数の配列リードを受け取り、ここで前記1又は2以上の試料は第一の試料を含み、前記シークエンシングは前記DNA断片中の標的領域を標的化することを含み;
    − 前記複数の配列リードを、参照配列の標的領域にアラインメントし;
    − 複数のバリアントクラス中の1つのバリアントクラス中のバリアントの参照アレルを各々が有する参照配列の標的領域における1セットの配列位置を同定し、ここで、前記複数のバリアントクラスの各々は、1又は2以上のバリアントを含むように定義され、各々のバリアントは対応する参照アレルとは異なるバリアントアレルを有し、そして前記1セットの配列位置は第一の位置を含み、
    前記1セットの配列位置の各々の位置において、かつ前記1又は2以上の試料の各々の試料に関して:
    − 各試料に関する各位置におけるリード数を決定し;
    − 各試料の配列リードに基づいて、前記バリアントクラス中のバリアントに関するバリアントアレルを有する候補バリアントを同定し、ここで前記バリアントアレルは、前記参照配列の同一の位置における参照アレルとは異なり、そして各試料中の各位置における候補バリアントの総数は、各試料に関する各位置中のバリアント数であり;
    − 前記リード数及びバリアント数に基づいてバリアントクラス中のバリアントのバリアント頻度を決定し、ここで各試料中の各位置に関するバリアント頻度は、統計分布を形成し、第一の試料に関する前記1セットの配列位置中の第一の位置におけるバリアント頻度は、第一のバリアント頻度であり;
    − 前記第一のバリアント頻度を統計分布の値と比較して、前記統計分布の値に対する前記第一のバリアント頻度の確率値を決定し;そして
    − 第一の試料中の候補バリアントが真陽性であるか否かを決定する一部として、前記確率値を閾値と比較すること、ここで前記閾値は、前記バリアントクラス中のバリアントに関して偽陽性と真陽性とを区別する、
    を含む、コンピュータ製品。
JP2016565058A 2014-05-12 2015-05-12 ウルトラディープシークエンシングにおける希少バリアントコール Active JP6618929B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461991820P 2014-05-12 2014-05-12
US61/991,820 2014-05-12
PCT/EP2015/060442 WO2015173222A1 (en) 2014-05-12 2015-05-12 Rare variant calls in ultra-deep sequencing

Publications (3)

Publication Number Publication Date
JP2017520821A JP2017520821A (ja) 2017-07-27
JP2017520821A5 true JP2017520821A5 (ja) 2018-06-21
JP6618929B2 JP6618929B2 (ja) 2019-12-11

Family

ID=53264628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016565058A Active JP6618929B2 (ja) 2014-05-12 2015-05-12 ウルトラディープシークエンシングにおける希少バリアントコール

Country Status (5)

Country Link
US (1) US10216895B2 (ja)
EP (1) EP3143537B1 (ja)
JP (1) JP6618929B2 (ja)
CN (1) CN106462670B (ja)
WO (1) WO2015173222A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
ES2701742T3 (es) 2012-10-29 2019-02-25 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
WO2017127741A1 (en) * 2016-01-22 2017-07-27 Grail, Inc. Methods and systems for high fidelity sequencing
KR102425257B1 (ko) 2016-06-01 2022-07-27 퀀텀-에스아이 인코포레이티드 펄스 호출자 및 베이스 호출자
US10600499B2 (en) 2016-07-13 2020-03-24 Seven Bridges Genomics Inc. Systems and methods for reconciling variants in sequence data relative to reference sequence data
US20190287647A1 (en) * 2016-11-16 2019-09-19 Illumina, Inc. Methods of sequencing data read realignment
WO2018093780A1 (en) * 2016-11-16 2018-05-24 Illumina, Inc. Validation methods and systems for sequence variant calls
US11978535B2 (en) * 2017-02-01 2024-05-07 The Translational Genomics Research Institute Methods of detecting somatic and germline variants in impure tumors
US20190005192A1 (en) * 2017-02-14 2019-01-03 Bahram Ghaffarzadeh Kermani Reliable and Secure Detection Techniques for Processing Genome Data in Next Generation Sequencing (NGS)
CN108660252B (zh) * 2017-04-01 2021-11-26 北京博尔晟科技发展有限公司 一种基于焦磷酸测序的人类免疫缺陷病毒耐药性分析方法
KR102035615B1 (ko) * 2017-08-07 2019-10-23 연세대학교 산학협력단 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
CA3072195A1 (en) 2017-08-07 2019-04-04 The Johns Hopkins University Methods and materials for assessing and treating cancer
WO2019071219A1 (en) * 2017-10-06 2019-04-11 Grail, Inc. SPECIFIC SITE NOISE MODEL FOR TARGETED SEQUENCING
SG10202108020VA (en) 2017-10-16 2021-09-29 Illumina Inc Deep learning-based techniques for training deep convolutional neural networks
US11861491B2 (en) 2017-10-16 2024-01-02 Illumina, Inc. Deep learning-based pathogenicity classifier for promoter single nucleotide variants (pSNVs)
JP7067896B2 (ja) * 2017-10-27 2022-05-16 シスメックス株式会社 品質評価方法、品質評価装置、プログラム、および記録媒体
CA3080170A1 (en) * 2017-11-28 2019-06-06 Grail, Inc. Models for targeted sequencing
EP3718113A1 (en) * 2017-11-30 2020-10-07 Illumina, Inc. Validation methods and systems for sequence variant calls
IL300049B2 (en) 2018-01-08 2023-11-01 Illumina Inc Systems and devices for high-throughput sequencing for sequential CMOS
WO2019136388A1 (en) 2018-01-08 2019-07-11 Illumina, Inc. Systems and devices for high-throughput sequencing with semiconductor-based detection
TWI812671B (zh) 2018-01-26 2023-08-21 美商寬騰矽公司 用於識別核酸之核苷酸之方法、系統及非暫時性電腦可讀儲存媒體以及用於訓練深度學習模型之方法及系統
US20190259468A1 (en) * 2018-02-16 2019-08-22 Illumina, Inc. System and Method for Correlated Error Event Mitigation for Variant Calling
SE541799C2 (en) * 2018-04-11 2019-12-17 David Yudovich Determination of frequency distribution of nucleotide sequence variants
JP2019191952A (ja) * 2018-04-25 2019-10-31 特定非営利活動法人North East Japan Study Group プログラム、情報処理方法および情報処理装置
CN113168886A (zh) * 2018-08-13 2021-07-23 豪夫迈·罗氏有限公司 用于使用神经网络进行种系和体细胞变体调用的系统和方法
MX2021004434A (es) * 2018-10-17 2021-09-10 Quest Diagnostics Invest Llc Sistema de seleccion de secuenciacion genomica.
JP7232433B2 (ja) * 2018-10-19 2023-03-03 エフ. ホフマン-ラ ロシュ アーゲー 配列決定のための電場補助型接合部
CN111073961A (zh) * 2019-12-20 2020-04-28 苏州赛美科基因科技有限公司 一种基因稀有突变的高通量检测方法
US11361194B2 (en) 2020-10-27 2022-06-14 Illumina, Inc. Systems and methods for per-cluster intensity correction and base calling
US11538555B1 (en) 2021-10-06 2022-12-27 Illumina, Inc. Protein structure-based protein language models

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2875149B1 (en) 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
US20140066317A1 (en) * 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20140143188A1 (en) * 2012-11-16 2014-05-22 Genformatic, Llc Method of machine learning, employing bayesian latent class inference: combining multiple genomic feature detection algorithms to produce an integrated genomic feature set with specificity, sensitivity and accuracy
US9218450B2 (en) * 2012-11-29 2015-12-22 Roche Molecular Systems, Inc. Accurate and fast mapping of reads to genome

Similar Documents

Publication Publication Date Title
JP2017520821A5 (ja)
JP6618929B2 (ja) ウルトラディープシークエンシングにおける希少バリアントコール
KR102638152B1 (ko) 서열 변이체 호출을 위한 검증 방법 및 시스템
Racimo et al. Approximation to the distribution of fitness effects across functional categories in human segregating polymorphisms
EP3914736A2 (en) Detecting cancer, cancer tissue of origin, and/or a cancer cell type
CN106033502B (zh) 鉴定病毒的方法和装置
CN107480470B (zh) 基于贝叶斯与泊松分布检验的已知变异检出方法和装置
JP2014502155A5 (ja)
CA3080170A1 (en) Models for targeted sequencing
Qian et al. Radiogenomics of lower-grade gliomas: a radiomic signature as a biological surrogate for survival prediction
US20180312928A1 (en) Method and system for selecting customized drug using genomic nucleotide sequence variation information and survival information of cancer patient
Moussa et al. Locality sensitive imputation for single cell RNA-seq data
US20190362807A1 (en) Genomic variant ranking system for clinical trial matching
Kuo et al. Illuminating the dark side of the human transcriptome with TAMA Iso-Seq analysis
Gong et al. MethCP: differentially methylated region detection with change point models
US20230072300A1 (en) Chromosomal assessment to differentiate histiocytic malignancy from lymphoma and hemangiosarcoma in dogs
JP2004272350A (ja) クラスタリング装置、クラスタリング方法、クラスタリングプログラム
EP4367668A1 (en) Methylation fragment probabilistic noise model with noisy region filtration
Li et al. Alternative polyadenylation modification patterns reveal essential posttranscription regulatory mechanisms of tumorigenesis in multiple tumor types
Davis et al. POWRS: position-sensitive motif discovery
JP2016184185A5 (ja)
CA3090743A1 (en) Patient classification and prognostic method
Bharadwaj Characterizing Alterations to Chromatin Accessibility in Crohn’s Disease Patients by Identifying Potential Causal Variants in Regulatory Regions Through a QTL Approach
EP4297037A1 (en) Device for determining an indicator of presence of hrd in a genome of a subject
Yang et al. Detection of non-structural outliers for microarray experiments