JP2020506489A5 - - Google Patents

Download PDF

Info

Publication number
JP2020506489A5
JP2020506489A5 JP2019547220A JP2019547220A JP2020506489A5 JP 2020506489 A5 JP2020506489 A5 JP 2020506489A5 JP 2019547220 A JP2019547220 A JP 2019547220A JP 2019547220 A JP2019547220 A JP 2019547220A JP 2020506489 A5 JP2020506489 A5 JP 2020506489A5
Authority
JP
Japan
Prior art keywords
variant
fragment
baseline
sample
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019547220A
Other languages
English (en)
Other versions
JP2020506489A (ja
JP7113838B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/US2017/061554 external-priority patent/WO2018093780A1/en
Publication of JP2020506489A publication Critical patent/JP2020506489A/ja
Publication of JP2020506489A5 publication Critical patent/JP2020506489A5/ja
Application granted granted Critical
Publication of JP7113838B2 publication Critical patent/JP7113838B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (18)

  1. バリアントコールを有効化するためのコンピュータ実装方法であって、
    対象のゲノム配列に沿ったヌクレオチドの対応する配列を有するサンプルリードを含むシーケンシングデータを受信するステップと、
    対象の前記ゲノム配列に沿ったヌクレオチドの前記配列内の指定位置における可能なバリアントコールの表示を受信するステップと、
    1つまたは複数のベースラインゲノム配列内の前記指定位置におけるベースラインバリアント頻度を取得するステップと、
    対象の前記ゲノム配列に対する前記指定位置におけるサンプルバリアント頻度を取得するステップと、
    品質スコアを取得するために前記指定位置における前記ベースラインバリアント頻度およびサンプルバリアント頻度を解析するステップと、
    対象の前記ゲノム配列に対する前記可能なバリアントコールを前記品質スコアに基づいて有効化するステップと
    のためのプログラム命令を、1つまたは複数のプロセッサの制御下で実行することを備える方法。
  2. 前記解析するステップの動作が、前記サンプルバリアント頻度と前記ベースラインバリアント頻度の分布との間の関係を取得するステップを含み、前記品質スコアが前記関係に基づく、または、
    前記解析するステップの動作が、前記ベースラインバリアント頻度の分布に対して、前記サンプルバリアント頻度にインデックスを付けるステップを備える、請求項1に記載の方法。
  3. 前記関係がノンパラメトリックウィルコクソン順位和検定に基づく、請求項2に記載の方法。
  4. 前記ベースラインバリアント頻度が、前記ベースラインゲノム配列に沿った対応する位置における背景雑音の程度を示す、請求項1に記載の方法。
  5. 有効化する前記ステップが、前記品質スコアをしきい値と比較するステップと、前記品質スコアが前記しきい値を超えるとき、前記可能なバリアントコールが有効なバリアントコールであると宣言するステップとをさらに備える、請求項1に記載の方法。
  6. 前記ベースラインバリアント頻度が、2つ以上のタイプの対立遺伝子に関連付けられた複数のベースラインゲノム配列から導出される、請求項1に記載の方法。
  7. 前記ベースラインゲノム配列に沿ったヌクレオチドの配列の複数の参照リードを含むシーケンシングデータを受信するステップと、前記指定位置における前記参照リードに対する前記ベースラインバリアント頻度を決定するステップとをさらに備え
    任意選択で、前記ベースラインバリアント頻度を決定する前記ステップが、
    a.現在の塩基対ウィンドウ内の位置のセットに対する前記参照リードから前記シーケンシングデータを受信するステップと、
    b.前記現在の塩基対ウィンドウ内の位置の前記セットの中の1つまたは複数の位置に対する候補バリアント頻度を同定するステップと、
    c.前記参照リード内の指定位置に対する前記ベースラインバリアント頻度として前記候補バリアント頻度のうちの1つを選択するステップと、
    d.前記ベースラインゲノム配列に沿って前記塩基対ウィンドウをシフトさせ、a、b、およびcにおける動作を反復するステップと
    をさらに備える、請求項1に記載の方法。
  8. 象の前記ゲノム配列に沿ったヌクレオチドのサンプル断片および未加工断片に対するリードを含むシーケンシングデータを受信するステップであって、ヌクレオチドの配列に対応する前記サンプル断片に対する前記リード、対象の前記ゲノム配列に沿った前記指定位置を含む、ステップと、
    以下の
    A)前記未加工断片が、前記可能なバリアントコールを確証するかどうか、
    B)前記サンプルリードが、前記サンプル断片に対する所定の量のカバレッジを提供するかどうか、および
    C)前記可能なバリアントコールが、既定の集団にわたって呈示された、以前のバリアントコールに整合するかどうか
    のうちの、少なくとも1つを決定するステップと、
    を実施するためのプログラム命令を、1つまたは複数のプロセッサの制御下で実行することを備え
    前記品質スコアに基づいて前記可能なバリアントコールを有効化するステップは、前記品質スコアと前記決定するステップの動作に基づいて前記可能なバリアントコールを有効化するステップを具備し、任意選択で、前記解析するステップの動作ならびに決定するステップの動作A)、B)、およびC)が、階層をなして実行される、請求項1に記載の方法
  9. 決定する前記ステップが動作A)を含み、動作A)が、
    サポートバリアントコールを示す前記未加工断片を同定するステップと、
    前記サポートバリアントコールを示す前記未加工断片に対する重み付き断片スコアを取得するステップと、
    前記可能なバリアントコールを確証すべきかどうかを決定するために、前記重み付き断片スコアを未加工断片しきい値と比較するステップと
    を備える、請求項8に記載の方法。
  10. 決定する前記ステップが動作A)を含み、前記未加工断片が、二重スティッチ型断片、一重スティッチ型断片、二重非スティッチ型断片、または一重非スティッチ型断片のうちの少なくとも1つに対応する、請求項8に記載の方法。
  11. 決定する前記ステップが
    (a)動作A)を含み、動作A)が、二重スティッチ型断片を前記未加工断片として同定するステップと、前記可能なバリアントコールを確証すべきかどうかを決定するために、前記二重スティッチ型断片がサポートバリアントコールを示すかどうかを決定するステップとを備えるか、
    (b)動作B)を含み、前記サンプルリードが前記所定の量のカバレッジを下回るとき、前記可能なバリアントコールがコールなしと宣言されるか、または、
    (c)動作C)を含み、
    i.前記可能なバリアントコールと以前のバリアントコールとの間に整合が決定されると、前記決定するステップの動作が、第1のしきい値を利用して動作A)または動作B)のうちの少なくとも一方を実行し、
    ii.前記可能なバリアントコールと以前のバリアントコールとの間に整合が存在しないとき、前記決定するステップの動作が、第2のしきい値を利用して動作A)または動作B)のうちの少なくとも一方を実行する、
    請求項8に記載の方法。
  12. バリアントコールを有効化するためのシステムであって、
    プログラム命令と、対象のゲノム配列に沿ったヌクレオチドの対応する配列を有するサンプルリードを含むシーケンシングデータとを記憶するメモリ、ならびに
    1つまたは複数のプロセッサ
    を備え、前記1つまたは複数のプロセッサが、前記プログラム命令を実行するとき、
    対象の前記ゲノム配列に沿ったヌクレオチドの前記配列内の指定位置における可能なバリアントコールの表示を受信し、
    1つまたは複数のベースラインゲノム配列内の前記指定位置におけるベースラインバリアント頻度を取得し、
    対象の前記ゲノム配列に対する前記指定位置におけるサンプルバリアント頻度を取得し、
    品質スコアを取得するために前記指定位置における前記ベースラインバリアント頻度およびサンプルバリアント頻度を解析し、
    対象の前記ゲノム配列に対する前記可能なバリアントコールを前記品質スコアに基づいて有効化する、
    システム。
  13. 前記1つまたは複数のプロセッサが、
    (a)前記サンプルバリアント頻度と前記ベースラインバリアント頻度の分布との間の関係を取得し、前記品質スコアが前記関係に基づくか、
    (b)前記ベースラインバリアント頻度の分布に対して、前記サンプルバリアント頻度にインデックスを付けるか、または、
    (c)前記品質スコアをしきい値と比較し、前記比較に基づいて前記可能なバリアントコールが無効であると宣言する表示を出力する、請求項12に記載のシステム。
  14. 前記ベースラインバリアント頻度が、前記ベースラインゲノム配列に沿った対応する座における背景雑音の程度を示す、請求項12に記載のシステム。
  15. 前記ベースラインゲノム配列に沿ったヌクレオチドの複数の参照リードを含むシーケンシングデータを記憶するメモリと、前記指定位置における前記参照リードに対する前記ベースラインバリアント頻度を決定するための前記1つまたは複数のプロセッサとをさらに備える、請求項12に記載のシステム。
  16. 前記メモリは、プログラム命令と、対象のゲノム配列に沿ったヌクレオチドのサンプル断片および未加工断片に対するサンプルリードを含むシーケンシングデータとを記憶、前記ヌクレオチドの配列に対応する前記サンプル断片に対する前記サンプルリードは、対象の前記ゲノム配列に沿った前記指定位置をみ、
    記1つまたは複数のプロセッサが、前記プログラム命令を実行するとき
    以下の、
    A)前記未加工断片が、前記可能なバリアントコールを確証するかどうか、
    B)前記サンプルリードが、前記サンプル断片に対する所定の量のカバレッジを提供するかどうか、および
    C)前記可能なバリアントコールが、既定の集団にわたって呈示された、以前のバリアントコールに整合するかどうかのうちの、少なくとも1つを決定し、
    前記品質スコアおよび前記決定するステップの動作に基づいて前記可能なバリアントコールを有効化する、
    請求項12に記載のシステム。
  17. 前記決定することが動作A)を含み、動作A)が、
    サポートバリアントコールを示す前記未加工断片を同定することと、
    前記サポートバリアントコールを示す前記未加工断片に対する重み付き断片スコアを取得することと、
    前記可能なバリアントコールを確証すべきかどうかを決定するために、前記重み付き断片スコアを未加工断片しきい値と比較することと
    を備える、請求項16に記載のシステム。
  18. 前記決定することが動作A)を含み、前記未加工断片が、二重スティッチ型断片、一重スティッチ型断片、二重非スティッチ型断片、または一重非スティッチ型断片のうちの少なくとも1つに対応する、請求項16に記載のシステム。
JP2019547220A 2016-11-16 2017-11-14 配列バリアントコールのための有効化方法およびシステム Active JP7113838B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662422841P 2016-11-16 2016-11-16
US62/422,841 2016-11-16
US201762447076P 2017-01-17 2017-01-17
US62/447,076 2017-01-17
PCT/US2017/061554 WO2018093780A1 (en) 2016-11-16 2017-11-14 Validation methods and systems for sequence variant calls

Publications (3)

Publication Number Publication Date
JP2020506489A JP2020506489A (ja) 2020-02-27
JP2020506489A5 true JP2020506489A5 (ja) 2020-12-03
JP7113838B2 JP7113838B2 (ja) 2022-08-05

Family

ID=60570225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019547220A Active JP7113838B2 (ja) 2016-11-16 2017-11-14 配列バリアントコールのための有効化方法およびシステム

Country Status (10)

Country Link
US (1) US20190348149A1 (ja)
EP (1) EP3542291A1 (ja)
JP (1) JP7113838B2 (ja)
KR (1) KR102638152B1 (ja)
CN (1) CN110168648A (ja)
AU (2) AU2017360993A1 (ja)
BR (1) BR112019009949A2 (ja)
CA (1) CA3044231A1 (ja)
SG (1) SG10201912285UA (ja)
WO (1) WO2018093780A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3246416B1 (en) 2011-04-15 2024-06-05 The Johns Hopkins University Safe sequencing system
WO2014070462A1 (en) 2012-10-29 2014-05-08 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
WO2017027653A1 (en) 2015-08-11 2017-02-16 The Johns Hopkins University Assaying ovarian cyst fluid
KR20200115450A (ko) 2017-08-07 2020-10-07 더 존스 홉킨스 유니버시티 암을 평가하고 치료하기 위한 방법 및 재료
US20190206510A1 (en) 2017-11-30 2019-07-04 Illumina, Inc. Validation methods and systems for sequence variant calls
SG11201911805VA (en) 2018-01-15 2020-01-30 Illumina Inc Deep learning-based variant classifier
SE541799C2 (en) * 2018-04-11 2019-12-17 David Yudovich Determination of frequency distribution of nucleotide sequence variants
US20210319849A1 (en) * 2018-08-28 2021-10-14 Koninklijke Philips N.V. Method for assessing genome alignment basis
CN109935275B (zh) * 2018-12-29 2021-09-07 北京安诺优达医学检验实验室有限公司 序列变异校验方法和装置、生产变异序列的方法和装置及电子设备
CA3150630A1 (en) * 2019-09-09 2021-03-18 Katherine E. Varley TARGETED SEQUENCING TO DETECT AND QUANTIFY LOW LEVELS OF METHYL DNA
CN110867207B (zh) * 2019-11-26 2021-07-30 北京橡鑫生物科技有限公司 验证ngs变异检测方法的评估方法及评估装置
CN113436679B (zh) * 2020-03-23 2024-05-10 北京合生基因科技有限公司 确定待测核酸样本变异率的方法和系统
US11198121B1 (en) 2020-06-10 2021-12-14 Element Biosciences, Inc. Flow cell systems and devices
CN115064212B (zh) * 2022-06-24 2023-03-14 哈尔滨星云生物信息技术开发有限公司 基于wgs数据的预设区域人群肿瘤特异突变识别方法

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
US5641658A (en) 1994-08-03 1997-06-24 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid with two primers bound to a single solid support
AU6846798A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US20040002090A1 (en) 2002-03-05 2004-01-01 Pascal Mayer Methods for detecting genome-wide sequence variations associated with a phenotype
EP3002289B1 (en) 2002-08-23 2018-02-28 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
GB2423819B (en) 2004-09-17 2008-02-06 Pacific Biosciences California Apparatus and method for analysis of molecules
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
WO2006138257A2 (en) 2005-06-15 2006-12-28 Callida Genomics, Inc. Single molecule arrays for genetic and chemical analysis
GB0514910D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Method for sequencing a polynucleotide template
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20080009420A1 (en) 2006-03-17 2008-01-10 Schroth Gary P Isothermal methods for creating clonal single molecule arrays
EP4105644A3 (en) 2006-03-31 2022-12-28 Illumina, Inc. Systems and devices for sequence by synthesis analysis
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
EP2614161B1 (en) * 2010-09-09 2020-11-04 Fabric Genomics, Inc. Variant annotation, analysis and selection tool
WO2012095872A1 (en) 2011-01-13 2012-07-19 Decode Genetics Ehf Genetic variants as markers for use in urinary bladder cancer risk assessment, diagnosis, prognosis and treatment
CN104160391A (zh) * 2011-09-16 2014-11-19 考利达基因组股份有限公司 确定异质样本的基因组中的变异
CN104094266A (zh) * 2011-11-07 2014-10-08 独创系统公司 用于识别原因性基因组变体的方法和系统
US20150337388A1 (en) * 2012-12-17 2015-11-26 Virginia Tech Intellectual Properties, Inc. Methods and compositions for identifying global microsatellite instability and for characterizing informative microsatellite loci
ES2704255T3 (es) 2013-03-13 2019-03-15 Illumina Inc Métodos y sistemas para alinear elementos de ADN repetitivos
WO2014152990A1 (en) * 2013-03-14 2014-09-25 University Of Rochester System and method for detecting population variation from nucleic acid sequencing data
CN106462670B (zh) * 2014-05-12 2020-04-10 豪夫迈·罗氏有限公司 超深度测序中的罕见变体召集
KR102538753B1 (ko) 2014-09-18 2023-05-31 일루미나, 인코포레이티드 핵산 서열결정 데이터를 분석하기 위한 방법 및 시스템
CA2963425A1 (en) * 2014-10-16 2016-04-21 Counsyl, Inc. Variant caller

Similar Documents

Publication Publication Date Title
JP2020506489A5 (ja)
He et al. Two evolutionary histories in the genome of rice: the roles of domestication genes
Huber et al. Detecting recent selective sweeps while controlling for mutation rate and background selection
Lohmueller et al. Natural selection affects multiple aspects of genetic variation at putatively neutral sites across the human genome
Loules et al. Targeted next-generation sequencing for the molecular diagnosis of hereditary angioedema due to C1-inhibitor deficiency
JP2017520821A5 (ja)
CN107408163B (zh) 用于分析基因的方法及装置
Huang et al. Evaluation of variant detection software for pooled next-generation sequence data
Amos et al. Genetic predisposition to pass the standard SICCT test for bovine tuberculosis in British cattle
Kozak et al. Genome-wide admixture is common across the Heliconius radiation
Zuber et al. A novel algorithm for simultaneous SNP selection in high-dimensional genome-wide association studies
CN114649055A (zh) 用于检测单核苷酸变异和插入缺失的方法、设备和介质
US20160132637A1 (en) Noise model to detect copy number alterations
Li et al. Comparative sequence alignment reveals River Buffalo genomic structural differences compared with cattle
JPWO2021028989A5 (ja) バックドア検査装置、方法及びプログラム
CN107653312B (zh) 与血脂水平和冠心病相关的rs7901016检测系统及相关应用
US10002232B2 (en) Biological sample analysis system and method
Kleftogiannis et al. Identification of single nucleotide variants using position-specific error estimation in deep sequencing data
KR20130125617A (ko) 비정상 조직의 유전 정보를 분석하는 방법 및 장치
CN113234835A (zh) 预后相关基因及风险模型预测胰腺癌预后的应用
CN108733984B (zh) Nipt的z值结果校正方法及装置、计算机可读存储介质
US20150347674A1 (en) System and method for analyzing biological sample
CN113215261A (zh) 胰腺癌的预后预测诊断用基因标记物及其用途
JPWO2021250792A5 (ja) ソフトウェア修正装置、ソフトウェア修正方法、及びプログラム
do Nascimento et al. Copy number variations detection: unravelling the problem in tangible aspects