JP2017521078A - 遺伝的多様体を検出する方法 - Google Patents

遺伝的多様体を検出する方法 Download PDF

Info

Publication number
JP2017521078A
JP2017521078A JP2017501719A JP2017501719A JP2017521078A JP 2017521078 A JP2017521078 A JP 2017521078A JP 2017501719 A JP2017501719 A JP 2017501719A JP 2017501719 A JP2017501719 A JP 2017501719A JP 2017521078 A JP2017521078 A JP 2017521078A
Authority
JP
Japan
Prior art keywords
amplification reaction
genetic variant
sequencing
genetic
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017501719A
Other languages
English (en)
Other versions
JP6621802B6 (ja
JP2017521078A5 (ja
JP6621802B2 (ja
Inventor
ローゼンフェルド,ニッツァン
フォーシュー,ティム
マラス,フランセスコ
ムルタザ,ムハメッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Research Technology Ltd
Original Assignee
Cancer Research Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Research Technology Ltd filed Critical Cancer Research Technology Ltd
Publication of JP2017521078A publication Critical patent/JP2017521078A/ja
Publication of JP2017521078A5 publication Critical patent/JP2017521078A5/ja
Application granted granted Critical
Publication of JP6621802B2 publication Critical patent/JP6621802B2/ja
Publication of JP6621802B6 publication Critical patent/JP6621802B6/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/146Concentration of target or template
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、DNA試料中の目的の領域中の遺伝的多様体を検出する方法であって、(i)所与のシーケンシングプラットフォーム、シーケンシング工程およびシーケンシング深度について、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果で観察されると予測される遺伝的多様体または複数の多様体を裏づけるリード数の分布(リードカウント分布)を決定すること;(ii)ステップ(i)において決定されたリードカウント分布に基づいて、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応物中の遺伝的多様体の存在について陽性判定を割り付けること;(iii)反復増幅反応物中の目的の領域の増幅可能なテンプレート分子の平均数がステップ(ii)において決定された閾値頻度の逆数よりも少なくなるように、DNA試料を複数の反復増幅反応物に分配すること;(iv)ステップ(iii)の増幅反応を実施することおよび増幅反応の産物をシーケンシングすること;(v)ステップ(ii)およびステップ(iv)の結果に基づいて、各反復増幅反応物中の遺伝的多様体の有無を決定すること;ならびに(vi)(v)の結果を統合してDNA試料中の目的の領域中の遺伝的多様体の有無を決定すること、を含む、方法を提供する。【選択図】図1A、図1B

Description

発明の分野
本発明は、DNA試料中の遺伝的多様体を検出する方法に関する。
発明の背景
遺伝的多様体は、所与の領域の参照DNA配列と異なる1つまたは複数のヌクレオチドである。例えば遺伝的多様体は、1つまたは複数のヌクレオチドの欠失、置換または挿入を含み得る。
目的の領域のDNA配列を決定すること、および決定された配列を参照配列と比較すること、によって、DNA試料を既知の遺伝的多様体について分析でき、または目的の領域にある過去に知られていない遺伝的多様体を発見できる。
DNAシーケンシングは、Metzker, M.L., Nat Rev Genet 2010 Jan;11(1): 31−46によって論評された、古典的な連鎖停止法、または複数のハイスループット次世代シーケンシング(NGS)法の1つなど、様々な技術を利用して実施できる。
Illuminaシーケンシング、454パイロシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシングおよびイオン半導体シーケンシングプラットフォームは、「合成によるシーケンシング」の原理に基づくDNAシーケンシング法の例である。これらの方法において、ヌクレオチド塩基が新たに合成された相補鎖に組み入れられると放出されるシグナルの検出を通して、DNAのテンプレート鎖の配列が決定される。
DNAシーケンシングプラットフォームは、誤り率を有する。例えば時折、増幅反応に用いられるポリメラーゼは、合成される相補鎖に誤ったヌクレオチド塩基を組み入れて、DNAテンプレート内のその位置でのヌクレオチドの決定を間違えることがある。NGS法の検出限界は、ライブラリーの調製(通常はPCRによる増幅を含む)およびシーケンシングそのもの、の2段階での誤りによって定義される。
このことは、低頻度で、例えば用いられるシーケンシング法の誤り率に近い頻度またはそれ未満の頻度でDNA試料中に存在するに過ぎない遺伝的多様体の検出の場合には特に問題になる。そのような状況下では、同定された遺伝的多様体が事実であるか(即ち、DNAテンプレート分子中に実際に存在する)、または誤りであるかを決定することが、困難または不可能である。
Illuminaシーケンシングの場合、バックグランド誤り率が、異なる遺伝的多様体およびゲノム位置によって変動し、大きな変動性を有する。それゆえ、約1%以下の頻度でDNA試料中に存在する突然変異を検出することが、問題になる。
既存のDNAシーケンシング法および遺伝的多様体同定法は、特に少量のDNAを有する試料では、複数の領域で希少な新規多様体を検出することに関して限界を有する。
方法は、用いられた方法の誤り率(即ち、バックグランドノイズ)よりも低い、またはそれと類似の頻度で生じる突然変異を同定するのは、典型的には不可能である。
デジタルPCR(dPCR; Vogelstein b., Kinzler K.W. Proc. Natl. Acad. Sci. U.S.A. 1999 96(16):9236−41; Sykes, P.J. et al., BioTechniques 1992 13(3): 444−9)は、特定の多様体を検出するように設計されたプライマーおよびアッセイの利用を必要とするため、新規な(即ち、過去に同定されていない)遺伝的多様体の同定には有用でない。その上、dPCRは、特にDNA試料が限定される場合に、目的の複数の領域を並行して分析するのに限定された範囲を有する。
Safe−SeqSおよび一分子での分子反転プローブなど、DNAの単一プールからの単一DNA分子を標識するための他の複雑な方法が、存在する(Kinde I, et al., Proc Natl Acad Sci U S A. 2011 108(23): 9530−5; Hiatt JB, et al., Genome Res. 2013 23(5):843−54.)。これらの方法は、複数の遺伝子(即ち、該当する複数の領域)の同時分析およびDNAが限られる場合には適さない。
複数の試験によって、癌DNAの非侵襲性検出が実証された(Dawson SJ, et al., N Engl J Med. 2013 368(13):1199−209; Forshew T, et al., Sci Transl Med. 2012 4(136):136ra68; Murtaza M, et al. Nature. 2013 497(7447):108−12)。しかし、(a)関連の癌突然変異を検出するための十分な塩基のゲノムのスクリーニング、(b)そのような突然変異に関する少量の断片化DNAのスクリーニング、および(c)多くの「野生型」分子のうちの低頻度の突然変異体腫瘍DNA分子の検出など、この分野には大きな難題が依然として存在する。
例えば、Forshew T, et al., Sci Transl Med. 2012 4(136):136ra68には、血中の癌突然変異に関する大きな領域のゲノムをスクリーニングすることが記載されているが、この方法の検出限界は、約1%〜2%のアレル頻度(AF)であった。
発明の概要
本発明は、上記の問題の解決策を提供する。実際の遺伝的多様体は、方法の誤り(即ち、DNA増幅およびシーケンシングプラットフォームの誤り率)を考慮して各位置での遺伝的多様体のバックグランド頻度を決定することにより同定される。
第一の態様において、本発明は、DNA試料において目的の領域中の遺伝的多様体を検出するための方法であって、
(i)所与のシーケンシングプラットフォーム、シーケンシング工程およびシーケンシング深度について、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果で観察されると予測される遺伝的多様体または複数の多様体を裏づけるリード数の分布(リードカウント分布)を決定すること;
(ii)ステップ(i)において決定されたリードカウント分布に基づいて、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応物における遺伝的多様体の存在について陽性判定を割り付けること;
(iii)反復増幅反応物における目的の領域の増幅可能なテンプレート分子の平均数がステップ(ii)において決定された閾値頻度の逆数よりも少なくなるようにDNA試料を複数の反復増幅反応物に分配すること;
(iv)ステップ(iii)の増幅反応を実施すること、および増幅反応の産物をシーケンシングすること;
(v)ステップ(ii)およびステップ(iv)の結果に基づいて、各反復増幅反応物における遺伝的多様体の有無を決定すること;ならびに
(vi)(v)の結果を統合してDNA試料における目的の領域の遺伝的多様体の有無を決定すること、
を含む、方法を提供する。
本発明は、DNA試料において目的の領域の遺伝的多様体を検出する方法であって、
(i)所与のシーケンシングプラットフォームについて、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果で遺伝的多様体または複数の遺伝的多様体が観察されると予測される平均頻度および頻度の分散を決定すること;
(ii)ステップ(i)で決定された平均頻度および頻度の分散に基づいて、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応物における遺伝的多様体の存在について陽性判定を割り付けること;
(iii)反復増幅反応物における目的の領域の増幅可能なテンプレート分子の平均数がステップ(ii)において決定された閾値頻度の逆数よりも少なくなるようにDNA試料を複数の反復増幅反応物に分配すること;
(iv)ステップ(iii)の増幅反応を実施すること、および増幅反応の産物をシーケンシングすること;
(v)ステップ(ii)およびステップ(iv)の結果に基づいて、各反復増幅反応物における遺伝的多様体の有無を決定すること;ならびに
(vi)(v)の結果を統合してDNA試料における目的の領域の遺伝的多様体の有無を決定すること、
を含む、方法を提供する。
有利には、この方法は、DNA試料において非常に低頻度の遺伝的多様体の検出を可能にする。したがって方法は、過去に知られた突然変異検出方法と比較して、遺伝的突然変異の存在(即ち、突然変異がより低頻度で存在する場合)のより早期の同定(例えば、癌関連の突然変異など疾患病態に関連して)を可能にする。それゆえ方法は、腫瘍の再出現、腫瘍の成長、薬物耐性の発達/腫瘍の進展に関するスクリーニングおよび治療的に実行可能な突然変異の同定など、様々な適用例に用途を見出す。この方法はまた、改善された統計学的信頼性を有する低頻度の遺伝的突然変異の存在の同定を可能にする。
本発明の方法の重要な特色は、平均で、反復増幅反応物に存在する目的の領域の増幅可能なテンプレート分子の数が、陽性判定の閾値頻度の逆数よりも少なくなるように、DNA試料を複数の反復増幅反応物に分配すること(例えば、希釈およびウェルへの分取により)である。こうして、遺伝的多様体が存在する増幅可能なテンプレート領域を有する各増幅反応物について、多様体の存在を決定するための閾値頻度よりも大きな頻度で多様体が観察される確率が高くなる。それによりこの方法は、DNA試料中に非常に低頻度で存在する場合であっても、DNA試料における遺伝的多様体の存在の検出を可能にする。例えばこの方法は、1%未満の頻度の検出を可能にする。
その上、本発明の方法は、遺伝的多様体の発見に有用である。即ち、目的の領域について参照DNA配列からの3つの潜在的塩基置換のそれぞれのバックグランドレベルを即座に決定でき、バックグランドレベル(特定のDNA試料の)を超える遺伝的多様体の頻度を、この方法を用いて続いて同定できる。したがって、任意の特定の遺伝的多様体についてスクリーニングせずに、目的の領域の任意の位置にある新たな遺伝的多様体が、同定され得る。この特色は、診断、予知、突然変異発見、処置への応答のモニタリングおよび薬物耐性など、広範囲の分野における明確な利点に関連する。
幾つかの実施形態において、ステップ(vi)においてDNA試料の目的の領域に遺伝的多様体が存在すると決定されるためには、ステップ(v)における遺伝的多様体の存在に関する陽性判定が1つよりも多くの復増幅反応物でなされなければならない。幾つかの実施形態において、遺伝的多様体の存在に関する陽性判定は、少なくとも3つの反復増幅反応物でなされなければならない。
幾つかの実施形態において、遺伝的多様体は、一ヌクレオチド多様体、即ち、同じ位置における1つのヌクレオチドから異なるヌクレオチドへの置換であり得る。幾つかの実施形態において、遺伝的多様体は、ヌクレオチドを付加または除去する挿入または欠失であり得る。幾つかの実施形態において、遺伝的多様体は、一ヌクレオチド多様体と挿入および/または欠失とを含む複数のイベントの組み合わせであり得る。幾つかの実施形態において、遺伝的多様体は、目的の異なる領域に存在する複数の遺伝的多様体で構成され得る。
複数の反復増幅反応物における遺伝的多様体の陽性判定を必要とすることで、DNA試料に存在する遺伝的多様体の偽陽性判定の確率が低下する。反復増幅反応物において複数の陽性判定を必要とするこの方法はそれゆえ、遺伝的多様体の検出に関してより高い特異度を有する。
DNA試料をシーケンシングするために用いられた方法における誤差の結果として所与の多様体が観察される(即ち、シーケンシングの結果において)平均頻度および変動係数(CV)を用いて、遺伝的多様体のバックグランドレベル(即ち、ノイズ)を決定および/またはモデル化できる。これらの値は、例えば累積分布関数(CDF)値を決定するため、そして/またはzスコアを計算するために、用いられ得る。
次に、遺伝的多様体のバックグランドノイズの測定および/またはモデルをその後用いて閾値頻度を確定し、それを超えて遺伝的多様体が観察されて所与の増幅反応物中に存在する(陽性判定)と決定されなければならない。陽性判定では、多様体の頻度はバックグランドレベルでの平均頻度よりも高くなければならない。
本発明の方法の幾つかの実施形態において、ステップ(ii)の閾値頻度は、二項分布、過分散二項分布、ベータ分布、正規分布、指数分布またはガンマ確率分布モデルを用いて決定される。幾つかの実施形態において、それ以上で所与の遺伝的多様体が観察されて反復増幅反応物中に存在すると決定される閾値頻度は、その遺伝的多様体の累積分布関数(CDF)値が0.99、0.995、0.999、0.9999、0.99999またはそれを超える所定の閾値(CDF_thresh)に達する頻度である。
本発明の方法の幾つかの実施形態において、ステップ(ii)の閾値頻度は、zスコアカットオフを利用して決定される。ここで、ステップ(i)で決定された遺伝的多様体のバックグランド平均頻度および頻度の分散は、正規分布でモデル化され、突然変異をコール(call)するための閾値頻度は、バックグランド平均頻度を超える多数の標準偏差であるzスコアでの頻度である。幾つかの実施形態において、閾値頻度は、zスコアが20での頻度である。幾つかの実施形態において、閾値頻度は、zスコアが30での頻度である。
幾つかの実施形態において、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応物中の遺伝的多様体の存在について陽性判定を割り付けることは、
(a)ステップ(i)において複数の遺伝的多様体について決定されたリードカウント分布(場合により、複数の遺伝的多様体について決定された平均頻度および頻度の分散によって定義された正規分布)に基づいて、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき複数の閾値頻度を確定して所与の増幅反応物中の遺伝的多様体の存在について陽性判定を割り付けること、および
(b)ステップ(a)に基づいて、それ以上で所与の増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき全体的閾値頻度を確定してその増幅反応物中の遺伝的多様体の存在について陽性判定を割り付けることであり、全体的閾値頻度が、ステップ(a)で決定された閾値頻度の90%、95%、97.5%、99%またはそれを超える閾値頻度がこの値未満である閾値頻度であること、
を含む。こうして、閾値頻度が目的の領域の各位置の各可能な塩基について決定される必要はなく、複数の遺伝的多様体に基づく全体的閾値が、本発明の方法で用いられ得る。
幾つかの実施形態において、遺伝的多様体が反復増幅反応物の1つの増幅可能なテンプレート分子中に存在する場合に、陽性判定がその反復測定でなされる確率が0.9以上であるように、所与の反復増幅反応物中に存在する目的の領域の増幅可能なテンプレート分子の平均数が決定される。
これによって、多様体が実際に存在する場合に、所与の反復増幅反応物が遺伝的多様体について陰性であると誤って決定される確率が最小限になる。
幾つかの実施形態において、複数の反応物は全て、試料からの同量の開始テンプレート材料を有する。幾つかの実施形態において、異なる反応物は、試料からの異なる量のテンプレート材料を有する。これらの量は、試料中の遺伝的変異体のアレル頻度を推定する場合に考慮され得る。
幾つかの実施形態において、ステップ(i)は、DNA試料を複数回シーケンシングして、遺伝的多様体または複数の遺伝的多様体についてリードカウント分布を決定することを含み、リードカウント分布は場合により、遺伝的多様体または複数の遺伝的多様体の平均頻度および頻度の分散によって定義された正規分布である。
有利には、バックグランド誤り率が、この方法で目的の領域中の遺伝的多様体について経験的に決定される場合には、バックグランド誤り率の推定がより正確であり、それによりDNA試料中の遺伝的多様体の存在を検出する感度がより大きくなり、信頼度がより大きくなる。
幾つかの実施形態において、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果において遺伝的多様体または複数の遺伝的多様体が観察されると予測されるリードカウント分布(場合により、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果において遺伝的多様体または複数の遺伝的多様体が観察されると予測される平均頻度および頻度の分散によって定義された正規分布)は、シーケンサーおよび/またはポリメラーゼの誤り率に基づいてステップ(i)において決定される。幾つかの実施形態において、これは、配列の状況を考慮して決定される。
幾つかの実施形態において、ステップ(i)は、データベース、チャート、表、リスト、カタログ、インデックス、ディレクトリ、またはレジスタにおいて参照値または複数の参照値を「探索すること」を含む。幾つかの実施形態において、参照値は、参照DNA試料を複数回シーケンシングして、遺伝的多様体または複数の遺伝的多様体についてのリードカウント分布を決定することにより決定され、リードカウント分布は、場合により遺伝的多様体または複数の遺伝的多様体についての平均頻度および頻度の分散によって定義された正規分布である。幾つかの実施形態において、参照DNA試料は、「一致した正常な」試料である。
有利には、本発明の方法は、各回でバックグランド誤り率を経験的に決定する必要なしに実施され得る。
幾つかの実施形態において、ステップ(iii)でのDNA試料の分配に続いて、各反復増幅反応物は、反復増幅反応物あたりに、目的の領域について1より多い増幅可能なテンプレート分子平均を有する。幾つかの実施形態において、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数は、1より多く1000未満、2より多く1000未満、または5より多く1000未満であろう。
有利には、DNA試料は、テンプレート分子の分配に関連する方法の効率を実現するのに必要な量よりも多く分配する必要はない。これは、少なくともランニングコストおよび材料費を低減することに関する利点を有する。
幾つかの実施形態において、この方法は、DNA試料の増幅可能なテンプレート分子の集団中に、2%未満、1%未満、0.5%未満、0.1%未満または0.05%未満の頻度で存在する遺伝的多様体を検出できる。
幾つかの実施形態において、DNA試料を複数の反復増幅反応物に分配することは、DNA試料を希釈すること、および反復増幅反応物に分取すること、を含む。例えば増幅反応は、別々のウェル中で実施され得る。あるいは反復増幅反応物は、当業者に知られる他の手段により分配され得る。
本発明の方法の幾つかの実施形態において、反復増幅反応は、並行して実施され、増幅反応の産物のシーケンシングは、並行して実施される。
本発明の幾つかの実施形態において、この方法は、
(vii)DNA試料における遺伝的多様体の頻度を決定すること、
をさらに含む。
有利には、これは、遺伝的多様体の頻度における経時的な変化(例えば、疾患経過および/または処置過程の間)および/または試料間の遺伝的多様体の頻度における差の決定を可能にする。
増幅反応は、一段階PCRまたは二段階PCRによって実施され得る。
幾つかの実施形態において、増幅反応は、目的の領域に隣接する1つまたは複数のプライマー対を使用して実施されて、試料および/または増幅反応反復測定物の特異的識別子配列を増幅産物中に組み込む。目的の結合した標的領域と共に読むと、識別子を利用して、どの試料および/または増幅反応複製物から標的配列が由来したかを同定できるように、識別子配列は、別の連続したDNA塩基と十分に異なる任意の連続したDNA塩基として定義され得る。用語「識別子配列」および「バーコード」は、本明細書では互換的に用いられる。
幾つかの実施形態において、プライマーは、配列アダプターを増幅産物に組み込む。幾つかの実施形態において、目的の領域に隣接するプライマーは、試料および/または増幅反応複製物特異的識別子配列、ならびに配列アダプターを含み、これらの識別子およびアダプター配列を一段階PCRの際に付加させる。幾つかの実施形態において、汎用の「標識」配列が、プライマー対の中に含まれる。標識配列は、PCRの次の回での標的として用いられ得る任意の連続したDNA塩基として定義され得る。複数のプライマーへの共通の標識配列の結合により、増幅後に、結合したこれらの共通の標識配列を有する複数の産物が得られる。最適な標識配列は、ゲノム配列の非特異的増幅を予防するために、目的のゲノムと十分異なる。幾つかの実施形態において、標識配列は、シーケンシングプライマーの結合部位などのさらなる特色を含み得る。幾つかの実施形態において、二回目のPCRが、シーケンシングアダプターおよび場合によりさらなるバーコードを元々のPCR産物に結合させるために、標識配列、配列アダプターおよび場合によりさらなるバーコードを含むプライマーを使用して実施される。幾つかの実施形態において、ライゲーションを利用して、配列アダプターおよび場合によりさらなるバーコードを元々のPCR産物に結合させる。幾つかの実施形態において、複数の目的の領域が、並行して分析される。
それゆえ幾つかの例においてこの方法は、ハイスループット法として実行され得、遺伝的多様体に関する目的の複数の領域のスクリーニングを同時に可能にする。これは、速度、効率、ならびにランニングコストおよび材料費の低下に関して利点を有する。
本発明の方法の幾つかの実施形態において、リードカウント分布は、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果で遺伝的多様体または複数の遺伝的多様体が観察される、または観察されると予測される平均頻度および頻度の分散であるパラメータを特徴とする正規分布として定義され得る。
リードカウント分布は、任意のカウントで非参照アレルを観察する一般的確率セットとして定義され得る。
リードカウント分布は、増幅反応物のシーケンシング誤差により増幅反応物のシーケンシング結果で観察されると予測される遺伝的多様体または複数の遺伝的多様体を裏づけるリード数の分布であり得る。遺伝的多様体を裏づけるリードは、遺伝的多様体に関して陽性リードである。
例えば、リードカウント分布は、増幅およびシーケンシング誤差により、所与のシーケンシングプラットフォーム、シーケンシング工程およびシーケンシング深度について、遺伝的多様体または複数の遺伝的多様体を観察する一般的確率セットであり得る。
シーケンシング深度とも称されるリード深度は、特異的ゲノム位置(例えば、所与のヌクレオチド)がシーケンシング工程で読まれる回数として定義され得る。
本発明の方法は、広範囲の適用例に用途を見出す。実際、この方法は、任意の目的のために、任意のDNA試料中の目的の任意の領域にある遺伝的多様体の検出に有用である。
別の態様において、本発明は、試料中の腫瘍DNAを検出および/または定量するための先に記載された方法を提供する。幾つかの実施形態において、この方法は、試料中の循環する腫瘍DNAを検出および/または定量するためのものである。
本発明の任意の態様による幾つかの例において、試料は、対象から得られた生物学的試料である。幾つかの実施形態において、試料は、組織試料、例えば外科的試料である。幾つかの実施形態において、試料は、液体生検、例えば血液、血漿、尿、精液、糞便、痰、胸水、腹水、滑液、脳脊髄液、リンパ、乳頭液(nipple fluid)、または気管支洗浄液である。幾つかの実施形態において、試料は、細胞学的試料あるいは細胞材料を含有するスメアまたは流体、例えば子宮頚管スメア、鼻腔擦過物、またはスポンジ(細胞スポンジ)による食道採取物、内視鏡/胃内視鏡/結腸内視鏡生検または擦過物、子宮頚管粘膜または擦過物である。
上記試料の多くは非侵襲的に得ることができ、それゆえ対象への大きなリスクまたは不快感を伴わずに定期的に採取できる。
したがって、一態様において本発明は、診断もしくは予知または疾患のモニタリングのインビトロ方法における、先に記載された方法を提供する。
方法を利用して、DNA試料を、易罹患性、所与の治療への耐性または応答に関連する、またはそれを予測する遺伝的多様性に関して分析できる。
したがって、別の態様において本発明は、疾患を発症する確率の高い(即ち、疾患への易罹患性が高い)対象を同定する方法であって、対象からDNA含有試料を得ること、および対象から得られたDNA含有試料で本発明の第一の態様による方法を実施すること、を含む、方法を提供する。幾つかの例において、本発明のこの態様によれば、DNA含有試料は疾患関連の遺伝的多様体を含むと決定され、それにより疾患を発症する確率の高い対象(DNA含有試料中で検出される疾患関連の遺伝的多様体を有さない対象と比較して)を同定する。
別の態様において、本発明は、対象からDNA含有試料を得ること、および対象から得られたDNA含有試料で本発明の第一の態様による方法を実施すること、を含む、診断の方法を提供する。幾つかの例において、本発明のこの態様によれば、DNA含有試料は、疾患関連の遺伝的多様体を含むと決定される。
特定の易罹患性、所与の治療への耐性または応答を有し得る対象または複数の対象が、そのような易罹患性、耐性または応答を予測する遺伝的多様性について分析され得る。したがって、一態様において本発明は、易罹患性、治療への耐性または応答を予測する遺伝的多様性を同定する方法における先に記載された方法を提供する。
したがって本発明は、治療のための患者を選択する方法であって、患者からDNA含有試料を得ること、および患者から得られたDNA含有試料で本発明の第一の態様による方法を実施すること、を含む、方法を提供する。幾つかの例において、本発明のこの態様によれば、DNA含有試料は、疾患関連の遺伝的多様体(例えば、リスクアレル)および/または治療への耐性もしくは応答を予測する遺伝的多様体を含むと決定される。この方法は、患者からのDNA含有試料が遺伝的多様体を含むという決定に基づいて、治療のための患者を選択することをさらに含み得る。幾つかの例において、この方法は、患者からのDNA含有試料が遺伝的多様体を含むという決定に基づいて、治療薬を投与するステップおよび/または治療薬の投与を推奨するステップをさらに含み得る。
本発明の方法はまた、疾患への易罹患性もしくは疾患の予後の、または治療への耐性もしくは応答の新規な(即ち、過去に同定されていない)決定子および/または予測子を同定するために用いることができる。
したがって、別の態様において本発明は、疾患を有する患者または複数の患者からDNA含有試料を得ること、および患者または複数の患者から得られたDNA含有試料で本発明の第一の態様による方法を実施すること、を含む、疾患関連の遺伝的多様体を同定する方法を提供する。幾つかの例において、本発明のこの態様によれば、DNA含有試料または複数のDNA含有試料は、遺伝的多様体を含むと決定され、それにより遺伝的多様体が、疾患関連の遺伝的多様体であると同定される。この態様によれば、幾つかの実施形態において患者または複数の患者は、特定の臨床表現型および/または疾患予後を有し得る。したがって、幾つかの実施形態においてこの方法は、特定の臨床表現型および/または疾患予後の決定子または予測子を同定する。
別の態様において、本発明は、疾患の治療への耐性または応答を有する患者または複数の患者からDNA含有試料を得ること、および患者または複数の患者から得られたDNA含有試料で本発明の第一の態様による方法を実施すること、を含む、治療への耐性または応答に関連する遺伝的多様体を同定する方法を提供する。幾つかの例において、本発明のこの態様によれば、DNA含有試料または複数のDNA含有試料は、遺伝的多様体を含むと決定され、それにより遺伝的多様体が、治療への耐性または応答に関連する遺伝的多様体であると同定される。
別の態様において、本発明は、治療への応答をモニタリングまたは評価する方法であって、本発明の第一の態様による方法が、治療の異なる段階で(例えば、介入前および介入時/介入後)患者から得られたDNA試料で実施される、方法を提供する。異なる時間に得られた試料中の遺伝的多様性の比較は、治療への応答の変化を明らかにし得る。例えば、治療時または治療後に得られた試料に存在し、治療前に得られた試料に存在しない遺伝的多様体、または遺伝的多様体の相対頻度は、例えば腫瘍の進展および/もしくは腫瘍量、または治療への他の生物学的応答を反映し得る。
別の態様において、遺伝的多様体の頻度、または異なる多様体の頻度の比率を利用して、治療への応答を予測、モニタリング、または評価できる。別の態様において、遺伝的多様体の存在もしくは頻度、または異なる多様体の頻度の比率を利用して、患者が処置されない場合、または患者が一連の治療の1つを与えられた場合の、患者のリスクレベルまたは予後を予測できる。
アンプリコンシーケンシング工程のバックグランドノイズ値の分布を示すグラフ。アンプリコンシーケンシングパネルで観察された異なる一ヌクレオチド多様体に関する(A)平均、および(B)変動係数(CV、平均で割られた標準偏差として定義)。 複数の塩基置換についての累積分布を示すグラフであり、その累積分布関数は、データの経験的分布に対して比較した、それらの塩基置換について計算された平均およびCVの値を利用して適合させた、正規分布およびベータ分布に関する。(A)EGFR_D0016_006_R 55248959 C>G。(b)EGFR_D0016_009_F 55249159 G>T。(C)EGFR_D0016_003_R 55241757 C>A。(D)EGFR_D0016_012_R 55259573 G>C。 CDF_threshの異なる値に関する最小検出可能頻度(MDF)の累積値を示すグラフ。(B)は、(A)の拡大図。垂直線は、97.5パーセンタイルのポイントを示し、ここでの可能な塩基置換の97.5%は、より低いMDF値を有する。CDF_thresh=0.9999の場合、97.5パーセンタイルは、水平線によって示されたアレル頻度(AF)=0.0382にある。 表2、表3に、細胞株の希釈系列におけるこの方法の主たる適用例を立証した結果を示す。 複数の反応での複合突然変異検出の確率を示すグラフであり、予測された分子数の関数として(材料の濃度および出発量に基づく)試料中で少なくともN個の分子を見出すポアソン確率を示しており、異なる線は複合コールがN以上の陽性反応でなされるように、異なるNを示す。 例示的なライブラリー調製方策の概要。TAm−Seqプライマーは、複数の異なるバーコードを含んで作製される。各バーコードの組み合わせは、別のPCRウェルに分配される。A)最初のPCRで目的の領域を増幅して、その反応物を、同じターゲット特異性プライマーであるが異なるバーコードを有する他の反復増幅反応物から同定する、分子識別子標識(バーコード)を付加する。B)1つの試料からのPCR産物の全てをプールして、二回目のPCRでシーケンサー特異性アダプターおよび試料特異性バーコードを結合させる。 ターゲット特異性プライマーバーコードの組み合わせの代表例。各ターゲット特異性プライマーは、7つの異なるバーコードを含んで7回合成された。その後、7つのフォワードプライマーのそれぞれを7つのリバースプライマーのそれぞれと共に混合することにより、フォワードおよびリバースプライマーを組み合わせて、49の異なるウェルのバーコード組を作製した。 コールの確率と反応物あたりの平均分子数との関連を示すグラフ。異なる値のMDF(図の凡例に示される)について、AF>MDFの確率が、テンプレート希釈に基づく反応物あたりの平均分子数の関数としてプロットされている。水平線は、確率=0.90を示す。MDF=0.0382の場合、AF>MDFの確率0.90は、外挿されたN=20.59(垂直線によって示される)で得られる。 3種の細胞株からのDNAの希釈系列でこの方法を実施することによる、同定された突然変異(真陽性(TP))、偽陽性コール(FP)、および見落とされた突然変異(偽陰性(FN))を示すプロット。(A)Nが2以上のベータ分布でCDFカットオフ=0.9999。(B)Nが3以上のベータ分布でCDFカットオフ=0.9999。 AF予測値とAF測定値の一致を示すプロット。偽陰性は、垂直軸の「検出されず(ND)」として示されている。予測値は、バツで示され、見やすいように点線で結ばれている。
発明の詳細な説明
本発明の方法は、DNA試料を反復測定物に分配し、その中で所与の多様体が存在するならば全DNA試料中よりも高い頻度であり、複数のウェル/反応物中の突然変異の検出と組み合わされ、それにより配列決定に用いられる方法、即ちシーケンシングプラットフォームに本質的に備わる誤り率よりも多く多様体を「コール」させることを利用する。
シーケンサーおよびポリメラーゼの誤り率は、当業者に周知の様々な方法で決定され得る(Tindall, K.R., Kunkel, T.A. Biochemistry 1988 27(16): 6008−13; Forshew, T. et al. Sci. Transl. Med. 2012 4(136):136ra68)。これらの多くは発表されており、そして/または製造業者から入手可能である。その後、誤り率を利用して、遺伝的多様体がバックグランドノイズにより観察される予測頻度を決定できる。
方法の誤差は、NGS法の場合には、例えばライブラリーの調製の際にも導入され得る。
誤差は多くの場合、シーケンシングされる分子中の塩基の位置に応じて異なる(例えば、Loman NJ et al., Nature Biotechnology 30: 434−439, 2012; Forshew, T. et al. Sci. Transl. Med. 2012 4(136):136ra68参照)。これに取り組むための一方法は、配列状況などのパラメータを利用してノイズをモデル化することによるが(Ross, MG et al., Genome Biology 2013 14:R51)、これは、各遺伝子座での各可能な変化についての正確な値を与えることができず、シーケンシングシステムまたは増幅工程の特性の経時的変化を説明できない。
特定の塩基での遺伝的多様体のバックグランド頻度は、参照DNA試料の目的の領域を複数回シーケンシングすることによって、経験的に決定することもできる。例えば、参照DNA試料は、健常対象の全血もしくは血漿から、または細胞株から得ることができる。参照試料の目的の領域を複数回シーケンシングした結果を利用して、その後、目的の領域のDNA配列の各位置での4つの可能な塩基(A、G、TおよびC)のそれぞれについてバックグランド頻度を確定できる。これにより、方法の誤差(即ち、用いられるDNAシーケンシングプラットフォームの誤り率)によって遺伝的多様体が同定される頻度を、目的の領域のDNA配列の各位置について決定できる。幾つかの実施形態において、参照DNA試料は、「マッチした正常な」試料であり得る。例えば、参照DNA試料は、健常対象からの同じ組織および/または試料のタイプから得ることができる。
本発明の方法の幾つかの実施形態において、遺伝的多様体の頻度の平均および分散は、目的の領域を含む特異的アンプリコンパネルについて決定される。
本明細書で用いられる「目的の領域」は、検討されるゲノムの一部分または複数の部分を意味する。それは、DNAの1つの配列またはDNAの複数の配列であり得る。目的の領域が複数の領域である場合、これらはゲノム全体に広がり得る。即ち、「目的の領域」は、検討されるDNAの複数の配列に、検討されないゲノムの部分が散在したものを包含する。幾つかの例において、目的の領域は、例えば検討される任意の臨床的問題に依存する。
例えば、幾つかの実施形態において、目的の領域は、疾患関連の遺伝的多様体または治療への応答に影響を及ぼす遺伝的多様体を含むことが知られている、または含む候補である、複数の領域であり得る。例えば、幾つかの実施形態において、目的の領域は、一連の癌関連遺伝子であり得る。
所与の位置にある所与のヌクレオチドの頻度(アレル頻度、AF)は、その位置のそのヌクレオチドの総決定数からその位置のそのヌクレオチドを同定する、その位置のリードの割合として決定される。
参照試料の各シーケンシング反応から決定された目的の領域の各位置にある各ヌクレオチドのAFをその後利用して、平均AF、およびAFの分散係数(CV)を計算し得る。AFのCVは、平均AFで割られたAFの標準偏差として計算される。
平均AFおよびAFのCVをその後用いて、所与の遺伝的多様体についてバックグランドノイズ(即ち、シーケンシング誤差)をモデル化できる。例えば、正規分布、ベータ分布、指数分布もしくはガンマ分布、または他の関数を用い、どのモデルがデータの経験的分布と最良適合するかに応じて、遺伝的多様体のバックグランドノイズをモデル化できる。同様に、突然変異体のリード数およびシーケンシング深度を、別個の関数でモデル化できる。
確率分布およびそれらをデータにモデル化する方法は、当業者に周知である。好ましくは複数の分布をAFデータにモデル化して、最良適合したモデルを、本発明の方法の次の段階でのモデルとして選択する。例えば、異なるモデルを、経験的データへの適合度のコルモゴロフ・スミルノフ値について解析できる。
以下の実施例では、ベータおよび正規確率分布が用いられている。
遺伝的多様体の存在を決定するための閾値
経験的に決定されたバックグランド誤差AFおよびCV値に適合させた確率分布、またはシーケンサーおよびポリメラーゼの誤り率、目的の領域ならびに遺伝的多様体に基づく予測されたバックグランド誤差に基づく確率分布をその後用いて、それ以上で反復増幅反応物のシーケンシング結果において遺伝的多様体が観察されてDNA試料に存在すると決定されるべき、閾値AF(本明細書では最小検出可能頻度(MDF)と称される)を確定し得る。
例えば、以下の実施例7において、20および30のzスコアでのAFが選択される。即ち、所与の反復増幅反応物中のDNA試料に存在すると決定される遺伝的多様体について、そのアレルの頻度は、その特定の多様体に関するバックグランド平均AFを超える20以上、または30以上の標準偏差でなければならなかった。
問題となる特定の遺伝的多様体、目的の領域、用いられるシーケンシングプラットフォームなどに応じて、様々なzスコアカットオフが、本発明の方法で有用である。例えばzスコア閾値は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、19、20、22、24、26、28、30、35、40、45、50、60、70、80、90および100のうちの1つから選択され得る。
確率分布を利用して、多様体が実際に反復増幅反応物中に存在する場合に、特定の遺伝的多様体を所与のAFで観察する累積確率を決定できる。これを次に利用して、反復増幅反応物の産物においてそれ以上で遺伝的多様体が観察されて、DNA試料に存在すると決定されるべき閾値頻度を確定する。
シーケンシングデータにおいてMDF以上の頻度で観察された推定突然変異がシーケンシング誤差の結果よりもむしろ「現実的」である確率は、非常に高い。そのような多様体はそれゆえ、高い信頼度で所与の増幅反応物中に存在すると決定され得る。
本発明の方法の幾つかの実施形態において、ステップ(ii)の閾値頻度は、遺伝的多様体のバックグランド頻度のベータ確率分布モデルを利用して決定される。この場合、目的の領域の各位置にある各可能な遺伝的多様体について、ステップ(i)で決定された遺伝的多様体のバックグランド平均頻度および頻度の分散を用いて、ベータ分布を定義する。所与の遺伝的多様体が観察されて反復増幅反応物中に存在すると決定されるべき閾値頻度は、その遺伝的多様体の累積分布関数(CDF)値が所定の閾値(CDF_thresh)に達する頻度である。幾つかの実施形態において、CDF_threshは、0.99、0.995、0.999、0.9999、0.99999またはそれを超える。
例えば、以下の実施例6において、特定の遺伝的多様体を所与のAFで観察する累積確率(ベータ分布に基づく)0.9999を、陽性判定についての閾値AF(即ち、MDF)として用いた。即ち、遺伝的多様体が存在しない場合に、反復増幅反応物でのシーケンシング結果において所与の遺伝的多様体を観察する確率は、0.01%以下である。幾つかの実施形態において、閾値頻度は、遺伝的多様体をその頻度(CDF_thresh)で観察する確率に関する累積分布関数が0.8、0.85、0.9、0.95、0.96、0.97、0.98、0.99、0.995、0.999、0.9995、0.9999、0.99995、0.99999、0.999995、0.999999またはそれを超える頻度であり、それは遺伝的多様体が存在しない増幅反応物のシーケンシング結果において遺伝的多様体が観察される確率20%、15%、10%、5%、4%、3%、2%、1%、0.5%、0.1%、0.05%、0.01%、0.005%、0.001%、0.0005%、0.0001%またはそれ未満に対応する。
幾つかの実施形態において、MDF値が複数の可能な遺伝的多様体で決定され、続いてそれを用いて目的の所与の領域および/または目的の一連の遺伝的多様体について全体的MDFを確定する。したがって幾つかの実施形態において、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応での遺伝的多様体の存在について陽性判定を割り付けることは、
(a)ステップ(i)で複数の遺伝的多様体について決定された平均頻度および頻度の分散に基づいて、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき複数の閾値頻度を確定して所与の増幅反応における遺伝的多様体の存在について陽性判定を割り付けること(即ち、MDFを複数の遺伝的多様体について確定すること)、および
(b)ステップ(a)に基づいて、それ以上で増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき全体的閾値頻度を確定してその増幅反応における遺伝的多様体の存在について陽性判定を割り付けること(即ち、全体的MDFを確定すること)、
を含み、それは、ステップ(a)で決定された複数の閾値頻度の少なくとも90%、95%、97.5%、または99%がこの値未満である閾値頻度である。
幾つかの実施形態において、全体的MDFは、そこで複数の遺伝的多様体について決定されたMDF値の80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、97.5%、98%、98.5%、99%もしくは99.5%またはそれを超える値が全体的MDFよりも小さい(即ち、全体的MDF未満)頻度である。幾つかの実施形態において、全体的MDFは、目的の領域全体に分布される複数の遺伝的多様体について確定されたMDF値に基づいて決定される。幾つかの実施形態において、複数の遺伝的多様体は、5、10、20、25、30またはそれを超える多様体であろう。
遺伝的多様体の存在を決定するための閾値は、(所与の反復増幅反応物における目的の領域のDNAテンプレートのコピー数と共に)、存在するならば所与の反復増幅反応物における遺伝的多様体の頻度がその遺伝的多様性のバックグランドレベルよりも有意に高くなるように選択される。こうして、所与の増幅反応物における遺伝的多様体の有無は、偽陽性判定の確率を最小限にして、信頼性を持って決定できる。
同様に、遺伝的多様体の存在を決定するための閾値は、偽陰性の判定数を最小限にするように選択される。
反応物あたりの多数の増幅可能なテンプレート分子
突然変異が同定され得る下限は、遺伝的多様体のバックグランド頻度(即ち、方法誤差により観察される頻度)により決定される。即ち、例えば誤った決定が5%の頻度でなされる方法では、それらの頻度が5%を実質的に超える場合に、実際の多様体が、誤りと区別され得るに過ぎない。
本発明の方法は、所与の反復増幅反応物における目的の領域の増幅可能なテンプレート分子の平均数に上限を設定することによって、この問題を克服している。
本発明の方法において、所与の反復増幅反応物における目的の領域の増幅可能なテンプレート分子の平均数(Mol_mean)は、以下の通り、遺伝的多様体の存在を決定するための閾値(MDF)を用いて決定される:
Mol_mean < 1/MDF。
したがって遺伝的多様体は、所与の反復増幅反応物中に存在する場合、所与の増幅反応において遺伝的多様体の存在を決定するための閾値頻度よりも大きな頻度で、その反復増幅反応物内で目的の領域の増幅可能なテンプレートコピーの平均総数以内で表される(分率として)と予測されよう。
こうして、多様体を有する単一分子は、ステップ(ii)において決定されるMDF以上の頻度で検出される確率が高い。
この場合、MDFは、所与の遺伝的多様体について計算されたMDF、または複数のMDFを代表する包括的値であり本明細書の先に記載されている全体的MDFであり得る。
例えば、所与の遺伝的多様体が、例えば5%以上の頻度で観察された場合に(MDFによって定義された通り)DNA試料中に存在していると信頼性をもって決定され得るのにすぎないならば、その方法は、平均で20未満の分子が所与の反復増幅反応物中に存在することを必要とする。こうして、遺伝的多様体が存在する(そして最大19の非多様体分子が存在する)任意の所与の反復測定物では、多様体は、5%以上の頻度で観察されるであろう。
以下に提供された実施例において、反復増幅反応物への分子の分布が、ポアソン分布でモデル化されている。所与の増幅反応において遺伝的多様体を有する増幅可能な分子についての陽性判定の確率は、ポアソン分布に基づいて決定され得る。あるいは反復増幅反応物への分子の分布は、負の二項分布でモデル化され得る。
したがって、幾つかの実施形態において、Mol_meanは、ポアソン分布を用いて決定され、所与の反復増幅反応物中に存在する増幅可能な分子の数および増幅可能な分子の予測される平均数をモデル化する。Mol_meanの異なる可能な値について、ポアソン分布の累積分布関数が計算される。ポアソン分布での累積分布関数値が0.8、0.85、0.9、0.95または0.99などの閾値よりも大きくなるように、Mol_meanがその後選択される。
本発明の方法の幾つかの実施形態において、反応物あたりの増幅可能なテンプレート分子の平均数が反応物における分子の予測されるポアソン分布に基づくように、DNA試料が分配され、遺伝的多様体がもし存在するならば、90%を超える確率で検出される。この閾値は、より高くてもより低くてもよく、反応物あたりの平均分子数が1に減少すると、定常に達する(例えば図8参照)。幾つかの実施形態において、遺伝的多様体が存在するならば、80%を超える、81%を超える、82%を超える、83%を超える、84%を超える、85%を超える、86%を超える、87%を超える、88%を超える、89%を超える、90%を超える、91%を超える、92%を超える、93%を超える、94%を超える、95%を超える、96%を超える、97%を超える、98%を超えるおよび99%を超える確率のうちの1つで検出されるように、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数が選択される。
時間および資源の効率および費用効果的使用という関心事については、DNA試料は、テンプレート分子の分配に関連する方法の効率を実現するのに必要な量よりも多く分配されないことが好ましい。このことは、少なくともランニングコストおよび材料費を低減することに関して利点を有する。もちろん増幅反応物あたりの最小分子数は、決定される遺伝的多様体、目的の領域、方法の誤差(即ち、DNAシーケンシングプラットフォームの誤り率)および計算された閾値などに依存するであろう。本発明の方法の特定の実施形態において、目的の領域において1つよりも多くの増幅可能なテンプレート分子が反復増幅反応物あたりに提供されることが、好ましい。
例えば、幾つかの実施形態において、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数は、1よりも多くMol_mean未満であろう。
幾つかの実施形態において、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数は、1よりも多く1000未満、1よりも多く750未満、1よりも多く500未満、1よりも多く250未満、1よりも多く200未満、1よりも多く150未満、1よりも多く100未満、1よりも多く80未満、1よりも多く60未満、1よりも多く50未満、1よりも多く40未満、1よりも多く35未満、1よりも多く30未満、1よりも多く29未満、1よりも多く28未満、1よりも多く27未満、1よりも多く26未満、1よりも多く25未満、1よりも多く24未満、1よりも多く23未満、1よりも多く22未満、1よりも多く21未満、1よりも多く20未満、1よりも多く19未満、1よりも多く18未満、1よりも多く17未満、1よりも多く16未満、1よりも多く15未満、1よりも多く14未満、1よりも多く13未満、1よりも多く12未満、1よりも多く11未満、1よりも多く10未満、1よりも多く9未満、1よりも多く8未満、1よりも多く7未満、1よりも多く6未満、1よりも多く5未満、1よりも多く4未満、1よりも多く3未満、または1よりも多く2未満である。
幾つかの実施形態において、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数は、2よりも多く1000未満、2よりも多く100未満、2よりも多く75未満、2よりも多く50未満、2よりも多く40未満、2よりも多く30未満、2よりも多く29未満、2よりも多く28未満、2よりも多く27未満、2よりも多く26未満、2よりも多く25未満、2よりも多く24未満、2よりも多く23未満、2よりも多く22未満、2よりも多く21未満、2よりも多く20未満、2よりも多く19未満、2よりも多く18未満、2よりも多く17未満、2よりも多く16未満、2よりも多く15未満、2よりも多く14未満、2よりも多く13未満、2よりも多く12未満、2よりも多く11未満、2よりも多く10未満、2よりも多く9未満、2よりも多く8未満、2よりも多く7未満、2よりも多く6未満、2よりも多く5未満、2よりも多く4未満、または2よりも多く3未満である。
幾つかの実施形態において、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数は、5よりも多く1000未満、5よりも多く100未満、5よりも多く75未満、5よりも多く50未満、5よりも多く40未満、5よりも多く30未満、5よりも多く29未満、5よりも多く28未満、5よりも多く27未満、5よりも多く26未満、5よりも多く25未満、5よりも多く24未満、5よりも多く23未満、5よりも多く22未満、5よりも多く21未満、5よりも多く20未満、5よりも多く19未満、5よりも多く18未満、5よりも多く17未満、5よりも多く16未満、5よりも多く15未満、5よりも多く14未満、5よりも多く13未満、5よりも多く12未満、5よりも多く11未満、5よりも多く10未満、5よりも多く9未満、5よりも多く8未満、5よりも多く7未満、または5よりも多く6未満である。
幾つかの実施形態において、反復増幅反応物あたりの増幅可能なテンプレート分子の平均数は、2〜40、3〜30、4〜30、5〜30、5〜25、10〜25、15〜25、または18〜22の範囲である。
「分配」は、反復増幅反応物を分離するのに適した任意の手段により実現され得る。例えば、分配は、(希釈された)DNA試料を別々のウェル中に分取することにより実現され得る。別々の(即ち、分離した、個々のまたは独立した)反復増幅反応物に区分するための様々な他の方法が、当業者に公知であろう。
陽性判定のために複数の陽性反復測定を必要とすること
DNA試料中の遺伝的多様体の存在の偽陽性判定の確率を最小限にするために、本発明の方法は、遺伝的多様体が1つよりも多くの反復測定物中に存在すると決定されることを必要とする。
反応物あたりの平均分子数、および偽陽性のコールを最小限にするのに必要とされる反復測定コール数が、必要とされる感度を得るために実行される反応物数を決定する。
全ての反応物数TのうちNの反応物中で起こる偽陽性の理論的確率(P_fpNT)は、1つの反応物中の偽陽性の確率(P_fp1T、1−CDF_threshに等しい)および反応物の数に依存し、
P_fpNT=((P_fp1T)^N)C_NT=((1−CDF_thresh)^N)C_NT
に等しく、ここで、C_NTは、以下の通り、反応物の総数Tに依存する組み合わせの係数である(「!」は、階乗関数を示す)
C_NT=T!/((T−N)!N!)
この工程から予測される偽陽性の総数は、この工程で検査される多様体数を掛けた、偽陽性の確率(P_fpNT)に等しい。例えば、一ヌクレオチド多様体が検査される場合、これは、3をかけた位置の数になろう(3つの可能な非参照変化の場合)。
複数の反復増幅反応物中の遺伝的多様体で陽性判定を必要とすることで、DNA試料中に存在する遺伝的多様体の偽陽性判定の確率が低下する。これは、以下の実験的実施例から明確である。
反復増幅反応物中で複数の陽性判定を必要とする方法はしたがって、遺伝的多様体の検出のより高い特異度を有する。
しかし、所与の遺伝的多様体について陽性である複数の反復測定物を必要とすることはまた、偽陰性判定がなされる確率を増加させる。図5は、少なくともN個のDNAテンプレート分子が予測された分子数の関数として(材料の濃度および出発量に基づき)DNA試料中に存在する、ポアソン確率を示す。
突然変異体分子の無作為な分布を前提とすれば、少なくとも必要とされる数の反復測定物が1つの突然変異を含む確率が十分に高くなるように、反応物の数、およびこれらの反応物中の多様体分子の数は、十分に高くなければならない。
それゆえ、ステップ(vi)において遺伝的多様体がDNA試料中に存在すると決定されるのに必要とされる陽性反復測定物の数は、偽陽性および偽陰性を最小限にするように選択される。即ち、必要とされる陽性反復測定物の数は、この方法の所望の感度および特異度を実現するように決定されるであろう。幾つかの実施形態において、陽性反復測定物の数は、この方法の感度および特異度を最大にする数であろう。
その数は常に、1を超えるであろう。幾つかの実施形態において、その数は、2、3、4、5、6、7、8、9、または10の反復測定物であろう。特定の実施形態において、その数は、2または3であろう。
その数は、分析される領域の数およびサイズ、利用可能なDNAの量、反復増幅反応物の総数などに応じて変動し得る。
その数はまた、参照ヌクレオチドからの多様性の特定のタイプに基づいて、例えば多様体が参照アレルからの転位であるか、または転換であるかに基づいて変動し得る
必要とされる陽性反復測定物の数は、DNA試料についての反復増幅反応物の総数によって一部は決定され得る。例えば幾つかの実施形態において、ステップ(vi)において遺伝的多様体がDNA試料に存在すると決定される場合、多様体の存在についての陽性判定が、反復測定物の1%、2%、3%、4%、5%、6%、7%、8%、9%または10%よりも多くなされなければならない。
所与の多様体および/または目的の領域について必要とされる陽性反復測定物の最適数は(偽陽性および偽陰性を最小限にするため)、例えば参照DNA試料で本発明の方法を実施することによって、決定され得る。
本発明の方法は、DNA試料中の目的の領域における遺伝的多様体の有無の最終決定のために、反復増幅反応物についての有無決定の結果の統合を必要とする。
本明細書で用いられる「統合する」は、反復増幅反応物についての有無の結果をまとめること、または合併整理することを意味する。
多様体コーリングの閾値と、増幅可能なテンプレートDNA分子の数と 反復増幅反応物の数との関連
先に、そして以下の実験的実施例に記載された通り、反復増幅反応物中の遺伝的多様体の存在を決定するための閾値AFと、所与の反復増幅反応物中に存在する増幅可能なテンプレートDNA分子の数と、遺伝的多様体がDNA試料中に存在すると決定されるために「陽性」であることが必要とされる反復測定物の数と、が相互に関連することは、当業者に直ちに明白であろう。
本質的に、主要な原理は、所与の反復増幅反応物中に遺伝的多様体が存在する場合、その頻度がその遺伝的多様体のバックグランドレベルよりも有意に高くなるように、目的の領域の遺伝的多様体の存在およびDNAテンプレートのコピー数を決定するための閾値が選択されなければならないこと、ならびに陽性である反復測定物の数がこの方法の感度および特異度を最適にするように選択されなければならないこと、である。
こうして、所与の増幅反応物中の遺伝的多様体の有無は、偽陽性判定の確率を最小限に抑えて、信頼性をもって決定できる。
これらのパラメータを確定する上での感度および特異度の相対的重要性は、個々の研究にも依存する。例えば、本発明の方法が新規な突然変異を同定するのに用いられている場合、主要な判断事項は、感度であり得る。逆に、DNA試料が治療決定の情報を与えるために多様体の存在について分析されている場合、主要な判断事項は、特異度であり得る。
標識されたアンプリコンのディープシーケンシング
本発明の方法は、ハイスループットDNAシーケンシング法での使用に適する。有利には、目的の複数の領域が、突然変異について並行してスクリーニングされ得る。
以下の実験的実施例において、標識されたアンプリコンのディープシーケンシング(TAm−Seq)法が用いられる。この方法は、Forshew et al. 2012 Sci Transl Med 4(136) 136ra68に詳細に記載される。TAm−Seqは、DNA断片の個々のコピーという小さなものから数千の塩基にわたるゲノム配列の増幅およびディープシーケンシングを可能にする。
手短に述べると、プライマーは、テンプレートDNAの性質(例えば、平均断片長)に基づいて選択されたサイズ範囲の断片で目的の領域を並べて表示するアンプリコンを作製するよう設計され、汎用シーケンシングアダプター配列を組み込み各反復測定物を識別子配列または「バーコード」で標識する(図6および7参照)。その後、産物をシーケンシングして、識別子配列を用いてリードをデマルチプレックスして、それらをゲノムに割り付ける。
本発明の方法の使用
この方法は、広範囲の適用例に有用であり、その適用例は、熟練者に直ちに明白となろう。本質的にこの方法は、目的の任意の試料における任意の遺伝的多様体の検出に有用である。
例えば本発明の方法は、診断および/もしくは予知方法、または微生物もしくはウイルス分析において有用である。
特に、この方法は、希少な遺伝的多様体および/または希少な突然変異の検出に有用である。この方法は、DNA試料において1%未満の頻度で存在する多様体の検出を可能にする。さらに方法は、そのような低頻度での新規多様体を検出すること、および試料を既知の多様体について分析すること、に適している。
したがって、この方法は、癌であるまたは妊娠時などの体内に出現し得る遺伝的多様体の存在のより早期の同定を可能にする(即ち、遺伝的多様体が低頻度で存在する場合)。
本発明の任意の態様の方法による幾つかの例において、この方法は、対象から過去に得られた試料をアッセイすることを含む。試料は一般に、DNAが単離され得る任意の適切な生物学的試料であり得る。幾つかの例において、試料は、尿、唾液、血液、血清、糞便、他の生物学的流体、毛髪、細胞および組織からなる群から選択される。
本発明の任意の態様の方法による幾つかの例において、DNAは、この方法を実施する前にビスルファイトで処置され得る。DNAのビスルファイト処置は、非メチル化シトシン残基をウラシルに変換するが、メチル化シトシン残基は影響を受けないままである。こうしてこの方法は、DNAメチル化において多様体を検出するのに有用である。
低頻度の多様体の存在を検出する方法の能力は、非侵襲的な、そして/または最小限に侵襲的な手段によって得られる試料の分析を可能にする。例えば血液、血清、尿、精液、糞便、痰、胸水、腹水、滑液、脳脊髄液または気管支洗浄液の試料などの液体生検。これは、対象への大きなリスクまたは不快感を伴わずに試料を定期的に採取し得るという利点を有する。試料は、新鮮であっても、過去に貯蔵されていても(例えば、凍結)、そして/または過去に加工されていてもよい。
その上、この方法は、定量的であり、例えば臨床的相関のための循環する腫瘍DNA(ctDNA)の突然変異レベルの正確な測定、またはウイルスもしくは微生物DNAなどの他のDNAの正確な測定を可能にする。
定量は、例えば多様体を有すると決定された分子の数をカウントすることによって、実施され得る。これは、多様体を有する分子の数が少ない場合に適する。定量はまた、カウントのポアソン補正によって、または観察されたアレル頻度をモデル化することによって実施され得る。定量はまた、複数の反応物それぞれの中の遺伝的多様体のアレル頻度、および各反応物中の相対的テンプレート量を考慮することによって、例えば平均もしくは材料の量を加重された平均を利用することによって、または異なる量の出発原料に関して多様体が検出される反応物の比率を考慮することによって、実施され得る。
例えばこの方法は、腫瘍量モニタリングに有用であり、その場合、この方法は、ctDNA突然変異のレベルをモニタリングするため、または突然変異の再出現をモニタリングするため、腫瘍の再成長の早期指示物質として情報を与えるために用いられる。この方法は、明らかに診断的および予知的用途を有する。
この方法はまた、治療への応答において、薬物耐性および/または腫瘍進展をモニタリングするのに有用である。この方法は、多数の目的の領域を並行して評価するのに特によく適しており、薬物耐性の早期指示物質であり得る可能な耐性経路での突然変異を検出するのに用いることができる。そのような用途は、過去の方法の能力を上回る可能性がある。
さらにこの方法は、腫瘍の一次診断において有用である。この方法を利用して、早期診断のために健常患者でctDNA突然変異を探索できる。例えば、重要な発癌遺伝子および腫瘍抑制遺伝子を、モニタリングできる。
この方法はまた、遺伝的多様体の日常的スクリーニングまたはテスト(即ち、モニタリング)のために、健常対象から得られた試料でも有用である。幾つかの実施形態において、健常対象は疾患から回復していてもよく、例えば対象は癌が鎮静中であってもよい。あるいは健常対象は疾患のリスクが増大していてもよく、例えば健常対象は疾患の家族歴を有していてもよい。本発明の方法を利用して、遺伝的多様体について、場合により所与の疾患に関連することが知られる遺伝的多様体について、日常的にスクリーニングし得る。こうして、健常対象から得られた試料を用いて、臨床症状発現の前に疾患関連の遺伝的多様体を検出し、それにより早期治療介入を容易にすることができる。
本発明の方法は、治療決定の情報を与えるのに有用である。即ち、易罹患性、治療への耐性または応答を予測する遺伝的多様体の同定を利用して、対象に関する適切な処置過程を選択できる。
例として、EGFRにおけるT790M突然変異は、EFGR阻害剤ゲフィチニブおよびエルロチニブを用いる癌処置への耐性に関連することが公知である。それゆえ、この突然変異が本発明の方法を用いて同定される対象は、これらの阻害剤を用いる処置の不適当な候補であると同定され得る。
同様に、B−RafにおけるV600E突然変異は、B−Raf阻害剤への感受性増大に関連する。それゆえ、この突然変異が本発明の方法を用いて同定される対象は、これらの阻害剤を用いる処置の良好な候補であると同定され得る。
この方法は、異なる時点に、例えば異なる疾患段階または処置過程に、対象から得られたDNA試料で実施できる。
この方法を利用して、易罹患性、進行(即ち、予後)、所与の治療への耐性または応答に関連する、またはそれを予測する遺伝的多様体について、DNA試料を分析できる。例えば、この方法を用いて、疾患の易罹患性もしくは予後、または治療への耐性もしくは応答の新規な(即ち、過去に同定されていない)決定子および/または予測子を同定できる。
本発明の方法は、定量的であるため、疾患の異なる段階で処置への応答において、そして/または経時的に健常対象で、遺伝的多様体の相対頻度を検査するのに有用である。
この情報は今度は、治療決定についての情報を与えるために用いることができる。例えば、易罹患性または特定の治療への耐性に関連することが既知である、そして/または予測される遺伝的多様体の頻度における上昇または低下は、どの治療が所与の対象の処置に最も適するかについての決定を誘導するであろう。
実施例
実施例1 − バックグランドノイズの決定
TP53ならびにEGFR、KRAS、BRAFおよびPIK3CAのホットスポット領域の全てに及ぶように41のアンプリコンを設計して、前方および後方に読んで、合計82のリードファミリーを与えた(表1)。アンプリコンは、前方および後方のリードの重複を含む(プライマー配列を除く)5,038の塩基に及ぶ。
Figure 2017521078
Figure 2017521078
Figure 2017521078
各遺伝子座は、3つの可能な非参照アレルのうちの1つに変化し得る。既知の多形、用いられた細胞株中で同定された多型、およびモデル化され得ない遺伝子座を除く、合計13,278の可能な一塩基置換が考慮された。このアンプリコンのパネルについてのシーケンシングデータを、LNCaP細胞株(ヒト前立腺腺癌、アンドロゲン感受性細胞株;ATCC CRL−1740)DNA試料の336の反復増幅物から回収した。
先に除外された遺伝子座以外の各リードファミリーにおける各塩基置換(アンプリコンおよびリードの方向)について、平均アレル頻度(AF)およびAFの変動係数(CV)を計算した。所与のアレル(即ち、遺伝的多様体)について、AFを、そのリードファミリーの全リードのうちのこのアレルを含むリードの割合として計算した。
図1Aは、増加するAF値によってビン化された平均AFの異なる値の出現数を示す。垂直線は、平均=0.00022を示し、それは分布の95%パーセンタイルである。
図1Bは、増加するCV値によってビン化されたCVの異なる値の出現数を示す。垂直線は、CV=18.16を示し、それは分布の95%パーセンタイルである。
実施例2 − 所与の反応における塩基置換について陽性コールに必要なAFの決定
観察されたAFがそのアレルの最小検出可能頻度(MDF)よりも大きいと見出された場合、反応を所与の配列変化について陽性と定義した。アレルについてのMDFを、その特定の塩基置換の累積分布関数(CDF)が所定の閾値(CDF_thresh)を交差するAFとして計算した。
図2は、実施例1のパネルの複数の塩基置換に関する累積分布を示す。経験的データ分布と比較した、それらの塩基置換について計算された平均AFおよびCVの値を利用して適合させた、正規分布およびベータ分布の累積分布関数が示される。経験的データ分布に対する正規分布(KS Normal)およびベータ分布(KS Beta)についての適合度のコルモゴロフ・スミルノフ値は、以下の通りである。
Figure 2017521078
記載された工程を利用して、複数の試料中の13,278の可能な一塩基置換をスキャンした。偽陽性を低い割合で維持するために、AF>MDFとなるAFおよびCDF_thresh=0.9999で突然変異が存在する場合には、突然変異をコールした。
バックグランドノイズをベータ分布としてモデル化し、13,278の可能な塩基置換それぞれで、対照試料における塩基置換で測定された平均AFおよびCVを条件に(図1)、
F(AF|Mean,CV)=CDF_thresh
(式中、「F」は、ベータ分布のCDFである)
でのAFである、MDF(CDF_thresh)を計算した。図3は、異なる値のCDF_thresh(凡例に示された)についてのMDF(CDF_thresh)を示す。各例のデータは、得られたMDFの値によって区分されている。
図3Bは、拡大図を示す。垂直線は、可能な塩基置換の97.5%がより低いAF値を有する97.5パーセンタイルポイントを示す。CDF_thresh=0.9999の場合、97.5パーセンタイルは、水平線で示されたAF=0.0382の位置である。
したがって、13,278の可能な一塩基置換の場合、CDF_thresh=0.9999でのMDFは、可能な一塩基置換の97.5%について0.0382以下となろう(図3参照)。
各反応における所与の塩基置換についての偽陽性判定の確率は、このモデルによれば、1−CDF_thresh(AF=MDFの時のCDFの値)である:
P_fp1T=1−F(AF=MDF|Mean,CV)=1−CDF_thresh
実施例3 − 試料中の塩基置換の存在を決定するための所与の塩基置換について陽性である反復増幅反応物の数の決定
試料中の塩基置換の存在についての偽陽性判定を最小限にするために、その試料の反復増幅反応物の総数(T)のうち、複数の陽性反復増幅反応物(N)が必要とされた。
Tの反応物のうちNに出現する偽陽性の理論的確率(P_fpNT)は、
P_fpNT=(P_fp1T)^N)C_NT=((1−CDF_thresh)^N)C_NT
であり、ここで「C_NT」は、順序には関係なくTのうちNのウェルを選択する可能性の数であり、
C_NT=T!/((T−N)!N!)
である(ここで、「!」は、階乗関数を示す)。
例えば、48のうちの3の反応物を選択する場合、17,296の可能性が存在する。48のうち2の反応を選択する場合、1,128の可能性が存在する。予測された偽陽性率を各試料について計算し、表2および3に示している(図4)。
複数の陽性反応を観察する必要性は、偽陰性の確率も上昇させ、真陽性が複数の反応物中で観察される確率を低下させる。
図5は、予測される分子数(材料の濃度および出発量に基づく)の関数としての試料中の少なくともNの分子数を見出すポアソン確率を示す。複合コールがN以上の陽性反応物でなされるように、異なる線が異なるNを示す。
(i)各試料の反復増幅反応物の総数(T)が、Nよりもかなり多くなるように(この場合、T≧48)、そして
(ii)突然変異体分子が存在した場合に、任意の反応物においてコールの確率が1に近似するように、
システムを設計した。
実施例4 − 各増幅反応物に存在する増幅可能な分子の数の決定
予定される希釈率および反応物あたりの対応する平均分子数では、実際の反応物は、ポアソン分布でモデル化され得る無作為な分子数を有すると予測される。
それぞれのそのようなプール中の単一突然変異分子によって、分子の数の逆数と等しい観察AFが得られるであろう(リード分率が、突然変異体アレル頻度の代表であると仮定、Forshew et al. 2012 Sci Transl Med 4(136) 136ra68, Figure 3b参照)。
異なる値のMDFについて(図の凡例に示される)、AF>MDFの確率を、テンプレート希釈に基づいて、反応物あたりの平均分子数の関数としてプロットした(図8)。
水平線は、確率=0.90を示す。MDF=0.0382(塩基置換の97.5%がCDF_thresh=0.9999を通過する、図3参照)では、AF>MDFである確率0.90が、外挿されたN=20.59(垂直線で示される)で得られる。
各増幅反応物が予測された20の増幅可能なテンプレート分子を有し、それにより増幅可能な突然変異体分子の存在を有する各反応物では、突然変異体AF>0.0382を有する確率が0.9を超えるように、DNA試料の希釈率が選択された。
試料中でN以上の分子を観察するポアソン確率は、N以上の反応物中でバックグランド率を超える突然変異体配列の同定に基づく複合コールの確率とほぼ等しかった。偽陰性の近似的確率を各試料で計算し、表2および3に示している(図4参照)。
実施例5 − 基本実験を証明するためのPCRプライマーおよび設計
41のプライマー対を、41のアンプリコンのパネルについて設計した。各プライマーを、5’末端での標識配列と、中央での7つの異なるバーコード配列の1つと、を有して作製した(図6)。標的特異性プライマーを、2つの最適化されたマルチプレックスPCRプールに分割し、そのフォワードプライマーおよびリバースプライマーを、49の異なるバーコード組が作成されるようにプールした(図7)。Fluidigmプラットフォームを用いて48のプライマープールを異なるPCRウェルに分配して、これをハイスループットで実施した。
DNAをデジタル方式で定量して、平均20個の分子が各PCRに投入されるように、DNAを添加した。Fluidigm Access Arrayは、68.32%のデッドボリュームを有し、それはDNAを添加する場合に考慮された(デッドボリューム=33nl48/5μl)。
これにより、試料あたり約20個の分子の48の別個のプールの増幅が可能になった。低頻度アレイが予測された試料では、48ウェルの複数組で実施した。
この最初のPCRの回収に続き、2回目のPCRをその後実施して、シーケンサーアダプターおよび試料バーコードを結合させた。その後、ライブラリーを洗浄して、Illumina MiSeqおよびHiSeq2000の両シーケンサーでシーケンシングした。
実施例6 − 細胞株の希釈系列における原理証明
ヘテロ接合体突然変異が3〜0.04%のAFで存在すると予測された、細胞株DNAの希釈系列を作製した。NCI−H1975およびVCAP細胞株は、実施例5に記載されたプライマー/アンプリコンパネルを用いて検出可能であり、LNCaP細胞株には存在しない5つの既知の突然変異/SNPを有する(表4)。VCAP、NCI−H1975およびLNCaP DNAをデジタル方式で定量して標準化し、その後、LNCaPのDNA中に系列希釈した。
Figure 2017521078
異なる試料について異なる数の反応物を使用し、合計5種の異なる試料で、2種の細胞株の系列希釈物で、この方法を実施した(表2および3(図4)参照)。
2種の細胞株は、合計25の(フォワードおよびリバースを独立してコールする場合には50の)陽性について、含まれるゲノムの領域中の5つの一塩基多型によって、LNCaPと異なっていた。
バックグランド率をモデル化するために、目的の領域中の各位置での平均AFおよびCVを用いて、パラメータを推定し、各遺伝子座および各可能な塩基置換に特異的なベータ分布を適合させた。
先のモデルならびに表2および3(図4)の計算に基づき、CDF_thresh=0.9999および複数(N)の陽性反応物を必要とする複合コールを用いて、以下の結果を得た。
N≧2
全体的感度0.96、36の偽陽性複合コール。表2(図4A)は、異なる希釈率での感度を示す。
N≧3
全体的感度0.90、1の偽陽性複合コール。表3(図4B)は、異なる希釈率での感度を示す。
2種の細胞株からのDNAの希釈系列でこの方法を実施することによる、同定された突然変異(真陽性(TP))、偽陽性コール(FP)、および見落とされた突然変異(偽陰性(FN))を、表4および図9に示す。図9のデータポイントは、測定されたAFの増加の順に並べられ、予測AFを示すFN突然変異を除き、各突然変異に関する測定AFを示している。
図10は、CDF_thresh=0.9999およびN≧3を用いる複合突然変異コールに基づく予測AFと測定AFとの一致を示す。偽陰性は、垂直軸上の「検出されず」(ND)として示されている。予測値は、バツで示され、見やすいように点線で結ばれている。
実施例7 − 突然変異コーリングの別の方法による原理証明
この方法を、実施例6に記載された希釈系列で実施した。
VCAPおよびNCI−H1975のDNAを、表6に示される通り、LNCaPのDNA中に系列希釈した。
Figure 2017521078
最初の実験では、7(x48)LNCaP、1(x48)VCAP、1(x48)NCI−H1975、そしてその後1つまたは複数の希釈物をシーケンシングした(表6、「繰り返し数」)。
突然変異コーリング
336のLNCaP PCR反応を用いて、各塩基でのバックグランドAFを決定した。正規分布を利用して、目的の領域の全ての位置での非参照塩基から可能な全ての塩基についてバックグランドをモデル化した。
各反応物を、特定のzスコアおよび深度によってバックグランドと異なる各塩基での置換についてその後スクリーニングした。このスコアを超える特定回数が同定された塩基置換が、突然変異を有すると決定された。
結果
20のzスコアカットオフおよび3つの陽性ウェルを利用して、突然変異コーリングを最初に実施した。表7に、突然変異検出結果を示している。
突然変異/SNPの全てが、0.33%に至るまで検出された。0.33%希釈でスクリーニングされた推定1,920個の分子のうち(2試料×48ウェル×20個DNA分子)、4と12の間の陽性ウェル/分子が検出され、それはほぼ厳密に0.33%に相当した(表7、Dil0.33)。
0.11%希釈では、5つの置換のうち4つが検出された。2つのウェルのみが陽性であったため、1つは見落とされた(表7、Dil0.11)。最後に、0.037%希釈では、5つの突然変異のうち1つが完全に見落とされ、2つの重複アンプリコンうちの1つで、もう1つ(chr17:7577644 C>G)が見落とされた。これらの結果は、これらの突然変異体分子の無作為分布と適合する(表7、Dil0.037)。
2つの偽陽性反応は、早期のライブラリー増幅回中のポリメラーゼ誤差による可能性が最も高かった。そのような誤差は、典型的には通常の変化よりも低い頻度であるはずである。
zスコアカットオフを30に増加させることによって、実際の変化の全てが保持され、2つの偽陽性が排除された(表7)。
Figure 2017521078

Claims (30)

  1. DNA試料中の目的の領域中の遺伝的多様体を検出する方法であって、
    (i)所与のシーケンシングプラットフォーム、シーケンシング工程およびシーケンシング深度について、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果で観察されると予測される遺伝的多様体または複数の遺伝的多様体を裏づけるリード数の分布(リードカウント分布)を決定すること;
    (ii)ステップ(i)において決定された前記リードカウント分布に基づいて、それ以上で増幅反応物のシーケンシング結果において前記遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応物中の前記遺伝的多様体の存在について陽性判定を割り付けること;
    (iii)反復増幅反応物中の目的の領域の増幅可能なテンプレート分子の平均数がステップ(ii)において決定された前記閾値頻度の逆数よりも少なくなるように、前記DNA試料を複数の反復増幅反応物に分配すること;
    (iv)ステップ(iii)の前記増幅反応を実施することおよび増幅反応の産物をシーケンシングすること;
    (v)ステップ(ii)およびステップ(iv)の結果に基づいて、各反復増幅反応物中の前記遺伝的多様体の有無を決定すること;ならびに
    (vi)(v)の結果を統合して前記DNA試料中の目的の領域中の前記遺伝的多様体の有無を決定すること、
    を含む、方法。
  2. ステップ(vi)において前記遺伝的多様体が前記DNA試料中の目的の領域中に存在すると決定されるために、ステップ(v)において前記遺伝的多様体の存在について陽性判定が1つよりも多くの反復増幅反応物でなされなければならない、請求項1に記載の方法。
  3. ステップ(vi)において前記遺伝的多様体が前記DNA試料中の目的の領域中に存在すると決定されるために、ステップ(v)において前記遺伝的多様体の存在について陽性判定が少なくとも3つの反復増幅反応物でなされなければならない、請求項2に記載の方法。
  4. ステップ(ii)の前記閾値頻度が、その頻度で前記遺伝的多様体を観察する確率について前記累積分布関数値が0.99以上である頻度である、前記請求項のいずれか1項に記載の方法。
  5. その頻度で前記遺伝的多様体を観察する確率について前記累積分布関数値が、0.99、0.995、0.999、0.9999、0.99999またはそれを超える、請求項4に記載の方法。
  6. ステップ(ii)の前記閾値頻度が、二項分布、過分散二項分布、ベータ分布、正規分布、指数分布またはガンマ確率分布モデルを用いて決定される、前記請求項のいずれか1項に記載の方法。
  7. ステップ(ii)の前記閾値頻度が、zスコアが20である頻度である、前記請求項のいずれか1項に記載の方法。
  8. ステップ(ii)の前記閾値頻度が、zスコアが30である頻度である、請求項1〜6のいずれか1項に記載の方法。
  9. それ以上で増幅反応物のシーケンシング結果において前記遺伝的多様体が観察されるべき閾値頻度を確定して所与の増幅反応物中の前記遺伝的多様体の存在について陽性判定を割り付けることが、
    (a)ステップ(i)において複数の遺伝的多様体について決定されたリードカウント分布に基づいて、それ以上で増幅反応物のシーケンシング結果において前記遺伝的多様体が観察されるべき複数の閾値頻度を確定して所与の増幅反応物中の前記遺伝的多様体の存在について陽性判定を割り付けること、および
    (b)ステップ(a)に基づいて、それ以上で所与の増幅反応物のシーケンシング結果において遺伝的多様体が観察されるべき全体的閾値頻度を確定して前記増幅反応物中の前記遺伝的多様体の存在について陽性判定を割り付けることであって、前記全体的閾値頻度が、ステップ(a)において決定された閾値頻度の少なくとも90%、95%、97.5%、99%またはそれを超える閾値頻度がこの値未満である閾値頻度であること、
    を含む、前記請求項のいずれか1項に記載の方法。
  10. 反復増幅反応物中に存在する増幅可能なテンプレート分子の前記平均数が、反復増幅反応物の1つの増幅可能なテンプレート分子中に前記遺伝的多様体が存在する場合に、その反復測定物について陽性判定がなされる確率が0.9以上である数である、前記請求項のいずれか1項に記載の方法。
  11. ステップ(i)が、DNA試料を複数回シーケンシングして遺伝的多様体または複数の遺伝的多様体について前記リードカウント分布を決定することを含む、前記請求項のいずれか1項に記載の方法。
  12. 増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果において遺伝的多様体または複数の遺伝的多様体が観察されると予測される前記リードカウント分布が、場合により配列状況を考慮して、シーケンサーおよび/またはポリメラーゼの誤り率に基づいてステップ(i)において決定される、請求項1〜10のいずれか1項に記載の方法。
  13. ステップ(i)が、データベース、チャート、表、リスト、カタログ、インデックス、ディレクトリ、またはレジスタにおいて遺伝的多様体または複数の遺伝的多様体について前記リードカウント分布のための参照値または複数の参照値を「探索すること」を含む、請求項1〜10に記載の方法。
  14. 前記参照値または複数の参照値が、遺伝的多様体または複数の遺伝的多様体について前記リードカウント分布を決定するために、DNA試料を複数回シーケンシングすることにより決定された、請求項13に記載の方法。
  15. ステップ(iii)における前記DNA試料の分配に続いて、各反復増幅反応物が、反復増幅反応物あたり目的の領域について1より多い増幅可能なテンプレート分子を有する、前記請求項のいずれか1項に記載の方法。
  16. 反復増幅反応物あたりの増幅可能なテンプレート分子の平均数が、1より多く1000未満、2より多く1000未満、または5より多く1000未満である、請求項15に記載の方法。
  17. 2%未満の頻度でDNA試料の増幅可能なテンプレート分子の集団内に存在する遺伝的多様体を検出することが可能である、前記請求項のいずれか1項に記載の方法。
  18. 1%未満、0.5%未満、0.2%未満、0.1%未満または0.05%未満の頻度でDNA試料の増幅可能なテンプレート分子の集団内に存在する遺伝的多様体を検出することが可能である、請求項17に記載の方法。
  19. 前記DNA試料を複数の反復増幅反応物に分配することが、前記DNA試料を希釈することおよび反復増幅反応物に分取することを含む、前記請求項のいずれか1項に記載の方法。
  20. 反復増幅反応が、並行して実施され、かつ増幅反応の産物のシーケンシングが、並行して実施される、前記請求項のいずれか1項に記載の方法。
  21. 増幅反応が、目的の領域に隣接する1つまたは複数のプライマー対を使用して実施されて試料および/または増幅反応反復測定物の特異的識別子配列を増幅の産物中に組み込む、前記請求項のいずれか1項に記載の方法。
  22. 前記プライマーが、配列アダプターを増幅の産物中に組み込む、前記請求項のいずれか1項に記載の方法。
  23. 複数の目的の領域が、並行して分析される、前記請求項のいずれか1項に記載の方法。
  24. (vii)前記DNA試料中の前記遺伝的多様体の頻度を決定すること、
    をさらに含む、前記請求項のいずれか1項に記載の方法。
  25. 前記リードカウント分布が、増幅およびシーケンシング誤差により増幅反応物のシーケンシング結果で遺伝的多様体または複数の遺伝的多様体が観察されるまたは観察されると予測される平均頻度および前記頻度の分散であるパラメータにより特徴づけられる正規分布として定義される、前記請求項のいずれか1項に記載の方法。
  26. 対象から得られた試料中の循環する腫瘍DNAを検出および/または定量するための、請求項1〜25のいずれか1項に記載の方法の利用。
  27. 診断もしくは予知または疾患のモニタリングのインビトロ方法における、請求項1〜25のいずれか1項に記載の方法の利用。
  28. 治療のための患者を選択する方法における、請求項1〜25のいずれか1項に記載の方法の利用。
  29. 易罹患性、治療への耐性または応答を予測する遺伝的多様性を同定する方法における、請求項1〜25のいずれか1項に記載の方法の利用。
  30. 治療への応答をモニタリングまたは評価するための、請求項1〜25のいずれか1項に記載の方法の利用。
JP2017501719A 2014-07-18 2015-07-17 遺伝的多様体を検出する方法 Active JP6621802B6 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1412834.2A GB201412834D0 (en) 2014-07-18 2014-07-18 A method for detecting a genetic variant
GB1412834.2 2014-07-18
PCT/GB2015/052086 WO2016009224A1 (en) 2014-07-18 2015-07-17 A method for detecting a genetic variant

Publications (4)

Publication Number Publication Date
JP2017521078A true JP2017521078A (ja) 2017-08-03
JP2017521078A5 JP2017521078A5 (ja) 2018-07-12
JP6621802B2 JP6621802B2 (ja) 2019-12-18
JP6621802B6 JP6621802B6 (ja) 2020-01-29

Family

ID=51494834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017501719A Active JP6621802B6 (ja) 2014-07-18 2015-07-17 遺伝的多様体を検出する方法

Country Status (12)

Country Link
US (2) US10640819B2 (ja)
EP (1) EP3169798B1 (ja)
JP (1) JP6621802B6 (ja)
AU (2) AU2015288920B2 (ja)
CA (2) CA2955303C (ja)
DK (1) DK3169798T3 (ja)
ES (1) ES2698531T3 (ja)
GB (2) GB201412834D0 (ja)
IL (1) IL249983B (ja)
PL (1) PL3169798T3 (ja)
SG (1) SG11201700184VA (ja)
WO (1) WO2016009224A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021511820A (ja) * 2018-04-11 2021-05-13 ティーゲルクー アクチエボラグ ヌクレオチド配列バリアントの頻度分布の測定
JP2021528099A (ja) * 2018-06-14 2021-10-21 ソフィア、ジェネティックス、ソシエテ、アノニムSophia Genetics Sa ゲノムデータを次世代シーケンシングする際のバリアント検出方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111544B2 (en) * 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
US20190106751A1 (en) * 2016-04-15 2019-04-11 Natera, Inc. Methods for lung cancer detection
US10294518B2 (en) 2016-09-16 2019-05-21 Fluxion Biosciences, Inc. Methods and systems for ultra-sensitive detection of genomic alterations
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
KR101942197B1 (ko) * 2016-12-28 2019-01-24 주식회사 엠디헬스케어 세균 메타게놈 분석을 통한 전립선질환 진단 방법
CN111164701A (zh) * 2017-10-06 2020-05-15 格瑞尔公司 针对靶标定序的定点噪声模型
US20210104297A1 (en) * 2018-04-16 2021-04-08 Grail, Inc. Systems and methods for determining tumor fraction in cell-free nucleic acid
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
JP7407193B2 (ja) 2018-08-08 2023-12-28 イニヴァータ リミテッド 可変の複製多重pcrを使用した配列決定方法
KR102273152B1 (ko) * 2019-11-11 2021-07-05 사회복지법인 삼성생명공익재단 유전자 변이 검출수단의 검출능력 평가용 조성물의 제조방법
CN115428087A (zh) * 2020-01-31 2022-12-02 夸登特健康公司 克隆水平缺乏靶变体的显著性建模
WO2022029688A1 (en) * 2020-08-05 2022-02-10 Inivata Ltd. Highly sensitive method for detecting cancer dna in a sample
EP4095267A1 (en) * 2021-05-26 2022-11-30 Siemens Healthcare GmbH Method and system for determining efficacy of cancer therapy
WO2023012521A1 (en) * 2021-08-05 2023-02-09 Inivata Limited Highly sensitive method for detecting cancer dna in a sample
CN115410653B (zh) * 2022-08-31 2023-10-17 吉林金域医学检验所有限公司 细菌耐药性监测方法、装置、计算机设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140088942A1 (en) * 2012-09-27 2014-03-27 Ambry Genetics Molecular genetic diagnostic system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014039556A1 (en) * 2012-09-04 2014-03-13 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NUCLEIC ACIDS RES., vol. 40, no. 1, JPN6019015632, 2012, pages 2 - 1, ISSN: 0004025688 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021511820A (ja) * 2018-04-11 2021-05-13 ティーゲルクー アクチエボラグ ヌクレオチド配列バリアントの頻度分布の測定
JP2021528099A (ja) * 2018-06-14 2021-10-21 ソフィア、ジェネティックス、ソシエテ、アノニムSophia Genetics Sa ゲノムデータを次世代シーケンシングする際のバリアント検出方法
JP7366129B2 (ja) 2018-06-14 2023-10-20 ソフィア、ジェネティックス、ソシエテ、アノニム ゲノムデータを次世代シーケンシングする際のバリアント検出方法

Also Published As

Publication number Publication date
JP6621802B6 (ja) 2020-01-29
CA2955303A1 (en) 2016-01-21
IL249983A0 (en) 2017-03-30
IL249983B (en) 2020-07-30
AU2022200054A1 (en) 2022-02-03
GB201412834D0 (en) 2014-09-03
PL3169798T3 (pl) 2019-03-29
WO2016009224A1 (en) 2016-01-21
GB2534250B (en) 2018-04-18
EP3169798A1 (en) 2017-05-24
US20170204455A1 (en) 2017-07-20
ES2698531T3 (es) 2019-02-05
JP6621802B2 (ja) 2019-12-18
CA3186272A1 (en) 2016-01-21
AU2015288920B2 (en) 2021-10-07
EP3169798B1 (en) 2018-09-12
CA2955303C (en) 2023-10-03
GB2534250C (en) 2023-01-11
SG11201700184VA (en) 2017-02-27
US20200232021A1 (en) 2020-07-23
US10640819B2 (en) 2020-05-05
DK3169798T3 (en) 2018-12-03
GB201512626D0 (en) 2015-08-26
GB2534250A (en) 2016-07-20
AU2015288920A1 (en) 2017-02-02

Similar Documents

Publication Publication Date Title
JP6621802B2 (ja) 遺伝的多様体を検出する方法
US20220195530A1 (en) Identification and use of circulating nucleic acid tumor markers
JP7022188B2 (ja) 無細胞核酸の多重解像度分析のための方法
WO2018090298A2 (en) Systems and methods for monitoring lifelong tumor evolution
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
US20210065842A1 (en) Systems and methods for determining tumor fraction
US20210324477A1 (en) Generating cancer detection panels according to a performance metric
CN112534506A (zh) 组织特异性的甲基化标志物
WO2017112738A1 (en) Methods for measuring microsatellite instability
JP2021531016A (ja) 無細胞dna損傷分析およびその臨床応用
AU2019351522A1 (en) Second generation sequencing-based method for detecting microsatellite stability and genome changes by means of plasma
CN115896281A (zh) 甲基化生物标记物、试剂盒及用途
CA3099612C (en) Method of cancer prognosis by assessing tumor variant diversity by means of establishing diversity indices
WO2018186687A1 (ko) 생물학적 시료의 핵산 품질을 결정하는 방법
US20230099193A1 (en) Personalized cancer liquid biopsies using primers from a primer bank
US11702692B2 (en) Method of treatment of disease and method for quantifying the level of minimal residual disease in a subject
WO2023183812A2 (en) Molecule counting of methylated cell-free dna for treatment monitoring
CN115772566A (zh) 用于辅助检测肺癌体细胞erbb2基因突变的甲基化生物标记物及其应用
Johansson Looking through the noise

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180531

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191120

R150 Certificate of patent or registration of utility model

Ref document number: 6621802

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250