JP7046097B2 - 試料核酸にアダプターを付着する方法 - Google Patents

試料核酸にアダプターを付着する方法 Download PDF

Info

Publication number
JP7046097B2
JP7046097B2 JP2019555645A JP2019555645A JP7046097B2 JP 7046097 B2 JP7046097 B2 JP 7046097B2 JP 2019555645 A JP2019555645 A JP 2019555645A JP 2019555645 A JP2019555645 A JP 2019555645A JP 7046097 B2 JP7046097 B2 JP 7046097B2
Authority
JP
Japan
Prior art keywords
adapter
sample
stranded
nucleic acid
double
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019555645A
Other languages
English (en)
Other versions
JP2020516281A5 (ja
JP2020516281A (ja
Inventor
アンドリュー ケネディ,
ステファニー アン ウォード モーティマー,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2017/027809 external-priority patent/WO2017181146A1/en
Application filed by ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2020516281A publication Critical patent/JP2020516281A/ja
Publication of JP2020516281A5 publication Critical patent/JP2020516281A5/ja
Priority to JP2022016339A priority Critical patent/JP7514263B2/ja
Application granted granted Critical
Publication of JP7046097B2 publication Critical patent/JP7046097B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/107Probe or oligonucleotide ligation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

相互参照
この国際特許出願は、2017年4月14日に出願された米国仮特許出願番号第62/485,769号、2017年4月18日に出願された第62/486,663号、および2017年6月8日に出願された第62/517,145号の優先日の利益を主張しており、そしてまた2017年4月14日に出願された国際特許出願第PCT/US2017/027809号の優先日の利益を主張しており、各々は、すべての目的のためにその全体が参考として援用される。
配列表
本出願は、2018年4月10日作成の1キロバイトのテキストファイル512837-ST25内の配列を含み、前記テキストファイルは参照により組み込まれる。
がんは、個体の正常細胞内での遺伝的変異の蓄積によって引き起こされることがあり、そのうち少なくとも一部は、不適切に調節された細胞分裂をもたらす。このような変異は、一般に、コピー数変異(CNV)、単一ヌクレオチド変異(SNV)、遺伝子融合、挿入および/または欠失(挿入欠失)を含み、エピジェネティック変異は、シトシンの5-メチル化(5-メチルシトシン)ならびにDNAのクロマチンおよび転写因子との会合を含む。
がんは、腫瘍の生検と、それに続く細胞、マーカーまたは細胞から抽出されたDNAの解析によって検出されることが多い。しかしより最近では、がんはまた、血液または尿などの体液中の無細胞核酸から検出できるということが提案されている(例えば、Siravegna et al., Nature Reviews 2017を参照)。このような試験は、非侵襲的であり、生検において疑わしいがん細胞を同定することなく実施できる利点を有する。しかし、体液中の核酸の量は非常に低い。したがって、そのような分析は、体液中の天然の無細胞DNAを、分析を受け入れられる形態に変換する効率的な方法を必要とする。
分析のために患者試料からDNA分子を調製することは、一般に、まず一本鎖オーバーハングを修復して増幅およびシーケンシングのためにアダプターへのライゲーションを可能にすることを含む。修復は、オーバーハング鎖を消化するまたは反対鎖を伸長して平滑末端を生成し、続いて5’末端をリン酸化して平滑末端をアダプターにライゲーションすることにより達成可能である。あるいは、平滑末端化の後、平滑末端はTaqポリメラーゼを用いてA尾部付加することが可能である。A尾部付加断片はアニールされ、3’末端に単一ヌクレオチドT尾部を含むアダプターとライゲーションされる。この立体配置は所望のアダプター-DNA分子ライゲーションに有利であるが、シーケンシングをすることができる分子への試料中のDNA分子の全体変換効率は、利用可能である核酸の量がごく少量である試料についてはそれでも容認しがたいほど低いことがある。
Siravegna et al., Nature Reviews 2017
要旨
本発明は、分析のために核酸を調製する方法であって、
(a)5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を提供する1つまたは複数の酵素ならびに4つの標準ヌクレオチドタイプの作用により試料中の一本鎖オーバーハングを有する二本鎖核酸を平滑末端とするステップであって、5’末端を有する一本鎖オーバーハングが、ポリメラーゼ活性による相補鎖の伸長のための鋳型として働き、3’末端を有する一本鎖オーバーハングが、プルーフリーディング活性により消化されて平滑末端化核酸を生じる、ステップと;(b)平滑末端化核酸を試料の他の成分から分離せずに、3’-5’プルーフリーディング機能のないポリメラーゼの作用により平滑末端化核酸の末端に尾部を付加するステップであって、これにより平滑末端化核酸の3’末端へのヌクレオチドの非鋳型特異的付加が実施され、Aが優先的に、次にGが優先的に、次にCまたはTが付加される、ステップと;(c)ステップ(c)の核酸を3’末端に単一ヌクレオチドTまたはCオーバーハングを有する少なくとも部分的に二本鎖のアダプターにアニールするステップと;(d)核酸をアダプターにライゲーションするステップとを含む、方法を提供する。必要に応じて、方法は、ステップ(a)の後、1つまたは複数の酵素を変性させるステップをさらに含む。必要に応じて、方法は、試料を、1つまたは複数の酵素、4つの標準ヌクレオチドタイプおよび3’-5’プルーフリーディング機能のないポリメラーゼと接触させるステップをさらに含む。必要に応じて、試料を、1つまたは複数の酵素、4つの標準ヌクレオチドタイプおよび3’-5’プルーフリーディング機能のないポリメラーゼと一緒に接触させる。必要に応じて、ステップ(b)は、ステップ(a)よりも高い温度で実施される。必要に応じて、ステップ(a)は、周囲温度で実施され、ステップ(b)は、60℃を超える温度で実施される。必要に応じて、1つまたは複数の酵素は、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有するポリメラーゼである。必要に応じて、3’-5’プルーフリーディング機能のないポリメラーゼは、熱安定性ポリメラーゼであり、方法は、ステップ(a)の後、試料の温度を上げて、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有するポリメラーゼを不活化するステップをさらに含む。必要に応じて、方法は、(e)アダプターにライゲーションされた核酸を増幅するステップと;(f)核酸を分析するステップとをさらに含む。
必要に応じて、方法は、試料を、ライゲーションするステップでの3’末端へのヌクレオチドの非鋳型特異的付加を受けなかった平滑末端化二本鎖核酸とライゲーションする少なくとも部分的に二本鎖の平滑末端化アダプターと接触させるステップをさらに含む。必要に応じて、第1のポリメラーゼは、T4ポリメラーゼまたはクレノウ大断片である。必要に応じて、第2のポリメラーゼは、Taqポリメラーゼである。必要に応じて、少なくともステップ(a)~(e)は、単一チューブで実施される。必要に応じて、ステップ(a)~(f)または(a)~(g)は、単一チューブで実施される。必要に応じて、単一ヌクレオチドTを有する少なくとも部分的に二本鎖のアダプターの単一ヌクレオチドCを有するものに対するモル比は、4:1~2:1、好ましくは3:1である。必要に応じて、平滑末端化アダプターの尾部付加アダプターに対するモル比は、1:5~1:500、好ましくは1:10~1:100である。必要に応じて、試料中の二本鎖核酸の少なくとも70%は、アダプターにつながっている。必要に応じて、試料中の利用可能な二本鎖核酸の少なくとも70%は分析される。必要に応じて、ステップ(f)は、アダプターにライゲーションされている核酸をシーケンシングすることを含む。必要に応じて、シーケンシングすることで、ステップ(c)または(d)においてオーバーハングを形成したヌクレオチドをシーケンシングする。
本発明は、二本鎖DNAをアダプタータグ付きDNAに変換する方法であって、(a)二本鎖DNA分子の集団を少なくとも部分的に二本鎖のアダプターの集団と接触させるステップであって、(i)二本鎖DNA分子の集団は、単一ヌクレオチドAオーバーハングを含むDNA分子および単一ヌクレオチドGオーバーハングを含むDNA分子を含み、単一ヌクレオチドAオーバーハングは、集団中で単一ヌクレオチドGオーバーハングよりも豊富であり(例えば、10倍、100倍、1000倍)、(ii)少なくとも部分的に二本鎖のアダプターの集団は、単一ヌクレオチドTオーバーハングを含むアダプターおよび単一ヌクレオチドCオーバーハングを含むアダプターを含む、ステップ、ならびに(b)アダプターをDNA分子にライゲーションするステップであって、これによりアダプタータグ付きDNAを生成するステップとを含む、方法をさらに提供する。
必要に応じて、(i)二本鎖DNA分子の集団は、単一ヌクレオチドCオーバーハングを含むDNA分子、単一ヌクレオチドTオーバーハングを含むDNA分子および平滑末端のうちの少なくとも1つをさらに含み、(ii)少なくとも部分的に二本鎖のアダプターの集団は、単一ヌクレオチドGオーバーハングを含むアダプター、単一ヌクレオチドAオーバーハングを含むアダプターおよび平滑末端のうちの少なくとも1つをさらに含む。必要に応じて、少なくとも部分的に二本鎖のアダプターは、NGS(「次世代シーケンシング」)プライマー結合部位およびDNAバーコードを含む。必要に応じて、少なくとも部分的に二本鎖のアダプターの集団は、複数の異なるDNAバーコードを含む。必要に応じて、二本鎖DNA分子の両末端に付着可能なバーコード組合せの数は、集団中で二本鎖DNA分子の数よりも少なく、例えば、5~10,000の間の異なる組合せである。必要に応じて、方法は、(c)試料インデックスバーコードを含む増幅プライマーおよびフローセル支持体に固定されたオリゴヌクレオチドにハイブリダイズするように適合されたヌクレオチド配列を使用してアダプタータグ付きDNAを増幅するステップをさらに含む。必要に応じて、アダプターは、Y型アダプターである。必要に応じて、試料は、全血、血清、または血漿などの体液試料である。必要に応じて、核酸集団は、無細胞核酸集団である。必要に応じて、試料は、がんを有すると疑われている対象由来である。必要に応じて、分析するステップは、体細胞または生殖細胞系変異、コピー数変異、単一ヌクレオチド変異(SNV)、およびインデルまたは遺伝子融合を検出する。
本発明は、前記請求項のいずれかの方法により生成される適合された核酸の集団であって、複数の核酸分子を含み、そのそれぞれが、核酸断片とアダプターの間にA/TまたはG/C塩基対を有するバーコードを含むアダプターが両側に隣接している核酸断片を含む、集団をさらに提供する。必要に応じて、複数の核酸分子は、少なくとも100,000分子である。必要に応じて、A/T塩基対のG/C塩基対に対する比は、2:1~4:1の間である。必要に応じて、集団中の核酸分子の少なくとも99%は、異なるバーコードを有するアダプターが隣接している核酸断片を有する。
本開示は、それぞれTおよびC単一ヌクレオチド3’ 尾部を有する少なくとも部分的に二本鎖のアダプターであって、尾部を除いて互いに同一であるアダプターの対を含むキットをさらに提供する。必要に応じて、アダプターは、配列番号1および2、ならびに3および2のオリゴヌクレオチドを含むY型アダプターである。必要に応じて、キットは、T4ポリメラーゼまたはクレノウ大断片、およびTaqポリメラーゼ、ならびに4つの標準ヌクレオチドタイプをさらに含む。
図1は、平滑末端化、末端尾部付加ならびに試料DNAの-Tおよび-C尾部付加Y型アダプターへの結合を示している。
定義
対象とは、哺乳動物種(好ましくはヒト)もしくはトリ(例えば、鳥)種などの動物、または植物などの他の生物のことである。さらに具体的には、対象は脊椎動物、例えば、マウス、霊長類、サルまたはヒトなどの哺乳動物が可能である。動物は、家畜、スポーツ動物、およびペットを含む。対象は、健康な個体、疾患もしくは疾患の素因を有するもしくはこれを有すると疑われている個体、または治療を必要とするもしくは治療を必要とすると疑われている個体が可能である。
遺伝子バリアントとは、対象の核酸試料またはゲノムにおける変更、バリアントまたは多型のことである。そのような変更、バリアントまたは多型は参照ゲノムに関するものであり得、参照ゲノムは対象のまたは他の個体の参照ゲノムでもよい。変異(variation)は、1つまたは複数の単一ヌクレオチド変異(SNV)、挿入、欠失、反復、小挿入、小欠失、小反復、構造多型接合部、可変長縦列反復、および/または隣接配列を含み、コピー数変異体(CNV)、塩基転換および他の再編成も遺伝子変異の形態である。変異は、塩基変化、挿入、欠失、反復、コピー数変異、塩基転換、またはその組合せが可能である。
がんマーカーは、がんの存在またはがんを発症するリスクに関連する遺伝子バリアントである。がんマーカーは、対象ががんを有するまたは同じ種の年齢および性が適合する対象よりもがんを発症する高いリスクを有する徴候を提供することが可能である。がんマーカーは、がんの原因となるものでもそうでなくてもよい。
核酸タグは、試料核酸に標識して核酸を、異なるタイプの、または異なる処理を受けている異なる試料(例えば、試料インデックスを表す)と区別するのに使用される、通常は人工的配列のおよび通常はDNAの短い核酸(例えば、100、50または10ヌクレオチド長未満)である。タグは一本鎖でも二本鎖でも可能である。核酸タグは解読すれば、核酸の起源、形態または処理の試料などの情報を明らかにすることが可能である。タグを使用すれば、異なるタグを保有する複数の核酸のプール化および並行処理が可能になり、核酸はそれに続いてタグを読むことによりデコンボリューションされる。タグは分子識別子またはバーコードと呼ぶことも可能である。
アダプターは、試料核酸分子のどちらかのまたは両方の末端への連結のために通常少なくとも部分的に二本鎖である短い核酸(例えば、500、100または50ヌクレオチド長未満および典型的にはDNA)である。アダプターは、両末端でアダプターが隣接している試料核酸分子の増幅を可能にするプライマー結合部位、および/または次世代シーケンシングのためのプライマー結合部位を含む、シーケンシングプライマー結合部位を含むことが可能である。アダプターは、フローセル支持体に付着しているオリゴヌクレオチドなどの、捕捉プローブのための結合部位も含むことが可能である。アダプターは、上記のタグも含むことが可能である。タグは好ましくは、タグが試料核酸のアンプリコンおよびシーケンシング読み取りデータに含まれるように、プライマーおよびシーケンシングプライマー結合部位に関連する位置にある。同じまたは異なるアダプターを試料分子のそれぞれの末端に連結させることが可能である。同じアダプターが、タグが異なること以外それぞれの末端に連結されることもある。好ましいアダプターはY型アダプターであり、そこでは、試料核酸につなげるために、1つの末端が本明細書に記載されるように平滑末端とされまたは尾部を付加されており、この試料核酸も平滑末端とされているまたは相補的ヌクレオチドで尾部を付加されている。別の好ましいアダプターは、ベル型アダプターであり、同様に分析する核酸につなげるために平滑末端または尾部付加末端を有する。
4つの標準ヌクレオチドタイプとは、デオキシリボヌクレオチドでは、A、C、G、T、リボヌクレオチドではA、C、TおよびUのことである。
詳細な説明
1.概要
新世代シーケンシングプラットフォームのための試料調製は多くの場合類似するプロトコールに従う。試料は典型的には一本鎖オーバーハングを有する二本鎖核酸断片を含有する。そのような断片は平滑末端とされてアダプターに直接ライゲーションすることが可能である。しかし、そのようなライゲーションは、アダプターまたは断片がコンカテマーを形成する副産物も生じる。そのような副産物の形成は、平滑末端化断片がA尾部付加されT尾部付加アダプターにライゲーションされる代替手法により低減することが可能である。単一のチューブで末端修復および尾部付加を実施する市販のキットは使用が簡便で迅速であり、市販のアダプター(例えば、NEBNext Ultra II(New England Biolabs、Ipswich、MA.))と一緒に使用可能である。しかし、A尾部付加について最適化されていないキットを使用すると、G、TおよびCなどの他のヌクレオチドで尾部を付加することがある。効率の悪い尾部付加の結果、アダプターのライゲーション効率は悪くなりライブラリーの複雑度は低くなる。
本発明は、増幅およびそれに続く分析、特にシーケンシングのために、一本鎖オーバーハングを有する二本鎖核酸(好ましくはDNA)を調製する改良された方法を提供する。平滑末端化二本鎖核酸を4つの標準ヌクレオチドタイプすべての存在下でTaqと接触させると核酸の3’末端への単一ヌクレオチドの非鋳型特異的付加が起き、その結果、Aが最も頻繁に、続いてG、続いてCおよびTが付加されることが見出された。追加の核酸分子が含まれるとオフターゲット副反応の可能性が増えるが、単一G尾部付加の割合は単一A尾部付加と比べて十分に高いので、アダプターへの試料中の核酸分子のライゲーションの効率は、Tでだけ(先の方法においてのように)でなくCでも尾部を付加されたアダプターのカスタマイズされた混合物を含めることにより著しく増加させることが可能であり、それらのアダプターは、AおよびGで尾部を付加されたDNA分子の3’末端にそれぞれアニールすることが見出された。ライゲーション効率は、いかなるヌクレオチドとも尾部付加を受けることができなかった試料中の平滑末端化核酸分子にライゲーションする平滑末端化アダプター(すなわち、いかなるヌクレオチドでも尾部を付加されていない)も含めることによりさらに増加させることが可能である。
2.試料
試料は対象から単離されたいかなる生体試料でも可能である。試料は、身体試料であり得る。試料として、既知または疑われる固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検、脳脊髄液滑液、リンパ液、腹水、間質性または細胞外液、歯肉溝滲出液を含む細胞間空間中の流体、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿などの体組織を挙げることができる。試料は、体液、特に、血液およびその画分ならびに尿が好ましい。試料は、対象から元々単離された形態であってもよく、あるいは細胞などの成分を除去もしくは付加するために、またはある成分を別のものに対して濃縮するためにさらなる処理に付されていてもよい。したがって、分析に好ましい体液は、無細胞核酸を含有する血漿または血清である。
血漿の体積は、シーケンシングされる領域の所望の読み取りデータ深度に応じて変わり得る。例示的体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は、0.5mL、1mL、5mL 10mL、20mL、30mLまたは40mLであり得る。試料採取される血漿の体積は、例えば、5~20mLであり得る。
試料は、ゲノム等価物を含有する種々の量の核酸を含むことが可能である。例えば、約30ngのDNAの試料は、約10,000の一倍体ヒトゲノム等価物を、無細胞DNAの場合は、約2000億の個々の核酸分子を含有することが可能である。同様に、約100ngのDNAの試料は、約30,000の一倍体ヒトゲノム等価物を、無細胞DNAの場合は、約6000億の個々の分子を含有することが可能である。一部の試料は、1~500、2~100、5~150ngの無細胞DNA、例えば、5~30ng、または10~150ngの無細胞DNAを含有する。
試料は、異なる供給源由来の核酸を含むことが可能である。例えば、試料は生殖系列DNAまたは体細胞DNAを含むことが可能である。試料は、突然変異を保有する核酸を含むことが可能である。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を保有するDNAを含むことが可能である。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を保有するDNAも含むことが可能である。
増幅前の試料中の無細胞核酸の例示的量は、約1fg~約1μg、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、最大約600ng、最大約500ng、最大約400ng、最大約300ng、最大約200ng、最大約100ng、最大約50ngまたは最大約20ngの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ngまたは少なくとも200ngの無細胞核酸分子であり得る。量は、最大1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ngまたは200ngの無細胞核酸分子であり得る。方法は、1フェムトグラム(fg)~200ngを得るステップを含み得る。
例示的試料は5~10mlの全血、血漿または血清であり、これは約30ngのDNAまたは約10,000の一倍体ゲノム等価物を含む。
無細胞核酸は、細胞内に含有されない、もしくはそうでなければ細胞に結合されない核酸、または言い換えれば、無傷の細胞を除去した試料中に残存している核酸である。無細胞核酸は、ゲノムDNA、ミトコンドリアDNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長鎖ノンコーディングRNA(long ncRNA)またはこれらのいずれかの断片を含む、DNA、RNAおよびそのハイブリッドを含む。少なくともその一部が一本鎖オーバーハングを有する二本鎖DNA分子は、本明細書に開示されるいかなる方法についても無細胞DNAの好ましい形態である。無細胞核酸は、二本鎖、一本鎖またはそのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスによって体液中に放出され得る。いくつかの無細胞核酸、例えば、循環腫瘍DNA(ctDNA)が、がん細胞から体液中に放出される。その他のものは、健康な細胞から放出される。
無細胞核酸は1つまたは複数のエピジェネティック修飾を有することが可能であり、例えば、無細胞核酸は、アセチル化、メチル化、ユビキチン化、リン酸化、SUMO化、リボシル化、および/またはシトルリン化することが可能である。
無細胞核酸は、約100~500ヌクレオチド、特に110~約230ヌクレオチドのサイズ分布を有し、約168ヌクレオチドの最頻値を有し、240~440ヌクレオチドの間の範囲に第2のわずかなピークを有する。
無細胞核酸は、溶液中に見られるような無細胞核酸が、無傷の細胞および体液のその他の非可溶性成分から分離される分画または分割ステップによって体液から単離できる。分割は、遠心分離または濾過などの技術を含み得る。あるいは、体液中の細胞を溶解し、無細胞および細胞性核酸を一緒に処理してもよい。一般的に、バッファーの添加および洗浄ステップ後、核酸をアルコールを用いて沈殿させることができる。シリカベースのカラムなどのさらなる精製ステップを使用して、夾雑物または塩を除去してもよい。非特異的バルク担体核酸は、例えば、収率などの手順のある特定の態様を最適化するために反応中ずっと添加してもよい。
このような処理後、試料は、二本鎖DNA、一本鎖DNAおよび一本鎖RNAを含む種々の形態の核酸を含み得る。必要に応じて、一本鎖DNAおよびRNAは、二本鎖形態に変換され、したがって、それらは、その後の処理および解析ステップに含まれ得る。
3.試料核酸分子をアダプターに連結する
上記の先の処理ありまたはなしで試料中に存在する核酸は、典型的には分子のかなりの分子を、一本鎖オーバーハングを有する部分的に二本鎖の分子の形態で含有する。そのような分子は、図1上に示される4つの標準ヌクレオチドタイプすべての存在下で、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼ(またはプルーフリーディング機能)を提供する1つまたは複数の酵素で処理することにより平滑末端化二本鎖分子に変換することが可能である。活性のそのような組合せは陥凹3’末端のある鎖を伸長することが可能なので、鎖は反対鎖の5’末端と平滑で終了する(言い換えると、平滑末端を生み出す)、または3’オーバーハングのある鎖を消化することが可能なので、鎖は同様に反対鎖の5’末端と平滑になる。両活性は、必要に応じて、単一ポリメラーゼが与えることが可能である。ポリメラーゼは、温度を上げた場合にその活性を終結させることができるように、好ましくは熱感受性である。クレノウ大断片およびT4ポリメラーゼは適切なポリメラーゼの例である。
5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼ活性を与える1つまたは複数の酵素は好ましくは、温度を上げることによりまたは他の方法で変性される。例えば、変性は温度を、例えば、75℃~80℃まで上げることにより達成することが可能である。次に、試料にはプルーフリーディング機能を欠くポリメラーゼが作用する(図1中央)。このポリメラーゼは、好ましくは、高温度でも依然活性があるなどの熱安定性である。Taq、Bst大断片およびTthポリメラーゼはそのようなポリメラーゼの例である。第2のポリメラーゼは、平滑末端化核酸の3’末端への単一ヌクレオチドの非鋳型付加を達成する。反応混合物は典型的には、先のステップ由来の4つの標準ヌクレオチドタイプのそれぞれの等モル量を含有しているが、4つのヌクレオチドタイプは等しい割合で3’末端に付加されない。むしろ、Aが最も頻繁に、続いてG、続いてCおよびTが付加される。
試料分子の尾部付加の後、および尾部付加試料分子のそれに続く精製ありまたはなしで、尾部付加試料分子はアダプターの1つの末端に相補的TおよびCヌクレオチドで尾部を付加したアダプターと接触させる(図1下)。アダプターは典型的には、そのそれぞれの鎖の個別の合成およびアニーリングにより形成される。したがって、追加のTおよびC尾部を鎖のうちの1つの合成において余分なヌクレオチドとして付加することが可能である。典型的には、GおよびAで尾部を付加されたアダプターは含まれない。なぜならば、これらのアダプターはそれぞれCおよびTで尾部を付加された試料分子とアニールする場合があるが、他のアダプターともアニールすると考えられるからである。その3’末端に相補的ヌクレオチド(すなわち、T-AおよびC-G)を保有するアダプター分子と試料分子はアニールし、互いにライゲーションすることが可能である。T尾部付加アダプターと比べたC尾部付加アダプターのパーセントは、モルで約5~40%、例えば、10~35%、15~25%、20~35%、25~35%または約30%の範囲に及ぶ。試料分子の3’末端への単一ヌクレオチドの非鋳型特異的付加は完了まで進まないので、試料は尾部付加なしのいくつかの平滑末端化試料分子も含有する。これらの分子は、1つ好ましくは1つだけ平滑末端を有するアダプターを試料に供給することによっても回収することが可能である。平滑末端アダプターは通常、TおよびC尾部付加アダプターを有するアダプターの0.2~20%、または0.5~15%または1~10%のモル比で供給される。平滑末端化アダプターは、TおよびC尾部付加アダプターと同時に、その前にまたはその後で提供することが可能である。平滑末端化アダプターは平滑末端化試料分子とライゲーションして、再びアダプターが両側に隣接している試料分子を生じた。これらの分子は、尾部付加試料分子が尾部付加アダプターにライゲーションされると、存在する試料とアダプターの間にA-Tヌクレオチド対もC-Gヌクレオチド対も欠く。
これらの反応で使用されるアダプターは好ましくは、アダプターが試料分子と1つの配向だけでライゲーションすることができるように、TもしくはCで尾部を付加された唯一の末端または唯一の平滑末端を有する。アダプターは、例えば、一方の末端に尾部が付加されているまたは平滑であり、もう一方の末端が2つの単一鎖を有する、Y型アダプターが可能である。例示的Y型アダプターは次の通りの配列を有し、(6塩基)がタグを示している。上のオリゴヌクレオチドは単一塩基T尾部を含む。
ユニバーサルアダプター:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(配列番号1)
アダプター、インデックス1~12:5’GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(6塩基)ATCTCGTATGCCGTCTTCTGCTTG(配列番号2)
C尾部を有する別のY型アダプターは、以下の配列を有する:
5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCC(配列番号3)およびアダプター、インデックス1~12:5’GATCGGAAGAGCACACGTCTGAACTCCAGTCAC(6塩基)ATCTCGTATGCCGTCTTCTGCTTG(配列番号2)
TとC尾部の両方を有するオリゴヌクレオチドを含むそのようなオリゴヌクレオチドのカスタマイズされた組合せは、本方法において使用するために合成することが可能である。
これらのアダプター配列の末端切断型は、Rohlandら、Genome Res.2012年5月;22巻(5号):939~946頁により記載されている。
アダプターは、末端が1つだけのベル型も可能であり、この末端は尾部が付加されているまたは平滑である。アダプターは、増幅のためのプライマー結合部位、シーケンシングプライマーのための結合部位、および/または識別を目的とする核酸タグを含むことが可能である。同じまたは異なるアダプターは単一反応において使用可能である。
アダプターが識別タグを含み、試料中の核酸がそれぞれの末端でアダプターに付着している場合、識別子の潜在的組合せの数は、供給される独自のタグの数に従って指数関数的に増加する(すなわち、nの組合せであり、nは、独自の識別タグの数である)。一部の方法では、独自のタグの組合せの数が十分なので、試料中の異なる二本鎖DNA分子のすべてまたは実質的にすべて(例えば、少なくとも90%)がタグの異なる組合せを受けることは統計的に見込みがある。一部の方法では、識別子タグの独自の組合せの数は、試料中の独自の二本鎖DNA分子の数よりも少ない(例えば、5~10,000の異なるタグ組合せ)。
上記方法を実施するのに適した酵素を提供するキットは、NEBNext(登録商標)Ultra(商標)II DNA Library Prep Kit for Illumina(登録商標)である。キットは以下の試薬を提供する。
NEBNext Ultra II End Prep Enzyme Mix、NEBNext Ultra II End Prep Reaction Buffer、NEBNext Ligation Enhancer、NEBNext Ultra II Ligation Master Mix-20、NEBNext(登録商標)Ultra II Q5(登録商標)Master Mix。
試料核酸の平滑末端化および尾部付加は、単一チューブで実施することが可能である。平滑末端化核酸は、尾部付加反応が起こる前に平滑末端化を実施する酵素(複数可)から分離する必要はない。必要に応じて、すべての酵素、ヌクレオチドおよび他の試薬は、平滑末端化反応が起こる前に一緒に供給される。一緒に供給するとは、平滑末端化が行われるために試料インキュベーションが生じるときにすべてが存在しているように、時間が十分接近してすべてが試料中に導入されることを意味する。必要に応じて、酵素、ヌクレオチドおよび他の試薬を供給した後、少なくとも平滑末端化と末端尾部付加インキュベーションの両方が完了するまで試料から何も除去されない。多くの場合、末端尾部付加反応は、平滑末端化反応よりも高い温度で実施される。例えば、平滑末端化反応は、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼが活性であり、熱安定性ポリメラーゼが不活性であるまたは活性が最小限である、周囲温度で実施することが可能であり、末端尾部付加反応は、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼが不活性であり、熱安定性ポリメラーゼが活性である、60℃を超えるなどの高温で実施することが可能である。
記載されているTおよびC尾部付加アダプターの付着により、適合された核酸の集団であって、複数の核酸分子を含み、そのそれぞれが、核酸断片とアダプターの間にA/TまたはG/C塩基対を有するバーコードを含むアダプターが両側に隣接している核酸断片を含む、集団がもたらされる。複数の核酸分子は、少なくとも10,000、100,000または1,000,000分子が可能である。断片と隣接するアダプターの間の接合領域でのA/T塩基対のG/C塩基対に対する比は、T尾部付加アダプターのC尾部付加アダプターに対する比に依存し、例えば、2:1~4:1の間である。集団中の大半の核酸は、異なるバーコードを有するアダプターが隣接している(例えば、少なくとも99%)。平滑末端化アダプターも含まれる場合、核酸断片で核酸分子を含む集団は、どちらかまたは両方の末端でアダプターに直接つなげられる(すなわち、介在するA/T対もG/C対もない)。
4.増幅
アダプターが隣接している試料核酸は、PCR、および増幅される核酸に隣接するアダプター中のプライマー結合部位に結合するプライマーから典型的にはプライミングされる他の増幅方法により増幅させることが可能である。増幅方法は、熱サイクリングから生じる伸長、変性およびアニーリングのサイクルを含むことが可能であり、または転写媒介増幅の場合のように等温であることが可能である。他の増幅方法は、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅、および自家持続性配列ベース複製を含む。
好ましくは、本方法は、試料中の少なくとも75、80、85、90または95%の二本鎖核酸がアダプターに連結されることになる。好ましくは、TおよびC尾部付加を使用すれば、T尾部付加アダプター単独で実施した対照方法と比べると、少なくとも1、2、3、4、5、6、7、8、9または10%(75%から80%の収率の増加は5%の増加と見なされる)アダプターに連結された試料中の二本鎖核酸のパーセントが増加する。好ましくは、平滑末端化アダプターと組み合わせてTおよびC尾部付加を使用すれば、アダプターに連結した二本鎖核酸のパーセントは少なくとも5、10、15、20または25%増加する。アダプターに連結された核酸のパーセントは、原試料とアダプターへの連結が完了した後の処理された試料の比較ゲル電気泳動により決定することが可能である。
好ましくは、本方法は、試料中の少なくとも75、80、85、90または95%の利用可能な二本鎖分子がシーケンシングされることになる。好ましくは、TおよびC尾部付加を使用すれば、T尾部付加アダプター単独で実施した対照方法と比べると、シーケンシングされる試料中の二本鎖核酸のパーセントが少なくとも1、2、3、4、5、6、7、8、9または10%増加する。好ましくは、平滑末端化アダプターと組み合わせてTおよびC尾部付加を使用すれば、T尾部付加アダプター単独で実施した対照方法と比べると、シーケンシングされる試料中の二本鎖核酸のパーセントが少なくとも5、10、15、20または25%増加する。シーケンシングされる核酸のパーセントは、入力核酸およびシーケンシングするために標的にされたゲノムの領域に基づいてシーケンシングすることができたと考えられる数に基づいて実際にシーケンシングされた分子の数を比べることにより決定することが可能である。
5.タグ
分子識別子またはバーコードを提供するタグは、ライゲーション、他の方法の中でもオーバーラップ伸長PCRによりアダプター内に取り込むまたは他の方法でこれにつなぐことが可能である。一般に、反応における独特または非独特識別子または分子バーコードの割り当ては、米国特許出願第20010053519号、第20030152490号、第20110160078号、ならびに米国特許第6,582,908号によって記載される方法およびシステムに従う。
いくつかの場合には、それらを、独特の識別子のマイクロウェルに対する予測される比で導入する。例えば、ゲノム試料1種あたり約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000より多い独特の識別子がロードされるように、独特の識別子をロードしてもよい。いくつかの場合には、ゲノム試料1種あたり約2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000未満の独特の識別子がロードされるように、独特の識別子をロードしてもよい。いくつかの場合には、試料ゲノム1種あたりロードされる独特の識別子の平均数は、ゲノム試料1種あたり約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000もしくは1,000,000,000未満または約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000もしくは1,000,000,000より多い独特の識別子である。
いくつかの場合には、独特の識別子は、予め決定された、またはランダムまたは半ランダムな配列のオリゴヌクレオチドであり得る。その他の場合には、複数のバーコードを使用してもよく、その結果、バーコードは必ずしも複数において互いに独特ではない。この例では、バーコードを個々の分子にライゲーションしてもよく、その結果、バーコードおよびライゲーションされ得る配列の組合せが、独特の配列を作り出し、これを個別に追跡してもよい。本明細書において記載されるように、配列読み取りデータの始まり(開始)および終了(停止)部分の配列データと組み合わせた非独特バーコードの検出によって、独特の同一性を特定の分子に割り当てることが可能となり得る。個々の配列読み取りデータの塩基対の長さまたは数も、このような分子に独特の同一性を割り当てるために使用してもよい。本明細書において記載されるように、独特の同一性が割り当てられている核酸の一本鎖に由来する断片は、それによって、親の鎖に由来する断片のその後の同定を可能にし得る。
試料中のポリヌクレオチドは、特定のゲノム領域にマッピングされるすべてのポリヌクレオチドが異なる識別タグを保有する(領域内の分子は実質的に独自のタグ付けがされている)確率が高くなる(例えば、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、少なくとも99.9%、または少なくとも99.99%)ように、十分な数の異なるタグでタグ付けすることが可能である。ポリヌクレオチドがマッピングされるゲノム領域は、例えば、(1)シーケンシングされている遺伝子の全パネル、(2)単一の遺伝子、エクソンもしくはイントロン内のマッピングなどのそのパネルの一部の部分、(3)単一ヌクレオチド座標(例えば、ポリヌクレオチド中の少なくとも1つのヌクレオチドは、座標、例えば、開始位置、停止位置、中心点またはその間の任意の場所にマッピングされる)または(4)開始/停止(始まり/終わり)ヌクレオチド座標の特定の対が可能である。実質的に独自のタグポリヌクレオチドに必要な異なる識別子の数(タグカウント)は、試料中のどれくらいの数の最初のポリヌクレオチド分子が領域にマッピングされているかの関数である。これは、次に、いくつかの要因の関数である。1つの要因は、アッセイに含まれる一倍体ゲノム等価物の総数である。別の要因は、ポリヌクレオチド分子の平均サイズである。別の要因は、領域にまたがる分子の分布である。これは、次に、切断パターンの関数が可能であり、ヌクレオソーム間よりもヌクレオソーム位置にまたがってマッピングされるポリヌクレオチドが多くなるように、切断は主にヌクレオソーム間で起きると予想してもよい。別の要因は、1つのバーコード対別のバーコードの有効濃度の違いを潜在的に引き起こす、プール中のバーコードの分布および個々のバーコードのライゲーション効率である。別の要因は、独自のタグ付けがされる分子が限定される領域(例えば、同じ開始/停止または同じエクソン)のサイズである。
識別子は、分子の1末端に付着している単一バーコード、またそれぞれが分子の異なる末端に付着している2つのバーコードが可能である。分子の両末端に独立してバーコードを付着させると、考えられる識別子の数が2乗で増加する。この場合、異なるバーコードの数は、特定のポリヌクレオチドのそれぞれの末端のバーコードの組合せが、同じ選択されたゲノム領域にマッピングされている他のポリヌクレオチドに関して独自である確率が高くなるように、選択される。
ある特定の実施形態では、使用される異なる識別子またはバーコード組合せの数(タグカウント)は、少なくとも64、100、400、900、1400、2500、5625、10,000、14,400、22,500または40,000のいずれかおよび90,000、40,000、22,500、14,400または10,000のいずれか以下が可能である。例えば、識別子またはバーコード組合せの数は、64~90,000の間、400~22,500の間、400~14,400の間または900~14,400の間が可能である。
複数のゲノム由来の断片化されたゲノムDNA、例えば、無細胞DNA(cfDNA)を含む試料では、異なるゲノム由来の1つよりも多いポリヌクレオチドが同じ開始および停止位置を有する(「重複」または「同族」)可能性が多少ある。任意の位置で開始する重複の推定数は、試料中の一倍体ゲノム等価物の数および断片サイズの分布の関数である。例えば、cfDNAは約160ヌクレオチドに断片のピークがあり、このピークの断片の大半は約140ヌクレオチド~180ヌクレオチドの範囲に及ぶ。したがって、約30億塩基のゲノム(例えば、ヒトゲノム)由来のcfDNAは、ほぼ2000万(2×10)のポリヌクレオチド断片から構成されている可能性がある。約30ngのDNAの試料は、約10,000の一倍体ヒトゲノム等価物を含有することが可能である(同様に、約100ngのDNAの試料は、約30,000の一倍体ヒトゲノム等価物を含有することが可能である)。そのようなDNAの約10,000(10)の一倍体ゲノム等価物を含有する試料は、約2000億(2×1011)の個々のポリヌクレオチド分子を有することが可能である。ヒトDNAの約10,000の一倍体ゲノム等価物の試料には、任意の所与の位置で開始する約3重複ポリヌクレオチドが存在すると経験的に決定されてきた。したがって、そのような収集物は、多様な約6×1010~8×1010(約600億~800億、例えば、約700億(7×1010))の別々にシーケンシングされるポリヌクレオチド分子を含有することが可能である。
分子を正しく識別する確率は、ゲノム等価物の最初の数、シーケンシングされた分子の長さ分布、配列均一性およびタグの数に依存している。数はポアソン分布を使用して計算することが可能である。タグカウントが1に等しい場合、それは独自のタグがないまたはタグ付けがないことに等しい。下の表1は、上の通り典型的な無細胞サイズ分布を想定して、分子を独自であると正しく識別する確率を収載している。
Figure 0007046097000001
この場合、ゲノムDNAをシーケンシングすると、どの配列読み取りデータがどの親分子由来なのかを決定することが可能ではない場合がある。この問題は、2つの重複分子、すなわち、同じ開始および停止位置を有する分子が異なる独自の識別子を保有し、そのため配列読み取りデータが特定の親分子にさかのぼって突き止められる可能性があるように、十分な数の独自の識別子(例えば、タグカウント)で親分子にタグ付けすることにより減らすことが可能である。この問題への1つのアプローチは、試料中のすべての、またはほぼすべての異なる親分子を独自にタグ付けすることである。しかし、試料中の一倍体遺伝子等価物の数および断片サイズの分布に応じて、これは数十億の異なる独自の識別子が必要になる可能性がある。
この方法は扱いにくく高価になることがある。一部の態様では、断片化されたゲノムDNAの試料中のポリヌクレオチドの集団が、n個の異なる独自の識別子でタグ付けされ、nは、少なくとも2および100,000z以下であり、zは、同じ開始および停止位置を有する重複分子の予想される数の中心傾向(例えば、平均、中央値、最頻値)の尺度である、方法および組成物が本明細書で提供される。ある特定の実施形態では、nは、2z、3z、4z、5z、6z、7z、8z、9z、10z、11z、12z、13z、14z、15z、16z、17z、18z、19z、20zまたは100zの少なくともいずれかである(例えば、下限値)。他の実施形態では、nは、100,000z、10,000z、2000z、1000z、500zまたは100z以下である(例えば、上限値)。したがって、nは、これら下限値と上限値の任意の組合せの間の範囲に及ぶことが可能である。ある特定の実施形態では、nは、100z~1000zの間、5z~15zの間、8z~12zの間、または約10zである。例えば、一倍体ヒトゲノム等価物は、約3ピコグラムのDNAを有する。約1マイクログラムのDNAの試料は、約300,000の一倍体ヒトゲノム等価物を含有する。数nは、15~45の間、24~36の間、64~2500の間、625~31,000の間、または約900~4000の間が可能である。シーケンシングの改良は、重複または同族ポリヌクレオチドの少なくとも一部が独自の識別子を保有する、すなわち、異なるタグを保有するかぎり、達成可能である。しかし、ある特定の実施形態では、使用されるタグの数は、いずれか1つの位置で開始するすべての重複分子が独自の識別子を保有する機会が少なくとも95%あるように選択される。例えば、cfDNAの約10,000の一倍体ヒトゲノム等価物を含む試料は、約36の独自の識別子でタグ付けすることが可能である。独自の識別子は、6つの独自のDNAバーコードを含むことが可能である。ポリヌクレオチドの両末端に付着させれば、考えられる36の独自の識別子が作成される。そのようにしてタグ付けされる試料は、断片化されたポリヌクレオチド、例えば、ゲノムDNA、例えば、cfDNAの約10ngから約100ng、約1μg、約10μgのいずれかまでの範囲を有する試料が可能である。
したがって、本開示は、タグ付きポリヌクレオチドの組成物も提供する。ポリヌクレオチドは、断片化されたDNA、例えば、cfDNAを含むことが可能である。ゲノム中でマッピング可能な塩基位置にマッピングされる組成物中のポリヌクレオチドのセットは、非独自にタグ付けが可能であり、すなわち、異なる識別子の数は少なくとも2であり、マッピング可能な塩基位置にマッピングされるポリヌクレオチドの数より少ないことが可能である。約10ng~約10μgの間(例えば、約10ng~1μg、約10ng~100ng、約100ng~10μg、約100ng~1μg、約1μg~10μgのいずれか)の組成物は、2、5、10、50または100のいずれかから100、1000、10,000または100,000のいずれかの間の異なる識別子を保有することが可能である。例えば、5~100の間または100~4000の間の異なる識別子を使用すればそのような組成物中のポリヌクレオチドにタグ付けすることが可能になる。
異なる分子が同じ座標にマッピングされており(この場合、同じ開始/停止位置を有する)、異なるタグではなく同じタグを保有するイベントは「分子衝突」と呼ばれる。ある特定の例では、分子衝突の実際の数は、例えば、上記のように計算された理論的衝突の数よりも大きくてもよい。これは、座標を横切る分子の不均等分布、バーコード間のライゲーションの効率の違いおよび他の要因の関数である可能性がある。この場合は、経験的方法を使用すれば、理論的衝突数に近づくのに必要なバーコードの数を決定することが可能である。一実施形態では、シーケンシングされた分子の長さ分布および配列均一性に基づいて所与の一倍体ゲノム等価物についてのバーコード衝突を減らすのに必要なバーコードの数を決定する方法が本明細書に提供される。方法は、核酸分子の複数のプールを創り出すステップと;それぞれのプールを徐々に増加する数のバーコードでタグ付けするステップと;バーコード衝突の数を理論的なレベルにまで低減するバーコードの最適数を決定するステップとを含み、例えば、それは、プール化およびライゲーション効率の違いに起因する有効バーコード濃度の違いに起因する可能性がある。
一実施形態では、領域にマッピングされているポリヌクレオチドを実質的に独自にタグ付けするのに必要な識別子の数は、経験的に決定することが可能である。例えば、選択された数の異なる識別子を試料中の分子に付着させることが可能であり、領域にマッピングされている分子についての異なる識別子の数は計数することが可能である。使用される識別子の数が不十分である場合、領域にマッピングされている一部のポリヌクレオチドは同じ識別子を保有することになる。その場合、計数される識別子の数は試料中の最初の分子の数よりも少なくなる。使用される異なる識別子の数は、新しい最初の分子を表す追加の識別子が検出されなくなるまで、試料タイプについて反復的に増加させることが可能である。例えば、第1の反復では、5つの異なる識別子が計数されて、少なくとも5つの異なる最初の分子を表す場合がある。第2の反復では、さらに多くのバーコードを使用して、7つの異なる識別子が計数されて、少なくとも7つの異なる最初の分子を表す。第3の反復では、さらに多くのバーコードを使用して、10の異なる識別子が計数され、少なくとも10の異なる最初の分子を表す。第4の反復では、さらに多くのバーコードを使用して、10の異なる識別子が再び計数される。この時点で、さらに多くのバーコードを加えても検出される最初の分子の数を増やす可能性は低い。
6.シーケンシング
先行する増幅を伴ってまたは伴わずに、アダプターに隣接する試料核酸をシーケンシングに付すことができる。シーケンシング方法として、例えば、サンガー(Sanger)シーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、RNA-Seq(Illumina)、デジタル遺伝子発現(Helicos)、次世代シーケンシング(NGS)、合成による単一分子シーケンシング(SMSS)(Helicos)、大量並列シーケンシング、クローナル単一分子アレイ(Solexa)、ショットガンシーケンシング、Ion Torrent、Oxford Nanopore、Roche Genia、マキシム-ギルバート(Maxim-Gilbert)シーケンシング、プライマーウォーキング、PacBioを使用するシーケンシング、SOLiD、Ion TorrentまたはNanoporeプラットフォームが挙げられる。シーケンシング反応は、複数のレーン、複数のチャネル、複数のウェルまたは複数の試料セットを実質的に同時に処理するその他の手段であり得る種々の試料処理ユニットで実施できる。試料処理ユニットはまた、複数の実施を同時に処理可能にする複数の試料チャンバーを含み得る。
シーケンシング反応は、がんまたは他の疾患のマーカーを含有することが分かっている1つまたは複数の断片タイプで実施することが可能である。シーケンシング反応はまた、試料中に存在する任意の核酸断片で実施できる。シーケンシング反応は、少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%のゲノムの配列カバー度を提供し得る。その他の場合には、ゲノムの配列カバー度は、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%未満であり得る。
同時シーケンシング反応は、マルチプレックスシーケンシングを使用して実施してもよい。いくつかの場合には、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000のシーケンシング反応を用いて無細胞核酸をシーケンシングしてもよい。その他の場合には、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満のシーケンシング反応を用いて無細胞ポリヌクレオチドをシーケンシングしてもよい。シーケンシング反応は、逐次実施しても、同時に実施してもよい。その後のデータ解析は、シーケンシング反応のすべてで実施しても、一部で実施してもよい。いくつかの場合には、データ解析は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000のシーケンシング反応で実施してもよい。その他の場合には、データ解析を1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満のシーケンシング反応で実施してもよい。
シーケンシング方法は、大規模並列シーケンシング、すなわち、少なくとも100、1000、10,000、100,000、100万、1000万、1億、または10億の核酸分子のいずれかを同時に(または立て続けに)シーケンシングすることが可能である。
7.解析
本方法を使用して、状態を特徴付ける(例えば、がんをステージ分類する、またはがんの不均一性を決定する)ため、状態の処置に対する応答をモニタリングするため、状態を発生する、または状態のその後の経過の有効な予後リスクのために、対象における状態、特に、がんの存在を診断できる。
本方法を使用して種々のがんを検出してもよい。がん細胞は、大半の細胞のように、古い細胞が死に、もっと新しい細胞により置き換えられる代謝回転速度により特徴付けることが可能である。一般的に、死細胞は、所与の対象において脈管構造と接触すると、DNAまたはDNAの断片を血流中に放出する場合がある。これは、疾患の種々の段階中のがん細胞にも当てはまる。がん細胞は、疾患の段階に応じて、コピー数変異ならびに稀な突然変異などの種々の遺伝子異常により特徴付けてもよい。この現象を使用して、本明細書に記載される方法およびシステムを使用してがんの個体の存在または非存在を検出してもよい。
検出され得るがんの種類および数は、血液がん、脳がん、肺がん、皮膚がん、鼻がん、咽頭がん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固体状態腫瘍、不均一腫瘍、均一腫瘍などを含み得る。
がんは、突然変異、希少突然変異、挿入欠失、コピー数変異、トランスバージョン、転位置、反転、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変化、遺伝子融合、染色体融合、遺伝子末端切断、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸の化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化および核酸メチル化感染症およびがんにおける異常な変化を含む遺伝的変異から検出され得る。
遺伝子データはまた、特定の形態のがんを特徴付けるために使用できる。がんは、組成およびステージ分類の両方において不均一であることが多い。遺伝子プロファイルデータは、その特定の亜種の診断または処置において重要であり得る、がんの特定の亜種を特徴付けることを可能にし得る。この情報はまた、対象または施術者に特定の種類のがんの予後に関する手がかりを提供し、対象または施術者のいずれかが、疾患の進行に従って処置選択肢を適合させることを可能にし得る。いくつかのがんは、より攻撃的に、遺伝子的に不安定になるように進行する。その他のがんは、良性で、不活性または休止状態のままであり得る。本開示のシステムおよび方法は、疾患進行の決定において有用であり得る。
本解析はまた、特定の処置選択肢の有効性の決定において有用である。処置が成功する場合には、より多くのがんが死滅し、DNAを流し出す可能性があるので、成功する処置選択肢は、対象の血液において検出されるコピー数変異または希少突然変異の量を増大させ得る。その他の例では、これは、起こらない可能性がある。別の例では、おそらくある特定の処置選択肢は、経時的にがんの遺伝子プロファイルと相関し得る。この相関は、療法の選択において有用であり得る。さらに、がんが、処置後に緩解状態にあると観察される場合には、本方法を使用して、残存する疾患または疾患の再発をモニタリングできる。
本方法はまた、がん以外の状態において遺伝的変異を検出するために使用できる。B細胞などの免疫細胞は、ある特定の疾患の存在時に迅速なクローン性増殖を起こし得る。クローン性増殖は、コピー数変異検出を使用してモニタリングしてもよく、ある特定の免疫状態をモニタリングしてもよい。この例では、コピー数変異解析を経時的に実施して、特定の疾患がどのように進行し得るのかのプロファイルを作成してもよい。コピー数変異またはさらには希少突然変異検出を使用して、病原体の集団が、どのように感染の過程の間に変化するかを決定してもよい。これは、HIV/AIDSまたは肝炎感染症などの慢性感染の際に特に重要であり得、それによって、ウイルスが、感染の過程の間に、生活環状態を変化させ、および/またはより病原性の形態に突然変異し得る。本方法を、免疫細胞が移植組織を破壊しようとする際の、宿主身体の拒絶活性を決定する、またはプロファイルして、移植組織の状態をモニタリングし、ならびに処置の過程を変更するまたは拒絶を予防するために使用してもよい。
さらに、本開示の方法であって、対象における細胞外ポリヌクレオチドの遺伝子プロファイルを作成するステップを含み、遺伝子プロファイルが、コピー数変異および稀な突然変異分析から生じる複数のデータを含む、方法を使用して、対象における異常な状態の不均一性を特徴付けてもよい。がんを含むがこれに限定されない、一部の場合、疾患は不均一でもよい。疾患細胞は同一でなくてもよい。がんの例では、一部の腫瘍は、異なるタイプの腫瘍細胞、がんの異なる段階の一部の細胞を含むことが分かっている。その他の例では、不均一性は、複数の病巣を含み得る。やはり、がんの例では、おそらくは、1つまたは複数の病巣が、原発部位から広がった転移の結果である複数の腫瘍病巣がある場合がある。
本方法は、不均一疾患中の異なる細胞に由来する遺伝情報の総和である、フィンガープリントまたはデータのセットを作成する、またはプロファイルするために使用してもよい。このデータのセットは、コピー数変異および珍しい突然変異解析を単独または組み合わせて含み得る。
本方法を使用すれば、胎児起源のがんまたは他の疾患を診断する、予後する、モニタリングするまたは観察することが可能になる。すなわち、これらの方法論を妊娠対象で用いて、そのDNAおよび他の核酸が母体の分子と同時循環している場合がある、まだ生まれていない対象においてがんまたは他の疾患を診断する、予後する、モニタリングするまたは観察してもよい。
9.キット
本開示は、上記方法のいずれかの実行のためのキットも提供する。例示的キットは、それぞれTおよびC単一ヌクレオチド3’尾部を有する少なくとも部分的に二本鎖のアダプターの対を含む。好ましくは、対合したオリゴヌクレオチドは、TおよびC尾部を除いて同一である。必要に応じて、キットは、AおよびG単一ヌクレオチド3’尾部を有する少なくとも部分的に二本鎖のアダプターがない。好ましくは、アダプターは、配列番号1および2、ならびに3および2のオリゴヌクレオチドを含むアダプターなどのY型である。キットは、T4ポリメラーゼもしくはクレノウ大断片、および/またはTaqポリメラーゼなどの方法の実行のための酵素、ならびに必要に応じて、4つの標準ヌクレオチドタイプも含むことが可能である。キットは、特許請求される方法の実行のための説明書を提供するパッケージング、リーフレット、またはCDなども含むことが可能である。
CおよびT尾部付加アダプターの使用は、試料中のより多くの分子を捕捉することにより感度を高めるのに寄与した。C-アダプターは、下の表2に示すように、Tアダプターに対して0から1対2.75(36%)に変動する比で試験した。
Figure 0007046097000002
Figure 0007046097000003
C尾部付加アダプターが存在したすべての試料は、C尾部が存在しない試料よりもアダプターにライゲーションされた核酸の高い収率(%ライゲーション)を示した。最良の収率はC尾部付加プライマーがT尾部付加プライマーに対して1対3.25(約30%)の比であるが、改良された収率は、0.5対3.25(約15%)~1対2.75(36%)の比で得られた。
増幅されたDNAのシーケンシング後、調製ごとに多様性を計算した。多様性は、(bpでの平均DNA分子サイズ)(シーケンシングされた独自の分子の#)/(bpでの標的にされた領域サイズ)により計算される、シーケンシングされた分子の数である。多様性は、C尾部付加アダプターが存在する試料中でのほうが一般的に大きかった。シーケンシングは、組み込まれたT尾部付加アダプターのC尾部付加アダプターに対する割合が約10%であることも示した。
上または下に引用されるすべての特許申請、ウェブサイト、他の出版物、および受託番号などは、あたかもそれぞれ個々の項目が参照によりそのように組み込まれることが明確におよび個別に示されている場合と同じ程度にあらゆる目的のためにその全体が参照により組み込まれる。配列の異なるバージョンが異なる時期の受託番号に関連している場合、本出願の有効出願日にその受託番号に関連しているバージョンを意味する。有効出願日とは、実際の出願日よりも早期、または該当する場合、受託番号に言及する優先権出願の出願日を意味する。同様に、出版物、またはウェブサイトなどの異なるバージョンが異なる時期に公表される場合、他の方法で示されていなければ、出願の有効出願日の直近に公表されたバージョンを意味する。本発明のいかなる特長、ステップ、要素、実施形態、または態様も、明確に他の方法で示されていなければ、他のいずれとも組み合わせて使用することが可能である。本発明は、明快さおよび理解を目的に図表および実施例によりある程度詳細に説明してきたが、添付の特許請求の範囲内で、ある特定の変更および改変を実行してもよいことは明らかである。
本発明は、例えば、以下の項目を提供する。
(項目1)
分析のために核酸を調製する方法であって、
(a)5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を提供する1つまたは複数の酵素ならびに4つの標準ヌクレオチドタイプの作用により試料中の一本鎖オーバーハングを有する二本鎖核酸を平滑末端とするステップであって、5’末端を有する一本鎖オーバーハングが、前記ポリメラーゼ活性による相補鎖の伸長のための鋳型として働き、3’末端を有する一本鎖オーバーハングが、前記プルーフリーディング活性により消化されて平滑末端化核酸を生じる、ステップと、
(b)前記平滑末端化核酸を前記試料の他の成分から分離せずに、3’-5’プルーフリーディング機能のないポリメラーゼの作用により前記平滑末端化核酸の末端に尾部を付加するステップであって、これにより平滑末端化核酸の3’末端へのヌクレオチドの非鋳型特異的付加が実施され、Aが優先的に、次にGが優先的に、次にCまたはTが付加される、ステップと;
(c)ステップ(c)の前記核酸を3’末端に単一ヌクレオチドTまたはCオーバーハングを有する少なくとも部分的に二本鎖のアダプターにアニールするステップと;
(d)前記核酸を前記アダプターにライゲーションするステップと
を含む、方法。
(項目2)
ステップ(a)の後、前記1つまたは複数の酵素を変性させるステップをさらに含む、項目1に記載の方法。
(項目3)
前記試料を、前記1つまたは複数の酵素、前記4つの標準ヌクレオチドタイプおよび3’-5’プルーフリーディング機能のない前記ポリメラーゼと接触させるステップをさらに含む、項目1または2に記載の方法。
(項目4)
前記試料を、前記1つまたは複数の酵素、前記4つの標準ヌクレオチドタイプおよび3’-5’プルーフリーディング機能のない前記ポリメラーゼと一緒に接触させる、項目3に記載の方法。
(項目5)
ステップ(b)が、ステップ(a)よりも高い温度で実施される、前記項目のいずれかに記載の方法。
(項目6)
ステップ(a)が、周囲温度で実施され、ステップ(b)が、60℃を超える温度で実施される、項目5に記載の方法。
(項目7)
前記1つまたは複数の酵素が、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有するポリメラーゼである、前記項目のいずれかに記載の方法。
(項目8)
3’-5’プルーフリーディング機能のない前記ポリメラーゼが、熱安定性ポリメラーゼであり、前記方法が、ステップ(a)の後、前記試料の温度を上げるステップであって、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有する前記ポリメラーゼを不活化するステップをさらに含む、前記項目のいずれかに記載の方法。
(項目9)
(e)前記アダプターにライゲーションされた前記核酸を増幅するステップと;(f)前記核酸を分析するステップとをさらに含む、前記項目のいずれかに記載の方法。
(項目10)
前記試料を、前記ライゲーションするステップでの前記3’末端へのヌクレオチドの非鋳型特異的付加を受けなかった平滑末端化二本鎖核酸とライゲーションする少なくとも部分的に二本鎖の平滑末端化アダプターと接触させるステップをさらに含む、前記項目のいずれかに記載の方法。
(項目11)
5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有する前記ポリメラーゼが、T4ポリメラーゼまたはクレノウ大断片である、項目7に記載の方法。
(項目12)
3’-5’プルーフリーディング機能のない前記ポリメラーゼが、Taqポリメラーゼである、前記項目のいずれかに記載の方法。
(項目13)
少なくともステップ(a)~(d)が、単一チューブで実施される、前記項目のいずれかに記載の方法。
(項目14)
少なくともステップ(a)~(d)では、前記試料から成分が除去されない、前記項目のいずれかに記載の方法。
(項目15)
ステップ(a)~(e)が、単一チューブで実施される、項目9に記載の方法。
(項目16)
単一ヌクレオチドTを有する少なくとも部分的に二本鎖のアダプターの単一ヌクレオチドCを有するものに対するモル比が、4:1~2:1である、前記項目のいずれかに記載の方法。
(項目17)
平滑末端化アダプターの尾部付加アダプターに対するモル比が、1:5~1:500である、項目16に記載の方法。
(項目18)
前記試料中の前記二本鎖核酸の少なくとも70%が、アダプターにつながっている、前記項目のいずれかに記載の方法。
(項目19)
前記試料中の利用可能な二本鎖核酸の少なくとも70%が分析される、項目9に記載の方法。
(項目20)
ステップ(f)が、前記アダプターにライゲーションされている前記核酸をシーケンシングすることを含む、項目9に記載の方法。
(項目21)
前記シーケンシングすることで、ステップ(c)または(d)においてオーバーハングを形成したヌクレオチドをシーケンシングする、項目20に記載の方法。
(項目22)
二本鎖DNAをアダプタータグ付きDNAに変換する方法であって、
(a)二本鎖DNA分子の集団を少なくとも部分的に二本鎖のアダプターの集団と接触させるステップであって、
(i)二本鎖DNA分子の前記集団が、単一ヌクレオチドAオーバーハングを含むDNA分子および単一ヌクレオチドGオーバーハングを含むDNA分子を含み、単一ヌクレオチドAオーバーハングは、前記集団中で単一ヌクレオチドGオーバーハングよりも豊富であり(例えば、10倍、100倍、1000倍)、
(ii)少なくとも部分的に二本鎖のアダプターの前記集団が、単一ヌクレオチドTオーバーハングを含むアダプターおよび単一ヌクレオチドCオーバーハングを含むアダプターを含む、ステップと;
(b)前記アダプターを前記DNA分子にライゲーションするステップであって、これによりアダプタータグ付きDNAを生成するステップと
を含む、方法。
(項目23)
(i)二本鎖DNA分子の前記集団が、単一ヌクレオチドCオーバーハングを含むDNA分子、単一ヌクレオチドTオーバーハングを含むDNA分子および平滑末端のうちの少なくとも1つをさらに含み、
(ii)少なくとも部分的に二本鎖のアダプターの前記集団が、単一ヌクレオチドGオーバーハングを含むアダプター、単一ヌクレオチドAオーバーハングを含むアダプターおよび平滑末端のうちの少なくとも1つをさらに含む、項目22に記載の方法。
(項目24)
前記少なくとも部分的に二本鎖のアダプターが、NGS(「次世代シーケンシング」)プライマー結合部位およびDNAバーコードを含む、項目22または23に記載の方法。
(項目25)
前記少なくとも部分的に二本鎖のアダプターの前記集団が、複数の異なるDNAバーコードを含む、項目22から25のいずれか一項に記載の方法。
(項目26)
二本鎖DNA分子の両末端に付着可能なバーコード組合せの数が、前記集団中で二本鎖DNA分子の数よりも少なく、例えば、5~10,000の間の異なる組合せである、項目25に記載の方法。
(項目27)
試料インデックスバーコードを含む増幅プライマーおよびフローセル支持体に固定されたオリゴヌクレオチドにハイブリダイズするように適合されたヌクレオチド配列を使用して前記アダプタータグ付きDNAを増幅するステップ
をさらに含む、項目24に記載の方法。
(項目28)
前記アダプターが、Y型アダプターである、項目22から27のいずれか一項に記載の方法。
(項目29)
前記試料が、体液試料である、前記項目のいずれかに記載の方法。
(項目30)
前記試料が、全血、血清、または血漿である、項目29に記載の方法。
(項目31)
核酸集団が、無細胞核酸集団、好ましくは無細胞DNAである、項目22から30のいずれか一項に記載の方法。
(項目32)
前記試料が、がんを有すると疑われる対象由来である、前記項目のいずれかに記載の方法。
(項目33)
前記分析するステップが、体細胞または生殖系列バリアントを検出する、項目9に記載の方法。
(項目34)
前記分析するステップが、コピー数変異を検出する、項目9に記載の方法。
(項目35)
前記分析するステップが、単一ヌクレオチド変異(SNV)を検出する、項目9に記載の方法。
(項目36)
前記項目のいずれかに記載の方法により生成される適合された核酸の集団であって、複数の核酸分子を含み、そのそれぞれが、核酸断片とアダプターの間にA/TまたはG/C塩基対を有するバーコードを含むアダプターが両側に隣接している前記核酸断片を含む、集団。
(項目37)
前記複数の核酸分子が、少なくとも100,000分子である、項目36に記載の集団。
(項目38)
A/T塩基対のG/C塩基対に対する比が、2:1~4:1の間である、項目36または37に記載の集団。
(項目39)
前記集団中の核酸分子の少なくとも99%が、異なるバーコードを有するアダプターが隣接している核酸断片を有する、項目36から38のいずれか一項に記載の集団。
(項目40)
それぞれTおよびC単一ヌクレオチド3’尾部を有する少なくとも部分的に二本鎖のアダプターであって、前記尾部を除いて互いに同一であるアダプターの対を含むキット。
(項目41)
前記アダプターが、配列番号1および2、ならびに3および2のオリゴヌクレオチドを含むY型アダプターである、項目40に記載のキット。
(項目42)
T4ポリメラーゼまたはクレノウ大断片、およびTaqポリメラーゼ、ならびに4つの標準ヌクレオチドタイプをさらに含む、項目40または41に記載のキット。

Claims (15)

  1. 分析のために核酸を調製する方法であって、
    (a)5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を提供する1つまたは複数の酵素ならびに4つの標準ヌクレオチドタイプの作用により試料中の一本鎖オーバーハングを有する二本鎖核酸を平滑末端とするステップであって、5’末端を有する一本鎖オーバーハングが、前記ポリメラーゼ活性による相補鎖の伸長のための鋳型として働き、3’末端を有する一本鎖オーバーハングが、前記プルーフリーディング活性により消化されて平滑末端化核酸を生じる、ステップと、
    (b)前記平滑末端化核酸を前記試料の他の成分から分離せずに、3’-5’プルーフリーディング機能のないポリメラーゼの作用により前記平滑末端化核酸の末端に尾部を付加するステップであって、これにより平滑末端化核酸の3’末端へのヌクレオチドの非鋳型特異的付加が実施され、Aが優先的に、次にGが優先的に、次にCまたはTが付加される、ステップと;
    (c)ステップ(b)の前記核酸を3’末端に単一ヌクレオチドTオーバーハングを有する少なくとも部分的に二本鎖のアダプターおよび3’末端に単一ヌクレオチドCオーバーハングを有する少なくとも部分的に二本鎖のアダプターにライゲーションするステップと;
    を含む、方法。
  2. ステップ(a)の後、前記1つまたは複数の酵素を変性させるステップをさらに含む、請求項1に記載の方法。
  3. 前記試料を、前記1つまたは複数の酵素、前記4つの標準ヌクレオチドタイプおよび3’-5’プルーフリーディング機能のない前記ポリメラーゼと接触させるステップをさらに含み、前記試料を、前記1つまたは複数の酵素、前記4つの標準ヌクレオチドタイプおよび3’-5’プルーフリーディング機能のない前記ポリメラーゼと一緒に接触させる、請求項1または2に記載の方法。
  4. ステップ(b)が、ステップ(a)よりも高い温度で実施され、ステップ(a)が、周囲温度で実施され、ステップ(b)が、60℃を超える温度で実施される、請求項1から3のいずれか一項に記載の方法。
  5. (i)前記1つまたは複数の酵素が、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有するポリメラーゼであり、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を有する前記ポリメラーゼが、T4ポリメラーゼまたはクレノウ大断片であり、および/または
    (ii)3’-5’プルーフリーディング機能のない前記ポリメラーゼが、熱安定性ポリメラーゼであり、前記方法が、ステップ(a)の後、前記試料の温度を上げるステップであって、5’-3’ポリメラーゼ活性および3’-5’プルーフリーディング活性を提供する前記1つまたは複数の酵素を不活化するステップをさらに含む、
    請求項1から4のいずれか一項に記載の方法。
  6. )前記アダプターにライゲーションされた前記核酸を増幅するステップと;()前記核酸を分析するステップとをさらに含み
    (i)ステップ(a)~(d)が、単一チューブで実施されるか、
    (ii)前記試料中の利用可能な二本鎖核酸の少なくとも70%が分析されるか、
    (iii)ステップ(e)が、前記アダプターにライゲーションされている前記核酸をシーケンシングすることを含み、前記シーケンシングすることで、ステップ(c)においてオーバーハングを形成したヌクレオチドをシーケンシングするか、
    (iv)前記分析するステップが、体細胞または生殖系列バリアントを検出するか、
    (v)前記分析するステップが、コピー数変異を検出するか、または
    (vi)前記分析するステップが、単一ヌクレオチド変異(SNV)を検出する、
    請求項1から5のいずれか一項に記載の方法。
  7. 前記試料を、前記ステップ(b)での前記3’末端へのヌクレオチドの非鋳型特異的付加を受けなかった平滑末端化二本鎖核酸とライゲーションする少なくとも部分的に二本鎖の平滑末端化アダプターと接触させるステップをさらに含む、請求項1から6のいずれか一項に記載の方法。
  8. (i)3’-5’プルーフリーディング機能のない前記ポリメラーゼが、Taqポリメラーゼであるか、
    (ii)少なくともステップ(a)~(c)が、単一チューブで実施されるか、
    (iii)少なくともステップ(a)~(c)では、前記試料から成分が除去されないか、
    (iv)単一ヌクレオチドTを有する少なくとも部分的に二本鎖のアダプターの単一ヌクレオチドCを有するものに対するモル比が、4:1~2:1であり、平滑末端化アダプターの尾部付加アダプターに対するモル比が、1:5~1:500であるか、および/または
    (v)前記試料中の前記二本鎖核酸の少なくとも70%が、アダプターにつながっている、
    請求項1から7のいずれか一項に記載の方法。
  9. 二本鎖DNAをアダプタータグ付きDNAに変換する方法であって、
    (a)二本鎖DNA分子の集団を少なくとも部分的に二本鎖のアダプターの集団と接触させるステップであって、
    (i)二本鎖DNA分子の前記集団が、単一ヌクレオチドAオーバーハングを含むDNA分子および単一ヌクレオチドGオーバーハングを含むDNA分子を含み、単一ヌクレオチドAオーバーハングは、前記集団中で単一ヌクレオチドGオーバーハングよりも豊富であり(例えば、10倍、100倍、1000倍)、
    (ii)少なくとも部分的に二本鎖のアダプターの前記集団が、単一ヌクレオチドTオーバーハングを含むアダプターおよび単一ヌクレオチドCオーバーハングを含むアダプターを含む、ステップと;
    (b)前記アダプターを前記DNA分子にライゲーションするステップであって、これによりアダプタータグ付きDNAを生成するステップと
    を含む、方法。
  10. (i)二本鎖DNA分子の前記集団が、単一ヌクレオチドCオーバーハングを含むDNA分子、単一ヌクレオチドTオーバーハングを含むDNA分子および平滑末端のうちの少なくとも1つをさらに含み、
    (ii)少なくとも部分的に二本鎖のアダプターの前記集団が、単一ヌクレオチドGオーバーハングを含むアダプター、単一ヌクレオチドAオーバーハングを含むアダプターおよび平滑末端のうちの少なくとも1つをさらに含む、請求項9に記載の方法。
  11. 前記少なくとも部分的に二本鎖のアダプターが、NGS(「次世代シーケンシング」)プライマー結合部位およびDNAバーコードを含み
    試料インデックスバーコードを含む増幅プライマーおよびフローセル支持体に固定されたオリゴヌクレオチドにハイブリダイズするように適合されたヌクレオチド配列を使用して前記アダプタータグ付きDNAを増幅するステップ
    をさらに含む、請求項9または10に記載の方法。
  12. 前記少なくとも部分的に二本鎖のアダプターの前記集団が、複数の異なるDNAバーコードを含み、二本鎖DNA分子の両末端に付着可能なバーコード組合せの数が、前記集団中で二本鎖DNA分子の数よりも少なく、例えば、5~10,000の間の異なる組合せである、請求項9から11のいずれか一項に記載の方法。
  13. (i)前記アダプターが、Y型アダプターであるか、および/または
    (ii)二本鎖DNA分子の前記集団が、無細胞核酸集団、好ましくは無細胞DNAである、
    請求項9から12のいずれか一項に記載の方法。
  14. 前記試料が、体液試料であり、前記試料が、全血、血清、または血漿である、請求項1から13のいずれか一項に記載の方法。
  15. 前記試料が、がんを有すると疑われる対象由来である、請求項1から14のいずれか一項に記載の方法。
JP2019555645A 2017-04-14 2018-04-13 試料核酸にアダプターを付着する方法 Active JP7046097B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022016339A JP7514263B2 (ja) 2017-04-14 2022-02-04 試料核酸にアダプターを付着する方法

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201762485769P 2017-04-14 2017-04-14
US62/485,769 2017-04-14
USPCT/US2017/027809 2017-04-14
PCT/US2017/027809 WO2017181146A1 (en) 2016-04-14 2017-04-14 Methods for early detection of cancer
US201762486663P 2017-04-18 2017-04-18
US62/486,663 2017-04-18
US201762517145P 2017-06-08 2017-06-08
US62/517,145 2017-06-08
PCT/US2018/027632 WO2018191702A2 (en) 2017-04-14 2018-04-13 Methods of attaching adapters to sample nucleic acids

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022016339A Division JP7514263B2 (ja) 2017-04-14 2022-02-04 試料核酸にアダプターを付着する方法

Publications (3)

Publication Number Publication Date
JP2020516281A JP2020516281A (ja) 2020-06-11
JP2020516281A5 JP2020516281A5 (ja) 2021-05-20
JP7046097B2 true JP7046097B2 (ja) 2022-04-01

Family

ID=63792821

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019555645A Active JP7046097B2 (ja) 2017-04-14 2018-04-13 試料核酸にアダプターを付着する方法
JP2022016339A Active JP7514263B2 (ja) 2017-04-14 2022-02-04 試料核酸にアダプターを付着する方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022016339A Active JP7514263B2 (ja) 2017-04-14 2022-02-04 試料核酸にアダプターを付着する方法

Country Status (10)

Country Link
US (2) US20200131567A1 (ja)
EP (2) EP3610032B1 (ja)
JP (2) JP7046097B2 (ja)
CN (1) CN110546272B (ja)
AU (1) AU2018252018A1 (ja)
CA (1) CA3057163A1 (ja)
ES (2) ES2962223T3 (ja)
HU (1) HUE063675T2 (ja)
PL (1) PL3885445T3 (ja)
WO (1) WO2018191702A2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093330A1 (en) 2012-12-10 2014-06-19 Clearfork Bioscience, Inc. Methods for targeted genomic analysis
MX2018005858A (es) 2015-11-11 2019-02-20 Resolution Bioscience Inc Construccion de alta eficacia de bibliotecas de adn.
EP3443066B1 (en) 2016-04-14 2024-10-02 Guardant Health, Inc. Methods for early detection of cancer
WO2018039463A1 (en) 2016-08-25 2018-03-01 Resolution Bioscience, Inc. Methods for the detection of genomic copy changes in dna samples
CN116144735A (zh) * 2019-08-12 2023-05-23 深圳市真迈生物科技有限公司 核酸样本处理方法、测序方法和试剂盒
JP2023540782A (ja) * 2020-09-08 2023-09-26 レゾリューション バイオサイエンス, インコーポレイテッド 遺伝子ライブラリーの高効率構築および遺伝子解析のためのアダプターおよび方法
CA3199189A1 (en) * 2020-11-25 2022-06-02 Gudrun Stengel Multiplexed profiling of rna and dna modifications
EP4265721A1 (en) * 2020-12-15 2023-10-25 Genodive Pharma Inc. Method for evaluating adapter ligation efficiency in sequence of dna sample
WO2023023402A2 (en) * 2021-08-20 2023-02-23 Guardant Health, Inc. Methods for simultaneous molecular and sample barcoding
AU2022397404A1 (en) * 2021-11-24 2024-06-13 Alida Biosciences, Inc. Rna and dna analysis using engineered surfaces

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016535979A (ja) 2013-09-25 2016-11-24 サーモ フィッシャー サイエンティフィック バルチックス ユーエービー Dna末端修復、アデニル化、リン酸化のための酵素組成物

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
AU2002359522A1 (en) 2001-11-28 2003-06-10 Applera Corporation Compositions and methods of selective nucleic acid isolation
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
WO2011161549A2 (en) * 2010-06-24 2011-12-29 Population Genetics Technologies Ltd. Methods and compositions for polynucleotide library production, immortalization and region of interest extraction
US8829172B2 (en) * 2011-03-11 2014-09-09 Academia Sinica Multiplex barcoded paired-end diTag (mbPED) sequencing approach and ITS application in fusion gene identification
WO2015103339A1 (en) * 2013-12-30 2015-07-09 Atreca, Inc. Analysis of nucleic acids associated with single cells using nucleic acid barcodes
WO2016019360A1 (en) * 2014-08-01 2016-02-04 Dovetail Genomics Llc Tagging nucleic acids for sequence assembly
WO2016135300A1 (en) * 2015-02-26 2016-09-01 Qiagen Gmbh Efficiency improving methods for gene library generation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016535979A (ja) 2013-09-25 2016-11-24 サーモ フィッシャー サイエンティフィック バルチックス ユーエービー Dna末端修復、アデニル化、リン酸化のための酵素組成物

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Analytical Biochemistry, 2015, 471, pp.80-82

Also Published As

Publication number Publication date
EP3610032A4 (en) 2020-05-06
ES2962223T3 (es) 2024-03-18
EP3885445A1 (en) 2021-09-29
EP3885445C0 (en) 2023-08-23
EP3610032A2 (en) 2020-02-19
JP2020516281A (ja) 2020-06-11
US20200283839A1 (en) 2020-09-10
CN110546272A (zh) 2019-12-06
US20200131567A1 (en) 2020-04-30
WO2018191702A2 (en) 2018-10-18
JP2022048389A (ja) 2022-03-25
WO2018191702A3 (en) 2019-02-21
EP3610032B1 (en) 2021-03-10
EP3885445B1 (en) 2023-08-23
PL3885445T3 (pl) 2024-01-29
ES2868074T3 (es) 2021-10-21
CA3057163A1 (en) 2018-10-18
HUE063675T2 (hu) 2024-01-28
AU2018252018A1 (en) 2019-10-10
JP7514263B2 (ja) 2024-07-10
CN110546272B (zh) 2024-06-07

Similar Documents

Publication Publication Date Title
JP7046097B2 (ja) 試料核酸にアダプターを付着する方法
JP6803327B2 (ja) 標的化されたシークエンシングからのデジタル測定値
RU2565550C2 (ru) Прямой захват, амплификация и секвенирование днк-мишени с использованием иммобилизированных праймеров
EP2964778B1 (en) Detection of genomic rearrangements by sequence capture
AU2018214075A1 (en) Systems and methods for prenatal genetic analysis
US10465241B2 (en) High resolution STR analysis using next generation sequencing
AU2021240263A1 (en) Isothermal methods and related compositions for preparing nucleic acids
WO2016181128A1 (en) Methods, compositions, and kits for preparing sequencing library
WO2017037657A1 (en) Method of identifying sequence variants using concatenation
CN110741096A (zh) 用于检测循环肿瘤dna的组合物和方法
CN105026578B (zh) 通过引物延伸合成探针库
US20240141425A1 (en) Correcting for deamination-induced sequence errors
JP2022512848A (ja) エピジェネティック区画アッセイを較正するための方法、組成物およびシステム
EP4048812B1 (en) Methods for 3' overhang repair

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210412

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210412

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210412

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210427

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210721

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220322

R150 Certificate of patent or registration of utility model

Ref document number: 7046097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150