JP2023533418A - シークエンシングライブラリーの収率を増加させるための方法 - Google Patents

シークエンシングライブラリーの収率を増加させるための方法 Download PDF

Info

Publication number
JP2023533418A
JP2023533418A JP2022567511A JP2022567511A JP2023533418A JP 2023533418 A JP2023533418 A JP 2023533418A JP 2022567511 A JP2022567511 A JP 2022567511A JP 2022567511 A JP2022567511 A JP 2022567511A JP 2023533418 A JP2023533418 A JP 2023533418A
Authority
JP
Japan
Prior art keywords
adapter
target nucleic
nucleic acid
dna
nucleic acids
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022567511A
Other languages
English (en)
Inventor
アンドリュー シー. アディ,
ライアン マルクイーン,
フランク スティーマーズ,
ディミトリー ケー. ポコロック,
ファン ジャン,
エスター マスグレイブ-ブラウン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oregon Health Science University
Original Assignee
Oregon Health Science University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oregon Health Science University filed Critical Oregon Health Science University
Priority claimed from PCT/US2021/036599 external-priority patent/WO2021252617A1/en
Publication of JP2023533418A publication Critical patent/JP2023533418A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1072Differential gene expression library synthesis, e.g. subtracted libraries, differential screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/101Modifications characterised by incorporating non-naturally occurring nucleotides, e.g. inosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/119Modifications characterised by incorporating abasic sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/186Modifications characterised by incorporating a non-extendable or blocking moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/125Specific component of sample, medium or buffer

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本開示は、シークエンシングライブラリーを調製するための組成物及び方法に関する。一実施形態では、方法は、各末端に同じアダプターを有する標的核酸のライブラリーを生成し、次いで、1つのアダプターの同一性を切り替えて、異なるアダプターに隣接する標的核酸をもたらすことを含む。

Description

(関連出願の相互参照)
本出願は、2020年6月9日に出願された米国仮特許出願第63/036,710号の利益を主張し、その全体が参照により本明細書に組み込まれる。
(政府出資)
本発明は、National Institutes of Healthにより授与されたR35GM124704の下で政府の支援によってなされた。政府は本発明において一定の権利を有する。
(配列表)
本出願は、2021年6月8日に作成されたサイズ2キロバイトの「2021-06-08-SequenceListing_ST25.txt」と題されたASCIIテキストファイルとして、EFS-Webを介して米国特許商標庁に電子的に提出された配列表を含む。配列表に含まれる情報は、参照により本明細書に組み込まれる。
(発明の分野)
本開示の実施形態は、シークエンシングのために核酸を調製することに関する。特に、本明細書で提供される方法、組成物、システム、及びキットの実施形態は、核酸ライブラリーを対称ユニバーサル配列を含む断片から非対称ユニバーサル配列を含む断片に変換し、そこから配列データを取得することに関する。
次世代シークエンシング(Next-generation sequencing、NGS)技術により、ゲノム研究が革命的に変化する。有効であることが証明されたNGSへの1つのアプローチは、断片が各末端に異なるアダプターを有するように処理されるシークエンシングライブラリーの生成である。次いで、ペアエンドシークエンシングを使用して、両方の鎖から配列情報を得る。ペアエンドアプローチの利点は、ランダムな様式で2つの独立した鋳型のそれぞれからの「n」個の塩基をシークエンシングするよりも、単一の鋳型からの「n」個の塩基をそれぞれ2本シークエンシングする方が、有意により多くの情報を得られる、ということである。しかしながら、各末端に異なるアダプターを付加するための方法は、第1のアダプターをDNA断片の一端及び第2のアダプターを同じDNA断片の他方の末端に選択的に標的化することが困難であるため、多くの場合非効率的である。例えば、シークエンシングライブラリーは、高度に効率的なタグメンテーションを使用して生成することができるが、実行可能なシークエンシングライブラリー分子は、順方向又は逆方向の一次配列の形態で異なるアダプターが分子の各末端に組み込まれている場合にのみ生成される。いくつかのタグメンテーション反応中に、2つの配列の各々が組み込まれる確率は等しく、したがって、半分の分子が順方向-順方向又は逆方向-逆方向アダプターの組み合わせを有するという結果になり、それによって理論収率が50%に低減する。
本明細書に提示されるのは、核酸をシークエンシングライブラリーに効率的に変換する方法及び組成物である。本明細書に提示される方法は、核酸の上鎖、核酸の下鎖、又は核酸の上鎖及び下鎖の両方について、順方向及び逆方向の両方のアダプターでタグ付けされた標的核酸のライブラリーを生成するためにアダプター交換を使用する代替戦略を含む。本方法は、全ゲノムシークエンシング、ゲノム立体配座捕捉、循環DNAシークエンシング、標的シークエンシング、2つ以上の分析物のコアッセイ、例えば、RNAとATAC又はDNAとRNA、及び単一細胞ゲノムを含むがこれらに限定されない、広範囲にわたるシークエンシングライブラリー調製方法に有用である。更に、このフォーマットにより、アダプター内に埋め込まれた1つ以上のインデックス配列の使用が可能になり、単一細胞コンビナトリアルインデックス付け(single-cell combinatorial indexing、sci)の適用が可能になる(例えば、Cusanovich,et al.,Science 348,910-914(2015)、Vitak et al.,Nat.Methods 14,302-308(2017)、Mulqueen et al.,Nat.Biotechnol.36,428-431(2018))。本明細書で提供される方法は、データ品質の改善、例えば、sci-HiCと比較した場合、s3-ATACの場合は、シグナル濃縮を犠牲にすることなく細胞ごとに得られる通過読み取りに関して既知の方法に対する顕著な改善、s3-WGSの場合はカバレッジ均一性、及びs3-GCCの場合は細胞ごとに得られるクロマチン接触の改善をもたらす。s3-ATAC、s3-WGS、及びs3-GCCが本明細書に記載されている。
定義
本明細書で使用される用語は、別段の指定がない限り、関連技術の通常の意味をとるものと理解されるであろう。本明細書で使用されるいくつかの用語及びそれらの意味は、以下に記載される。
本明細書で使用される場合、用語「生物」及び「対象」とは、交換可能に使用され、微生物(例えば、原核生物又は真核生物)、動物、及び植物を指す。動物の例は、ヒトなどの哺乳類である。
本明細書で使用される場合、用語「標的核酸」とは、核酸に関して使用する場合、本明細書に記載の方法又は組成物の文脈における核酸の意味的識別子として意図され、別途明示的に示されるもの以外の核酸の構造又は機能を必ずしも限定するものではない。標的核酸は、本質的に既知又は未知の配列の任意の核酸であってもよい。例えば、ゲノムDNA断片(例えば、染色体DNA)、プラスミドなどの染色体外DNA、循環DNA、又は循環RNA、1つの細胞又は複数の細胞からの核酸、無細胞DNA、RNA(例えば、mRNA)、又はcDNAであり得る。シークエンシングは、標的分子の全体又は一部の配列の決定をもたらし得る。標的は、核などの一次核酸試料に由来し得る。一実施形態では、標的は、各標的断片の末端にユニバーサル配列を配置することによって増幅に好適な鋳型に処理することができる。標的はまた、cDNAへの逆転写によって一次RNA試料から得ることもできる。一実施形態では、標的は、細胞内のDNA又はRNAのサブセットに関して使用される。標的シークエンシングは、一般にはPCR増幅(例えば、領域特異的プライマー)又はハイブリダイゼーションベースの捕捉法又は抗体のいずれかによる、対象とする遺伝子の選択及び単離を使用する。標的濃縮は、方法の様々な段階で行うことができる。例えば、標的RNA表現は、逆転写工程で標的特異的プライマーを使用するか、より複雑なライブラリーからサブセットをハイブリダイゼーションベースで濃縮することで得られる。例としては、エクソームシークエンシング又はL1000アッセイがある(Subramanian et al.,2017,Cell,171;1437-1452)。標的シークエンシングは、当業者に既知の濃縮プロセスのいずれかを含み得る。ユニバーサル配列の一端又は両端を有する標的核酸は、修飾標的核酸と称され得る。標的核酸など核酸への言及は、別途記載のない限り、一本鎖核酸及び二本鎖核酸の両方を含む。例えば、対称及び非対称の標的核酸は、本開示の方法において、二本鎖、一本鎖、又はある点で部分的に二本鎖及び一本鎖であり得る。
本明細書で使用する場合、用語「アダプター」及びその派生語、例えば、ユニバーサルアダプターとは、一般に、標的核酸に付加され得る任意の線状オリゴヌクレオチドを指す。アダプターは、一本鎖又は二本鎖DNAであり得るか、又は二本鎖領域及び一本鎖領域の両方を含み得る。アダプターは、プライマー、例えばユニバーサルプライマーの少なくとも一部と実質的に同一であるか、又は実質的に相補的である配列;下流エラー補正、識別、又はシークエンシングを補助するためのインデックス(本明細書ではバーコード又はタグとも呼ばれる)、並びに/又はUMIを含み得る。いくつかの実施形態では、アダプターは、試料中に存在する任意の標的配列の3’末端又は5’末端に実質的に非相補的である。いくつかの実施形態では、好適なアダプターの長さは、約6~100ヌクレオチド、約12~60ヌクレオチド、又は約15~50ヌクレオチドの長さの範囲である。例えば、用語「アダプター(adaptor)」及び「アダプター(adapter)」は、交換可能に使用される。
本明細書で使用するとき、用語「ユニバーサル」は、ヌクレオチド配列を記述するために使用する場合、2つ以上の核酸分子に共通する配列の領域を指し、分子はまた、互いに異なる配列の領域を有する。核酸コレクションの異なるメンバー内に存在するユニバーサル配列は、インデックスなどの別のヌクレオチド配列を標的核酸に付加するためのプライマーとして使用され得るヌクレオチド配列をアニーリングする後続工程において、「ランディングパッド」として使用され得る。核酸コレクションの異なるメンバー内に存在するユニバーサル配列は、ユニバーサル捕捉核酸の集団、例えば、ユニバーサル配列の一部に相補的な捕捉オリゴヌクレオチド、例えば、ユニバーサル捕捉配列を使用して、複数の異なる核酸を捕捉することができる。ユニバーサル捕捉配列の非限定的な例としては、P5及びP7プライマーと同一又は相補的な配列が挙げられる。同様に、分子の集合の異なるメンバーに存在するユニバーサル配列は、ユニバーサル配列の一部に相補的なユニバーサルプライマーの集団、例えば、ユニバーサルアンカー配列を使用して、複数の異なる核酸を複製(例えば、シークエンシング)又は増幅することができる。用語「A14」及び「B15」とは、ユニバーサルアンカー配列を指す場合に使用され得る。用語「A14’」(A14プライム)及び「B15’」(B15プライム)は、それぞれA14及びB15の相補体を指す。本明細書に提示される方法において、任意の好適なユニバーサルアンカー配列を使用し得ること、及びA14及びB15の使用は例示的な実施形態のみであることが理解されるであろう。一実施形態では、ユニバーサルアンカー配列は、ユニバーサルプライマー(例えば、リード1又はリード2のためのシークエンシングプライマー)がシークエンシングのためにアニーリングする部位として使用される。したがって、捕捉オリゴヌクレオチド又はユニバーサルプライマーは、ユニバーサル配列に特異的にハイブリダイズすることができる配列を含む。
用語「P5」及び「P7」は、ユニバーサル捕捉配列又は捕捉オリゴヌクレオチドを指す場合に使用され得る。用語「P5’」(P5プライム)及び「P7’」(P7プライム)は、それぞれP5及びP7の相補体を指す。本明細書に提示される方法において、任意の好適なユニバーサル捕捉配列又は捕捉ヌクレオチドを使用することができ、P5及びP7の使用は例示的な実施形態のみであることが理解されるであろう。フローセル上でのP5及びP7又はそれらの相補体などの捕捉ヌクレオチドの使用は、国際公開第2007/010251号、同第2006/064199号、同第2005/065814号、同第2015/106941号、同第1998/044151号、及び同第2000/018957号の開示によって例示されるように、当技術分野において既知である。例えば、任意の好適な順方向増幅プライマーは、固定化されているか又は溶液中にあるかに関わらず、相補的配列及び配列の増幅のために本明細書に提示される方法において有用であり得る。同様に、任意の好適な逆増幅プライマーは、固定化されているか又は溶液中にあるかに関わらず、相補的配列及び配列の増幅のために本明細書に提示される方法において有用であり得る。当業者であれば、本明細書に提示される核酸の捕捉及び/又は増幅に好適なプライマー配列の設計及び使用方法を理解するであろう。
本明細書で使用する場合、用語「プライマー」及びその派生語は、一般に、対象とする標的配列にハイブリダイズすることができる任意の核酸を指す。典型的には、プライマーは、ヌクレオチドがポリメラーゼによって重合され得るか、又はポリヌクレオチドがライゲートされ得る基質として機能するが、いくつかの実施形態では、プライマーは、合成された核酸鎖に組み込まれ、別のプライマーがハイブリダイズして、合成された核酸分子に相補的な新たな鎖合成をプライムすることができる部位を提供することができる。プライマーは、ヌクレオチド又はその類似体の任意の組み合わせを含み得る。いくつかの実施形態では、プライマーは、一本鎖オリゴヌクレオチド又はポリヌクレオチドである。用語「ポリヌクレオチド」及び「オリゴヌクレオチド」とは、任意の長さのヌクレオチドのポリマー形態を指すために本明細書において交換可能に使用され、リボヌクレオチド、デオキシリボヌクレオチド、これらの類似体、又はこれらの混合物を含み得る。これらの用語は、同等物として、ヌクレオチド類似体から作製されたDNA、RNA、cDNA、又は抗体-オリゴ共役のいずれかの類似体を含み、一本鎖(センス又はアンチセンスなど)及び二本鎖ポリヌクレオチドに適用可能であることを理解されたい。本明細書で使用するこの用語はまた、例えば逆転写酵素の作用によって、RNA鋳型から生成される相補的又はコピーDNAであるcDNAも包含する。この用語は、分子の一次構造のみを指す。したがって、この用語は、三本鎖、二本鎖、及び一本鎖デオキシリボ核酸(「DNA」)、並びに三本鎖、二本鎖、及び一本鎖リボ核酸(「RNA」)を含む。
本明細書で使用する場合、「インデックス」(「インデックス領域」、「インデックスアダプター」、「タグ」、又は「バーコード」とも呼ばれる)とは、核酸材料の試料若しくは供給源、又は標的核酸が存在する区画を識別するために使用することができる固有の核酸タグを指す。インデックスは、溶液中若しくは固体支持体上に存在し得るか、又は固体支持体に付着又は結合され、溶液若しくは区画に放出され得る。核酸試料が複数の供給源に由来する場合、各核酸試料中の核酸は、試料の供給源を特定することができるように、異なる核酸タグでタグ付けすることができる。当技術分野で知られているように、及び米国特許第8,053,192号、国際公開第05/068656号、及び米国特許出願公開第2013/0274117号の開示によって例示されるように、任意の適切なインデックス又はインデックスのセットを使用することができる。いくつかの実施形態では、インデックスは、Illumina社(San Diego,CA)の6塩基インデックス1(i7)配列、8塩基インデックス1(i7)配列、8塩基インデックス2(i5e)配列、10塩基インデックス1(i7)配列、又は10塩基インデックス2(i5)配列を含み得る。
本明細書で使用するとき、用語「固有分子識別子」又は「UMI」は、核酸に付けられ得る、ランダム、非ランダム、又は半ランダムのいずれかの分子タグを指す。核酸に組み込まれる場合、増幅後にシークエンシングされる固有分子識別子(unique molecular identifier、UMI)を直接カウントすることによって、UMIを使用して後続の増幅バイアスを補正することができる。UMIは、同様の核酸、例えば、アダプターに結合することができ、各核酸を固有にする。
本明細書で使用するとき、用語「アンプリコン」は、核酸に関して使用する場合、核酸のコピーの生成物を意味し、この生成物は、核酸のヌクレオチド配列の少なくとも一部と同じ又は相補的なヌクレオチド配列を有する。アンプリコンは、例えばポリメラーゼ伸長、ポリメラーゼ連鎖反応(polymerase chain reaction、PCR)、ローリングサークル増幅(rolling circle amplification、RCA)、ライゲーション伸長、又はライゲーション連鎖反応を含む鋳型として、核酸又はそのアンプリコンを使用する様々な増幅法のいずれかによって生成することができる。アンプリコンは、特定のヌクレオチド配列(例えば、PCR生成物)の単一コピー又はヌクレオチド配列(例えば、RCAのコンカテマー生成物)の複数のコピーを有する核酸分子であり得る。標的核酸の第1のアンプリコンは、典型的には相補的なコピーである。後続のアンプリコンは、第1のアンプリコンの生成後に、標的核酸又は第1のアンプリコンから作成されたコピーである。後続のアンプリコンは、標的核酸と実質的に相補的であるか、又は標的核酸と実質的に同一である配列を有し得る。
本明細書で使用する場合、「増幅する」、「増幅」又は「増幅反応」及びそれらの派生語は、一般に、核酸分子の少なくとも一部が少なくとも1つの追加の核酸分子に複製又はコピーされる任意の作用又はプロセスを指す。追加の核酸分子は、任意選択で、鋳型核酸分子の少なくとも一部と実質的に同一であるか、又は実質的に相補的である配列を含む。鋳型核酸分子は一本鎖又は二本鎖であってよく、追加の核酸分子は、独立して一本鎖又は二本鎖であり得る。増幅は、核酸分子の線形又は指数関数的複製を任意選択的に含む。いくつかの実施形態では、このような増幅は、等温条件を使用して行うことができ、他の実施形態では、このような増幅は、熱サイクリングを含み得る。いくつかの実施形態では、増幅は、単一増幅反応における複数の標的配列の同時増幅を含む多重増幅である。いくつかの実施形態では、「増幅」は、DNA及びRNAベースの核酸の少なくとも一部を単独で、又は組み合わせて増幅することを含む。増幅反応は、当業者に既知の増幅プロセスのいずれかを含み得る。いくつかの実施形態では、増幅反応は、ポリメラーゼ連鎖反応(polymerase chain reaction、PCR)を含む。
本明細書で使用する場合、用語「ポリメラーゼ連鎖反応」(「PCR」)とは、クローニング又は精製することなくゲノムDNAの混合物中の対象となるポリヌクレオチドのセグメントの濃度を増加させるための方法を記載するMullisの方法(米国特許第4,683,195号及び同第4,683,202号)を指す。対象のポリヌクレオチドを増幅するためのこのプロセスは、所望の対象ポリヌクレオチドを含有するDNA混合物に、多量の過剰の2つのオリゴヌクレオチドプライマーを導入すること、続いてDNAポリメラーゼの存在下で一連の熱サイクリングを行うことからなる。2つのプライマーは、対象の二本鎖ポリヌクレオチドのそれぞれの鎖に相補的である。最初に混合物がより高温で変性され、次いで、プライマーが、目的の分子のポリヌクレオチド内の相補的配列にアニーリングされる。アニーリング後、プライマーをポリメラーゼで伸長させて、相補鎖の新しい対を形成する。変性、プライマーアニーリング、及びポリメラーゼ伸長は、所望の目的ポリヌクレオチドの高濃度の増幅セグメントを得るために、何度も繰り返され得る(熱サイクリングと呼ばれる)。所望の目的ポリヌクレオチドの増幅セグメントの長さ(アンプリコン)は、互いに対するプライマーの相対位置によって決定され、したがって、この長さは制御可能なパラメータである。このプロセスを繰り返すことにより、この方法はPCRと呼ばれる。対象となるポリヌクレオチドの所望の増幅セグメントは、混合物中の主要な核酸配列(濃度に関して)になるため、これらは「PCR増幅された」と言われる。上記の方法の修飾において、標的核酸分子は、複数の異なるプライマー対を使用してPCR増幅することができ、場合によっては、対象とする標的核酸分子当たり1つ以上のプライマー対を使用してPCR増幅することができ、それによって多重PCR反応を形成することができる。
本明細書で使用するとき、「増幅条件」及びその派生語は、一般に、1つ以上の核酸配列を増幅するのに好適な条件を指す。このような増幅は、線形又は指数関数的であり得る。いくつかの実施形態では、増幅条件は、等温条件を含むことができ、あるいは、熱サイクリング条件、又は等温及び熱サイクリング条件の組み合わせを含み得る。いくつかの実施形態では、1つ以上の核酸配列を増幅するのに好適な条件としては、ポリメラーゼ連鎖反応(PCR)条件が挙げられる。典型的には、増幅条件は、ユニバーサル配列、若しくは標的特異的プライマーに隣接する1つ以上の標的配列などの核酸を増幅するか、又は1つ以上のアダプターに隣接する増幅標的配列を増幅するのに十分な反応混合物を指す。一般に、増幅条件は、増幅用の触媒、又は核酸合成、例えばポリメラーゼ、増幅される核酸に対してある程度相補性を有するプライマー、及び核酸にハイブリダイズしたときにプライマーの伸長を促進するためのデオキシリボヌクレオチド三リン酸(deoxyribonucleotide triphosphate、dNTP)などのヌクレオチドを含む。増幅条件は、プライマーの核酸へのハイブリダイゼーション又はアニーリング、プライマーの伸長、及び伸長プライマーが増幅を受ける核酸配列から分離される変性を必要とし得る。典型的には、必ずしもそうとは限らないが、増幅条件は、熱サイクリングを含み得るが、いくつかの実施形態では、増幅条件は、アニーリング、伸長、及び分離の工程が繰り返される複数のサイクルを含む。典型的には、増幅条件としては、Mg2+又はMn2+などのカチオンが挙げられ、イオン強度の様々な改質剤も含み得る。
本明細書で定義するように、「多重増幅」は、少なくとも1つの標的特異的プライマーを使用した、試料内の2つ以上の標的配列の選択的かつ非ランダム増幅を指す。いくつかの実施形態では、標的配列の一部又は全てが単一の反応容器内で増幅されるように多重増幅が行われる。所与の多重増幅の「プレックス」は、一般に、当該単一多重増幅中に増幅される、異なる標的特異的配列の数を指す。いくつかの実施形態では、プレックスは、約12プレックス、24プレックス、48プレックス、96プレックス、192プレックス、384プレックス、768プレックス、1536プレックス、3072プレックス、6144プレックス、又はそれ以上であり得る。増幅された標的配列をいくつかの異なる方法論(例えば、ゲル電気泳動とそれに続くデンシトメトリー、バイオアナライザー又は定量的PCRによる定量化、標識プローブでのハイブリダイゼーション、ビオチン化プライマーの組み込みとそれに続くアビジン-酵素共役の検出、増幅標的配列への32P標識デオキシヌクレオチド三リン酸の組み込み)によって検出することも可能である。
本明細書で使用するとき、用語「増幅部位」は、1つ以上のアンプリコンが生成され得るアレイ内又はアレイ上の部位を指す。増幅部位は、その部位で生成される少なくとも1つのアンプリコンを含有、保持、又は付着させるように更に構成することができる。
本明細書で使用するとき、用語「アレイ」は、相対的な位置に従って互いに区別することができる部位の集団を指す。アレイの異なる部位にある異なる分子は、アレイ内の部位の位置に従って互いに区別することができる。アレイの個々の部位は、特定の種類の1つ以上の分子を含み得る。例えば、部位は、特定の配列を有する単一の標的核酸分子を含むことができ、又は部位は、同じ配列(及び/又はその相補的配列)を有するいくつかの核酸分子を含むことができる。アレイの部位は、同じ基質上に位置する異なる特徴とすることができる。例示的な特徴としては、液滴、基質中のウェル、基質中若しくは基質上のビーズ(又は他の粒子)、基質からの突起、基質上の隆起、又は基質内のチャネルが挙げられるが、これらに限定されない。アレイの部位は、それぞれ異なる分子を有する別個の基質とすることができる。別個の基質に付着した異なる分子は、基質が会合する表面上の基質の位置に従って、又は液体若しくはゲル内の基質の位置に従って特定することができる。別個の基質が表面上に配置される例示的なアレイとしては、ウェル内にビーズを有するものが挙げられるが、これらに限定されない。
本明細書で使用するとき、用語「区画」は、他の物から何かを分離又は単離する領域又は容積を意味することを意図する。例示的な区画としては、バイアル、チューブ、ウェル、液滴、ボーラス、ビーズ、容器、表面特徴、フローセル、又は流体の流れ、磁性、電流等の物理的な力によって分離された領域若しくは体積が挙げられるが、これらに限定されない。一実施形態では、区画は、96又は384ウェルプレートなどのマルチウェルプレートのウェルである。本明細書で使用するとき、液滴は、1つ以上の核又は細胞を封入するためのビーズであり、ヒドロゲル組成物を含む、ヒドロゲルビーズを含み得る。いくつかの実施形態では、液滴は、ヒドロゲル材料の均質な液滴であるか、又はポリマーヒドロゲルシェルを有する中空液滴である。均質又は中空であるかどうかに関わらず、液滴は、1つ以上の核又は細胞を封入することが可能であり得る。いくつかの実施形態では、液滴は、界面活性剤安定化液滴である。いくつかの実施形態では、単一細胞又は核は、区画ごとに存在する。いくつかの実施形態では、区画ごとに2つ以上の細胞又は核が存在する。いくつかの実施形態では、各区画は、区画特異的インデックスを含む。いくつかの実施形態では、インデックスは、溶液中にあるか、又は各区画内の固相に付着若しくは結合している。
本明細書で使用する場合、用語「フローセル」とは、1つ以上の流体試薬を全体に流すことができる固体表面を含むチャンバーを指す。本開示の方法において容易に使用することができるフローセル及び関連する流体システム及び検出プラットフォームの例は、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、国際公開第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されている。
本明細書で使用するとき、用語「クローン集団」は、特定のヌクレオチド配列に対して均質である核酸の集団を指す。均質な配列は、典型的には、少なくとも10ヌクレオチド長であるが、更に長い、例えば、少なくとも50、100、250、500又は1000ヌクレオチド長を含み得る。クローン集団は、単一の標的核酸又は鋳型核酸に由来し得る。典型的には、クローン集団中の全ての核酸は、同じヌクレオチド配列を有する。クロナリティーから逸脱することなく、少数の変異(例えば、増幅アーチファクトによる)が生じ得ることが理解されよう。
本明細書で使用するとき、用語「それぞれ」は、項目の集合に関して使用する場合、集合内の個々の項目を識別することを意図しているが、文脈が明確に別段の指示をしない限り、必ずしも集合内の全ての項目を指すものではない。
本明細書及び添付の特許請求の範囲で使用される場合、「又は」という用語は、内容が別途明確に指示されない限り、「及び/又は」を含む意味で一般に用いられる。用語「及び/又は」は、列挙された要素の1つ若しくは全て、又は列挙された要素のうちの任意の2つ以上の組み合わせを意味する。場合によっては、「及び/又は」の使用は、他の例では「又は」の使用が「及び/又は」を意味し得ないことを意味しない。
「好ましい」及び「好ましくは」という語は、特定の状況下で特定の利益をもたらし得る本開示の実施形態を指す。しかしながら、同じ又は他の状況下で、他の実施形態が好ましい場合もある。更に、1つ以上の好ましい実施形態の記載は、その他の実施形態が有用でないことを示唆するものではなく、本開示の範囲から他の実施形態を除外することを意図するものではない。
本明細書で使用される場合、「有する(have)」、「有する(has)」、「有している(having)」、「含む(include)」、「含む(includes)」、「含んでいる(including)」、「含む(comprise)」、「含む(comprises)」、「含んでいる(comprising)」などは、制約のない包括的な意味で用いられ、一般に、「含む(include)が、これらに限定されない」、「含む(includes)が、これらに限定されない」、又は「含んでいる(including)が、これらに限定されない」ことを意味する。
本明細書で、「有する(have)」、「有する(has)」、「有している(having)」、「含む(include)」、「含む(includes)」、「含んでいる(including)」、「含む(comprise)」、「含む(comprises)」、「含んでいる(comprising)」などの語で本明細書に記載されている場合、さもなければ「からなる(consisting of)」及び/又は「から本質的になる(consisting essentially of)」という用語で説明される類似の実施形態もまた提供されることが理解される。「からなる」という用語は、「からなる」という句に続くものを含むことを意味する。すなわち、「からなる」は、列挙された要素が必要とされるか又は必須であり、他の要素が存在し得ないことを示す。「から本質的になる」という用語は、語句の後に列挙されたいずれの要素も含まれ、それらの要素が列挙された要素の開示において明記された活動又は作用に干渉しないか、又は寄与しない限り、列挙されたもの以外の他の要素が含まれ得ることを示す。
別途記載のない限り、「a」、「an」、「the」、及び「少なくとも1つ」は、交換可能に使用され、1つ又は2つ以上を意味する。
発生する事象に「好適」である条件、又は「好適な」条件は、そのような事象が発生することを妨げない条件である。したがって、これらの条件は、事象を可能にし、強化し、促進する、及び/又はそれの助けとなる。
本明細書で使用する場合、例えば、組成物若しくは核酸の文脈における「提供する」とは、組成物若しくは核酸を作製すること、組成物若しくは核酸を購入すること、又はさもなければ化合物若しくは核酸を得ることを意味する。
「一実施形態」、「実施形態」、「特定の実施形態」、又は「いくつかの実施形態」などへの言及は、本実施形態に関連して説明される特定の特徴、構成、組成、又は特性が、本開示の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書全体を通して様々な場所でのこのような語句の出現は、必ずしも本開示の同じ実施形態を指すものではない。更に、特定の特徴、構成、組成、又は特性は、1つ以上の実施形態において任意の好適な方法で組み合わされてもよい。
本開示の様々な態様は、範囲形式で提示され得る。範囲形式での説明は、単に便宜上及び簡潔さのためのものであり、本開示の範囲に対する柔軟性がない限定として解釈されるべきではないことを理解されたい。したがって、範囲の説明は、その範囲内の全ての可能な部分的な範囲並びに個々の数値を具体的に開示しているとみなされるべきである。例えば、1~6などの範囲の説明は、1~3、1~4、1~5、2~4、2~6、3~6など、並びにその範囲内の個々の数、例えば、1、2、2.7.3、4、5、5.3、及び6などの部分的な範囲を具体的に開示しているとみなされるべきである。これは、範囲の幅に関係なく適用される。
別個の工程を含む本明細書に開示される任意の方法では、工程は、任意の実行可能な順序で行われてもよい。また、適切には、2つ以上の工程の任意の組み合わせを同時に行うことができる。
本開示の例示的な実施形態の以下の詳細な説明は、以下の図面と併せて読むと、最も良く理解され得る。
本開示によるシークエンシングのためのライブラリーを生成する一実施形態の一般的な例示的方法の一般的なブロック図を示す。 A~Dは、本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称に変換する実施形態の概略図を示す。簡略化するために、1つの標的核酸のみを示す。 A~Dは、本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称に変換し、別のアダプターを付加する実施形態の概略図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称変換し、別のアダプターを付加する実施形態の模式図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称変換し、別のアダプターを付加する実施形態の模式図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称変換し、別のアダプターを付加する実施形態の模式図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称変換し、別のアダプターを付加する実施形態の模式図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称変換し、別のアダプターを付加する実施形態の模式図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、標的核酸を対称から非対称変換し、別のアダプターを付加する実施形態の模式図を示す。簡略化するために、1つの標的核酸のみを示す。 本開示による、単一細胞コンビナトリアルインデックス付けのための一般的な例示的方法の一般的なブロック図を示す。 本明細書に提示される本開示の様々な態様による、全細胞ゲノムDNAを対称標的核酸に変換し、次いで非対称標的核酸(s3-WGS)に変換する実施形態の概略図を示す。簡略化するために、1つの標的核酸のみを示す。 本明細書に提示される本開示の様々な態様による、アクセス可能なゲノムDNAを対称標的核酸に、次いで非対称標的核酸(s3-ATAC)に変換する実施形態の概略図を示す。簡略化するために、1つの標的核酸のみを示す。 DNAへのmRNA核酸のプロセッシングし、次いで非対称核酸の3つの集団をもたらすためのその後プロセッシングの実施形態の概略図を示す。簡略化するために、1つのmRNA核酸のみを示す。 DNAへのmRNA核酸のプロセッシングし、次いで非対称核酸の3つの集団をもたらすためのその後プロセッシングの実施形態の概略図を示す。簡略化するために、1つのmRNA核酸のみを示す。 DNAへのmRNA核酸のプロセッシングし、次いで非対称核酸の3つの集団をもたらすためのその後プロセッシングの実施形態の概略図を示す。簡略化するために、1つのmRNA核酸のみを示す。 DNAへのmRNA核酸のプロセッシングし、次いで非対称核酸の3つの集団をもたらすためのその後プロセッシングの実施形態の概略図を示す。簡略化するために、1つのmRNA核酸のみを示す。 本明細書に提示される本開示の様々な態様による、全細胞ゲノムDNAを対称標的核酸に、次いで非対称標的核酸(s3-GCC)に変換する同時アッセイの実施形態の概略図を示す。簡略化するために、1つの標的核酸のみを示す。 プレートベースのコンビナトリアルインデックス付けのためのプロトコルの実施形態の模式図を示す。 DNA損傷のサイズのライブラリー生成に対する影響を示す。 改変ヌクレオチドのアダプターを付加するための伸長に対する影響を示す。 第2の伸長を増強する改変ヌクレオチドを示す。 アニーリング温度の効果を示す。 フラッシュ凍結ヒト皮質及びマウス全脳試料由来の核を使用して複数の96ウェルプレートのタグメンテーション及びPCRの両段階でのインデックス付けを示すバーンヤード実験の実験レイアウトを示す。 1細胞当たりの固有の読み取りによって投影されたライブラリーの複雑さの箱ひげ図を示す。s3ATACは、予測された固有のライブラリー分子に基づいて、フラッシュ凍結マウス皮質上の全ての他の公開された単一細胞ATAC配列ライブラリーより優れている。 「真のバーンヤード」(左、混合種タグメンテーションウェル)及びPCRバーンヤード(右;PCR段階で混合された種)における1細胞当たりのヒト及びマウス読み取りの比較を示し、ライブラリー分子の細胞間交換をほとんど又は全く示さない。真のバーンヤード内の5.12%のインデックス衝突率は、許容衝突率について1ウェル当たりの最適な15核を示唆している。 ヒト核のUMAP投影を示す。 皮質内の肉眼的細胞型のカノニカルマーカーが異なる細胞集団を明らかにすることを示す。 皮質内の肉眼的細胞型のカノニカルマーカーが異なる細胞集団を明らかにすることを示す。 皮質内の肉眼的細胞型のカノニカルマーカーが異なる細胞集団を明らかにすることを示す。 マウス核のUMAP投影を示す。 マウス脳内の肉眼的細胞型のカノニカルマーカーが異なる細胞集団を明らかにすることを示す。 マウス脳内の肉眼的細胞型のカノニカルマーカーが異なる細胞集団を明らかにすることを示す。 マウス脳内の肉眼的細胞型のカノニカルマーカーが異なる細胞集団を明らかにすることを示す。 複数の96ウェルプレートのタグメンテーション及びPCR段階の両方でのインデックス付けを示すs3-WGSライブラリーを生成するためのPDAC低継代の患者由来系統の実験レイアウトを示す。 1細胞当たりの固有の読み取り、並びにライブラリー飽和への投影によって測定されたライブラリーの複雑さの箱ひげ図を示す。 ビンにわたる不偏のゲノムカバレッジについての平均絶対偏差(mean absolute deviation、MAD)スコアの箱ひげ図を示す。キーは、図23から続く。 s3-GCCライブラリーの生成のためのPDAC低継代の患者由来系統の実験レイアウトを示し、複数の96ウェルプレートのタグメンテーション及びPCR段階の両方でのインデックス付けを示す。 1細胞当たりの固有の読み取り、並びに50%及び95%のライブラリー飽和への投影によって測定されたライブラリーの複雑さの箱ひげ図を示す。上部:総読み取り、中央:遠位(>1kbpマッピング)染色体内読み取り、下部:染色体にマッピングされた読み取り。 遠位領域捕捉を示すマッピングされた読み取り長分布の密度プロットを示す。 共有トポロジードメイン上の単一細胞GCCライブラリーのクラスタリングを示す。細胞株(左)及びK平均は、定義されたクラスター(右)を意味する。 トランスポゾンの第1の鎖の例示的なヌクレオチド配列、第2のインデックス配列、P5、i5、P7、i7、ME、A14、及びB15を含むオリゴヌクレオチドを示す(それぞれ配列番号1~9)。
概略図は必ずしも縮尺通りではない。図面に使用される同様の数字は、同様の構成要素、工程などを指す。しかしながら、所与の図の構成要素を指すための数字の使用は、同じ数字でラベル付けされた別の図における構成要素を制限することを意図していないことが理解されるであろう。更に、構成要素を指すために異なる番号を使用することは、異なる番号の構成要素が他の番号付けされた構成要素と同じ又は類似であることができないことを示すことを意図するものではない。
本明細書では、核酸のシークエンシング及び/又はアッセイを実施することに関連する方法、組成物、システム、及びキットが提示される。本開示は、シークエンシングライブラリーに存在する標的核酸の数を著しく増加させる方法を提供する。図1は、本方法の1つの例示的な実施形態の一般的な概要を示す。この例示的な実施形態では、方法は、本明細書で対称アダプターを有する標的核酸を指す、各末端に同じアダプターを含むように修飾された標的核酸を提供することを含む(図1、ブロック10)。標的核酸の供給源は、限定することを意図するものではなく、標的核酸は、DNA又はDNAに変換されたRNAに由来し得る。同様に、標的核酸の末端にアダプターを付加するために使用される方法は、限定することを意図するものではないが、例えば、転位、断片化に続いてライゲーション、ライゲーション、又は伸長及びライゲーションを含むことができる。この方法は更に、対称アダプターのうちの1つを修飾し、対称修飾標的核酸を非対称修飾標的核酸(図1、ブロック12)、各末端に異なるアダプターを含む標的核酸に変換することを含む。アダプターは、インデックス配列、UMI、ユニバーサル配列、及び/又はプライマーに由来する配列を含み得る。任意選択的に、非対称標的核酸を増幅することができる(図1、ブロック14)。非対称標的核酸の増幅は、1つ以上のインデックス配列、UMI配列、ユニバーサル配列、又はプライマー由来の配列を含むがこれらに限定されない他の有用な配列を、一方又は両方の末端に付加することを含み得る。
本発明者らは、驚くべきかつ予想外に、修飾標的核酸を、対称標的核酸の非対称標的核酸への変換中、非対称修飾標的核酸の収率を理論的最大収率近くに大幅に増加させる条件に曝露し得ることを観察した。これは、標的核酸の任意の供給源で使用することができ、限定された入力一次核酸を使用する方法を含む、高効率ライブラリー生成が有利である方法に特に有用である。任意のシークエンシングライブラリー方法は、全ゲノムシークエンシング、標的シークエンシング、メチル化シークエンシング、ゲノム立体配座捕捉(genomic conformation capture、GCC)、例えば、HiC、クロマチン立体配座など、単一細胞アッセイ、単一細胞コンビナトリアルインデックス付け、RNA-seq方法とATAC-seq方法、同時アッセイ、例えば、DNAとRNA、供給源が無細胞DNA若しくはRNAである実施形態、リキッドバイオプシーを含むが、これらに限定されない、高効率生成に利益を得ることができる。高効率変換アッセイはまた、分析物の存在を検出する際にも有用であり、例えば、感度を増加させる。検出又はスクリーニングアッセイの例は、PCR、qPCR、デジタルPCR、DNA若しくはRNA若しくは抗体若しくはタンパク質検出アッセイ、又は一般的な分析物検出アッセイがあるが、これらに限定されない。分析物の例としては、DNA、RNA、及びタンパク質が挙げられるが、これらに限定されない。
標的核酸
本明細書で提供される方法、組成物、システム、及びキットに使用される標的核酸は、典型的には、試料中に存在する一次核酸に由来する。一次核酸は、試料からの二本鎖DNA(double-stranded DNA、dsDNA)形態(例えば、ゲノムDNA断片、増幅生成物など)に由来し得るか、又はDNA若しくはRNAとして試料からの一本鎖形態に由来し得、DsDNA形態に変換され得る。例として、本明細書に記載の方法中に、当技術分野で既知の標準的な技術を使用して、mRNA分子を二本鎖cDNAにコピーすることができる。一次核酸試料からのポリヌクレオチド分子の正確な配列は、一般に、本開示にとって重要ではなく、既知又は不明であり得る。
一実施形態では、一次核酸は、DNA分子を含む。一次核酸分子は、生物の遺伝子相補体全体、例えば、イントロン及びエクソン配列の両方、並びにプロモーター及びエンハンサー配列などの非コード調節配列を含むゲノムDNA分子を表し得る。一実施形態では、例えば、特定の染色体、オープンクロマチンに関連するDNA、クローズドクロマチンに関連するDNA、又は特定の遺伝子の領域(例えば、標的シークエンシング)などの1つ以上の特定の配列などのゲノムDNAの特定のサブセットを使用することができる。
一実施形態では、一次核酸は、RNA分子を含む。一次核酸分子は、トランスクリプトーム全体又は試料の1つの細胞若しくは複数の細胞、例えば、mRNA分子を表し得る。一次核酸分子は、試料の1つの細胞若しくは複数の細胞、例えば、マイクロRNA又は低分子干渉RNAの非コードRNAを表し得る。一実施形態では、例えば、特定の遺伝子によってコードされる領域などの1つ以上の特定の配列などのRNA分子の特定のサブセットを使用することができる。
試料は、生検、腫瘍、擦過物、スワブ、血液、粘液、尿、血漿、精液、毛髪、レーザ捕捉顕微解剖、外科的切除、及び他の臨床的に又は実験室で得られた試料から得られた核酸分子を含み得る。いくつかの実施態様では、試料は、疫学、農業、法医学又は病原性の試料であり得る。いくつかの実施形態では、試料は、培養細胞を含み得る。いくつかの実施態様では、試料は、ヒト又は哺乳動物源などの動物から得られた核酸分子を含むことができる。別の実施態様では、試料は、植物、細菌、ウイルス又は真菌などの非哺乳類源から得られた核酸分子を含むことができる。いくつかの実施態様において、核酸分子の供給源は、保存された又は絶滅した試料若しくは種であり得る。
更に、本明細書に開示される方法、組成物、システム、及びキットは、法医学試料からの分解及び/又は断片化されたゲノムDNAなどの低品質核酸分子を有する核酸試料を増幅するのに有用であり得る。一実施態様では、法医学試料は、犯罪現場から得られた核酸、行方不明者DNAデータベースから得られた核酸、法医学調査と関連した研究所から得られた核酸を含み得る、又は法執行機関、1つ以上のミリタリーサービス若しくはそのような隊員によって得られた法医学試料を含むことができる。核酸試料は、唾液、血液、若しくは他の体液で含浸され得る、例えば、口腔スワブ、紙、布、若しくは他の基質に由来する核酸を含む、精製された試料又は粗溶解物であり得る。したがって、いくつかの実施態様では、核酸試料は、ゲノムDNAのような、少量のDNA又は断片化されたDNAの部分を含み得る。いくつかの実施態様では、標的核酸は、血液、痰、血漿、精液、尿及び血清を含む1つ以上の体液に存在し得るが、これに限定されるものではない。いくつかの実施態様では、標的配列は、犠牲者の毛髪、皮膚、組織試料、剖検又は遺体から得ることができる。いくつかの実施態様では、1つ以上の標的配列を含む核酸は、死亡した動物又はヒトから得ることができる。いくつかの実施態様では、標的配列は、微生物、植物又は昆虫学的DNAなど非ヒトDNAから得られた核酸を含むことができる。いくつかの実施形態では、標的配列は、法医学試料などの人物同定の目的に関する。
生物学的試料の供給源の更なる非限定的な例には、生物全体、並びに患者から得られた試料が含まれ得る。生体試料は、任意の生体液又は組織から得ることができ、液体流体と組織、固体組織、並びに乾燥、凍結、及び固定形態などの保存形態を含む様々な形態であり得る。試料は、任意の生物学的組織、細胞、又は体液のものであり得る。そのような試料には、痰、血液、血清、血漿、血球(例えば、白血球)、腹水、尿、唾液、涙、痰、膣液、唾液、涙液、唾液、膣液、唾液、涙液、唾液、膣液(分泌物)、医療処置中に得られた洗浄液(例えば、生検、内視鏡検査又は外科手術中に得られる骨盤若しくは他の洗浄液)、組織、乳頭吸引物、コア若しくは細針生検試料、細胞含有体液、腹水、及び胸膜液、又はそれらからの細胞、並びに無細胞循環DNAなどの遊離浮遊核酸が含まれるが、これらに限定されない。生体試料はまた、組織学的目的若しくは微小解剖された細胞若しくはその細胞外部分のために採取された凍結又は固定切片などの組織の切片を含み得る。いくつかの実施形態では、試料は、例えば全血試料などの血液試料であり得る。別の例では、試料は、未処理の乾燥血液スポット(dried blood spot、DBS)試料である。更に別の例では、試料は、ホルマリン固定パラフィン包埋(formalin-fixed paraffin-embedded、FFPE)試料である。更に別の例では、試料は唾液試料である。更に別の例では、試料は、乾燥唾液スポット(dried saliva spot、DSS)試料である。
標的核酸が由来し得る例示的な生物学的試料としては、例えば、真核生物、例えば、げっ歯類、マウス、ラット、ウサギ、モルモット、有蹄動物、ウマ、ヒツジ、ブタ、ヤギ、ウシ、ネコ、イヌ、霊長類、ヒト又は非ヒト霊長類などの哺乳動物からのもの、例えば、シロイヌナズナ、トウモロコシ、ソルガム、オート麦、小麦、米、キャノーラ、又は大豆などの植物、Chlamydomonas reinhardtiiなどの藻類、Caenorhabditis elegansなどの線虫、キイロショウジョウバエ、蚊、ショウジョウバエ、ミツバチ、又はクモなどの昆虫、ゼブラフィッシュなどの魚、爬虫類、カエル若しくはアフルカツメガエルなどの両生類、Dictyostelium discoideum、Pneumocystis carinii、Takifugu rubripes、酵母、Saccharamoyces cerevisiae、若しくはSchizosaccharomyces pombeなどの真菌、又は熱帯熱マラリア原虫が挙げられる。標的核酸はまた、細菌、Escherichia coli、staphylococci若しくはMycoplasma pneumoniae若しくはMycoplasma pneumoniaeなどの原核生物、古細菌、C型肝炎ウイルス若しくはヒト免疫不全ウイルスなどのウイルス、又はビロイドに由来し得る。標的核酸は、本明細書に記載の均質な培養物若しくは生物の集団に由来し得るか、又は代替的に、例えば、群衆若しくは生態系におけるいくつかの異なる生物のコレクションから由来し得る。
いくつかの実施形態では、試料は、所望の一次核酸を得るために処理される組織を含む。いくつかの実施形態では、細胞を使用して、所望の一次核酸を得る。いくつかの実施形態では、核を使用して、所望の一次核酸を得る。本方法は、細胞を解離させること、及び/又は核を単離することを更に含み得る。組織から細胞及び核を単離するための方法が利用可能である(国際公開第2019/236599号)。
いくつかの実施形態では、組織内、細胞内、又は単離された核内に存在する核酸は、所望の読み出しに応じて処理され得る。例えば、核酸は、プロセッシング中に固定され得、有用な固定方法が利用可能である(国際公開第2019/236599号)。固定は、試料を保存するか、又は試料、細胞、若しくは核からの分析物の連続性を維持するのに有用であり得る。固定方法は、組織、細胞、及び核形態及びアーキテクチャを保存し、安定化し、タンパク質分解酵素を不活性化し、試料、細胞、及び核を強化し、そのためそれらは更なるプロセッシング及び染色に耐えることができ、混入から保護する。固定が有用であり得る方法の例としては、単離された核の全ゲノムシークエンシング及びHi-Cなどの染色体立体配座捕捉方法が挙げられるが、これらに限定されない。一般的な固定方法としては、灌流、浸漬、凍結、及び乾燥(Srinivasanet al.,Am J Pathol.2002 Dec;161(6):1961-1971.doi:10.1016/S0002-9440(10)64472-0)を含む。
全ゲノムシークエンシングなどのいくつかの実施形態では、単離された核を処理して、核を無傷のままにしながら、ヌクレオソームをDNAから解離させ、ヌクレオソームを含まない核を生成するための方法が利用可能である(国際公開第2018/018008号)。一実施形態では、界面活性剤ベースのヌクレオソーム法が使用される(実施例2)。染色体立体配座捕捉法などのいくつかの実施形態では、組織内、細胞内、又は単離された核内に存在する核酸は、例えば、制限エンドヌクレアーゼ消化によって断片化され得る。断片化は、本明細書でより詳細に説明される。染色体立体配座捕捉法などのいくつかの実施形態では、組織内、細胞内、又は単離された核内に存在する核酸は、平滑末端ライゲーションなどの近接ベースのライゲーションのための条件に曝露され得る。
いくつかの実施形態では、例えば、複数の細胞からのバルク中の一次核酸を使用して、本明細書に記載のシークエンシングライブラリーを生成することができる。他の実施形態では、個々の細胞又は核は、一次核酸の供給源として使用されて、単一細胞及び核から配列情報を得ることができる。多くの異なる単一細胞ライブラリー調製法が、当該技術分野において既知である。(Hwang et al.Experimental & Molecular Medicine,vol.50,Article number:96(2018)、Drop-seq法、Seq-well法、単一細胞コンビナトリアルインデックス付け(「sci-」)法が挙げられるが、これらに限定されない。単一細胞製品及び関連技術を提供する企業としては、10X Genomics、Takara biosciences、BD biosciences、Biorad、1cellbio、IsoPlexis、CellSee、nanoselect、及びDolomite Bioが挙げられるが、これらに限定されない。SCI-seqは、スプリットプールバーコーディングを用いて多数の単一細胞又は単一核の核酸内容を一意に標識化する、方法論的フレームワークである。一般には、核又は細胞の数は、少なくとも2つであり得る。上限は、本明細書に記載の方法の他の工程で使用される機器の実際の制限(例えば、マルチウェルプレート、インデックスの数)に依存する。使用され得る核又は細胞の数は、限定することを意図するものではなく、数十億に達することがあり得る。例えば、一実施形態では、核又は細胞の数は、100,000,000以下、10,000,000以下、1,000,000,000以下、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、1,000以下、500以下、又は50以下であり得る。
アダプター
本開示の方法は、標的核酸の両端にアダプターを付加することを含み得る。シークエンシングライブラリーを調製する際に使用するための多くのアダプターが既知であり、本質的に任意のアダプターを使用することができる。例えば、アダプターは、一本鎖、二本鎖、又は二本鎖領域及び一本鎖領域を含むことができる。一実施形態では、単鎖及び二本鎖領域の両方を有するアダプターの一本鎖領域は、各末端に相補的な一本鎖領域を有する標的核酸にアダプターを結合するのを助けるために、「付着末端」として使用され得る。一実施形態では、一本鎖及び二本鎖領域の両方を有するアダプターは、フォーク又はミスマッチアダプターとも呼ばれ、その一般的な特徴は既知である(Gormley et al.,米国特許第7,741,463号;Bignell et al.,米国特許第8,053,192号)。一実施形態では、アダプターは、トランスポソーム複合体の一部として存在する。トランスポソーム複合体は、本明細書に詳細に記載されている。
標的核酸の両方の末端に付加するために使用されるアダプターの一方又は両方の末端を修飾して、アダプターと他の核酸との相互作用を改変することができる。一実施形態では、アダプターの一方の3’末端をブロックして、その特定の末端のライゲーション効率の相互作用を低減することができる。一実施形態では、標的核酸の各末端へのアダプター、例えば二本鎖アダプターの付加は、結果として生じる修飾標的核酸の一方の鎖にギャップをもたらす。一実施形態では、ギャップは、少なくとも1つのヌクレオチドである。一実施形態では、ギャップは、標的核酸の3’末端と標的核酸に結合したアダプターの5’末端との間に位置する。
アダプターは、1つ以上のインデックス配列、1つ以上のUMI、1つ以上のユニバーサル配列、1つ以上のDNA損傷、又はそれらの組み合わせを含み得る。本明細書でより詳細に説明するように、アダプター中のインデックス配列の存在は、sciベースの用途、試料インデックス付け、又は単一細胞識別を助けることができる。
DNA損傷のヌクレオチドは、DNA合成中に鋳型としてDNAポリメラーゼによって使用される場合、特定のDNAポリメラーゼが活性を低減させ、DNA損傷でDNA合成を止める、若しくは終了させる構造を有する。このタイプのDNAポリメラーゼは、本明細書では「損傷不耐性ポリメラーゼ」と称される。DNA損傷として使用され得るヌクレオチドの例は、当業者に知られており、脱塩基部位、修飾塩基、ミスマッチ、一本鎖切断、又は架橋ヌクレオチドを含むが、これらに限定されない。修飾塩基の例としては、メチル化塩基(例えば、N3-メチルアデニン、N7-O6-メチルグアニン、N3-メチルシトシン、O4メチルチミン)、O6-アルキルグアニン、O4-アルキルチミン、ヒポキサンチン、キサンチン、及びウラシルが挙げられるが、これらに限定されない。修飾塩基はまた、FapyTA、8-オキソ-G、及びチミングリコールを含むがこれらに限定されない酸化塩基を含み得る。架橋ヌクレオチドの例としては、チミン二量体が挙げられるが、これに限定されない。
損傷不耐性ポリメラーゼは、当業者に既知である(Heyn et al.,Nucleic Acids Res.2010 Sep;38(16):e161、Sikorsky et al.,Biochem Biophys Res Commun.2007 Apr 6;355(2):431-437、及びGruz et al.,Nucleic Acids Res.2003-Jul-15;31(14):4024-4030)。有用な損傷不耐性ポリメラーゼの例を表1に示す。
本開示の方法は、損傷不耐性ポリメラーゼを使用する工程を含むことができ、鋳型としてDNA損傷を使用して活性を低減していないDNAポリメラーゼを使用する別の工程も含むことができる。鋳型としてDNA損傷を使用する場合、活性が低減していないポリメラーゼは、本明細書では「損傷耐性ポリメラーゼ」と称される。損傷耐性ポリメラーゼは、当業者に既知であり、表1に記載されているものを含むが、これらに限定されない。損傷耐性ポリメラーゼの使用は、対称修飾標的核酸の非対称修飾標的核酸への変換中に起こり得、典型的には、得られるアンプリコンにおけるDNA損傷の喪失をもたらす。変換中の損傷耐性ポリメラーゼの使用は、本明細書に記載されている。
DNA損傷は、DNAポリメラーゼ活性を低減する活性を有する1つ以上のヌクレオチドを含み得る。例えば、DNA損傷を構成するヌクレオチドの数は、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、又は少なくとも5つであり得る。一実施形態では、DNA損傷を構成するヌクレオチドの数は、5つ以下、4つ以下、3つ以下、又は2つ以下であり得る。一実施形態では、DNA損傷は、2つ、3つ、又は4つのウラシルヌクレオチドである。DNA損傷が2つ以上のヌクレオチドを含む場合、DNA損傷のヌクレオチドは、典型的には連続している。
DNA損傷は、典型的には、標的核酸の各末端に存在するアダプターの1つの鎖に存在する。一実施形態では、アダプターがDNA損傷を含み、アダプターが標的核酸に結合している1つの鎖にギャップが存在する場合、DNA損傷及びギャップは、異なる鎖上に位置する。
アダプターはまた、捕捉剤を含み得る。本明細書で使用する場合、用語「捕捉剤」とは、核酸(例えば、アダプターの鎖)に付着、保持、又は結合することができる材料、化学物質、分子、又はその部分を指す。例示的な捕捉剤としては、受容体-リガンド結合対のメンバーに結合することができる受容体-リガンド結合対(例えば、アビジン、ストレプトアビジン、ビオチン、レクチン、炭水化物、核酸結合タンパク質、エピトープ、抗体など)のメンバー、又は連結部分と共有結合を形成することができる化学試薬が挙げられるが、これらに限定されない。一実施形態では、捕捉剤は、ビオチンである。捕捉剤は、アダプターの鎖に結合することができ、アダプターの末端に結合して、標的核酸へのアダプターの結合を妨げない。例えば、アダプターの5’末端は、捕捉剤を含むことができ、又はアダプターの3’末端が、捕捉剤を含むことができる。一実施形態では、捕捉剤は、トランスポゾンの鎖の5’末端又はトランスポゾンの他の鎖の3’末端に結合している。捕捉剤は、ビーズ又はウェルなどの固体表面にアダプターを付着させるのに有用である。
アダプターはまた、捕捉剤とアダプターとの間に切断可能なリンカーを含み得る。切断可能なリンカーの例としては、ジスルフィド結合が挙げられるが、これらに限定されず、これは、例えば、捕捉剤を放出するためにジチオスレイトールで切断され得る。切断可能なリンカーを有するビオチン標識ヌクレオチドを含む切断可能なリンカーを有する捕捉剤は、市販されている。
対称アダプターを有する標的核酸の生成
本明細書で提供される方法、組成物、システム、及びキットは、任意選択的に、各末端に同じアダプターを有することによってシークエンシング及び対称に適した長さを有する修飾標的核酸を得るために、一次核酸のプロセッシングを含み得る。一次核酸の試料は、ゲノムDNAなどの高分子量物質又は液体生検から得られるか、又はRNAのDNAへの変換によって得られる核酸分子などの低分子量物質などを含み得る。バルク中に存在する、単離された核に存在する、又は単離された細胞中に存在する核酸を核酸断片に処理するための様々な方法が、知られている。一実施形態では、トランスポソーム複合体が使用され、アダプターの付加をもたらす。別の実施形態では、DNAは、例えば、酵素的又は機械的方法によって断片化され、次いで、アダプターが断片の末端に付加される。別の実施形態では、mRNAなどのRNA分子は、cDNAに変換され、アダプターが末端に付加される。
トランスポソーム複合体は、典型的にトランスポザーゼ認識部位を含むトランスポゾン配列に結合したトランスポザーゼであり、「タグメンテーション」と呼ばれることもあるプロセスで、トランスポザーゼ認識部位をDNA分子内の標的核酸に挿入することができる。タグメンテーションを単一工程の断片化及びライゲーションに組み合わせて、ユニバーサルアダプターを付加する(Gunderson et al.,国際公開第2016/130704号)。当業者は、非対称標的核酸の生成が転位により容易かつ効率的に達成され、シークエンシングの準備ができているため、各末端に異なるアダプターを含む核酸断片を生成するためにタグメンテーションが典型的に使用されることを認識するであろう。非対称標的核酸を生成するためのタグメンテーション方法は有用であるが、非効率的であり、典型的に理論収率を50%に低減する。対照的に、本開示の方法で使用される場合、タグメンテーションは、各末端に同じヌクレオチド配列を含む核酸断片を生成し、理論収率をほぼ100%まで増加させることができる。
いくつかの実施形態では、トランスポゾンの1つの鎖は、挿入イベント中に標的核酸の5’末端に転移され、例えば、共有結合され得る。このような鎖は、「移送鎖」と称される。トランスポゾン配列は、1つ以上のインデックス配列、1つ以上のUMI、1つ以上のユニバーサル配列、1つ以上のDNA損傷、又はそれらの組み合わせを含み得るアダプターを含むことができる。一実施形態では、ユニバーサル配列は、トランスポザーゼ認識部位である。トランスポザーゼ認識部位の例としては、モザイク要素(mosaic element、ME)が挙げられるが、これに限定されない。一実施形態では、アダプター、例えば、1つ以上のインデックス配列、1つ以上のUMI、1つ以上のユニバーサル配列、1つ以上のDNA損傷、又はそれらの組み合わせが、転移鎖上に存在する。いくつかの実施形態では、トランスポゾンの1つの鎖は、挿入イベント中に標的核酸の3’末端に転移されず、例えば共有結合され得ない。このような鎖は、「転移鎖」と称される。非転移鎖の存在は、標的核酸のヌクレオチドの重複の転位反応中の生成をもたらし、アダプター配列の5’と標的核酸の3’末端との間にギャップを引き起こし得る。ギャップのサイズは変化し得、典型的には使用されるトランスポゾンシステムに依存する。例えば、Tn5ベースシステムによって導入されるギャップは、典型的には9塩基である。
いくつかの実施形態は、高活性Tn5トランスポザーゼ及びTn5型トランスポザーゼ認識部位(Goryshin and Reznikoff,J.Biol.Chem.,273:7367(1998))、又はR1及びR2末端配列を含むMuAトランスポザーゼ及びMuトランスポザーゼ認識部位(Mizuuchi,K.,Cell,35:785,1983、Savilahti,H,et al.,EMBO J.,14:4893,1995)の使用を含み得る。Tn5モザイク端(Mosaic End、ME)配列、トランスポザーゼ認識部位もまた、当業者によって最適化されたものとしてが使用することができる。
本明細書で提供される方法、組成物、システム及びキットの特定の実施形態とともに使用することができる転位システムの更なる例としては、Staphylococcus aureus Tn552(Colegio et al.,J.Bacteriol.,183:2384-8,2001、Kirby C et al.,Mol.Microbiol.,43:173-86,2002)、Ty1(Devine & Boeke,Nucleic Acids Res.,22:3765-72,1994、及び国際公開第95/23875号)、トランスポゾンTn7(Craig,N L,Science.271:1512,1996、Craig,N L,Curr Top Microbiol Immunol.中のレビュー、204:27-48,1996)、Tn/O及びIS10(Kleckner N,et al.,Curr Top Microbiol Immunol.,204:49-82,1996)、Marinerトランスポザーゼ(Lampe D J,et al.,EMBO J.,15:5470-9,1996)、Tc1(Plasterk R H,Curr.Topics Microbiol.Immunol.,204:125-43,1996)、P要素(Gloor,G B,Methods Mol.Biol.,260:97-114,2004)、Tn3(Ichikawa & Ohtsubo,J Biol.Chem.265:18829-32,1990)、細菌挿入配列(Ohtsubo & Sekine,Curr.Top.Microbiol.Immunol.204:1-26,1996)、レトロウイルス(Brown,et al,.Proc Natl Acad Sci USA,86:2525-9,1989)、及び酵母のレトロトランスポゾン(Boeke & Corces,Annu Rev Microbiol.43:403-34,1989)。その他の例としては、IS5、Tn10、Tn903、IS911、及びトランスポザーゼファミリー酵素の操作型(Zhang et al.,(2009)PLoS Genet.5:e1000689.Epub 2009 Oct 16、Wilson C.et al(2007)J.Microbiol.Methods 71:332-5)がある。
本明細書で提供される方法及び組成物とともに使用され得るインテグラーゼの他の例には、レトロウイルスインテグラーゼ及びそのようなレトロウイルスインテグラーゼのインテグラーゼ認識配列、例えば、HIV-1、HIV-2、SIV、PFV-1、RSVからのインテグラーゼが含まれる。
本明細書に記載の方法及び組成物で有用なトランスポゾン配列は、米国特許出願公開第2012/0208705号、米国特許出願公開第2012/0208724号及び国際公開第2012/061832号に提供されている。
様々なトランスポソーム複合体構成が当該技術分野で既知である。一実施形態では、トランスポソーム複合体は、2つのサブユニット、及び2つの非連続的なトランスポゾン配列を有する二量体トランスポザーゼを含む。このようなトランスポソームの例は、当技術分野において既知である(例えば、米国特許出願公開第2010/0120098号参照)。いくつかの実施形態では、トランスポソーム複合体は、2つのトランスポザーゼサブユニットを結合して「ループ状複合体」又は「ループ状トランスポソーム」を形成するトランスポゾン配列核酸を含む。一実施例では、トランスポソームは、二量体トランスポザーゼ及びトランスポゾン配列を含む。ループ状複合体は、標的DNAを断片化することなく、元の標的DNAの順序情報を維持しながら、トランスポゾンが標的DNAに挿入されることを確実にすることができる。理解されるように、ループ状構造は、標的核酸の物理的接続性を維持しながら、標的核酸に所望のアダプター配列を挿入し得る。いくつかの実施形態では、ループ状トランスポソーム複合体のトランスポゾン配列は、トランスポゾン配列を断片化して2つのトランスポゾン配列を含むトランスポソーム複合体を作成することができるように、断片化部位を含むことができる。このようなトランスポソーム複合体は、トランスポゾンが挿入される、近傍の標的DNA断片が、アッセイの後の段階で明確に組み立てられ得るバーコードの組み合わせを確実に受け取るのに有用である。
断片化部位は、トランスポソーム複合体を使用することによって標的核酸に導入され得る。一実施形態では、核酸の断片化後、トランスポザーゼは、核酸断片に結合したままであり、同じゲノムDNA分子に由来する核酸断片が物理的に連結されたままになる(Adey et al.,2014,Genome Res.,24:2041-2049)。開裂は、生化学的、化学的、又は他の手段によって行われてよい。いくつかの実施形態では、断片化部位は、様々な手段によって断片化され得るヌクレオチド又はヌクレオチド配列を含み得る。断片化部位の例としては、制限エンドヌクレアーゼ部位、RNAseにより切断可能な少なくとも1つのリボヌクレオチド、特定の化学剤の存在下で切断可能なヌクレオチド類似体、過ヨウ素酸塩による処理で切断可能なジオール結合、化学還元剤で切断可能なジスルフィド基、光化学的切断に供され得る切断可能部分、及びペプチダーゼ酵素又は他の好適な手段によって切断可能なペプチドが挙げられるが、これらに限定されない(例えば、米国特許出願公開第2012/0208705号、米国特許出願公開第2012/0208724号、及び国際公開第2012/061832号を参照)。
一次核酸がDNAである実施形態では、転位の結果は、修飾標的核酸のライブラリーであり、各断片は、各末端に対称アダプターを含む。対照的に、一次核酸がRNAである実施形態では、転位の結果は、最大3つの異なるタイプの修飾標的核酸である。第1の集団は、修飾標的核酸のライブラリーを含み、各断片は、各末端に対称アダプターを含む。第2及び第3の集団は各々、一方の末端でトランスポゾンによって導入されたアダプターを含み、他端、すなわち、RNAの3’又は5’末端のいずれかに対応する末端は、鋳型スイッチプライマー、ランダムプライマー、又はポリTなどの代替方法によって付加される。
転位の代わりに、断片化によって標的核酸を得ることができる。試料からの一次核酸の断片化は、酵素法、化学的方法、又は機械的方法によって順不同の様式で達成され得、次いで、アダプターが断片の末端に付加される。酵素的断片化の例としては、CRISPR及びTalen様酵素、並びにDNA断片がハイブリダイズし、伸長又は増幅を開始することができる一本鎖領域を作製することができるDNA(例えば、ヘリカーゼ)をほどく酵素が挙げられる。例えば、ヘリカーゼベースの増幅を使用することができる(Vincent et al.,2004,EMBO Rep.,5(8):795-800)。一実施形態では、伸長又は増幅は、ランダムプライマーを用いて開始される。機械的断片化の例としては、噴霧化又は超音波処理が挙げられる。
機械的手段による一次核酸の断片化は、平滑末端、3’オーバーハング末端、及び5’オーバーハング末端の異種混合物を有する断片をもたらす。したがって、例えば、平滑部位にアダプターを付加するのに最適な端部を生成するために、当該技術分野において既知の方法を使用して、断片末端を修復することが望ましい。特定の実施形態では、核酸集団の断片末端は、平滑末端である。より具体的には、断片末端は、平滑末端であり、リン酸化されている。リン酸部分は、酵素処理によって、例えば、ポリヌクレオチドキナーゼを使用して導入することができる。
一実施形態では、断片化した核酸は、オーバーハングヌクレオチドを用いて調製される。例えば、単一のオーバーハングヌクレオチドは、例えばヌクレオチド「A」をDNA分子の3’末端に付加するなど単一のデオキシヌクレオチドを付加する、鋳型非依存の末端トランスフェラーゼ活性を有する、Taqポリメラーゼ又はKlenowエキソマイナスポリメラーゼなど特定タイプのDNAポリメラーゼの活性によって付加することができる。このような酵素を使用して、二本鎖核酸断片の各鎖の平滑末端の3’末端に単一ヌクレオチド「A」を付加することができる。したがって、Taq又はKlenowエキソマイナスポリメラーゼとの反応によって、二本鎖標的断片の末端修復された各鎖の3’末端に「A」を付加することができ、一方、アダプターは、ユニバーサルアダプターの二本鎖核酸の各領域の3’末端に存在する適合性のある「T」オーバーハングを有するT構築物であり得る。一実施例では、末端デオキシヌクレオチジルトランスフェラーゼ(terminal deoxynucleotidyl transferase、TdT)を使用して、複数の「T」ヌクレオチド」(Swift Biosciences,Ann Arbor,MI)を付加することができる。このタイプの末端修飾はまた、各末端に同じアダプターを有する標的核酸を形成するバイアスが存在するように、ベクター及び標的の両方の自己ライゲーションを防止する。
アダプターは、例えば、断片の末端又はアニーリングされたプライマーの伸長への二本鎖アダプターのライゲーションを含む様々な方法によって、断片化されたDNA又は非対称DNA標的核酸の末端に付加され得る。断片の末端への二本鎖アダプターのライゲーションは、断片の末端に存在するオーバーハングを使用することによって、平滑末端化又は助けられ得る。アダプターは、ライゲーション又は重合を含む一本鎖又は二本鎖アダプターを使用して付加することもできる(例えば、TdT標識)。一実施形態では、アダプターは、結果として生じる修飾標的核酸の1つの鎖にギャップをもたらすように構成されている。一実施形態では、ギャップは、少なくとも1つのヌクレオチドである。一実施形態では、ギャップは、標的核酸の3’末端と標的核酸に付着したアダプターの5’末端との間に位置する。
一次核酸がRNAである実施形態では、対称アダプターを有する標的核酸を生成することは、典型的には、一方又は両方の末端でのアダプターの任意の導入を伴うDNAへのRNAの変換を含む。様々な方法を使用して、mRNAの3’側にアダプターを付加することができる。例えば、アダプターは、cDNAを生成するために使用されている日常的な方法で付加され得る。3’末端にポリT配列を有するプライマー及びポリT配列の上流のアダプターをmRNA分子にアニーリングされ、逆転写酵素を使用して伸長させることができる。これにより、DNAへのmRNAの1工程変換、任意選択的に、3’末端へのユニバーサル配列の1工程変換をもたらす。一実施形態では、プライマーはまた、1つ以上のインデックス配列、1つ以上のUMI、1つ以上のユニバーサル配列、又はそれらの組み合わせを含み得る。一実施形態では、ランダムプライマーを使用する。
非コードRNAはまた、DNAに変換することができ、任意選択的に、様々な方法を使用してユニバーサル配列を含むように修飾され得る。例えば、ランダム配列及び鋳型スイッチプライマーを含む第1プライマーを使用してアダプターを付加することができ、いずれかのプライマーもアダプターを含むことができる。合成鎖の3’末端への非鋳型ヌクレオチドの付加をもたらすために末端トランスフェラーゼ活性を有する逆転写酵素を使用することができ、鋳型スイッチプライマーは、逆転写酵素により付加される非鋳型ヌクレオチドとアニーリングするヌクレオチドを含む。有用な逆転写酵素の例は、モロニ-マウス白血病ウイルス逆転写酵素である。特定の実施形態では、Takara Bio USA,Inc.から入手可能な試薬SMARTer(商標)(Cat.No.634926)を使用して、インデックスを非コードRNAに付加し、必要に応じてmRNAを付加するために使用される。任意選択的に、鋳型スイッチプライマーを、ポリT配列を有するプライマーと併せてmRNAで用い、RNAから生成されたDNA標的核酸の両端にユニバーサル配列を付加することができる。一実施形態では、同じアダプターが両方の末端に付加される。
標的核酸の集団は、本明細書に記載の方法又は組成物の特定の用途に望ましい又は適切な平均鎖長を有し得る。例えば、本明細書に記載の方法の1つ以上の工程で使用されるか、又は特定の組成物、システム、若しくはキットに存在するメンバーの平均鎖長は、約100,000ヌクレオチド、50,000ヌクレオチド、10,000ヌクレオチド、5,000ヌクレオチド、1,000ヌクレオチド、500ヌクレオチド、100ヌクレオチド、又は50ヌクレオチド未満であり得る。代替的に、又は追加的に、平均鎖長は、約10ヌクレオチド、50ヌクレオチド、100ヌクレオチド、500ヌクレオチド、1,000ヌクレオチド、5,000ヌクレオチド、10,000ヌクレオチド、50,000ヌクレオチド、又は100,000ヌクレオチド超であり得る。標的核酸の集団の平均鎖長は、上記の最大値と最小値との間の範囲内であり得る。増幅部位で生成された(又は別の手段で本明細書で作製又は使用された)アンプリコンは、上記に例示されているものから選択される上限と下限との間の範囲の平均鎖長を有し得ることが理解されよう。
いくつかの実施形態では、標的核酸は、例えば、排除増幅を容易にするために、増幅部位の面積に対して大きさを決定される。例えば、アレイの部位の各々の面積は、排除増幅を達成するために、標的核酸の排除体積の直径よりも大きくすることができる。例えば、アレイの表面の特徴を使用する実施形態をとると、各特徴の面積は、増幅部位に輸送される標的核酸の排除体積の直径よりも大きくなり得る。標的核酸の排除体積及びその直径は、例えば、標的核酸の長さから決定することができる。核酸の排除体積及び排除体積の直径を決定するための方法は、例えば、米国特許第7,785,790号、Rybenkov et al.Proc.Natl.Acad.Sci.U.S.A.90:5307-5311(1993)、Zimmerman et al.,J.Mol.Biol.222:599-620(1991)、又はSobel et al.,Biopolymers 31:1559-1564(1991)に記載されている。
標的核酸のタグメンテーション又は断片化及びプロセッシングによって一次核酸断片を生成することにより、分子の純度を高めるためのクリーンアッププロセスが続くことができる。電気泳動、サイズ排除クロマトグラフィーなどの任意の好適なクリーンアッププロセスが使用されてよい。いくつかの実施形態では、固相可逆性固定常磁性ビーズを用いて、例えば、組み込まれていないプライマーから所望のDNA分子を分離し、サイズに基づいて核酸を選択することができる。固相可逆性固定常磁性ビーズは、ベックマン・コールター社(Agencourt AMPure XP)、サーモフィッシャー社(MagJet)、オメガ・バイオテック社(Mag-Bind)、プロメガ・ビーズ社(Promega)、及びカパ・バイオシステムズ社(Kapa Pure Beads)から市販されている。
標的核酸の対称から非対称からの変換
本明細書で提供される方法、組成物、システム、及びキットは、対称標的核酸を非対称アダプターで標的核酸に変換することを含む。本明細書で論じられるように、いくつかの実施形態では、標的核酸の各末端へのアダプターの付加は、得られた修飾標的核酸の各鎖にギャップをもたらす。一実施形態では、ギャップは、標的核酸の3’末端と標的核酸の各末端に結合したアダプターの5’末端との間に位置する。一実施形態では、ギャップは、ヌクレオチドで充填され、標的核酸の3’末端をプライマーとして使用してライゲートされ得る。例えば、トランスポソーム複合体を使用するいくつかの実施形態では、Tn5ベースのトランスポゾン挿入によって作成された9bpの標的配列重複が伸長される。一実施形態では、伸長は、鎖置換ポリメラーゼを使用して、上流配列の置換をもたらす。一実施形態では、転位によって作成された標的配列重複は、伸長されない。一実施形態では、ライゲーションが使用される。伸長がギャップを充填するために使用される場合、損傷不耐性ポリメラーゼ又は損傷耐性ポリメラーゼを使用することができる。
一実施形態では、アダプターがDNA損傷を含み、アダプターが標的核酸に結合している1つの鎖にギャップが存在する場合、DNA損傷及びギャップは、異なる鎖上に位置する。伸長によってギャップを充填するために使用されるポリメラーゼは、鋳型鎖にDNA損傷を使用し、ポリメラーゼが損傷不耐性である場合、伸長は終了する。したがって、この構成が存在する場合、損傷不耐性ポリメラーゼの使用により、ギャップの下流のアダプターのアダプター配列の一部分のみの保持がもたらされる。これにより、標的核酸の1つのアダプターの修飾及び非対称標的核酸の生成がもたらされる。当業者は、非対称標的核酸が、ペアエンドシークエンシング反応を含むシークエンシング反応において使用され得ることを認識するであろう。しかしながら、本開示の方法は、本明細書に記載される更なる利点を提供する。
対称標的核酸を生成し、次いで1つのアダプターを修飾して非対称標的核酸をもたらす一実施形態で起こり得る構造の例を図2に示す。例示的な標的核酸20を、図2Aに示す対称アダプター22とともに示す。この例示的な実施形態では、対称アダプターは、DNA損傷(Uで示す)を含む。一方の鎖の3’末端がブロックされ(*で示す)、他方の鎖の3’末端がオーバーハングを含む。アダプターは、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含み得る。標的核酸20の各末端へのアダプターの付着後、修飾標的核酸23は、元の標的核酸20の3’末端にギャップ24を含む。損傷不耐性ポリメラーゼを用いる修飾標的核酸23の伸長は、ギャップ24の3’末端から始まり、DNA損傷Uで停止し、得られた修飾標的核酸25を図2Cに示す。修飾標的核酸25の変性により、核酸が、一方の末端にDNA損傷を有する対称アダプター22の鎖と、他端にギャップとDNA損傷との間に位置する対称アダプター配列の一部27と、を含む、非対称標的核酸26がもたらされる。
対称標的核酸の非対称アダプターを有する標的核酸への修飾後、非対称標核酸を更に修飾することができる。例えば、配列は、末端のうちの1つを特異的に標的とすることによって、例えば、標的核酸に付加された第1のアダプターにヌクレオチドを付加するか、又は非対称標的核酸をもたらすように修飾されたアダプターにヌクレオチドを付加することによって付加され得る。一実施形態では、修飾は、非対称標的核酸(例えば、図2Dに図示するように、アダプター22から27への修飾)をもたらすように修飾されたアダプターに第2のアダプターを付加するための伸長反応においてプライマーを使用することを含み得る。
修飾に使用されるプライマーは、少なくとも2つのドメインを含み得る。第1のドメインは、プライマーの3’末端に存在し、非対称標的核酸をもたらすように修飾されたアダプターの一部にアニーリングする配列を含む。第1のドメインは、本明細書ではアニーリングドメインとも呼ばれる。当業者は、第1のドメインが特定のアニーリングのために十分な長さを有する場合、プライマーが本方法において有用であることを認識するであろう。当業者はまた、プライマーがアニーリングするヌクレオチドが、非対称アダプターの3’ヌクレオチドを含み、それによって3’ヌクレオチドをプライマーの第2のドメインを鋳型として使用する伸長のための好適な開始部位にする場合、プライマーが本方法において有用であることを認識するであろう。非対称標的核酸の3’末端は、ライゲーションを使用して修飾することもできる。
一実施形態では、アニーリングドメインの1つ以上のヌクレオチドは、改変ヌクレオチドである。改変ヌクレオチドは、対応する天然DNAヌクレオチドよりも高い融解温度で変性するヌクレオチド、例えば、対応する天然DNAヌクレオチドよりも高い強度を有する相補的な天然ヌクレオチドA、T、G、又はCとのヌクレオチド水素結合である。改変ヌクレオチドの例としては、ロックド核酸(locked nucleic acid、LNA)、架橋核酸(bridged nucleic acid、BNA)、擬似相補的塩基、ペプチド核酸(peptide nucleic acid、PNA)、2,6-ジアミノプリン、5’メチルdC、SuperT、RNAヌクレオチド、又は本質的に溶融温度を増加させる当該技術分野で既知の任意のヌクレオチド若しくは塩基が挙げられるが、これらに限定されない。プライマーの第1のドメイン内の改変ヌクレオチドの数は、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つぃ、又は少なくとも5つであり得る。いくつかの実施形態では、天然ヌクレオチドと改変ヌクレオチドの組み合わせが使用される。一実施形態では、改変ヌクレオチドは、ポリメラーゼ開始部位から少なくとも5、少なくとも10、又は少なくとも15ヌクレオチド離れている。一実施形態では、伸長に有用なプライマーの濃度は、日常的な滴定によって決定することができる。
一実施形態では、プライマー又はアダプターの3’末端をブロックして、DNAポリメラーゼによるプライマーの3’末端上のヌクレオチドの組み込みを防止する。プライマーの3’末端をブロックするための方法の例としては、3’-OH基の除去、又はプライマーの3’末端にジデオキシヌクレオチド(ddNTP)などのヌクレオチド、逆塩基、それらの相補体を含まない追加の塩基、又はミスマッチ塩基などのヌクレオチドの存在によるが挙げられるが、これらに限定されない。
プライマーの第2のドメインは、アダプターを含むヌクレオチド配列を有する。アダプターは、1つ以上のインデックス配列、1つ以上のUMI、1つ以上のユニバーサル配列、又はそれらの組み合わせを含み得る。典型的には、アダプターに存在する任意のインデックス配列、UMI、及びユニバーサル配列は、非対称標的核酸中に既に存在する任意のインデックス配列、UMI、及びユニバーサル配列と比較して固有である。いくつかの実施形態では、存在する場合、ユニバーサル配列は、プライマーの5’末端に位置し得、インデックス又はUMIなどのいかなる任意の配列も、第1のドメインとユニバーサル配列との間に存在することができる。
プライマーを使用して、一方の末端に対称アダプターを、他端に非対称アダプターを有する一本鎖非対称標的核酸の3’末端を伸長又はリガンドする。
いくつかの実施形態では、伸長の有効性は、アニーリング温度に依存し、当業者は、qPCRなどの温度滴定及び増幅を使用して有用なアニーリング温度を容易に特定することができる。一実施形態では、損傷不耐性DNAポリメラーゼが伸長に使用される。伸長の結果は、一方の末端に対称アダプターを保持する非対称標的核酸であり、他端の非対称アダプターは、別のアダプターを含むように修飾されている。
天然ヌクレオチドA、T、G、及びCは、伸長に使用することができる。いくつかの実施形態では、非天然ヌクレオチドが使用される。例えば、メチル化シトシンを使用することができる。メチル化シトシンは、アダプタープライマーが典型的にシトシンのウラシル変換中に変換されないため、メチル化シークエンシング用途(国際公開第2017/106481号)において有利である。
一実施形態では、伸長反応が繰り返される。本発明者らは、少なくとも1つの改変ヌクレオチドを有する2ドメインプライマーを用いた複数の伸長サイクルの使用により、非対称修飾標的核酸の収量が理論上の最大収率近くまで驚くほどかつ予想外に増加することを見出した。一実施形態では、伸長回数は、少なくとも1、少なくとも3、少なくとも5、少なくとも7、少なくとも9、又は少なくとも10であり得る。一実施形態では、伸長回数は、15以下、13以下、又は11以下であり得る。一実施形態では、伸長回数は、10である。
タグメンテーションによって対称標的核酸を生成し、次いで、非対称標的核酸をもたらすために1つのアダプターを修飾する一実施形態で起こり得る構造の別の例を図3に示す。例示的な修飾標的核酸33を、標的核酸30及び対称アダプター32とともに図3Aに示す。アダプターは、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含み得る。この例示的な実施形態では、対称アダプター32は、DNA損傷(Uで示す)、ギャップ34、及びトランスポザーゼ認識ドメイン35などのユニバーサル配列を含む。損傷不耐性ポリメラーゼによる修飾標的核酸33の伸長は、ギャップ34の3’末端から始まり、DNA損傷Uで停止し、変性後得られた非対称標的核酸36を図3Bに示す。非対称標的核酸36は、一方の末端にDNA損傷とともに対称アダプター32の鎖を含む。他端に、非対称標的核酸36は、非対称アダプター37、例えば、ギャップとDNA損傷との間に位置した対称アダプター配列の一部を含む。図3Cは、別のアダプターを含むために非対称標的核酸36を更に修飾する例示的な実施形態も示す。2ドメインプライマー38は、非対称アダプター37にアニーリングする1つのドメイン39と、異なるアダプター40を含む第2のドメインと、を含む。この例示的な実施形態では、プライマー38の3’末端で開始された伸長を低減するために、ブロック(*)が含まれる。図3Cにおいて点線で示される、任意選択的に損傷不耐性ポリメラーゼによる伸長は、非対称標的核酸36の3’末端から始まり、異なるアダプター40を追加し、図3Dに示すように非対称標的核酸41をもたらす。
タグメンテーションによって対称標的核酸を生成し、次いで、非対称標的核酸をもたらすために1つのアダプターを修飾する一実施形態で起こり得る構造の別の例を図4に示す。2つのトランスポザーゼ及びトランスポゾンの例示的なトランスポソーム複合体41は、アダプターを42を含む(図4A)。各アダプターは、プライマー(P5)、インデックス(i5)、ユニバーサルアンカー配列(A14)、DNA損傷ウラシル(U)、トランスポザーゼ認識配列(ME)、及びトランスポザーゼ認識配列(ME’)の相補体を含む。アダプターはまた、一方の鎖の5’末端に結合した任意選択の捕捉剤(B)及び任意選択の切断可能なリンカー(CL)、並びに他の鎖の3’末端に結合した任意選択のブロッキングジデオキシヌクレオチド(ddC)を含む。いくつかの実施形態では、捕捉剤-切断可能なリンカー及びブロッキング基の配置が切り替えられる。図4Bは、トランスポザーゼと依然として複合体を形成している、タグ付き及び断片化された核酸を示す。簡単にするために、二量体の描写を図4Aに示すが、図4Bには示していない。図4Cは、トランスポザーゼの除去後、及びDNA損傷不耐性ポリメラーゼを用いたギャップ充填後の構造を示す。図4Dは、2ドメインプライマー43を用いそれにハイブリダイズされた、図4Cの上鎖を示す。2ドメインプライマー43は、相補的ME’にアニーリングする1つのドメインMEと、異なるアダプター配列B15、i7、及びP7を含む第2のドメインと、を含む。図4Eは、2ドメインプライマー配列に基づく上鎖の伸長の結果を示す。図4Fは、プライマー除去後のタグ付きライブラリー断片を示す。図4Dにおいて点線で示される伸長は、ME’の3’末端から始まり、異なるアダプター43を付加し、図4Fに示す非対称標的核酸をもたらす。
非対称標的核酸のライブラリーは、DNA損傷を除去するための条件に曝露され、任意選択的に、非対称標的核酸の一方又は両方の末端に1つ以上のアダプターを付加し、結果として、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ更なる以上のUMI配列、又はそれらの組み合わせにより一方又は両方の末端を更に修飾し得る。一実施形態では、DNA損傷を除去するための条件は、損傷耐性DNAポリメラーゼによる伸長を含む。好適な損傷耐性DNAポリメラーゼの例を表1に示す。損傷耐性DNAポリメラーゼは、DNA損傷を介して読み取る任意のタイプの伸長反応で使用することができ、得られた合成された鎖は、DNA損傷をもはや含まない。一実施形態では、DNA損傷を除去するための条件は、修復システムを含む。DNA修復システムには、DNA損傷を固定又は修復するための酵素及びメカニズムが含まれ、除去修復システム及びDNA修復システムが含まれるが、これらに限定されない。DNA修復システムは、当該技術分野において既知である(Chaudhuri et al.,Nature Reviews Molecular Cell Biology,2017,18:610-621)。DNA修復システムの使用後、非対称標的核酸のライブラリーは、伸長反応を含む条件に曝露される。
一実施形態では、伸長は、非対称標的核酸の数を実質的に増加させる方法による。一実施形態では、方法は、ポリメラーゼ連鎖反応(PCR)及びローリングサークル増幅(RCA)を含むがこれらに限定されない増幅であり得る。
一実施形態では、本方法は、ビーズ又はウェルの表面などの表面に結合したトランスポソーム複合体の使用を含む。典型的には、そのような実施形態では、トランスポゾンの鎖のうちの1つは、ビオチンなどの捕捉剤を含む。捕捉剤の使用は、非対称標的核酸を生成するための工程を有利に低減する方法を可能にする。例えば、捕捉剤及び任意の切断可能なリンカーは、一方の鎖(例えば、プライマーP5、インデックスi5、ユニバーサルアンカー配列A14、DNA損傷ウラシルU、及びトランスポザーゼ認識配列MEを含む図4におけるアダプター42の鎖)の5’末端に結合することができる。表面結合トランスポソーム複合体を使用したタグメンテーション後、DNA損傷不耐性ポリメラーゼ、dNTP、及び図4Dにおける2ドメインプライマー43などの2ドメインプライマーを付加し得る。変性条件、例えば熱に曝露されると、トランスポザーゼ認識配列ME’の相補体が除去される。例えば、図4Bに示すME’は、もはやハイブリダイズしない。ポリメラーゼは、MEを鋳型として使用して標的核酸の3’コピーを伸長し、ME’が標的核酸の3’末端に結合し、DNA損傷で停止する。別の変性工程に続いて、2ドメインプライマー43は、標的核酸の3’末端に結合したME’にアニーリングする。伸長は、鋳型として2ドメインプライマーを使用してME’で開始され、非対称標的核酸をもたらす。次いで、非対称標的核酸を固体表面から除去することができる。
ビーズ又はウェルの表面などの表面に結合したトランスポソーム複合体を使用する別の実施形態では、捕捉剤及び任意の切断可能なリンカーは、他の鎖(例えば、トランスポザーゼ認識配列の相補体ME’を含む図4におけるアダプター42の鎖)の3’末端に結合することができる。表面結合トランスポソーム複合体を使用したタグメンテーション後、DNA損傷不耐性ポリメラーゼ、dNTP、及び図4Dにおける2ドメインプライマー43などの2ドメインプライマーを付加し得る。変性条件、例えば熱に曝露されると、トランスポゾンの他の鎖及び結合した標的核酸が溶液に放出される。2ドメインプライマー43は、標的核酸の3’末端に結合したME’にアニーリングされ得る。伸長は、鋳型として2ドメインプライマーを使用してME’で開始され、非対称標的核酸をもたらす。次いで、非対称標的核酸を固体表面から除去することができる。
インデックス配列
いくつかの実施形態では、シークエンシングの工程中に標的核酸の供給源を特定することが有用であり得る。これが有用である場合の例は、当業者に容易に明らかであり、異なる供給源(例えば、異なる対象、試料、組織、又は細胞型)からの複数のライブラリーの同時分析を含むが、これらに限定されない。標的核酸の供給源の特定は、例えば、標的核酸のサブセットを複数の区画に分配し、各区画において標的核酸を一意に標識し(典型的には、固有のインデックス配列を含むアダプターを付加するように修飾することによって)、次いでサブセットをプールすることによる区画化の使用を介して達成され得る。例えば、単一細胞コンビナトリアルインデックス付け(「sci-」)方法は、典型的には、スプリット-プール標識を使用する。したがって、いくつかの実施形態では、標的核酸の各々に結合したインデックスは、特定の区画に存在し、及びこのインデックスの存在は、この方法のこの段階で核又は細胞の集団が存在している区画を示しているか、又は識別するために使用される。区画化とも呼ばれる、区画へのインデックス及び核酸の分布の使用は、本明細書に記載されている。
本明細書で使用するインデックス配列は、長さが任意の好適な数、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20以上のヌクレオチドの好適な配列であり得る。4つのヌクレオチドタグは、256個の試料を多重化する可能性をもたらし、6つの塩基タグは、4096個の試料の処理を可能にする。いくつかの実施形態では、インデックスは、特定の区画内の核酸を標識するために使用される。
本明細書に記載されるように、インデックスを付加するための非対称標的核酸の修飾は、対称標的核酸の生成中に達成され得る。例えば、インデックスは、対称アダプターに含まれ得る。追加のインデックスを、その後の工程で非対称標的核酸のいずれかの末端に選択的に付加することができる。
インデックスを付加することによる非対称標的核酸を修飾するための方法には、プライマーによる直接包含、伸長、転位、又はライゲーションが含まれるが、これらに限定されない。伸長の例としては、プライマーのハイブリダイゼーション、逆転写酵素を使用する伸長、及び増幅が挙げられるが、これらに限定されない。非対称標的核酸の一端又は両末端に付加されるヌクレオチド配列はまた、1つ以上のユニバーサル配列及び/又はUMIを含み得る。ユニバーサル配列は、例えば、別のインデックス、ユニバーサル配列、及び/又はUMIなどの別のヌクレオチド配列を非対称標的核酸に付加するためのプライマーとして使用され得るヌクレオチド配列をアニーリングするための後続の工程において「ランディングパッド」として使用され得る。したがって、インデックス配列の組み込みは、伸長(ハイブリダイゼーション、逆転写酵素、及び/又は増幅を含む)、ライゲーション、又は転位の本質的に任意の組み合わせを使用して、1、2、又はそれ以上の工程を含むプロセスを使用することができる。
いくつかの実施形態では、インデックスの組み込みは、1、2、3、又はそれ以上のラウンドのスプリット及びプールのインデックス付けで生じ、インデックス付き単一細胞ライブラリーなどの単一、デュアル、トリプル、又は複数の(例えば、4以上の)インデックス付きライブラリーをもたらす。
本方法は、単離された核又は細胞などの標的核酸の集団(本明細書ではプールとも呼ばれる)をサブセットにスプリットする、複数の分配工程を含み得る。以下は単離された核又は細胞に関して論じられているが、当業者は、「スプリット及びプール」工程が標的核酸の任意の集団に適用され得ることを理解するであろう。典型的には、単離された核又は細胞のサブセット、例えば、複数の区画に存在するサブセットを、区画特異的インデックスでインデックス付けし、次いでプールする。標的核酸のこの区画化は、インデックスが追加される任意の段階で起こり得る。例えば、標的核酸は、対称アダプター及び/又は別のアダプターが付加されるときに区画に存在し得る。したがって、本方法は、典型的には、プールされた単離された核又は細胞を得て、それらを分配し、区画特異的インデックスを付加するという、少なくとも1つの「スプリット及びプール」工程を含み、「スプリット及びプール」工程の数は、核酸断片に付加される異なるインデックスの数に依存し得る。インデックス付け前の核又は細胞の各初期サブセットは、他のサブセットとは異なり、一意であり得る。インデックス付け後、十分な数のインデックスが標的核酸に付加されるまで、必要に応じて、サブセットをインデックス付け後プールし、サブセットにスプリットし、インデックス付けし、再度プールすることができる。このプロセスは、各単一の細胞又は核に固有のインデックス又はインデックスの組み合わせを割り当てる。インデックス付けの完了後、例えば、1つ、2つ、3つ、又はそれ以上のインデックスの付加後、単離された核又は細胞を溶解することができる。いくつかの実施形態では、インデックスの付加及び溶解は同時に生じ得る。
サブセット、したがって各区画内に存在する核又は細胞の数は、少なくとも1であり得る。一実施形態では、サブセット内に存在する核又は細胞の数は、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、4,000以下、3,000以下、2,000以下、1,000以下、500以下、又は50以下である。一実施形態では、サブセット内に存在する核又は細胞の数は、1~1,000、1,000~10,000、10,000~100,000、100,000~1,000,000、1,000,000~10,000,000、又は10,000,000~100,000,000であり得る。一実施形態では、各サブセット内に存在する核又は細胞の数はほぼ等しい。サブセット内、したがって各区画内に存在する核の数は、インデックスの衝突を減らしたいという要望に部分的に基づいており、衝突とは、本方法のこの工程において同じ区画内で終わる同じインデックスの組み合わせを有する2つの核又は細胞の存在である。核又は細胞をサブセットに分配するための方法は、当業者に既知であり、日常的であり、蛍光活性化細胞選別(fluorescence-activated cell sorting、FACS)単純希釈を含む。
分配工程(及び後続のインデックスの付加)における区画の数は、使用するフォーマットに依存し得る。例えば、区画の数は、2~96区画(96ウェルプレートを使用する場合)、2~384区画(384ウェルプレートを使用する場合)、又は2~1536区画(1536ウェルプレートを使用する場合)であり得る。一実施形態では、区画の数は、5000以上(Takara Biosciences、icell8システム)である。一実施形態では、複数のプレートを使用することができる。一実施形態では、各区画は液滴であり得る。使用される区画の種類が、2つ以上の核又は細胞を含有する液滴又はウェルである場合、少なくとも10,000、少なくとも100,000、少なくとも1,000,000、又は少なくとも10,000,000の液滴など、任意の数の液滴又はウェルを使用することができる。単離された核又は細胞のサブセットは、典型的には、プール前に区画内でインデックス付けされる。
図5は、本開示による、単一細胞コンビナトリアルインデックス付けのための一般的な例示的方法の一般的なブロック図を示す。この方法は、単離された核又は細胞を提供すること(図5、ブロック50)及び単離された核又は細胞を複数の区画に分配すること(図5、ブロック51)を含む。ブロック40はDNAを指し、当業者は、DNAが、例えば、ゲノムDNA又はRNA由来のDNAであり得ることを認識するであろう。この方法の実施形態では、単離された核又は細胞は、対称アダプターを付加することによって区画特異的インデックスでインデックス付けされ(図5、ブロック52)、次いでプールされる(図5、ブロック53)。したがって、本方法は、典型的には、プールされた単離された核又は細胞を得て、それらを分配し、区画特異的インデックスを付加するという、少なくとも1つの「スプリット及びプール」工程を含み、「スプリット及びプール」工程の数は、標的核酸に付加される、異なるインデックスの数に依存し得る。第2のインデックスに非対称アダプターを付加する場合、プールされた単離された核又は細胞は、第2の複数の区画に分配され(図5、ブロック53)、非対称アダプターを付加することによって、区画特異的インデックスでインデックス付けされる(図5、ブロック54)。任意選択的に、非対称標的核酸は、次いで増幅され得る(図5、ブロック55)。非対称標的核酸の増幅は、インデックス配列、UMI配列、及び/又はユニバーサル配列を含むがこれらに限定されない、一方又は両方の末端への他の有用な配列の付加を含むことができ、更なるスプリット及びプールインデックス付けと組み合わせることができる。
得られたインデックス付き標的核酸は、シークエンシングされ得る核酸のライブラリーを集合的に提供する。本明細書においてシークエンシングライブラリーとも呼ばれるライブラリーという用語は、3’末端及び5’末端に既知のユニバーサル配列を含む修飾核酸のコレクションを指す。
用途
本開示により提供される方法は、全ゲノム、トランスクリプトーム、メチル化、アクセス可能(例えば、ATAC)、及び立体構造状態(例えば、HiC)などシークエンシングライブラリーの調製を含む、本質的に任意の用途に容易に組み込むことができる。これは、これらに限定されないが、sci-WGS-seq、sci-MET-seq、sci-ATAC-seq、及びsci-RNA-seqなどの単一細胞コンビナトリアルインデックス付け(sci)方法などの、高ライブラリー変換を必要とする、本質的に任意の用途において、特に有用であり得る。シークエンシングライブラリー生成を、各側に異なるユニバーサル配列を有する(例えば、非対称)標的核酸の生成に集中させる代わりに、本開示によって提供される方法をシークエンシングライブラリー生成に統合することは、各側に同じユニバーサル配列を有する(例えば、対称)より効率的な標的核酸の生成を含む。対称断片の生成時に、対称断片を非対称断片に変換するための本明細書に記載の方法を適用することができる。全ゲノム又は標的ライブラリーの構築に使用することができる、多数のシークエンシングライブラリー法が当業者に知られている(例えば、genomics.umn.edu/downloads/sequencing-methods-review.pdfで入手可能な「Sequencing Methods Review」を参照)。
いくつかの実施形態では、この適用は、全ゲノム又は標的化シークエンシングである。一般に、組織、個々の細胞、又は個々の核は、本明細書に記載されるように処理されて、対称標的核酸をもたらす。(実施例2を参照)。いくつかの実施形態では、個々の細胞又は個々の核を処理して、ゲノムDNAからヌクレオソームを結合解除することができる(国際公開第2018/018008号)。次いで、対称修飾標的核酸を本明細書に記載されるように処理して、非対称修飾標的核酸を生成することができる。例えば、図6に示すように、核酸は、核の完全性を維持するために固定され、ゲノムDNAからヌクレオソームを除去してゲノム全体をアクセス可能にする条件に曝露し、次いで、対称標的核酸を生成するために例えばタグメンテーションによって挿入されたアダプターの1つの集団を有する。続いて、対称標的核酸を、本明細書に記載されるように非対称標的核酸に変換することができる。
いくつかの実施形態では、用途は、アクセス可能なDNAの識別のためのATAC-seq(シークエンシングを使用したトランスポザーゼアクセス可能クロマチンのアッセイ)などのアクセス可能なDNAをプローブするためのものである。一般に、無傷のヌクレオソームを有する組織、個々の細胞、又は個々の核は、本明細書に記載されるように処理されて、対称標的核酸をもたらす(実施例2を参照)。次いで、対称修飾標的核酸を本明細書に記載されるように処理して、非対称修飾標的核酸を生成することができる。例えば、図7に示すように、結合ヌクレオソームを含むゲノムDNAをタグメンテーションして、対称標的核酸を生成することができる。続いて、対称標的核酸を、本明細書に記載されるように非対称標的核酸に変換することができる。
いくつかの実施形態では、用途は、mRNAなどのRNAをシークエンシングするためである。RNAは、DNAに変換され、出発物質としてDNAを使用する用途とは対照的に、DNAへのプロセッシング中にRNA分子の一方又は両方の末端にアダプターを付加することができる。これは、RNAの5’及び/又は3’プロファイリング又は全長RNAプロファイリングの選択肢を提供する。例えば、図8に示すように、例示的な一実施形態では、mRNA分子を、ユニバーサル配列及び鋳型スイッチプライマーを含むポリ-Tプライマーの存在下で逆転写酵素に供して、各端にアダプター(CS1で示す)を含む二本鎖DNAをもたらす(図8A)。得られた二本鎖DNAのトランスポソーム複合体への曝露し(図8B)、対称アダプターを非対称アダプターに変換した後(図8C)、3つの異なる集団が結果として生じ得る(図8D)。1つの集団(3’末端)は、トランスポゾン配列が二本鎖DNAに挿入され、得られる標的核酸の他方の末端が、mRNAの元の3’末端に対応する配列を含む場合に生じる可能性がある。第2の集団(RNAボディとして示す)は、トランスポゾン配列が二本鎖 DNA内の2つの位置に挿入されると、結果として生じ得る。第3の集団(5’末端として示す)は、トランスポゾン配列が二本鎖DNAに挿入され、結果として生じる標的核酸の他端が、mRNAの元の5’末端に対応する配列を含む場合に生じ得る。
いくつかの実施形態では、用途は、メチル化シークエンシングである。メチル化又はヒドロキシメチル化状態の分析を可能にする広範囲な方法が文献、Barros-Silva et al.,Genes(Basel).2018 Sep;9(9):429)に記載されているか、当業者に既知である。変換の化学的(例えば、亜硫酸水素ナトリウム又はホウ酸塩化学)又は酵素的方法は、BS-seq、TAB-seq、RRBS-seq、MeDip-seq、メチルキャップ-seq、MBD-seq、Nanopore-seq、oxBS-seq、SeqCap Epi CpGiant、BSAS、WGBS、及びsci-MET(国際公開第2018/226708号)を含むがこれらに限定されない様々なメチル化シークエンシング法で使用することができる。
一実施形態では、用途は、タンパク質分析である。タンパク質は、細胞内若しくは表面結合されること、単離されること、又は生体試料中に存在することができる。様々な方法が当業者に利用可能である。タンパク質検出に多くの場合使用される一般的な方法は、抗体又はfab断片をオリゴヌクレオチドタグで標識することであり、抗体を目的のタンパク質と親和性結合させること、オリゴヌクレオチドタグを読み出し又は検出のために使用することである。オリゴヌクレオチドタグは、インデックス配列、UMI、ユニバーサル配列、又はそれらの組み合わせを含み得る。
いくつかの実施形態では、用途は、同時アッセイであり、2つ以上の異なる検体又は情報を同時に評価する。検体の例としては、DNA、RNA、及びタンパク質が挙げられるが、これらに限定されない。核酸は、異なる状態、例えば、エピジェネティック状態(ATAC、meC、5-ヒドロキシMeなど)、又は立体配座状態(例えば、HiC、3C、クロマチン状態など)であり得る。例としては、DNAとRNA、DNAと/又はRNA及びエピジェネティック状態(ATAC、meC、5-ヒドロキシMeなど)、DNAと立体配座状態(例えば、HiC、3C、クロマチン状態など)を分析するアッセイが挙げられる。
同時アッセイの例は、本明細書でGCC-seqと称されるゲノム+クロマチン立体配座シークエンシングのためのゲノムDNAの調製である。GCC-seqは、全ゲノムシークエンシング及びクロマチン立体配座分析を組み合わせ、単一細胞若しくは単一核並びにスプリット及びプールインデックス付けと組み合わせたときに、日常的なHi-Cタイプの方法よりも高い速度でクロマチン相互作用を捕捉する(実施例2を参照)。図9に例示されるようにゲノムDNAは、例えば、固定、制限酵素による消化、近接ライゲーション、及びヌクレオソーム枯渇によって処理され、次いでアダプターが付加されて対称標的核酸をもたらす。任意選択的に、分子捕捉を使用することができる。対称修飾標的核酸は、本明細書に記載されるように処理することができる。
シークエンシングのための固定された試料の調製
インデックス付き標的核酸のライブラリーは、シークエンシングのために調製することができる。インデックス付き標的核酸を断片を基質に付加するための方法は、当技術分野において既知である。一実施形態では、インデックス付き断片は、インデックス付き断片に対する特異性を有する複数の捕捉オリゴヌクレオチドを使用して濃縮され、捕捉オリゴヌクレオチドは、フローセル又はビーズなどの固形基質の表面に固定化され得る。例えば、捕捉オリゴヌクレオチドは、ユニバーサル結合対の第1のメンバーを含むことができ、結合対の第2のメンバーは、固形基質の表面に固定化される。同様に、固定化された標的核酸を増幅するための方法としては、ブリッジ増幅及び結合平衡除外が挙げられるが、これらに限定されない。シークエンシングの前に固定化及び増幅する方法は、例えば、Bignellら(米国特許第8,053,192号)、Gundersonら(国際公開第2016/130704号)、Shenら(米国特許第8,895,249号)、及びPipenburgら(米国特許第9,309,502号)に記載されている。
プールされた試料は、シークエンシングのために調製中に固定化され得る。シークエンシングは、単一分子のアレイとして実施することも、シークエンシングの前に増幅することもできる。増幅は、1つ以上の固定化プライマーを使用して実施することができる。固定化されたプライマーは、例えば、平面上、又はビーズのプール上のローンであり得る。ビーズのプールは、エマルジョンの各「区画」に単一のビーズを有するエマルジョン中に単離され得る。「区画」当たり1つの鋳型のみの濃度では、単一の鋳型のみが各ビーズ上で増幅される。
本明細書で使用するとき、用語「固相増幅」は、形成時に増幅生成物の全て又は一部が固体支持体上に固定されるように、固体支持体上又は固体支持体と関連して実施される任意の核酸増幅反応を指す。具体的には、この用語は、順方向及び逆方向増幅プライマーの一方又は両方が固体支持体上に固定されていることを除いて、標準溶液相増幅に類似した反応である固相ポリメラーゼ連鎖反応(固相PCR)及び固相等温増幅を包含する。固相PCRは、一方のプライマーがビーズに固定され、もう一方が遊離溶液にあるエマルジョン、一方のプライマーが表面に固定され、もう一方が遊離溶液にある固相ゲルマトリックスでのコロニー形成などのシステムを包含する。
いくつかの実施形態では、固体支持体はパターン化された表面を含む。「パターン化された表面」は、固体支持体の露出層内又はその上の異なる領域の配置を指す。例えば、1つ以上の領域は、1つ以上の増幅プライマーが存在する特徴であり得る。この特徴は、増幅プライマーが存在しない間質領域によって分離され得る。いくつかの実施形態では、パターンは、行及び列にある特徴のx-yフォーマットであり得る。いくつかの実施形態では、パターンは、特徴及び/又は間質領域の反復配列であり得る。いくつかの実施態様では、パターンは、特徴及び/又は間質領域のランダム配列であり得る。本明細書に記載の方法及び組成物で使用することができる例示的なパターン化表面は、米国特許第8,778,848号、同第8,778,849号、及び同第9,079,148号、並びに米国特許出願公開第2014/0243224号に記載されている。
いくつかの実施形態では、固体支持体は、表面にウェル又は窪みのアレイを含む。これは、フォトリソグラフィ、スタンピング技術、成形技術、及びマイクロエッチング技術を含むがこれらに限定されない様々な技術を使用して、当該技術分野において一般的に知られているように製造することができる。当該技術分野において理解されるように、使用される技術は、アレイ基板の組成及び形状に依存する。
パターン付き表面内の特徴は、ガラス、シリコン、プラスチック、又はポリ(N-(5-アジドアセトアミルペンチル)アクリルアミド-co-アクリルアミド)(PAZAM、例えば、それぞれ、参照によりその全体が本明細書に組み込まれる米国特許出願公開第2013/184796号、国際公開第2016/066586号、及び同第2015/002813号参照)などのパターン化された共有結合ゲルを備えた他の適切な固体支持体上のウェルのアレイ(例えば、マイクロウェル又はナノウェル)のウェルである可能性がある。このプロセスは、シークエンシングのために使用されるゲルパッドを作成し、これは、多数のサイクルでシークエンシング動作にわたって安定であり得る。ポリマーをウェルに共有結合することは、様々な用途の間に、構造化基材の寿命全体にわたってゲルを構造化特徴部に維持するのに有用である。しかしながら、多くの実施形態では、ゲルは、ウェルに共有結合される必要はない。例えば、いくつかの条件では、構造化基質のどの部分にも共有結合されていないシランフリーのアクリルアミド(silane free acrylamide、SFA、例えば、米国特許第8,563,477号を参照)をゲル材料として使用することができる。
特定の別の実施形態では、構造化基材は、ウェル(例えば、マイクロウェル又はナノセル)を用いて固体支持材料をパターニングし、パターン化された支持体をゲル材料(例えば、PAZAM、SFA、又はその化学修飾された変異体)でコーティングすることによって作製することができ、SFA(アジド-SFA)のアジド化バージョンなど、及びゲルコーティングされた支持体を、例えば化学研磨又は機械研磨によって研磨し、それによって、ウェル内にゲルを保持するが、ウェル間の構造化基材の表面上の間質領域から実質的に全てのゲルを除去するか又は不活性化する。ゲル材料にプライマー核酸を付着させることができる。次いで、修飾標的核酸の溶液を研磨基材と接触させて、個々の修飾標的核酸が、ゲル材料に付着したプライマーとの相互作用を介して個々のウェルに播種されるようにすることができるが、ゲル材料が存在しないか不活性であるため、標的核酸は間質領域を占有しない。修飾標的核酸の増幅は、間質領域内のゲルの不在又は非活性が、増殖する核酸コロニーの外への移動を防止するため、ウェルに限定されるであろう。プロセスは、好都合に製造可能であり、スケール変更可能であり、従来のマイクロ又はナノ製造方法を利用する。
本開示は、1つの増幅プライマーのみが固定化される「固相」増幅法(他のプライマーは通常は遊離溶液中に存在する)を包含するが、一実施形態では、固体支持体は、固定化された順方向及び逆方向プライマーの両方とともに提供される。実際には、増幅プロセスは増幅を維持するために過剰なプライマーを必要とするため、「複数」の同一の順方向プライマー及び/又は固体支持体上に固定化された「複数」の同一の逆方向プライマーが存在するであろう。本明細書における順方向及び逆方向プライマーへの言及は、文脈が別段の指示をしない限り、「複数の」そのようなプライマーを包含するものとして解釈されるべきである。
当業者に理解されるように、任意の所与の増幅反応は、増幅される鋳型に特異的な少なくとも1つのタイプの順方向プライマー及び少なくとも1つのタイプの逆方向プライマーを必要とする。しかしながら、特定の実施形態では、順方向及び逆方向プライマーは、同一配列の鋳型特異的部分を含んでもよく、完全に同一のヌクレオチド配列及び構造(任意の非ヌクレオチド修飾を含む)を有してもよい。換言すれば、1つのタイプのプライマーのみを用いて固相増幅を行うことができ、そのような単一プライマー法は、本開示の範囲内に包含される。他の実施形態は、同一の鋳型特異的配列を含むが、いくつかの他の構造的特徴において異なる順方向及び逆方向プライマーを使用してもよい。例えば、一方のタイプのプライマーは、他方には存在しない非ヌクレオチド修飾を含み得る。
固相増幅用プライマーは、好ましくは、プライマーの5’末端又はその付近で固体支持体への単一点共有結合によって固定され、プライマーの鋳型特異的部分をその同族鋳型へのアニーリングのために自由にし、3’ヒドロキシル基をプライマー伸長のために自由にする。当該技術分野において既知の任意の好適な共有結合手段をこの目的のために使用することができる。選択された付着化学的物質は、固体支持体の性質、及びそれに適用される任意の誘導体化又は官能化に依存する。プライマー自体は、付着を促進するために非ヌクレオチド化学修飾であってもよい部分を含んでもよい。特定の実施形態では、プライマーは、5’末端にホスホロチオエート又はチオホスフェートなどの硫黄含有求核剤を含んでもよい。固体に支持されたポリアクリルアミドヒドロゲルの場合、この求核剤はヒドロゲルに存在するブロモアセトアミド基に結合する。プライマー及び鋳型を固体支持体に取り付けるより具体的な手段は、国際公開第05/065814号に記載されるように、重合アクリルアミド及びN-(5-ブロモアセトアミドイルペンチル)アクリルアミド(BRAPA)からなるヒドロゲルへの、5’ホスホロチオエート結合を介する。
本開示の特定の実施形態は、例えば、ポリヌクレオチドなど生体分子への共有結合を可能にする反応基を含む中間材料の層又はコーティングの適用によって「官能化」された不活性基質又はマトリックス(例えば、ガラススライド、ポリマービーズなど)を含む固体支持体を利用することができる。このような支持体の例としては、ガラスなどの不活性基質上に支持されるポリアクリルアミドヒドロゲルが挙げられるが、これに限定されない。このような実施形態では、生体分子(例えば、ポリヌクレオチド)は、中間材料(例えば、ヒドロゲル)に直接共有結合してもよいが、中間材料は、それ自体が基質又はマトリックス(例えば、ガラス基質)に非共有結合してもよい。用語「固体支持体への共有結合」は、このタイプの配置を包含するように適宜解釈されるべきである。
プールされた試料は、ビーズ上で増幅されてもよく、各ビーズは、順方向及び逆方向増幅プライマーを含有する。一実施形態では、修飾標的核酸のライブラリーを使用して、米国特許出願公開第2005/0100900号、米国特許第7,115,400号、国際公開第00/18957号及び国際公開第98/44151号に記載されているものに類似した、固相増幅、より具体的には固相等温増幅による核酸コロニーのクラスター化アレイを調製する。用語「クラスター」及び「コロニー」は、本明細書において交換可能に使用され、複数の同一の固定化核酸鎖及び複数の同一の固定化された相補的核酸鎖を含む、固体支持体上の別個の部位を指す。用語「クラスター化アレイ」とは、このようなクラスター又はコロニーから形成されるアレイを意味する。この文脈では、用語「アレイ」は、クラスターの順序付けられた配置を必要とするものとして理解されるべきではない。
「固相」又は「表面」という用語は、プライマーが平坦な表面、例えば、ガラス、シリカ若しくはプラスチック顕微鏡スライド、又は類似のフロー細胞デバイスや、ビーズであって、1つ又は2つのプライマーが付着し、ビーズが増幅される、ビーズに取り付けられている平面アレイか、ビーズが増幅された後の表面上のビーズのアレイのいずれかを意味するために使用される。
クラスター化されたアレイは、国際公開第98/44151号に記載されているような熱サイクルのプロセス、又は温度が一定に維持され、試薬の変化を使用して延伸及び変性のサイクルが行われるプロセスを使用して調整され得る。このような等温増幅法は、国際公開第02/46456号及び米国特許出願公開第2008/0009420号に記載されている。
本明細書に記載されるか、又は当技術分野において一般的に既知の増幅方法のいずれも、固定化DNA断片を増幅するために、ユニバーサル又は標的特異的なプライマーとともに使用され得ることが理解されるであろう。増幅に好適な方法としては、米国特許第8,003,354号に記載されているように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(strand displacement amplification、SDA)、転写媒介増幅(transcription mediated amplification、TMA)、及び核酸配列に基づく増幅(nucleic acid sequence-based amplification、NASBA)が挙げられるが、これらに限定されない。上記の増幅方法を用いて、対象とする1つ以上の核酸を増幅することができる。例えば、多重PCR、SDA、TMA、NASBAなどを含むPCRを利用して、固定化DNA断片を増幅することができる。いくつかの実施形態では、対象となるポリヌクレオチドに特異的に指向されるプライマーは、増幅反応に含まれる。
ポリヌクレオチドの増幅に好適な他の方法としては、オリゴヌクレオチド伸長及びライゲーション、ローリングサークル増幅(RCA)(Lizardi et al.,Nat.Genet.19:225-232(1998))、及びオリゴヌクレオチドライゲーションアッセイ(oligonucleotide ligation assay、OLA)技術を含み得る(一般に米国特許第7,582,420号、同第5,185,243号、同第5,679,524号、及び同第5,573,907号、欧州特許第0 320 308(B1)号、欧州特許第0 336 731(B1)号、欧州特許第0 439 182(B1)号、国際公開第90/01069号、国際公開第89/12696号、及び国際公開第89/09835号参照)。これらの増幅方法は、固定化DNA断片を増幅するように設計され得ることが理解されるであろう。例えば、いくつかの実施形態では、増幅法は、対象の核酸に特異的に指向されるプライマーを含有するライゲーションプローブ増幅又はオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含んでもよい。いくつかの実施形態では、増幅法は、対象の核酸に特異的に指向されるプライマーを含有するプライマー伸長ライゲーション反応を含んでもよい。対象の核酸を増幅するよう特異的に設計され得るプライマー伸長及びライゲーションプライマーの非限定的な例として、増幅は、米国特許第7,582,420号及び同第7,611,869号により例示されるように、GoldenGateアッセイに使用されるプライマー(Illumina,Inc.,San Diego,CA)を挙げることができる。
DNAナノボールも、本明細書に記載の方法、システム、及び組成物と組み合わせて使用することができる。ゲノムシークエンシングのためのDNAナノブロックを作成及び使用するための方法は、例えば、米国特許及び公報である米国特許第7,910,354号、米国特許出願公開第2009/0264299号、同第2009/0011943号、同第2009/0005252号、同第2009/0155781号、同第2009/0118488号に見出すことができ、例えば、Drmanacら(2010,Science 327(5961):78-81)に記載されているように見出すことができる。手短に言うと、非対称標的核酸の生成後、非対称標的核酸は環状化され、ローリングサークル増幅によって増幅される(Lizardi et al.,1998.Nat.Genet.19:225-232;米国特許出願公開第2007/0099208(A1)号)。アンプリコンの伸長された鎖状構造は、コイリングを促進し、それによりコンパクトなDNAナノボールを作成する。DNAナノボールは、基質上に捕捉され、好ましくは、各ナノボール間の距離が維持され、それによって別個のDNAナノボールのシークエンシングが可能になるように、順序付けられた又はパターン化されたアレイを形成することができる。Complete Genomics(Mountain View,Calif.)によって使用されるものなどのいくつかの実施形態では、環状化の前にアダプター付加、増幅及び消化の連続ラウンドを実行して、アダプター配列によって分離されたいくつかの標的核酸を有するヘッドトゥテール構築物を作製する。
本開示の方法で使用され得る例示的な等温増幅法としては、例えば、Dean et al.,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)、又は例えば米国特許第6,214,587号により例示される等温鎖置換核酸増幅によって例示される複数置換増幅(Multiple Displacement Amplification、MDA)が挙げられるが、これらに限定されない。本開示で使用され得る他の非PCR系方法としては、例えば、Walker et al.,Molecular Methods for Virus Detection,Academic Press Inc.,1995に記載されている鎖置換増幅(SDA)、米国特許第5,455,166号、及び同第5,130,238号、並びにWalker et al.,Nucl.Acids Res.20:1691-96(1992)、又は、例えばLage et al.,Genome Res.13:294-307(2003)に記載されている過分枝鎖置換増幅が挙げられる。等温増幅法は、例えば、鎖置換Phi29ポリメラーゼ又はBst DNAポリメラーゼ大型断片、ゲノムDNAのランダムプライマー増幅のための5’->3’エキソで使用することができる。これらのポリメラーゼの使用は、それらの高い加工性及び鎖置換活性の利点を利用する。高い加工性により、ポリメラーゼは、10-20kbの長さの断片を生成できる。上記に述べたように、低加工性を有するポリメラーゼ及びKlenowポリメラーゼなどの鎖置換活性を有するポリメラーゼを使用して、等温条件下でより小さな断片を生成することができる。増幅反応、条件及び成分の更なる説明は、米国特許第7,670,810号の開示に詳細に記載されている。
いくつかの実施形態では、等温増幅は、排除増幅(ExAmp)とも呼ばれる、結合平衡除外増幅(kinetic exclusion amplification、KEA)を使用して行うことができる。本開示の核酸ライブラリーは、増幅試薬を反応させて、部位に播種した個々の標的核酸からそれぞれがアンプリコンの実質的にクローン性集団を含む複数の増幅部位を生成する工程を含む方法を使用して作製することができる。いくつかの実施形態では、増幅反応は、それぞれの増幅部位の容量を満たすのに十分な数のアンプリコンが生成されるまで進行する。このように、既に播種された部位を容量まで満たすと、標的核酸がその部位に着地して増幅するのを阻害し、それによってその部位でアンプリコンのクローン集団を生成する。いくつかの実施形態では、第2の標的核酸がその部位に到達する前に増幅部位が容量まで満たされていなくても、見かけのクローン性を達成することができる。いくつかの条件下では、第1の標的核酸の増幅は、その部位に輸送される第2の標的核酸からのコピーの生成を有効に上回るか又は圧倒するのに十分な数のコピーが作製される点まで進行し得る。例えば、直径500nm未満の円形特徴部上でブリッジ増幅プロセスを使用する実施形態では、第1の標的核酸に対する指数増幅の14サイクル後、同じ部位での第2の標的核酸からの汚染は、Illuminaシークエンシングプラットフォーム上での配列合成分析に悪影響を及ぼすのに不十分な数の汚染アンプリコンを生成することが決定された。
いくつかの実施形態では、アレイ中の増幅部位は、完全にクローンであることができるが、必ずしもそうである必要はない。むしろ、いくつかの用途では、個々の増幅部位は、主に第1の非対称標的核酸からのアンプリコンで占められ、また、第2の非対称標的核酸からの低レベルの汚染アンプリコンを有し得る。アレイは、汚染レベルがアレイのその後の使用に許容できない影響を有さない限り、低レベルの汚染アンプリコンを有する1つ以上の増幅部位を有することができる。例えば、アレイが検出用途で使用される場合、許容可能なレベルの汚染は、検出技術の信号対雑音比又は分解能に許容できない方法で影響を与えないレベルである。したがって、見かけのクローン性は、一般に、本明細書に記載の方法によって作製されるアレイの特定の使用又は用途に関連する。特定の用途のために個々の増幅部位で許容できる汚染の例示的なレベルとしては、最大で0.1%、0.5%、1%、5%、10%又は25%の汚染アンプリコンを含むが、これらに限定されない。アレイは、これらの例示的なレベルの汚染アンプリコンを有する1つ以上の増幅部位を含み得る。例えば、アレイ内の増幅部位の最大5%、10%、25%、50%、75%、又は更には100%に、汚染されたアンプリコンが含まれている可能性がある。アレイ又はその他の部位集合において、部位の少なくとも50%、75%、80%、85%、90%、95%又は99%以上がクローン性であるか、又は見かけでクローン性であり得ることが理解されよう。
いくつかの実施形態では、結合平衡除外は、別のイベント又はプロセスが発生することを効果的に排除するために、十分に速い速度でプロセスが生じるときに生じ得る。アレイの部位が溶液からの非対称標的核酸でランダムに播種され、非対称標的核酸のコピーが増幅プロセスで生成されて、播種部位の各々を容量を満たす核酸アレイの作製を例として取り上げる。本開示の結合平衡除外法によれば、播種及び増幅プロセスは、増幅速度が播種速度を超える条件下で同時に進行することができる。したがって、第1の標的核酸によって播種された部位でコピーが作製される比較的速い速度は、増幅のためにその部位を播種することから、第2の核酸を効果的に排除する。結合平衡除外法は、米国特許出願公開第2013/0338042号の開示に詳細に記載されているように実施することができる。
結合平衡除外は、増幅を開始する比較的遅い速度(例えば、非対称標的核酸の第1のコピーを作製する比較的遅い速度)に対して、非対称標的核酸(又は非対称標的核酸の第1のコピーの)の後続のコピーを作製する比較的速い速度を利用することができる。前段落の例では、結合平衡除外は、比較的遅い速度の非対称標的核酸の播種(例えば、比較的遅い拡散又は輸送)に対して、非対称標的核酸播種のコピーで部位を満たすために増幅が生じる比較的速い速度のために生じる。別の例示的な実施形態では、結合平衡除外は、部位に播種した非対称標的核酸の第1のコピーの形成の遅延(例えば、遅延活性化又は遅い活性化)に対して、部位を満たすために後続のコピーが作製される比較的速い速度のために生じ得る。この例では、個々の部位にいくつかの異なる非対称標的核酸が播種されている可能性がある(例えば、増幅前に、各部位にいくつかの非対称標的核酸が存在し得る)。しかしながら、任意の所与の非対称標的核酸の第1のコピー形成がランダムに活性化され得、これにより、後続のコピーが生成される速度と比較して第1のコピー形成の平均速度が比較的遅くなる。この場合、個々の部位にいくつかの異なる非対称標的核酸が播種されている可能性があるが、結合平衡除外により、それらのうちの1つのみの増幅が可能になる。より具体的には、第1の非対称標的核酸が増幅のために活性化されると、その部位はそのコピーで急速に容量が満たされ、それにより、その部位で第2の非対称標的核酸のコピーが作製されるのが防止される。
一実施形態では、本方法は、(i)平均輸送速度で増幅部位に非対称標的核酸を輸送すること、(ii)平均増幅速度で増幅部位にある非対称標的核酸を増幅することを同時に行うため、平均増幅速度が平均輸送速度を超える(米国特許第9,169,513号)。したがって、このような実施形態では、比較的遅い輸送速度を使用することによって、結合平衡除外を達成することができる。例えば、濃度が低いと、輸送の平均速度が遅くなるので、濃度が十分に低い非対称標的核酸を選択して、所望の平均輸送速度を達成することができる。代替的に又は追加的に、溶液中の高粘度溶液及び/又は分子クラウディング試薬の存在を使用して、輸送速度を低下させることができる。有用な分子クラウディング試薬の例としては、ポリエチレングリコール(polyethylene glycol、PEG)、フィコール、デキストラン、又はポリビニルアルコールが挙げられるが、これらに限定されない。例示的な分子クラウディング試薬及び製剤は、参照により本明細書に組み込まれる米国特許第7,399,590号に記載されている。所望の輸送速度を達成するように調節することができる別の因子は、標的核酸の平均サイズである。
増幅試薬は、アンプリコン形成を促進する更なる成分を含むことができ、場合によってはアンプリコン形成の速度を増加させる。一実施例は、リコンビナーゼである。リコンビナーゼは、反復的な浸潤/伸長を可能にすることによって、アンプリコン形成を促進することができる。より具体的には、リコンビナーゼは、ポリメラーゼによる非対称標的核酸の浸潤と、非対称標的核酸をアンプリコン形成の鋳型として使用するポリメラーゼによるプライマーの伸長と、を促進することができる。このプロセスは、浸潤/伸長の各ラウンドから生成されたアンプリコンが後続のラウンドで鋳型として機能する鎖反応として繰り返すことができる。変性サイクル(例えば、加熱又は化学変性による)は必要とされないため、このプロセスは標準的なPCRよりも迅速に行うことができる。したがって、リコンビナーゼ促進増幅は、等温的に行うことができる。増幅を促進するために、リコンビナーゼ促進増幅試薬中に、ATP、又は他のヌクレオチド(又は場合によってはその非加水分解性類似体)を含めることが望ましい。リコンビナーゼと一本鎖結合(single stranded binding、SSB)タンパク質の混合物は、SSBが増幅を更に促進できるため、特に有用である。リコンビナーゼ促進増幅のための代表的な製剤としては、TwistDx社(Cambridge,UK)によりTwistAmpキットとして市販されているものが挙げられる。リコンビナーゼ促進増幅試薬の有用な成分及び反応条件は、米国特許第5,223,414号及び同第7,399,590号に記載されている。
アンプリコン形成を促進し、場合によってはアンプリコン形成の速度を増加させるために増幅試薬に含めることができる成分の別の例は、ヘリカーゼである。ヘリカーゼは、アンプリコン形成の連鎖反応を可能にすることによって、アンプリコン形成を促進することができる。変性サイクル(例えば、加熱又は化学変性による)は必要とされないため、このプロセスは標準的なPCRよりも迅速に行うことができる。したがって、ヘリカーゼ促進増幅は、等温的に行うことができる。ヘリカーゼと一本鎖結合(SSB)タンパク質の混合物は、SSBが増幅を更に促進できるため、特に有用である。ヘリカーゼ促進増幅のための代表的な製剤としては、Biohelix社(Beverly,MA)からIsoAmpキットとして市販されているものが挙げられる。更に、ヘリカーゼタンパク質を含む有用な製剤の例は、米国特許第7,399,590号及び同第7,829,284号に記載されている。
アンプリコン形成を促進し、場合によってはアンプリコン形成の速度を増加させるために増幅試薬に含めることができる成分の更に別の例は、起点結合タンパク質である。
シークエンシング方法
非対称標的核酸の表面への結合に続いて、固定化され増幅された非対称標的核酸の配列が決定される。シークエンシングは、任意の好適なシークエンシング技術を使用して実施することができ、鎖再合成を含む、固定化され、増幅された非対称修飾標的核酸の配列を決定するための方法は、当技術分野において既知であり、例えば、Bignell et al.(米国特許第8,053,192号)、Gunderson et al.(国際公開第2016/130704号)、Shen et al.(米国特許第8,895,249号)、及びPipenburg et al.(米国特許第9,309,502号)に記載されている。
本明細書に記載の方法は、様々な核酸シークエンシング方法と併せて使用することができる。特に適用可能な技術は、核酸が、それらの相対的位置が変化しないようにアレイ内の固定位置に取り付けられ、アレイが繰り返し撮像されるものである。例えば、1つのヌクレオチド塩基型を別のヌクレオチド塩基型と区別するために使用される異なる標識と一致する異なる色チャネルで画像が得られる実施形態は、特に適用可能である。いくつかの実施形態では、非対称標的核酸のヌクレオチド配列を決定するプロセスは、自動プロセスであり得る。好ましい実施形態としては、合成によるシークエンシング(「SBS(sequencing-by-synthesis)」)技術が挙げられる。
SBS技術は、一般に、鋳型鎖に対するヌクレオチドの反復的付加による、新生核酸鎖の酵素的伸長を伴う。SBSの従来の方法では、単一のヌクレオチドモノマーが、各送達においてポリメラーゼの存在下で標的ヌクレオチドに提供され得る。しかしながら、本明細書に記載の方法では、送達中のポリメラーゼの存在下で、複数のタイプのヌクレオチドモノマーを標的核酸に提供することができる。
一実施形態では、ヌクレオチドモノマーは、ロックされた核酸(locked nucleic acid、LNA)又は架橋核酸(bridged nucleic acid、BNA)を含む。ヌクレオチドモノマーにおけるLNA又はBNAの使用は、ヌクレオチドモノマーと固定化された非対称修飾標的核酸上に存在するシークエンシングプライマー配列との間のハイブリダイゼーション強度を増加させる。
SBSは、ターミネーター部分を有するヌクレオチドモノマー、又はターミネーター部分を欠くヌクレオチドモノマーを使用することができる。ターミネーターを含まないヌクレオチドモノマーを使用する方法としては、例えば、本明細書で更に詳細に記載されるように、γ-リン酸標識ヌクレオチドを用いたピロシークエンシング及びシークエンシングが挙げられる。ターミネーターを含まないヌクレオチドモノマーを使用する方法では、各サイクルに付加されるヌクレオチドの数は、一般に可変であり、鋳型配列及びヌクレオチド送達のモードに依存する。ターミネーター部分を有するヌクレオチドモノマーを利用するSBS技術では、ターミネーターは、ジデオキシヌクレオチドを利用する従来のSangerシークエンシングの場合のように使用されるシークエンシング条件下で有効に不可逆的であり得るか、又はターミネーターは、Solexa(現在はIllumina,Inc.)によって開発されたシークエンシング方法の場合のように可逆的であり得る。
SBS技術は、標識部分を有するヌクレオチドモノマー、又は標識部分を欠くヌクレオチドモノマーを使用することができる。したがって、標識の蛍光などの標識の特性、分子量又は電荷などのヌクレオチドモノマーの特性、ピロリン酸の放出などのヌクレオチドの組み込みの副生成物などに基づいて、組み込みイベントを検出することができる。2つ以上の異なるヌクレオチドがシークエンシング試薬中に存在する実施形態では、異なるヌクレオチドは互いに区別可能であってもよく、あるいは2つ以上の異なる標識は、使用される検出技術の下で区別可能であり得る。例えば、シークエンシング試薬中に存在する異なるヌクレオチドは、異なる標識を有することができ、それらは、Solexa社(現Illumina社)によって開発されたシークエンシング方法によって例示される適切な光学系を使用して区別することができる。
好ましい実施形態としては、ピロシークエンシング技術が挙げられる。パイロシークエンシングは、特定のヌクレオチドが新生鎖に組み込まれるときに無機ピロリン酸塩(PPi)の放出を検出する(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.and Nyren,P.(1996)「Real-time DNA sequencing using detection of pyrophosphate release.」Analytical Biochemistry 242(1),84-9、Ronaghi,M.(2001)「Pyrosequencing sheds light on DNA sequencing.」Genome Res.11(1),3-11、Ronaghi,M.,Uhlen,M.and Nyren,P.(1998)「A sequencing method based on real-time pyrophosphate.」Science 281(5375),363、米国特許第6,210,891号、同第6,258,568号及び同第6,274,320号)。ピロシークエンシングにおいて、放出されたPPiは、ATPスルフラーゼによってアデノシン三リン酸(ATP)に即座に変換されることによって検出することができ、生成されたATPのレベルはルシフェラーゼで生成された光子を介して検出される。シークエンシングされる核酸は、アレイ中の特徴部に付着させることができ、アレイは、アレイの特徴部にヌクレオチドを組み込むことにより生成される化学発光シグナルを捕捉するために画像化することができる。アレイを特定のヌクレオチド型(例えば、T、C、又はG)で処理した後に、画像を得ることができる。各ヌクレオチド型の付加後に得られる画像は、アレイ内のどの特徴部が検出されるかに関して異なる。画像内のこれらの差異は、アレイ上の特徴部の異なる配列コンテンツを反映する。しかしながら、各特徴部の相対的な位置は、画像内で変わらないままである。画像は、本明細書に記載の方法を使用して記憶、処理、及び分析することができる。例えば、アレイを各異なるヌクレオチド型で処理した後に得られる画像は、可逆的ターミネーターベースのシークエンシング方法のための異なる検出チャネルから得られる画像について、本明細書に例示されるものと同じ方法で処理することができる。
別の例示的な種類のSBSでは、サイクルシークエンシングは、例えば、国際公開第04/018497号及び米国特許第7,057,026号に記載されているような開裂可能な又は光漂白可能な染料標識を含む可逆的ターミネーターヌクレオチドを段階的に付加することによって達成される。この手法は、Solexa社(現在Illumina社)によって商品化されており、国際公開第91/06678号及び同第07/123,744号にも記載されている。終端の両方を逆転させることができ、蛍光標識が開裂された蛍光標識ターミネーターの可用性は、効率的な循環可逆的終端(CRT)シークエンシングを容易にする。ポリメラーゼはまた、これらの修飾されたヌクレオチドを効率的に組み込み、かつそこから伸長するように共操作することもできる。
いくつかの可逆的ターミネーターベースのシークエンシング実施形態では、標識は、SBS反応条件下での伸長を実質的に阻害しない。しかしながら、検出標識は、例えば、開裂又は分解によって取り外し可能であり得る。画像は、アレイ化された核酸特徴部への標識の組み込み後に捕捉することができる。特定の実施形態では、各サイクルは、アレイへの4つの異なるヌクレオチド型の同時送達を伴い、各ヌクレオチド型は、スペクトル的に異なる標識を有する。次に、4つの異なる標識の1つに選択的な検出チャネルをそれぞれ使用して、4つの画像を得ることができる。あるいは、異なるヌクレオチド型を順次追加することができ、各追加工程の間にアレイの画像を得ることができる。このような実施形態では、各画像は、特定の型のヌクレオチドを組み込んだ核酸特徴部を示す。各特徴部の配列コンテンツが異なるため、様々な画像に様々な特徴部が存在するか、存在しない。しかしながら、特徴部の相対的な位置は、画像内で変わらないままである。このような可逆的ターミネーター-SBS法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。画像捕捉工程に続いて、標識を除去することができ、その後のヌクレオチド付加及び検出のサイクルのために可逆的ターミネーター部分を除去することができる。特定のサイクルで検出された後、及び後続のサイクルの前に標識を除去すると、サイクル間のバックグラウンド信号及びクロストークを低減できるという利点がある。有用な標識及び除去方法の例を本明細書に記載する。
特定の実施形態では、ヌクレオチドモノマーの一部又は全ては、可逆的ターミネーターを含み得る。このような実施形態では、可逆的ターミネーター/開裂可能なフルオロフォアは、3’エステル結合(Metzker,Genome Res.15:1767-1776(2005))を介してリボース部分に結合されたフルオロフォアを含み得る。他の手法は、蛍光標識(Ruparel et al.,Proc Natl Acad Sci USA 102:5932-7(2005))からターミネーターの化学的物質を分離した。Ruparelらは、少量の3’アリル基を使用して伸長をブロックするが、パラジウム触媒で短時間処理することで簡単にブロックを解除できる可逆性ターミネーターの開発について説明している。フルオロフォアは、長波長UV光への30秒の曝露によって容易に開裂することができる光開裂可能リンカーを介して基に付着された。したがって、ジスルフィド還元又は光開裂のいずれかを開裂可能なリンカーとして使用することができる。可逆的終端への別の手法は、dNTP上に嵩高な染料を配置した後に続く自然終端の使用である。dNTP上の帯電した嵩高な染料の存在は、立体障害及び/又は静電障害を介して効果的なターミネーターとして作用することができる。1つの組み込みイベントの存在は、染料が除去されない限り、それ以上の結合を防止する。染料の開裂は、フルオロフォアを除去し、終端を効果的に逆転させる。修飾ヌクレオチドの例は、米国特許第7,427,673号及び同第7,057,026号にも記載されている。
本明細書に記載の方法及びシステムとともに利用することができる追加の例示的なSBSシステム及び方法は、米国特許出願公開第2007/0166705号、同第2006/0188901号、同第2006/0240439号、同第2006/0281109号、同第2012/0270305号、及び同第2013/0260372号、米国特許第7,057,026号、及び国際公開第05/065814号、米国特許出願公開第2005/0100900号、及び国際公開第06/064199号及び同第07/010,251号に記載されている。
いくつかの実施形態は、4つ未満の異なる標識を使用する4つの異なるヌクレオチドの検出を使用することができる。例えば、SBSは、組み込まれた資料である米国特許公開第2013/0079232号に記載される方法及びシステムを使用して実施することができる。第1の例として、ヌクレオチド型の対は、同じ波長で検出することができるが、対のうちの一方のメンバーの他方と比較した強度の差に基づいて、又は、対のうちの他方のメンバーについて検出されたシグナルと比較して明らかなシグナルを出現又は消失させる、対のうちの一方のメンバーへの変化(例えば、化学修飾、光化学修飾、又は物理的修飾を行うことを介して)に基づいて区別され得る。第2の例として、4つの異なるヌクレオチド型のうちの3つを特定の条件下で検出することができ、一方、第4のヌクレオチド型は、それらの条件下で検出可能な標識がないか、又はそれらの条件下で最小限に検出される(例えば、バックグラウンド蛍光による最小限の検出など)。最初の3つのヌクレオチド型を核酸に組み込むことは、それらの対応するシグナルの存在に基づいて決定することができ、第4のヌクレオチド型を核酸に組み込むことは、任意のシグナルの不在又は最小限の検出に基づいて決定することができる。第3の例として、1つのヌクレオチド型は、2つの異なるチャネルで検出される標識を含むことができ、一方、他のヌクレオチド型は、チャネルのうちの1つ以下で検出される。前述の3つの例示的な構成は、相互に排他的であるとはみなされず、様々な組み合わせで使用することができる。3つ全ての実施例を組み合わせた例示的な実施形態は、第1のチャネルで検出される第1のヌクレオチド型(例えば、第1の励起波長によって励起されたときに第1のチャネルで検出される標識を有するdATP)、第2のチャネルで検出される第2のヌクレオチド型(例えば、第2の励起波長によって励起されたときに第2のチャネルで検出される標識を有するdCTP)、第1及び第2のチャネルの両方において検出される第3のヌクレオチド型(例えば、第1及び/又は第2の励起波長によって励起されたときに両方のチャネルで検出される少なくとも1つの標識を有するdTTP)、及びいずれのチャネルでも検出されないか、又は最小限に検出される、標識のない第4のヌクレオチド型(例えば、標識のないdGTP)を使用する蛍光ベースのSBS法である。
更に、米国特許出願公開第2013/0079232号に記載のように、シークエンシングデータは、単一のチャネルを使用して得ることができる。このようないわゆる1つの染料シークエンシング方法では、第1のヌクレオチド型は標識されるが、第1の画像が生成された後に標識が除去され、第2のヌクレオチド型は、第1の画像が生成された後にのみ標識される。第3のヌクレオチド型は、第1及び第2の画像の両方においてその標識を保持し、第4のヌクレオチド型は、両方の画像において標識されていないままである。
いくつかの実施形態は、ライゲーション技術によるシークエンシングを使用することができる。このような技術は、DNAリガーゼを使用してオリゴヌクレオチドを組み込み、そのようなオリゴヌクレオチドの組み込みを識別する。オリゴヌクレオチドは、典型的には、オリゴヌクレオチドがハイブリダイズする配列中の特定のヌクレオチドの同一性と相関する異なる標識を有する。他のSBS方法と同様に、標識されたシークエンシング試薬で核酸配列のアレイを処理した後、画像を得ることができる。各画像は、特定の型の標識を組み込んだ核酸特徴部を示す。各特徴部の配列コンテンツが異なるため、様々な画像に様々な特徴部が存在するか、存在しないが、特徴部の相対的な位置は、画像内で変わらないままである。ライゲーションベースのシークエンシング方法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。本明細書に記載の方法及びシステムとともに利用することができる例示的なSBSシステム及び方法は、米国特許第6,969,488号、同第6,172,218号、及び同第6,306,597号に記載されている。
いくつかの実施形態は、ナノ細孔シークエンシングを使用することができる(Deamer,D.W.& Akeson,M.「Nanopores and nucleic acids:prospects for ultrarapid sequencing.」、Trends Biotechnol.18,147-151(2000)、Deamer,D.and D.Branton,「Characterization of nucleic acids by nanopore analysis」,Acc.Chem.Res.35:817-825(2002)、Li,J.,M.Gershow,D.Stein,E.Brandin,and J.A.Golovchenko,「DNA molecules and configurations in a solid-state nanopore microscope」Nat.Mater.2:611-615(2003))。そのような実施形態では、非対称標的核酸は、ナノ細孔を通過する。ナノ細孔は、α-ヘモリジンなどの合成孔又は生体膜タンパク質であり得る。非対称標的核酸がナノ細孔を通過するとき、各塩基対は、細孔の電気コンダクタンスの変動を測定することによって識別することができる。(米国特許第7,001,792号、Soni,G.V.& Meller,「A.Progress toward ultrafast DNA sequencing using solid-state nanopores.」Clin.Chem.53,1996-2001(2007)、Healy,K.「Nanopore-based single-molecule DNA analysis.」Nanomed.2,459-481(2007)、Cockroft,S.L.,Chu,J.,Amorin,M.& Ghadiri,M.R.「A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution.」J.Am Chem.Soc.130,818-820(2008)。ナノ細孔シークエンシングから得られるデータは、本明細書に記載されるように、保存、処理、及び分析することができる。具体的には、データは、本明細書に記載される光学画像及び他の画像の例示的な処理に従って、画像として処理することができる。
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを含む方法を使用することができる。ヌクレオチドの組み込みは、例えば、米国特許第7,329,492号及び同第7,211,414号に記載されているようなフルオロフォア含有ポリメラーゼとγ-リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(fluorescence resonance energy transfer、FRET)相互作用を介して検出することができ、又はヌクレオチドの組み込みは、例えば、米国特許第7,315,019号に記載されているようなゼロモード導波路、並びに、例えば、米国特許第7,405,281号及び米国特許出願公開第2008/0108082号に記載されているような蛍光ヌクレオチド類似体及び操作ポリメラーゼを使用して検出することができる。照明は、蛍光標識されたヌクレオチドの組み込みが低バックグラウンドで観察され得るように、表面繋留ポリメラーゼの周囲のゼプトリットルスケールの体積に制限することができる(Levene,M.J.et al.「Zero-mode waveguides for single-molecule analysis at high concentrations.」Science,299,682-686(2003)、Lundquist,P.M.et al.「Parallel confocal detection of single molecules in real time.」Opt.Lett.33,1026-1028(2008)、Korlach,J.et al.「Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures.」Proc.Natl.Acad.Sci.USA 105、1176-1181(2008))。このような方法から得られる画像は、本明細書に記載されるように、記憶、処理、及び分析することができる。
いくつかのSBS実施形態は、伸長生成物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づくシークエンシングは、Ion Torrent社(Guilford,CT、Life Technologies社子会社)から市販されている電気検出器及び関連技術、又は米国特許出願公開第2009/0026082号、同第2009/0127589号、同第2010/0137143号、及び同第2010/0282617号に記載のシークエンシング方法及びシステムを使用することができる。結合平衡除外を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基質に容易に適用することができる。より具体的には、本明細書に記載の方法を使用して、プロトンを検出するために使用されるアンプリコンのクローン集団を生成することができる。
上記のSBS方法は、複数の異なる非対称標的核酸が同時に操作されるように、多重形式で有利に実施することができる。特定の実施形態では、異なる非対称標的核酸は、共通の反応容器又は特定の基質の表面で処理することができる。これにより、シークエンシング試薬の簡便な送達、未反応試薬の除去、及び組み込みイベントの検出を多重に可能になる。表面結合された標的核酸を使用する実施形態では、非対称標的核酸は、アレイ形式であり得る。アレイ形式では、非対称標的核酸は、典型的には、空間的に区別可能な様式で表面に結合され得る。非対称標的核酸は、直接共有結合、ビーズ若しくは他の粒子への付着、又は表面に付着したポリメラーゼ若しくは他の分子への結合によって結合され得る。アレイは、各部位(特徴部とも呼ばれる)に非対称標的核酸の単一コピーを含むか、又は同じ配列を有する複数のコピーが、各部位若しくは特徴部に存在することができる。複数のコピーは、本明細書で更に詳細に記載されるブリッジ増幅又はエマルジョンPCRなどの増幅方法によって生成することができる。
本明細書に記載の方法は、例えば、少なくとも約10個の特徴部/cm、100個の特徴部/cm、500個の特徴部/cm、1,000個の特徴部/cm、5,000個の特徴部/cm、10,000個の特徴部/cm、50,000個の特徴部/cm、100,000個の特徴部/cm、1,000,000個の特徴部/cm、5,000,000個の特徴部/cm、又はそれ以上を含む、様々な密度のいずれかの特徴部を有するアレイを使用することができる。
本明細書に記載の方法の利点は、複数のcmの迅速かつ効率的で、並行な検出を提供することである。したがって、本開示は、本明細書に例示されるものなどの当技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又はシークエンシング試薬を1つ以上の固定化された非対称標的核酸に送達することができる流体構成要素を含むことができ、システムは、ポンプ、弁、リザーバー、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフロー細胞は、例えば、米国特許第8,241,573号及び米国特許第8,951,781号に記載されている。フローセルについて例示されるように、統合システムの流体成分の1つ以上を増幅方法及び検出方法に使用することができる。核酸シークエンシングの実施形態を一例としてとると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したようなシークエンシング方法におけるシークエンシング試薬の送達に使用することができる。あるいは、統合システムは、増幅方法を実行し、検出方法を実行するための別個の流体システムを含み得る。増幅された核酸を作成し、又核酸の配列を決定することができる統合シークエンシングシステムの例としては、MiSeqTMプラットフォーム(Illumina,Inc.,San Diego,CA)、及び米国特許第8,951,781号に記載の装置が挙げられるが、これらに限定されない。
組成物
本開示によって提供される方法の実施中に、いくつかの組成物が生じ得る。例えば、トランスポソーム複合体及び損傷不耐性DNAポリメラーゼを含む組成物が生じ得る。トランスポソームは、アダプターを含むトランスポゾン配列に結合したトランスポザーゼを含み得る。アダプターは、1つ以上のDNA損傷、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含み得る。組成物は、標的核酸を更に含むことができる。任意選択的に、組成物は、損傷耐性DNAポリメラーゼを含み得る。
別の実施形態では、組成物は、複数の一本鎖修飾標的核酸、プライマー、及び損傷不耐性DNAポリメラーゼを有することになり得る。例えば、標的核酸は、5’から3’に、第1のアダプター、標的核酸、及び第1のアダプターの相補体を含み得る。第1のアダプターは、1つ以上のDNA損傷、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含むことができる。一実施形態では、ユニバーサル配列は、トランスポザーゼ認識部位を含み得る。プライマーは、5’から3’に、第2のアダプター、及び第1のアダプターの相補体にアニーリングするヌクレオチド配列を含み得る。第2のアダプターは、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含むことができる。プライマーは、任意選択的に、ブロック3’末端を含み得、任意選択的に少なくとも1つの改変ヌクレオチドを含み得る。一実施形態では、プライマーは、一本鎖修飾標的核酸にアニーリングされる。
別の実施形態では、組成物は、トランスポソーム複合体を含む。トランスポソーム複合体は、トランスポザーゼ及びトランスポゾンを含むが、これらに限定されない。一実施形態では、トランスポゾンは、アダプターを含む。アダプターは、例えば、5’から3’に少なくとも1つのユニバーサル配列、少なくとも1つのインデックス配列、少なくとも1つのUMI、又はそれらの組み合わせ、DNA損傷、及びトランスポザーゼ認識配列を有する第1の鎖を含み得る。一実施形態では、トランスポザーゼ認識配列は、モザイク要素を含む。アダプターは、例えば、トランスポザーゼ認識配列の少なくとも一部に相補的なヌクレオチドを有する第2の鎖を含み得る。一実施形態では、第1の鎖はまた、5’末端に捕捉剤を含むか、又は第2の鎖も、3’末端に捕捉剤を含む。一実施形態では、切断可能なリンカーは、捕捉剤と第1の鎖の5’末端との間に位置する。一実施形態では、切断可能なリンカーは、捕捉剤と第2の鎖の3’末端との間に位置する。一実施形態では、組成物は、固体表面を更に含み、トランスポザーゼ複合体が、固体表面に付着している。別の実施形態では、組成物は、固体表面を更に含み、トランスポゾンはトランスポザーゼに関連しておらず、トランスポゾンは固体表面に結合している。
キット
本開示はまた、本明細書で提供される方法の1つ以上の態様を実施するためのキットを提供する。キットは、標的核酸のライブラリーを生成するために使用することができる。一実施形態では、キットは、対称標的核酸のライブラリーを生成するために使用することができる。キットは、別個の容器を、トランスポソーム複合体及び損傷不耐性DNAポリメラーゼを含見得る。トランスポソームは、トランスポゾン配列に結合したトランスポザーゼを含むことができ、トランスポゾン配列は、アダプター及びDNA損傷を含む。一実施形態では、キットは、対称ライブラリーを非対称ライブラリーに変換するために使用することができる。この実施形態では、キットは、プライマーを更に含むことができる。一実施形態では、プライマーは、5’から3’に第2のアダプター及び第1のアダプターの相補体にアニーリングするヌクレオチド配列を含む。
キットの成分は、少なくとも1つのライブラリーを生成するのに十分な量で好適なパッケージ材料中に存在し得る。任意選択的に、緩衝液(調製されたもの、又はその構成成分中に存在するかのいずれかであり、構成成分のうちの1つ以上が予め混合されていてもよく、又は構成成分の全てが別々であってもよい)などの他の試薬もまた含まれる。典型的には、パッケージされた構成要素の使用説明書も含まれる。
本明細書で使用するとき、「パッケージ材料」という語句は、キットの内容物を収容するために使用される1つ以上の物理的構造を指す。パッケージ材料は、好ましくは無菌の、汚染物質を含まない環境を提供するために、既知の方法によって構築される。パッケージ材料は、シークエンシングライブラリーを生成するために構成成分が使用され得ることを示すラベルを有してよい。加えて、パッケージ材料は、本明細書で提供される方法の1つ以上の態様を実施するためにキット内の材料がどのように用いられるかを示す説明書を含む。本明細書で使用され場合、用語「パッケージ」とは、キットの1つ以上の構成成分を一定限度内に保持することができる、ガラス、プラスチック、紙、箔などの固体マトリックス又は材料を指す。「使用説明書」は、典型的には、試薬濃度、又は混合する試薬及び試料の相対量、試薬/試料混合物の維持期間、温度、緩衝条件など少なくとも1つのアッセイ法パラメータを説明する具体的な表現を含む。
本発明は、特許請求の範囲に定義される。しかしながら、以下に非限定的な例示的態様の非網羅的なリストを提供する。これらの態様の特徴のうちの任意の1つ以上は、本明細書に記載される別の実施例、実施形態、又は態様のうちの任意の1つ以上の特徴と組み合わせることができる。
例示的な態様
態様1は、シークエンシングライブラリーを生成するための方法であって、
各末端に第1のアダプター配列を含む複数の対称修飾標的核酸を提供することであって、第1のアダプター配列が、DNA損傷を含む、提供することと、
修飾標的核酸を損傷不耐性ポリメラーゼで伸長して、各鎖の5’末端に第1のアダプター配列と、各鎖の3’末端に第1のアダプターの一部の相補体とを含む複数の非対称修飾標的核酸を生成することと、を含む、方法である。
態様2は、複数の対称修飾標的核酸が、二本鎖であり、各鎖が、5’から3’にDNA損傷を含む第1のアダプター配列と、標的核酸と、少なくとも1つのヌクレオチドを含むギャップと、DNA損傷を含まない第1のアダプター配列の相補体と、を含む、態様1に記載の方法である。
態様3は、伸長が、ギャップで開始する、態様1又は2に記載の方法である。
態様4は、
プライマーを複数の非対称修飾標的核酸にアニーリングすることであって、プライマーが、5’から3’に第2のアダプター配列及びアニーリングドメインを含み、アニーリングドメインが、複数の非対称修飾標的核酸の第1のアダプターの一部の相補体にアニーリングするヌクレオチド配列を含む、アニーリングすることと、
アニーリングされた非対称修飾標的核酸の3’末端を、損傷不耐性ポリメラーゼで伸長することであって、伸長が、5’から3’に(i)第1のアダプター、(ii)標的核酸、(iii)第1のアダプターの一部の相補体、及び(iv)第2のアダプターの相補体を含む、複数の非対称修飾標的核酸をもたらす、伸長することと、を更に含む、態様2又は3のいずれかの方法である。
態様5は、アニーリングされた非対称修飾標的核酸の3’末端の伸長が少なくとも3回繰り返される、態様1~4のいずれか1つに記載の方法である。
態様6は、DNA損傷が、脱塩基部位、修飾塩基、ミスマッチ、一本鎖切断、又は架橋ヌクレオチドのうちの少なくとも1つを含む、態様1~5のいずれか1つに記載の方法である。
態様7は、DNA損傷が、少なくとも1つのウラシルを含む、態様1~6のいずれか1つに記載の方法である。
態様8は、プライマーのアニーリングドメインが、対応する天然DNAヌクレオチドと比較して、融解温度を増加させる少なくとも1つの改変ヌクレオチドを含む、態様1~7のいずれか1つに記載の方法である。
態様9は、改変ヌクレオチドが、ロックド核酸、PNA、又はRNAを含む、態様1~8のいずれか1つに記載の方法である。
態様10は、プライマーの3’末端がブロックされている、態様1~9のいずれか1つに記載の方法である。
態様11は、第1のアダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のユニバーサル分子識別子、又はそれらの組み合わせを含む、態様1~10のいずれか1つに記載の方法である。
態様12は、1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子のうちの少なくとも1つが、DNA損傷と標的核酸の遠位のアダプターの末端との間のアダプターに位置する、態様1~11のいずれか1つに記載の方法である。
態様13は、第2のアダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のユニバーサル分子識別子、又はそれらの組み合わせを含む、態様1~12のいずれか1つに記載の方法である。
態様14は、第1のアダプターの1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子が、第2のアダプターの1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子と比較して固有である、態様1~13のいずれか1つに記載の方法である。
態様15は、第1のアダプターの1つ以上のインデックス配列が、区画特異的である、態様1~14のいずれか1つに記載の方法である。
態様16は、第2のアダプターの1つ以上のインデックス配列が、区画特異的である、態様1~15のいずれか1つに記載の方法である。
態様17.第1のアダプターが、トランスポザーゼ認識部位を含む、態様1~16のいずれか1つに記載の方法である。
態様18は、標的核酸が、単一細胞に由来する核酸由来である、態様1~17のいずれか1つに記載の方法である。
態様19は、標的核酸が、複数の細胞に由来する核酸由来である、態様1~18のいずれか1つに記載の方法である。
態様20は、単一細胞又は複数の細胞に由来する標的核酸が、RNAを含む、態様1~19のいずれか1つに記載の方法である。
態様21は、RNAが、mRNAを含む、態様1~20のいずれか1つに記載の方法である。
態様22は、単一細胞又は複数の細胞に由来する標的核酸が、DNAを含む、態様1~21のいずれか1つに記載の方法である。
態様23は、DNAが、全細胞ゲノムDNAを含む、態様1~22のいずれか1つに記載の方法である。
態様24は、全細胞ゲノムDNAが、ヌクレオソームを含む、態様1~23のいずれか1つに記載の方法である。
態様25は、標的核酸が無細胞DNAに由来する核酸由来である、態様1~247のいずれか1つに記載の方法である。
態様26は、方法が、コンビナトリアルインデックス付きを含む、態様1~25のいずれか1つに記載の方法である。
態様27は、非対称修飾標的核酸を増幅することを更に含み、増幅が、第2のプライマー及び損傷耐性ポリメラーゼを含み、第2のプライマーが、第1のアダプター配列又はその相補体にアニーリングするヌクレオチド配列を含む、態様1~26のいずれか1つに記載の方法である。
態様28は、第2のプライマーが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のユニバーサル分子識別子、又はそれらの組み合わせを更に含む、態様1~27のいずれか1つに記載の方法である。
態様29は、第2のプライマーの1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子が、第1のアダプター及び第2のアダプターの1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子と比較して固有である、態様1~28のいずれか1つに記載の方法である。
態様30は、複数の非対称修飾標的核酸のサブセットが、複数の区画内に存在し、(i)第1のアダプターが、第1の区画特異的インデックスを含むか、(ii)第2のアダプターが、第2の区画特異的インデックスを含むか、又は(i)及び(ii)の両方のいずれかである、態様1~29のいずれか1つに記載の方法である。
態様31.異なる区画からの非対称修飾標的核酸を組み合わせて、プールされたインデックス付き非対称修飾標的核酸を生成することを更に含む、態様1~30のいずれか1つに記載の方法である。
態様32は、
プールされたインデックス付き非対称修飾標的核酸のサブセットを第2の複数の区画に分配し、インデックス付き非対称修飾標的核酸を修飾することを更に含み、修飾が、各サブセット中に存在するインデックス付き非対称修飾標的核酸に追加の区画特異的インデックス配列を付加して、インデックス付きDNA核酸をもたらすことを含み、修飾が、ライゲーション又は伸長を含む、態様1~31のいずれか1つに記載の方法である。
態様33は、区画が、ウェル又は液滴を含む、態様1~32のいずれか1つに記載の方法である。
態様34は、提供が、複数のDNA断片を第1のアダプターと、DNA断片の両端に第1のアダプターをライゲートする条件下で、接触させることを含む、態様1~33のいずれか1つに記載の方法である。
態様35は、DNA断片が二本鎖及び平滑末端である、態様1~34のいずれか1つに記載の方法である。
態様36は、第1のアダプターが、二本鎖DNAオリゴヌクレオチドである、態様1~35のいずれか1つに記載の方法である。
態様37は、第1の伸長オリゴヌクレオチドの一方の3’末端が、ブロックされている、態様1~36のいずれか一項に記載の方法である。
態様38は、DNA断片が二本鎖であり、一方又は両方の3’末端に一本鎖領域を含む、態様1~37のいずれか1つに記載の方法である。
態様39は、第1のアダプターが、一方の末端に一本鎖領域を含む二本鎖DNAオリゴヌクレオチドであり、一本鎖領域が、DNA断片上に存在する一本鎖領域にアニーリングすることができる、態様1~38のいずれか1つに記載の方法である。
態様40は、アダプターがフォーク型アダプターである、態様1~38のいずれか1つに記載の方法である。
態様41は、提供が、DNAをトランスポソーム複合体と接触させることを含み、トランスポソーム複合体が、トランスポザーゼと、第1のアダプターと、を含み、接触が、第1のアダプターのDNAへのライゲーションに好適な条件下で生じて、対称修飾標的核酸を生成する、態様1~40のいずれか1つに記載の方法である。一態様では、トランスポソーム複合体は、態様67~71のいずれか1つに記載のトランスポソーム複合体である。
態様42は、生成された対称修飾標的核酸が、ライゲートされた第1のアダプターと標的核酸との間で1つの鎖中に少なくとも1つのヌクレオチドのギャップを含む、態様1~41のいずれか1つに記載の方法である。
態様43は、DNAが複数の区画内に存在し、各区画内の第1のアダプターが、区画特異的インデックスを含む、態様1~42のいずれか1つに記載の方法である。
態様44は、異なる区画からの一本鎖修飾標的核酸を組み合わせて、プールされた対称修飾標的核酸を生成することと、対称修飾標的核酸を第2の複数の区画に分配することと、を更に含む、態様1~43のいずれか1つに記載の方法である。
態様45は、方法が、全細胞ゲノムDNAの断片化を更に含む、態様1~44のいずれか1つに記載の方法である。
態様46は、断片化が、制限エンドヌクレアーゼを用いた全細胞ゲノムDNAの消化を含む、態様1~45のいずれか1つに記載の方法である。
態様47は、断片化されたDNAが、キメラ標的核酸を結合するための近接ライゲーションに供される、態様1~46のいずれか1つに記載の方法である。
態様48は、アダプターのシトシン残基が、5-メチルシトシンで置き換えられる、態様1~47のいずれか1つに記載の方法である。
態様49は、対称又は非対称標的核酸が、化学的又は酵素的メチル化変換に供される、態様1~48のいずれか1つに記載の方法である。
態様50は、提供が、単離された核を固定することと、単離された核を、ゲノムDNAからヌクレオソームを解離させる条件に供することと、ゲノムDNAを断片化することと、キメラ標的核酸を結合する近接ライゲーションに断片を供することと、ライゲートされた断片をトランスポソーム複合体に接触させることと、を含み、トランスポソーム複合体が、トランスポザーゼと、第1のアダプターと、を含み、接触が、第1のアダプターのDNAへのライゲーションに好適な条件下で生じて、対称修飾標的核酸を生成する、態様1~49のいずれか1つに記載の方法である。
態様51は、断片化が、制限エンドヌクレアーゼでの消化を含む、態様1~50のいずれか1つに記載の方法である。
態様52は、
複数の増幅部位を含む表面を提供することであって、
増幅部位が、遊離3’末端を有する結合した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む、提供することと、
個々の非対称修飾標的核酸からのアンプリコンのクローン集団を各々含む複数の増幅部位を生成するのに好適な条件下で、増幅部位を含む表面を、複数の非対称修飾標的核酸と接触させることと、を更に含む、態様1~51のいずれか1つに記載の方法である。
態様53は、トランスポソーム複合体及びDNAポリメラーゼを含む組成物であって、トランスポソームが、トランスポゾン配列に結合したトランスポザーゼを含み、トランスポゾン配列が、アダプター及びDNA損傷を含み、DNAポリメラーゼが、損傷不耐性ポリメラーゼである、組成物である。
態様54は、アダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含む、態様53に記載の組成物である。
態様55は、損傷耐性DNAポリメラーゼを更に含む、態様53又は54に記載の組成物である。
態様56は、
5’~3’にDNA損傷を含む第1のアダプター、標的核酸、及び第1のアダプターの相補体を含む複数の修飾標的核酸と、
5’から3’に第2のアダプターと、アニーリングドメインと、を含むプライマーであって、アニーリングドメインが、第1のアダプターの相補体にアニーリングするヌクレオチド配列を含む、プライマーと、
損傷不耐性DNAポリメラーゼと、を含む、組成物である。
態様57は、プライマーが、対応する天然DNAヌクレオチドと比較して、融解温度を増加させる少なくとも1つの改変ヌクレオチドを含む、態様56に記載の組成物である。
態様58は、プライマーが標的核酸にアニーリングされる、態様56又は57に記載の組成物である。
態様59は、プライマーの3’末端が、ブロックされている、態様56~58のいずれか1つに記載の組成物である。
態様60は、第1のアダプターが、トランスポザーゼ認識部位を含む、態様56~59のいずれか1つに記載の組成物である。
態様61は、トランスポソーム複合体及びDNAポリメラーゼを別々の容器に、並びに使用説明書を含むキットであって、トランスポソームが、トランスポゾン配列に結合したトランスポザーゼを含み、トランスポゾン配列が、第1のアダプター及びDNA損傷を含み、DNAポリメラーゼが、損傷不耐性ポリメラーゼである、キットである。
態様62は、第2のDNAポリメラーゼを更に含み、第2のDNAポリメラーゼが、損傷耐性ポリメラーゼである、態様61に記載のキットである。
態様63は、プライマーを更に含み、プライマーが、5’から3’に第2のアダプター及びアニーリングドメインを含み、アニーリングドメインが、第1のアダプターの相補体にアニーリングするヌクレオチド配列を含む、態様61又は62に記載のキットである。
態様64は、プライマーの3’末端が、ブロックされている、態様61~63のいずれか1つに記載のキットである。
態様65は、第1のアダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含む、態様61~64のいずれか1つに記載のキットである。
態様66は、第2のアダプタープライマーが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを更に含む、態様61~65のいずれか1つに記載のキットである。
態様67は、トランスポザーゼと、第1の鎖上に、5’から3’に、少なくとも1つのユニバーサル配列、少なくとも1つのインデックス配列、少なくとも1つのUMI、又はそれらの組み合わせ、DNA損傷、トランスポザーゼ認識配列を含み、第2の鎖上に、トランスポザーゼ認識配列の少なくとも一部に相補的なヌクレオチドを含むアダプターを含む核酸を含むトランスポゾンと、を含む、トランスポソーム複合体である。
態様68は、第1の鎖が、第1の鎖の5’末端に捕捉剤を更に含む、態様67に記載のトランスポソーム複合体である。
態様69は、第1の鎖が、捕捉剤と5’末端との間に位置する切断可能なリンカーを更に含む、態様67又は68に記載のトランスポソーム複合体である。
態様70は、第2の鎖が、第2の鎖の3’末端に捕捉剤を更に含む、態様67~69のいずれか1つに記載のトランスポソーム複合体である。
態様71は、第2の鎖が、捕捉剤と3’末端との間に位置する切断可能なリンカーを更に含む、態様70に記載のいずれか1つのトランスポソーム複合体である。
本開示は、以下の実施例によって例示される。特定の実施例、材料、量、及び手順は、本明細書に記載の本開示の範囲及び趣旨に従って広く解釈されるべきであることを理解されたい。
実施例1
対称標的核酸の非対称標的核酸断片への変換の概念実証。
タグメンテーションによる対称標的核酸の生成及び非対称標的核酸への変換の実験アプローチ。シークエンシングライブラリーは、各末端に同じアダプターを有する標的核酸を生成するための単一のトランスポゾンとのトランスポソーム複合体を使用してDNAのタグメンテーションによって調製し、次いで、アダプターのうちの1つを修飾して非対称標的核酸をもたらすための条件に曝露した。
細胞/核のプロトコル。
キットは、以下を含む:96ウェルインデックス付きTSMプレート、384ウェルインデックス付きPCRプレート、5×タグメンテーション緩衝液TB1、ExTB(1.7mlのスクリューキャップチューブ、LNA+TX100中500ul)、タグメンテーション後の洗浄緩衝液(15mlコニカルチューブ中10ml)、再懸濁緩衝液(Resuspension buffer、RSB)(15mlのコニカルチューブ中10ml)、及び0.5%SDS(1.7mlのスクリューキャップチューブ中500ul)。
使用者により調製されたもの:Q5 2×マスターミックス(NEB、M0492L)、Q5U 2×マスターミックス(NEB、M0597L)、80%EtOH、及びAMPure XPビーズ(Beckman Coulter、A63880)。
機器及び消耗プラスチック:細胞カウンター(ThermoFisher Countess II FL自動細胞カウンター、AMQAF1000)、Countess細胞カウントチャンバースライド(ThermoFisher、PN C10228)、温度制御を備えたプレート用遠心分離機、温度制御を備えたベンチトップ型遠心分離機、バイオアナライザー(Agilent、PN G2939BA)、Agilent High Sensitivity DNAキット(5067-4626)、96ウェルプレート(Eppendorf twin.tec PCRプレート96 LoBind、スカート型、PN0030129512)、384ウェルプレート(Eppendorf twin.tec PCRプレート384 LoBind、スカート型、PN0030129547)、使い捨て試薬リザーバー(VWR、PN89094-658)又は同等品、ビーズ収集用マグネットスタンド、96及び384ウェルプレート用サーマルサイクラー、プレートシェーカー、並びにFalcon15mLコレクションチューブ(ThermoFisher、PN14-959-53A又はSARSTEDT、PN62.554.205)。
核調製のための試薬:Pierce(商標)16%ホルムアルデヒド(w/v)、メタノール不含(ThermoFisher、PN28906)、TryPLE(Fisher Scientific、PN12-604-039)、PBS緩衝液(Sigma、PN#806552-1L)、Pierceプロテアーゼ阻害剤ミニ錠剤、EDTA不含(PN A32955)、及びトリパンブルー溶液(ThermoFisher、PN15250061)。
細胞株に推奨される緩衝液。溶解緩衝液は、10mMのHEPES、10mMのNaCl、3mMのMgCl2、0.1%のIgepal、0.1%のTween(登録商標)、及びプロテアーゼ阻害剤である。NIB緩衝液は、10mMのTris(pH7.5)、10mMのNaCl、3mMのMgCl2、0.1%のTween、及びプロテアーゼ阻害剤である。10×Xlink緩衝液は、5MのNaCl、1MのTris HCl(pH7.5)、1MのMgCl2及び100ng/uLのBSAである。
核調製及びヌクレオソーム枯渇。細胞は、前日にT25フラスコ(PN)に1×10で播種し、採取時にはサブコンフルエントであった。細胞を、5mLの氷冷PBSを用いてフラスコ内で洗浄し、TrypLEを用いてトリプシン処理し(1mL、37℃で5分間)、4℃で3分間500rcfで回転させて収集し、1mLの氷冷PBSで洗浄して、核単離に進めた。
核単離。細胞を、4℃で3分間500rcfで遠心沈殿させ、1mLの溶解緩衝液中に再懸濁し、氷上で10分間インキュベートした。細胞を、4℃で3分間500rcfで遠心沈殿させ、300uLの溶解緩衝液に再懸濁した。核を1:5希釈(2uLの試料+8uLの溶解緩衝液+10uLのトリパンブルー溶液)を使用してカウントした。1×10を固定のために等分した。
核固定。体積を5mLの溶解緩衝液まで増加させ、新たに開封したアンプルから16%ホルムアルデヒド246μLを添加した(総計0.75%ホルムアルデヒド、0.5%~0.75%の範囲が許容可能)。穏やかに振とうしながら室温で10分間インキュベートし、4℃で3分間500rcfで遠心分離してペレット化し、1mLの氷冷NIBで洗浄し、4℃で3分間500rcfで回転させ、200uLの1×Xlink緩衝液(氷冷)で洗浄した。洗浄中、より良好なペレットのために核を1.5mLチューブに移し、4℃で3分間500rcfで回転させた。
ヌクレオソーム枯渇(全ゲノムシークエンシング用)。ペレットを40μLの1%SDSで760μLの1×Xlink緩衝液に再懸濁し、37℃で20分間振とうしながら(400rpm)インキュベートした。(0.05%最終SDS)、4℃で3分間500rcfで回転させ、200uL 1×NIBで洗浄し、4℃で3分間500rcfで回転させて、50~100uLのNIBに再懸濁した。2uLの試料に8uLのNIB及び10uLのトリパンブルーを添加し、10uLを細胞カウンターにロードした。核は、ピペッティングアウトのために、必要に応じて、500核/ulに濃縮又は希釈した。
プレートベースのコンビナトリアルインデックス付けワークフローのためのプロトコル(図10)。
タグメンテーション。核を緩衝液と混合する:350ul(約100K)核、500ulの5×タグメンテーション緩衝液(TB1)、及び1350ulのH2O。96TSMプレートの各ウェルに20ulを添加し、サーマルサイクラー上で55℃で15分間インキュベートする。100ulの200mMのEDTAを15mLのコレクションチューブに添加し、核を96ウェルプレートから氷上の15mLコレクションチューブにプールする(総計25ul×96+100ul=2.5mL)。核を4℃、500rcfでペレット化し、核を洗浄緩衝液500ulに懸濁する。2uLの試料を取り出し、8uLのNIB及び10uLのトリパンブルーを添加し、10uLを細胞カウンターにロードすることによって核の濃度を決定する。次いで、核を核/uLに希釈し、4uLをプレートの各ウェルにロードする。
伸長:以下の順序で試薬を添加する:1ulの0.5%SDSを添加し、55℃で10分間加熱し、2ulのExTB、7ulの2×Q5マスターミックス(NEB)を合計14ul添加する。ウェルを混合し、サーモサイクラー上でプログラムを実行する。1.72℃で10分間、2.98℃で30秒間、3.98℃で10秒間、4.59℃で20秒間、5.72℃で10秒間、6.工程3~5を総計10サイクル繰り返す、7.72℃で2分間及び8.10℃保持温度。
インデックス付きPCR:伸長から1ulのPCRプライマーを384ウェルPCRプレートから核プレートに移す。15ul 2×NEB Q5Uを添加し、サーマルサイクラー上でPCRプログラムを実行する:1.98℃で30秒間、2.98℃で10秒間、3.55℃で20秒間、4.72℃で30秒間、5.工程2~4を総計20サイクル繰り返す、6.72℃で2分間、及び7.10℃保持温度。ライブラリーは通常、12~14サイクルの間で増幅される。
ライブラリーのクリーンアップ:1ウェル当たり10ulをプールし、総計3840ulを15mLのコレクションチューブ(PN)に、Qiagen PCRクリーンアップカラム(PN)を通して濃縮し、50ulに溶出し、50ulのAmpure XPビーズを添加し、100ulの80%EtOHで2回洗浄し、20ulのRSBに溶出し、Bioanalyzer DNA HSキット(PN)で定量化する。
ゲノムDNA(genomic DNA、gDNA)のためのAA→AB(対称対非対称)プロトコル。
Tnpアセンブリ:5ulの10×アニーリング緩衝液、5ulのSBS12-U-ME(Mosaic Element)100uM、5ulのME’100uM、及び35ulのHOを総計で50ulを添加する。サーモサイクラー上で実行する:95℃で1分間、80℃で30秒間、サイクルごとに1℃ずつ20℃まで下げて、20℃で1時間、10℃保持温度。
TSMアセンブリ:79ulのSDB緩衝液、1ulのTn5 200uM、及び20ulのTnpを、総計100ulでTnpアセンブリから添加する。37℃で一晩インキュベートし、SDB緩衝液中で4倍希釈して500uMのTSM にする。
gDNAに対するタグメンテーション:4ulのgDNA20ng、5ulの2×TD緩衝液(タグメンション緩衝液)、及びTSMアセンブリから1ulのTSMを総計10ulで添加し、55℃で10分間インキュベートする。
AA→AB変換:1ulの1%SDSを添加し、55℃で10分間インキュベートし、1uMのLNA-ME_A14オリゴと混合した2ul 10% Triton(登録商標)-X100を加え、2ulの2×NPMマスターミックス(Illumina)を総計15ulで添加する。サーモサイクラー上で実行する:1.72℃で10分間、2.98℃で30秒間、3.98℃で10秒間、4.59℃で20秒間、5.72℃で10秒間、6.工程3~5を総計10サイクル繰り返す、7.72℃で2分間、及び8.10℃保持温度。
PCR:25uMのSBS12を1ul、25uMのA14を1ul、HOを8ul、及び25ulの2×NEB Q5Uマスターミックスを総計50ulで添加する。サーモサイクラー上で実行する:1.98℃で30秒間、2.98℃で10秒間、3.55℃で20秒間、4.72℃で30秒間、5.工程2~4を総計20サイクル繰り返す、6.72℃で2分間、及び7.10℃保持温度。ライブラリーは通常、12~14サイクルの間で増幅される。ライブラリーは、5ulのPCR生成物を1.2%のLonza agroseゲルにロードし、180vで15分間、生成物を分解することによってチェックすることができる。
DNA損傷のサイズの影響。
gDNAに対するAA→ABアプローチの概念実証データ。MEとインデックス間のDNA損傷として、異なる数のウラシルを含む3つの異なるTSM、すなわちU、UU、又はUUUを試験した。第1の伸長を10回繰り返した。全てのTSMは、機能的であり、異なる効率ではあるがライブラリーを生成し、単一のUが最も効率的であった(図11)。ABシステムを対照と比較し、SBS12-ME TSMを、A14-MEをロードしたTSMと混合した。qPCRにより、AA→ABシステムは、標準的なABシステムと比較して、鋳型を約4倍増加させた。LNA-ME濃度の滴定(本明細書ではデータは不図示)は、第2の伸長について100nMが効率的であることを示している。
アダプターを付加するための伸長に対する改変ヌクレオチドの影響。
標準的なA14-MEオリゴ(プライマー中にロック核酸(LNA)が存在しない)が、AA->AB変換において不十分に実施されたことをデータは示している。SBS12-ME及びA14-ME TSMを含むABシステムを対照として比較した(図12)。LNA-A14の代わりに、通常の塩基で作製されたオリゴを第2の伸長に適用した。PCRによる最終ライブラリー収率は、大幅に低減し、図11と比較して、幅広いスメアを示す。
LNA-MEは、第2の伸長を増強する。LNA-ME伸長のサイクル数を増加させると、収率が向上し、10サイクルは、ほぼ理論的最大値に達する(図13)。LNA修飾を有する修飾A14-MEオリゴを使用したほぼ完全なライブラリー変換と比較すると、標準的なA14-MEオリゴ(LNAなし)との不十分なライブラリー生成の差は、驚くべきかつ予想外であり、重大な利点であった。加えて、AA→AB及びABシステム間の2倍の収率差異は、ほぼ完全な最大変換が得られたことを示している。
アニーリング温度の影響。
核ATACバルクアッセイにおけるLNA-MEアニーリング温度滴定。SBS12及びA14MEを含むABシステムを対照として使用した。同じ数の核内のゲノムDNAをTSMによって転置した。第2の伸長のAA→ABワークフローは、異なるアニーリング温度で行った。約59.5℃では、最適な効率を示し、AB対照と比較して、qPCRに従って、増幅可能な鋳型を約5倍に増強することができる(図14)。
実施例2
単一細胞コンビナトリアルインデックス付けの改善
単一細胞オミックスの主要な課題は、各細胞についてのゲノム特性のシークエンシングライブラリーへの効率的な変換である。本明細書では、複数のアッセイに一般化可能であり、カスタムシークエンシング化学を必要としない単一細胞コンビナトリアルインデックス付けワークフロー(sci)のアダプター切り替え戦略について説明する。この技術では、対称鎖sci(s3)は、クロマチンアクセシビリティ(s3-ATAC)、全ゲノムシークエンシング(s3-WGS)、及びゲノムとクロマチンの立体配座(s3-GCC)を含む様々な特性について、細胞ごとに得られる読み取りにおいて1~2桁の改善を提供する。
主な
単一細胞ゲノミクスアッセイは、ライフサイエンス分野全範囲の複雑な生物学的システムを問い合わせるための有力なプラットフォームに急速になっている。単一細胞レベルで様々な特性を捕捉するためのプラットフォームは、典型的に、細胞スループットと細胞ごとに取得され得る情報の深度との間のトレードオフを被る。本発明者らは、ハイスループットで様々なゲノム特性を評価するためのトランスポザーゼベースのライブラリー構築を活用する単一細胞コンビナトリアルインデックス付け(sci)を利用するワークフローを説明した。転位反応自体(タグメンテーション)は、非常に効率的であるが、順方向又は逆方向の一次配列の形態で異なるアダプターが分子の各末端に組み込まれている場合のみ、実行可能なシークエンシングライブラリー分子が生成される。タグメンテーション反応の間、2つの配列の各々を組み込む可能性が等しいため、分子の半分が順方向-順方向又は逆方向-逆方向のアダプター組み合わせになり、理論的収率が50%に低減する。この効率に対抗するために、アダプター種のより大きな相補体の使用、RNA中間体を通過するためのT7プロモーター配列の組み込み4~6、又は標的化若しくはランダムプライミングを使用する第2のアダプターの組み込みを含むいくつかの戦略が開発されてきた。本明細書では、アダプター交換を利用して、上下両鎖の順方向及び逆方向アダプターの両方でタグ付けされたライブラリー分子を生成する代替戦略を提示する。更に、この形式により、トランスポザーゼアダプター複合体内に埋め込まれたDNAインデックス配列の使用が可能になり、1回目は転位段階で、2回目はPCR段階での2回のインデクシングが実行される単一細胞コンビナトリアルインデックス付け(sci)適用が可能になる1,9,10
この技術の対称ストランドsci(s3)は、ユニバーサルモザイク末端配列及び区画特異的DNAバーコードに加えて、順方向プライマー配列を組み込むための単一アダプター転位の効率を活用する。アダプターは、タグメンテーション反応中に共有結合で組み込まれる、得られる生成物の上鎖上のトランスポザーゼ認識配列(モザイク末端)の直後にウラシル塩基が存在するように設計されている。ウラシル不耐性酵素を用いたポリメラーゼ伸長は、DNAバーコード又は順方向プライマー配列への伸長なしに、下鎖上のモザイク末端配列のコピーをもたらす。ウラシル耐性ポリメラーゼとともに逆方向プライマー配列を含有するモザイク末端ロック核酸(LNA)鋳型のその後の変性及び付加により、ライブラリー分子の伸長が追加の配列に組み込まれることが可能になる。最大効率を確保するために、鋳型オリゴヌクレオチドを伸長からブロックして、プライマーとしてのその作用を防止し、線形伸長反応を複数回実行することが可能になる(図7)。s3プラットフォームの更なる利点は、アダプター配列が、sci技術に必要なカスタムワークフロー及びプライマーの代わりに、標準的なシークエンシングレシピが使用され得るように設計されていることである。1細胞当たりの通過読み取りの中央値が16倍改善された単一細胞クロマチンアクセシビリティライブラリー(s3-ATAC)、以前のSCI-seq/sci-DNA-seq11に比べて126倍改善された単一細胞全ゲノムシークエンシング(s3-WGS)、及び以前のコンビナトリアルインデックスHi-C法12よりも高い割合のクロマチン相互作用シグナルにより単一細胞におけるゲノム配列及びクロマチン立体配座情報(s3-GCC)の両方を捕捉する新しい技術を生成するためのこのワークフローを実証する。
本技術の新規成分の前に、核の前処理が最小限であるため、クロマチンアクセシビリティを評価するs3技術を確立することを最初に求めた。s3-ATACにおいて核を単離し、次いで従来のsci-ATAC-seqにおけるようにタグメント化するが、代わりに、シングルエンドインデックス付きトランスポソームを使用し、次いでアダプタースイッチングs3のワークフローを介して実行する(図7)。他の核からのゲノム混入がなく、かつバーコード衝突が最小限の真の単一細胞ライブラリーを達成することを確実にするために、一次凍結ヒト皮質組織及び凍結マウス全脳組織に対して「バーンヤード」試験としても知られている混合種実験を行った図15。クロスセル混入の割合をより正確に捕捉するために、理想化された細胞株設定ではなく、一次組織試料に対してこの試験を実行することを選択した。本発明者らは更に、タグメンテーション段階及びPCR段階でタグメンテーション前及び後の2つの試料からの核を混合することによって、導入の可能性のある両点でのクロストークのレベルを評価するように実験を設計した。更に、単一細胞コンビナトリアルインデックス付けワークフローの固有の試料多重化能力を活用することにより、純種ライブラリーを生成した。総計で、30886及び26,530の固有の中央値、それぞれヒト及びマウスの1細胞当たり、染色体第1~第22、第23(ヒト)、X及びYに整列させた高マッピング品質の読み取り(以下、「通過読み取り」と呼ぶ)を有する、1,366のヒト及び1054のマウスの単一細胞ATAC-seqプロファイルを生成した。特に、ライブラリーは非常に複雑であり、一意として細胞に割り当てられた読み取りの中央値が69.05%であり、追加の配列深度が現在シークエンシングされている深度のカバレッジを超えて得られ、それを大幅に増加させることを示している。更なるシークエンシング時に予測推定値が経験的データの2%以内に収まる、1細胞当たりの固有の読み取りを投影するための確立された方法を使用して、本発明者らは、我々のライブラリーが、それぞれヒト皮質及びマウス全脳試料について95%ライブラリー飽和で1細胞当たり128,144及び174,858の通過読み取りの中央値に達することを見出した。次に、我々のマウス脳試料の現在の深度並びに投影を、同等の組織並びに可能な場合はそれらのライブラリーの投影の公開されているデータセットと比較した。我々のライブラリーは、任意の他のライブラリー又は自己報告ライブラリー投影よりも桁違いに改善していることを見出した図16。
本発明者らは、改善がインデックスの重複又はゲノムクロストークによるものではないことを確認するために、ヒトマウス組み合わせ参照ゲノムに対応する一意の読み取り数を評価することによって、試料の純度を実証した。任意の処理の前、すなわち、タグメンテーション前、核を混合した実験条件下では、5.12%の衝突割合が観察され(図17、2×2.56%の検出されたヒト-マウスの衝突)、十分に許容レベル内である。予想されるように、タグメンテーション後の実験条件下でゼロ衝突が観察されたが、タグメンテーション前の実験で観察された衝突は、クロストーク又は周囲クロマチンとは対照的に二重サンプリングに起因することを示唆している。また、本発明者らは、それぞれ、2.77及び3.93の中央値で転写開始点(transcription start site、TSS)濃縮を評価し、ヒト及びマウス試料についてはそれぞれ、14.60%及び19.40%でピークと呼ばれる読み取りの割合(fraction of reads in called peak、FRIP)を評価することによって、読み取りの増加が、過剰なバックグラウンドに起因しない生物学的シグナルを実際に捕捉しており、両測定基準が一致する組織型に関して他のプラットフォームに匹敵することを確認した。次に、本発明者らは、十分なシグナルを使用して、試料内に存在する細胞型を識別することを求めた。各種について、集計データ上の呼び出されたピークを使用して、カウントマトリックスを構築し、続いてトピックモデリングツールのcisTopic13を使用した次元削減を構築し、次いで、UMAP14を使用して可視化し、最終的に、トピックレベルでグラフベースのクラスタリングを行った。本発明者らは、ヒト皮質及びマウス全脳の両試料について各クラスター内の細胞型特異的遺伝子における明確なシグナルとともに、視覚化空間並びに同定されたクラスターの両方における細胞型の明確な分離を見出した(図18~図21)。
次に、s3-ATACによって生成されたデータ品質の改善は、ハイスループットローパス単細胞ゲノムシークエンシングのために以前に報告された我々のsci-DNA-seq法を含む、他の単一細胞コンビナトリアルインデックス付けワークフローに翻訳可能であるべきであると推論した。s3ワークフロー(図7)を使用することに加えて、均一なカバレッジを得るために使用される技術のヌクレオソーム枯渇成分に対する他の改善も調査した。最初に、対照リンパ芽球細胞株(GM12878)上でs3-WGS(図6)を展開し、最適化されたバージョンの界面活性剤ベースのヌクレオソーム枯渇(×SDS)が、最高の均一性及び読み取り数を提供し、その状態における92の細胞が、1細胞当たりの通過読み取りが37.12%のゲノム捕捉率の中央値に変換される、6,584,602の中央値を示していることを明らかにした。本発明者らはまた、0.1~0.3(中央値0.18)内に収まる絶対偏差の中央値(MAD)を評価することによって、カバレッジが均一であり、他の単一細胞ゲノムシークエンシング技術に匹敵することを確認した。この最適化されたプロトコルを使用して、次に、s3-WGSを展開し、最小限の継代数後に原発性膵管腺がん(pancreatic ductal adenocarcinoma、PDAC)腫瘍に由来する2つの細胞株のシークエンシングを行った。
PDACは、典型的には進行した段階で現れるがんの壊滅的な形態であり、早期検出及び検査が腫瘍進行の鍵となる。PDAC検査は、生検試料中のがん細胞画分が少ないことに悩まされるために、精製された腫瘍からの低継代由来の連続再生細胞株(continuously-regenerating cell line、CRC)を使用した。この方法は、核型分析によって証明されるように、腫瘍試料に存在する不均一性の大部分を維持しながら、特性評価及び摂動の複数のモダリティを可能にする15。がん遺伝子KRASの2つの異なるサブクローンミスセンス変異(p.G12D及びp.G12C)と、Gバンディングベース及びスペクトル核型分析によって測定される重大なゲノム不安定性と、を有する2つの系統(PDAC-1及びPDAC-2と呼ばれる)を標的とした。これらの系統については、それぞれ、PDAC-1及びPDAC-2について、2,096,207及び1,445,381の予測通過読み取り数の中央値を示した709及び267の単一細胞ライブラリーを得た(図22~図24)。初期のGM12878対照試料よりも低いが、それは、従来の方法によって得られたカバレッジを大幅に超える。2つの系統のMADスコア(図24)は、0.28及び0.32の中央値を有するGM12878の比較的正常な核型のものよりも高かったが、しかしながら、これは、試料に存在する広範なコピー数変化を考慮すると、予想されることである。本発明者らは、PDAC-1原発性腫瘍、正常血液、及びCRC株からの一対の全エクソームシークエンシング及びコピー数呼び出しでこの期待値を検証し、特徴的なゲノム不安定性の強力な証拠を明らかにした。次に、単一細胞コピー数プロファイリングを行い、2つの系統の各々内の高度に変化したゲノムランドスケープを特定した。限定された核型分析データ及び全エクソームデータに従って、マルチメガベースサイズのコピー数異常の細胞ごとの同様のパターンを確認する。GM12878、及び2つのPDAC系統の3つの試料について、ゲノムウィンドウ内の推測コピー数プロファイルを使用して、階層的及びK平均クラスタリングを行い、複数のクローンゲノム配置を明らかにした。
単一細胞分解能を考慮して、既知のPDAC関連がん遺伝子及び腫瘍抑制因子コピー数異常の発生を評価することができた。患者間の違いの例として、PDAC-2試料のみで占められているクラスター7は、TGFβR2及びPBRM1を含むゲノム領域の特有の増幅を示し、領域は、細胞増殖に関連し、以前は、PDAC患者における高いがん細胞腫瘍画分と関連していた。PDAC-1試料は、がん遺伝子MYC(絶対コピー数2.26±2.36)を含むゲノム領域の不均一な増幅を明らかにする。更に、PDAC症例の90%超で発生することが知られているがん遺伝子KRASと重複するゲノム範囲の限局的増幅を明らかにした。クラスター1は、KRAS増幅による細胞数が最も少ない(23.3%、40/172細胞)が、クラスター5は、KRASコピー数増加の頻度が最も高い(82.6%、138/167細胞)ことが判明した。本発明者らは、ジェノタイピング及びデジタル液滴PCRに全エクソームデータを利用することによって、この不均一なコピー数異常を検証し、PDAC-1CRC株からサンプリングしたKRAS対立遺伝子の53%が過剰発現に関連する変異KRAS対立遺伝子を示していることを見出した。
重複及び欠失は、がん細胞増殖において競合的な利点を誘導し得るゲノム再編成の唯一の形態ではない。ゲノム反転は、標準的な核型分析及び染色体ペインティング法を介して評価することが困難であるが、ブレークポイントを捕捉する読み取りのみが裏付けになる証拠を提供するため、染色体転座は、全ゲノム増幅法で明らかにすることが困難である。これらの制限の両方に対処するために、本発明者らは、追加の前処理ワークフローとともにs3-WGS技術を利用し、固定及びヌクレオソーム枯渇後に制限消化し、次いで(HiC法のように、だがビオチン化塩基を組み込むことなく)、s3ライブラリー調製に続いて再ライゲーションした。この追加の処理により、遠位クロマチン接触点を示すキメラライゲーション結合部にわたる読み取りの一部がもたらされ、残りの読み取りが、全ゲノムシークエンシングデータとして機能し、ゲノム及びクロマチン立体配座の両方を可能にする(s3-GCC)ことが推論された(図9)。s3-WGS実験におけるように同じ2つのPDAC細胞株でs3-GCCを実行し(図25~図28)、PDAC-1及びPDAC-2について、1細胞当たりの予測通過読み取り中央値がそれぞれ、1,034,014及び1,245,266で同等である、22及び93の細胞プロファイルを生成した。次いで、コピー数呼び出しを実行し、結果をs3-WGSライブラリーと比較して、細胞株群内のもう片方内に散在する各方法のプロファイルと同様のパターンを明らかにした。クロマチン立体配座シグナルの初期測定値を得るために、染色体間読み取り対の割合を評価し、両方のs3-GCC調製物が、それらのs3-WGS対応物よりも68.91及び58.91倍の増加で過剰を含有していた。次いで、1kbpを超えるインサートサイズを有する読み取りの割合を測定し、各系統についてはそれぞれ、15.6%及び17.0%の中央値、平均16%であり、s3-WGSに対して361倍及び402倍の倍数濃縮で、ここでも中央値が同等であった。1細胞当たりの予測される固有の総染色体接触点を評価するために、最初に、クロマチン接触の読み取り数投影が、標準的なゲノムシークエンシング読み取りを表すデータのバルクと同じように実行されると仮定し、総通過読み取り数のパーセンテージをとることができた。これにより、PDAC-1については20,451及びPDAC-2については20,611の1細胞当たりの接触点の予測中央値が生成された。更に、本発明者らは、クロマチン接触を表す読み取りの部分に特異的に読み取り数投影を行い、244,728及び245,560の同様の値を得た。次いで、本発明者らは、比較的浅いシークエンシング深度から得られた接触点を使用し、異なるトポロジーパターンを示す凝集体プロファイルによりクロマチン接触マップを生成する能力を実証した。本発明者らは、scHiClusterを介してそれらの遠位接触の情報によって単一細胞を分離し、3つの異なるクラスターを観察した。特に、この低いシークエンシング深度でさえ、本発明者らは、細胞株の低密度の接触プロファイルを確実に見分けることができる。サンプリングされた細胞にわたる固有の転座及び反転イベントを評価するために、クラスター0(PDAC-1のみが占有している)及び1の集約された接触マップ間の差異を調べた。本発明者らは、単一細胞接触データが、PDAC-1試料について特に明らかになっていないt(3;14)(q24-26;q21-24)転座の例において、スペクトル核型分析(SKY)データから報告された染色体腕スケールの転座を複製することを見出した。本発明者らはまた、s3-WGSデータに見られる第3染色体のTGFβR2及びPBRM1領域間の染色体間の接触頻度が高まり、第2及び第4染色体に向かって、コピー数増加の異常なゲノム区画化を示唆している。
まとめると、s3ワークフローは、s3-ATACの場合、シグナル濃縮、又はs3-WGSのカバレッジ均一性を犠牲にすることなく、細胞ごとに得られた通過読み取り関して、従来のsciプラットフォームよりも著しい改善を表す。また、コンビナトリアルインデックス付けワークフローの別の異形、すなわちs3-GCCを導入して、ゲノムシークエンシング及びクロマチン立体配座の両方を取得し、sci-HiCと比較すると、細胞ごとに得られたクロマチン接点が改善される。本発明者らは、劇的なクロマチン不安定性を有する2つの患者由来の腫瘍細胞株を評価することによって、これらのアプローチの有用性を実証する。本発明者らは、疾患関連遺伝子の焦点増幅のパターンを明らかにし、標準的な核型分析で達成可能ではないスループットで広範囲の不均一性を明らかにする。更に、本発明者らは、クロマチン区画を破壊するコピー数異常の影響を明らかにするためのプロトコルの共同分析を強調する。更に、s3ワークフローは、標準的な単一細胞コンビナトリアルインデックス付けの同じ固有のスループット可能性を有する。このプラットフォームは、sci-METを含む他のトランスポザーゼに基づく技術と互換性があることも期待される10。s3プラットフォームの1つの可能な欠点は、一連の8の順方向及び12の逆方向複合体(96ウェルプレートの行及び列に対応する)を使用することとは対照的に、固有のトランスポソーム複合体のフルセットを使用する必要があり、ワークフローに必要なオリゴの数を大きくすることである。しかしながら、実験ごとに必要なオリゴが比例して少なくなるため、これらのコストは最終的には収支が合う。最後に、sciワークフローとは異なり、s3プラットフォームは、カスタムシークエンシングプライマー又はカスタムシークエンシングレシピを必要とせず、これらの技術を実行しながらラボが直面し得る主要なハードルのうちの1つを取り除く。
実施例2の引用
1. Cusanovich,D.A.et al.Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing.Science(80-.)。348,910-914(2015)。
2. Adey,A.et al.Rapid,low-input,low-bias construction of shotgun fragment libraries by high-density in vitro transposition.Genome Biol.11,R119(2010)。
3. Tan,L.,Xing,D.,Chang,C.H.,Li,H.& Xie,X.S.Three-dimensional genome structures of single diploid human cells.Science(80-.)。361,924-928(2018)。
4. Sos,B.C.et al.Characterization of chromatin accessibility with a transposome hypersensitive sites sequencing(THS-seq) assay.Genome Biol.17,20(2016)。
5. Yin,Y.et al.High-Throughput Single-Cell Sequencing with Linear Amplification.Mol.Cell 76,676-690.e10(2019)。
6. Chen,C.et al.Single-cell whole-genome analyses by Linear Amplification via Transposon Insertion(LIANTI).Science(80-.)。356,189-194(2017)。
7. Adey,A.& Shendure,J.Ultra-low-input,tagmentation-based whole-genome bisulfite sequencing.Genome Res.22,1139-1143(2012)。
8. Mulqueen,R.M.et al.Highly scalable generation of DNA methylation profiles in single cells.Nat.Biotechnol.36,428-431(2018)。
9. Vitak,S.A.et al.Sequencing thousands of single-cell genomes with combinatorial indexing.Nat.Methods 14,302-308(2017)。
10. Mulqueen,R.M.et al.Highly scalable generation of DNA methylation profiles in single cells.Nat.Biotechnol.36,428-431(2018)。
11. Vitak,S.A.et al.Sequencing thousands of single-cell genomes with combinatorial indexing.Nat.Methods 14,(2017)。
12. Ramani,V.et al.Massively multiplex single-cell Hi-C.Nat.Methods 14,263-266(2017)。
13. Bravo Gonzalez-Blas,C.et al.cisTopic:cis-regulatory topic modeling on single-cell ATAC-seq data.Nat.Methods 16,397-400(2019)。
14. Becht,E.et al.Dimensionality reduction for visualizing single-cell data using UMAP.Nat.Biotechnol.37,38-44(2018)。
15. Lindenburger,K.et al.AB024.S024.Drug responses of patient-derived cell lines in vitro that match drug responses of patient PDAc tumors in situ.Ann.Pancreat.Cancer 1,AB024-AB024(2018)。
方法
s3-ATACライブラリーの生成
試料取り扱いの前に、複合トランスポザーゼをIllumina Inc.から入手した。96の一意のインデックス付きトランスポザーゼにそれぞれのアダプターのうちの1つをロードし、2.5uMに希釈し、-20℃で保存した。50mLの核単離緩衝液(NIB-HEPES)を、最終濃度10mMのHEPES-KOH(それぞれ、Fisher Scientific、BP310-500及びSigma Aldrich1050121000)、pH7.2、10mMのNaCl(Fisher Scientific S271-3)、3mMのMgCl2(Fisher Scientific AC223210010)、0.1%(v/v)IGEPAL CA-630(Sigma Aldrich I3021)、0.1%(v/v)Tween(Sigma-Aldrich P-7949)で新たに調製し、PCRグレードの超純蒸留水(Thermo Fisher Scientific 10977015)で希釈した。希釈後、Pierce(商標)プロテアーゼ阻害剤ミニ錠剤、EDTA不含(Thermo Fisher A32955)2錠剤を溶解し、懸濁して、核単離中のプロテアーゼ分解を防止した。
s3-ATAC組織取り扱いについて、C57/B6マウス全脳及びヒト皮質の一次試料を抽出し、液体窒素浴中で急速凍結した後、-80℃で保存した。ベンチでの切開段階は、核抽出の前に設定した。ペトリ皿をドライアイス上に置き、新しい滅菌したかみそりをドライアイス包埋によって予備冷却した。7mL容量のダウンス型ホモジナイザーに2mLのNIB-HEPES緩衝液を充填し、ウェットアイス上に保持した。氷上で氷冷70%(v/v)エタノール(Decon Laboratories Inc 2701)を15mLのチューブに保持することによって、ダウンス型ホモジナイザー乳棒を冷却する。使用直前に、乳棒を冷却した蒸留水ですすいだ。組織解離のために、マウス及びヒトの脳試料を同様に処理した。まだ凍結した組織ブロックを清潔な予備冷却されたペトリ皿上に置き、かみそりで粗く刻んだ。次いで、かみそりを使用して約1mgに刻んだ組織を、ダウンス型ホモジナイザー内の冷却されたNIB-HEPES緩衝液に輸送した。懸濁した試料に5分間かけて、ダウンシング前の塩濃度の変化に平衡化した。次いで、ゆるい(A)乳棒での5ストロークでホモジナイズし、更に5分間インキュベートし、次いできつい(B)乳棒での5~10ストロークでホモジナイズした。次いで、試料を、15mLのコニカルチューブに移す間35μmのセルストレーナー(Corning 352235)を通して濾過し、続行する準備が整うまで核を氷上に保持した。核を4℃で、400rcfの遠心分離により10分間ペレット化した。上清を除去し、ペレットを1mLのNIB-HEPES緩衝液に再懸濁した。この工程を繰り返して2回目の洗浄を行い、続行する準備が整うまで、核を再び氷上に保持した。懸濁した核の10uLアリコートを90uLのNIB-HEPES(1:10希釈)で希釈し、血球計又はBioRad TC-20自動細胞カウンターのいずれかで製造業者の推奨プロトコルに従って定量化した。次いで、ストック核懸濁液を1400核/uLの濃度に希釈した。
タグメンテーションプレートを、420uLの1400核/uL溶液と540uLの2×TD緩衝液(Nextera XTキット、Illumina Inc.)との組み合わせによって、調製した。この混合物から、8uL(総計約5000核)をウェルスキーマに応じて96ウェルプレートの各ウェルにピペットで移した。次いで、25uMの一意のインデックス付きトランスポザーゼ1uLを各ウェルにピペットで移した。タグメンテーションは、300rcfエッペンドルフThermoMixer上で、55℃で10分間行った。このインキュベーション後、プレート温度を氷上で短時間インキュベートして下げて、反応を停止させた。実験的スキーマに応じてタグ付き核のプールを混合して、5mg/mLのDAPI(Thermo Fisher Scientific D1306)2uLを添加した。
次いで、核をSony SH800を介して流動分類して破片を除去し、PCRの前に1ウェル当たりの正確な計数を得た。容器96ウェルプレートを9uLの1×TD緩衝液(超純水で希釈)で調製した。次いで4℃の保持された試料室に保持した。次いで、蛍光核を、単一核についてサイズ、内部の複雑さ、及びDAPI蛍光によるゲーティングでフロー選別した。選別完了直後に、プレートを密閉し、500rcf、4℃で5分間遠心沈殿させて、核が緩衝液内にあることを確認した。
次いで、ヌクレオソーム及び残りのトランスポザーゼを、1ウェル当たり1uLの0.1%SDS(約0.01%f.c.)を添加して変性させた。その後、1ウェル当たり4uLのNPM(Nextera XTキット、Illumina Inc)を添加して、タグ付きゲノムDNA上でギャップ充填を行い、72℃で10分間インキュベートした。次いで、1uMのA14-LNA-MEオリゴ1.5uLを添加して、アダプター切り替えのために鋳型を供給した。次いで、ポリメラーゼベースのアダプター切り替えを、以下の条件で行った:98℃で30秒間の初期変性、98℃で10秒間を10サイクル、59℃で20秒間、及び72℃で10秒間。次いで、プレートを10℃に保持した。アダプター切り替え後、超純H2O(Sigma93426)で溶解した1%(v/v)Triton-X100を添加して、SDSの持続をクエンチした。この時点で、いくつかのプレートを-20℃で数週間保存し、他のプレートを直ちに処理した。
次いで、PCRのために1ウェル当たりの以下を混合した:1ウェル当たり50uLの反応のために16.5ulの試料、10μMのインデックス付きi7プライマー2.5uL、10μMのインデックス付きi5プライマー2.5uL、3uLの超純水、及び25uLのNEBNext Q5U 2Xマスターミックス(New England Biolabs M0597S)、並びに0.5uLの100×SYBR Green I(Thermo Scientific S7563)。リアルタイムPCRは、以下の条件でBioRad CFX上で行い、サイクルごとにSYBR蛍光を測定する:98℃で30秒間、98℃で10秒間を16~18サイクル、55℃で20秒間、72℃で30秒間、蛍光読み取り、72℃で10秒間。蛍光が指数関数的成長を過ぎて、屈折し始めた後、試料を72℃で更に30秒間保持し、次いで4℃で保存した。
次いで、増幅されたライブラリーを、1ウェル当たり25uLを15mLのコニカルチューブにプールすることによってクリーンアップし、製造元のプロトコル(Qiagen28106)に従ってQiaquick PCR精製カラムを介してクリーンアップした。プールした試料を10mMのTris-HCl50uL、pH8.0(Life technologies AM9855)中で溶出した。次いで、ライブラリー分子は、SPRI選択ビーズを介したサイズ選択(Mag-Bind(登録商標)TotalPure NGS Omega Biotek M1378-01)を受けた。室温でボルテックスし、完全に懸濁した50uLのSPRIビーズを50uLのライブラリー(1×クリーンアップ)と混合して、室温で5分間インキュベートした。次いで、反応物をマグネットラック上に置いて1度清澄させ、上清を除去した。残りのペレットを100uLの新しい80%エタノールで2回すすいだ。エタノールをピペットで除去した後、チューブを遠心沈殿させ、マグネットラックに戻して、あらゆる残留エタノールを除去する。次いで、31μLの10mMトリス-HCl、pH8.0を使用して、ビーズをマグネットラックから取り外して、再懸濁し、室温で5分間インキュベートした。チューブを再びマグネットラック上に置き、1度清澄させて、上清の全量をクリーンなチューブに移した。次いで、製造業者の説明書(Thermo Fisher Q32851)に従ってQubit dsDNA高感度アッセイによってDNAを定量化した。次いで、ライブラリーを2ng/uLに希釈し、Agilent Tapestation 4150 D5000テープ(Agilent5067-5592)上で実行した。次いで、100~1000bpの範囲内のライブラリー分子濃度を、ライブラリーの最終希釈の1nMまで使用した。次いで、希釈したライブラリーを、製造元(Illumina Inc.)の推奨に従ってNextseq 500システム上で大容量又は中容量150bpシークエンシングキットでシークエンシングした。
s3-WGSライブラリーの生成
処理の前に、以下の緩衝液を調製した:上記のように50mLのNIB HEPES緩衝液、並びに最終濃度の10mMのTris HCl pH7.4(Life Technologies AM9855)、10mMのNaCl、3mMのMgCl2、0.1%(v/v)のIGEPAL CA-630、0.1%(v/v)のTweenを含み、PCRグレードの超純蒸留水で希釈した50mLのTrisベースのNIB(NIB Tris)バリアント。希釈後、Pierce(商標)プロテアーゼ阻害剤ミニ錠剤(EDTA不含)2錠を溶解し、懸濁して、核単離中のプロテアーゼ分解を防止した。
s3-WGSライブラリーの調製は、以下のように細胞株で行った。患者由来のCRC細胞株の場合、処理の前に、T25フラスコ上に1×106の密度で細胞を播種した。細胞を氷冷1×PBS(VWR75800-986)で2回洗浄し、次いで5mLの1×TrypLE(Thermo Fisher 12604039)で37℃で15分間トリプシン処理した。次いで、浮遊細胞を収集し、300rcfで4℃で5分間ペレット化した。浮遊増殖細胞株(GM12878)の場合、細胞を増殖培地からピペットで移し、300rcfで4℃で5分間ペレット化した。
初期ペレットに続いて、細胞を氷冷1mLのNIB HEPESで2回洗浄した。2回目の洗浄後、ペレットを300uLのNIB HEPESに再懸濁した。核を等分し、上記のように定量化し、次いで、定量化に基づいて100万個の核アリコートを生成した。アリコートを、4℃で5分間300rcfの遠心分離によってペレット化し、5mLのNIB HEPESに再懸濁した。次いで、246uLの16%(w/v)ホルムアルデヒド(Thermo Fisher28906)を核懸濁液に添加して(f.c.0.75%ホルムアルデヒド)、核を軽く固定した。核を、50rpmに設定されたオービタルシェーカー上のホルムアルデヒド溶液中で10分間インキュベートすることによって固定した。次いで、懸濁液を4℃で4分間500rcfでペレット化し、上清を吸引した。次いで、ペレットを1mLのNIB Tris緩衝液に再懸濁して、残りのホルムアルデヒドをクエンチした。核を、4℃で4分間500rcfで再度ペレット化し、上清を吸引した。ペレットを500uL 1×NE緩衝液2.1(NEB B7202S)で1回洗浄し、次いで760uL 1×NE緩衝液2.1で再懸濁した。40uLの1%SDS(v/v)を添加し、試料を300rcfで37℃、20分間に設定したThermoMixer上でインキュベートした。次いで、ヌクレオソーム枯渇核を、500rcfで、4℃で5分間ペレット化し、次いで50uLのNIBトリスに再懸濁した。5uLの核アリコートを採取し、NIB Trisで1:10に希釈し、次いで上記のように定量化した。Nucleiを、定量化に基づいて、NIB Trisトを添加して、500核/uLに希釈した。実験設定に応じて、500核/uLで420uLの核を、540uL 2×TD緩衝液と混合した。これに続いて、核をタグメント化し、染色して、フロー選別し、ゲノムDNAをギャップ充填し、アダプターの切り替えを、s3-ATACプロトコルについて説明したように行った。ライブラリー増幅は、上記のようにPCRによって、ライブラリー当たりの初期の捕捉イベントが多い可能性のために少ない総サイクル数(13~15)で行った。次いで、前述のように、ライブラリーをクリーンアップし、サイズ選択して、シークエンシングした。
s3-GCCライブラリーの生成
同じ培養細胞株試料を、s3-WGSライブラリーの生成について記載したようにサンプリングし、固定されたヌクレオソーム枯渇核の同じプールから処理した。核の定量化に続いて、残りの核懸濁液を全部(試料当たり約200万~300万の核)、試料のそれぞれにプールした。核を4℃で5分間500rcfでペレット化し、90uLの1×Cutsmart緩衝液(NEB B7204S)に再懸濁した。10U/uLのAluI制限酵素(NEB R0137S)10uLを各試料に添加した。次いで、試料を、ThermoMixer上で、300rpm、37℃で2時間消化した。消化後、核断片は、近接ライゲーションを受けた。核を4℃で5分間500rcfでペレット化し、100uLのライゲーション反応緩衝液に再懸濁した。ライゲーション緩衝液は、1×T4 DNAリガーゼ緩衝液+ATP(NEB M0202S)、0.01%TritonX-100、0.5mMのDTT(Sigma D0632)、200UのT4 DNAリガーゼを超純水で希釈した最終濃度を有する混合物である。ライゲーションは、16℃で14時間(一晩)行った。このインキュベーション後、核を4℃で5分間500rcfでペレット化し、100uLのNIB HEPES緩衝液に再懸濁した。核のアリコートを前述のように定量化し、次いで希釈し、アリコートし、タグメント化、プールし、DAPI染色、フロー選別して、ゲノムDNAをギャップ充填し、アダプター切り替えを、s3-ATACプロトコルについて記載したように行った。ライブラリー増幅は、s3-WGSライブラリーと同じ速度(13~15サイクル)で生じ、その後、ライブラリーをプールし、上記のようにクリーンアップし、シークエンシングした。
実施例3
組み合わされたタグメンテーション及びインデックス付けによるライブラリーの調製
以下の実施例において、タグメンテーション及びインデックス付けの工程を使用して、核酸試料からデュアルインデックス付きペアエンドライブラリーを調製するための方法及びシステムを示す。第1のインデックス配列は、タグメンテーションを介して付加され、第2のインデックス配列は、ハイブリダイゼーション及び伸長を介して付加される。
この実施例では、5’-プライマー-インデックス-アダプター-ウラシル-トランスポザーゼ認識ドメイン、例えば5’-P5-i5-A14-U-ME-3’の第1の鎖、及びトランスポザーゼ認識配列の相補体である第2の鎖、例えば5’-ME’-3’とともにトランスポゾンを有する固定化トランスポソーム複合体を使用する。トランスポゾンの例示的な第1の鎖は、配列番号1であり、トランスポゾンの例示的な第2の鎖は、配列番号1のヌクレオチド53~71の相補体である。トランスポソーム複合体は、切断可能なリンカーを介して第1の鎖の5’末端に結合したビオチンを介してビーズ上に固定化される。第2のインデックス配列を含有するオリゴヌクレオチドは、5’-プライマー-インデックス-アダプター-トランスポザーゼ認識配列、例えば、5’-P7-i7-B15-ME-3’の配列を有する。第2のインデックス配列を含有する例示的なオリゴヌクレオチドは、配列番号2である。第2のインデックス配列は、任意選択的で、3’末端で、例えば、ジデオキシ又はロックド核酸を使用してブロックされる。P5、i5、P7、i7、ME、A14、及びB15の例示的な配列は、それぞれ配列番号3~9である。
溶液中の核酸を、所望の範囲で96ウェルプレートの各ウェルに添加する。上記のトランスポゾン配列を有するビーズ結合トランスポソームの懸濁液を各ウェルに添加し、プレートをトランスポザーゼを断片化し、トランスポゾン配列を挿入するのに好適な条件下でインキュベートする。トランスポザーゼ酵素は、例えば、SDSを添加する又は加熱することによって除去される。ウラシル不耐性ポリメラーゼ(例えば、プルーフリーディングポリメラーゼ又はPhusion)を添加して、核酸断片末端と第2のトランスポゾン配列との間のギャップを充填する。ウラシル不耐性ポリメラーゼは、挿入された第1のトランスポゾン配列のA14とME配列との間に挿入されたウラシルに達すると停止する。タグメント化された核酸は、変性され、第2のインデックス付けオリゴヌクレオチドは、酵素的伸長によってタグメント化された核酸にハイブリダイズする。二重インデックス付き核酸は、増幅を含むがこれらに限定されないシークエンシングのために使用され得るか、又は更に処理され得る。
全ての特許、特許出願、及び刊行物、並びに本明細書で引用した電子的に利用可能な資料の完全な開示(例えば、GenBank及びRefSeqでのヌクレオチド配列の提出、SwissProt、PIR、PRF、PDBでのアミノ酸配列の提出、並びにGenBank及びRefSeqにおける注釈付きコード領域からの翻訳)は、参照によりその全体が組み込まれる。刊行物で参照されている補足資料(補足表、補足図、補足資料及び方法、並びに/又は補足実験データなど)も同様に、参照によりその全体が組み込まれる。本出願の開示と、参照により本明細書に組み込まれる文書の開示との間に矛盾が存在する場合、本出願の開示が優先するものとする。前述の詳細な説明及び実施例は、理解を明確にするためにのみ提供されている。それから不必要な制限を理解する必要はない。当業者に明らかな変形は、特許請求の範囲によって定義される開示に含まれるため、本開示は、図示及び記載された正確な詳細に限定されない。
別途記載のない限り、本明細書及び特許請求の範囲で使用される成分、分子量などの量を表す全ての数は、全ての場合において、用語「約」によって修飾されるものとして理解されるべきである。したがって、別途記載のない限り、本明細書及び特許請求の範囲に記載される数値パラメータは、本開示によって得られることが求められる所望の特性に応じて変化し得る近似値である。少なくとも、かつ均等論を特許請求の範囲に限定する試みとしてではなく、各数値パラメータは、少なくとも、報告された有効桁数に照らして、通常の四捨五入法を適用することによって解釈されるべきである。
本開示の広い範囲を示す数値範囲及びパラメータは近似値であることに関わらず、特定の実施例に記載される数値は、可能な限り正確に報告される。しかしながら、全ての数値は、それぞれの試験測定値に見出される標準偏差から必然的に生じる範囲を本質的に含む。
全ての見出しは読者の便宜のためのものであり、特に明記されていない限り、見出しに続くテキストの意味を制限するために使用されるべきではない。

Claims (71)

  1. シークエンシングライブラリーを生成するための方法であって、
    各末端に第1のアダプター配列を含む複数の対称修飾標的核酸を提供することであって、前記第1のアダプター配列が、DNA損傷を含む、提供することと、
    前記修飾標的核酸を損傷不耐性ポリメラーゼで伸長して、各鎖の5’末端に前記第1のアダプター配列と、各鎖の3’末端に前記第1のアダプターの一部の相補体とを含む複数の非対称修飾標的核酸を生成することと、を含む、方法。
  2. 前記複数の対称修飾標的核酸が、二本鎖であり、各鎖が、5’から3’に前記DNA損傷を含む前記第1のアダプター配列と、前記標的核酸と、少なくとも1つのヌクレオチドを含むギャップと、前記DNA損傷を含まない前記第1のアダプター配列の一部の相補体と、を含む、請求項1に記載の方法。
  3. 前記伸長が、前記ギャップで開始する、請求項1に記載の方法。
  4. プライマーを前記複数の非対称修飾標的核酸にアニーリングすることであって、前記プライマーが、5’から3’に第2のアダプター配列及びアニーリングドメインを含み、前記アニーリングドメインが、前記複数の非対称修飾標的核酸の前記第1のアダプターの前記一部の前記相補体にアニーリングするヌクレオチド配列を含む、アニーリングすることと、
    アニーリングされた前記非対称修飾標的核酸の3’末端を、損傷不耐性ポリメラーゼで伸長することと、を更に含み、
    前記伸長が、5’から3’に(i)前記第1のアダプター、(ii)前記標的核酸、(iii)前記第1のアダプターの前記一部の前記相補体、及び(iv)前記第2のアダプターの相補体を含む、複数の非対称修飾標的核酸をもたらす、請求項2に記載の方法。
  5. 前記アニーリングされた非対称修飾標的核酸の3’末端の前記伸長が、少なくとも3回繰り返される、請求項4に記載の方法。
  6. 前記DNA損傷が、脱塩基部位、修飾塩基、ミスマッチ、一本鎖切断、又は架橋ヌクレオチドのうちの少なくとも1つを含む、請求項1に記載の方法。
  7. 前記DNA損傷が、少なくとも1つのウラシルを含む、請求項1に記載の方法。
  8. 前記プライマーの前記アニーリングドメインが、対応する天然DNAヌクレオチドと比較して、融解温度を増加させる少なくとも1つの改変ヌクレオチドを含む、請求項4に記載の方法。
  9. 前記改変ヌクレオチドが、ロックド核酸、PNA、又はRNAを含む、請求項8に記載の方法。
  10. 前記プライマーの3’末端がブロックされている、請求項4に記載の方法。
  11. 前記第1のアダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のユニバーサル分子識別子、又はそれらの組み合わせを含む、請求項1に記載の方法。
  12. 前記1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子のうちの少なくとも1つが、前記DNA損傷と前記標的核酸の遠位の前記アダプターの末端との間の前記アダプターに位置する、請求項11に記載の方法。
  13. 前記第2のアダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のユニバーサル分子識別子、又はそれらの組み合わせを含む、請求項4に記載の方法。
  14. 前記第1のアダプターの前記1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子が、前記第2のアダプターの前記1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子と比較して固有である、請求項13に記載の方法。
  15. 前記第1のアダプターの前記1つ以上のインデックス配列が、区画特異的である、請求項11に記載の方法。
  16. 前記第2のアダプターの前記1つ以上のインデックス配列が、区画特異的である、請求項13に記載の方法。
  17. 前記第1のアダプターが、トランスポザーゼ認識部位を含む、請求項1に記載の方法。
  18. 前記標的核酸が、単一細胞に由来する核酸由来である、請求項1に記載の方法。
  19. 前記標的核酸が、複数の細胞に由来する核酸由来である、請求項1に記載の方法。
  20. 単一細胞又は複数の細胞に由来する前記標的核酸が、RNAを含む、請求項18又は19に記載の方法。
  21. 前記RNAが、mRNAを含む、請求項20に記載の方法。
  22. 単一細胞又は複数の細胞に由来する前記標的核酸が、DNAを含む、請求項18又は19に記載の方法。
  23. 前記DNAが、全細胞ゲノムDNAを含む、請求項22に記載の方法。
  24. 前記全細胞ゲノムDNAが、ヌクレオソームを含む、請求項23に記載の方法。
  25. 前記標的核酸が、無細胞DNAに由来する核酸由来である、請求項1に記載の方法。
  26. 前記方法が、コンビナトリアルインデックス付けを含む、請求項11~16のいずれか一項に記載の方法。
  27. 前記非対称修飾標的核酸を増幅することを更に含み、
    前記増幅が、第2のプライマー及び損傷耐性ポリメラーゼを含み、
    前記第2のプライマーが、前記第1のアダプター配列又は前記その相補体にアニーリングするヌクレオチド配列を含む、請求項1に記載の方法。
  28. 前記第2のプライマーが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のユニバーサル分子識別子、又はそれらの組み合わせを更に含む、請求項27に記載の方法。
  29. 前記第2のプライマーの前記1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子が、前記第1のアダプター及び前記第2のアダプターの前記1つ以上のユニバーサル配列、1つ以上のインデックス配列、及び1つ以上のユニバーサル分子識別子と比較して固有である、請求項28に記載の方法。
  30. 前記複数の非対称修飾標的核酸のサブセットが、複数の区画内に存在し、(i)前記第1のアダプターが、第1の区画特異的インデックスを含むか、(ii)前記第2のアダプターが、第2の区画特異的インデックスを含むか、又は(i)及び(ii)の両方のいずれかである、請求項1に記載の方法。
  31. 異なる区画からの前記非対称修飾標的核酸を組み合わせて、プールされたインデックス付き非対称修飾標的核酸を生成することを更に含む、請求項30に記載の方法。
  32. 前記プールされたインデックス付き非対称修飾標的核酸のサブセットを第2の複数の区画に分配し、前記インデックス付き非対称修飾標的核酸を修飾することを更に含み、
    前記修飾が、各サブセット中に存在する前記インデックス付き非対称修飾標的核酸に追加の区画特異的インデックス配列を付加して、インデックス付きDNA核酸をもたらすことを含み、
    前記修飾が、ライゲーション又は伸長を含む、請求項31に記載の方法。
  33. 前記区画が、ウェル又は液滴を含む、請求項30~32のいずれか一項に記載の方法。
  34. 前記提供が、複数のDNA断片を前記第1のアダプターと、前記DNA断片の両端に前記第1のアダプターをライゲートする条件下で、接触させることを含む、請求項1に記載の方法。
  35. 前記DNA断片が、二本鎖及び平滑末端である、請求項34に記載の方法。
  36. 前記第1のアダプターが、二本鎖DNAオリゴヌクレオチドである、請求項34又は35に記載の方法。
  37. 前記第1のアダプターの一方の3’末端が、ブロックされている、請求項34又は35に記載の方法。
  38. 前記DNA断片が、二本鎖であり、一方又は両方の3’末端に一本鎖領域を含む、請求項34に記載の方法。
  39. 前記第1のアダプターが、一方の末端に一本鎖領域を含む二本鎖DNAオリゴヌクレオチドであり、前記一本鎖領域が、前記DNA断片上に存在する前記一本鎖領域にアニーリングすることができる、請求項34又は38に記載の方法。
  40. 前記アダプターが、フォーク型アダプターである、請求項34、35、又は38に記載の方法。
  41. 前記提供が、DNAをトランスポソーム複合体と接触させることを含み、前記トランスポソーム複合体が、トランスポザーゼと、前記第1のアダプターと、を含み、前記接触が、前記第1のアダプターの前記DNAへのライゲーションに好適な条件下で生じて、前記対称修飾標的核酸を生成する、請求項1に記載の方法。
  42. 生成された前記対称修飾標的核酸が、ライゲートされた前記第1のアダプターと前記標的核酸との間で1つの鎖中に少なくとも1つのヌクレオチドのギャップを含む、請求項41に記載の方法。
  43. 前記DNAが、複数の区画内に存在し、各区画内の前記第1のアダプターが、区画特異的インデックスを含む、請求項41又は42に記載の方法。
  44. 異なる区画からの一本鎖修飾標的核酸を組み合わせて、プールされた対称修飾標的核酸を生成することと、前記対称修飾標的核酸を第2の複数の区画に分配することと、を更に含む、請求項42に記載の方法。
  45. 前記方法が、前記全細胞ゲノムDNAの断片化を更に含む、請求項23に記載の方法。
  46. 前記断片化が、制限エンドヌクレアーゼを用いた前記全細胞ゲノムDNAの消化を含む、請求項45に記載の方法。
  47. 断片化された前記DNAが、キメラ標的核酸を結合するための近接ライゲーションに供される、請求項45又は46に記載の方法。
  48. アダプターのシトシン残基が、5-メチルシトシンで置き換えられる、請求項1又は4に記載の方法。
  49. 前記対称又は非対称標的核酸が、化学的又は酵素的メチル化変換に供される、請求項48に記載の方法。
  50. 前記提供が、単離された核を固定することと、前記単離された核を、ゲノムDNAからヌクレオソームを解離させる条件に供することと、前記ゲノムDNAを断片化することと、キメラ標的核酸を結合する近接ライゲーションに前記断片を供することと、ライゲートされた前記断片をトランスポソーム複合体に接触させることと、を含み、前記トランスポソーム複合体が、トランスポザーゼと、前記第1のアダプターと、を含み、前記接触が、前記第1のアダプターの前記DNAへのライゲーションに好適な条件下で生じて、前記対称修飾標的核酸を生成する、請求項1に記載の方法。
  51. 前記断片化が、制限エンドヌクレアーゼによる消化を含む、請求項50に記載の方法。
  52. 複数の増幅部位を含む表面を提供することであって、
    前記増幅部位が、遊離3’末端を有する結合した一本鎖捕捉オリゴヌクレオチドの少なくとも2つの集団を含む、提供することと、
    個々の非対称修飾標的核酸からのアンプリコンのクローン集団を各々含む複数の増幅部位を生成するのに好適な条件下で、前記増幅部位を含む表面を、前記複数の非対称修飾標的核酸と接触させることと、を更に含む、請求項4に記載の方法。
  53. トランスポソーム複合体及びDNAポリメラーゼを含む組成物であって、
    前記トランスポソームが、トランスポゾン配列に結合したトランスポザーゼを含み、
    前記トランスポゾン配列が、アダプター及びDNA損傷を含み、
    前記DNAポリメラーゼが、損傷不耐性ポリメラーゼである、組成物。
  54. 前記アダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含む、請求項53に記載の組成物。
  55. 損傷耐性DNAポリメラーゼを更に含む、請求項53又は54に記載の組成物。
  56. 組成物であって、
    5’から3’にDNA損傷を含む第1のアダプター、標的核酸、及び前記第1のアダプターの相補体を含む複数の修飾標的核酸と、
    5’から3’に第2のアダプターと、アニーリングドメインと、を含む、プライマーであって、前記アニーリングドメインが、前記第1のアダプターの前記相補体にアニーリングするヌクレオチド配列を含む、プライマーと、
    損傷不耐性DNAポリメラーゼと、を含む、組成物。
  57. 前記プライマーが、対応する天然DNAヌクレオチドと比較して、融解温度を増加させる少なくとも1つの改変ヌクレオチドを含む、請求項56に記載の組成物。
  58. 前記プライマーが、標的核酸にアニーリングされる、請求項56又は57に記載の組成物。
  59. 前記プライマーの3’末端が、ブロックされている、請求項56に記載の組成物。
  60. 前記第1のアダプターが、トランスポザーゼ認識部位を含む、請求項56に記載の組成物。
  61. 別々の容器中のトランスポソーム複合体及びDNAポリメラーゼであって、
    トランスポソームが、トランスポゾン配列に結合したトランスポザーゼを含み、
    前記トランスポゾン配列が、第1のアダプター及びDNA損傷を含み、
    前記DNAポリメラーゼが、損傷不耐性ポリメラーゼである、トランスポソーム複合体及びDNAポリメラーゼと、
    使用説明書と、を含む、キット。
  62. 別々の容器中に第2のDNAポリメラーゼを更に含み、
    前記第2のDNAポリメラーゼが、損傷耐性ポリメラーゼである、請求項61に記載のキット。
  63. プライマーを更に含み、
    前記プライマーが、5’から3’に第2のアダプター及びアニーリングドメインを含み、前記アニーリングドメインが、前記第1のアダプターの相補体にアニーリングするヌクレオチド配列を含む、請求項61又は62に記載のキット。
  64. 前記プライマーの3’末端が、ブロックされている、請求項63に記載のキット。
  65. 前記第1のアダプターが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを含む、請求項61に記載のキット。
  66. 前記第2のアダプタープライマーが、1つ以上のユニバーサル配列、1つ以上のインデックス配列、1つ以上のUMI、又はそれらの組み合わせを更に含む、請求項63に記載のキット。
  67. トランスポソーム複合体であって、
    トランスポザーゼと、
    第1の鎖上に、5’から3’に、少なくとも1つのユニバーサル配列、少なくとも1つのインデックス配列、少なくとも1つのUMI、又はそれらの組み合わせ、DNA損傷、及びトランスポザーゼ認識配列を含み、第2の鎖上に、前記トランスポザーゼ認識配列の少なくとも一部に相補的なヌクレオチドを含むアダプターを含む核酸を含むトランスポゾンと、を含む、トランスポソーム複合体。
  68. 前記第1の鎖が、前記第1の鎖の5’末端に捕捉剤を更に含む、請求項67に記載のトランスポソーム複合体。
  69. 前記第1の鎖が、捕捉剤と前記5’末端との間に位置する切断可能なリンカーを更に含む、請求項68に記載のトランスポソーム複合体。
  70. 前記第2の鎖が、前記第2の鎖の3’末端に捕捉剤を更に含む、請求項67に記載のトランスポソーム複合体。
  71. 前記第2の鎖が、捕捉剤と前記3’末端との間に位置する切断可能なリンカーを更に含む、請求項70に記載のトランスポソーム複合体。
JP2022567511A 2020-06-09 2021-06-09 シークエンシングライブラリーの収率を増加させるための方法 Pending JP2023533418A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063036710P 2020-06-09 2020-06-09
US63/036,710 2020-06-09
PCT/US2021/036599 WO2021252617A1 (en) 2020-06-09 2021-06-09 Methods for increasing yield of sequencing libraries

Publications (1)

Publication Number Publication Date
JP2023533418A true JP2023533418A (ja) 2023-08-03

Family

ID=78817125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022567511A Pending JP2023533418A (ja) 2020-06-09 2021-06-09 シークエンシングライブラリーの収率を増加させるための方法

Country Status (10)

Country Link
US (1) US20210380972A1 (ja)
EP (1) EP4162080A1 (ja)
JP (1) JP2023533418A (ja)
KR (1) KR20230020977A (ja)
CN (1) CN115552035A (ja)
AU (1) AU2021287900A1 (ja)
BR (1) BR112022025184A2 (ja)
CA (1) CA3182810A1 (ja)
IL (1) IL298821A (ja)
MX (1) MX2022015521A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240210290A1 (en) * 2021-07-21 2024-06-27 10X Genomics, Inc. Methods, devices, and kits for purifying and lysing biological particles
US20230313177A1 (en) * 2022-02-25 2023-10-05 Eclipse Bioinnovations, Inc. Methods for oligo targeted proximity ligation
WO2023204594A1 (ko) * 2022-04-19 2023-10-26 서울대학교산학협력단 태그멘테이션을 이용한 벡터 삽입위치 검출 및 클론 정량 방법
CN117672343B (zh) * 2024-02-01 2024-06-04 深圳赛陆医疗科技有限公司 测序饱和度评估方法及装置、设备及存储介质

Also Published As

Publication number Publication date
CA3182810A1 (en) 2021-12-16
AU2021287900A1 (en) 2022-12-08
IL298821A (en) 2023-02-01
CN115552035A (zh) 2022-12-30
MX2022015521A (es) 2023-03-01
BR112022025184A2 (pt) 2023-05-09
US20210380972A1 (en) 2021-12-09
EP4162080A1 (en) 2023-04-12
KR20230020977A (ko) 2023-02-13

Similar Documents

Publication Publication Date Title
RU2770879C2 (ru) Полногеномные библиотеки отдельных клеток для бисульфитного секвенирования
CN110785492B (zh) 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
US10731152B2 (en) Method for controlled DNA fragmentation
KR20190034164A (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
US20210380972A1 (en) Methods for increasing yield of sequencing libraries
US20150353989A1 (en) Sample preparation for nucleic acid amplification
KR20220041875A (ko) 단일 세포 분석
JP7569690B2 (ja) ブリッジ増幅によるクラスタ生成のための方法および組成物
WO2021252617A1 (en) Methods for increasing yield of sequencing libraries
US20240182881A1 (en) Altered cytidine deaminases and methods of use
WO2024069581A1 (en) Helicase-cytidine deaminase complexes and methods of use
US11136576B2 (en) Method for controlled DNA fragmentation
CA3064622A1 (en) Compositions and methods for making controls for sequence-based genetic testing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240412