CN116171330A - 使用小珠连接的转座体制备rna和dna测序文库 - Google Patents

使用小珠连接的转座体制备rna和dna测序文库 Download PDF

Info

Publication number
CN116171330A
CN116171330A CN202180057876.8A CN202180057876A CN116171330A CN 116171330 A CN116171330 A CN 116171330A CN 202180057876 A CN202180057876 A CN 202180057876A CN 116171330 A CN116171330 A CN 116171330A
Authority
CN
China
Prior art keywords
dna
rna
solid support
sequence
immobilized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180057876.8A
Other languages
English (en)
Inventor
尼尔·安东尼·戈麦利
安德鲁·B·肯尼迪
罗伯特·斯科特·库尔斯滕
加里·斯洛特
卡洛·兰迪斯辛奇利夫
萨拉·舒尔特扎贝尔格
菲奥娜·卡帕
吴怡萱
塔伦·库拉纳
福阿德·马沙耶克希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Illumina Inc
Original Assignee
Illumina Cambridge Ltd
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd, Illumina Inc filed Critical Illumina Cambridge Ltd
Publication of CN116171330A publication Critical patent/CN116171330A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/507Recombinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/543Immobilised enzyme(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/519Detection characterised by immobilisation to a surface characterised by the capture moiety being a single stranded oligonucleotide

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请描述了制备标记RNA片段的固定文库的方法。本文还描述了从单一样品制备DNA和RNA测序文库的多种方法。这些方法可包括从单个细胞进行的文库制备。

Description

使用小珠连接的转座体制备RNA和DNA测序文库
相关申请的交叉引用
本申请要求于2020年8月6日提交的美国临时申请号63/061,885,2021年3月25日提交的美国临时申请号63/165,830,2021年3月31日提交的美国临时申请号63/168,802以及2021年7月7日提交的美国临时申请号63/219,014的优先权的权益,这些临时申请中的每一篇全文以引用方式并入本文以用于任何目的。
描述
技术领域
本申请涉及使用小珠连接的转座体(bead-linked transposomes)制备RNA测序文库。还描述了从单一样品制备RNA和DNA测序文库的方法。
背景技术
RNA测序对于许多用途是重要的。例如,全RNA转录物的测序允许研究转录物中的任何变化,诸如剪接的差异。此外,RNA测序可用于进行转录物计数并对各种基因的转录物进行计数。
RNA测序(RNA-seq)使用下一代测序来绘制转录组的图谱。常用技术包括将单链RNA转化为单链或双链cDNA片段。然后在文库制备中将衔接子添加到每个片段的端部,这是许多测序平台所需的。根据所使用的方法,可以保留关于RNA源自哪条链的信息。这被称为链特异性RNA-seq,并且其通过准确识别反义转录物、确定非译码RNA(例如,LncRNA)的链以及划分重叠基因的边界来改进标准方法。此外,链特异性RNA-seq是期望的方法,因为它提供了对转录物表达的更准确的估计。
许多目前用于测序RNA样品的方案采用样品制备方法,该方法在测序前将样品中的RNA转化成双链cDNA形式。RNA测序需要改进工作流程和易用性的方法,诸如允许使用标签化制备链特异性RNA文库的方法。
此外,目前的单细胞RNA测序分析依赖于基于独特分子标识符(UMI)的方法来确保表达的定量测量。该方法尤其与单细胞RNA测序相关,其通常依赖于显著水平的cDNA预扩增以获得用于测序的足够输入。扩增偏倚可通过折叠具有匹配UMI和映射位点的读段来校正。然而,基于UMI的方法提供仅来自转录物的3’的读段,其中UMI在大多数当前方案中附接,诸如CEL-seq2(Hashimshony T等人,Genome Biol.,第17卷,第77页(2016年)),Drop-Seq(Macosko EZ等人Cell,第161卷,第1202-1214页(2015年)),Smart-seq2(Picelli S等人,Nature Protocols,第9卷,第171-181页(2014年)),或者UMI还可附接在5’端处,诸如在STRT-seq(Islam S等人,Nat Methods,2013年,第11卷,第163-166页)中。因此,尽管选择性剪接研究已经成为RNA测序的突出应用,但同种型表达的单细胞水平测量仍然有限,因为存在极少数能够进行单细胞同种型表达分析的可用技术。因此,改进从RNA生产cDNA的方法可用于各种不同的应用。
结合到表面(诸如小珠)的转座体可使双链(ds)DNA的长分子标签化并在小珠或其他表面上产生模板文库(参见US 9683230)。将转座体锚定到小珠上有助于在标签化期间控制插入物大小和产率,并且是Illumina DNA Flex PCR-Free(仅研究使用,RUO)技术的基础,先前称为Illumina的Nextera技术。在这些方法中,Tn5酶通过称为标签化的“切割和粘贴(cut-and-paste)”机制催化测序所需的衔接子至双链DNA或cDNA的端部的易位。在文库制备中,标签化要么在溶液中进行,要么使用小珠连接的转座体(BLT)在磁性小珠上进行。基于标签化的方法需要更少的步骤,产生更高的转化效率并且比基于连接的方法更准确。然而,不存在可与标签化方法一起使用的链特异性RNA-seq方法。
另外,不对称标签化方法(诸如Illumina DNA Flex PCR-Free)包括用含有A14和B15转座体的混合物的BLT进行标签化,其中A14和B15包括测序衔接子序列。仅用A14或仅用B15标签化的片段(即,在片段的两端处具有A14序列或在片段的两端处具有B15序列的片段)不产生可行的文库产物,因为标准Illumina SBS测序方法需要在片段的一端处存在A14并且在另一端处存在B15。因此,所有标签化片段的大约一半丢失,导致现有技术中利用不对称标签化方法的文库制备效率降低。需要避免标签化产物的这种损失的方法,诸如通过引入对称标签化方案(其中所有转座体复合物包含相同的转座体)来提高包括标签化在内的方法的产率。
转座体还可以使“表观”DNA:RNA双链体标签化。例如,聚T捕获寡核苷酸可结合到流通池表面并经由其3’聚A尾捕获mRNA转录物,随后用逆转录酶(RT)处理以生成包含结合到原始RNA转录物的“第一链合成”cDNA链的双链体。来自溶液的转座体然后可以生成可聚簇和可测序的模板,如WO 2013131962A1中所述。接下来,可将转座体添加到溶液中以生成可聚簇和可测序的模板,而不生成第2链cDNA以及因此双链cDNA。这表明转座体可使“表观”RNA/DNA双链体标签化。这种机制的假设是逆转录酶通过RNA链中出现的切口启动第二链合成,并且这些dsDNA双链体是转座体的底物。然而,由于使用来自溶液的转座体,读段仅从转录物的3’端生成(如图1B和图1C所示)。本申请描述了避免3'偏倚的在RNA上标签化的方法。
此外,该申请描述了用以从相同样品制备RNA和DNA测序文库的手段。许多基于测序的测定受益于能够表征样品“多组学”分析的DNA含量和RNA含量两者。用以分析来自样品的总核酸(TNA,包含DNA和RNA两者)的当前样品制备/测序工作流程对于多组学是有限的,因为这些工作流程是麻烦的和/或具有显著的样品损失(例如,需要将TNA样品分成两个生物分子特异性文库制备)或不区分生物分子类型(例如,下一代测序(NGS)读段可以来自RNA分子或DNA分子)。本公开描述了使用识别起源生物分子类型(RNA或DNA)的方法来进行NGS的有效TNA样品制备的各种方法。因此,这些方法可允许通过双链核酸的标签化来简化多组学文库制备。
本文还描述了制备掺入3’独特分子标识符(UMI)的RNA文库的方法以及用标签化制备链特异性RNA文库的方法。
发明内容
本文描述了制备RNA和DNA文库的方法。
实施方案1.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,包括(a)将包含靶RNA的样品应用于其上固定有转座体复合物和捕获寡核苷酸的固体载体,其中转座体复合物包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签;其中在靶RNA的3’端结合到捕获寡核苷酸的条件下将样品应用于固体载体;(b)在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及(c)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案2.根据实施方案1所述的方法,其中在进行标签化之前使转座体复合物可逆地失活,并且进行标签化包括活化转座体复合物。
实施方案3.根据实施方案2所述的方法,其中转座体复合物通过结合到转座体复合物的转座体去活化剂可逆地失活。
实施方案4.根据实施方案3所述的方法,其中转座体去活化剂结合到转座体复合物的Tn5结合位点。
实施方案5.根据实施方案3或实施方案4所述的方法,其中转座体去活化剂包含去磷酸化的ME’、额外的碱基、抑制剂双链体和/或热不稳定抗体。
实施方案6.根据实施方案2至5中任一项所述的方法,其中转座体复合物在步骤(c)中通过去除转座体去活化剂而被活化。
实施方案7.根据实施方案1至6中任一项所述的方法,其中捕获寡核苷酸包含聚T序列。
实施方案8.根据实施方案1至7中任一项所述的方法,其中靶RNA包含与捕获寡核苷酸中的一种或多种捕获寡核苷酸的至少一部分互补的序列。
实施方案9.根据实施方案1至8中任一项所述的方法,其中转座体复合物经由第一多核苷酸固定到固体载体。
实施方案10.根据实施方案1至9中任一项所述的方法,其中转座体复合物包含第二多核苷酸,该第二多核苷酸包含与转座子末端序列互补的区域。
实施方案11.根据实施方案10所述的方法,其中转座体复合物经由第二多核苷酸固定到固体载体。
实施方案12.根据实施方案1至11中任一项所述的方法,还包括在步骤(a)之后洗涤固体载体以去除任何未结合的靶RNA。
实施方案13.根据实施方案1至12中任一项所述的方法,其中转座体复合物以至少103、104、105或106个复合物/mm2的密度存在于固体载体上。
实施方案14.根据实施方案1至13中任一项所述的方法,其中转座酶包括Tn5转座酶。
实施方案15.根据实施方案14所述的方法,其中Tn5转座酶是超高活性的Tn5转座酶。
实施方案16.根据实施方案1至15中任一项所述的方法,其中固定文库中的双链片段的长度通过增加或降低固体载体上的转座体复合物的密度来调节。
实施方案17.根据实施方案1至16中任一项所述的方法,其中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的第一标签包含相同的标签结构域。
实施方案18.根据实施方案1至17中任一项所述的方法,其中标签包括用于簇扩增的区域。
实施方案19.根据实施方案1至18中任一项所述的方法,其中标签包括用于引发测序反应的区域。
实施方案20.根据实施方案1至19中任一项所述的方法,其中固体载体包括微粒、小珠、平面载体、图案化表面或孔。
实施方案21.根据实施方案20所述的方法,其中平面载体为管的内表面或外表面。
实施方案22.根据实施方案1至21中任一项所述的方法,其中进行标签化产生桥接到固体载体上的两个固定转座体复合物的双链DNA:RNA双链体,任选地其中在进行标签化之前合成DNA的第二链以制备双链DNA。
实施方案23.根据实施方案22所述的方法,其中桥接双链体的长度为100个碱基对至1500个碱基对。
实施方案24.根据实施方案1至23中任一项所述的方法,其中应用于固体载体的样品是血液。
实施方案25.根据实施方案1至24中任一项所述的方法,其中应用于固体载体的样品是细胞裂解物。
实施方案26.根据实施方案25所述的方法,其中细胞裂解物是粗制细胞裂解物。
实施方案27.根据实施方案1至26中任一项所述的方法,其中应用于固体载体的样品具有小于或等于1.7的260/280吸光度比。
实施方案28.根据实施方案1至27中任一项所述的方法,还包括在将样品应用于固体载体后裂解样品中的细胞。
实施方案29.根据实施方案1至28中任一项所述的方法,还包括:(d)在DNA:RNA片段被溶液相转座体复合物进一步片段化的条件下,使溶液相转座体复合物与固定DNA:RNA片段接触;从而获得在溶液中具有一端的固定核酸片段。
实施方案30.根据实施方案29所述的方法,其中溶液相转座体复合物包含第二标签,从而在溶液中生成具有第二标签的固定核酸片段。
实施方案31.根据实施方案30所述的方法,其中第一标签和第二标签是不同的。
实施方案32.根据实施方案29至31中任一项所述的方法,其中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的溶液相转座体复合物包含第二标签。
实施方案33.根据实施方案29至32中任一项所述的方法,还包括通过使聚合酶和对应于第一多核苷酸的一部分的扩增引物反应来扩增固体载体上的片段。
实施方案34.一种其上固定有标记RNA片段的文库的固体载体,该文库根据实施方案1至33中任一项所述的方法制备。
实施方案35.一种从靶RNA制备标记DNA:RNA片段的固定文库的方法,包括:(a)将包含靶RNA的样品应用于其上固定有捕获寡核苷酸和第一多核苷酸的固体载体,其中第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签,其中样品在靶RNA的3’端结合到捕获寡核苷酸的条件下应用于固体载体;(b)在转座酶结合到第一多核苷酸以形成转座体复合物的条件下添加转座酶;(c)在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及(d)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案36.一种从靶RNA制备标记DNA:RNA片段的固定文库的方法,包括:(a)将包含靶RNA的样品应用于其上固定有捕获寡核苷酸和第一多核苷酸的固体载体,其中第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签,其中样品在靶RNA的3’端结合到捕获寡核苷酸的条件下应用于固体载体;(b)在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;(c)在转座酶结合到第一多核苷酸以形成转座体复合物的条件下添加转座酶;以及(d)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案37.根据实施方案35或36中任一项所述的方法,其中将包含靶RNA的样品应用于固体载体在小滴中进行。
实施方案38.根据实施方案37所述的方法,其中将包含靶RNA的样品应用于固体载体包括(a)在小滴中与小珠一起提供单个细胞;(b)裂解小滴中的细胞;(c)从单个细胞释放靶RNA;以及(d)将靶RNA捕获在小珠上。
实施方案39.根据实施方案37至38中任一项所述的方法,其中在合成cDNA之前去除小滴。
实施方案40.根据实施方案35至39中任一项所述的方法,还包括将固体载体上的DNA:RNA片段的固定文库递送到用于测序的表面。
实施方案41.根据实施方案40所述的方法,还包括在递送后,(a)在用于测序的表面上捕获具有DNA:RNA片段的固定文库的固体载体;(b)从固体载体释放固定片段;以及(c)在用于测序的表面上捕获片段。
实施方案42.根据实施方案41所述的方法,还包括对用于测序的表面上的片段进行测序。
实施方案43.根据实施方案42所述的方法,其中用于测序的表面是流通池。
实施方案44.根据实施方案35至43中任一项所述的方法,其中将包含靶RNA的样品应用于固体载体在固体载体上的微孔中进行。
实施方案45.根据实施方案44所述的方法,将包含靶RNA的样品应用于固体载体包括裂解细胞并从微孔中的单个细胞释放靶RNA。
实施方案46.根据实施方案35至45中任一项所述的方法,还包括释放DNA:RNA片段的固定文库并在同一微孔中对片段进行测序。
实施方案47.根据实施方案44至46中任一项所述的方法,其中固体载体是包含微孔的流通池。
实施方案48.根据实施方案47所述的方法,其中测序数据允许基于用于测序的表面上的片段的空间接近度来分辨已被固定在相同固体载体上的片段。
实施方案49.根据实施方案1至48中任一项所述的方法,其中用转座体复合物在DNA:RNA双链体上进行标签化是用两种不同的转座体复合物进行的,其中不同的转座体复合物包含第一转座子,该第一转座子包含不同的衔接子序列。
实施方案50.根据实施方案49所述的方法,其中至少一些片段在一条链的5’端处用第一读段序列衔接子序列标记,并且在另一条链的5’端处用第二读段序列衔接子序列标记。
实施方案51.根据实施方案1至48中任一项所述的方法,其中用转座体复合物在DNA:RNA双链体上进行标签化是用包含第一转座子的转座体复合物进行的,该第一转座子包含相同的衔接子序列。
实施方案52.根据实施方案51所述的方法,其中所有转座体复合物都是相同的。
实施方案53.根据实施方案51或52所述的方法,其中片段在双链片段的两条链的5'端处用相同的衔接子序列标记。
实施方案54.根据实施方案51至53中任一项所述的方法,该方法还包括(a)从转座体复合物释放双链靶核酸片段,(b)使包含衔接子序列、UMI和与第一3'端转座子序列全部或部分互补的序列的多核苷酸杂交,其中多核苷酸中包含的衔接子序列与转座体复合物中包含的衔接子序列不同,(c)任选地使双链靶核酸片段的第二链延伸,(d)任选地将多核苷酸或所延伸的多核苷酸与双链靶核酸片段连接,以及(e)产生包含UMI的双链靶核酸片段,其中UMI直接位于插入DNA的3’端附近。
实施方案55.根据实施方案51至53中任一项所述的方法,还包括(a)从转座体复合物释放双链靶核苷酸片段,(b)使包含UMI和衔接子序列的第一多核苷酸杂交,其中第一转座子中的衔接子与第一多核苷酸中的衔接子不同,(c)任选地添加包含与第一多核苷酸互补的区域的第二多核苷酸以产生双链衔接子,(d)任选地使双链靶核酸片段的第二链延伸,(e)任选地将双链衔接子与双链靶核酸片段连接,以及(f)产生包含UMI的双链靶核苷酸片段,其中UMI位于双链靶核苷酸片段和来自第一多核苷酸的衔接子序列之间。
实施方案56.根据实施方案54或实施方案55所述的方法,其中片段在一条链的5'端处用来自第一转座子的第一读段序列衔接子序列标记,并且在另一条链的5'端处用来自第一多核苷酸的第二读段序列衔接子序列标记。
实施方案57.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,包括(a)将包含靶RNA的样品应用于其上固定有捕获寡核苷酸的固体载体;
(b)在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;
(c)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用溶液中的转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案58.根据实施方案57所述的方法,其中RNA是mRNA,并且捕获寡核苷酸包含聚T序列。
实施方案59.根据实施方案58所述的方法,其中片段的文库包含从一个或多个RNA的3’端生成的DNA:RNA片段。
实施方案60.根据实施方案57至59中任一项所述的方法,其中捕获寡核苷酸还包含第一读段测序衔接子序列、小珠代码和/或一个或多个附加衔接子序列。
实施方案61.根据实施方案57至60中任一项所述的方法,其中溶液中的转座体复合物包含第一转座体,该第一转座体包含第二读序列衔接子序列和/或一个或多个附加衔接子序列。
实施方案62.根据实施方案57至61中任一项所述的方法,其中对DNA:RNA片段的文库进行测序,而在测序前不扩增片段。
实施方案63.一种包含固定在其上的捕获寡核苷酸和第一多核苷酸的固体载体,其中第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签。
实施方案64.根据实施方案63所述的固体载体,其中固体载体是小珠。
实施方案65.根据实施方案64所述的固体载体,其中第一多核苷酸还包含小珠代码。
实施方案66.根据实施方案65所述的固体载体,其中小珠包含在小珠的池中,其中每个小珠包含固定的第一多核苷酸,该第一多核苷酸包含与池中其他小珠中包含的小珠代码相比不同的小珠代码。
实施方案67.根据实施方案63至66中任一项所述的固体载体,还包含结合到第一多核苷酸以形成转座体复合物的转座酶。
实施方案68.根据实施方案67所述的固体载体,其中转座体复合物可逆地失活。
实施方案69.根据实施方案68所述的固体载体,其中转座体复合物通过结合到转座体复合物的转座体去活化剂可逆地失活。
实施方案70.根据实施方案69所述的固体载体,其中转座体去活化剂结合到转座体复合物的Tn5结合位点。
实施方案71.根据实施方案69或实施方案70所述的固体载体,其中转座体去活化剂包含去磷酸化的ME’、额外的碱基、抑制剂双链体和/或热不稳定抗体。
实施方案72.一种包含捕获寡核苷酸和固定寡核苷酸的固体载体,其中固定寡核苷酸包含用于与包含在转座体复合物中包含的第二转座子中的杂交序列杂交的序列。
实施方案73.根据实施方案72所述的固体载体,其中固体载体是小珠。
实施方案74.根据实施方案73所述的固体载体,其中固定寡核苷酸还包含小珠代码和/或一个或多个衔接子序列。
实施方案75.根据实施方案74所述的固体载体,其中小珠包含在小珠的池中,其中每个小珠包含固定寡核苷酸,该寡核苷酸包含与包含在池中其他小珠中包含的固定寡核苷酸中的小珠代码相比不同的小珠代码。
实施方案76.根据实施方案63至75中任一项所述的固体载体,其中捕获寡核苷酸包含聚T序列。
实施方案77.根据实施方案63至76中任一项所述的固体载体,其中捕获寡核苷酸包含与靶RNA的至少一部分互补的序列。
实施方案78.根据实施方案63至77中任一项所述的固体载体,其中转座体复合物经由第一多核苷酸固定到固体载体。
实施方案79.根据实施方案63至78中任一项所述的固体载体,其中转座体复合物包含第二多核苷酸,该第二多核苷酸包含与转座子末端序列互补的区域。
实施方案80.根据实施方案79所述的方法,其中转座体复合物经由第二多核苷酸固定到固体载体。
实施方案81.根据实施方案63至80中任一项所述的固体载体,其中转座体复合物以至少103、104、105或106个复合物/mm2的密度存在于固体载体上。
实施方案82.根据实施方案63至81中任一项所述的固体载体,其中转座酶包括Tn5转座酶。
实施方案83.根据实施方案82所述的方法,其中Tn5转座酶是超高活性的Tn5转座酶。
实施方案84.根据实施方案63至83中任一项所述的固体载体,其中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的第一标签包含相同的标签结构域。
实施方案85.根据实施方案63至84中任一项所述的固体载体,其中标签包括用于簇扩增的区域。
实施方案86.根据实施方案63至85中任一项所述的固体载体,其中标签包括用于引发测序反应的区域。
实施方案87.根据实施方案63至86中任一项所述的固体载体,其中固体载体包括微粒、小珠、平面载体、图案化表面或孔。
实施方案88.根据实施方案87所述的固体载体,其中平面载体为管的内表面或外表面。
实施方案89.一种试剂盒,包含根据实施方案63至88中任一项所述的固体载体。
实施方案90.根据实施方案89所述的试剂盒,还包含转座酶。
实施方案91.根据实施方案89或90所述的试剂盒,还包含逆转录酶聚合酶。
实施方案92.根据实施方案90至91中任一项所述的试剂盒,还包含用于固定DNA的第二固体载体,该第二固体载体包含第二转座体复合物和第三多核苷酸,该第二转座体复合物包含转座酶,该第三多核苷酸包含含有转座子末端序列的3’部分以及任选第二标签。
实施方案93.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,包括(a)将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及其上固定有第一捕获寡核苷酸的第二固体载体,其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记,并且RNA结合到第二固体载体上的第一捕获寡核苷酸的条件下,将样品应用于第一固体载体和第二固体载体的混合物;(b)将结合到第二固体载体的RNA转移到第三固体载体,该第三固体载体具有固定在其上的结合转移的RNA的第二捕获寡核苷酸以及第二转座体复合物,其中第二转座体复合物包含转座酶和第二多核苷酸,该第二多核苷酸包含含有转座子末端序列的3'部分以及第二标签;(c)在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及(d)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用第二转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案94.根据实施方案93所述的方法,其中第一捕获寡核苷酸和/或第二捕获寡核苷酸包含聚T序列。
实施方案95.根据实施方案93或实施方案94所述的方法,其中RNA包含与第一捕获寡核苷酸和/或第二捕获寡核苷酸中的一者或多者的至少一部分互补的序列。
实施方案96.根据实施方案93至95中任一项所述的方法,其中第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。
实施方案97.根据实施方案93至96中任一项所述的方法,还包括在步骤(a)之后洗涤固体载体以去除任何未结合的DNA或RNA。
实施方案98.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,包括(a)将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及第二固体载体,该第二固体载体具有固定在其上的捕获寡核苷酸和第二多核苷酸,其中第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签;其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记,并且RNA结合到第二固体载体上的捕获寡核苷酸的条件下,将样品应用于第一固体载体和第二固体载体的混合物;(b)在转座酶结合到第二多核苷酸以在第二固体载体上形成转座体复合物的条件下添加转座酶;在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及(c)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用第二转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案99.根据实施方案98所述的方法,其中捕获寡核苷酸包含聚T序列。
实施方案100.根据实施方案98或实施方案99所述的方法,其中RNA包含与捕获寡核苷酸中的一个或多个捕获寡核苷酸的至少一部分互补的序列。
实施方案101.根据实施方案98至100中任一项所述的方法,其中第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。
实施方案102.根据实施方案98至101中任一项所述的方法,还包括在步骤(a)之后洗涤固体载体以去除任何未结合的DNA或RNA。
实施方案103.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,包括(a)将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及用于固定RNA的第二固体载体,该第二固体载体具有固定在其上的捕获寡核苷酸以及可逆地失活的第二转座体复合物,其中转座体复合物包含结合到第二多核苷酸的转座酶,该第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签;其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记,并且RNA结合到第二固体载体上的捕获寡核苷酸的条件下,将样品应用于第一固体载体和第二固体载体的混合物;(b)在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;(c)活化第二转座体复合物;以及(d)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用活化的第二转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案104.根据实施方案103所述的方法,其中转座体复合物通过结合到转座体复合物的转座体去活化剂可逆地失活。
实施方案105.根据实施方案104所述的方法,其中转座体去活化剂结合到转座体复合物的Tn5结合位点。
实施方案106.根据实施方案104或实施方案105所述的方法,其中转座体去活化剂包含去磷酸化的ME’、额外的碱基、抑制剂双链体和/或热不稳定抗体。
实施方案107.根据实施方案104至106中任一项所述的方法,其中转座体复合物在步骤(c)中通过去除转座体去活化剂而被活化。
实施方案108.根据实施方案103至106中任一项所述的方法,其中捕获寡核苷酸包含聚T序列。
实施方案109.根据实施方案103至108中任一项所述的方法,其中RNA包含与捕获寡核苷酸中的一种或多种捕获寡核苷酸的至少一部分互补的序列。
实施方案110.根据实施方案103至109中任一项所述的方法,其中第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。
实施方案111.根据实施方案103至110中任一项所述的方法,还包括在步骤(a)之后洗涤固体载体以去除任何未结合的DNA或RNA。
实施方案112.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,包括(a)将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签,并且其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记的条件下应用样品;(b)将具有结合的DNA的第一固体载体与RNA分离;(c)将RNA应用于用于固定RNA的第二固体载体,该第二固体载体具有固定在其上的捕获寡核苷酸和第二转座体复合物,其中第二转座体复合物包含结合到第二多核苷酸的转座酶,该第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签,并且其中在RNA结合到第二固体载体上的捕获寡核苷酸的条件下应用RNA;(d)在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及(e)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用活化的第二转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案113.根据实施方案112所述的方法,其中捕获寡核苷酸包含聚T序列。
实施方案114.根据实施方案112或实施方案113所述的方法,其中RNA包含与捕获寡核苷酸中的一个或多个捕获寡核苷酸的至少一部分互补的序列。
实施方案115.根据实施方案112至114中任一项所述的方法,其中第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。
实施方案116.根据实施方案112至115中任一项所述的方法,还包括在步骤(c)之后洗涤固体载体以去除任何未结合RNA。
实施方案117.根据实施方案112至116中任一项所述的方法,还包括将具有结合的DNA的第一固体载体与具有标记的DNA:RNA片段的固定文库的第二固体载体重组。
实施方案118.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,包括(a)在合成cDNA并生成DNA:RNA双链体的条件下,向包含靶RNA的样品中添加逆转录酶聚合酶;(b)将DNA:RNA双链体固定到其上固定有转座体复合物的固体载体,其中转座体复合物包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3'部分以及第一标签,其中在DNA:RNA双链体直接结合到捕获寡核苷酸或转座酶的条件下将样品应用于固体载体;以及(b)在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物在DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
实施方案119.根据实施方案118所述的方法,其中转座体复合物经由第一多核苷酸固定到固体载体。
实施方案120.根据实施方案118或实施方案119所述的方法,其中转座体复合物包含第二多核苷酸,该第二多核苷酸包含与转座子末端序列互补的区域。
实施方案121.根据实施方案120所述的方法,其中转座体复合物经由第二多核苷酸固定到固体载体。
实施方案122.根据实施方案118至121中任一项所述的方法,其中转座体复合物以至少103、104、105或106个复合物/mm2的密度存在于固体载体上。
实施方案123.根据实施方案118至122中任一项所述的方法,其中转座酶包括Tn5转座酶。
实施方案124.根据实施方案123所述的方法,其中Tn5转座酶是超高活性的Tn5转座酶。
实施方案125.根据实施方案118至124中任一项所述的方法,其中固定文库中的双链片段的长度通过增加或降低固体载体上的转座体复合物的密度来调节。
实施方案126.根据实施方案118至125中任一项所述的方法,其中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的第一标签包含相同的标签结构域。
实施方案127.根据实施方案118至126中任一项所述的方法,其中标签包括用于簇扩增的区域。
实施方案128.根据实施方案118至127中任一项所述的方法,其中标签包括用于引发测序反应的区域。
实施方案129.根据实施方案118至128中任一项所述的方法,其中固体载体包括微粒、小珠、平面载体、图案化表面或孔。
实施方案130.根据实施方案129所述的方法,其中平面载体为管的内表面或外表面。
实施方案131.根据实施方案118至130中任一项所述的方法,其中进行标签化产生桥接到固体载体上的两个固定转座体复合物的双链DNA:RNA双链体。
实施方案132.根据实施方案131所述的方法,其中桥接双链体的长度为100个碱基对至1500个碱基对。
实施方案133.根据实施方案118至132中任一项所述的方法,其中应用于固体载体的样品是血液。
实施方案134.根据实施方案118至133中任一项所述的方法,其中应用于固体载体的样品是细胞裂解物。
实施方案135.根据实施方案134所述的方法,其中细胞裂解物是粗制细胞裂解物。
实施方案136.根据实施方案118至135中任一项所述的方法,其中应用于固体载体的样品具有小于或等于1.7的260/280吸光度比。
实施方案137.根据实施方案118至136中任一项所述的方法,还包括在将样品应用于固体载体后裂解样品中的细胞。
实施方案138.根据实施方案118至137中任一项所述的方法,还包括:(d)在DNA:RNA片段被溶液相转座体复合物进一步片段化的条件下,使溶液相转座体复合物与固定DNA:RNA片段接触;从而获得在溶液中具有一端的固定核酸片段。
实施方案139.根据实施方案138所述的方法,其中溶液相转座体复合物包含第二标签,从而在溶液中生成具有第二标签的固定核酸片段。
实施方案140.根据实施方案139所述的方法,其中第一标签和第二标签是不同的。
实施方案141.根据实施方案138至140中任一项所述的方法,其中至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的溶液相转座体复合物包含第二标签。
实施方案142.根据实施方案138至141中任一项所述的方法,还包括通过使聚合酶和对应于第一多核苷酸的一部分的扩增引物反应来扩增固体载体上的片段。
实施方案143.根据实施方案1至142中任一项所述的方法,其中一条链的5'端是RNA链的5'端。
实施方案144.根据实施方案1至142中任一项所述的方法,其中一条链的5'端是DNA链的5'端。
实施方案145.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中标记片段包含DNA特异性条形码或RNA特异性条形码,该方法包括(a)将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;(b)固定DNA;(c)在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;(d)从RNA制备双链cDNA;(e)将样品与用于固定cDNA的第二固体载体组合,其中第二固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和RNA特异性条形码;以及(f)在第二固体载体上固定cDNA并进行标签化以制备包含RNA特异性条形码的标记片段,任选地其中在进行标签化之前使转座体复合物可逆地失活,并且进行标签化包括活化转座体复合物。
实施方案146.根据实施方案145所述的方法,还包括在第二固体载体上进行标签化之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
实施方案147.根据实施方案145或实施方案146所述的方法,还包括在第一固体载体上进行标签化之后并且在从RNA制备双链cDNA之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
实施方案148.根据实施方案145或实施方案146所述的方法,还包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
实施方案149.根据实施方案145至148中任一项所述的方法,其中从RNA制备双链cDNA通过模板转换进行。
实施方案150.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中标记片段包含DNA特异性条形码或RNA特异性条形码,该方法包括(a)将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;(b)固定DNA;(c)在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;(d)从RNA制备cDNA的单链以产生DNA:RNA双链体;(e)将样品与用于固定DNA:RNA双链体的第二固体载体组合,其中第二固体载体包含固定在其上的转座体复合物,其中转座体复合物包含对DNA:RNA双链体具有活性的转座酶和转座子,该转座子包含转座子末端序列和RNA特异性条形码;以及(f)在第二固体载体上固定DNA:RNA双链体并进行标签化以制备包含RNA特异性条形码的标记片段,任选地其中在进行标签化之前使转座体复合物可逆地失活,并且进行标签化包括活化转座体复合物。
实施方案151.根据实施方案150所述的方法,还包括在第二固体载体上进行标签化之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
实施方案152.根据实施方案150或实施方案151所述的方法,还包括在第一固体载体上进行标签化之后并且在从RNA制备cDNA的单链以产生DNA:RNA双链体之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
实施方案153.根据实施方案150或实施方案151所述的方法,还包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
实施方案154.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中标记片段包含DNA特异性条形码或RNA特异性条形码,该方法包括(a)将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;(b)固定DNA;(c)在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;(d)从RNA制备双链cDNA;(e)在溶液中对双链DNA进行标签化以制备双链cDNA的标记片段,其中溶液中的转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列、RNA特异性条形码和与捕获探针杂交的序列,任选地其中转座体复合物在进行标签化之前可逆地失活,并且进行标签化包括活化转座体复合物,并且其中标记片段包含RNA特异性条形码和与捕获探针杂交的序列;(f)将样品与具有包含捕获探针的表面的第二固体载体组合;以及(g)将双链cDNA的标记片段固定在第二固体载体上。
实施方案155.根据实施方案154所述的方法,还包括在将双链cDNA的标记片段固定在第二固体载体上之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
实施方案156.根据实施方案154或实施方案155所述的方法,还包括在第一固体载体上进行标签化之后并且在从RNA制备双链cDNA之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
实施方案157.根据实施方案154或实施方案155所述的方法,还包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
实施方案158.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中标记片段包含DNA特异性条形码或RNA特异性条形码,该方法包括(a)将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;(b)固定DNA;(c)在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;(d)从RNA制备cDNA的单链以产生DNA:RNA双链体;(e)在溶液中在DNA:RNA双链体上进行标签化以制备DNA:RNA双链体的标记片段,其中溶液中的转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列、RNA特异性条形码和与捕获探针杂交的序列,任选地其中转座体复合物在进行标签化之前可逆地失活,并且进行标签化包括活化转座体复合物,并且其中标记片段包含RNA特异性条形码和与捕获探针杂交的序列;(f)将样品与具有包含捕获探针的表面的第二固体载体组合;以及(g)将DNA:RNA双链体的标记片段固定在第二固体载体上。
实施方案159.根据实施方案158所述的方法,还包括在将DNA:RNA双链体的标记片段固定在第二固体载体上之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
实施方案160.根据实施方案158或实施方案159所述的方法,还包括在第一固体载体上进行标签化之后并且在从RNA制备cDNA的单链以产生DNA:RNA双链体之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
实施方案161.根据实施方案158或实施方案160所述的方法,还包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
实施方案162.根据实施方案154至161中任一项所述的方法,其中捕获探针包含核酸。
实施方案163.根据实施方案145-162中任一项所述的方法,还包括在第一固体载体上进行标签化之后向第一固体载体添加合成双链DNA。
实施方案164.根据实施方案163所述的方法,其中合成双链DNA包含尿嘧啶。
实施方案165.根据实施方案145至164中任一项所述的方法,其中DNA特异性条形码和RNA特异性条形码包含不同的引物结合序列。
实施方案166.根据实施方案165所述的方法,还包括使用结合包含在DNA特异性条形码中的引物结合序列的引物来扩增包含DNA特异性条形码的标记片段。
实施方案167.根据实施方案165所述的方法,还包括使用结合包含在RNA特异性条形码中的引物结合序列的引物来扩增包含RNA特异性条形码的标记片段。
实施方案168.根据实施方案165所述的方法,还包括使用引物混合物扩增包含DNA特异性条形码的标记片段和包含RNA特异性条形码的标记片段,该引物混合物包含结合包含在DNA特异性条形码中的引物结合序列的引物和结合包含在RNA特异性条形码中的引物结合序列的引物。
实施方案169.根据实施方案166至168中任一项所述的方法,其中扩增用尿嘧啶不耐受的DNA聚合酶进行。
实施方案170.根据实施方案168至169中任一项所述的方法,其中扩增包括桥式扩增。
实施方案171.根据实施方案145至170中任一项所述的方法,还包括对标记片段或扩增的标记片段进行测序。
实施方案172.根据实施方案145至171中任一项所述的方法,其中该方法在单个反应容器中进行。
实施方案173.根据实施方案145至172中任一项所述的方法,其中转座体复合物以至少103、104、105或106个复合物/mm2的密度存在于固体载体上。
实施方案174.根据实施方案145至173中任一项所述的方法,其中转座酶包括Tn5转座酶。
实施方案175.根据实施方案174所述的方法,其中Tn5转座酶是超高活性的Tn5转座酶。
实施方案176.根据实施方案145至175中任一项所述的方法,其中固定片段的长度通过增加或降低固体载体上的转座体复合物的密度来调节。
实施方案177.根据实施方案145至176中任一项所述的方法,其中固体载体包括微粒、小珠、平面载体、图案化表面或孔。
实施方案178.根据实施方案177所述的方法,其中固体载体是小珠。
实施方案179.一种其上固定有标记片段的文库的固体载体,该文库根据实施方案145至178中任一项所述的方法制备。
实施方案180.根据实施方案179所述的固体载体,其中固体载体是小珠。
实施方案181.一种从RNA制备单链DNA的链特异性文库的方法,包括(a)在抑制DNA依赖性DNA合成的条件下使用逆转录酶、引物和包含dTTP的核苷酸从样品中包含的RNA制备cDNA的第一链;(b)使用DNA聚合酶、引物和包含dUTP的核苷酸从cDNA的第一链制备cDNA的第二链以制备双链cDNA;(c)将双链cDNA应用于其上固定有转座体复合物的固体载体,其中每个转座体复合物包含转座酶;第一转座子,该第一转座子包含含有转座子末端序列的3’部分以及第一读段测序衔接子序列;其中第一转座子包含用于将转座体复合物固定到固体载体的5’亲和元素;以及第二转座子序列,该第二转座子序列包含与转座子末端序列全部或部分互补的序列;(b)用转座体复合物在双链DNA上进行标签化以制备包含第一读段测序衔接子序列的标记双链DNA片段,任选地其中在进行标签化之前使转座体复合物可逆地失活,并且进行标签化包括活化转座体复合物;(c)去除第二转座子并进行间隙-填充和延伸;(d)分离双链DNA片段的链;(e)将包含第二读段测序衔接子序列的引物与转座子末端序列或与转座子末端序列全部或部分互补的序列杂交,并扩增以制备DNA链,该DNA链不附接到固体载体并且包含第一读段测序衔接子和第二读段测序衔接子;以及(f)从固体载体释放通过扩增生成的链,其中释放释放包含第一读段测序衔接子和第二读段测序衔接子的单链DNA片段。
实施方案182.根据实施方案181所述的方法,其中抑制DNA依赖性DNA合成的条件是存在包含放线菌素D的缓冲液。
实施方案183.根据实施方案181至182中任一项所述的方法,其中引物是一种或多种随机引物。
实施方案184.根据实施方案181至183中任一项所述的方法,其中引物是随机引物和聚T引物的混合物。
实施方案185.根据实施方案181至184中任一项所述的方法,其中用于制备cDNA的第二链的引物与用于制备cDNA的第一链的引物相同。
实施方案186.根据实施方案181至185中任一项所述的方法,其中RNA是长的非译码RNA或反义转录物。
实施方案187.根据实施方案181至186中任一项所述的方法,其中扩增用尿嘧啶不耐受的聚合酶进行。
实施方案188.根据实施方案187所述的方法,其中扩增不从包含尿嘧啶的DNA链扩增。
实施方案189.根据实施方案181至188中任一项所述的方法,其中独特分子标识符(UMI)包含在包含第二读段测序衔接子序列的引物中。
实施方案190.根据实施方案189所述的方法,其中UMI位于第二读段测序衔接子序列和可结合到转座子末端序列的序列或与转座子末端序列全部或部分互补的序列之间。
实施方案191.根据实施方案181至188中任一项所述的方法,其中UMI包含在第一转座子中。
实施方案192.根据实施方案191所述的方法,其中UMI位于转座子末端序列和第一读段测序衔接子序列之间。
实施方案193.根据实施方案189至192中任一项所述的方法,其中RNA包含不同RNA的池,并且包含第一读段测序衔接子和第二读段测序衔接子的单链片段包含不同片段的池,其中每个片段包含与不同片段的池中包含的其他片段不同的UMI。
实施方案194.根据实施方案181至193中任一项所述的方法,其中亲和元素是生物素或脱硫生物素,并且固体载体在其表面上包含链霉亲和素或亲和素。
实施方案195.根据实施方案194所述的方法,其中亲和元素是双生物素。
实施方案196.根据实施方案181至195中任一项所述的方法,其中释放是用热或氢氧化钠处理进行的。
实施方案197.根据实施方案181至196中任一项所述的方法,其中包含第一读段测序衔接子和第二读段测序衔接子的单链片段在释放之后与固体载体分开。
实施方案198.根据实施方案181至197中任一项所述的方法,还包括用包含第一读段测序衔接子和第二读段测序衔接子的单链DNA片段进行索引引物扩增以在释放之后制备索引片段。
实施方案199.根据实施方案198所述的方法,其中索引引物扩增在与固体载体分离的反应容器中进行。
实施方案200.根据实施方案198或实施方案199所述的方法,其中索引引物扩增用尿嘧啶不耐受聚合酶进行。
实施方案201.根据实施方案181至200中任一项所述的方法,还包括对包含第一读段测序衔接子和第二读段测序衔接子的单链DNA片段或索引片段进行测序。
实施方案202.根据实施方案201所述的方法,其中测序数据是从由RNA生成的cDNA的第一链生成的。
实施方案203.根据实施方案201所述的方法,其中测序数据不是从由RNA生成的cDNA的第二链生成的。
实施方案204.根据实施方案181至203中任一项所述的方法,其中该方法不需要连接。
实施方案205.根据实施方案181至206中任一项所述的方法,其中该方法划分RNA中重叠序列的边界。
实施方案206.根据实施方案181至207中任一项所述的方法,其中该方法允许估计转录物表达。
实施方案207.根据实施方案208所述的方法,其中转录物表达的估计基于UMI的分析。
实施方案208.一种从RNA制备双链DNA片段的文库的方法,包括(a)使用包含UMI和第一读段测序衔接子序列的聚T引物在样品中从全长RNA制备cDNA的第一链;(b)制备cDNA的第二链以生成双链cDNA;(c)将双链cDNA应用于其上固定有转座体复合物的小珠,其中每个转座体复合物包含转座酶;第一转座子,该第一转座子包含3’转座子末端序列;以及第二转座子,该第二转座子包含与转座子末端序列全部或部分互补的序列以及杂交序列,其中转座体复合物通过将杂交序列结合到固定到小珠的寡核苷酸而被固定,其中所述寡核苷酸包含5'亲和元素、第一读段测序衔接子序列、小珠代码以及与杂交序列全部或部分互补的序列;(b)固定双链cDNA并且在小珠上进行标签化以制备双链DNA片段,任选地其中在进行标签化之前使转座体复合物可逆地失活,并且进行标签化包括活化转座体复合物;(c)去除第二转座子;(d)使包含第二读段测序衔接子序列和与转座子末端序列全部或部分互补的序列的引物与转座子末端序列杂交;以及(e)进行间隙-填充和延伸以制备包含第一读段测序衔接子和第二读段测序衔接子的双链DNA片段。
实施方案209.一种从RNA制备双链DNA片段的文库的方法,包括(a)使用包含UMI和第一读段测序衔接子序列的聚T引物在样品中从全长RNA制备cDNA的第一链;(b)制备cDNA的第二链以生成双链cDNA;(c)将双链cDNA应用于其上固定有转座体复合物的小珠,其中每个转座体复合物包含转座酶;第一转座子,该第一转座子包含3'转座子末端序列、小珠代码和第二读段测序衔接子序列;其中第一转座子还包含用于将转座体复合物固定到固体载体的5’亲和元素;以及第二转座子,该第二转座子包含与转座子末端序列全部或部分互补的序列;(b)固定双链cDNA并且在小珠上进行标签化以制备双链DNA片段,任选地其中在进行标签化之前使转座体复合物可逆地失活,并且进行标签化包括活化转座体复合物;(c)去除第二转座子;(d)使包含第二读段测序衔接子序列和与转座子末端序列全部或部分互补的序列的引物与转座子末端序列杂交;以及(e)进行间隙-填充和延伸以制备包含第一读段测序衔接子和第二读段测序衔接子的双链DNA片段。
实施方案210.根据实施方案208或209所述的方法,其中与转座子末端序列全部或部分互补的序列短于转座子末端序列。
实施方案211.根据实施方案210所述的方法,其中当与转座子末端序列全部或部分互补的序列短于转座子末端序列时,生成较少的衔接子二聚体。
实施方案212.根据实施方案208至211中任一项所述的方法,其中引物包含5'部分和3'部分,该5'部分包含第二读段序列衔接子,该3'部分包含与转座子末端序列全部或部分互补的序列。
实施方案213.根据实施方案210至212中任一项所述的方法,其中当去除与转座子末端序列全部或部分互补的序列时,该片段在一个或两个末端处保持附接到转座体。
实施方案214.根据实施方案210至213中任一项所述的方法,其中全长RNA包含不同全长RNA的池,并且聚T引物包含含有不同UMI的不同聚T引物的池。
实施方案215.根据实施方案214所述的方法,其中不同聚T引物的池中包含的每种聚T引物包含不同的UMI。
实施方案216.根据实施方案210至215所述的方法,其中全长RNA包含不同全长RNA的池,并且从单个全长RNA制备的3'双链DNA片段包含与从池中的其他全长RNA制备的3'双链DNA片段不同的UMI。
实施方案217.根据实施方案216所述的方法,其中全长RNA包含不同全长RNA的池,并且小珠包含小珠的池。
实施方案218.根据实施方案217所述的方法,其中每个小珠固定了转座体复合物,该转座体复合物包含与固定在池中其他小珠上的转座体复合物中包含的小珠代码相比不同的小珠代码。
实施方案219.根据实施方案210至218中任一项所述的方法,其中从由单个全长RNA制备的双链cDNA制备的所有片段在同一小珠上进行标签化。
实施方案220.根据实施方案210至219中任一项所述的方法,其中在进行间隙-填充和延伸后,由双链cDNA制备的包含第一读段测序衔接子和第二读段测序衔接子的所有双链片段在相同的固体载体上。
实施方案221.根据实施方案210至220中任一项所述的方法,其中全长RNA包含不同全长RNA的池,并且在进行间隙-填充和延伸后,由池中的单个全长RNA制备的包含第一读段测序衔接子和第二读段测序衔接子的所有双链片段在相同的固体载体上。
实施方案222.根据实施方案210至221中任一项所述的方法,还包括扩增包含第一读段测序衔接子和第二读段测序衔接子的双链片段以制备扩增片段。
实施方案223.根据实施方案210至222中任一项所述的方法,还包括对扩增片段或包含第一读段测序衔接子和第二读段测序衔接子的双链片段进行测序。
实施方案224.根据实施方案223所述的方法,其中测序允许全长RNA同种型检测。
实施方案225.根据实施方案210至224中任一项所述的方法,其中双链cDNA制备是通过链方法进行的。
实施方案226.根据实施方案223至225中任一项所述的方法,其中从包含第一读段测序衔接子和第二读段测序衔接子的双链片段或扩增片段获得的序列中小珠代码的存在识别在其上生成片段的小珠。
实施方案227.根据实施方案210至226中任一项所述的方法,其中样品是单个细胞。
实施方案228.根据实施方案210至227中任一项所述的方法,其中从RNA制备双链cDNA并将样品与用于固定cDNA的第二固体载体组合包括根据实施方案145中任一项所述的方法。
另外的目的和优点将在下列描述中部分地示出,并且部分地将在描述中显而易见,或可通过实践获知。这些目的和优点将借助所附权利要求书中特别指出的元件和组合来实现和获得。
应当理解,上述一般描述和下述详细描述均仅作为示例和说明,并且不是对权利要求书的限制。
并入本说明书中并且构成本说明书的一部分的附图示出了一个(多个)实施方案,并且其与说明书一起用于解释本文所述的原理。
附图说明
图1A至图1C比较了通过固定转座体片段化RNA:DNA双链体(A)与通过捕获和标签化通过溶液中的转座体片段化DNA:RNA双链体(Cap-Tag,B和C)的当前方法。在图1A和图1B中,靶RNA被结合到mRNA的聚A尾的聚T捕获寡核苷酸固定。在图1B和图1C中,提出逆转录酶通过RNA链中出现的切口启动第二链合成,并且这些dsDNA双链体是转座体的底物。然而,由于使用来自溶液的转座体,读段仅从转录物的3’端生成。相反,使用固定转座体的本发明方法(图1A)允许对应于全长靶RNA的文库生成。
图2示出溶液中的DNA:RNA双链体可如何被固定在表面上的转座体标签化。将靶RNA用于cDNA合成以生成DNA:RNA双链体,随后经由固定的转座体复合物对DNA:RNA双链体进行标签化。标签化产生桥接到固体载体上的两个固定转座体复合物的双链DNA:RNA双链体。然后终止转座体复合物的转座酶的活性(诸如如此处所示的Tn5)或去除转座酶。进行链交换,然后进行间隙-填充连接。片段的文库可在管或流通池中释放。
图3A至图3C示出来自RNA测序文库的代表性测序结果,该RNA测序文库是使用cDNA合成从通用人类参考RNA生成DNA:RNA双链体而生成的。这些DNA:RNA双链体通过固定的转座体复合物(如图2所示)诸如BLT标签化。在BLT上通过固定的转座体复合物进行标签化后,进行间隙填充连接。将文库释放到管中并直接接种在流通池上。该文库是可测序的(A)。结果的分布显示译码、非翻译区(UTR)、内含子和基因间序列(B)的测序,并且因此表明可以使用本发明方法对RNA的不同区域进行测序。还显示了沿着转录物长度的归一化覆盖(C),其支持测序结果中3'偏倚的相对缺乏。
图4示出细胞和捕获小珠在小滴中的共包封,随后是细胞裂解、cDNA合成和文库制备。在释放文库片段之前,可以将具有片段的固定文库的小珠递送到用于测序的固体表面(诸如流通池)。另选地,可将具有固定的靶核酸的小珠递送到用于测序的固体表面,随后在小珠上制备片段并将片段释放到用于测序的固体表面。将片段释放到流通池上可允许流通池上的空间读段以识别可能源自相同细胞的片段。
图5示出包含捕获寡核苷酸的小珠。在该代表性示例中,捕获寡核苷酸包含聚T序列、条形码(其可用作小珠代码)和P5衔接子序列。聚T序列可用于捕获mRNA,并且P5和条形码可在DNA:RNA双链体的制备期间掺入。其他衔接子(此处示出为B'-P7')可在标签化期间或之后掺入。在标签化之后,可进行链交换和连接以制备用于测序的文库片段。
图6示出具有捕获寡核苷酸(此处为用于捕获mRNA的聚T序列)和固定寡核苷酸的小珠,该固定寡核苷酸包含用于与包含在转座体复合物中包含的第二转座子中的杂交序列杂交的序列(“shortA”)。以这种方式,固定寡核苷酸可用于组装转座体复合物。固定寡核苷酸还可包含P5衔接子序列和小珠代码。
图7示出使用具有用于组装转座体的固定寡核苷酸的可活化BLT从全长RNA产生文库的工作流程,包括小滴中的mRNA捕获、批量cDNA合成、转座体与固定寡核苷酸的杂交(Hyb)以及标签化的步骤。BLT可以在标签化之前或之后在流通池上捕获。
图8示出用于文库的单细胞解析的方法,该文库在液滴中使用或在流通池的微孔中捕获。
图9示出cDNA合成,随后在BLT上标签化和文库制备,并且然后在流通池或管中释放片段的方法。该方法使用聚T引物来结合到mRNA的聚A尾结合以制备全长mRNA文库。
图10示出cDNA合成,随后在BLT上标签化和文库制备,并且然后在流通池或管中释放片段的方法。该方法使用随机引物来结合到所有RNA结合以制备总RNA文库。
图11A至图11C示出可用于本发明用于从RNA制备文库的方法的多种不同小珠。(A)用于全长mRNA文库制备的小珠,其具有捕获寡核苷酸(此处为用于捕获mRNA的聚T序列)和固定寡核苷酸,该固定寡核苷酸包含用于与包含在转座体复合物中包含的第二转座子中的杂交序列杂交的序列(例如,“shortA”),其可用于组装转座体复合物。(B)转座体与shortA序列的杂交。(C)在小珠上制备全长mRNA的多个片段。
图12示出用于全长mRNA文库制备的代表性小珠。小珠将具有多个捕获寡核苷酸(此处为用于捕获mRNA的聚T序列)和多个固定寡核苷酸,该固定寡核苷酸包含用于与包含在第二转座子中的杂交序列杂交的序列。在制备DNA:RNA双链体之前或之后,固定寡核苷酸可用于杂交并固定小珠上的转座体复合物。
图13示出BLT上的多个转座体如何从由mRNA生成的全长DNA:RNA双链体制备片段的代表性示例。
图14示出在cDNA合成期间掺入3’UMI后在BLT上的对称标签化事件。
图15示出在制备具有3’UMI的双链cDNA后的标签化。在该示例中,每个小珠包含具有小珠代码的固定的第一转座子,从而允许在整个mRNA转录物上进行UMI计数测定。
图16示出在制备具有3’UMI的双链cDNA后利用小珠的标签化,其中该方法包括第一链cDNA合成、模版转换和标签化前的PCR扩增。
图17示出具有链特异性cDNA合成的引物延伸链特异性BLT(PRESS-BLT)工作流程。
图18示出PRESS-BLT工作流程的概述,其中使用双生物素将第一转座子固定到小珠。
图19总结了双生物素和缩短的ME’序列可如何提高工作流程的产率。例如,缩短的ME’序列可用于诸如图14所示的那些方法或其中非转移的ME'链与不同寡核苷酸交换的其他方法之类的方法。
图20示出用于制备RNA测序文库的示例性工作流程的图。使用包含聚T捕获寡核苷酸的RNA BLT从总RNA样品捕获mRNA,洗涤样品,使用逆转录酶来生成cDNA以形成DNA:RNA双链体,并经由固定在RNA BLT上的转座体复合物将DNA:RNA双链体进行片段化。在图20至图28所示的实施方案中,还可以制备双链cDNA(代替DNA:RNA双链体)并经由固定在RNA BLT上的转座体复合物进行片段化。
图21示出混合样品(即,包含DNA和RNA两者)中的DNA和RNA可如何结合到RNA BLT和DNA BLT的概述。由于RNA对转座体复合物不具有亲和力,因此RNA将仅结合到包含聚T捕获寡核苷酸的RNA BLT。然而,基于DNA对包含在DNA和RNA BLT两者上的固定转座体复合物中的转座子末端序列的亲和力,DNA可以结合到DNA BLT或RNA BLT中的任一者。因此,与包含RNA和DNA的样品一起使用的方法必须选择性地将DNA与DNA BLT隔离。与包含DNA和RNA的混合物样品一起使用的方法可在标签化反应期间采用不同的标签,使得iDNA是识别DNABLT的索引,并且iRNA是识别RNA BLT的索引。以这种方式,可以将源自DNA的片段与源自RNA的片段区分开。
图22概述了通过在应用样品之前可逆地失活的RNA BLT从包含RNA和DNA的样品制备RNA和DNA测序样品的方法。以这种方式,样品中的DNA结合到DNA BLT,并且仅RNA结合到RNA BLT(经由聚T捕获寡核苷酸)。将结合到DNA BLT的DNA标签化,并洗涤小珠。然后RNABLT的转座体复合物被活化(即,失活被逆转)。进行逆转录以生成固定到RNA BLT的DNA:RNA双链体,随后进行DNA:RNA双链体的片段化。
图23概述了使用“裸”RNA BLT从包含RNA和DNA的样品制备RNA和DNA测序样品的方法。这些“裸”RNA-BLT不包含转座酶。首先,用DNA-BLT对DNA进行标签化,并且在聚T捕获寡核苷酸上捕获RNA,并且可以进行cDNA合成,洗涤样品,并且然后添加转座酶以在先前“裸”的RNA-BLT上组装功能性转座体。添加逆转录酶聚合酶,并且用RNA BLT进行DNA:RNA双链体的标签化。转座体可在cDNA合成后通过转座体复合物与固定在RNA-BLT上的寡核苷酸杂交而组装在小珠上。
图24概述了使用3-小珠方法从包含RNA和DNA的样品制备RNA和DNA测序样品的方法。在3-小珠方法中,该方法开始于DNA-BLT和聚T小珠(缺少转座体)。DNA通过DNA BLT标签化,并且RNA被聚T小珠捕获。洗涤小珠。然后将RNA-BLT与试剂一起添加,该试剂将捕获的RNA从聚T小珠置换到RNA-BLT上。添加逆转录酶聚合酶,并且用RNA BLT进行DNA:RNA双链体的标签化。
图25概述了使用DNA捕获,随后将DNA结合的DNA BLT与RNA BLT物理隔离来从包含RNA和DNA的样品制备RNA和DNA测序样品的方法。过量的DNA BLT可用于结合样品中的所有双链(ds)DNA并在DNA上进行标签化。然后可将RNA与标签化的DNA BLT分开并结合到RNABLT。在经由逆转录酶聚合酶生成DNA:RNA双链体后,进行RNA的标签化。然后可将RNA BLT和DNA BLT组合。
图26描述了使用DNA特异性标签化和cDNA特异性标签化和分区来制备从DNA或RNA(转化为cDNA)制备的标记片段的文库的方法。在将具有总核酸(TNA,包含DNA和RNA)的样品与DNA BLT组合并且进行DNA特异性标签化以将DNA特异性条形码掺入片段中之后,可以在DNA片段与BLT缔合的同时将DNA BLT分开。然后,可以从RNA生成双链cDNA(ds-cDNA),并且经由RNA(cDNA)特异性标签化进行标签化,以将RNA特异性条形码掺入片段中。以这种方式,片段被标记,使得下游测序和生物信息学可用于使用条形码将源自RNA的样品与源自DNA的那些样品区分开。
图27描述了使用DNA特异性标签化和RNA(cDNA)特异性标签化来制备从DNA或RNA(转化为cDNA)制备的标记片段的文库的方法。该方法可以在单个反应容器中进行(即,一锅反应)。在使用DNA BLT进行DNA特异性标签化以掺入DNA特异性条形码之后,可将“自杀”合成DNA添加到这些DNA BLT中。这样的合成DNA可以是包含尿嘧啶的双链DNA(dsDNA),当尿嘧啶不耐受DNA聚合酶用于扩增时,它不能被扩增。以这种方式,所有DNA BLT将被来自样品的dsDNA或合成dsDNA饱和,并且DNA BLT(包含具有DNA特异性条形码的转座体复合物)将不可用于进一步的标签化。然后,可以从样品中的RNA制备ds-cDNA,并且cDNA特异性标签化可以用于使用包含具有RNA特异性条形码的转座体复合物的RNA BLT掺入RNA条形码。在清除和扩增后,可以对标记的片段进行测序,并且将条形码用于确定源自DNA的那些样品与源自RNA的那些样品。
图28描述了用于使用DNA特异性标签化和DNA:RNA双链体特异性标签化来制备从DNA或RNA(转化为DNA:RNA双链体)制备的标记片段的文库的方法。在进行DNA特异性标签化以使用包含具有DNA特异性条形码的转座体复合物的DNA BLT掺入DNA条形码之后,可将“自杀”合成DNA添加到这些DNA BLT中。然后,可以从样品中的RNA制备cDNA的单链以生成DNA:RNA双链体,并且DNA:RNA双链体的标签化可以用于使用包含具有RNA特异性条形码的转座体复合物的RNA BLT掺入RNA条形码。示例性RNA BLT包括来自xGEN USA的tedRNA小珠,其在标记DNA:RNA双链体时具有改善的功效。在清除和扩增后,可以对标记的片段进行测序,并且将条形码用于确定源自DNA的那些样品与源自RNA的那些样品。
具体实施方式
I.使用包含捕获寡核苷酸的小珠连接的转座体制备RNA测序文库的方法
许多用于测序RNA样品的方案采用样品制备,该样品制备在测序前将样品中的RNA转化成双链cDNA形式。本文提供了用于对RNA样品进行测序的方法,该方法使用DNA:RNA双链体并且当对mRNA进行标签化时避免3'偏倚。在一些实施方案中,本发明方法允许所得文库产物中靶RNA的5'至3'的均匀覆盖(如图1A中所示)。
如本文所用,“DNA:RNA”双链体是指RNA和DNA的双链体。DNA:RNA双链体包括具有一定量与其缔合的DNA的RNA。DNA:RNA双链体的DNA允许片段化,即DNA:RNA双链体中的DNA足以使转座酶将DNA:RNA双链体片段化。
应当理解,对于所有实施方案,DNA:RNA双链体也可在片段化(即,进行标签化)之前转化为双链DNA。在一些实施方案中,在片段化之前生成cDNA的第二链的全部或部分。在一些实施方案中,DNA:RNA双链体可在溶液中或在DNA:RNA双链体已结合到BLT后转化为双链DNA。所谓转化为双链DNA是指DNA:RNA双链体中的一些或全部RNA被转化为DNA。在此类实施方案中,片段化可发生在双链DNA的区域中。
在一些实施方案中,将包含一种或多种RNA的样品添加到表面,由此通过捕获寡核苷酸捕获mRNA转录物,诸如通过它们在小珠表面上的3'聚A尾捕获。然后添加逆转录酶(RT)聚合酶以生成第一链cDNA。因此,在该方法中,cDNA合成可以在RNA结合到捕获寡核苷酸之后进行。DNA:RNA双链体通过表面结合的转座体标签化,从而从全长的mRNA转录物生成文库模板。
在一些实施方案中,从靶RNA制备标记的DNA:RNA片段的固定文库的方法包括:
将包含靶RNA的样品应用于其上固定有转座体复合物和捕获寡核苷酸的固体载体,
其中转座体复合物包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3'部分以及
第一标签;
其中在靶RNA的3’端结合到捕获寡核苷酸的条件下将样品应用于固体载体;
在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,一条链的5'端是RNA链的5'端。在一些实施方案中,一条链的5'端是DNA链的5'端。
在一些实施方案中,可使用可活化的BLT,其中转座酶在该方法期间附接到第一多核苷酸。在一些实施方案中,转座酶在添加逆转录酶之前或之后附接到第一多核苷酸。换句话说,转座酶可以在生成DNA:RNA双链体之后或在生成DNA:RNA双链体之前添加。
在一些实施方案中,从靶RNA制备标记的DNA:RNA片段的固定文库的方法包括
将包含靶RNA的样品应用于其上固定有捕获寡核苷酸和第一多核苷酸的固体载体,其中第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签;其中在靶RNA的3’端结合到捕获寡核苷酸的条件下将样品应用于固体载体;
在转座酶结合到第一多核苷酸以形成转座体复合物的条件下添加转座酶;
在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
在一些实施方案中,从靶RNA制备标记的DNA:RNA片段的固定文库的方法包括
将包含靶RNA的样品应用于其上固定有捕获寡核苷酸和第一多核苷酸的固体载体,其中第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签;其中在靶RNA的3’端结合到捕获寡核苷酸的条件下将样品应用于固体载体;
在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;
在转座酶结合到第一多核苷酸以形成转座体复合物的条件下添加转座酶;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。
在一些实施方案中,该方法还包括在将样品应用于固体载体后洗涤固体载体以去除任何未结合的靶RNA。
当将DNA:RNA双链体添加到固体载体时,转座体复合物将使双链体标签化,从而生成在两端处偶联到表面的片段。在一些实施方案中,桥接片段的长度可以通过改变表面上的转座体复合物的密度来改变。在某些实施方案中,所得桥接片段的长度小于或等于100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900bp、5000bp、10000bp、30000bp或100,000bp。在此类实施方案中,然后可使用标准簇化学将桥接片段扩增成簇,如美国专利号7,985,565和7,115,400的公开内容所例示,这些专利中的每一篇的内容以引用方式全文并入本文。
在一些实施方案中,片段化产生桥接到固体载体上的两个固定转座体复合物的双链DNA:RNA双链体。在一些实施方案中,桥接双链体的长度是为100个碱基对至1500个碱基对。
在一些实施方案中,从mRNA的3'端生成的DNA:RNA双链体在一端处附接到捕获寡核苷酸,并且在另一端处附接到固定转座体复合物。在一些实施方案中,捕获寡核苷酸包含与包含在一个或多个转座子末端中的那些序列相似或相同的序列。在一些实施方案中,捕获寡核苷酸可包含第一标签。
在一些实施方案中,DNA:RNA双链体的片段可用于生成靶RNA的译码序列、非翻译区(UTR)、内含子和/或基因间序列。
在一些实施方案中,标记靶DNA:RNA双链体并生成固定的标记DNA:RNA双链体的体外转座反应涉及转座酶、转座子序列组成和合适的反应条件。
如本文所述,对方案的某些修改可以提高产率。然而,这些特定方法并不意味着限制权利要求书的范围,而是向想要针对其特定样品优化方法的本领域技术人员提供指导。例如,用包含单个细胞的样品进行工作的用户可能想要使用本文所述的方法来提高文库产率,因为单个细胞将具有有限量的RNA和DNA。
A.样品和靶mRNA
在一些实施方案中,样品包含靶RNA。在一些实施方案中,该样品包含RNA和DNA。在一些实施方案中,靶RNA是mRNA。在一些实施方案中,靶RNA包含译码、非翻译区(UTR)、内含子和/或基因间序列。
在一些实施方案中,应用包含靶RNA的样品或包含RNA和DNA的样品的步骤包括向所述固体载体添加生物样品。生物样品可以是包含RNA或RNA和DNA并且可沉积到固体表面上以进行标签化的任何类型。例如,样品可包含多种纯化状态的RNA或RNA和DNA,包括纯化的RNA或RNA和DNA。然而,样品不需要完全纯化,并且可包括例如与蛋白质、其他核酸物质、其他细胞组分和/或任何其他污染物混合的RNA或RNA和DNA。在一些实施方案中,生物样品包含以与体内发现的比例大致相同的比例存在的RNA或RNA和DNA、蛋白质、其他核酸物质、其他细胞组分和/或任何其他污染物的混合物。例如,在一些实施方案中,这些组分以与完整细胞中发现的相同比例存在。在一些实施方案中,生物样品具有小于或等于2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7或0.60的260/280吸光度比。在一些实施方案中,生物样品具有至少2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7或0.60的260/280吸光度比。因为本文所提供的方法允许RNA或RNA和DNA结合到固体载体,所以能够在表面结合的标签化发生后仅通过洗涤固体载体来移除其他污染物。生物样本可包括例如粗制细胞裂解物或全细胞。例如,在本文示出的方法中施加于固体载体的粗制细胞裂解物不需要经受传统上用于从其他细胞组分分离核酸的一个或多个分离步骤。示例性分离步骤在Maniatis等人,Molecular Cloning:A Laboratory Manual,第2版,1989年和Short Protocols in Molecular Biology,Ausubel等人编辑中示出,这些文献据此以引用方式并入。
在一些实施方案中,应用于固体载体的样品具有小于或等于1.7的260/280吸光度比。
因此,在一些实施方案中,生物样品可包括例如血液、血浆、血清、淋巴、粘液、痰液、尿液、精液、脑脊液、支气管抽吸物、粪便和浸渍组织或它们的裂解物或包括RNA或RNA和DNA的任何其他生物样本。
在一些实施方案中,应用于固体载体的样品是血液。在一些实施方案中,应用于固体载体的样品是细胞裂解物。
在一些实施方案中,细胞裂解物是粗制细胞裂解物。在一些实施方案中,该方法还包括在将样品应用于固体载体后裂解样品中的细胞以生成细胞裂解物。
在一些实施方案中,在溶液中制备DNA:RNA双链体,然后将其固定到BLT(参见图2)。
本文提出的方法和组合物的一个优点是,可以将生物样品添加到流通池中,并且随后的裂解和纯化步骤可以都在流通池中进行,而无需进一步的转移或处理步骤,仅需通过使必要的试剂流入流通池中。
在一些实施方案中,靶RNA包含与捕获寡核苷酸中的一种或多种捕获寡核苷酸的至少一部分互补的序列。
在一些实施方案中,靶RNA是信使RNA(mRNA)、转移RNA(tRNA)或核糖体RNA(rRNA)。可以基于靶RNA的类型设计合适的捕获寡核苷酸。
在一些实施方案中,靶RNA的3'端结合到捕获寡核苷酸。
在一些实施方案中,靶RNA是mRNA。在一些实施方案中,靶RNA是聚腺苷酸化的(即,包含仅含有腺嘌呤碱基的一段RNA)。在一些实施方案中,mRNA包含聚A尾。在一些实施方案中,mRNA的3'端包含聚A尾。
在一些实施方案中,靶mRNA包含聚A序列并且结合到包含聚T序列的捕获寡核苷酸。
包含在样品中的DNA和RNA可称为“总核酸”。本文所述的方法可用于从包含总核酸的样品制备DNA和RNA文库,其中DNA文库中包含的片段各自包含DNA特异性条形码,并且其中RNA文库中包含的片段各自包含RNA特异性条形码。此类方法可避免在从单个样品制备DNA和RNA文库之前分离DNA和RNA的需要。
B.转座体复合物
在一些实施方案中,转座体复合物包含结合到一个或多个多核苷酸的转座酶。
“转座体复合物”由至少一种转座酶(或如本文所述的其他酶)和转座子识别序列构成。在一些此类体系中,转座酶结合转座子识别序列以形成能够催化转座反应的功能性复合物。在一些方面,转座子识别序列为双链转座子末端序列。转座酶结合靶标核酸中的转座酶识别位点并将转座子识别序列插入到靶标核酸中。在一些此类插入事件中,转座子识别序列(或末端序列)的一条链被转移到靶标核酸中,导致切割事件。可容易地适于与转座酶一起使用的示例性转座程序和系统。
“转座酶”意指一种酶,所述酶能够与包含转座子末端的组合物(例如,转座子、转座子末端、转座子末端组合物)形成功能性复合物,并且催化含转座子末端的组合物插入或转座到双链靶核酸中。如本文所示的转座酶还可包括来自逆转录转座子和逆转录病毒的整合酶。
基于转座子的技术可用于将DNA片段化,其中靶核酸诸如基因组DNA用转座体复合物处理,该转座体复合物同时对靶标进行片段化和标记(“标签化”),从而形成在该片段的末端处用独特衔接子序列加标签的片段化核酸分子的群体。标签化包括通过转座体复合物修饰DNA,该转座体复合物包含与包含转座子末端序列(本文称为转座子)的一个或多个标签(诸如衔接子序列)复合的转座酶。标签化因此可导致DNA的片段化和衔接子与双链体片段的两条链的5'端的连接同时发生。
转座反应是其中一个或多个转座子在随机位点或几乎随机位点处插入靶核酸中的反应。转座反应中的组分可包括转座酶(或能够将如本文所述的核酸片段化并标记的其他酶,诸如整合酶)和转座子元件,该转座子元件包括结合到该酶的双链转座子末端序列,以及附接到这两个转座子末端序列中的一个转座子末端序列的衔接子序列。双链转座子末端序列的一条链被转移到靶核酸的一条链上,而互补转座子末端序列链则没有被转移(即,非转移转座子序列)。衔接子序列可根据需要或期望包含一个或多个功能序列(例如,引物序列)。
可与本文提供的某些实施方案一起使用的示例性转座酶包括(或编码自):Tn5转座酶、睡美人(Sleeping Beauty,SB)转座酶、哈氏弧菌(Vibrio harveyi)、MuA转座酶和包含R1和R2端序列的Mu转座酶识别位点、金黄色葡萄球菌(Staphylococcus aureus)Tn552、Ty1、Tn7转座酶、Tn/O和IS10、水手转座酶、Tc1、P因子、Tn3、细菌插入序列、逆转录病毒和酵母的逆转座子。更多示例包括IS5、Tn10、Tn903、IS911和转座酶家族酶的工程化版本。本文所述的方法还可包括转座酶的组合,而不仅仅是单一转座酶。
在一些实施方案中,转座酶是Tn5、Tn7、MuA或哈氏弧菌转座酶或它们的活性突变体。在其他实施方案中,转座酶是Tn5转座酶或其突变体。在其他实施方案中,转座酶是Tn5转座酶或其突变体。在其他实施方案中,转座酶是Tn5转座酶或其活性突变体。在一些实施方案中,Tn5转座酶是高活性Tn5转座酶或其活性突变体。在一些方面,Tn5转座酶是如PCT公布号WO2015/160895中所述的Tn5转座酶,该专利以引用方式并入本文。在一些方面,Tn5转座酶是相对于野生型Tn5转座酶在具有第54、56、372、212、214、251和338位处的突变的高活性Tn5。在一些方面,Tn5转座酶是相对于野生型Tn5转座酶具有下列突变的高活性Tn5:E54K、M56A、L372P、K212R、P214R、G251R和A338V。在一些实施方案中,Tn5转座酶是融合蛋白质。在一些实施方案中,Tn5转座酶融合蛋白质包含融合的延长因子Ts(Tsf)标签。在一些实施方案中,Tn5转座酶是相对于野生型序列在氨基酸54、56和372处包含突变的超高活性Tn5转座酶。在一些实施方案中,超高活性Tn5转座酶是融合蛋白质,任选地,其中融合蛋白质是延长因子Ts(Tsf)。在一些实施方案中,识别位点是Tn5型转座酶识别位点(Goryshin和Reznikoff,J.Biol.Chem.,第273卷:第7367页,1998年)。在一个实施方案中,使用与超高活性Tn5转座酶形成复合物的转座酶识别位点(例如,EZ-Tn5TM转座酶,EpicentreBiotechnologies,Madison,Wis.)。在一些实施方案中,Tn5转座酶是野生型Tn5转座酶。
在一些实施方案中,转座体复合物包含转座酶的两个分子的二聚体。在一些实施方案中,转座体复合物是同源二聚体,其中转座酶的两个分子各自结合到相同类型的第一转座子和第二转座子(例如,结合到每个单体的两个转座子的序列是相同的,从而形成“同源二聚体”)。在一些实施方案中,本文所述的组合物和方法采用转座体复合物的两个群体。在一些实施方案中,每个群体中的转座酶是相同的。在一些实施方案中,每个群体中的转座体复合物是同源二聚体,其中第一群体在每个单体中具有第一衔接子序列,并且第二群体在每个单体中具有不同的衔接子序列。
术语“转座子末端”是指双链核酸DNA,其仅表现出与在体外转座反应中起作用的转座酶或整合酶形成复合物所必需的核苷酸序列(“转座子末端序列”)。在一些实施方案中,转座子末端能够在转座反应中与转座酶形成功能性复合物。作为非限制性示例,转座子末端可包括由野生型或突变型Tn5转座酶识别的19-bp外端(“OE”)转座子末端、内端(“IE”)转座子末端、或“嵌合末端”(“ME”)转座子末端、或R1和R2转座子末端,如US 2010/0120098的公开内容中所述,该专利的内容全文以引用方式并入本文。转座子末端可包含适用于在体外转座反应中与转座酶或整合酶形成功能性复合物的任何核酸或核酸类似物。例如,转座子末端可包含DNA、RNA、修饰碱基、非天然碱基、修饰主链,并且可以在一条链或两条链中包含切口。尽管术语“DNA”在本公开中与转座子末端的组合物结合使用,但应当理解,任何合适的核酸或核酸类似物均可以用于转座子末端。
术语“转移链”是指两个转座子末端的转移部分。类似地,术语“非转移链”是指两个“转座子末端”的非转移部分。在体外转座反应中,转移链的3’末端接合或转移至靶DNA。在体外转座反应中,展现与转移的转座子末端序列互补的转座子末端序列的非转移链不接合或转移至靶DNA。
在一些实施方案中,转移链和非转移链共价接合。例如,在一些实施方案中,转移链序列和非转移链序列在单个寡核苷酸上提供,例如以发夹构型提供。因此,尽管非转移链的自由端未通过转座反应直接接合到靶DNA,但是非转移链变得间接附接到DNA片段,因为非转移链通过发夹结构的环连接到转移链。转座体结构以及制备和使用转座体的方法的附加示例可以在US 2010/0120098的公开内容中找到,其内容全文以引用方式并入本文。
在一些实施方案中,转座体复合物包含结合到第一多核苷酸的转座酶。在一些实施方案中,第一多核苷酸包含含有转座子末端序列的3'部分以及第一标签。
在一些实施方案中,转座体复合物包含第二多核苷酸,该第二多核苷酸包含与转座子末端序列互补的区域。
1.转座酶
如全文所用,术语转座酶是指一种酶,该酶能够与包含转座子的组合物(例如,转座子、转座子组合物)形成功能性复合物,并且在体外转座反应中,催化含转座子的组合物插入或转座到与其一起温育的双链靶核酸中。所提供的方法的转座酶还包括来自逆转录转座子和逆转录病毒的整合酶。可用于所提供方法的示例性转座酶包括野生型或突变形式的Tn5转座酶和MuA转座酶。
“转座反应”是其中一个或多个转座子在随机位点或几乎随机位点处插入靶核酸中的反应。转座反应中的基本组分是转座酶和DNA寡核苷酸,该DNA寡核苷酸表现出转座子的核苷酸序列,包括转移的转座子序列及其互补序列(即,非转移的转座子末端序列)以及形成功能性转座或转座体复合物所需的其他组分。本公开的方法通过采用由超高活性Tn5转座酶和Tn5型转座子末端或由MuA或HYPERMu转座酶以及包含Rl和R2末端序列的Mu转座子末端形成的转座复合物来例示(参见例如Goryshin,I.和Reznikoff,W.S.,J.Biol.Chem.,第273卷,第7367页,1998年;以及Mizuuchi,Cell,第35卷,第785页,1983年;Savilahti,H等人,EMBO J.,第14卷,第4893页,1995年;这些文献全文以引用方式并入本文)。然而,能够以随机或几乎随机的方式以足够的效率将转座子末端插入到标签靶核酸以用于其预期目的的任何转座体系均可用于所提供的方法中。可用于所提供的方法的已知转座体系的其他示例包括但不限于,金黄色葡萄球菌Tn552、Tyl、转座子Tn7、Tn/O和IS 10、Mariner转座酶、Tel、P因子、Tn3、细菌插入序列、逆转录病毒和酵母的逆转录酶(参见例如,Colegio O R等人,J.Bacteriol.,第183卷,第2384-2388页,2001年;Kirby C等人,Mol.Microbiol.,第43卷,第173-186页,2002年;Devine SE和Boeke J D.,Nucleic Acids Res.,第22卷,第3765-3772页,1994年;国际专利申请号WO 95/23875;Craig,N L,Science.,第271卷,第1512页,1996年;Craig,N L,Review in:Curr Top Microbiol Immunol.,第204卷,第27-48页,1996年;Kleckner N等人,Curr Top Microbiol Immunol.,第204卷,第49-82页,1996年;LampeD J等人,EMBO J.,第15卷,第5470-5479页,1996年;Plasterk R H,Curr Top MicrobiolImmunol,第204卷,第125-143页,1996年;Gloor,G B,Methods Mol.Biol,第260卷,第97-114页,2004年;Ichikawa H和Ohtsubo E.,JBiol.Chem.第265卷,第18829-18832页,1990年;Ohtsubo,F和Sekine,Y,Curr.Top.Microbiol.Immunol.第204卷,第1-26页,1996年;Brown P O等人,Proc Natl Acad Sci USA,第86卷,第2525-2529页,1989年;Boeke J D和Corces V G,Annu Rev Microbiol.第43卷,第403-434页,1989年;这些文献全文以引用方式并入本文)。
用于将转座子插入靶序列中的方法可使用任何合适的转座子体系在体外进行,对于该转座子体系,合适的体外转座体系是可用的或可基于本领域的知识开发。一般来讲,适用于本公开的方法的体外转座体系至少需要足够纯度、足够浓度和足够体外转座活性的转座酶以及转座子,转座酶与转座子形成功能性复合物,该功能性复合物具有能够催化转座反应的相应转座酶。可使用的合适的转座酶转座子末端序列包括但不限于野生型、衍生型或突变型转座子末端序列,其与选自野生型、衍生型或突变型转座酶的转座酶形成复合物。
在一些实施方案中,转座酶包括Tn5转座酶。在一些实施方案中,Tn5转座酶是超高活性Tn5转座酶。在一些实施方案中,与Tn5相比,转座酶对DNA:RNA双链体具有增加的活性。
2.失活的转座体
在一些实施方案中,转座体复合物在方法期间可逆地失活。在一些实施方案中,转座体复合物在将包含靶RNA的样品应用于具有转座体复合物和捕获寡核苷酸的固体载体时可逆地失活,并且在对DNA:RNA复合物进行片段化之前或之时活化。在一些实施方案中,转座体复合物在片段化之前或之时通过除去转座体去活化剂而被活化。可逆失活的方法中的任一种方法可与本文所述的方法一起使用,该方法包括DNA:RNA双链体或双链DNA的片段化。换句话说,本文所述的任何转座体复合物可以可逆地失活。在一些实施方案中,进行标签化包括活化先前处于可逆失活状态的转座体复合物。
在一些实施方案中,转座体复合物通过结合到转座体复合物的转座体去活化剂可逆地失活。在一些实施方案中,转座体去活化剂结合到转座体复合物的Tn5结合位点。
多种手段可以使转座体失活。在一些实施方案中,转座体去活化剂包含去磷酸化的ME’、额外的碱基、抑制剂双链体和/或热不稳定抗体。
在一些实施方案中,去磷酸化的ME’序列可被磷酸化以生成磷酸化的ME’序列并活化转座体。
在一些实施方案中,额外的碱基(即,核苷酸)邻近转座子末端序列以阻断与转座酶的缔合。在一些实施方案中,额外的碱基通过可切割接头与转座子末端序列分离。在一些实施方案中,用切割可切割接头的试剂处理生成活性转座体复合物。
在一些实施方案中,抑制剂双链体结合到转座体复合物的转座酶。
在一些实施方案中,热不稳定抗体是与转座体复合物的转座酶的DNA结合位点的复合物。在一些实施方案中,加热包含含有热不稳定抗体的失活的转座体的反应溶液,使得热不稳定抗体被灭活。一旦热不稳定抗体被灭活,转座体就可被活化。
3.溶液相转座体复合物
本文提出的方法还可包括以下步骤:在溶液中提供转座体复合物并且在DNA:RNA被转座体复合物溶液片段化的条件下使溶液相转座体复合物与固定片段接触;从而获得在溶液中具有一端的固定核酸片段。在一些实施方案中,溶液中的转座体复合物可包含第二标签,使得该方法生成具有第二标签的固定核酸片段,该第二标签在溶液中。第一标签和第二并且可以不同或相同。
在一些实施方案中,该方法还包括在DNA:RNA片段被溶液相转座体复合物进一步片段化的条件下,使溶液相转座体复合物与固定DNA:RNA片段接触;从而获得在溶液中具有一端的固定核酸片段。
在一些实施方案中,溶液相转座体复合物包含第二标签,从而在溶液中生成具有第二标签的固定核酸片段。在一些实施方案中,第一标签和第二标签是不同的。在一些实施方案中,至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的溶液相转座体复合物包含第二标签。
在一些实施方案中,表面结合的转座体的一种形式主要存在于固体载体上。例如,在一些实施方案中,存在于所述固体载体上的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的标签包含相同的标签结构域。在此类实施方案中,在与表面结合的转座体的初始标签化反应后,至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的桥结构在桥的每一端处包含相同的标签结构域。第二标签化反应可通过添加来自溶液的转座体来进行,该转座体进一步使桥片段化。在一些实施方案中,大部分或全部溶液相转座体包含与第一标签化反应中生成的桥结构上存在的标签结构域不同的标签结构域。例如,在一些实施方案中,存在于溶液相转座体中的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的标签包含与存在于在第一标签化反应中生成的桥结构上的标签结构域不同的标签结构域。
在一些实施方案中,模板的长度长于可以使用标准簇化学过程适当扩增的模板的长度。例如,在一些实施方案中,模板的长度为至少100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900bp、5000bp、10000bp、30000bp或100,000bp。在此类实施方案中,然后可以通过添加来自溶液的转座体来进行第二标签化反应,该转座体进一步使桥片段化,如US 9683230中所述,该专利全文并入本文。第二标签化反应可因此去除桥的内部跨度,留下锚定于表面的短残端,其可转化成簇,准备用于另外的测序步骤。在特定实施方案中,模板的长度可以在由选自上文例示的那些的上限和下限限定的范围内。
在一些实施方案中,溶液中的转座(即,用溶液相转座体复合物)可用于掺入可与捕获探针杂交的序列。以这种方式,标签化可用于生成可特异性地结合到在其表面上包含捕获探针的固体载体的片段。在一些实施方案中,将从RNA生成的cDNA或DNA:RNA双链体在溶液中标签化以掺入包含可与捕获探针杂交的序列的标签。在该标签化后,从cDNA或DNA:RNA双链体生成的片段可结合到包含捕获探针的固体载体上。在一些实施方案中,捕获探针包含P5或P7序列(或它们的互补物)。
C.包含捕获寡核苷酸的小珠
在一些实施方案中,将捕获寡核苷酸固定在固体载体上。在一些实施方案中,靶RNA的3'端结合到捕获寡核苷酸。在一些实施方案中,捕获寡核苷酸可用于将靶RNA固定在固体载体上。使用包含捕获寡核苷酸的小珠来捕获mRNA的示例性工作流程在图20中示出。
在一些实施方案中,捕获寡核苷酸包含聚T序列。
在一些实施方案中,靶RNA是mRNA,并且mRNA结合到包含聚T序列的捕获寡核苷酸。
在一些实施方案中,捕获寡核苷酸不包含聚T序列。
在一些实施方案中,捕获寡核苷酸经由P5或P7序列固定到小珠。
在一些实施方案中,捕获寡核苷酸还包含小珠代码或其他类型的条形码。如本文所用,“小珠代码”是存在于小珠上并且不同于小珠池中所有或大多数其他小珠的核酸序列。在一些实施方案中,珠代码可用于识别在相同小珠上生成的片段。
在一些实施方案中,捕获寡核苷酸中包含的序列在合成期间被掺入cDNA中。
在一些实施方案中,捕获寡核苷酸包含也存在于固定转座体的第一多核苷酸中包含的第一标签中的标签。
在一些实施方案中,固体载体不包含用于固定靶核酸的捕获寡核苷酸。例如,双链DNA和DNA:RNA双链体可通过结合到固定转座体复合物而固定在固体载体上。
D.多核苷酸和固定转座体复合物
在一些实施方案中,转座体复合物组合物包含至少一个转座子与除转座子序列外的一个或多个其他核苷酸序列,或由它们组成。此类核苷酸序列可称为多核苷酸。
在本文所示的方法和组合物中,转座体复合物固定到固体载体。在一些实施方案中,通过一种或多种多核苷酸,诸如包含转座子末端序列的多核苷酸,将转座体复合物固定到载体。在一些实施方案中,转座体复合物可经由将转座酶偶联到固体载体的接头分子固定。在一些实施方案中,转座酶和多核苷酸均固定到固体载体。当提及分子(例如,核酸)到固体载体的固定时,术语“固定的”和“附接的”在本文中可互换使用,并且除非另外明确地或通过上下文指明,否则这两个术语旨在涵盖直接或间接、共价或非共价附接。在一些实施方案中,可以使用共价附接,但一般来讲全部所需的是分子(例如,核酸)在旨在使用载体的条件下(例如,在需要核酸扩增和/或测序的应用中)保持固定或附接到载体。
在一些实施方案中,转座体复合物包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3'部分以及第一标签。在一些实施方案中,第一标签是DNA特异性条形码。
在一些实施方案中,转座体复合物包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3'部分以及第二标签。在一些实施方案中,第二标签是RNA特异性条形码。
因此,在一些实施方案中,转座子组合物包含具有转移的转座子序列的一个或多个其他核苷酸序列5'的转移链,例如标签序列。除了转移的转座子序列外,标签还可具有一个或多个其他标签部分或标签结构域。
如本文所用,“标签化”是指转座酶用于对核酸进行片段化和标记。标签化包括通过转座体复合物修饰DNA,该转座体复合物包含与包含转座子末端序列(本文称为转座子)的一个或多个标签(诸如衔接子序列)复合的转座酶。标签化因此可导致DNA的片段化和衔接子与双链体片段的两条链的5'端的连接同时发生。
在一些实施方案中,转座体复合物经由第一多核苷酸固定到固体载体。
在一些实施方案中,转座体复合物包含第二多核苷酸,该第二多核苷酸包含与转座子末端序列互补的区域。在一些实施方案中,转座体复合物经由第二多核苷酸固定到固体载体。
在一些实施方案中,转座体复合物以至少103、104、105或106个复合物/mm2的密度存在于固体载体上。
在一些实施方案中,固定文库中的双链片段的长度通过增加或降低固体载体上的转座体复合物的密度来调节。
在这些方法中可以使用许多不同类型的固定转座体,如US 9683230中所述,该专利全文并入本文。
E.核酸在小珠上的空间隔离的捕获
在一些实施方案中,使用包含捕获寡核苷酸的固体载体来捕获核酸。在一些实施方案中,核酸为RNA。在一些实施方案中,RNA是mRNA。在一些实施方案中,包含聚T序列的捕获寡核苷酸用于捕获mRNA。
在一些实施方案中,RNA被捕获在捕获小珠上。在一些实施方案中,RNA被捕获在RNA-BLT上。
在一些实施方案中,RNA被捕获在小滴内的固体载体上。在一些实施方案中,将包含靶RNA的样品应用于固体载体在小滴中进行。
在一些实施方案中,DNA被捕获在小滴内的固体载体上。在一些实施方案中,将包含靶DNA的样品应用于固体载体在小滴中进行。
1.小滴
在一些实施方案中,将包含靶RNA的样品应用于固体载体包括在小滴中与小珠一起提供单个细胞;裂解小滴中的细胞;从单个细胞释放靶RNA;以及将靶RNA捕获在小珠上。在一些实施方案中,在合成cDNA之前去除小滴。使用小滴的多种方法在本领域中是已知的,诸如公布WO 2015/168161和WO 2017/040306,其各自全文并入本文。来自样品的靶DNA可以类似地捕获在小珠(诸如BLT)上,并且然后去除小滴。
在一些实施方案中,在捕获小滴中的RNA后,在小珠上批量进行cDNA合成以生成cDNA的第一链(即,生成DNA:RNA双链体)。如本文所用,“批量”用于表示在小珠上进行的步骤,但这些小珠在溶液中且不被小滴分离。因此,当在将核酸捕获到小珠上之后批量进行方法步骤时,这些固定核酸不在溶液中,而是保持固定在小珠上。一般来讲,本文所述的所有方法允许在小滴中捕获RNA或DNA,而随后的步骤可以在小滴中进行或者批量进行。在一些实施方案中,标签化批量进行。
例如,图5示出代表性示例,其中在cDNA的第一链的合成期间掺入小珠代码(即,条形码)以在小滴中制备DNA:RNA双链体。小珠代码包含在捕获寡核苷酸中,该捕获寡核苷酸还包含聚T序列(以结合到mRNA的聚A尾)以及可用于将片段固定在固体表面上的P5衔接子序列。可将固定的DNA:RNA双链体批量标签化,然后进行链交换和连接。衔接子(诸如B'和P7')可添加到片段的自由端(未附接到小珠),诸如用溶液中的标签化或用PCR。
2.小滴中的条形码编码
在一些实施方案中,可通过将单独细胞隔离成小滴并掺入小珠代码来进行条形码编码。在一些实施方案中,基于包含在小滴中的小珠中的小珠代码,可以将小珠代码掺入文库片段中。在一些实施方案中,小滴用于空间分离样品。
在一些实施方案中,BLT包含固定寡核苷酸,该固定寡核苷酸包含小珠代码。在一些实施方案中,固定寡核苷酸包含第一转座子,该第一转座子包含小珠代码。在一些实施方案中,固定寡核苷酸包含小珠代码和用于结合到第二转座子的杂交序列。
在一些实施方案中,可将小珠代码掺入从来自样品的RNA生成的cDNA中。在一些实施方案中,可在标签化期间将小珠代码掺入文库片段中。
在一些实施方案中,小滴在乳液中彼此隔离。在一些实施方案中,使用小滴致动器来形成和/或操纵小滴。在一些实施方案中,一个或多个小滴包含不同组的含条形码的第一链合成引物。在一些实施方案中,每个小滴包含多个第一链合成引物,这些引物中的每个引物具有包括相同条形码的相同序列并且来自一个小滴的条形码与来自另一个小滴的条形码不同,而第一链合成引物的其余部分在小滴之间保持相同。因此,在这些实施方案中,条形码充当小滴以及小滴所包围的单个细胞的标识符。
在一些实施方案中,一个或多个小滴包含不同组的含UMI的第一链合成引物。因此,在每个小滴中裂解的每个单独细胞将可由每个小滴中的条形码识别。在一些实施方案中,基于小滴的条形码编码可通过将含有单个细胞的小滴与包含独特组条形码的其他小滴合并来进行。这种格式允许除了多壁格式中可用的之外的附加复用。在每个单独的小滴内进行第一链合成和模板转换。附加地或另选地,在一些实施方案中,可以在标签化之前合并小滴。附加地或另选地,在一些实施方案中,可以在PCR之后以及在标签化之前合并小滴。例如,在一些实施方案中,在单独小滴中进行第一链合成后,可以合并标记的cDNA,从而池化cDNA。
在一些实施方案中,样品和UMI条形码编码可通过用携带用于第一链合成的UMI和/或条形码标记引物的小珠隔离单独细胞来进行。在一些实施方案中,小珠在乳液中被隔离成小滴。在一些实施方案中,使用小滴致动器隔离和操纵小珠。在一些实施方案中,基于小珠的条形码编码可通过产生一组小珠来进行,每个小珠携带独特的一组或多组条形码。
3.在小滴中的BLT上使用核酸捕获的空间隔离
在一些实施方案中,将RNA捕获在小滴中的BLT上,并且然后在从BLT释放片段之前进行cDNA制备和片段化。可将细胞和捕获小珠共包封在小滴中,随后进行小滴中的裂解和mRNA捕获。然后,cDNA合成、标签化和连接也可以批量进行,其中所得文库片段保留在小珠上。代表性的方法在图7中示出,其中BLT是可活化的BLT,并且在cDNA批量合成后组装转座体。
在一些实施方案中,将DNA捕获在小滴中的BLT上,并且在从BLT释放片段之前进行片段化。
在一些实施方案中,文库片段由于转座酶(包含在BLT上的转座体复合物中)与片段的缔合而保留在小珠上。在一些实施方案中,片段保持固定在小珠上直到添加蛋白酶或SDS以从转座酶释放片段。在一些实施方案中,将具有固定的文库片段的小珠递送到用于测序的固体载体(诸如流通池),并且将文库从小珠释放。从捕获在流通池上的小珠的这样的释放将实现“流通池上的空间读段”,如图4所示,其中来自单个小珠的片段将彼此以紧密接近度释放。以这种方式,可以确定在流通池上呈紧密空间接近度的片段可能源自来自相同细胞的核酸。
在一些实施方案中,小滴中核酸的捕获以及随后在BLT上的文库制备允许从不同细胞中隔离片段,甚至在不存在条形码编码的情况下。
4.使用区室化固体载体的空间隔离
在一些实施方案中,区室化允许文库片段的空间分离以用于测序。在一些实施方案中,区室化允许来自原始样品中的DNA或RNA的片段在文库制备后紧密接近。在一些实施方案中,测序数据和接近度数据一起可用于确定样品中的起始DNA或RNA分子中包含的片段。
在一些实施方案中,使用包含微孔的固体载体进行区室化。在一些实施方案中,单个细胞在微孔中区室化。在一些实施方案中,细胞密度和体积的计算可用于稀释样品,使得大多数细胞在不含另一细胞的微孔中区室化。
图8示出代表性示例,其中可在包含微孔的流通池上进行聚T RNA捕获,从而允许每微孔捕获单个细胞。
在一些实施方案中,将包含靶RNA的样品应用于固体载体在固体载体上的微孔中进行。在一些实施方案中,将包含靶RNA的样品应用于固体载体包括裂解细胞并从微孔中的单个细胞释放靶RNA。在一些实施方案中,方法还包括释放DNA:RNA片段的固定文库并在同一微孔中对片段进行测序。以这种方式,定位到给定微孔的片段可表征为来自单个细胞。在一些实施方案中,测序数据允许基于用于测序的表面上的片段的空间接近度来分辨已被固定在相同固体载体上的片段。
在一些实施方案中,固体载体是包含微孔的流通池。
在一些实施方案中,包含微孔的流通池含有聚合物涂层。在一些实施方案中,流通池涂覆有共价附接的聚合物。在一些实施方案中,共价附接的聚合物是PAZAM。在一些实施方案中,聚合物涂层包含用于与寡核苷酸反应的反应性位点。这样的共价附接的聚合物描述于WO 2013/184796中,其全文以引用方式并入本文。在一些实施方案中,使用紫外光交联聚合物诸如PAZAM。
使用包含微孔的流通池的方法还可以使用专门的杂交缓冲液和衔接子阻断剂,如WO 2020/036991中所述,其全文以引用方式并入本文。
F.固体载体
在本文所示的方法和组合物中,转座体复合物固定到固体载体。在一些实施方案中,通过一种或多种多核苷酸,诸如包含转座子末端序列的多核苷酸,将转座体复合物和/或捕获寡核苷酸固定到载体。在一些实施方案中,转座体复合物可经由将转座酶偶联到固体载体的接头分子固定。在一些实施方案中,转座酶和多核苷酸均固定到固体载体。当提及分子(例如,核酸)到固体载体的固定时,术语“固定的”和“附接的”在本文中可互换使用,并且除非另外明确地或通过上下文指明,否则这两个术语旨在涵盖直接或间接、共价或非共价附接。在一些实施方案中,可以使用共价附接,但一般来讲全部所需的是分子(例如,核酸)在旨在使用载体的条件下(例如,在需要核酸扩增和/或测序的应用中)保持固定或附接到载体。
某些实施方案可利用由惰性基板或基质(例如,载玻片、聚合物小珠等)构成的固体载体,该惰性基板或基质已例如通过施加包含反应性基团的中间材料层或涂层被官能化,这些反应性基团允许共价附接到生物分子诸如多核苷酸。此类载体的示例包括但不限于负载在惰性基板(诸如玻璃)上的聚丙烯酰胺水凝胶,尤其是如WO 2005/065814和US2008/0280773中所述的聚丙烯酰胺水凝胶,这些文献的内容全文以引用方式并入本文。在此类实施方案中,生物分子(例如,多核苷酸)可直接共价附接到中间材料(例如,水凝胶),但该中间材料本身可非共价附接到基板或基质(例如,玻璃基板)。术语“共价附接到固体载体”应相应地被解释为涵盖这种类型的布置。
术语“固体表面”、“固体载体”和本文中的其他语法等同形式物是指适于或可被修饰成适于转座体复合物的附接的任何材料。如本领域技术人员将会理解的,可能的基板的数量非常大。可能的基板包括但不限于玻璃和改性或官能化的玻璃、塑料(包括丙烯酸类、聚苯乙烯以及苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM等)、多糖、尼龙或硝化纤维、陶瓷、树脂、二氧化硅或基于二氧化硅的材料(包括硅和改性硅)、碳、金属、无机玻璃、塑料、光纤束和各种其他聚合物。对于一些实施方案特别有用的固体载体和固体表面位于流通池装置内。示例性流通池在下文中进一步详细阐述。
在一些实施方案中,固体载体包括适于以有序图案固定转座体复合物的图案化表面。“图案化表面”是指在固体载体的暴露层中或该暴露层上的不同区域的布置。例如,区域中的一个或多个区域可以是存在一种或多种转座体复合物的特征。特征可由不存在转座体复合物的间隙区域分离。在一些实施方案中,图案可以为呈行和列形式的特征部的x-y格式。在一些实施方案中,图案可以为特征部和/或间隙区域的重复布置。在一些实施方案中,图案可以为特征部和/或间隙区域的随机布置。在一些实施方案中,转座体复合物随机分布在固体载体上。在一些实施方案中,转座体复合物分布在图案化表面上。可以用于本文阐述的方法和组合物中的示例性图案化表面描述于美国申请13/661,524和美国专利申请公布2012/0316086A1中,这些专利文献中的每一篇均以引用方式并入本文。
在一些实施方案中,固体载体在表面中包括孔或凹陷的阵列。这可如本领域通常已知的那样使用多种技术来制造,这些技术包括但不限于光刻、压印技术、模制技术和微蚀刻技术。本领域的技术人员将会知道,所使用的技术将取决于阵列衬底的组成和形状。
固体载体的组成和几何形状可以随其用途而变化。在一些实施方案中,固体载体是平面结构,诸如载玻片、芯片、微芯片和/或阵列。因此,基板底的表面可以为平面层的形式。在一些实施方案中,固体载体包括流通池的一个或多个表面。如本文所用,术语“流通池”是指包括固体表面的室,一种或多种流体试剂可流过该固体表面。可容易地用于本公开的方法中的流通池以及相关流体系统和检测平台的示例描述于例如以下中:Bentley等人,Nature,第456卷,第53-59页(2008年);WO 04/018497、US 7,057,026、WO 91/06678、WO 07/123744、US 7,329,492、US 7,211,414、US 7,315,019、US 7,405,281和US 2008/0108082,其中每一篇以引用方式并入本文。
在一些实施方案中,固体载体或其表面是非平面的,诸如管或容器的内表面或外表面。在一些实施方案中,固体载体包括微球或小珠。所谓“微球”或“小珠”或“颗粒”或语法等同形式在本文中是指小离散颗粒。合适的小珠组合物包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、顺磁性材料、氧化钍溶胶、碳石墨、二氧化钛、乳胶或交联葡聚糖(诸如琼脂糖凝胶)、纤维素、尼龙、交联胶束和特氟隆,以及本文概述的用于固体载体的任何其他材料都可使用。来自Bangs Laboratories,Fishers Ind.的“MicrosphereSelection Guide”是有用的指南。在某些实施方案中,微球为磁性微球或小珠。
小珠无需为球形的;可使用不规则的颗粒。另选地或除此之外,小珠可为多孔的。小珠尺寸在纳米(即,100nm)至毫米(即,1mm)的范围内,其中可使用0.2微米至200微米、或0.5微米至5微米的小珠,但在一些实施方案中可使用更小或更大的小珠。
这些表面结合的转座体的密度可以通过改变第一多核苷酸的密度或者通过添加到固体载体的转座酶的量来调节。例如,在一些实施方案中,转座体复合物以至少103、104、105或106个复合物/mm2的密度存在于固体载体上。
核酸与载体(无论刚性或半刚性)的附接可以通过共价或非共价连接发生。示例性连接在美国专利号6,737,236、7,259,258、7,375,234和7,427,678和美国专利公布号2011/0059865Al中阐述,其各自以引用方式并入本文。在一些实施方案中,核酸或其他反应组分可附接到凝胶或其他半固体载体,该凝胶或其他半固体载体继而附接或粘附到固相载体上。在此类实施方案中,核酸或其他反应组分将被理解为固相。
在一些实施方案中,固体载体包括微粒、小珠、平面载体、图案化表面或孔。在一些实施方案中,平面载体为管的内表面或外表面。
在一些实施方案中,固体载体具有制备的固定在其上的标记的RNA片段的文库。在一些实施方案中,固体载体具有制备的固定在其上的标记的DNA片段的文库。在一些实施方案中,使用多于一个固体载体在一个固体载体上生成标记的RNA片段的文库,并且在另一个固体载体上生成标记的DNA片段的文库。
在一些实施方案中,固体载体包含固定在其上的捕获寡核苷酸和第一多核苷酸,其中第一多核苷酸包含含有转座子末端序列的3’部分以及第一标签。在一些实施方案中,第一标签是DNA特异性条形码。在一些实施方案中,这种固体载体用于使DNA标签化并且被称为DNA小珠连接的转座体(DNA BLT)。
在一些实施方案中,固体载体还包含结合到第一多核苷酸以形成转座体复合物的转座酶。
在一些实施方案中,固体载体包含固定在其上的捕获寡核苷酸和第二多核苷酸,其中第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签。在一些实施方案中,第二标签是RNA特异性条形码。在一些实施方案中,这种固体载体用于使从RNA(ds-cDNA或DNA:RNA双链体)生成的核酸标签化,并且被称为RNA小珠连接的转座体(RNA BLT)。
在一些实施方案中,固体载体还包含结合到第二多核苷酸以形成转座体复合物的转座酶。
在一些实施方案中,固体载体包含根据本文所述的方法中的任一种方法制备的固定在其上的标记片段的文库。
在一些实施方案中,试剂盒包含如本文所述的固体载体。在一些实施方案中,试剂盒还包含转座酶。在一些实施方案中,试剂盒还包含逆转录酶聚合酶。在一些实施方案中,试剂盒还包含用于固定DNA的第二固体载体,该第二固体载体包含第二转座体复合物和第三多核苷酸,该第二转座体复合物包含转座酶,该第三多核苷酸包含含有转座子末端序列的3’部分以及任选第二标签。
G.DNA BLT和RNA BLT
在一些实施方案中,这些方法使用BLT(小珠连接的转座体)。结合到表面(例如,BLT)的转座体可使双链DNA的长分子标签化并在小珠或其他表面上产生模板文库(US9683230)。将转座体锚定到小珠给出了新的性质,诸如可控的插入物大小和产率。这是先前称为Illumina的Nextera技术的Illumina DNA Flex PCR-Free技术的基础。可以使双链DNA标签化的BLT可称为DNA-BLT。
由于转座子末端对DNA具有亲和力,所以DNA BLT不需要用于固定在小珠上的捕获寡核苷酸,而是可以使用包含转座子末端序列的多核苷酸来固定DNA。另选地,捕获寡核苷酸可用于捕获DNA分子。
在一些实施方案中,用于固定DNA的固体载体包含固定在其上的第一转座体复合物。在一些实施方案中,第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3'部分。在一些实施方案中,第一多核苷酸还包含第一标签。在一些实施方案中,第一标签是DNA特异性条形码。
在一些实施方案中,这些方法使用RNA BLT。如本文所用,“RNA BLT”是指用于制备源自样品中RNA的标记片段的BLT。因此,RNA BLT可从由RNA生成的核酸生成片段。在一些实施方案中,RNA BLT从由RNA生成的ds-cDNA生成片段(在合成cDNA的两条链后)。在一些实施方案中,RNA BLT从DNA:RNA双链体生成片段(其中仅产生cDNA的单链)。在一些实施方案中,RNA BLT用于掺入RNA特异性条形码,而DNA BLT用于掺入DNA特异性条形码,如图26至图28所示。
在一些实施方案中,用于固定从RNA生成的核酸(诸如ds-cDNA或DNA:RNA双链体)的固体载体包含固定在其上的第二转座体复合物。在一些实施方案中,第二转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3'部分。在一些实施方案中,该转座酶对于从DNA:RNA双链体生成片段具有增加的活性。在一些实施方案中,第一多核苷酸还包含第二标签。在一些实施方案中,第二标签是RNA特异性条形码。
1.可活化的BLT
在一些实施方案中,小珠可用于允许用户在他们选择时生成活性转座体。例如,允许在用户选择时从溶液中捕获转座体的小珠可以被称为“可活化的BLT”。可活化的BLT的共同方面是它们可以以下状态应用于样品:其中它们不能使核酸(诸如DNA:RNA双链体或双链cDNA)片段化,但是用户可以在他们选择时活化BLT。以这种方式,用户在多步骤方法中控制标签化的定时。一系列不同类型的可活化转座体在本文中描述并且可用于不同方法。图11A至图11C示出包含捕获寡核苷酸以及可通过ShortA序列结合来自溶液的转座体的寡核苷酸的小珠。图12示出其中第一转座子和第二转座子已经通过ShortA序列结合到小珠的实施方案。
在一些实施方案中,可活化的BLT避免不期望的标签化。例如,使用可活化的BLT可允许用户确保cDNA合成已经完成(诸如DNA:RNA双链体的生成),然后通过转座体进行标签化。以这种方式,用户可以避免“部分”DNA:RNA双链体的片段化(即,不完整DNA:RNA双链体的标签化,其中cDNA仅从RNA的一部分生成)。
可活化的BLT具有许多优点,诸如允许用户在多步骤方法中控制标签化的定时。在一些实施方案中,可活化的BLT可以对来自样品的DNA与由来自样品的RNA生成的cDNA或DNA:RNA双链体的标签化的步骤进行排序。这样的排序可允许标记源自DNA的片段与源自RNA的那些片段。
可活化的BLT可与固定在固体载体(诸如小珠)上的转座体一起用于本文所述的任何方法中。在一些实施方案中,可活化的BLT是DNA-BLT或RNA-BLT。
在一些实施方案中,可活化的RNA BLT用于捕获RNA,制备DNA:RNA双链体,并且然后使DNA:RNA双链体标签化。在一些实施方案中,可活化的BLT包含用于捕获mRNA的固定的聚T序列。
在一些实施方案中,固体载体包含捕获寡核苷酸和固定寡核苷酸,其中固定寡核苷酸包含用于与包含在转座体复合物中包含的第二转座子中的杂交序列杂交的序列。在一个实施方案中,固体载体为小珠。在一些实施方案中,固定寡核苷酸还包含小珠代码和/或一个或多个衔接子序列。在一些实施方案中,小珠包含在小珠的池中,其中每个小珠包含固定寡核苷酸,该寡核苷酸包含与包含在池中其他小珠中包含的固定寡核苷酸中的小珠代码相比不同的小珠代码。
在一些实施方案中,可活化的BLT包含可从溶液中捕获转座体的固定寡核苷酸。在一些实施方案中,可活化的BLT包含固定寡核苷酸,该固定寡核苷酸包含可结合到包含在转座体复合物中的转座子的杂交序列。
在一些实施方案中,可从溶液中捕获转座体的固定寡核苷酸包含衔接子序列(诸如P5或P7,或它们的互补物)、小珠条形码以及用于与转座体复合物的第二转座子中包含的序列杂交的序列。如图6至图7的代表性示例中所示,固定寡核苷酸可包含P5、小珠条形码(BC)以及用于与第二转座子(其中第二转座子包含A'-ME')中包含的序列(A')杂交的序列(短A)。固定寡核苷酸还可以包含测序衔接子序列(诸如A14或B15,或它们的互补物)。以这种方式,用户可以捕获mRNA并在小珠上制备DNA:RNA双链体,并且然后将转座体与小珠杂交以在同一小珠上制备cDNA片段。使用可活化的BLT意味着用户可以在制备DNA片段之前制备全长DNA:RNA双链体。以这种方式,可以避免部分DNA:RNA双链体的片段化,因为用户可以优化DNA:RNA双链体的条件并且不必担心片段化在cDNA的第一链的合成完成之前开始。
在一些实施方案中,可活化的RNA-BLT包含用于捕获mRNA的固定聚T序列以及用于从溶液中捕获转座体的固定寡核苷酸。在一些实施方案中,此类可活化的BLT可捕获mRNA并允许在小珠上制备DNA:RNA双链体,此后转座体可与固定寡核苷酸杂交并允许标签化。在一些实施方案中,仅一种类型的转座体与固定寡核苷酸杂交,因此允许在BLT上对称的标签化。
2.用于对称标签化的BLT
在一些实施方案中,所有转座体复合物包含相同的测序衔接子序列。在一些实施方案中,所有转座体复合物中包含的第一转座子是相同的。在一些实施方案中,固定在小珠上(诸如DNA-BLT或RNA-BLT上)的所有转座体复合物包含相同的第一转座子和第二转座子。这种转座体复合物(其中相同的衔接子序列可被添加到片段的两端)的使用可被称为“对称标签化”,因为这些转座体复合物将导致相同的衔接子被添加到通过标签化生成的双链片段的两条链的5'端。
在一些实施方案中,用转座体复合物对DNA:RNA双链体进行标签化是用包含第一转座子的转座体复合物进行的,该第一转座子包含相同的衔接子序列。在一些实施方案中,所有转座体复合物是相同的。
在一些实施方案中,用于制备RNA测序文库的BLT包含转座体复合物,该转座体复合物包含相同的一个或多个衔接子序列。在一些实施方案中,BLT的池中包含的所有转座体复合物中的转座子是相同的。在一些实施方案中,包含相同的一个或多个衔接子序列的BLT意指双链cDNA片段的两端均用相同的衔接子序列标记。在一些实施方案中,DNA:RNA双链体片段的双链cDNA片段的两个5'端掺入了相同的一个或多个衔接子。在一些实施方案中,双链cDNA的两端均包含相同的5'标签。
在一些实施方案中,与其中多于一种类型的转座体复合物用于标签化的标准不对称标签化步骤相比,使用对称标签化步骤的方法增加了可测序片段(即,每个片段在片段的每个末端具有不同的测序衔接子序列)的产率。使用具有不同标签的2种类型的转座体(A和B,诸如第一读取测序衔接子和第二读取测序衔接子)的不对称标签化导致从扩增的标签化产物中损失几乎一半的读段,因为产生了对称和不对称标记的产物(A-A、B-B、A-B、B-A),但只有A-B和B-A适用于随后的扩增和测序。相比之下,具有用于对称标签化的BLT的本发明可增加所得片段将包含第一读段测序衔接子和第二读段测序衔接子两者的概率。
在一些实施方案中,与其他文库制备方法相比,使用对称标签化的方法可增加文库的产量。
本文描述了用于在标签化后添加第二衔接子的多种不同方法。例如,可在标签化期间将第一读取测序衔接子掺入双链DNA或DNA:RNA双链体片段中,并且在随后的步骤中(诸如通过连接)掺入第二读取测序衔接子。本文将描述示例性方法。在一些实施方案中,本发明方法可通过经由对称标签化掺入一个测序衔接子序列以及经由使用包含第二测序衔接子序列的引物或寡核苷酸掺入另一个测序衔接子序列来提高文库产率(与使用不对称标签化的方法相比)。
3.用于不对称标签化的BLT
在一些实施方案中,用转座体复合物对DNA:RNA双链体进行标签化是用两种不同的转座体复合物进行的,其中不同的转座体复合物包含第一转座子,该第一转座子包含不同的衔接子序列。
使用两种不同的转座体复合物(其中不同的转座体复合物包含含有不同衔接子序列的第一转座子)可称为“不对称标签化”,因为这些转座体复合物可导致不同的衔接子被添加到通过标签化生成的双链片段的两条链的5'端。在一些实施方案中,不对称标签化可通过在标签化步骤期间掺入两个不同的衔接子而允许更快或更容易的工作流程。
在一些实施方案中,使用不对称标签化,至少一些片段在一条链的5’端处用第一读段序列衔接子序列标记,并且在另一条链的5’端处用第二读段序列衔接子序列标记。
4.包含捕获寡核苷酸的BLT
在一些实施方案中,固体载体包含转座体和捕获寡核苷酸。在一个实施方案中,固体载体为小珠。在一些实施方案中,小珠包含捕获寡核苷酸以及可包含在转座体中的第一多核苷酸。
在一些实施方案中,第一多核苷酸还包含小珠代码。在一些实施方案中,小珠包含在小珠的池中,其中每个小珠包含固定的第一多核苷酸,该第一多核苷酸包含与池中其他小珠中包含的小珠代码相比不同的小珠代码。
在一些实施方案中,BLT还包含捕获寡核苷酸,其中此类小珠可用于捕获RNA,随后制备cDNA的第一链以生成固定的DNA:RNA双链体和小珠,并最终从DNA:RNA双链体制备固定片段。在一些实施方案中,捕获寡核苷酸是用于捕获mRNA的聚T序列,并且小珠允许在用于捕获mRNA的相同小珠上制备文库。在这些实施方案中的任一个实施方案中,还可以在捕获mRNA以制备双链cDNA之后制备cDNA的第二链。
在一些实施方案中,包含捕获寡核苷酸的BLT是包含固定寡核苷酸的可活化的BLT,该固定寡核苷酸包含可用于与转座体复合物杂交的杂交序列。
图11A至图11C示出DNA:RNA双链体的制备(图11A),转座子与包含用于生成转座体复合物的杂交序列的固定寡核苷酸的杂交(图11B),以及由转座体复合物介导的多重标签化反应(图11C)。在通过标签化制备多个片段后,如本文所述的方法(诸如对称标签化后的引物延伸)可用于掺入附加衔接子并制备可测序片段。
图12示出用于全长mRNA制备的小珠,其具有多个捕获寡核苷酸以及固定转座体的多个固定寡核苷酸。图13示出多个转座体可如何允许从由mRNA生成的全长DNA:RNA双链体制备片段。
H.通过BLT将文库片段递送到用于测序的表面
在一些实施方案中,使用具有固定文库片段的固体载体将文库片段递送到用于测序的表面。在一些实施方案中,用于测序的表面是流通池。图9和图10总结了可如何在BLT上进行标签化和文库制备,随后在流通池或管中释放片段。图9使用聚T引物从全长mRNA制备文库,而图10使用随机引物制备文库全长总RNA。
在一些实施方案中,将固体载体上的片段的文库递送到用于测序的表面,同时将片段固定在固体载体上,并且然后将片段释放并捕获在用于测序的表面上。在一些实施方案中,将具有固定核酸的固体载体递送到用于测序的表面,通过标签化在固体载体上生成固定片段的文库,并且然后将片段释放并捕获在用于测序的表面上。
在一些实施方案中,一种方法包括在递送后,在用于测序的表面上捕获具有DNA:RNA片段的固定文库的固体载体;从固体载体释放固定片段;以及在用于测序的表面上捕获片段。在一些实施方案中,方法还包括对用于测序的表面上的片段进行测序。
在一些实施方案中,BLT可用作固相载体。BLT作为固相载体的示例性用途在WO2015/095226中描述,其全文并入本文。在一些实施方案中,从BLT释放的片段可以被重新捕获在表面的区域上,该区域靠近小珠被捕获在用于测序的表面上的位点。以这种方式,来自给定小珠的所有片段将在用于测序的表面上以紧密接近度被捕获。
在一些实施方案中,可将具有固定文库片段的BLT递送到用于测序的表面。在一些实施方案中,BLT的表面上的DNA或DNA:RNA双链体在BLT被递送到用于测序的表面之前可能已经被标签化。例如,在BLT上的标签化可以在反应容器中发生,BLT接下来被递送到流通池,并且然后片段被释放并被捕获在流通池上。
在一些实施方案中,可将具有固定核酸的BLT递送到用于测序的表面。在该递送之后,可以生成文库片段。例如,可以将双链DNA或DNA:RNA双链体固定到BLT的表面,并且在将BLT递送到用于测序的表面后进行标签化。例如,在BLT上的标签化可以发生在流通池中,此后片段被释放并被捕获在流通池上。
片段从BLT的释放可通过多种方法进行。例如,可通过蛋白酶或SDS处理释放片段。另选地,可通过破坏小珠来产生片段,这从BLT释放片段。在用于释放片段的这些机制中的任一者中,来自给定小珠的片段可以以紧密接近度释放并捕获在用于测序的表面(诸如流通池)上,以帮助制备原始DNA或RNA分子的序列的物理图谱。
在一些实施方案中,BLT可包含水凝胶小珠。在一些实施方案中,可将水凝胶小珠熔融或溶解以释放附接到小珠的片段,诸如公布号WO 2019/028047和WO 2019/028166中公开的方法,这些公布全文并入本文。
在一些实施方案中,BLT可包含可降解的聚酯小珠。在一些实施方案中,聚酯小珠可以降解以释放附接到小珠的片段,诸如申请号WO PCT/US2021/040612中公开的方法,该申请全文并入本文。例如,每个转座体复合物可包含允许多核苷酸结合到另一种试剂的多核苷酸结合部分。在一些实施方案中,多核苷酸结合部分用于将多核苷酸结合到包含小珠结合部分的小珠。在一些实施方案中,每个小珠结合部分通过接头共价结合到聚酯小珠。在一些实施方案中,接头包含-N=CH-(CH2)3-CH=N-、-C(O)NH-(CH2)6-N=或-C(O)NH-(CH2)6-N=CH-(CH2)3CH=N-。
在一些实施方案中,可降解聚酯小珠被大于50℃、大于60℃、大于70℃或大于80℃的温度降解。在一些实施方案中,可降解聚酯小珠被60℃的温度降解。在一些实施方案中,可降解聚酯小珠被碱水溶液降解。在一些实施方案中,碱水溶液是NaOH。在一些实施方案中,NaOH是1M-5MNaOH。在一些实施方案中,NaOH是3M NaOH(参见Yeo等人,J Biomed MaterRes B Appl Biomater,第87卷,第2期,第562-569页(2008年))。在一些实施方案中,可降解聚酯小珠被NaOH水溶液在50℃至90℃的温度下降解。
在一些实施方案中,可通过重力沉降允许具有固定核酸或其片段的BLT接触用于测序的表面。在一些实施方案中,可使用受体和配体将具有固定核酸或其片段的BLT附接到用于测序的表面。
在一些实施方案中,接近度数据可与关于片段的测序数据一起使用以生成关于包含在样品中的给定DNA或RNA的信息,因为来自由RNA生成的DNA或cDNA的所有片段将在相同小珠上生成。接近度数据用于制备固定多核苷酸的物理图谱的用途可使用本文所述的方法进行。
I.BLT上的对称标签化后的引物延伸
在一些实施方案中,BLT上的对称标签化导致双链DNA片段的两端具有相同的一个或多个衔接子序列。
在一些实施方案中,将非转移的ME’序列(来自第二转座子)熔融掉,并在标签化后通过PCR延伸填充间隙。在一些实施方案中,通过升高反应的温度来去除ME’序列。
在一些实施方案中,在去除非转移的ME’序列之后进行间隙填充。在一些实施方案中,将引物与间隙填充的ME’序列退火。在一些实施方案中,该引物用于延伸并且可被称为延伸引物。在一些实施方案中,延伸引物包含ME序列。在一些实施方案中,包含在延伸引物中的ME序列与间隙填充的ME’序列杂交。
在一些实施方案中,延伸引物还包含测序衔接子序列。在一些实施方案中,包含在延伸引物中的序列衔接子序列不包含在转座体复合物中。在一些实施方案中,用延伸引物进行的延伸生成在双链片段的每一端处包含不同测序衔接子序列的片段。
在一些实施方案中,尿嘧啶不耐受的DNA用于引物延伸。在一些实施方案中,基于上述链特异性cDNA制备,不延伸cDNA的第二链,因为其包含尿嘧啶。
在一些实施方案中,如果转座体复合物包含A14序列(或其互补物),则延伸引物包含B15(或其互补物)。在一些实施方案中,如果转座体复合物包含B15序列(或其互补物),则延伸引物包含A14(或其互补物)。在这些代表性示例中,A14和15仅代表示例性测序衔接子序列,并且本发明方法不限于此类衔接子序列。任何组的感兴趣的成对衔接子序列可用于转座体复合物和延伸引物中,并且本领域技术人员将充分了解如何在不同平台上进行测序并且此类平台可随时间推移而演变。
1.用合成DNA对DNA BLT的饱和
在一些实施方案中,在DNA BLT(诸如在一些方法中可用作第一固体载体的那些)用于进行标签化以生成包含DNA特异性条形码的片段后,DNA BLT与合成双链DNA结合。在一些实施方案中,DNA BLT用合成双链DNA饱和。在一些实施方案中,该方法包括在第一固体载体上进行标签化之后向第一固体载体添加合成双链DNA。
在一些实施方案中,DNA BLT在该饱和后不能结合(和标签化)核酸。DNA BLT的这种饱和可以允许分步方法,该方法接下来从RNA生成cDNA或DNA:RNA双链体,以用于在第二固体载体上进行标签化。在一些实施方案中,cDNA或DNA:RNA双链体不能被饱和的DNA BLT标签化。相反,cDNA或DNA:RNA双链体可在第二固体载体(即,RNA BLT)上标签化,从而允许从cDNA或DNA:RNA双链体生成的片段用RNA特异性条形码标记。在一些实施方案中,合成双链DNA包含尿嘧啶,其阻断某些高保真DNA聚合酶对标记片段的扩增。
在一些实施方案中,用合成双链DNA对DNA BLT的饱和可允许在单个反应容器中完成的方法。在一些实施方案中,用合成双链DNA对DNA BLT的饱和避免了在对来自样品的DNA进行标签化后分开DNA BLT的需要。
J.标签以及DNA特异性条形码和RNA特异性条形码
如本文所用,术语“标签”和“标签结构域”是指多核苷酸的表现出用于期望的预期目的或应用的序列的部分或结构域。本文提出的一些实施方案包括包含多核苷酸的转座体复合物,该多核苷酸具有包括转座子末端序列的3'部分和标签,该标签包含标签结构域。标签结构域可以包含针对任何期望目的提供的任何序列。例如,在一些实施方案中,标签结构域包含一个或多个限制性内切核酸酶识别位点。在一些实施方案中,标签结构域包含一个或多个适用于与用于簇扩增反应的引物杂交的区域。在一些实施方案中,标签结构域包含一个或多个适用于与用于测序反应的引物杂交的区域。应当理解,可以将任何其他合适的特征结合到标签结构域中。在一些实施方案中,标签结构域包含长度为5bp至200bp的序列。在一些实施方案中,标签结构域包含长度为10bp至100bp的序列。在一些实施方案中,标签结构域包含长度为20bp至50bp的序列。在一些实施方案中,标签结构域包含长度为5bp、6bp、7bp、8bp、9bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、150bp或200bp的序列。
根据需要或期望,标签可包括一种或多种功能序列或组分(例如,引物序列、锚定序列、通用序列、间隔区或索引标签序列)。
在一些实施方案中,至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的第一标签包含相同的标签结构域。在一些实施方案中,标签包含用于簇扩增的区域。在一些实施方案中,标签包含用于引发测序反应的区域。
在一些实施方案中,该方法还包括通过使聚合酶和对应于第一多核苷酸的一部分的扩增引物反应来扩增固体载体上的片段。在一些实施方案中,第一多核苷酸的一部分包含扩增引物。在一些实施方案中,第一多核苷酸的第一标签包含扩增引物。
在一些实施方案中,单独小珠上的转座体携带独特的索引,并且如果采用多个此类索引小珠,则将产生定相转录物。在与包含RNA和DNA的样品一起使用的一些实施方案中,RNA BLT包含标签,该标签是用于识别RNA BLT(“iRNA”)的索引。在与包含RNA和DNA的样品一起使用的一些实施方案中,DNA BLT包含标签,该标签是用于识别DNA BLT(“iDNA”)的索引。用于识别RNA BLT的索引可被称为“RNA特异性条形码”,并且用于识别DNA BLT的索引可称为“DNA特异性条形码”。使用DNA BLT和RNA BLT的示例性方法在图21至图25中示出。
在一些实施方案中,第一多核苷酸包含第一标签。在一些实施方案中,第二多核苷酸包含第二标签。
在一些实施方案中,第一标签或第二标签包含A14引物序列。在一些实施方案中,第一标签或第二标签包含B15引物序列。
在一些实施方案中,在标签化期间掺入的标签包含衔接子序列。在一些实施方案中,衔接子序列可在标签化期间,在第一链cDNA合成期间,或在标签化后经由引物添加。
在一些实施方案中,衔接子序列包含引物序列、索引标签序列、捕获序列、条形码序列、切割序列或测序相关序列或它们的组合。如本文所用,测序相关序列可以是与随后的测序步骤相关的任何序列。测序相关序列可用于简化下游测序步骤。例如,测序相关序列可以是通过将衔接子连接到核酸片段的步骤而以其他方式掺入的序列。在一些实施方案中,衔接子序列包含P5或P7序列(或它们的互补物)以在某些测序方法中促进与流通池的结合。本公开不限于可以使用的衔接子序列的类型,并且技术人员将认识到可用于文库制备和下一代测序的另外的序列。
在一些实施方案中,在标签化期间掺入第一读段测序衔接子序列,并且在标签化后经由引物掺入第二读段测序衔接子序列。不同的测序方案使用不同的“第一读段测序衔接子”和“第二读段测序衔接子”,并且这些衔接子随制造商和装备而变化。换句话说,对于给定的测序方法,测序读段的顺序和同一性是任意的。因此,本文所用的“第一读段”和“第二读段”测序衔接子仅需要两个读段测序衔接子的存在;它们不需要在制备测序文库后在任何下游测序方法中必须将特异性衔接子用于第一测序读段与第二测序读段。本领域技术人员可以选择首先用“第二读段”测序衔接子运行下游测序反应,并且然后用“第一读段”测序衔接子运行该反应,如果他们这样选择的话。
在一些实施方案中,第一读段测序衔接子序列和/或第二读段测序衔接子序列包含不同的引物结合位点。
K.逆转录酶聚合酶和cDNA合成反应
在一些实施方案中,将逆转录酶聚合酶用于cDNA合成。如本文所用,“逆转录酶聚合酶”是指可使用RNA作为模板催化DNA合成的任何RNA依赖性DNA聚合酶。逆转录酶聚合酶可用于从RNA合成互补DNA(cDNA)的第一链。在一些实施方案中,固定RNA分子通过逆转录酶聚合酶转化为DNA:RNA双链体。
在一些实施方案中,逆转录酶聚合酶仅生成cDNA的单链。在一些实施方案中,cDNA的单链结合到靶RNA,即,使用逆转录酶聚合酶从靶RNA生成DNA:RNA双链体。
在一些实施方案中,逆转录酶聚合酶生成cDNA的两条链,即,逆转录酶生成双链(ds)cDNA。
在一些实施方案中,逆转录酶聚合酶是M-MLV逆转录酶。
在一些实施方案中,用于cDNA合成的试剂包括逆转录酶、随机引物、寡dT引物、dNTP和/或RNA酶抑制剂。在一些实施方案中,随机引物和寡dT引物两者均用于cDNA合成反应。
在一些实施方案中,在将RNA固定(即,捕获)在小珠上之后进行逆转录。在一些实施方案中,逆转录在溶液中进行。
1.使用模板转换制备cDNA
在一些实施方案中(诸如图16),通过模板转换从RNA制备双链cDNA,如WO 2017/040306、WO 2015/168161和WO 2010/117620中所述,这些专利全文以引用方式并入本文。简言之,寡(dT)和/或随机引物引发第一链cDNA合成反应。当逆转录酶(诸如SMARTSCRIBETM)到达mRNA的5'端时,酶的末端转移酶活性将若干附加非模版核苷酸添加到cDNA的3'端。被设计成与该非模板核苷酸序列碱基配对的模板转换寡核苷酸(TSO)退火并产生延伸的模板以使逆转录酶能够继续复制到寡核苷酸的末端。
在一些实施方案中,使用模板转换寡核苷酸引物(TSO引物)合成cDNA的第二链。在一些实施方案中,TSO引物还包含第二扩增引物结合位点。在一些实施方案中,第一链合成引物延伸超过mRNA模板并进一步复制TSO引物链。在一些实施方案中,使用TSO引物合成cDNA的第二链。在一些实施方案中,使用与cDNA的延伸超过mRNA模板以包含互补TSO链的第一链互补的第二扩增引物合成cDNA的第二链。
采用模板转换寡核苷酸和相容逆转录酶的示例性系统是SMRT-seq(Takara Bio)。
2.链cDNA的制备
本领域中已知多种方法,这些方法允许测序数据识别作为文库片段来源的mRNA链。此类“链”方法的使用可允许用户使用cDNA的第一链的序列来确定原始mRNA链的序列(而不混淆来自cDNA的第二链的数据)。
链cDNA制备的示例性方法在“TruSeq Stranded Total RNA Reference Guide,”Illumina(2017年)中概述。在第一链合成放线菌素混合物中使用逆转录酶将mRNA复制到cDNA的第一链中,这允许RNA依赖性合成并防止不期望的DNA依赖性合成。当生成cDNA的第一链时,第一链合成放线菌素混合物可以改善链特异性。在第二链标记混合物中使用DNA聚合酶I和RNA酶H进行第二链cDNA合成,其中dTTP已被dUTP替换。当使用尿嘧啶不耐受DNA聚合酶时,dUTP在cDNA的第二链中的掺入可淬灭该链的扩增(如下文在扩增描述中所述)。
在一些实施方案中,包含在用于第一链cDNA合成的组合物中的核苷三磷酸包含dCTP、dATP、dGTP和dTTP。
在一些实施方案中,为了链特异性,在第二链cDNA合成反应中用dUTP替换dTTP。在一些实施方案中,用于第二链cDNA合成的组合物包含dCTP、dATP、dGTP和dUTP。在一些实施方案中,在cDNA的第二链中掺入dUTP抑制了文库制备期间在索引PCR反应中cDNA的第二链的扩增。在一些实施方案中,抑制cDNA的第二链的扩增允许链特异性方法。
在一些实施方案中,通过的确保留来自mRNA的链信息的非链方法进行cDNA制备。
L.链交换和间隙-填充连接
在通过固定转座体使DNA:RNA双链体片段化后,可使用链置换聚合酶(例如,Bst聚合酶)来置换DNA:RNA片段的RNA链并生成第二cDNA链。在一些实施方案中,链交换用于产生双链DNA片段。在一些实施方案中,链交换步骤从DNA:RNA双链体去除片段的RNA链并且用DNA的第二链替换RNA。在一些实施方案中,经由链置换聚合酶的链交换转化双链DNA片段中包含DNA:RNA的片段。
在一些实施方案中,转座事件后留下的DNA序列中的间隙也可使用链置换延伸反应来填充,这样的反应包含Bst DNA聚合酶和dNTP混合物。在一些实施方案中,使用延伸-连接混合缓冲液进行间隙-填充连接。
然后可以任选地扩增双链DNA片段的文库(诸如用簇扩增)并用测序引物对其进行测序。
M.扩增
本公开还涉及对根据本文提供的方法产生的固定DNA片段进行扩增。可以根据本领域已知的任何合适的扩增方法扩增由表面结合的转座体介导的标签化产生的固定DNA片段。在一些实施方案中,在固体载体上扩增固定DNA片段。在一些实施方案中,固体载体与在其上发生表面结合的标签化的固体载体相同。在此类实施方案中,本文提供的方法和组合物允许在来自初始样本引入步骤的相同固体载体上通过扩增且任选地通过测序步骤进行样本制备。
例如,在一些实施方案中,使用簇扩增方法扩增固定DNA片段,如美国专利号7,985,565和7,115,400的公开内容所例示,这些专利中的每一篇的内容全文以引用方式并入本文。美国专利7,985,565和7,115,400的并入材料描述了固相核酸扩增的方法,这些方法允许扩增产物固定在固体载体上以便形成由固定核酸分子的簇或“集群”构成的阵列。此类阵列上的每个簇或集群由多个相同的固定多核苷酸链和多个相同的固定互补多核苷酸链形成。如此形成的阵列在本文中通常被称为“簇阵列”。固相扩增反应的产物(诸如美国专利号7,985,565和7,115,400中描述的那些)是所谓的“桥接”结构,这些结构通过对成对的固定多核苷酸链和固定互补链(两条链在一些实施方案中经由共价附接在5'端处固定在固体载体上)进行退火形成。簇扩增方法是其中固定核酸模板用于产生固定扩增子的方法的示例。也可使用其他合适的方法由根据本文提供的方法产生的固定化DNA片段产生固定化扩增子。例如,无论每对扩增引物中的一个或两个引物是否被固定,都可以经由固相PCR形成一个或多个簇或集群。
在其他实施方案中,在溶液中扩增固定DNA片段。例如,在一些实施方案中,固定DNA片段被切割或以其他方式从固体载体释放,然后扩增引物在溶液中与释放的分子杂交。在其他实施方案中,扩增引物与固定DNA片段杂交以进行一个或多个初始扩增步骤,随后在溶液中进行后续扩增步骤。因此,在一些实施方案中,固定核酸模板可以用于产生溶液相扩增子。
应当理解,本文所述或本领域公知的任一种扩增方法可以与通用引物或目标特异性引物一起用于扩增固定DNA片段。用于扩增的合适方法包括但不限于聚合酶链反应(PCR)、链置换扩增(SDA)、转录介导的扩增(TMA)和基于核酸序列的扩增(NASBA),如美国专利号8,003,354中所述,该专利全文以引用方式并入本文。上述扩增方法可用于扩增一种或多种感兴趣核酸。例如,可利用PCR(包括多重PCR)、SDA、TMA、NASBA等扩增固定DNA片段。在一些实施方案中,在扩增反应中包括特异性针对感兴趣核酸的引物。
其他合适的核酸扩增方法可包括寡核苷酸延伸和连接、滚环扩增(RCA)(Lizardi等人,Nat.Genet.第19卷,第225-232页(1998年),其以引用方式并入本文)和寡核苷酸连接测定(OLA)(通常参见美国专利号7,582,420、5,185,243、5,679,524和5,573,907,EP 0 320308 B1,EP 0336 731B1,EP 0 439 182 B1,WO 90/01069,WO 89/12696和WO 89/09835,所有这些专利以引用方式并入)技术。应当理解,这些扩增方法可被设计成用于扩增固定DNA片段。例如,在一些实施方案中,扩增方法可包括连接探针扩增或含有特异性针对感兴趣核酸的引物的寡核苷酸连接测定(OLA)反应。在一些实施方案中,扩增方法可包括引物延伸-连接反应,该引物延伸-连接反应包含特异性针对感兴趣核酸的引物。作为可被特别设计用于扩增感兴趣的核酸的引物延伸和连接引物的非限制性示例,扩增可包括用于GoldenGate测定(Illumina,Inc.,San Diego,CA)的引物,如美国专利第7,582,420号和第7,611,869号所示例,这两篇专利中的每一篇专利全文均以引用方式并入本文。
在本公开的方法中可使用的示例性等温扩增方法包括但不限于多重置换扩增(MDA),由例如Dean等人,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)所示例的多重置换扩增(MDA),或由例如美国专利第6,214,587号所示例的等温链置换核酸扩增,这两篇文献中的每篇文献全文以引用方式并入本文。可用于本公开的其他非基于PCR的方法包括:例如链置换扩增(SDA),其描述于例如Walker等人,Molecular Methods for Virus Detection,Academic Press,Inc.,1995年;美国专利号5,455,166和5,130,238,以及Walker等人,Nucl.Acids Res,第20卷:第1691-1696页(1992年);或超支化链置换扩增,其描述于例如Lage等人,Genome Research,第13卷,第294-307页(2003年)中,这些文献中的每篇文献均全文以引用方式并入本文。等温扩增方法可与链置换Phi 29聚合酶或Bst DNA聚合酶大片段5’->3’exo-一起用于基因组DNA的随机引物扩增。这些聚合酶的使用利用了它们的高持续合成能力和链置换活性。高持续合成能力允许聚合酶产生长度为10kb-20kb的片段。如上所述,可使用具有低持续合成能力和链置换活性的聚合酶(诸如Klenow聚合酶)在等温条件下产生较小的片段。对扩增反应、条件和组分的附加描述在美国专利7,670,810的公开内容中详细阐述,该专利以引用方式全文并入本文。
可用于本公开的另一种核酸扩增方法是标记的PCR,其使用具有恒定5'区,接着是随机3'区的二结构域引物的群体,如例如Grothues等人,Nucleic Acids Res,第21卷第5期:第1321-1322页(1993年)中所述,该专利全文以引用方式并入本文。基于来自随机合成的3'区的单独杂交,进行第一轮扩增以允许大量启动热变性的DNA。由于3'区的性质,设想启动位点在整个基因组中是随机的。然后,可移除未结合的引物,并且可使用与恒定5'区互补的引物进行进一步的复制。
1.用尿嘧啶不耐受的DNA聚合酶进行的扩增
在一些实施方案中,在对第一固体载体(诸如DNA小珠连接的转座体(BLT))上的DNA进行标签化以将DNA特异性条形码掺入DNA片段中之后,将合成双链DNA添加到第一固体载体。在一些实施方案中,合成双链DNA结合到第一固体载体上尚未被DNA片段结合的任何转座体复合物。在一些实施方案中,合成的双链DNA是不能随后扩增的“自杀DNA”。在一些实施方案中,合成的双链DNA包含尿嘧啶,并且尿嘧啶不耐受DNA聚合酶用于随后的步骤中的扩增(参见例如图27和图28中概述的方法)。
在一些实施方案中,尿嘧啶不耐受DNA聚合酶是高保真或校对DNA聚合酶。本领域技术人员将意识到,许多校对DNA聚合酶不能扩增含尿嘧啶的模板,这是由于在模板链中检测尿嘧啶残基并阻止进一步的DNA合成的“尿嘧啶结合袋”(参见“Thermo ScientificPhusion DNA Polymerases,”Thermo Fisher,2015年)。在一些实施方案中,高保真DNA聚合酶是KAPA HiFi HotStart(Roche)或Phusion(Thermo Fisher)。尿嘧啶不耐受的聚合酶的用途还描述于申请号PCT/US2021/036599和Mulqueen等人,High-content single-cellcombinatorial indexing,bioRxiv preprint(可在doi.org/10.1101/2021.01.11.425995查看,发表于2021年1月12日),其中每一篇全文以引用方式并入本文。在一些实施方案中,转座体复合物包含紧接在嵌合末端序列之后的尿嘧啶碱基,并且尿嘧啶不耐受聚合酶的使用防止延伸超过嵌合末端,如Mulqueen等人所述。
类似地,尿嘧啶不耐受DNA聚合酶可用于cDNA制备的链方法中。在一些实施方案中,当使用尿嘧啶不耐受的DNA聚合酶时,由样品中的RNA制备的cDNA的第二链中尿嘧啶的存在可猝灭该第二链的扩增。以这种方式,扩增的cDNA限于从cDNA的第一链生成的cDNA,并且允许识别包含在样品中的mRNA链。
2.选择性扩增
在一些实施方案中,DNA特异性条形码和RNA特异性条形码允许选择性扩增。“选择性扩增”是指源自样品中DNA的片段(即,用DNA特异性条形码标记的片段)的扩增或源自样品中RNA的片段(即,用RNA特异性条形码标记的片段)的扩增。选择性扩增允许用户仅扩增(和潜在地测序)源自DNA的片段或源自RNA的片段。另选地,用户可以选择扩增源自DNA和RNA的片段。
取决于用户的实验目标,仅来自给定样品的DNA或RNA可能是感兴趣的。另选地,用户可能期望样品的多组学分析以评估DNA和RNA两者。
在一些实施方案中,DNA特异性条形码和RNA特异性条形码包含不同的引物结合序列。在一些实施方案中,该方法还包括使用结合包含在DNA特异性条形码中的引物结合序列的引物来扩增包含DNA特异性条形码的标记片段。在一些实施方案中,该方法还包括使用结合包含在RNA特异性条形码中的引物结合序列的引物来扩增包含RNA特异性条形码的标记片段。在一些实施方案中,该方法还包括使用引物混合物扩增包含DNA特异性条形码的标记片段和包含RNA特异性条形码的标记片段,该引物混合物包含结合包含在DNA特异性条形码中的引物结合序列的引物和结合包含在RNA特异性条形码中的引物结合序列的引物。
N.测序
本公开还涉及对根据本文提供的方法产生的固定DNA片段进行测序。在一些实施方案中,该方法包括对标记片段或扩增的标记片段进行测序。固定DNA片段可以是从样品中包含的dsDNA生成的那些固定DNA片段,从样品中包含的RNA生成的ds-cDNA,或者从样品中包含的RNA生成的DNA:RNA双链体的标签化后的链交换生成的ds-DNA。在一些实施方案中,固定DNA片段可包含DNA特异性条形码或RNA特异性条形码,使得测序后的生物信息学解析可区分源自样品的DNA的那些片段与源自样品的RNA的那些片段。
在一些实施方案中,对DNA:RNA双链体的片段进行直接测序而不进行链交换。
可以根据任何合适的测序方法(诸如直接测序,包括合成测序、连接测序、杂交测序、纳米孔测序等)对通过表面结合的转座体介导的标签化产生的固定DNA片段进行测序。在一些实施方案中,在固体载体上对固定DNA片段进行测序。在一些实施方案中,用于测序的固体载体与在其上发生表面结合的标签化的固体载体相同。在一些实施方案中,用于测序的固体载体与在其上发生扩增的固体载体相同。
一种示例性测序方法是合成测序(SBS)。在SBS中,监测核酸引物沿核酸模板(例如,靶核酸或其扩增子)的延伸,以确定模板中核苷酸的序列。基础化学过程可以是聚合(例如,由聚合酶催化)。在特定的基于聚合酶的SBS实施方案中,以模板依赖性方式将荧光标记的核苷酸添加到引物(从而使引物延伸),使得对添加到引物中的核苷酸的顺序和类型的检测可以用于确定模板的序列。
流通池为容纳通过本公开的方法产生的扩增DNA片段提供了方便的固体载体。可以使这种格式的一种或多种扩增DNA片段经受SBS或涉及在循环中重复递送试剂的其他检测技术。例如,为了启动第一SBS循环,一个或多个标记的核苷酸、DNA聚合酶等可流入/通过容纳一个或多个扩增核酸分子的流通池。可以检测其中引物延伸引起标记核苷酸掺入的那些位点。任选地,核苷酸还可以包括一旦将核苷酸添加到引物就终止进一步的引物延伸的可逆终止属性。例如,可以将具有可逆终止子部分的核苷酸类似物添加到引物,使得后续的延伸直到递送解封闭剂以去除该部分才发生。因此,对于使用可逆终止的实施方案,可(在检测发生之前或之后)将解封闭试剂递送到流通池。洗涤可以在各个递送步骤之间进行。然后可以重复该循环n次以使引物延伸n个核苷酸,从而检测长度为n的序列。可以容易地适于与通过本公开的方法产生的扩增子一起使用的示例性SBS程序、流体系统和检测平台在例如以下文献中描述:Bentley等人,Nature,第456卷,第53-59页(2008年),WO 04/018497,US7,057,026,WO 91/06678,WO 07/123744,US 7,329,492,US 7,211,414,US 7,315,019,US7,405,281和US 2008/0108082,其中每一篇以引用方式并入本文。
可以使用利用循环反应的其他测序程序,诸如焦磷酸测序。焦磷酸测序检测当特定核苷酸掺入新生核酸链中时无机焦磷酸盐(PPi)的释放(Ronaghi等人,AnalyticalBiochemistry,第242卷,第1期,第84-89页(1996年);Ronaghi,Genome Res.第11卷第1期,第3-11页(2001年);Ronaghi等人,Science 281(5375),363(1998);US 6,210,891,US 6,258,568和US 6,274,320,其中每一篇以引用方式并入本文)。在焦磷酸测序中,所释放的PPi可通过ATP硫酸化酶立即转化成三磷酸腺苷(ATP)来检测,并且所产生ATP的水平可经由荧光素酶产生的光子来检测。因此,可经由发光检测系统来监测测序反应。用于基于荧光的检测系统的激发辐射源不是焦磷酸测序程序所必需的。可适于对根据本公开产生的扩增子应用焦磷酸测序的可用流体系统、检测器和程序在例如WIPO专利申请序列号PCT/US11/57111、US 2005/0191698 A1、US 7,595,883和US 7,244,559中描述,这些文献中的每一篇以引用方式并入本文。
一些实施方案可利用涉及DNA聚合酶活性的实时监测的方法。例如,可以通过带有荧光团的聚合酶与γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用或者利用零模式波导(ZMW)来检测核苷酸掺入。用于基于FRET的测序的技术和试剂在例如以下文献中描述:Levene等人,Science,299,682–686(2003);Lundquist等人,Opt.Lett.33,1026–1028(2008);Korlach等人,Proc.Natl.Acad.Sci.USA 105,1176–1181(2008),这些文献的公开内容以引用方式并入本文。
一些SBS实施方案包括检测在核苷酸掺入延伸产物时释放的质子。例如,基于释放质子的检测的测序可使用可从Ion Torrent公司(Guilford,CT,它是Life Technologies子公司)商购获得的电检测器和相关技术或在US 2009/0026082A1、US 2009/0127589A1、US2010/0137143A1或US 2010/0282617A1中所述的测序方法和系统,其中每一篇以引用方式并入本文。本文阐述的使用动力学排阻来扩增靶核酸的方法可以容易地应用于用于检测质子的基板。更具体地,本文阐述的方法可以用于产生用于检测质子的扩增子克隆群体。
另一种有用的测序技术是纳米孔测序(参见例如Deamer等人,TrendsBiotechnol.第18卷,第147-151页(2000年);Deamer等人,Acc.Chem.Res.35:817-825(2002);Li等人,Nat.Mater.2:611-615(2003),这些文献的公开内容以引用方式并入本文)。在一些纳米孔实施方案中,靶核酸或从靶核酸除去的单独核苷酸穿过纳米孔。当核酸或核苷酸穿过纳米孔时,可通过测量孔的电导率的波动来识别每种核苷酸类型。(美国专利号7,001,792;Soni等人,Clin.Chem.第53卷,第1996-2001页(2007年);Healy,Nanomed.2,459–481(2007);Cockroft等人,J.Am.Chem.Soc.130,818–820(2008),这些文献的公开内容以引用方式并入本文)。
可应用于根据本公开的检测的基于阵列的表达和基因分型分析的示例性方法描述于以下中:美国专利号7,582,420、6,890,741、6,913,884或6,355,431或者美国专利公布号2005/0053980A1、2009/0186349A1或US 2005/0181440A1,其中每一篇以引用方式并入本文。
本文阐述的方法的优点是它们并行提供了对多个靶核酸的快速且有效检测。因此,本公开提供了能够使用本领域已知的技术(诸如上文所例示的那些)来制备和检测核酸的整合系统。因此,本公开的整合系统可以包括能够将扩增试剂和/或测序试剂递送到一个或多个固定DNA片段的流体部件,该系统包括诸如泵、阀、贮存器、流体管线等的部件。流通池在整合系统中可以被配置用于和/或用于检测靶核酸。示例性流通池在例如US 2010/0111768A1和美国序列号13/273,666中有所描述,这两份专利各自以引用方式并入本文。如针对流通池所例示的,整合系统的流体部件中的一个或多个流体部件可以用于扩增方法和检测方法。以核酸测序实施方案为例,整合系统的一个或多个流体部件可以用于本文阐述的扩增方法以及用于在测序方法(诸如上文例示的那些)中递送测序试剂。另选地,整合系统可包括单独的流体系统以执行扩增方法并执行检测方法。能够产生扩增核酸并且还确定核酸序列的整合测序系统的示例包括但不限于MiSeqTM平台(Illumina,Inc.,San Diego,CA)以及在美国序列号13/273,666中描述的设备,该专利以引用方式并入本文。
O.固定多核苷酸分子的物理图谱
本文还提出了生成固定多核苷酸的物理图谱的方法。可以有利地利用这些方法来识别可能包含连接序列(即,来自相同靶多核苷酸分子的第一部分和第二部分)的簇。因此,由固定多核苷酸产生的任何两个簇的相对接近度提供了可用于比对从两个簇获得的序列信息的信息。具体地,固体表面上任何两个给定簇之间的距离与两个簇来自相同靶多核苷酸分子的概率正相关,如WO 2012/025250中更详细地描述,该文献以引用方式全文并入本文。
例如,在一些实施方案中,在流通池的表面上伸展的长DNA:RNA双链体分子原位被标签化,从而在流通池的表面上形成一条连接的DNA:RNA桥。此外,然后可以在链交换生成固定DNA之前或之后生成固定DNA:RNA的物理图谱。因此,在扩增固定DNA之后,物理图谱与簇的物理关系相关。具体地,物理图谱用于计算从任何两个簇获得的序列数据被连接的概率,如WO 2012/025250的并入材料中所述。
在一些实施方案中,通过对DNA进行成像以确定固定DNA分子在整个固体表面上的位置来生成物理图谱。在一些实施方案中,通过将成像剂添加到固体载体并检测来自成像剂的信号来对固定DNA进行成像。在一些实施方案中,成像剂是可检测标记。合适的可检测标记包括但不限于质子、半抗原、放射性核素、酶、荧光标记、化学发光标记和/或显色剂。例如,在一些实施方案中,成像剂是嵌入染料或非嵌入DNA结合剂。可以使用如本领域中已知的任何合适的嵌入染料或非嵌入DNA结合剂,包括但不限于U.S.2012/0282617中阐述的那些,该专利全文以引用方式并入本文。
在一些实施方案中,在链交换和簇生成之前,进一步片段化固定DNA:RNA双链体以释放自由端。裂解桥接结构可以使用本领域已知的任何合适的方法来执行,如WO 2012/025250的并入材料所例示。例如,切割可以如WO 2012/025250中所述通过掺入经修饰的核苷酸(诸如尿嘧啶)、通过掺入限制性内切核酸酶位点或通过将溶液相转座体复合物应用于桥接DNA结构而发生,如本文其他地方所述。
在某些实施方案中,多个RNA流到包括多个纳米通道的流通池上,该纳米通道具有固定到其上的多个转座体复合物。如本文所用,术语纳米通道是指长线性核酸分子流入其中的窄通道。在一些实施方案中,靶RNA的不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900个或不超过1000个单独长链流入每个纳米通道中。在一些实施方案中,单个纳米通道被物理屏障隔开,该物理屏障防止靶RNA的单个长链与多个纳米通道相互作用。在一些实施方案中,固体载体包含至少10、50、100、200、500、1000、3000、5000、10000、30000、50000、80000个或100000个纳米通道。在一些实施方案中,结合到纳米通道表面的转座体对RNA进行标签化。然后可以例如通过沿这些通道中的一个的长度向下跟随簇来执行连续性标测。在一些实施方案中,靶RNA的长链的长度可以为至少0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb、1000kb、5000kb、10000kb、20000kb、30000kb或50000kb。在一些实施方案中,靶RNA的长链的长度不超过0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb或不超过1000kb。例如,具有1000个或更多个纳米通道且在纳米通道中具有标测的固定标签化产物的流通池可以用于对具有短“定位”读段的生物体的基因组进行测序。在一些实施方案中,纳米通道中标测的固定标签化产物可以用于解析单倍型。在一些实施方案中,纳米通道中标测的固定标签化产物可以用于解决定相问题。
II.在溶液中使用小珠连接的转座体和cDNA合成制备RNA测序文库的方法
在一些实施方案中,作为文库制备的第一步骤,从包含RNA的样品在溶液中合成cDNA。换句话说,在通过BLT进行标签化之前,可以在溶液中生成DNA:RNA双链体(如图2所示)。在一些实施方案中,然后通过捕获寡核苷酸将DNA:RNA双链体捕获在BLT上。在一些实施方案中,基于对包含在转座体复合物中的转座酶的亲和力,DNA:RNA双链体直接结合到BLT。
在一些实施方案中,通过逆转录酶进行cDNA合成。在一些实施方案中,该cDNA合成产生DNA:RNA双链体,其中生成可与RNA链杂交的DNA链。在一些实施方案中,在合成cDNA的条件下将逆转录酶聚合酶添加到包含RNA的样品中。在一些实施方案中,合成cDNA的条件包括存在可结合到RNA的核苷酸和/或引物(诸如聚T引物和/或随机引物)。在一些实施方案中,用于制备DNA:RNA双链体的反应混合物包含寡dT引物、逆转录酶和核苷酸。在一些实施方案中,DNA:RNA双链体在42℃的反应温度下合成cDNA的第一链。
在一些实施方案中,逆转录酶仅从RNA制备DNA(而不生成DNA的附加拷贝以产生双链DNA)。
在一些实施方案中,在溶液中进行cDNA制备以生成DNA:RNA双链体或生成双链cDNA。
在一些实施方案中,然后可将溶液中生成的DNA:RNA双链体结合到BLT并进行标签化。在终止或去除转座酶后,可以进行链交换,随后进行间隙-填充和连接,并且然后可以释放文库。在一些实施方案中,如果在溶液中制备双链cDNA然后进行标签化,则不需要链交换。在一些实施方案中,这些方法可以在管中或在流通池中进行。
在一些实施方案中,从靶RNA制备标记的DNA:RNA片段的固定文库的方法包括在合成cDNA并生成DNA:RNA双链体的条件下,向包含靶RNA的样品中添加逆转录酶聚合酶;将DNA:RNA双链体固定到其上固定有转座体复合物的固体载体上,其中转座体复合物包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3'部分以及第一标签;其中在DNA:RNA双链体直接结合到捕获寡核苷酸或转座酶的条件下将样品应用于固体载体;以及在DNA:RNA双链体被标记在一条链的5’端上的条件下,用转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,一条链的5'端是RNA链的5'端。在一些实施方案中,一条链的5'端是DNA链的5'端。
在一些实施方案中,从靶RNA制备标记的DNA:RNA片段的固定文库的方法包括将包含靶RNA的样品应用于其上固定有捕获寡核苷酸的固体载体;在合成cDNA并在捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及在DNA:RNA双链体被标记在一条链的5’端上的条件下,用溶液中的转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,RNA是mRNA,并且捕获寡核苷酸包含聚T序列。在一些实施方案中,片段的文库包含从一个或多个RNA的3’端生成的DNA:RNA片段。在一些实施方案中,捕获寡核苷酸还包含第一读段测序衔接子序列、小珠代码和/或一个或多个附加衔接子序列。在一些实施方案中,溶液中的转座体复合物包含第一转座体,该第一转座体包含第二读序列衔接子序列和/或一个或多个附加衔接子序列。在一些实施方案中,对DNA:RNA片段的文库进行测序,而在测序前不扩增片段。
III.制备具有3’UMI的RNA测序文库的方法
仅UMI测序的当前方法使得能够仅对转录物的片段进行定量测序,这阻碍了高分辨率同种型识别。在一些实施方案中,将本文所述的连锁长读段技术与3’UMI附接相结合,使得能够对RNA文库进行定量测序,以及通过将原始转录物的所有片段与3’UMI连接在一起进行同种型识别。在一些实施方案中,具有共同小珠代码标识符的小珠连接的转座体(BLT)可生成全长RNA的连锁长读段。尽管利用UMI的本发明方法可具有许多用途,但它们可特别用于可选剪接研究,其中识别源自不同RNA分子的序列是关键的。
在一些实施方案中,该方法结合了用于准确定量的3’UMI标记和连锁长读段小珠代码,如图15和图16所例示的。在一些实施方案中,在扩增之前进行3’UMI标记。在一些实施方案中,在标签化之前掺入cDNA的3’UMI预扩增使得该方法与单细胞和超低RNA输入相容。在一些实施方案中,该方法使得能够进行单个细胞的全长RNA计数测定。在一些实施方案中,该方法包括模板转换。
在一些实施方案中,从RNA制备双链DNA片段的文库的方法包括使用包含UMI和第一读段测序衔接子序列的聚T引物在样品中从全长RNA制备cDNA的第一链;制备cDNA的第二链以生成双链cDNA;将双链cDNA应用于其上固定有转座体复合物的小珠,其中每个转座体复合物包含转座酶;第一转座子,该第一转座子包含3’转座子末端序列;以及第二转座子,该第二转座子包含与转座子末端序列全部或部分互补的序列以及杂交序列;其中转座体复合物通过将杂交序列结合到固定到小珠的寡核苷酸而被固定,其中寡核苷酸包含5'亲和元素、第一读段测序衔接子序列、小珠代码以及与杂交序列全部或部分互补的序列;固定双链cDNA并且在小珠上进行标签化以制备双链DNA片段;去除第二转座子;使包含第二读段测序衔接子序列和与转座子末端序列全部或部分互补的序列的引物与转座子末端序列杂交;以及进行间隙-填充和延伸以制备包含第一读段测序衔接子和第二读段测序衔接子的双链DNA片段。
在一些实施方案中,从RNA制备双链DNA片段的文库的方法包括使用包含UMI和第一读段测序衔接子序列的聚T引物在样品中从全长RNA制备cDNA的第一链;制备cDNA的第二链以生成双链cDNA;将双链cDNA应用于其上固定有转座体复合物的小珠,其中每个转座体复合物包含转座酶;第一转座子,该第一转座子包含3'转座子末端序列、小珠代码和第二读段测序衔接子序列;其中第一转座子还包含用于将转座体复合物固定到固体载体的5’亲和元素;以及第二转座子,该第二转座子包含与转座子末端序列全部或部分互补的序列;固定双链cDNA并且在小珠上进行标签化以制备双链DNA片段;去除第二转座子;使包含第二读段测序衔接子序列和与转座子末端序列全部或部分互补的序列的引物与转座子末端序列杂交;以及进行间隙-填充和延伸以制备包含第一读段测序衔接子和第二读段测序衔接子的双链DNA片段。
在一些实施方案中,引物包含5'部分和3'部分,该5'部分包含第二读段序列衔接子,该3'部分包含与转座子末端序列全部或部分互补的序列。
在一些实施方案中,当去除与转座子末端序列全部或部分互补的序列时,该片段在一个或两个末端处保持附接到转座体。
在一些实施方案中,每个引物包含不同的UMI。在一些实施方案中,全长RNA包含不同全长RNA的池,并且聚T引物包含含有不同UMI的不同聚T引物的池。在一些实施方案中,不同聚T引物的池中包含的每种聚T引物包含不同的UMI。
在一些实施方案中,每个片段包含独特UMI。在一些实施方案中,全长RNA包含不同全长RNA的池,并且从单个全长RNA制备的3'双链DNA片段包含与从池中的其他全长RNA制备的3'双链DNA片段不同的UMI。
在一些实施方案中,每个小珠包含独特小珠代码。在一些实施方案中,全长RNA包含不同全长RNA的池,并且小珠包含小珠的池。在一些实施方案中,每个小珠固定了转座体复合物,该转座体复合物包含与固定在池中其他小珠上的转座体复合物中包含的小珠代码相比不同的小珠代码。
在一些实施方案中,从由单个全长RNA制备的双链cDNA制备的所有片段在同一小珠上进行标签化。
在一些实施方案中,在进行间隙-填充和延伸后,由双链cDNA制备的包含第一读段测序衔接子和第二读段测序衔接子的所有双链片段在相同的固体载体上。
在一些实施方案中,全长RNA包含不同全长RNA的池,并且在进行间隙-填充和延伸后,由池中的单个全长RNA制备的包含第一读段测序衔接子和第二读段测序衔接子的所有双链片段在相同的固体载体上。
在一些实施方案中,该方法还包括扩增包含第一读段测序衔接子和第二读段测序衔接子的双链片段以制备扩增片段。
在一些实施方案中,双链cDNA制备通过链方法进行。在一些实施方案中,从包含第一读段测序衔接子和第二读段测序衔接子的双链片段或扩增片段获得的序列中小珠代码的存在识别在其上生成片段的小珠。
在一些实施方案中,样品是单个细胞。
在一些实施方案中,该方法包括链RNA文库制备。
在一些实施方案中,在标签化步骤期间将一个测序衔接子序列掺入片段中,并且在标签化后经由用于伸长的引物将不同的测序衔接子序列掺入片段中。在一些实施方案中,掺入测序衔接子序列的引物是包含测序衔接子序列的标记引物。
在一些实施方案中,本发明方法包括对称标签化步骤,其中所有转座体复合物包含相同衔接子序列。
在一些实施方案中,本发明方法与3’UMI标记、预扩增和/或全长RNA同种型检测相容。
在一些实施方案中,该方法还包括对扩增片段或包含第一读段测序衔接子和第二读段测序衔接子的双链片段进行测序。
在一些实施方案中,测序允许全长RNA同种型检测。
在一些实施方案中,3’UMI(包含在标签化期间生成的3'片段中)可在测序结果的分析期间用于识别与其他cDNA不同的cDNA(基于具有其他UMI的其他cDNA)。图14概述了3'片段如何在第一链合成期间掺入UMI(基于包含在第一链合成引物中的UMI),然后在捕获cDNA的3'端后进行单个标签化事件。由于来自给定cDNA的所有片段将在相同的DNA BLT上被片段化,因此所有片段将掺入相同的小珠代码。图15总结了实施方案的这一方面,在cDNA合成期间将“UMI 1”掺入来自同种型#1的cDNA中,并且该同种型的所有片段将掺入“小珠代码A”,因为所有片段是通过在包含该代码的小珠上的标签化而生成的。相比之下,在cDNA合成期间将“UMI 2”掺入来自同种型#2的cDNA中,并且该同种型的所有片段将掺入“小珠代码B”,因为所有片段是通过在包含该代码的小珠上的标签化而生成的。使用模板转换和PCR扩增的方法在图16中示出,其中模板转换引物可用于掺入衔接子(诸如P5)。
使用这些方法,从来自给定mRNA同种型的cDNA生成的所有片段可在测序结果的分析期间分组。该分析允许在测序结果内区分不同的mRNA同种型。
A.连锁长读段测序
标准短读取测序提供精确的碱基水平序列以提供近程信息,但短读取测序可能不提供远程基因组信息。此外,因为没有保留测序基因组或短读段数据参考的单倍型信息,所以用标准方法重建远程单倍型具有挑战性。因此,标准测序和分析方法通常可称为单核苷酸变体(SNV),但这些方法可能无法识别单个基因组中看到的结构变异的全谱。如本文所用,基因组的“结构变异”是指大于SNV的事件,包括50个碱基对或更多的事件。代表性的结构变体包括拷贝数变异、倒位、缺失和重复。
“连锁长读取测序”或“连锁读取测序”是指提供关于基因组序列的远程信息的测序方法。
在一些实施方案中,连锁读取测序可用于单倍型重建。在一些实施方案中,连锁读取测序改善了结构变体的调用。在一些实施方案中,连锁读取测序改善了对具有有限可及性的基因组区域的访问。在一些实施方案中,连锁读取测序用于从头二倍体组装。在一些实施方案中,连锁读取测序改善了需要从头组装的高度多态性序列(诸如人白细胞抗原基因)的测序。
在一些实施方案中,可基于在从BLT释放片段之前的空间分离或基于小珠条形码编码来进行连锁长读段测序。
1.基于空间分离的连锁长读段测序
在一些实施方案中,全长核酸“包裹”在单个小珠(诸如BLT)上,这意味着全长核酸可与单个小珠上的多个转座体复合物缔合。如本文所用,核酸可以是DNA、cDNA或DNA:RNA双链体。
在一些实施方案中,将小珠递送到表面以用附接到小珠的全长核酸进行测序。例如,核酸可结合到可活化的BLT,并递送到流通池。BLT可以在附接到流通池之后被活化以允许制备片段。然后可释放这些片段,使得与在其他小珠上制备的片段相比,由给定全长核酸(其在相同小珠上制备)产生的片段将以紧密接近度释放。
在一些实施方案中,将BLT递送到表面以对附接到BLT的片段进行测序。
在一些实施方案中,连锁读段测序使用分子条形码来标记来自相同长DNA片段的读段。当将独特条形码添加到从单个DNA分子生成的每个短读段中时,短读段可以将该DNA分子连接在一起。换句话说,共享条形码的读段可被分组为来源于单个长输入分子,从而允许从短读段组装长范围信息。
B.第一链合成引物
在一些实施方案中,第一链合成引物能够将一个或多个标签掺入由样品中包含的RNA生成的cDNA的第一链中。在一些实施方案中,第一链合成引物包含聚T序列。在一些实施方案中,该聚T序列可与RNA的3'端上的聚A尾杂交。在一些实施方案中,RNA是mRNA。在一些实施方案中,使用包含聚T序列的引物允许用3’UMI标记cDNA的第一链。
在一些实施方案中,第一链合成引物还包含UMI、索引序列(或其互补物)、第一读段测序衔接子序列(或其互补物)和/或一个或多个附加衔接子序列。
在一些实施方案中,第一链合成引物包含在第一链合成引物的池中。在一些实施方案中,第一链合成引物的池中的第一链合成引物包含独特UMI,这不同于混合物中的所有或大多数其他引物。
在一些实施方案中,第一链合成引物包含寡dT序列、UMI、索引序列和衔接子序列。用这样的引物生成的cDNA的代表性第一链在图14中示出,其中cDNA的第一链包含寡dT序列、UMI、i7序列(索引序列)和P7序列(即,用作引物着陆位点的衔接子序列)。在一些实施方案中,用于测序的表面(诸如流通池)涂覆有引物着陆位点的菌苔。在一些实施方案中,引物着陆位点是P5或P7。在一些实施方案中,引物着陆位点(诸如P5或P7)促进片段与流通池的结合。
在一些实施方案中,寡dT序列和第一读段测序衔接子序列对于引物混合物中的每个第一链合成引物是相同的。在一些实施方案中,UMI对于每个第一链合成引物是独特的。以这种方式,下游测序事件可以区分从包含不同RNA的样品中包含的不同RNA分子生成的片段。
在一些实施方案中,第一链合成引物中包含的索引序列是已知的索引序列池中的一个索引序列,诸如i7或i5序列(参见例如Illumina Document#1000000002694v10,Illumina,Inc.,2019年)。
在一些实施方案中,第一链合成引物包含一个或多个衔接子序列。在一些实施方案中,衔接子序列包含引物序列、索引标签序列、捕获序列、条形码序列、切割序列或测序相关序列或它们的组合。
C.独特分子标识符(UMI)
独特分子标识符(UMI)是应用于核酸分子或在核酸分子中识别的核苷酸序列,其可用于将各个核酸分子彼此区分。UMI可与它们所缔合的核酸分子一起测序,以确定读取序列是一种来源核酸分子的序列还是另一种来源核酸分子的序列。术语“UMI”在本文中可用于指多核苷酸的序列信息和物理多核苷酸本身两者。UMI类似于条形码,其通常用于将一个样品的读段与其他样品的读段区分,但当来自各个样品的许多片段一起测序时,UMI替代地用于将核酸模板片段与另一个区分。UMI可以许多方式定义,诸如WO 2019/108972和WO2018/136248中所述,其以引用方式并入本文。
独特分子标识符(UMI)是应用于核酸分子或在核酸分子中识别的核苷酸序列,其可用于将各个核酸分子彼此区分。UMI可与它们所缔合的核酸分子一起测序,以确定读取序列是一种来源核酸分子的序列还是另一种来源核酸分子的序列。术语“UMI”在本文中可用于指多核苷酸的序列信息和物理多核苷酸本身两者。UMI类似于条形码,其通常用于将一个样品的读段与其他样品的读段区分,但当来自各个样品的许多片段一起测序时,UMI替代地用于将核酸模板片段与另一个区分。UMI可以许多方式定义,诸如WO 2019/108972和WO2018/136248中所述,其以引用方式并入本文。
在一些实施方案中,UMI文库包含非随机序列。在一些实施方案中,针对特定实验或应用预定义非随机UMI(nrUMI)。在某些实施方案中,规则用于生成集合的序列或从该集合中选择样品以获得nrUMI。例如,可生成集合的序列,使得序列具有一个或多个特定模式。在一些具体实施中,每个序列与该集合中的每个其他序列相差特定数目的(例如,2、3或4个)核苷酸。即,通过替换少于特定数目的核苷酸,没有nrUMI序列可转化成任何其他可用的nrUMI序列。在一些具体实施中,在测序过程中使用的一组UMI包括少于给定特定序列长度的所有可能的UMI。例如,具有6个核苷酸的一组nrUMI可包括总共96个不同的序列,而不是总共4A6=4096个可能的不同序列。在一些实施方案中,UMI文库包含120个非随机序列。
在一些具体实施中,当nrUMI选自具有少于所有可能的不同序列的组时,nrUMI的数目少于,有时显著少于来源DNA分子的数目。在此类具体实施中,nrUMI信息可与其他信息(诸如虚拟UMI、参考序列上的读段位置和/或读段的序列信息)组合,以识别来源于相同来源DNA分子的序列读段。
在一些实施方案中,UMI文库可包含随机UMI(rUMI),其作为随机样品从由给定一个或多个序列长度的所有可能的不同寡核苷酸序列组成的一组UMI中在进行或不进行替换的情况下来选择。例如,如果该组UMI中的每个UMI具有n个核苷酸,则该组包括4An个具有彼此不同的序列的UMI。从4An个UMI中选择的随机样品构成rUMI。
在一些实施方案中,UMI文库是伪随机的或部分随机的,其可包含nrUMI和rUMI的混合物。
在一些实施方案中,衔接子序列或其他核苷酸序列可存在于UMI与插入DNA之间。
在一些实施方案中,衔接子序列或其他核苷酸序列可存在于每个UMI与插入DNA之间。
在一些实施方案中,UMI位于插入DNA的3'。在一些实施方案中,代表一个或多个衔接子序列的核酸序列可位于UMI与插入DNA之间。
在一些实施方案中,UMI位于合成的cDNA的第一链上。在一些实施方案中,UMI的第一拷贝在合成的cDNA的第一链上,并且UMI的第二拷贝(即,其互补物)在合成的cDNA的第二链上。
D.用于在标签化后掺入一个或多个衔接子的引物
在一些实施方案中,引物在BLT上的标签化后杂交以掺入一个或多个衔接子序列。在一些实施方案中,该引物包含测序衔接子序列以及与转座子末端序列全部或部分互补的序列。在一些实施方案中,引物包含与包含在第一链合成引物中的测序衔接子不同的测序衔接子序列。在一些实施方案中,第一链合成引物的序列不同于在标签化后使用的引物的序列。
在一些实施方案中,在标签化后杂交的引物与第一转座子中的序列不完全互补。换句话说,引物与固定到BLT的片段的杂交生成“Y-衔接子”或“叉状衔接子”样结构。
在一些实施方案中,在标签化后杂交的引物包含与第一转座子中包含的序列全部或部分互补的序列。在一些实施方案中,在标签化后杂交的引物包含与第一转座子中包含的嵌合末端(ME)序列(或其互补物)全部或部分互补的序列。在一些实施方案中,在标签化后杂交的引物包含不包含在第一转座子中的序列。
在一些实施方案中,在与包含与第一转座子中包含的序列全部或部分互补的序列的引物杂交之前,将非转移链中的ME’序列从片段解离。在一些实施方案中,与转座子末端序列全部或部分互补的序列短于转座子末端序列。这样的实施方案在图19中被示出为缩短的ME'。在一些实施方案中,当与转座子末端序列全部或部分互补的序列短于转座子末端序列(即,使用缩短的ME’序列)时,生成较少的衔接子二聚体。
在一些实施方案中,第二转座子包含较短的ME'以促进ME'序列在标签化后从ME序列解离。在一些实施方案中,缩短的ME’序列可用于将非转移的ME’序列与不同的寡核苷酸(诸如引物)交换。在一些实施方案中,缩短的ME’序列也可减少钝端连接的发生。
E.杂交序列
在一些实施方案中,小珠包含可用于结合溶液中的转座体的寡核苷酸。以这种方式,小珠可以是“可活化的BLT”,其中用户控制BLT的生成的定时。
在一些实施方案中,小珠包含含有杂交序列的寡核苷酸。在一些实施方案中,杂交序列结合到与包含在转座体复合物中的序列全部或部分互补的序列。在一些实施方案中,杂交序列结合到包含在转座体中的第二转座子,其中来自溶液的转座体可经由与包含在第二转座子中的序列全部或部分互补的杂交序列结合(以形成BLT)。
F.小珠代码
给定cDNA的3'片段可掺入(如上所述)UMI序列。以这种方式,从给定cDNA生成的3'片段中的UMI序列可用于将该cDNA与生成的其他cDNA区分开。从给定cDNA(如图15所示)或DNA:RNA双链体生成的这种3'片段也将包含在标签化期间掺入的小珠代码。以这种方式,来自3'片段(包含UMI)的测序数据可与来自在相同小珠上生成的其他片段的测序数据一起分类,以从样品生成起始RNA的全序列。换句话说,由全长RNA转录物生成的cDNA将被单个小珠标签化,该小珠用相同的小珠代码序列对来自原始全长RNA的cDNA的所有段进行标签化。在一些实施方案中,对给定小珠上的单个cDNA进行片段化允许所有片段连接回原始转录物以及在逆转录期间引入的UMI。因此,该方法可以提供关于独特RNA分子的数据。
尽管给定cDNA的所有片段通常将在相同BLT上生成,但该BLT也可从结合到其的其他cDNA生成片段。换句话说,源自原始样品中不同RNA的片段可以具有相同的小珠代码。然而,序列比对可用于识别给定小珠上的哪些片段源自给定序列。
IV.对称标签化后制备RNA或DNA文库的附加方法
在BLT上的对称标签化后,可使用生成可测序片段的许多不同方式。这些方法可与本文所述的方案中的任何方案组合。多种示例性方法在美国临时申请号63/168,802中公开,该申请全文并入本文。
在一些实施方案中,方法包括在DNA或DNA:RNA双链体的标签化之后,从转座体复合物释放双链靶核酸片段,使包含衔接子序列和与第一3'端转座子序列全部或部分互补的序列的多核苷酸杂交,其中多核苷酸中包含的衔接子序列与转座体复合物中包含的衔接子序列不同,任选地使双链靶核酸片段的第二链延伸,任选地将多核苷酸或所延伸的多核苷酸与双链靶核酸片段连接,以及产生双链靶核酸片段。在一些实施方案中,多核苷酸还包含UMI。在一些实施方案中,片段包含UMI,其中UMI直接位于插入DNA的3’端附近。
在一些实施方案中,方法包括在DNA或DNA:RNA双链体的标签化之后,从转座体复合物释放双链靶核酸片段,使第一多核苷酸与衔接子序列杂交,其中第一转座子中的衔接子与第一多核苷酸中的衔接子不同,任选地添加包含与第一多核苷酸互补的区域的第二多核苷酸以产生双链衔接子,任选地使双链靶核酸片段的第二链延伸,任选地将双链衔接子与双链靶核酸片段连接,以及产生双链靶核酸片段。在一些实施方案中,第一多核苷酸还包含UMI。在一些实施方案中,片段包含UMI,其中UMI位于双联靶核酸片段与来自第一多核苷酸的衔接子序列之间。
在一些实施方案中,片段在一条链的5'端处用来自第一转座子的第一读段序列衔接子序列标记,并且在另一条链的5'端处用来自第一多核苷酸的第二读段序列衔接子序列标记。
V.利用用于文库制备的标签化制备链特异性cDNA制备物的方法(PRESS-BLT)
在一些实施方案中,将链特异性cDNA制备的方法与标签化组合以制备文库。引物延伸链特异性BLT方法(PRESS-BLT)可用于描述包括cDNA合成、BLT制剂和文库制备的链特异性方法,如图17和图18所示。
在一些实施方案中,经由PRESS-BLT从RNA制备单链DNA的链特异性文库的方法包括在抑制DNA依赖性DNA合成的条件下使用逆转录酶、引物和包含dTTP的核苷酸从样品中包含的RNA制备cDNA的第一链;使用DNA聚合酶、引物和包含dUTP的核苷酸从cDNA的第一链制备cDNA的第二链以制备双链cDNA;将双链cDNA应用于其上固定有转座体复合物的固体载体,其中每个转座体复合物包含转座酶;第一转座子,该第一转座子包含含有转座子末端序列的3’部分以及第一读段测序衔接子序列;其中第一转座子包含用于将转座体复合物固定到固体载体的5’亲和元素;以及第二转座子序列,该第二转座子序列包含与转座子末端序列全部或部分互补的序列;用转座体复合物对双链DNA进行标签化以制备包含第一读段测序衔接子序列的标记双链DNA片段;去除第二转座子并进行间隙-填充和延伸;分离双链DNA片段的链;将包含第二读段测序衔接子序列的引物与转座子末端序列或与转座子末端序列全部或部分互补的序列杂交,并扩增以制备DNA链,该DNA链不附接到固体载体并且包含第一读段测序衔接子和第二读段测序衔接子;以及从固体载体释放通过扩增生成的链,其中释放释放包含第一读段测序衔接子和第二读段测序衔接子的单链DNA片段。
在一些实施方案中,抑制DNA依赖性DNA合成的条件是存在包含放线菌素D的缓冲液。在一些实施方案中,引物是一种或多种随机引物。在一些实施方案中,引物是随机引物和聚T引物的混合物。在一些实施方案中,用于制备cDNA的第二链的引物与用于制备cDNA的第一链的引物相同。在一些实施方案中,RNA是长的非译码RNA或反义转录物。
在一些实施方案中,用尿嘧啶不耐受聚合酶进行扩增。在一些实施方案中,扩增不从包含尿嘧啶的DNA链扩增。
在一些实施方案中,独特分子标识符(UMI)包含在包含第二读段测序衔接子序列的引物中。在一些实施方案中,UMI位于第二读段测序衔接子序列和可结合到转座子末端序列的序列或与转座子末端序列全部或部分互补的序列之间。在一些实施方案中,UMI包含在第一转座子中。在一些实施方案中,UMI位于转座子末端序列和第一读段测序衔接子序列之间。
在一些实施方案中,所得文库中的不同片段包含不同UMI。在一些实施方案中,RNA包含不同RNA的池,并且包含第一读段测序衔接子和第二读段测序衔接子的单链片段包含不同片段的池,其中每个片段包含与不同片段的池中包含的其他片段不同的UMI。
一系列不同的亲和元素可以在PRESS-BLT方法中使用。在一些实施方案中,亲和元素是生物素或脱硫生物素,并且固体载体在其表面上包含链霉亲和素或亲和素。在一些实施方案中,亲和元素是双生物素,如图19中所述。
通过扩增生成的链从固体载体的释放可以以多种方式进行。在一些实施方案中,用热或氢氧化钠处理进行释放。在一些实施方案中,包含第一读段测序衔接子和第二读段测序衔接子的单链片段在释放之后与固体载体分开。
在一些实施方案中,该方法还包括用包含第一读段测序衔接子和第二读段测序衔接子的单链DNA片段进行索引引物扩增以在释放之后制备索引片段。这样的索引引物扩增对于测序数据的索引是本领域公知的。在一些实施方案中,索引引物扩增在与固体载体分离的反应容器中进行。
在一些实施方案中,用尿嘧啶不耐受聚合酶进行索引引物扩增。以这种方式,如果cDNA的第二链包含尿嘧啶,则它们不被扩增。
在一些实施方案中,该方法还包括对包含第一读段测序衔接子和第二读段测序衔接子的单链DNA片段或索引片段进行测序。在一些实施方案中,测序数据是从由RNA生成的cDNA的第一链生成的。在一些实施方案中,测序数据不是从由RNA生成的cDNA的第二链生成的。在一些实施方案中,该方法不需要连接。
PRESS-BLT为mRNA分析提供了许多优点。在一些实施方案中,该方法划分RNA中重叠序列的边界。在一些实施方案中,该方法允许估计转录物表达。在一些实施方案中,转录物表达的估计基于UMI的分析。PRESS-BLT的一般概述是其包括链特异性cDNA合成、通过BLT进行的对称标签化和引物延伸以制备文库片段的步骤。
A.在PRESS-BLT中的链特异性cDNA合成
在一些实施方案中,使用逆转录酶、随机引物、核苷三磷酸和包括放线菌素D的FSA缓冲液将总RNA复制到第一链cDNA中。在一些实施方案中,放线菌素D特异性抑制DNA依赖性DNA合成并提高链特异性。链特异性cDNA合成的代表性方法示于图17中。
这样的链特异性cDNA合成可用于PRESS-BLT方法中,但也可与其他文库制备方法一起使用。
B.用于PRESS-BLT中的BLT
在一些实施方案中,然后将使用链特异性方案制备的双链cDNA标签化以生成标记的双链DNA片段。
在一些实施方案中,PRESS-BLT方法中的标签化是对称标签化,其中所有转座体复合物包含第一转座子,该第一转座子包含相同的衔接子序列。在一些实施方案中,与其中多于一种类型的转座体复合物用于标签化的不对称标签化步骤相比,使用对称标签化步骤的方法增加了可测序片段(即,每个片段在片段的每个末端具有不同的测序衔接子序列)的产率。
在一些实施方案中,对cDNA进行标签化,使得片段在两条链的5'端处掺入相同标签。在一些实施方案中,通过标签化生成的标记的双链cDNA片段在片段的两端处具有相同标签。在一些实施方案中,cDNA用包含单个测序衔接子序列的标签进行标签化。在一些实施方案中,测序衔接子序列是A14或B15。
C.PRESS-BLT中的引物延伸
在一些实施方案中,将非转移的ME’序列(来自第二转座子)熔融掉,并在标签化后通过PCR延伸填充间隙。在一些实施方案中,通过升高反应的温度来去除ME’序列。该方法的这些步骤在图18中概述。
在一些实施方案中,在去除非转移的ME’序列之后进行间隙填充。在一些实施方案中,将引物与间隙填充的ME’序列退火。在一些实施方案中,该引物用于延伸并且可被称为延伸引物。在一些实施方案中,延伸引物包含ME序列。在一些实施方案中,包含在延伸引物中的ME序列与间隙填充的ME’序列杂交。
在一些实施方案中,延伸引物还包含测序衔接子序列。在一些实施方案中,包含在延伸引物中的序列衔接子序列不包含在转座体复合物中。在一些实施方案中,用延伸引物进行的延伸生成在双链片段的每一端处包含不同测序衔接子序列的片段。
在一些实施方案中,尿嘧啶不耐受的DNA用于引物延伸。在一些实施方案中,引物延伸仅从cDNA的第一链发生。在一些实施方案中,基于上述链特异性cDNA制备,不延伸cDNA的第二链,因为其包含尿嘧啶。
在一些实施方案中,如果转座体复合物包含A14序列(或其互补物),则延伸引物包含B15(或其互补物)。在一些实施方案中,如果转座体复合物包含B15序列(或其互补物),则延伸包含A14(或其互补物)。在这些代表性示例中,A14和15仅代表示例性测序衔接子序列,并且本发明方法不限于此类衔接子序列。任何组的感兴趣的成对衔接子序列可用于转座体复合物和延伸引物中,并且本领域技术人员将充分了解如何在不同平台上进行测序并且此类平台可随时间推移而演变。
在一些实施方案中,延伸引物包含UMI。在一些实施方案中,UMI标记独特mRNA转录物与通过PCR扩增产生的拷贝。换句话说,来自任何下游扩增步骤的相同cDNA(例如,源自单个mRNA转录物)的扩增子拷贝将包含相同的UMI。以这种方式,测序结果的分析可以识别从相同mRNA生成的片段的多个拷贝。
如图19所示,某些经修饰的转座子可改善PRESS-BLT的结果。这些修饰也可用于本文所述的其他方法中。在一些实施方案中,双生物素用于将转座子序列固定到小珠以生成BLT。在一些实施方案中,与生物素相比,双生物素对链霉亲和素具有更强的亲和力,这改善了转座体从BLT的结合和释放。此类修饰可与本文所述的任何其他方法一起用于PRESS-BLT方法中。
VI.使用小珠连接的转座体制备RNA和DNA测序文库的方法
在一些实施方案中,方法应用包含RNA和DNA的样品。这些方法可以用与使用RNA测序文库所述的方法类似的组分进行。当从同一样品制备RNA和DNA测序文库时,可使用图2至图18中所示和本文所述的RNA测序的方法中的任一种方法。图22至图28还示出示例性方法,其中在该方法期间RNA可被转化为DNA:RNA双链体或双链DNA。
在一些实施方案中,本发明方法可以通过基于标签化的文库制备来解析总核酸(TNA)样品中源自RNA的样品和源自DNA的样品的测序。在一些实施方案中,方法允许单个反应容器生成RNA和DNA文库。
在一些实施方案中,方法允许“定向”文库制备,其可区分作为测序片段的来源的核酸链。
在一些实施方案中,可组合不同方法的方面以生成基于“链”RNA和DNA标签化的测序文库。
在一些实施方案中,DNA和RNA测序文库可由单个样品反应生成。在一些实施方案中,DNA和RNA测序文库可以在单个反应容器中生成。在一些实施方案中,本发明方法可以在一个反应中捕获基因组和转录组或其他信息,这可以被称为多组学测定。
多种方法可与包含RNA和DNA的样品一起使用,以允许从同一样品制备RNA和DNA测序文库。在一些实施方案中,这些方法避免了RNA-BLT对DNA的标签化。相反,包含RNA和DNA的样品中的RNA被设计用于DNA:RNA双链体片段化的BLT(RNA BLT)标签化,并且样品中的DNA被设计用于DNA片段化的BLT(DNA BLT)标签化。
图21提出了这些方法中的挑战,即DNA本身可结合到将存在于RNA BLT上的转座体。本申请描述了通过RNA BLT指定DNA:RNA双链体的标签化的多种方法。这些方法避免了RNA BLT对DNA的标签化。图22至图28提供了允许通过DNA BLT对DNA进行标签化(诸如掺入DNA特异性条形码)和通过RNA BLT对从RNA制备的DNA:RNA双链体或双链DNA进行标签化(诸如掺入RNA特异性条形码)的示例性工作流程。
在一些实施方案中,第一标签和第二标签是不同的。在一些实施方案中,第一标签和第二标签允许将RNA测序文库的片段与DNA测序文库的片段区分开。在一些实施方案中,识别由DNA BLT进行的片段化的索引被称为“iDNA”或识别DNA BLT的索引(参见图21)。在一些实施方案中,识别由RNA BLT进行的片段化的索引被称为“iRNA”或识别RNA BLT的索引(参见图21)。
这样的工作流程的挑战是将双链DNA底物仅引导至DNA BLT而不引导至RNA BLT。图21总结了由于直接结合到转座体复合物的能力,DNA分子将对RNA PLT具有亲和力。本发明方法描述了当样品包含RNA和DNA时,有效地引导将RNA片段化为RNA BLT并且将DNA片段化为DNA BLT的多种方式。
A.使用3个小珠的方法
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法使用3个小珠。具有3个小珠的示例性方法在图24中示出。在一些实施方案中,这3个小珠可以是RNA BLT、DNA BLT和“RNA捕获小珠”。RNA捕获小珠可包含聚T捕获寡核苷酸或另一种捕获RNA的试剂,而不导致RNA标签化(即,RNA捕获小珠缺乏活性转座体复合物)。在DNA标签化和通过RNA捕获小珠捕获RNA后,将RNA从RNA捕获小珠转移到RNA BLT。
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法包括
将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及
其上固定有第一捕获寡核苷酸的第二固体载体;
其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记,并且RNA结合到第二固体载体上的第一捕获寡核苷酸的条件下,将样品应用于第一固体载体和第二固体载体的混合物;
将结合到第二固体载体的RNA转移到第三固体载体,该第三固体载体具有固定在其上的结合转移的RNA的第二捕获寡核苷酸以及第二转座体复合物,其中第二转座体复合物包含转座酶和第二多核苷酸,该第二多核苷酸包含含有转座子末端序列的3'部分以及第二标签;
在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用第二转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,一条链的5'端是RNA链的5'端。在一些实施方案中,一条链的5'端是DNA链的5'端。
在一些实施方案中,第一捕获寡核苷酸和/或第二捕获寡核苷酸包含聚T序列。在一些实施方案中,RNA包含与第一捕获寡核苷酸和/或第二捕获寡核苷酸中的一者或多者的至少一部分互补的序列。在一些实施方案中,第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。在一些实施方案中,该方法还包括在将样品应用于固体载体后洗涤固体载体以去除任何未结合的DNA或RNA。
B.使用2个小珠:缺乏功能性转座体的DNA BLT和RNA小珠的方法
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法使用2个固体载体。在一些实施方案中,固体载体是小珠。在一些实施方案中,2个小珠是DNA BLT和“裸”RNA小珠。如本文所用,“裸”BLT是指可连接转座体复合物但不具有连接的活性转座体复合物的小珠。例如,转座体复合物可缺乏转座酶或转座体复合物活性所需的另一种基本组分。因此,“裸”BLT允许在随后的步骤期间添加附加组分以允许片段化。“裸”RNA BLT的使用允许控制RNA片段化的定时。
在一些实施方案中,用于固定DNA的第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分。在一些实施方案中,第一固体载体还包含第一标签。
在一些实施方案中,第二固体载体具有固定在其上的捕获寡核苷酸和第二多核苷酸,其中第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签。在一些实施方案中,第二标签是RNA特异性条形码。
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法包括:
将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及
第二固体载体,该第二固体载体具有固定在其上的捕获寡核苷酸和第二多核苷酸,其中第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签;其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记,并且RNA结合到第二固体载体上的捕获寡核苷酸的条件下,将样品应用于第一固体载体和第二固体载体的混合物;
在转座酶结合到第二多核苷酸以在第二固体载体上形成转座体复合物的条件下添加转座酶;
在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用第二转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,一条链的5'端是RNA链的5'端。在一些实施方案中,一条链的5'端是DNA链的5'端。
在一些实施方案中,第一捕获寡核苷酸和/或第二捕获寡核苷酸包含聚T序列。在一些实施方案中,RNA包含与第一捕获寡核苷酸和/或第二捕获寡核苷酸中的一者或多者的至少一部分互补的序列。在一些实施方案中,第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。在一些实施方案中,该方法还包括在将样品应用于固体载体后洗涤固体载体以去除任何未结合的DNA或RNA。
C.使用2个小珠:DNA BLT和失活的RNA BLT的方法
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法使用2个固体载体。在一些实施方案中,固体载体是小珠。在一些实施方案中,2个小珠是DNA BLT和“失活的”RNA BLT。如本文所用,“失活的”RNA BLT是指可逆失活的RNA BLT。因此,“失活的”RNA BLT允许在随后的步骤期间活化以允许片段化。“失活的”RNA小珠的使用因此允许控制RNA片段化的定时。
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法包括:
将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及用于固定RNA的第二固体载体,该第二固体载体具有固定在其上的捕获寡核苷酸以及可逆地失活的第二转座体复合物,其中转座体复合物包含结合到第二多核苷酸的转座酶,该第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签;其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记,并且RNA结合到第二固体载体上的捕获寡核苷酸的条件下,将样品应用于第一固体载体和第二固体载体的混合物;
在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;
活化第二转座体复合物;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用活化的第二转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,一条链的5'端是RNA链的5'端。在一些实施方案中,一条链的5'端是DNA链的5'端。
在一些实施方案中,转座体复合物通过结合到转座体复合物的转座体去活化剂可逆地失活。在一些实施方案中,转座体去活化剂结合到转座体复合物的Tn5结合位点。在一些实施方案中,转座体去活化剂包含去磷酸化的ME’、额外的碱基、抑制剂双链体和/或热不稳定抗体。在一些实施方案中,通过去除转座体去活化剂来活化转座体复合物。
在一些实施方案中,捕获寡核苷酸包含聚T序列。在一些实施方案中,RNA包含与捕获寡核苷酸中的一种或多种捕获寡核苷酸的至少一部分互补的序列。在一些实施方案中,第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。在一些实施方案中,该方法还包括在应用样品后洗涤固体载体以去除任何未结合的DNA或RNA。
D.使用具有DNA和RNA的顺序固定的2个小珠的方法
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法使用2个固体载体。在一些实施方案中,固体载体是小珠。在一些实施方案中,将样品中的DNA和RNA顺序固定在分开的固体载体上。
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法包括将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,该第一固体载体包含固定在其上的第一转座体复合物,其中第一转座体复合物包含转座酶和第一多核苷酸,该第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签,并且其中在DNA结合到第一固体载体上的第一转座体复合物并且被片段化和任选地标记的条件下应用样品;
将具有结合的DNA的第一固体载体与RNA分离;
将RNA应用于用于固定RNA的第二固体载体,该第二固体载体具有固定在其上的捕获寡核苷酸和第二转座体复合物,其中第二转座体复合物包含结合到第二多核苷酸的转座酶,该第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签,并且其中在RNA结合到第二固体载体上的捕获寡核苷酸的条件下应用RNA;
在合成cDNA并在第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
在DNA:RNA双链体被标记在一条链的5’端上的条件下,用活化的第二转座体复合物对DNA:RNA双链体进行片段化,从而产生DNA:RNA片段的固定文库,其中至少一条链用第一标签5’标记。在一些实施方案中,一条链的5'端是RNA链的5'端。在一些实施方案中,一条链的5'端是DNA链的5'端。
在一些实施方案中,捕获寡核苷酸包含聚T序列。在一些实施方案中,RNA包含与捕获寡核苷酸中的一种或多种捕获寡核苷酸的至少一部分互补的序列。在一些实施方案中,第一转座体复合物和/或第二转座体复合物经由第一多核苷酸和/或第二多核苷酸固定到固体载体。在一些实施方案中,该方法还包括在施用RNA的步骤之后洗涤固体载体以去除任何未结合的RNA。在一些实施方案中,该方法还包括将具有结合的DNA的第一固体载体与具有标记的DNA:RNA片段的固定文库的第二固体载体重组。
E.使用具有DNA和RNA的顺序固定的2个小珠以及制备双链cDNA的方法
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法使用2个固体载体。在一些实施方案中,固体载体是小珠。在一些实施方案中,将DNA和由RNA生成的双链cDNA(ds-cDNA)顺序固定在分开的固体载体上。
在一些实施方案中,从包含RNA和DNA的样品制备标记片段的固定文库的方法(其中标记片段包含DNA特异性条形码或RNA特异性条形码)包括将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;固定DNA;在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;从RNA制备双链cDNA;将样品与用于固定cDNA的第二固体载体组合,其中第二固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和RNA特异性条形码;以及固定cDNA并且在第二固体载体上进行标签化以制备包含RNA特异性条形码的标记片段。
在一些实施方案中,ds-cDNA在溶液中生成。在一些实施方案中,在第二固体载体上进行标签化之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
在一些实施方案中,该方法包括在第一固体载体上进行标签化之后并且在从RNA制备双链cDNA之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
在一些实施方案中,该方法包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
在一些实施方案中,从RNA制备双链cDNA通过模板转换进行。
F.使用具有DNA和RNA的顺序固定的2个小珠以及制备DNA:RNA双链体的方法
在一些实施方案中,从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法使用2个固体载体。在一些实施方案中,固体载体是小珠。在一些实施方案中,将DNA和由RNA生成的DNA:RNA双链体顺序固定在分开的固体载体上。
在一些实施方案中,从包含RNA和DNA的样品制备标记片段的固定文库的方法(其中标记片段包含DNA特异性条形码或RNA特异性条形码)包括将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;固定DNA;在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;从RNA制备cDNA的单链以产生DNA:RNA双链体;将样品与用于固定DNA:RNA双链体的第二固体载体组合,其中第二固体载体包含固定在其上的转座体复合物,其中转座体复合物包含对DNA:RNA双链体具有活性的转座酶和转座子,该转座子包含转座子末端序列和RNA特异性条形码;以及固定DNA:RNA双链体并且在第二固体载体上进行标签化以制备包含RNA特异性条形码的标记片段。
在一些实施方案中,该方法还包括在第二固体载体上进行标签化之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
在一些实施方案中,该方法还包括在第一固体载体上进行标签化之后并且在从RNA制备cDNA的单链以产生DNA:RNA双链体之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
在一些实施方案中,该方法还包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
在一些实施方案中,DNA:RNA双链体在溶液中生成。在一些实施方案中,在第二固体载体上进行标签化之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
G.使用2个小珠的方法:使用DNA BLT的DNA标签化和溶液相cDNA或DNA:RNA双链体 标签化
在一些实施方案中,可以使用DNA BLT对样品中的DNA进行标签化,并且然后在溶液中对从RNA制备的双链cDNA或DNA:RNA双链体进行标签化。换句话说,在制备标记的DNA片段后,cDNA或DNA:RNA双链体可以与溶液相转座体复合物反应。在一些实施方案中,双链cDNA或DNA:RNA双链体的标签化掺入可与捕获探针杂交的序列。在一些实施方案中,从cDNA或DNA:RNA双链体生成的标记片段可被在其表面上包含捕获探针的固体载体结合。
在一些实施方案中,从包含RNA和DNA的样品制备标记片段的固定文库的方法(其中标记片段包含DNA特异性条形码或RNA特异性条形码)包括将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;固定DNA;在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;从RNA制备双链cDNA;在溶液中对双链DNA进行标签化以制备双链cDNA的标记片段,其中溶液中的转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列、RNA特异性条形码和与捕获探针杂交的序列,其中标记片段包含RNA特异性条形码和与捕获探针杂交的序列;将样品与具有包含捕获探针的表面的第二固体载体组合;以及将双链cDNA的标记片段固定在第二固体载体上。
在一些实施方案中,该方法还包括在将双链cDNA的标记片段固定在第二固体载体上之后将第一固体载体和第二固体载体组合,其中每个固体载体具有固定的标记片段,该标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者。
在一些实施方案中,该方法还包括在第一固体载体上进行标签化之后并且在从RNA制备双链cDNA之前,将具有包含DNA特异性条形码的固定的标记片段的第一固体载体与样品的其余部分分开。
在一些实施方案中,该方法还包括在固定DNA之后并且在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段之前,将具有固定DNA的第一固体载体与样品的其余部分分开。
在一些实施方案中,从包含RNA和DNA的样品制备标记片段的固定文库的方法(其中标记片段包含DNA特异性条形码或RNA特异性条形码)包括将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中第一固体载体包含固定在其上的转座体复合物,其中转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列和DNA特异性条形码;固定DNA;在第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;从RNA制备cDNA的单链以产生DNA:RNA双链体;在溶液中对DNA:RNA双链体进行标签化以制备DNA:RNA双链体的标记片段,其中溶液中的转座体复合物包含转座酶和转座子,该转座子包含转座子末端序列、RNA特异性条形码和与捕获探针杂交的序列,其中标记片段包含RNA特异性条形码和与捕获探针杂交的序列;将样品与具有包含捕获探针的表面的第二固体载体组合;以及将DNA:RNA双链体的标记片段固定在第二固体载体上。
在一些实施方案中,捕获探针包含核酸。
实施例
实施例1.使用包含捕获寡核苷酸的BLT制备RNA测序文库
可使用本文所述的方法从来自包含RNA的样品的全长总RNA制备RNA测序文库。
通过将mRNA的聚A尾结合到小珠上的聚T捕获寡核苷酸,可以将来自样品的mRNA固定到RNA小珠连接的转座体(BLT)。
然后,将逆转录酶用于cDNA合成。逆转录酶聚合酶用于从结合到小珠的靶RNA生成DNA:RNA双链体。用于cDNA合成的示例性试剂包括逆转录酶、随机引物、寡dT引物、dNTP和/或RNA酶抑制剂。随机引物和寡dT引物两者均可用于cDNA合成反应。
cDNA合成反应可以在42℃下进行90分钟,然后在85℃下进行5分钟。在cDNA合成后不需要洗涤样品。
DNA:RNA双链体的标签化然后可以用RNA BLT进行。已经描述了可用于生成RNABLT的多种BLT。DNA:RNA双链体的标签化用于生成通过转座体固定到小珠上的DNA:RNA片段。
BLT的转座体复合物可包含结合到第一多核苷酸的转座酶,该第一多核苷酸包含含有转座子末端序列的3'部分以及第一标签。以这种方式,在DNA:RNA片段的生成期间掺入第一标签。
在片段化后,进行链交换和间隙-填充连接。在一些实施方案中,进行第二标签化反应以生成双链DNA片段,其中一端在溶液中。第二标签化反应可掺入第二标签。
然后可以释放文库以用于可以在管中或在流通池中进行的另外方法。该方法允许提供全长mRNA的序列的方法。
此类方法也可与可活化的BLT一起使用,该可活化的BLT包含可结合到溶液中的转座体的固定寡核苷酸。这样的小珠在图13中示出,其中第二转座子中的A'序列可结合到用于结合转座体的固定多核苷酸中的shortA序列。固定寡核苷酸还可包含衔接子(诸如P5序列)和小珠代码(BC),如图13所示。
实施例2.使用3个小珠制备多组学测序文库
使用3个小珠的方法可用于从包含RNA和DNA的样品生成RNA和DNA测序文库,如图24所示。该方法利用可结合RNA但不具有转座体的RNA捕获小珠。
在该方法中,DNA BLT可用于DNA标签化,同时RNA被RNA捕获小珠捕获。在洗涤后,将RNA从RNA捕获小珠转移到RNA BLT。在逆转录后,DNA:RNA双链体可被片段化并且被活性RNA BLT标记。在链交换和间隙-填充连接后,RNA和DNA测序文库然后可从相应的BLT释放。
实施例3.使用缺乏活性转座体复合物的DNA BLT和RNA小珠制备多组学测序文库
缺乏转座酶的DNA BLT和RNA BLT(随后添加转座酶以生成RNA BLT)可用于从包含RNA和DNA的样品生成RNA和DNA测序文库,如图23所示。结合RNA但缺乏转座酶的BLT可被称为“裸”RNA BLT。
在该方法中,DNA BLT可用于对DNA进行标签化,同时RNA被裸RNA BLT捕获。在洗涤后,添加转座酶以活化RNA BLT。在逆转录后,DNA:RNA双链体可被活性RNA BLT标签化。在链交换和间隙-填充连接后,RNA和DNA测序文库然后可从相应的BLT释放。
实施例4.使用DNA BLT和失活的RNA BLT制备多组学测序文库
DNA BLT和可逆地“失活的”RNA BLT可用于从包含RNA和DNA的样品生成RNA和DNA测序文库,如图22所示。
在该方法中,DNA BLT可用于对DNA进行标签化,同时RNA被失活的RNA BLT捕获。在洗涤后,逆转RNA BLT的失活(即,RNA BLT的转座体复合物被活化)。在活化后,进行逆转录,并且DNA:RNA双链体可被片段化并被活性RNA BLT标记。在链交换和间隙-填充连接后,RNA和DNA测序文库然后可从相应的BLT释放。
已知多种可逆转座体去活化剂,诸如去磷酸化的ME'、转座子末端上的额外可切割碱基、可结合到转座体的抑制剂双链体、以及可与转座酶的DNA结合位点复合的热不稳定抗体。
实施例5:使用具有DNA和RNA的顺序固定的2个小珠制备多组学测序文库
顺序步骤可用于从包含RNA和DNA的样品生成RNA和DNA测序文库,如图25所示。DNA可被DNA BLT捕获,并且DNA被标签化。该步骤用过量的小珠进行,使得所有的双链DNA结合到DNA BLT。然后将RNA与标签化的DNA BLT分开(即,物理分离或隔离)。然后通过包含聚T捕获寡核苷酸的RNA BLT捕获RNA,并且通过逆转录酶聚合酶生成RNA-DNA双链体。DNA:RNA双链体可通过RNA BLT的转座体复合物标签化。在链交换和间隙-填充连接后,RNA和DNA测序文库然后可从相应的BLT释放。
实施例6:在溶液中经由cDNA合成制备RNA测序文库
在一些方法中,在结合到BLT之前在溶液中生成DNA:RNA双链体。在该方法中,BLT可包含结合到DNA:RNA双链体的捕获寡核苷酸。另选地,DNA:RNA双链体可被转座体复合物的转座酶结合。
包含靶RNA的样品可用于在溶液中生成cDNA。用于生成全长cDNA的示例性溶液可包含逆转录酶、引物、dNTP和/或RNA酶抑制剂。寡dT引物可用于从mRNA制备全长cDNA。寡dT引物和随机引物可用于制备全长总RNA。cDNA合成可以在42℃下进行90分钟,然后在85℃下进行5分钟而不洗涤。以这种方式,在溶液中生成DNA:RNA双链体(如图2所示)。
这些DNA:RNA双链体可结合到BLT以用于标签化。该标签化可用标准Illumina DNAFlex PCR-Free(仅研究使用,RUO)技术进行,该技术先前称为Illumina的Nextera技术,其使用两种不同的转座体复合物来在片段的相对端掺入不同的衔接子序列。另选地,可以使用用BLT进行对称标签化,随后进行引物延伸以引入另一衔接子的方法。
在生成固定的DNA:RNA片段后,可终止或去除转座酶(诸如通过SDS)。链交换可生成双链DNA,随后进行间隙填充和连接。然后,可以释放所制备的文库。该方法可以在管或流通池中进行。图3A至图3C示出来自RNA测序文库的代表性测序结果,该RNA测序文库是在溶液中使用cDNA合成从通用人类参考RNA生成DNA:RNA双链体,随后通过包含固定转座体复合物的小珠进行片段化而生成的。文库成功地从转录物生成并与外显子序列比对。当使用包括在溶液中生成DNA:RNA双链体的方法时,这些数据支持在测序结果中相对缺乏3'偏倚,因为序列读段代表原始转录物分子的整个长度。使用该方法的自动化工作流程可以用最少的用户输入从总RNA生成可测序文库。
图9示出可如何使用聚T引物和溶液中DNA:RNA双链体的制备与BLT上的标签化和文库制备来从全长mRNA制备文库。图10示出可如何使用随机引物和溶液中DNA:RNA双链体的制备与BLT上的标签化和文库制备来从总RNA制备文库。对于这两种方法,文库可在BLT上制备,并在流通池或管中释放。流通池中的这种释放可允许以空间定位方式释放,使得来自相同全长RNA或mRNA的片段将在流通池上紧密接近地释放,因为这些片段是在相同小珠上制备的。
实施例7.使用双RNA/DNA条形码编码和分区制备多组学测序文库
一种方法可生成具有不同寡核苷酸索引序列的小珠连接的转座体(BLT),这些不同寡核苷酸索引序列在NGS读段中是可识别的(参见Zhang等人,Nat.Biotech.,第35卷,第852-857页(2017年))。在文库制备工作流程期间应用具有不同寡核苷酸索引的BLT来掺入用于识别RNA和DNA来源的NGS读段的差异分子标签。
代表性方法在图26中示出。首先,将装载有识别DNA靶物质的寡核苷酸索引(“DNA特异性条形码”)的BLT应用于总核酸(TNA)样品。样品中的双链DNA(dsDNA)通过DNA条形码BLT(DNA BLT)特异性地标签化。磁性链分离可应用于将DNA BLT上的标签化DNA片段与溶液中的RNA分子分开。然后通过本领域普通技术人员已知的逆转录和第二链合成方法(包括“链”和“非链”合成方法)将分离的RNA分子完全转化为ds-互补DNA(ds-cDNA)。然后将具有RNA识别条形码(RNA BLT上的“RNA特异性条形码”)的BLT应用于对ds-cDNA样品进行标签化。
然后可将两个标签化文库组合并一起或单独扩增。后者对于指定RNA和DNA来源的文库分子的不同扩增水平可能是有利的。另选地,RNA特异性条形码和DNA特异性条形码还可包含不同的引物结合序列,其能够通过不同的PCR条件(例如,RNA和DNA扩增引物集的不同扩增循环数)实现差异RNA和DNA文库扩增。如果分别扩增RNA和DNA文库,则可以使用PCR样品索引代替索引的转座体来将NGS读段识别为具有RNA或DNA分子来源。
在扩增后,RNA和DNA文库可直接测序或在测序前富集靶向区域。当RNA特异性条形码或DNA特异性条形码与每个文库片段一起测序时,这些条形码可用于在二级生物信息学分析期间将源自DNA的那些样品与源自RNA的那些样品分类。
实施例8.在单个反应容器中使用BLT标签化和双RNA/DNA条形码编码制备多组学 测序文库
多组学测序文库的制备也可以在单个反应器中进行(即,单锅方案)而不进行分区。
如实施例7中那样在TNA样品上进行DNA特异性条形码BLT(DNA BLT)标签化。在DNA标签化反应完成后,可以添加包含合成dsDNA的“自杀dsDNA”底物。合成dsDNA的目的是饱和DNA-条形码BLT(DNA BLT)并占据任何剩余的未反应的DNA BLT(并通过该DNA BLT标签化)。这防止未反应的DNA BLT在下游步骤中与RNA来源的底物交叉反应。示例性自杀是含尿嘧啶的dsDNA,其是用于标签化的底物,但在采用尿嘧啶不耐受的DNA聚合酶的PCR反应中不会被扩增。
在相同反应管中,在dsDNA标签化后,从溶液中的RNA分子生成ds-cDNA。这种cDNA合成可以在两个步骤中实现以生成“链文库”(例如,采用具有尿嘧啶碱基的第二链合成,具有与“自杀dsDNA”类似的效果)或在一个步骤中使用模板转换寡核苷酸和相容的逆转录酶(例如,SMRT-seq,Takara Bio)。一旦生成ds-cDNA,就应用RNA特异性条形码BLT(RNA BLT)以对这些底物分子进行特异性标签化。两种标签化产物被一起清除和洗脱(在相同管中)。在DNA BLT与RNA BLT上的标签化期间掺入的差异引物结合序列也可以实现差异RNA和DNA文库扩增水平。可以如实施例7中那样进行RNA和DNA来源的分子的任选富集、测序和生物信息学去卷积。
实施例9.使用对DNA:RNA双链体具有活性的转座酶,用双RNA/DNA条形码编码进行 BLT标签化
可修改实施例8中描述的方法以与DNA:RNA双链体一起使用。该方法避免了合成cDNA的第二链(和相关联的清除)步骤的需要。在使用DNA BLT对DNA进行标签化以掺入DNA特异性条形码后,进行逆转录以生成第一链cDNA,从而产生DNA:RNA双链体。可以使用对DNA:RNA双链体具有活性的RNA特异性条形码BLT(RNA BLT)来对这些DNA:RNA双链体进行标签化。XGEN已开发出对DNA:RNA双链体具有活性的ted-转座子产物。该方法避免了对生成ds-cDNA的需要。
实施例10.以单细胞分辨率制备RNA测序文库
BLT可使用诸如具有微孔的小滴或流通池的方法从单细胞形式的转录物制备文库。
在使用小滴的方法中(图4和图5),首先将细胞分离成小滴,该小滴含有用P5装饰的至少一个小珠、小珠代码(条形码)和寡dT序列的。可以使用大约1000种不同类型的条形码小珠,因为空间条形码编码为条形码编码提供了另外3个数量级。将含有与小珠杂交的mRNA的小珠从小滴中去除,并使用逆转录酶和核苷酸批量进行cDNA合成。
术语“批量”是指在溶液中的小珠上发生的cDNA合成,因此小珠不在小滴中,但是mRNA保持与小珠杂交并且不在溶液本身中。因此,批量制备cDNA允许在小珠外进行更简单的工作流程,但是这种制备维持不同小珠上不同mRNA的空间分离。用包含P7-ME序列的转座子通过单侧标签化生成文库,并使用连接完成。
将小珠递送到流通池而不释放片段,并且以空间定位方式在流通池上释放单细胞RNA文库以实现空间条形码编码。以这种方式,源自单个细胞的转录物可以从来自其他细胞的转录物解析,因为来自相同细胞的转录物更接近。如图5所示,这导致文库偏向原始mRNA分子的3'端。
对于从全长mRNA制备文库的工作流程(图7),小珠由两种不同类型的寡核苷酸(用以杂交mRNA的聚T捕获寡核苷酸和用以组装转座子的固定的P5-条形码-shortA寡核苷酸)组成。该shortA序列可与转座子中的序列杂交。换句话说,这些方法可使用如本文所述的可用于组装转座子的“可活化转座子”。
在小珠上的cDNA合成后,使用附接到第二转座子的ME’序列的A5'柄将转座子组装在小珠上。长转录物环绕小珠并在多个位点处标签化。在该步骤后,将ME'-A5'(即,第二转座子)去杂交,并将ME'-A5'-P7寡核苷酸杂交,然后进行间隙填充连接反应。这导致从mRNA分子生成的全长转录物转化成包裹在小珠周围的连锁读段。此外,文库片段包含在标签化期间掺入的一个或多个衔接子以及在寡核苷酸连接期间掺入的一个或多个衔接子。然后以空间定位的方式在流通池上释放文库片段。
为了在不需要小滴的情况下直接在流通池上进行单细胞工作流程,可以使用整合有微孔的流通池(图8)。除了由于与微孔分隔而具有少得多至没有条形码之外,可以使用上述用于小滴的小珠。换句话说,通过使用微孔提供的空间分辨率可以避免使用小珠代码的需要。细胞被捕获在微孔内(通常每个微孔一个细胞)。来自裂解细胞的mRNA被捕获在微孔内的小珠上,并且然后使用上文对于小滴实施方案所述的方法转化为文库。微孔提供空间分辨率,使得文库通常由给定微孔内的单个细胞生成。
图11A至图11C示出可用于此类方法的小珠的一些特征。图11A示出在生成cDNA的第一链以制备DNA:RNA双链体之后的小珠,图11B示出多个转座体可如何在多个位置处使DNA:RNA双链体片段化,并且图11C示出具有多个捕获寡核苷酸和组装的转座体的小珠。
实施例10.具有3’UMI的RNA测序文库的制备
方法可以组合用于精确定量的3’UMI标记和连锁长读段小珠代码以实现单个细胞的全长计数测定。
对于该方法,将UMI序列和引物着陆位点掺入用于第一链cDNA合成的聚T引物中(图14)。该引物着陆位点可以是P5或P7(或它们的互补物),其允许在流通池上捕获所得文库片段。聚T引物还可包含其他序列,诸如第一读段测序衔接子序列或第二读段测序衔接子序列。
可以制备cDNA的第二链,诸如来自Clonetech的Smart-Seq,其将使得能够在标签化之前预扩增cDNA,从而使该方法与单个细胞和超低RNA输入相容(图16)。
接下来,将具有3’UMI的全长双链cDNA用具有共同小珠代码的小珠连接的转座体进行标签化,使得每个小珠具有独特的代码。这将导致单个标签化以捕获双链cDNA的3'端片段,而其他片段经历对称标签化以在片段的两端处掺入相同的衔接子序列(图14)。接下来,将第二转座子去杂交,并且将多核苷酸与第一转座体的ME序列退火。多核苷酸可包含与在标签化期间引入的那些不同的衔接子序列,以允许制备用于标准平台的可测序片段。在小珠连接的转座体上标签化后杂交多核苷酸的“y-衔接子型”使其与链RNA文库制备物相容。该工作流程可以比标准不对称标签化工作流程更灵敏,这可以导致非生产性标签化事件(其中末端片段在片段的两端处具有相同衔接子并且不能在标准平台上测序)。
标签化可以用可活化的BLT进行,其中小珠表面上固定寡核苷酸内的序列可以与第二转座子(Hyb'-ME')杂交以组装活性转座体(图14);或者用BLT进行,其中转座体的第一转座子(即,第一多核苷酸)被固定到小珠(图15和图16)。
通常使用该方法,全长转录物将被单个小珠标签化,该小珠用相同的小珠代码序列对原始全长RNA的所有段进行标签化。这允许所有片段连接回原始转录物以及在逆转录期间引入的UMI(图15)。以这种方式,具有相同小珠代码的片段基于测序结果,连同标记独特转录物的UMI(与重复或测序伪影相反)。该方法定量评估全长RNA,并且与3'UMI标记、预扩增和全长RNA同种型检测相容。
实施例11.经由PRESS-BLT制备RNA测序文库
标签化反应可以在使用引物延伸链特异性BLT(PRESS-BLT)方法的cDNA制备的链方法之后进行。该工作流程可使用BLT方法产生链特异性RNA-seq文库。
PRESS-BLT的第一步骤是cDNA合成。与其他链特异性RNA测序方法(诸如TruSeqStranded Total
Figure BDA0004113503390001081
Illumina)一样,使用逆转录酶、随机引物和包括放线菌素D的第一链合成缓冲液(例如,来自Illumina的FSA缓冲液)将总RNA复制到cDNA的第一链中。放线菌素D特异性地抑制DNA依赖性DNA合成并改善链特异性。
由于双链cDNA是标签化和链特异性所必需的,因此在第二链合成反应中用dUTP替换dTTP。在第二链中掺入dUTP抑制了其在文库制备期间在索引PCR中的扩增。因此,在第二链中掺入dUTP允许链特异性BLT方法。
接下来,制备BLT制剂。通过将Tn5-V3酶与包含19bp镶嵌末端(ME)序列的退火双链序列一起温育来组装转座体。顶部链(即,第一转座子)被称为转移链,因为它共价附接到标记DNA或cDNA的5'端。底部链(即,第二转座子)被称为非转移链。在标签化后,在称为ME'的反向互补ME序列的非转移链和标签化DNA的3'端之间存在9bp间隙。对于引物延伸工作流程,在转移链的5'端处存在称为A14的14bp序列。A14是使用索引引物进行文库扩增所必需的着陆位点中的一个着陆位点。最后,附接到A14序列的5'端的是脱硫生物素修饰。脱硫生物素与链霉亲和素紧密结合,并且用于将转座体附接到磁性小珠以形成BLT。使用脱硫生物素代替生物素是因为与生物素相比,其对链霉亲和素具有更高的结合亲和力。脱硫生物素的使用是重要的,因为其减少了生物素化DNA在文库产物中的传载,这可影响文库制备后富集工作流程。与PRESS-BLT一起使用的代表性转座体复合物在图17中示出。
最后,通过引物延伸进行链特异性文库制备。使用本领域的标准不对称标签化方法,用含有A14和B15转座体的混合物的BLT对cDNA进行标签化。仅用A14或仅用B15进行标签化的片段不产生可行的文库产物。这意味着所有标签化片段的大约一半丢失,从而导致降低的文库制备效率。
具有引物延伸工作流程的PRESS-BLT没有这个问题。cDNA仅用A14转座体标签化(图17)。然后将非转移的ME'熔融掉并通过PCR延伸填充间隙。然后将B15-ME引物与填充间隙的ME’序列退火并延伸以产生在插入物的一端处包括B15并且在另一端处包含A14的拷贝。UMI可以在B15和ME之间的引物中插入,或者在A14和ME序列之间的BLT上制造。UMI是重要的,因为它们标记独特的mRNA转录物并将它们与通过PCR扩增产生的拷贝区分开。在引物延伸后,通过热或氢氧化钠处理将B15-插入物-A14拷贝从小珠熔融掉(图18),并转移到新管中以用于索引引物扩增。
如图19所示,PRESS-BLT工作流程也可以使用双生物素来固定转座体,因为这可以改善转座体的结合和释放。
等同内容
上述书面说明书被认为足以使得本领域的技术人员能够实践实施方案。上述详细描述和实施例详述了某些实施方案,并且描述了发明人所设想的最佳模式。然而,应当理解,无论前述内容在文本中可能描述得多么详尽,该实施方案都可以多种方式实践,并且应当根据所附权利要求及所附权利要求的任何等同条款来解释。
如本文所用,术语“约”是指数值,包括例如整数、分数和百分比,无论是否明确指出。术语“约”通常是指本领域普通技术人员将认为等于所列举的值(例如,具有相同的功能或结果)的数值范围(例如,所列举范围的+/-5-10%)。当术语诸如“至少”和“约”在数值或范围的列表之前时,该术语修饰列表中提供的所有值或范围。在一些情况下,术语“约”可包括四舍五入到最近有效数字的数值。

Claims (31)

1.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中所述标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者,所述方法包括:
a.将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中所述第一固体载体包含固定在其上的转座体复合物,其中所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列和DNA特异性条形码;
b.固定所述DNA;
c.在所述第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;
d.从所述RNA制备双链cDNA;
e.将所述样品与用于固定cDNA的第二固体载体组合,其中所述第二固体载体包含固定在其上的转座体复合物,其中所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列和RNA特异性条形码;以及
f.固定所述cDNA并且在所述第二固体载体上进行标签化以制备包含RNA特异性条形码的标记片段。
2.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中所述标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者,所述方法包括:
a.将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中所述第一固体载体包含固定在其上的转座体复合物,其中所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列和DNA特异性条形码;
b.固定所述DNA;
c.在所述第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;
d.从所述RNA制备cDNA的单链以产生DNA:RNA双链体;
e.将所述样品与用于固定DNA:RNA双链体的第二固体载体组合,其中所述第二固体载体包含固定在其上的转座体复合物,其中所述转座体复合物包含对DNA:RNA双链体具有活性的转座酶和转座子,所述转座子包含转座子末端序列和RNA特异性条形码;以及
f.固定所述DNA:RNA双链体并且在所述第二固体载体上进行标签化以制备包含RNA特异性条形码的标记片段。
3.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中所述标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者,所述方法包括:
a.将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中所述第一固体载体包含固定在其上的转座体复合物,其中所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列和DNA特异性条形码;
b.固定所述DNA;
c.在所述第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;
d.从所述RNA制备双链cDNA;
e.在溶液中对所述双链DNA进行标签化以制备所述双链cDNA的标记片段,其中溶液中的所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列、RNA特异性条形码和与捕获探针杂交的序列,其中所述标记片段包含所述RNA特异性条形码和与捕获探针杂交的所述序列;
f.将所述样品与具有包含捕获探针的表面的第二固体载体组合;以及
g.将双链cDNA的所述标记片段固定在所述第二固体载体上。
4.一种从包含RNA和DNA的样品制备标记片段的固定文库的方法,其中所述标记片段包含DNA特异性条形码或RNA特异性条形码中的任一者,所述方法包括:
a.将包含RNA和DNA的样品与用于固定DNA的第一固体载体组合,其中所述第一固体载体包含固定在其上的转座体复合物,其中所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列和DNA特异性条形码;
b.固定所述DNA;
c.在所述第一固体载体上进行标签化以制备包含DNA特异性条形码的标记片段;
d.从所述RNA制备cDNA的单链以产生DNA:RNA双链体;
e.在溶液中对所述DNA:RNA双链体进行标签化以制备所述DNA:RNA双链体的标记片段,其中溶液中的所述转座体复合物包含转座酶和转座子,所述转座子包含转座子末端序列、RNA特异性条形码和与捕获探针杂交的序列,其中所述标记片段包含所述RNA特异性条形码和与捕获探针杂交的所述序列;
f.将所述样品与具有包含捕获探针的表面的第二固体载体组合;以及
g.将DNA:RNA双链体的所述标记片段固定在所述第二固体载体上。
5.根据权利要求1至4中任一项所述的方法,还包括在所述第一固体载体上进行标签化之后向所述第一固体载体添加合成双链DNA,任选地其中所述合成双链DNA包含尿嘧啶,并且扩增用尿嘧啶不耐受的DNA聚合酶进行。
6.根据权利要求1至5中任一项所述的方法,其中所述DNA特异性条形码和所述RNA特异性条形码包含不同的引物结合序列,任选地其中所述方法还包括:
a.使用结合包含在所述DNA特异性条形码中的所述引物结合序列的引物来扩增包含所述DNA特异性条形码的标记片段;
b.使用结合包含在所述RNA特异性条形码中的所述引物结合序列的引物来扩增包含所述RNA特异性条形码的标记片段;或者
c.使用引物混合物扩增包含所述DNA特异性条形码的标记片段和包含所述RNA特异性条形码的标记片段,所述引物混合物包含结合包含在所述DNA特异性条形码中的所述引物结合序列的引物和结合包含在所述RNA特异性条形码中的所述引物结合序列的引物。
7.一种从RNA制备单链DNA的链特异性文库的方法,所述方法包括:
a.在抑制DNA依赖性DNA合成的条件下使用逆转录酶、引物和包含dTTP的核苷酸从样品中包含的RNA制备cDNA的第一链;
b.使用DNA聚合酶、引物和包含dUTP的核苷酸从cDNA的所述第一链制备cDNA的第二链以制备双链cDNA;
c.将所述双链cDNA应用于其上固定有转座体复合物的固体载体,其中每个转座体复合物包含:
i.转座酶;
ii.第一转座子,所述第一转座子含有转座子末端序列的3’部分以及第一读段测序衔接子序列;其中所述第一转座子包含用于将所述转座体复合物固定到所述固体载体的5’亲和元素;以及
iii.第二转座子序列,所述第二转座子序列包含与所述转座子末端序列全部或部分互补的序列;
d.用所述转座体复合物在所述双链DNA上进行标签化以制备包含所述第一读段测序衔接子序列的标记双链DNA片段,
e.去除所述第二转座子并进行间隙-填充和延伸;
f.分离所述双链DNA片段的所述链;
g.将包含第二读段测序衔接子序列的引物与所述转座子末端序列或与所述转座子末端序列全部或部分互补的所述序列杂交,并扩增以制备DNA链,所述DNA链不附接到所述固体载体并且包含所述第一读段测序衔接子和所述第二读段测序衔接子;以及
h.从所述固体载体释放通过所述扩增生成的所述链,其中所述释放释放包含所述第一读段测序衔接子和所述第二读段测序衔接子的单链DNA片段。
8.根据权利要求7所述的方法,其中:
a.抑制DNA依赖性DNA合成的所述条件是存在包含放线菌素D的缓冲液;
b.所述引物是一种或多种随机引物或所述引物是随机引物和聚T引物的混合物;
c.用于制备cDNA的第二链的所述引物与用于制备cDNA的第一链的所述引物相同;
d.所述RNA是长的非译码RNA或反义转录物;
e.用尿嘧啶不耐受聚合酶进行所述扩增;并且/或者
f.所述亲和元素是生物素、脱硫生物素或双生物素,并且所述固体载体在其表面上包含链霉亲和素或亲和素。
9.根据权利要求7或权利要求8所述的方法,其中:
a.独特分子标识符(UMI)包含在包含第二读段测序衔接子序列的所述引物中,任选地其中所述UMI位于所述第二读段测序衔接子序列和能够结合到所述转座子末端序列的所述序列或与所述转座子末端序列全部或部分互补的所述序列之间;或者
b.UMI包含在所述第一转座子中,任选地其中所述UMI位于所述转座子末端序列和所述第一读段测序衔接子序列之间。
10.根据权利要求9所述的方法,还包括用包含所述第一读段测序衔接子和所述第二读段测序衔接子的所述单链DNA片段进行索引引物扩增以在所述释放之后制备索引片段,任选地其中所述索引引物扩增在与所述固体载体分离的反应容器中进行,并且/或者其中所述索引引物扩增用尿嘧啶不耐受聚合酶进行。
11.一种从RNA制备双链DNA片段的文库的方法,所述方法包括:
a.使用包含UMI和第一读段测序衔接子序列的聚T引物在样品中从全长RNA制备cDNA的第一链;
b.制备cDNA的第二链以生成双链cDNA;
c.将所述双链cDNA应用于其上固定有转座体复合物的小珠,其中每个转座体复合物包含:
i.转座酶;
ii.第一转座子,所述第一转座子包含3’转座子末端序列;以及
iii.第二转座子,所述第二转座子包含与所述转座子末端序列全部或部分互补的序列以及杂交序列;
其中所述转座体复合物通过将所述杂交序列结合到固定到小珠的寡核苷酸而被固定,其中所述寡核苷酸包含5'亲和元素、第一读段测序衔接子序列、小珠代码以及与所述杂交序列全部或部分互补的序列;
d.固定所述双链cDNA并且在所述小珠上进行标签化以制备双链DNA片段;
e.去除所述第二转座子;
f.使包含第二读段测序衔接子序列和与所述转座子末端序列全部或部分互补的序列的引物与所述转座子末端序列杂交;以及
g.进行间隙-填充和延伸以制备包含所述第一读段测序衔接子和所述第二读段测序衔接子的双链DNA片段。
12.一种从RNA制备双链DNA片段的文库的方法,所述方法包括:
a.使用包含UMI和第一读段测序衔接子序列的聚T引物在样品中从全长RNA制备cDNA的第一链;
b.制备cDNA的第二链以生成双链cDNA;
c.将所述双链cDNA应用于其上固定有转座体复合物的小珠,其中每个转座体复合物包含:
i.转座酶;
ii.第一转座子,所述第一转座子包含3'转座子末端序列、小珠代码和第二读段测序衔接子序列;其中所述第一转座子还包含用于将所述转座体复合物固定到所述固体载体的5’亲和元素;以及
iii.第二转座子,所述第二转座子包含与所述转座子末端序列全部或部分互补的序列;
d.固定所述双链cDNA并且在所述小珠上进行标签化以制备双链DNA片段;
e.去除所述第二转座子;
f.使包含第二读段测序衔接子序列和与所述转座子末端序列全部或部分互补的序列的引物与所述转座子末端序列杂交;以及
g.进行间隙-填充和延伸以制备包含所述第一读段测序衔接子和所述第二读段测序衔接子的双链DNA片段。
13.根据权利要求11或12所述的方法,其中与所述转座子末端序列全部或部分互补的所述序列短于所述转座子末端序列,任选地其中当与所述转座子末端序列全部或部分互补的所述序列短于所述转座子末端序列时,生成较少的衔接子二聚体。
14.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含靶RNA的样品应用于其上固定有转座体复合物和捕获寡核苷酸的固体载体,任选地其中所述靶RNA包含与所述捕获寡核苷酸中的一种或多种捕获寡核苷酸的至少一部分互补的序列并且/或者所述捕获寡核苷酸包含聚T序列,其中所述转座体复合物包含结合到第一多核苷酸的转座酶,所述第一多核苷酸包含:
i.包含转座子末端序列的3'部分,以及
ii.第一标签;
其中在所述靶RNA的所述3’端结合到所述捕获寡核苷酸的条件下将所述样品应用于所述固体载体;
b.在合成cDNA并在所述捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
c.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所述转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
15.根据权利要求1至14、16至23或26至30中任一项所述的方法,其中在进行标签化之前使所述转座体复合物可逆地失活,并且进行标签化包括活化所述转座体复合物,任选地其中:
a.所述转座体复合物通过结合到所述转座体复合物的转座体去活化剂可逆地失活,任选地其中:
i.所述转座体去活化剂结合到所述转座体复合物的Tn5结合位点,或者
ii.所述转座体去活化剂包含去磷酸化的ME’、额外的碱基、抑制剂双链体和/或热不稳定抗体;并且/或者
b.通过去除所述转座体去活化剂来活化所述转座体复合物。
16.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含靶RNA的样品应用于其上固定有捕获寡核苷酸和第一多核苷酸的固体载体,其中所述第一多核苷酸包含:
i.包含转座子末端序列的3'部分,以及
ii.第一标签;
其中在所述靶RNA的所述3’端结合到所述捕获寡核苷酸的条件下将所述样品应用于所述固体载体;
b.在转座酶结合到所述第一多核苷酸以形成转座体复合物的条件下添加所述转座酶;
c.在合成cDNA并在所述捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
d.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所述转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
17.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含靶RNA的样品应用于其上固定有捕获寡核苷酸和第一多核苷酸的固体载体,其中所述第一多核苷酸包含:
i.包含转座子末端序列的3'部分,以及
ii.第一标签;
其中在所述靶RNA的所述3’端结合到所述捕获寡核苷酸的条件下将所述样品应用于所述固体载体;
b.在合成cDNA并在所述捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;
c.在转座酶结合到所述第一多核苷酸以形成转座体复合物的条件下添加所述转座酶;以及
d.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所述转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
18.根据权利要求14至17中任一项所述的方法,其中将包含靶RNA的样品应用于固体载体在小滴中进行,任选地其中将包含靶RNA的样品应用于固体载体包括:
a.在小滴中与小珠一起提供单个细胞;
b.裂解所述小滴中的所述细胞;
c.从所述单个细胞释放所述靶RNA;以及
d.将所述靶RNA捕获在所述小珠上。
19.根据权利要求18所述的方法,还包括将所述固体载体上的DNA:RNA片段的所述固定文库递送到用于测序的表面,任选地其中所述方法还包括在递送后:
a.在用于测序的所述表面上捕获具有DNA:RNA片段的所述固定文库的所述固体载体;
b.从所述固体载体释放所述固定片段;以及
c.在用于测序的所述表面上捕获所述片段。
20.根据权利要求14至17中任一项所述的方法,其中将包含靶RNA的样品应用于固体载体在所述固体载体上的微孔中进行,并且/或者将包含靶RNA的样品应用于固体载体包括裂解细胞并从微孔中的所述单个细胞释放靶RNA。
21.根据权利要求20所述的方法,还包括释放DNA:RNA片段的所述固定文库并在同一微孔中对所述片段进行测序,任选地其中所述固体载体是包含微孔的流通池。
22.根据权利要求14至21中任一项所述的方法,其中所有所述转座体复合物是相同的,任选地其中所述片段在所述双链片段的两条链的所述5'端处用相同的衔接子序列标记,并且任选地其中所述方法还包括:
a.从所述转座体复合物释放双链靶核苷酸片段,
b.使包含衔接子序列、UMI和与所述第一3'端转座子序列全部或部分互补的序列的多核苷酸杂交,其中所述多核苷酸中包含的所述衔接子序列与所述转座体复合物中包含的所述衔接子序列不同,
c.任选地使所述双链靶核酸片段的第二链延伸,
d.任选地将所述多核苷酸或所延伸的多核苷酸与所述双链靶核酸片段连接,以及
e.产生包含所述UMI的双链靶核酸片段,其中所述UMI直接位于插入DNA的所述3’端附近。
23.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含靶RNA的样品应用于其上固定有捕获寡核苷酸的固体载体,任选地其中所述RNA是mRNA,并且所述捕获寡核苷酸包含聚T序列;
b.在合成cDNA并在所述捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
c.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用溶液中的所述转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
24.一种包含固定在其上的捕获寡核苷酸和第一多核苷酸的固体载体,其中所述第一多核苷酸包含:
a.包含转座子末端序列的3'部分,以及
b.第一标签。
25.一种包含捕获寡核苷酸和固定寡核苷酸的固体载体,其中所述固定寡核苷酸包含用于与包含在转座体复合物中包含的第二转座子中的杂交序列杂交的序列。
26.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含RNA和DNA的所述样品应用于:
i.用于固定DNA的第一固体载体,所述第一固体载体包含固定在其上的第一转座体复合物,其中所述第一转座体复合物包含转座酶和第一多核苷酸,所述第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及
ii.其上固定有第一捕获寡核苷酸的第二固体载体;
其中在所述DNA结合到所述第一固体载体上的所述第一转座体复合物并且被片段化和任选地标记,并且所述RNA结合到所述第二固体载体上的所述第一捕获寡核苷酸的条件下,将所述样品应用于第一固体载体和第二固体载体的混合物;
b.将结合到所述第二固体载体的所述RNA转移到第三固体载体,所述第三固体载体具有固定在其上的结合所转移的RNA的第二捕获寡核苷酸以及第二转座体复合物,其中所述第二转座体复合物包含转座酶和第二多核苷酸,所述第二多核苷酸包含含有转座子末端序列的3'部分以及第二标签;
c.在合成cDNA并在所述第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
d.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所述第二转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
27.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含RNA和DNA的样品应用于:
i.用于固定DNA的第一固体载体,所述第一固体载体包含固定在其上的第一转座体复合物,其中所述第一转座体复合物包含转座酶和第一多核苷酸,所述第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及
ii.其上固定有捕获寡核苷酸和第二多核苷酸的第二固体载体,其中所述第二多核苷酸包含:
包含转座子末端序列的3'部分,以及
第二标签;
其中在所述DNA结合到所述第一固体载体上的所述第一转座体复合物并且被片段化和任选地标记,并且所述RNA结合到所述第二固体载体上的所述捕获寡核苷酸的条件下,将所述样品应用于第一固体载体和第二固体载体的所述混合物;
b.在转座酶结合到所述第二多核苷酸以在所述第二固体载体上形成转座体复合物的条件下添加所述转座酶;
c.在合成cDNA并在所述第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
d.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所述第二转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
28.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含RNA和DNA的样品应用于:
i.用于固定DNA的第一固体载体,所述第一固体载体包含固定在其上的第一转座体复合物,其中所述第一转座体复合物包含转座酶和第一多核苷酸,所述第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签;以及
ii.用于固定RNA的第二固体载体,所述第二固体载体具有固定在其上的捕获寡核苷酸以及可逆地失活的第二转座体复合物,其中所述转座体复合物包含结合到第二多核苷酸的转座酶,所述第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签;其中在所述DNA结合到所述第一固体载体上的所述第一转座体复合物并且被片段化和任选地标记,并且所述RNA结合到所述第二固体载体上的所述捕获寡核苷酸的条件下,将所述样品应用于第一固体载体和第二固体载体的所述混合物;
b.在合成cDNA并在所述第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;
c.活化所述第二转座体复合物;以及
d.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所活化的第二转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
29.一种从包含RNA和DNA的样品制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.将包含RNA和DNA的样品应用于用于固定DNA的第一固体载体,所述第一固体载体包含固定在其上的第一转座体复合物,其中所述第一转座体复合物包含转座酶和第一多核苷酸,所述第一多核苷酸包含含有转座子末端序列的3’部分以及任选第一标签,并且其中在所述DNA结合到所述第一固体载体上的所述第一转座体复合物并且被片段化和任选地标记的条件下应用所述样品;
b.将具有所结合的DNA的所述第一固体载体与所述RNA分离;
c.将所述RNA应用于用于固定RNA的第二固体载体,所述第二固体载体具有固定在其上的捕获寡核苷酸和第二转座体复合物,其中所述第二转座体复合物包含结合到第二多核苷酸的转座酶,所述第二多核苷酸包含含有转座子末端序列的3’部分以及第二标签,并且其中在所述RNA结合到所述第二固体载体上的所述捕获寡核苷酸的条件下应用所述RNA;
d.在合成cDNA并在所述第二捕获寡核苷酸上生成固定的DNA:RNA双链体的条件下添加逆转录酶聚合酶;以及
e.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所活化的第二转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
30.一种从靶RNA制备标记的DNA:RNA片段的固定文库的方法,所述方法包括:
a.在合成cDNA并生成DNA:RNA双链体的条件下,向包含靶RNA的样品中添加逆转录酶聚合酶;
b.将DNA:RNA双链体固定到其上固定有转座体复合物的固体载体,
其中所述转座体复合物包含结合到第一多核苷酸的转座酶,所述第一多核苷酸包含:
i.包含转座子末端序列的3'部分,以及
ii.第一标签;
其中在所述DNA:RNA双链体直接结合到捕获寡核苷酸或转座酶的条件下将所述样品应用于所述固体载体;以及
c.在所述DNA:RNA双链体被标记在一条链的所述5’端上的条件下,用所述转座体复合物在所述DNA:RNA双链体上进行标签化,从而产生DNA:RNA片段的固定文库,其中至少一条链用所述第一标签5’标记。
31.一种使用根据权利要求1至30中任一项所述的方法制备的测序文库。
CN202180057876.8A 2020-08-06 2021-08-05 使用小珠连接的转座体制备rna和dna测序文库 Pending CN116171330A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063061885P 2020-08-06 2020-08-06
US63/061,885 2020-08-06
US202163165830P 2021-03-25 2021-03-25
US63/165,830 2021-03-25
US202163168802P 2021-03-31 2021-03-31
US63/168,802 2021-03-31
US202163219014P 2021-07-07 2021-07-07
US63/219,014 2021-07-07
PCT/US2021/044715 WO2022031955A1 (en) 2020-08-06 2021-08-05 Preparation of rna and dna sequencing libraries using bead-linked transposomes

Publications (1)

Publication Number Publication Date
CN116171330A true CN116171330A (zh) 2023-05-26

Family

ID=77802218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180057876.8A Pending CN116171330A (zh) 2020-08-06 2021-08-05 使用小珠连接的转座体制备rna和dna测序文库

Country Status (11)

Country Link
US (1) US20230183682A1 (zh)
EP (1) EP4192951A1 (zh)
JP (1) JP2023543541A (zh)
KR (1) KR20230041725A (zh)
CN (1) CN116171330A (zh)
AU (1) AU2021320307A1 (zh)
BR (1) BR112023002051A2 (zh)
CA (1) CA3190588A1 (zh)
IL (1) IL300112A (zh)
MX (1) MX2023000872A (zh)
WO (1) WO2022031955A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115747301B (zh) * 2022-08-01 2023-12-22 深圳赛陆医疗科技有限公司 一种测序文库的构建方法、构建测序文库的试剂盒及基因测序方法
US11976325B2 (en) 2022-10-06 2024-05-07 Fluent Biosciences Inc. Quantitative detection and analysis of molecules

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
AU3539089A (en) 1988-04-08 1989-11-03 Salk Institute For Biological Studies, The Ligase-based amplification method
DE68927373T2 (de) 1988-06-24 1997-03-20 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
DE69118930T2 (de) 1990-01-26 1997-01-09 Abbott Lab Verbessertes Verfahren zur Amplifikation von Nuklein säurezielsequenz, einsetzbar für die Polymerase und Ligasekettenreaktion
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
WO1995021271A1 (en) 1994-02-07 1995-08-10 Molecular Tool, Inc. Ligase/polymerase-mediated genetic bit analysistm of single nucleotide polymorphisms and its use in genetic analysis
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
KR100230718B1 (ko) 1994-03-16 1999-11-15 다니엘 엘. 캐시앙, 헨리 엘. 노르호프 등온 가닥 변위 핵산 증폭법
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP2319855B1 (en) 1997-01-08 2016-04-06 Sigma-Aldrich Co. LLC Bioconjugation of Macromolecules
EP1591541B1 (en) 1997-04-01 2012-02-15 Illumina Cambridge Limited Method of nucleic acid sequencing
US7427678B2 (en) 1998-01-08 2008-09-23 Sigma-Aldrich Co. Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US20050191698A1 (en) 1999-04-20 2005-09-01 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6913884B2 (en) 2001-08-16 2005-07-05 Illumina, Inc. Compositions and methods for repetitive use of genomic DNA
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
EP1259643B1 (en) 2000-02-07 2008-10-15 Illumina, Inc. Nucleic acid detection methods using universal priming
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
CN101525660A (zh) 2000-07-07 2009-09-09 维西根生物技术公司 实时序列测定
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
WO2003101972A1 (en) 2002-05-30 2003-12-11 The Scripps Research Institute Copper-catalysed ligation of azides and acetylenes
EP3363809B1 (en) 2002-08-23 2020-04-08 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
CA2528577C (en) 2003-06-20 2012-08-07 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
US7259258B2 (en) 2003-12-17 2007-08-21 Illumina, Inc. Methods of attaching biological compounds to solid supports using triazine
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
AU2005296200B2 (en) 2004-09-17 2011-07-14 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
SG170802A1 (en) 2006-03-31 2011-05-30 Solexa Inc Systems and devices for sequence by synthesis analysis
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
EP2639579B1 (en) 2006-12-14 2016-11-16 Life Technologies Corporation Apparatus for measuring analytes using large scale FET arrays
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
EP3998346A1 (en) 2009-03-30 2022-05-18 Illumina, Inc. Gene expression analysis in single cells
US8148515B1 (en) 2009-06-02 2012-04-03 Biotium, Inc. Detection using a dye and a dye modifier
US9029103B2 (en) 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
WO2012170936A2 (en) 2011-06-09 2012-12-13 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
NO2694769T3 (zh) 2012-03-06 2018-03-03
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
ES2890078T3 (es) 2013-12-20 2022-01-17 Illumina Inc Conservación de la información de conectividad genómica en muestras de ADN genómico fragmentado
EP3132029A2 (en) 2014-04-15 2017-02-22 Illumina, Inc. Modified transposases for improved insertion sequence bias and increased dna input tolerance
SG11201609053YA (en) 2014-04-29 2016-11-29 Illumina Inc Multiplexed single cell gene expression analysis using template switch and tagmentation
SG10201912283RA (en) 2015-08-28 2020-02-27 Illumina Inc Nucleic acid sequence analysis from single cells
WO2017048993A1 (en) * 2015-09-15 2017-03-23 Takara Bio Usa, Inc. Methods for preparing a next generation sequencing (ngs) library from a ribonucleic acid (rna) sample and compositions for practicing the same
EP3571616B1 (en) 2017-01-18 2021-05-19 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
WO2018156519A1 (en) * 2017-02-21 2018-08-30 Illumina Inc. Tagmentation using immobilized transposomes with linkers
WO2019028047A1 (en) 2017-08-01 2019-02-07 Illumina, Inc SPATIAL INDEXING OF GENETIC MATERIAL AND PREPARATION OF PHARMACOTOQUE USING HYDROGEL BALLS AND FLOW CELLS
CA3067048C (en) 2017-08-01 2024-03-05 Illumina, Inc. Hydrogel beads for nucleotide sequencing
AU2018375785A1 (en) 2017-11-30 2019-12-12 Illumina, Inc. Validation methods and systems for sequence variant calls
EP3837381A1 (en) 2018-08-15 2021-06-23 Illumina, Inc. Compositions and methods for improving library enrichment
SG11202102918WA (en) * 2019-01-11 2021-04-29 Illumina Cambridge Ltd Complex surface-bound transposome complexes

Also Published As

Publication number Publication date
WO2022031955A1 (en) 2022-02-10
AU2021320307A1 (en) 2023-02-16
JP2023543541A (ja) 2023-10-17
US20230183682A1 (en) 2023-06-15
IL300112A (en) 2023-03-01
KR20230041725A (ko) 2023-03-24
BR112023002051A2 (pt) 2023-04-18
EP4192951A1 (en) 2023-06-14
CA3190588A1 (en) 2022-02-10
MX2023000872A (es) 2023-02-22

Similar Documents

Publication Publication Date Title
KR102602143B1 (ko) 고체 지지체 상의 샘플 제조법
US20240076658A1 (en) Second strand direct
GB2533882A (en) Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US20230183682A1 (en) Preparation of RNA and DNA Sequencing Libraries Using Bead-Linked Transposomes
EP3746552B1 (en) Methods and compositions for deconvoluting partition barcodes
US11834710B2 (en) Transposase-based genomic analysis
CN116323971A (zh) 核酸的序列特异性靶向转座和选择以及分选
JP2024512917A (ja) 等温相補的dna及びライブラリ調製の改善された方法
CN114040975A (zh) 每液滴多个珠的解决方案
US20240026348A1 (en) Methods of Preparing Directional Tagmentation Sequencing Libraries Using Transposon-Based Technology with Unique Molecular Identifiers for Error Correction
US20240158847A1 (en) Transposase-based genomic analysis
US20240132953A1 (en) Methods and compositions for tracking barcodes in partitions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination