CN113631764A - 用于固态合成在单分子测序中使用的可扩展聚合物的方法、组合物和装置 - Google Patents

用于固态合成在单分子测序中使用的可扩展聚合物的方法、组合物和装置 Download PDF

Info

Publication number
CN113631764A
CN113631764A CN202080015860.6A CN202080015860A CN113631764A CN 113631764 A CN113631764 A CN 113631764A CN 202080015860 A CN202080015860 A CN 202080015860A CN 113631764 A CN113631764 A CN 113631764A
Authority
CN
China
Prior art keywords
oligonucleotide
sequence
dna
template
strand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080015860.6A
Other languages
English (en)
Inventor
L·梅里尔
M·普林德尔
S·韦卢奇
J·钱德拉塞克尔
M·S·科科里斯
G·阿吉雷
J·塔博恩
R·N·麦克鲁尔
M·李
M·科宁
G·蒂森
S·凯勒巴雷特
C·贝里奥斯
A·雅各布斯
T·莱曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roche Sequencing Solutions Co
Original Assignee
Stratos Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stratos Genomics Inc filed Critical Stratos Genomics Inc
Publication of CN113631764A publication Critical patent/CN113631764A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08FMACROMOLECULAR COMPOUNDS OBTAINED BY REACTIONS ONLY INVOLVING CARBON-TO-CARBON UNSATURATED BONDS
    • C08F255/00Macromolecular compounds obtained by polymerising monomers on to polymers of hydrocarbons as defined in group C08F10/00
    • C08F255/02Macromolecular compounds obtained by polymerising monomers on to polymers of hydrocarbons as defined in group C08F10/00 on to polymers of olefins having two or three carbon atoms

Abstract

本发明提供了用于单分子测序,特别是用于可扩展聚合物(例如,Xpandomer)的固态合成和加工的方法、组合物和装置,以及用于产生新的可扩展聚合物构建体的方法和组合物,所述新的可扩展聚合物构建体通过纳米孔传感器时提供更准确的序列信息。

Description

用于固态合成在单分子测序中使用的可扩展聚合物的方法、 组合物和装置
关于序列表的声明
与本申请相关的序列表以文本格式代替纸质副本提供,并在此通过引用并入说明书。包含序列表的文本文件的名称是870225_424WO_Sequence_Listing_ST25.txt。该文本文件为5KB,创建于2020年2月20日,正在通过EFS-Web以电子方式提交。
技术领域
本发明总体涉及用于单分子测序的新方法、组合物和装置,更具体地,涉及用于可扩展聚合物(例如,Xpandomer)的固态合成和加工的改进方法和装置,并且进一步涉及用于产生新的可扩展聚合物构建体的方法和组合物,所述新的可扩展聚合物构建体通过纳米孔传感器时提供更准确序列信息。
背景技术
生物分子的测量是现代医学的基础,广泛用于医学研究,更具体地用于诊断和治疗,以及药物开发。核酸编码生命体活动和繁殖所必需的信息,本质上是生命的蓝图。确定此类蓝图在纯研究和应用科学中都有用。在医学中,测序可用于诊断和研发用于各种病症的治疗方法,包括癌症、心脏病、自身免疫性疾病、多发性硬化症和肥胖症。在工业中,测序可用于设计改进的酶促过程或合成生物。例如,在生物学中,该工具可用于研究生态系统的健康,因此具有广泛的用途。类似地,蛋白质和其他生物分子的测量提供了标志物和对疾病和病原传播的了解。
个体独特的DNA序列提供了有关他们对某些疾病的易感性的宝贵信息。它还为患者提供了筛查以早期发现和/或接受预防性治疗的机会。此外,根据患者的个人蓝图,临床医生将能够施用个性化疗法,以最大限度地提高药物疗效和/或最大限度地降低药物不良反应的风险。类似地,确定病原生物的蓝图可以为传染病提供新的治疗和更稳健的病原体监测。低成本的全基因组DNA测序将为现代医学奠定基础。为了实现该目标,测序技术必须在通量、准确性和读段长度方面不断进步。
在过去的十年中,大量的下一代DNA测序技术已经可商购,已大大降低了全基因组测序的成本。这些包括边合成边测序(″SBS″)平台(Illumina,Inc.,454Life Sciences,IonTorrent,Pacific Biosciences)和基于类似连接的平台(Complete Genomics,LifeTechnologies Corporation)。许多其他技术正在开发中,这些技术利用了各种各样的样品处理和检测方法。例如,GnuBio公司(Cambridge,Mass.)使用皮升反应容器来控制数百万个谨慎的探针测序反应,而Halcyon Molecular(Redwood City,Calif.)正在尝试开发使用透射电子显微镜进行直接DNA测量的技术。
基于纳米孔的核酸测序是一种已被广泛研究的引人注目的方法。Kasianowicz等人(Proc.Natl.Acad.Sci.USA 93:13770-13773,1996)在单链多核苷酸电易位通过嵌入脂双层中的α溶血素纳米孔时,表征了单链多核苷酸。已经证明,在多核苷酸易位期间,可以测量纳米孔孔径的部分堵塞作为离子电流降低的量度。然而,纳米孔中的多核苷酸测序因必须解析紧密间隔的碱基(0.34nm)而承受沉浸在显著背景噪音中的小信号差异。由于观察到多核苷酸的快速易位速率,通常大约为每微秒1个碱基,因此纳米孔中单碱基分辨率的测量挑战变得更加苛刻。可以通过调整运行参数(例如电压、盐成分、pH、温度和粘度等)来降低易位速度。然而,这种调整无法将易位速度降低到允许单碱基分辨率的水平。
Stratos Genomics开发了一种称为扩展测序(“SBX”)的方法,该方法使用生化过程将DNA序列转录到称为“Xpandomer”的可测量聚合物上(Kokoris等人,美国专利号7,939,259″High Throughput Nucleic Acid Sequencing by Expansion″)。转录的序列沿Xpandomer主链在高信噪比报告子中编码,所述报告子相隔约10nm,专为高信噪比、分化良好的反应而设计。这些差异在Xpandomer相对于天然DNA的序列读段效率和准确性方面提供了显著的性能增强。Xpandomer可以实现多种下一代DNA测序检测技术,并且非常适合纳米孔测序。
Xpandomer由称为XNTP的非天然核苷酸类似物产生,其特征在于长的取代基使Xpandomer主链能够在合成后扩展(参见Kokoris等人的已公布的PCT申请号WO2016/081871,通过引用以其整体并入本文)。由于它们的非典型结构,用于纳米孔测序的XNTP聚合成Xpandomer和将Xpandomer加工成扩展形式是低效的过程,尤其是在溶液中。
因此,用于改进核酸模板的Xpandomer拷贝的合成和加工效率以产生富集纳米孔测序的全长产物群的新方法和设备,以及提高序列信息准确性的策略,将在现有技术中发现价值。本发明满足这些需要并提供进一步的相关优点。
背景部分中讨论的所有主题都不一定是现有技术,不应仅仅因为其在背景部分中的讨论而被假定为现有技术。沿着这些思路,除非明确说明是现有技术,否则对背景部分中讨论的或与此类主题相关的现有技术中的问题的任何认识不应被视为现有技术。相反,背景部分中对任何主题的讨论都应被视为发明人解决特定问题的方法的一部分,其本身也可能具有创造性。
发明内容
简而言之,本公开提供了用于单分子纳米孔测序的新方法、组合物和装置。某些实施例中,本公开提供了用于Xpandomer的固态合成和加工的改进方法、组合物和装置,以及用于合成提供更准确序列信息的Xpanodmer的方法和组合物。
一方面,本公开提供了一种在固体基质上合成核酸模板拷贝的方法,所述方法包括以下步骤:a)将连接基固定在固体支持物上,其中所述连接基包括靠近固体支持物的第一末端以及远离固体支持物的第二末端,其中第一末端与马来酰亚胺部分偶联,第二末端与炔烃部分偶联,并且其中马来酰亚胺部分与固体支持物交联;b)将寡核苷酸引物连接到连接基上,其中寡核苷酸引物包括与核酸模板的3’末端的一部分互补的核酸序列,其中寡核苷酸引物的5’末端与叠氮化物部分偶联,并且其中叠氮化物部分与炔烃部分反应形成三唑部分;c)提供包括核酸模板、核酸聚合酶、核苷酸底物或其类似物、合适的缓冲剂和任选的一种或多种添加剂的反应混合物,其中核酸模板与寡核苷酸引物特异性杂交;以及d)进行引物延伸反应以产生核酸模板的拷贝。
在某些实施例中,所述马来酰亚胺部分通过光引发的去质子反应与固体基质交联。在其他实施例中,所述固体基质由聚烯烃组成,在替代实施例中,聚烯烃可以是环烯烃共聚物(COC)或聚丙烯。在一些实施例中,核酸模板是DNA模板并且DNA模板的拷贝是可扩展聚合物,其中所述可扩展聚合物包括非天然核苷酸类似物的链,并且其中所述非天然核苷酸类似物中的每一者通过氨基磷酸酯键(例如Xpandomer)与相邻的非天然核苷酸类似物可操作连结。在其他实施例中,所述连接基进一步包括插入在所述第一末端和所述第二末端之间的间隔臂,其中所述间隔臂包括乙二醇的一个或多个单体。在一些实施例中,所述连接基进一步包括可切割部分。在其他实施例中,所述固体支持物选自由以下项组成的组:珠、管、毛细管和微流体芯片。
在另一方面,本公开提供了选择性修饰核酸靶序列的拷贝的3’末端的方法,所述方法包括以下步骤:a)提供具有与靶核酸的第一序列互补的序列的第一寡核苷酸序列和具有与核酸靶序列的第二序列互补的序列的第二寡核苷酸,其中核酸靶序列的第一序列在核酸靶序列的第二序列的3′,其中第一寡核苷酸提供核酸聚合酶的延伸引物,并且第二寡核苷酸的5’末端与双脱氧核苷5’三磷酸可操作连结,其中双脱氧核苷5’三磷酸提供核酸聚合酶的底物;b)提供包含第一和第二寡核苷酸、核酸靶序列、核酸聚合酶、核苷酸底物或其类似物、合适的缓冲剂和任选的一种或多种添加剂的反应混合物,其中第一寡核苷酸和第二寡核苷酸与核酸靶序列特异性地杂交;c)进行引物延伸反应以产生靶序列的拷贝,其中第二寡核苷酸的5’末端通过核酸聚合酶与核酸靶序列的拷贝的3’末端可操作连结。
在一些实施例中,所述双脱氧核苷5’三磷酸通过柔性连接基与所述第二寡核苷酸的5’末端可操作连结。在其他实施例中,所述柔性连接基包括一个或多个己基(C6)单体。在其他实施例中,所述第二寡核苷酸包括一个或多个2’甲氧基核糖核酸类似物。在其他实施例中,所述第二寡核苷酸的3′末端固定在第一固体支持物上,并且在一些实施例中,该方法进一步包括洗涤第一固体支持物以纯化与第二寡核苷酸可操作连结的核酸靶标的拷贝的步骤。在另一个实施例中,第一寡核苷酸被固定到第一固体支持物上,并且在一些实施例中,所述方法进一步包括从第一固体支持物释放核酸靶序列的拷贝并使核酸靶序列的拷贝与第三寡核苷酸接触的步骤,其中第三寡核苷酸具有与第二寡核苷酸的序列互补的序列,其中第三寡核苷酸与第二寡核苷酸特异性杂交,并且其中第三寡核苷酸的5’末端固定在第二固体支持物上,并且在其他实施例中,进一步包括洗涤第二固体支持物以纯化在3’末端与第二寡核苷酸可操作连结的核酸靶序列的拷贝的步骤。在其他实施例中,所述第二寡核苷酸包括一个或多个增加所述第二寡核苷酸对所述核酸靶序列的结合亲和力的核苷酸类似物。在其他实施例中,所述第二寡核苷酸与和所述核酸靶序列的5’末端可操作连结的异源核酸序列互补。在一些实施例中,核酸靶序列是单链DNA,并且靶序列的拷贝是可扩展聚合物,其中所述可扩展聚合物包括非天然核苷酸类似物的链,并且其中所述非天然核苷酸类似物中的每一者通过氨基磷酸酯键与相邻的非天然核苷酸类似物可操作连结。在一些实施例中,第一固体支持物和第二固体支持物选自由以下项组成的组:珠、管、毛细管和微流体芯片。
在另一方面,本公开提供了一种用于产生单链DNA模板构建体文库的方法,其中每个模板构建体包括DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:a)提供DNA Y形衔接子群,其中每个所述Y形衔接子包括第一寡核苷酸和第二寡核苷酸,其中所述第一寡核苷酸的3′区和所述第二寡核苷酸的5′区通过序列互补形成双链区,其中所述第一寡核苷酸的5’区和所述第二寡核苷酸的3’区是单链的并且包括寡核苷酸引物的结合位点,并且其中所述第一寡核苷酸和所述第二寡核苷酸的单链区的末端任选地固定在固体基质上;b)提供双链DNA分子群,其中每个所述双链DNA分子包括第一链和第二链,其中每个所述双链DNA分子的第一末端与所述Y形衔接子的双链末端相容;c)提供帽引物衔接子群,其中每个帽引物衔接子包括第一寡核苷酸、第二寡核苷酸和第三寡核苷酸,其中所述第二寡核苷酸插入在所述第一寡核苷酸和所述第三寡核苷酸之间,其中所述第一寡核苷酸、所述第二寡核苷酸和所述第三寡核苷酸通过化学分支在所述第一寡核苷酸和所述第三寡核苷酸的5’末端和所述第二寡核苷酸的3’末端可操作连结,其中所述第一寡核苷酸的序列的一部分与所述第三寡核苷酸的序列的一部分相同,其中所述第二寡核苷酸的序列的一部分是所述第一寡核苷酸和所述第三寡核苷酸的序列的部分的反向互补序列,并且其中所述第二寡核苷酸的5’末端和所述第三寡核苷酸的3’末端形成与每个所述双链DNA分子的第二末端相容的双链区;d)将每个双链DNA分子的第二末端连接到第二寡核苷酸的5’末端和一个帽引物衔接子的第三寡核苷酸的3’末端;e)将每个双链DNA分子的第一末端连接到所述DNA Y形衔接子之一的双链末端;f)用DNA聚合酶从经连接的帽引物衔接子中的每一者的第一寡核苷酸的3’末端延伸,其中经连接的双链DNA分子的第一链为DNA聚合酶提供模板,并且其中DNA聚合酶产生第三链,所述第三链包括双链DNA分子的第一链的序列和Y形衔接子的第一寡核苷酸的序列的反向互补序列;以及g)用外切核酸酶从每个连接的Y形衔接子的第一寡核苷酸的5′末端消化,其中消化去除所述第一寡核苷酸、所述双链DNA分子的第一链和所述帽引物衔接子的第二寡核苷酸以产生单链模板构建体,其中每个所述单链模板构建体包括两个模板分子,每个所述模板分子包括双链DNA分子的第二链的序列,并且其中所述两个模板分子通过所述帽引物衔接子的第一寡核苷酸和第三寡核苷酸可操作连结。
在另一方面,本公开提供了一种单链DNA模板构建体文库,其中所述模板构建体中的每一者包括DNA靶序列的相同链的第一拷贝和第二拷贝,其中所述靶序列的第一拷贝和第二拷贝可操作连结;并且其中所述单链DNA模板构建体的文库是通过上述方法产生的。
在另一方面,本公开提供了一种产生镜像Xpandomer分子文库的方法,其中Xpandomer分子中的每一者包括DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:a)提供上段所述的单链DNA模板构建体文库;b)提供与所述Y形衔接子的第一链的单链部分互补的第一延伸寡核苷酸群和与所述Y形衔接子的第二链的单链部分互补的第二延伸寡核苷酸群,并且其中所述第一延伸寡核苷酸或所述第二延伸寡核苷酸任选地固定在固体基质上;c)将所述单链DNA模板构建体文库与所述第一延伸寡核苷酸和所述第二延伸寡核苷酸群特异性杂交;d)提供帽分支构建体群,其中所述帽分支构建体包括与所述第二寡核苷酸可操作连结的第一寡核苷酸,其中所述第一寡核苷酸和所述第二寡核苷酸包含与所述帽引物衔接子构建体的第一寡核苷酸和第三寡核苷酸的序列的一部分互补的序列,并且其中所述帽分支构建体的第一寡核苷酸和第二寡核苷酸提供游离的5’核苷三磷酸部分;e)将帽分支构建体群与单链DNA模板构建体群特异性杂交;以及f)进行引物延伸反应以产生所述DNA靶序列的第一拷贝和第二拷贝的Xpandomer拷贝,其中所述Xpandomer拷贝通过所述帽分支构建体可操作连结。
在另一方面,本公开提供了一种在固体支持物上产生带标签的双链DNA扩增子文库的方法,所述方法包括以下步骤:a)提供双链DNA分子群,其中每个所述双链DNA分子包括与第二链特异性杂交的第一链;b)提供正向PCR引物和反向PCR引物,其中所述正向PCR引物包括第一5′异源标签序列,所述第一5′异源标签序列与和所述双链DNA分子的第二链的3′末端的一部分互补的3′序列可操作可操作连结,并且其中反向PCR引物包括第二5’异源标签序列,所述第二5′异源标签序列与和所述双链DNA分子的第一链的3’末端的一部分互补的3’序列可操作连结;c)进行第一PCR反应,其中所述双链DNA分子群被扩增以产生第一DNA扩增子产物群,其所述中第一DNA扩增子产物包括第一末端的第一异源序列标签和第二末端的第二异源序列标签;d)提供固定在固体支持物上的捕获寡核苷酸结构,其中所述捕获寡核苷酸结构包括第一末端和第二末端,其中所述第一末端共价连接至所述固体支持物,其中所述第二末端包括捕获寡核苷酸,所述捕获寡核苷酸包括与第一DNA扩增子产物群的第二异源序列标签的一部分互补的序列,并且其中所述捕获寡核苷酸结构进一步包括插入在所述第一末端和所述捕获寡核苷酸之间的可切割元件;以及e)进行第二PCR反应,所述第二PCR反应包括第一DNA扩增子产物群、包括与所述第一异源序列标签的一条链的序列互补的序列的正向引物,和包括与所述第二异源序列标签的一条链互补的序列的反向引物,其中第一DNA扩增子产物群的第一链与所述捕获寡核苷酸特异性杂交,并且其中所述第二PCR反应产生固定化DNA扩增子产物群,其中所述固定化DNA扩增子产物的第二链与所述固体支持物可操作连结。
另一方面,本公开提供了一种制备单链DNA模板构建体文库的方法,其中每个模板构建体包括DNA靶序列相同链的两个拷贝,所述方法包括以下步骤:a)提供上一段所述的固定在固体支持物上的DNA扩增子产物文库;b)提供帽引物衔接子群,其中每个帽引物衔接子包括第一寡核苷酸、第二寡核苷酸和第三寡核苷酸,其中所述第二寡核苷酸插入在所述第一寡核苷酸和所述第三寡核苷酸之间,其中所述第一寡核苷酸、所述第二寡核苷酸和所述第三寡核苷酸通过化学分支在所述第一寡核苷酸和所述第三寡核苷酸的5’末端和所述第二寡核苷酸的3’末端可操作连结,其中所述第一寡核苷酸的序列的一部分与所述第三寡核苷酸的序列的一部分相同,其中所述第二寡核苷酸的序列的一部分是所述第一寡核苷酸和所述第三寡核苷酸的序列的部分的反向互补序列,并且其中所述第二寡核苷酸的5’末端和所述第三寡核苷酸的3’末端形成与每个带标签的固定化DNA扩增子产物的游离末端相容的双链区;c)将每个固定化DNA扩增子产物的游离末端连接到所述帽引物衔接子的第二寡核苷酸的5’末端和第三寡核苷酸的3’末端;d)用DNA聚合酶从所述帽引物衔接子的每个第一寡核苷酸的3′末端延伸,其中所述固定化DNA扩增子产物的第二链为所述DNA聚合酶提供模板,并且其中所述DNA聚合酶产生第三链,其中所述第三链是所述第二链的拷贝;e)切割每个所述捕获寡核苷酸结构的可切割元件,其中所述切割从所述固体支持物上释放所述DNA扩增子产物,并在每个所述DNA扩增子产物的第二链上产生游离的5’末端;以及f)用外切核酸酶从每个所述DNA扩增子产物的切割的第二链的游离5’末端消化,其中所述消化去除所述DNA扩增子产物的第二链和所述帽引物衔接子的第二寡核苷酸以产生单链模板构建体文库,其中每个所述单链模板构建体包括通过所述帽引物衔接子的第一寡核苷酸和第三寡核苷酸可操作连结的所述DNA扩增子产物的第一链的两个拷贝。
在另一方面,本公开提供了一种单链DNA模板构建体文库,其中所述模板构建体中的每一者包括DNA靶序列的相同链的第一拷贝和第二拷贝,其中所述DNA靶序列的第一拷贝和第二拷贝可操作连结;并且其中所述单链DNA模板构建体的文库通过前段所述的方法产生。
在另一方面,本公开提供了一种产生镜像Xpandomer分子文库的方法,其中Xpandomer分子中的每一者包括DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:a)提供前段所述的单链DNA模板构建体文库;b)提供与所述DNA扩增子产物的第二标签互补的延伸寡核苷酸群,其中所述延伸寡核苷酸固定在固体基质上;c)将所述单链DNA模板构建体与所述延伸寡核苷酸特异性杂交;d)提供帽分支构建体群,其中所述帽分支构建体包括与所述第二寡核苷酸可操作连结的第一寡核苷酸,其中所述第一寡核苷酸和所述第二寡核苷酸包含与所述帽引物衔接子构建体的第一寡核苷酸和第三寡核苷酸的序列的一部分互补的序列,并且其中所述帽分支构建体的第一寡核苷酸和第二寡核苷酸提供游离的5’核苷三磷酸部分;e)将帽分支构建体群与DNA模板构建体群特异性杂交;以及f)进行引物延伸反应以产生所述DNA靶序列的第一拷贝和第二拷贝的Xpandomer拷贝,其中所述Xpandomer拷贝可操作连结所述帽分支构建体。
在一些实施例中,所述捕获寡核苷酸结构和所述延伸寡核苷酸固定在同一固体支持物上,其中所述延伸寡核苷酸包括可切割的发夹结构,并且其中所述可切割的发夹结构在切割步骤中被切割以提供所述DNA扩增子产物的结合位点。在其他实施例中,所述捕获寡核苷酸结构被固定在微流体卡的第一室的第一基质上,所述延伸寡核苷酸被固定在所述微流体卡的第二室的第二基质上,并且其中所述第一室被配置为产生所述单链DNA模板构建体群,所述第二室被配置为产生所述单链DNA模板构建体的Xpandomer拷贝群。在其他实施例中,所述捕获寡核苷酸结构被固定在珠支持物上,所述延伸寡核苷酸被固定在COC芯片支持物上,其中所述珠支持物被配置为产生单链DNA模板构建体群,所述COC芯片支持物被配置为产生所述DNA模板构建体的Xpandomer拷贝群。在其他实施例中,所述捕获寡核苷酸结构和所述延伸寡核苷酸被固定在珠支持物上,其中所述珠支持物被配置为产生单链DNA模板构建体群和所述DNA模板构建体的Xpandomer拷贝群。在另一个实施例中,所述延伸寡核苷酸由分支寡核苷酸结构提供,其中所述分支寡核苷酸结构包括通过化学分支与第二延伸寡核苷酸可操作连结的第一延伸寡核苷酸,其中所述第一延伸寡核苷酸包含前导序列、聚集剂序列(concentrator sequence)和插入在所述化学分支和所述前导序列和所述聚集剂序列之间的第一可切割部分,并且其中所述第二延伸寡核苷酸包括第二可切割部分。
本发明的上述和附加特征以及获得它们的方式将变得显而易见,并且通过参考以下更详细的描述将最好地理解本发明。在此公开的所有参考文献均通过引用整体并入本文,就好像每篇文献均单独并入一样。
提供该简要概述以简化形式介绍某些概念,这些概念将在下面的详细说明中进一步详细描述。除非另有明确说明,该简要概述不旨在确定要求保护的主题的关键或基本特征,也不旨在限制要求保护的主题的范围。
一个或多个实施例的细节在以下描述中阐述。结合一个示例性实施例示出或描述的特征可以与其他实施例的特征组合。因此,本文描述的各种实施例中的任一个可以组合以提供进一步的实施例。如有必要,可对实施例的各个方面进行修改从而采用如本文所识别的各类专利、应用和公开的概念来提供其他进一步的实施例。从描述、附图和权利要求中,其他特征、目的和优点将是显而易见的。
附图说明
本公开的示例性特征、其性质和各种优点将从附图和各种实施例的以下详细描述中显而易见。参考附图描述了非限制性和非穷尽的实施例,其中除非另有说明,否则在各个视图中相同的标签或附图标记指相同的部件。图中元件的尺寸和相对位置不一定按比例绘制。例如,选择、放大和定位各种元件的形状以提高图的易读性。为便于在图中识别,已选择所绘元件的特定形状。
图1A、1B、1C和1D是说明概括性XNTP的主要特征及其在扩展测序(SBX)中使用的简明示意图。
图2是说明XNTP的一个实施例的更多细节的示意图。
图3是说明Xpandomer穿过生物纳米孔的一个实施例的示意图。
图4A、4B、4C、4D和4E是说明用于固相Xpandomer合成的表面化学的示例性实施例的示意图。
图5是提供耐酸珠的功能化和将延伸寡核苷酸/DNA模板复合物固定到其上的一个实施例的概括性说明的示意图。
图6A是提供封端方法的概括性说明的示意图。
图6B是显示引物延伸产物的凝胶。
图7A-7D是末端帽的示例性实施例的一般特征的示意图。
图8A-8F是概括固相Xpandomer合成的一个实施例的步骤的示意图。
图9A-9D是概括固相Xpandomer合成的另一个实施例的步骤的示意图。
图10A和10B是描述在封端方案期间防止聚合酶“短路”的替代策略的示意图。
图11A、11B和11C是概括镜像文库构建和用于Xpandomer合成的一个实施例的步骤的示意图。
图12是帽衔接子构建体的一个实施例的一般特征的示意图。
图13概括了产生Xpandomer镜像文库的工作流程的一个实施例。
图14A和14B是概括产生DNA扩增子的固定化文库的一个实施例的步骤的示意图。
图15A和15B是概括用于镜像文库Xpandomer产生的镜像模板构建体文库的固态合成的一个实施例的步骤的示意图。
图16A和16B是概括用于镜像文库Xpandomer合成的构建体文库的固态合成的另一个实施例的步骤的示意图。
图17概括了使用不同固体支持物产生Xpandomer镜像文库的工作流程的一个实施例。
图18是分支延伸寡核苷酸结构的一般特征的示意图。
图19A和19B是概括使用分支延伸寡核苷酸固态合成Xpandomer镜像文库的一个实施例的步骤的示意图。
图20是显示引物延伸产物的凝胶。
图21A是显示引物延伸产物的凝胶。
图21B是来自纳米孔的测序读段的直方图比对。
图22是显示带封端的引物延伸产物的凝胶。
图23是显示带封端的引物延伸产物的凝胶。
图24A是描绘与文库片段连接的三叉衔接子的一个实施例的示意图。
图24B是显示三叉衔接子与文库片段连接的凝胶。
图25A是描绘M1镜像文库构建体的延伸和消化反应以产生M3镜像文库构建体的一个实施例的示意图。
图25B是显示延伸和消化反应产物的凝胶。
图26A是描绘M1镜像文库构建体的固态合成的一个实施例的示意图。
图26B是显示M1镜像文库构建体的固态合成产物的凝胶。
图27是描绘用于镜像文库Xpandomer合成的模板的一个实施例的示意图。
图28是显示镜像文库构建的各个阶段的产物的凝胶。
图29是显示镜像文库Xpandomer的序列的一部分的纳米孔迹线。
图30是显示在耐酸磁珠上合成的Xpandomer产物的凝胶。
图31是显示Xpandomer产物合成和在耐酸磁珠上加工的凝胶。
具体实施方式
通过参考以下对本发明的优选实施例和本文包括的实例的详细描述,可以更容易地理解本发明。除非另有说明,否则本文中使用的所有技术和科学术语所具有的含义与本发明所属领域普通技术人员通常理解的含义相同。
除非另外指出,否则本发明的实施将采用分子生物学、微生物学、重组DNA等常规技术,其在本领域的技术范围内。文献中对此类技术进行了充分的阐述。参见例如Sambrook、Fritsch和Maniatis,分子克隆:实验室手册,第二版(1989),寡核苷酸合成(M.J.Gait Ed.,1984),酶学方法系列(学术出版社公司),分子生物学中的当前方案(F.M.Ausubel,R.Brent,R.E.Kingston,D.D.Moore,J.G.Siedman,J.A.Smith,andK.Struhl,eds.,1987)。上文和下文提及的所有专利、专利申请和出版物以此通过引用并入本文。
1.定义
如本文所用,“核酸”,也称为多核苷酸,是共价连接的一连串核苷酸,其中一个核苷酸的戊糖的3’位置通过磷酸二酯基团连接到下一个的5’位置。核酸分子可以是脱氧核糖核酸(DNA)、核糖核酸(RNA)或两者的组合。DNA(脱氧核糖核酸)和RNA(核糖核酸)是生物存在的多核苷酸,其中核苷酸残基通过磷酸二酯键以特定序列连接。如本文所用,术语“核酸”、“多核苷酸”或“寡核苷酸”包括具有核苷酸的线性主链的任何聚合物化合物。寡核苷酸,也称为寡聚物,通常是较短的链状多核苷酸。如果被靶向用于测序,核酸通常被称为“靶核酸”、“靶序列”、“模板”或“文库片段”。
术语“模板”是指设置新链遗传序列的DNA链。
如本文所用,术语“模板依赖性方式”旨在指涉及引物分子的模板依赖性延伸的过程(例如,通过DNA聚合酶合成DNA)。术语“模板依赖方式”是指RNA或DNA的多核苷酸合成,其中新合成的多核苷酸链的序列由众所周知的互补碱基配对规则决定(参见,例如,Watson,J.D.等人,In:Molecular Biology of the Gene,4th Ed.,W.A.Benjamin,Inc.,MenloPark,Calif.(1987))。
如本文所用,术语“引物”是指与另一个核酸中的序列互补并充当DNA合成起点的核酸短链。优选地,引物具有至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少18个、至少20个、至少25个、至少30个或更多个碱基长度。
如本文所用,术语“链”是指由通过磷酸二酯键共价连接在一起的核苷酸组成的核酸。核酸的一条链不包括仅通过氢键合,即通过碱基配对结合的核苷酸,尽管该链可以通过氢键合与互补链碱基配对。当第一链和第二链通过互补性碱基配对时,第一链可以称为“正”链、“有义”链或“5’到3′”链,第二链可以是称为“负”链、“反义”链或“3’到5′”链(反之亦然)。
如本文所用,术语“3’末端”表示在其末端具有脱氧核糖的糖环中第三个碳的羟基的核苷酸链的末端。
如本文所用,术语“5′末端”表示在其末端具有脱氧核糖的糖环中的第五个碳的核苷酸链的末端。
术语“互补的”是指允许在核苷酸或核酸之间形成双链体的碱基配对,例如在双链DNA分子的两条链之间,或寡核苷酸引物与单链核酸上的引物结合位点之间,或寡核苷酸探针与其在DNA分子中的互补序列之间。互补核苷酸通常是A和T(或A和U),或C和G。当一条链的核苷酸经过最佳比对和比较并带有适当的核苷酸插入或缺失,与另一条链的约60%、至少70%、至少80%、至少85%,通常至少约90%至约95%,甚至约98%至约100%配对时,两条单链DNA分子称为基本上互补。使用在计算机中实施的算法和本领域技术人员公知的方法来确定两个核苷酸区域之间的同一性程度。两个核苷酸序列之间的同一性优选使用BLASTN算法确定(BLAST Manual,Altschul,S.等人,NCBI NLM NIH Bethesda,Md.20894,Altschul,S.,等人,J.,1990,Mol.Biol.215:403-410)。
“杂交”是指两条单链多核苷酸非共价结合以形成稳定双链多核苷酸的过程。“杂交条件”通常包括约1M或更小,更通常小于约500mM并且可以小于约200mM的盐浓度。“杂交缓冲剂”是缓冲盐溶液,例如5%SSPE,或本领域已知的其他此类缓冲剂。杂交温度可低至5℃,但通常高于22℃,更通常高于约30℃,并且通常超过37℃。杂交通常在严格条件下,即在引物将与其靶标子序列杂交但不会与其他非互补序列杂交的条件下进行。严格条件依赖于序列并且在不同情况下是不同的。例如,较长的片段可能需要比短片段更高的杂交温度来进行特异性杂交。由于其他因素可能会影响杂交的严格性,包括互补链的碱基组成和长度、有机溶剂的存在以及碱基错配的程度,因此参数的组合比单独任何一个参数的绝对测量更重要。通常严格的条件选择在比特定序列在定义的离子强度和pH值下的Tm低约5℃。示例性严格条件包括在约7.0至约8.3的pH和至少25℃的温度下,至少0.01M至不超过1M钠离子浓度(或其他盐)的盐浓度。
当核酸彼此处于功能关系中时,它们是“可操作连结”的。通常,“可操作连结”是指被连接的核酸序列彼此靠近。连接可以酶促,例如通过核酸连接酶或聚合酶来完成。
如本文所用,表述“双链DNA文库”可以指包含DNA分子的两条链(即有义链和反义链)的文库,所述两条链可以通过其末端之一物理连接并形成同一分子的一部分。双链DNA分子文库可以是但不限于基因组DNA(核DNA、线粒体DNA、叶绿体DNA等)、质粒DNA或从单链核酸样品获得的双链DNA分子(例如DNA、cDNA、mRNA)。
如本文所用,“核酸聚合酶”是通常用于连接3′-OH 5′-三磷酸核苷酸、寡聚物和其类似物的酶。聚合酶包括但不限于DNA依赖性DNA聚合酶、DNA依赖性RNA聚合酶、RNA依赖性DNA聚合酶、RNA依赖性RNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3 RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、Klenow片段、嗜热菌DNA聚合酶、Tth DNA聚合酶、
Figure BDA0003221916090000151
DNA聚合酶(New England Biolabs)、Deep
Figure BDA0003221916090000152
DNA聚合酶(NewEngland Biolabs)、Bst DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、9°N DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Tth DNA聚合酶、RepliPHI Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、TherminatorTM聚合酶(New England Biolabs)、KODHiFiTMDNA聚合酶(Novagen)、KOD1 DNA聚合酶、Q-β复制酶、末端转移酶、AMV逆转录酶、M-MLV逆转录酶、Phi6逆转录酶、HIV-1逆转录酶。根据本发明的聚合酶可以是变体、突变体或嵌合聚合酶。
如本文所用,“DPO4-型DNA聚合酶”是由古细菌、硫化叶菌天然表达的DNA聚合酶或相关Y家族DNA聚合酶,其通常通过称为跨损伤合成(TLS)的过程在受损DNA的复制中起作用。Y家族DNA聚合酶与DPO4聚合酶同源;实例包括原核酶PolII、PolIV、PolV、古细菌酶Dbh和真核酶Rev3p、Rev1p、Poln、REV3、REV1、Pol
Figure BDA0003221916090000153
和PolκDNA聚合酶,及其嵌合体。
如本文所用,“DPO4变体”是修饰的重组DPO4型DNA聚合酶,包括相对于天然存在的野生型DPO4型DNA聚合酶的一个或多个突变,例如,增加了利用大核苷酸类似物作为底物或另一种聚合酶特性的能力的一个或多个突变,并且可以包括对野生型DPO4型DNA聚合酶的附加改变或修饰,例如一个或多个缺失、插入和/或附加肽或蛋白质序列的融合(例如,用于将聚合酶固定在表面上或以其他方式标记聚合酶)。根据本发明的DPO4变体聚合酶的实例是在已公开的PCT专利申请WO2017/087281 A1和PCT专利申请号PCTUS2018/030972和PCTUS2018/64794中描述的硫化叶菌DPO4的变体,这些专利通过引用以其整体并入本文。
如本文所用,“核酸聚合酶反应”是指以依赖模板的方式制备新的核酸链或延长现有核酸(例如,DNA或RNA)的体外方法。根据本发明,核酸聚合酶反应包括引物延伸反应,其导致核苷酸或核苷酸类似物掺入引物的3’末端,使得掺入的核苷酸或核苷酸类似物与靶多核苷酸的相应核苷酸互补。核酸聚合酶反应的引物延伸产物可进一步用于单分子测序或作为模板以合成附加的核酸分子。
如本文所用,术语“多个”是指“至少两个”。
“XNTP”是与模板依赖性酶促聚合相容的可扩展的、5’三磷酸修饰的核苷酸底物。XNTP有两个不同的功能组分;即,核苷碱基5′-三氨基磷酸酯和连接在每个核苷三氨基磷酸酯中的系链,其位置允许通过氨基磷酸酯键的核苷酸内切割来控制扩展。如本文所用,XNTP是示例性的“非天然、高度取代的核苷酸类似物底物”。示例性的XNTP及其制造方法描述于例如申请人公开的PCT申请号WO2016/081871,其全文以引用方式并入本文。
“Xpandomer中间体”是由XNTP组装的中间产物(在本文中也称为“子链”),并且是使用靶核酸模板通过XNTP的聚合酶介导的模板导向组装形成。新合成的Xpandomer中间体是受约束的Xpandomer。在由XNTP提供的氨基磷酸酯键被裂解的工艺步骤下,受约束的Xpandomer不再受约束,并且是随着系链的伸展而延伸的Xpandomer产物。
“Xpandomer”或“Xpandomer产物”是通过受约束的Xpandomer扩增产生的合成分子构建体,其本身通过XNTP底物的模板导向组装来合成。Xpandomer相对于产生它的靶模板被拉长。它由亚基串联组成,每个亚基是一个基序,每个基序是文库的成员,包括序列信息、系链和任选的部分或全部底物,所有这些都来自形成性底物构建体。Xpandomer被设计成扩展到比靶模板更长,从而降低靶模板的序列信息沿其长度的线性密度。此外,Xpandomer任选地提供了一个用于增加报告子的尺寸和丰度的平台,从而提高检测的信噪比。较低的线性信息密度和较强的信号提高了分辨率并降低了检测和解码模板链序列的灵敏度要求。
“系链”或“系链成员”是指具有大体线性尺寸并且在两个相对末端的每一个处具有末端部分的聚合物或分子构建体。系链通过在末端部分的键连接到核苷三磷酸酯以形成XNTP。键用于将系链约束在“受约束构型”中。系链具有“受约束构型”和“扩展构型”。受约束构型见于XNTP和子链或Xpandomer中间体中。系链的受约束构型是扩展构型的前体,如Xpandomer产物中所见。从受约束构型到扩展构型的转变导致可选择性切割的氨基磷酸酯键的切割。系链包含一个或多个沿其长度的可以编码基质的序列信息的报告子或报告子构建体。系链提供了一种方法来扩展Xpandomer的长度,从而降低序列信息的线性密度。
“系链元件”或“系链链段”是具有两个末端的大体线性尺寸的聚合物,其中末端形成用于连接系链元件的末端键。系链元件是系链的链段。此类聚合物可包括但不限于:聚乙二醇、聚二醇、聚吡啶、聚异氰化物、聚异氰酸酯、聚(三芳基甲基)甲基丙烯酸酯、聚醛、聚吡咯烷酮、聚脲、聚乙二醇磷酸二酯、聚丙烯酸酯、聚甲基丙烯酸酯、聚丙烯酰胺、聚乙烯酯、聚苯乙烯、聚酰胺、聚氨酯、聚碳酸酯、聚丁酸酯、聚丁二烯、聚丁内酯、聚吡咯烷酮、聚乙烯膦酸酯、聚乙酰胺、多糖、聚透明质酸酯、聚酰胺、聚酰亚胺、聚酯、聚乙烯、聚丙烯、聚苯乙烯、聚碳酸酯、聚对苯二甲酸酯、聚硅烷、聚氨酯、聚醚、聚氨基酸、聚甘氨酸、聚脯氨酸、N-取代的聚赖氨酸、多肽、侧链N-取代的肽、聚-N-取代的甘氨酸、类肽、侧链羧基取代的肽、同型肽、寡核苷酸、核糖核酸寡核苷酸、脱氧核酸寡核苷酸、被修饰以防止Watson-Crick碱基配对的寡核苷酸、寡核苷酸类似物、聚胞苷酸、聚腺苷酸、聚尿苷酸、聚胸苷、聚磷酸酯、多核苷酸、多核糖核苷酸、聚乙二醇-磷酸二酯、肽多核苷酸类似物、苏氨酸-多核苷酸类似物、乙二醇-多核苷酸类似物、吗啉-多核苷酸类似物、锁核苷酸寡聚物类似物、多肽类似物、分支聚合物、梳形聚合物、星形聚合物、树枝状聚合物、无规聚合物、梯度和嵌段共聚物、阴离子聚合物、阳离子聚合物、形成茎环的聚合物、刚性链段和柔性链段。
“报告子”由一个或多个报告者元件组成。报告子用于分析靶核酸的遗传信息。
“报告子构建体”包含一个或多个可产生可检测信号的报告子,其中可检测信号通常包含序列信息。该信号信息被称为“报告子代码”,随后被解码为基因序列数据。报告子构建体还可包含系链链段或其他结构组分,包括聚合物、接枝共聚物、嵌段共聚物、亲和配体、低聚物、半抗原、适体、树枝状聚合物、连接基团或亲和结合基团(例如,生物素)。
“报告子代码”是来自报告子构建体的测量信号的遗传信息。报告子代码被解码以提供序列特异性遗传信息数据。
如本文所用,术语“固体支持物”、“固态”、“支持物”和“基质”可互换使用并且指具有刚性或半刚性表面的材料或材料组。在许多实施例中,固体支持物的至少一个表面是基本平坦的,例如聚合物微流体卡或芯片的表面。在一些实施例中,可能需要物理分离卡或芯片的区域以用于与例如蚀刻通道、沟、孔、凸起区域、销等的不同反应。根据其他实施例,固体支持物将采用不溶性珠、树脂、凝胶、膜、微球或其他几何构型的形式,其由例如可控孔玻璃(CPG)和/或聚苯乙烯组成。
如本文所用,术语“固定化”是指分子(例如连接基、衔接子、寡核苷酸)和支持物之间以在延伸、扩增、连接以及本文所述的其他过程条件下提供稳定结合的方式的缔合、连接或结合。这种结合可以是共价的或非共价的。非共价结合包括静电、亲水和疏水相互作用。共价结合是形成共价键,其特征在于原子之间共享电子对。这种共价结合可以直接在分子和支持物之间,或者可以通过交联剂或通过在支持物或分子或两者上包含特定反应基团来形成。分子的共价连接可以通过使用固定在支持物上的结合配偶体,例如亲和素或链霉亲和素,以及生物素化分子与亲和素或链霉亲和素的非共价结合来实现。固定化还可能涉及共价和非共价相互作用的组合。
如本文所用,术语“点击反应”是本领域公认的,其描述了极其可靠和自导向的有机反应的集合,例如最公认的铜催化的叠氮化物-炔烃[3+2]环加成。点击化学反应的非限制性实例可以在例如H.C.Kolb,M.G.Finn,K.B.Sharpless,Angew.Chem.Int.Ed.2001,40,2004和E.M.Sletten,C.R.Bertozzi,Angew.Chem.Int.Ed.2009,48,6974中找到,其公开内容出于所有目的通过引用整体并入本文。
示例性点击化学反应是叠氮化物-炔烃Huisgen环加成(例如,在室温下使用铜(Cu)催化剂)。(Rostovtsev,等人.2002Angew.Chemie Int′1 Ed.41(14):2596-2599;Tornoe,等人.2002J.Org.Chem.67(9):3057-3064)。击化学的其他实例包括硫醇-烯点击反应、Diels-Alder反应和逆电子需求Diels-Alder反应、异腈(异氰化物)和四嗪之间的[4+1]环加成。(参见,例如,Hoyle,等人.2010Angew.Chemie Int′l Ed.49(9):1540-1573;Blackman,等人.2008J.Am.Chem.Soc.130(41):13518-13519;Devaraj,等人.2008Bioconjugate Chem.19(12):2297-2299;Stockmann,等人.2011Org.Biomol.Chem.9,7303-7305)。
术语“炔烃”是指具有至少一个碳-碳三键的烃。如本文所用,术语“末端炔烃”是指其中至少一个氢原子与三键碳原子键合的炔烃。
如本文所用,术语“叠氮化物”或“叠氮基”是指式(--N3)的基团。
术语“三唑”是指分子式为C2H3N3的具有两个碳原子和三个氮原子的五元环的任何杂环化合物。炔烃部分和叠氮化物部分之间的化学点击反应的产物是三唑部分。
扩展测序
可以通过固态合成增强的一种示例性引物延伸反应是称为“XNTP”的非天然核苷酸类似物的聚合,其构成了由Stratos Genomics开发的“扩展测序”(SBX)方案的基础(参见,例如,Kokoris等人,美国专利号7,939,259,″High Throughput Nucleic AcidSequencing by Expansion″)。一般而言,SBX使用这种生化聚合将DNA模板的序列转录到称为“Xpandomer”的可测量聚合物上。转录的序列沿Xpandomer主链在高信噪比报告子中编码,所述报告子相隔约10nm,专为高信噪比、分化良好的反应而设计。这些差异在Xpandomer相对于天然DNA的序列读段效率和准确性方面提供了显著的性能增强。SBX过程的概述在图1A、图1B、图1C和图1D中描述。
XNTP是与模板依赖性酶促聚合相容的可扩展的、5’三磷酸修饰的核苷酸底物。高度简化的XNTP在图1A中示出,其强调了这些核苷酸类似物的独特特征:XNTP 100具有两个不同的功能区;即:可选择性切割的氨基磷酸酯键110,将5’α-磷酸115连接到核碱基105;以及连接在核苷三氨基磷酸酯内的某些位置处的系链120,该位置允许通过氨基磷酸酯键的核苷酸内切割来控制扩展。XNTP的系链包含被可选择性切割的氨基磷酸酯键分开的连接基臂部分125A和125B。每个连接基通过连接基团(LG)连接到报告子130的一端,如公开于Kokoris等人的美国专利号8,324,360,其通过引用以其整体并入本文。XNTP 100以“受约束构型”说明,这是XNTP基质和聚合后子链的特征。聚合XNTP的受限构型是扩展构型的前体,如Xpandomer产品中所见。从受限构型到扩展构型的转变发生在子链的主要主链内的氨基磷酸酯的P-N键断裂时。
Xpandomer的合成总结在图1B和图1C中。在组装期间,单体XNTP底物145(XATP、XCTP、XGTP和XTTP)通过使用单链模板(SEQ ID NO:1)140作为向导的模板导向聚合过程在新生子链150的可延伸末端聚合。通常,该过程从引物开始并沿5′到3′方向进行。通常,使用DNA聚合酶或其他聚合酶来形成子链,并且选择条件以便获得模板链的互补拷贝。在合成子链之后,偶联的系链包含进一步包含子链的受约束Xpandomer。子链中的系链具有XNTP底物的“受约束构型”。系链的受约束构型是扩展构型的前体,如Xpandomer产物中所见。
如图1C所示,从受约束构型160到扩展构型165的转变是由于子链的主要主链内可选择性切割的氨基磷酸酯键(为简单起见用无阴影椭圆表示)的切割引起的。在该实施例中,系链包含一个或多个对它们所连接的核碱基具有特异性的报告子或报告子构建体,130A、130C、130G或130T,从而编码模板的序列信息。以这种方式,系链提供了一种手段来扩展Xpandomer的长度并降低母链序列信息的线性密度。
图1D说明Xpandomer 165通过纳米孔180从顺式储器175转移到反式储器185。通过纳米孔后,线性化Xpandomer的每个报告子(在此图示中,标记为“G”、“C”和“T”)产生独特且可重复的电子信号(由叠加迹线190表示),对它所连接的核碱基具有特异性。
图2更详细地描绘了XNTP的概括结构。XNTP 200包含具有连接臂部分220A和220B的核碱基三氨基磷酸酯210,这两个连接臂部分被可选择性切割的氨基磷酸酯键230分开。系链在连接基团250A和250B处与核苷三磷酸酯相连,其中第一系链末端连接到杂环260(此处由胞嘧啶表示,尽管杂环可以是四种标准核碱基A、C、G、或T中的任一个),并且第二系链末端连接到核碱基主链的α磷酸酯270。本领域技术人员将理解,可以使用本领域已知的许多合适的偶联化学以形成最终的XNTP底物产物,例如,系链偶联可以通过三唑键来完成系链缀合。
在该实施例中,系链275包含若干功能元件,包括增强子280A和280B、报告子代码285A和285B以及翻译控制元件(TCE)290A和290B。这些特征中的每一个都在Xpandomer通过纳米孔易位并产生独特且可重复的电子信号期间执行独特的功能。系链275被设计用于通过杂交(TCH)进行易位控制。如图所示,TCE提供了一个杂交区域,该区域可以与互补寡聚物(CO)形成双链体,并位于报告子代码附近。不同的报告子代码的大小可以阻止离子以不同的可测量水平流过纳米孔。使用通常用于寡核苷酸合成的亚磷酰胺化学可以有效地合成特定的报告子代码。可以通过从市售文库中选择特定亚磷酰胺的序列来设计报告子。此类文库包括但不限于长度为1个至12个或更多乙二醇单元的聚乙二醇、长度为1个至12个或更多碳单元的脂肪族、脱氧腺苷(A)、脱氧胞嘧啶(C)、脱氧鸟苷(G)、脱氧胸腺嘧啶(T)、无碱基(Q)。与报告子代码相关的双链体TCE也有助于离子流阻塞,因此报告子代码和TCE的组合可以称为“报告子”。报道子代码之后是增强子,在一个实施例中其包括精胺聚合物。
图3显示了在转移α-溶血素纳米孔的过程中切割的Xpandomer的一个实施例。该生物纳米孔嵌入脂质双层膜中,该膜将两个电解质储库分开并电隔离。典型的电解质具有缓冲至7.0的pH值的1摩尔KCl。当在双层上施加小电压(通常为100mV)时,纳米孔会限制离子电流的流动,并且是电路中的主要电阻。Xpandomer报告子设计用于提供特定的离子电流阻塞水平,并且可以通过测量离子电流水平序列随着报告子序列易位纳米孔来读取序列信息。
α-溶血素纳米孔通常是定向的,因此通过进入前庭侧并离开茎侧发生易位。如图3所示,纳米孔被定向以首先从茎侧捕获Xpandomer。使用TCH方法时,这种定向是有利的,因为它会减少首先进入前庭时发生的阻塞伪影。除非另有说明,茎侧首先是假定的易位方向。随着Xpandomer移位,报告子进入茎,直到其双链体TCE在茎入口处停止。双链体的直径为约2.4nm,而茎的入口为约2.2nm,因此报告子被保持在茎中,直到双链体的互补链395解离(释放),然后易位进行到下一个报告子。游离互补链极不利于进入纳米孔,因为Xpandomer仍在转移并从孔中扩散开。
在一个实施例中,报告子代码的每个成员(在双链体之后)由可选自许多商业文库的亚磷酰胺的有序选择形成。每种成分的亚磷酰胺根据其在纳米孔中的位置(位于双链体终止之后)、其位移、其电荷、其与纳米孔的相互作用、其化学和热环境以及其他因素对净离子电阻做出贡献。每个亚磷酰胺上的电荷部分归因于具有-1的标称电荷但被反离子屏蔽有效减少的磷酸根离子。拉动双链体的力是由于这些沿报告子的有效电荷受到局部电场的作用。由于每个报告分子可以具有不同的电荷分布,因此对于给定的施加电压,它可以对双链体施加不同的力。沿报告子主链传输的力还用于将报告子拉长以提供可重复的阻塞响应。
对于测序,通过将α-溶血素插入缓冲剂B1中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔,其中缓冲剂B1含有2M NH4Cl和100mM HEPES,pH 7.4。顺式孔灌注缓冲剂B2,其中缓冲剂B2含有0.4M NH4Cl、0.6M GuCl和100mM HEPES,pH 7.4。将Xpandomer样品加热至70℃2分钟,完全冷却,然后将2μL样品加入顺式孔中。然后施加90mV/390mV/10μs的电压脉冲,并通过以下方式Labview获取软件获取数据。
通过来自单个SBX反应的序列读段群的直方图显示来分析序列数据。分析软件将每个序列读段与模板序列对齐,并修整与正确模板序列不对齐的读段末端的序列范围。
2.本发明的具体实施例
本发明可以采用以下示例性实施例中描述的特定方法、装置和组合物。
固态合成
由本发明人开发的扩展测序(SBX)方法在Xpandomer相对于天然DNA的序列读取效率和准确性方面提供了显著的性能增强。然而,富集模板DNA的高质量、全长Xpandomer拷贝的样品可能难以在溶液中产生。有利地,通过反复试验,本发明人发现全长Xpandomer的合成和/或加工效率可以通过使工作流程的各个步骤(例如,引物延伸反应和/或合成后处理步骤)适应固体支持物来提高全长Xpandomer的合成和/或加工效率。已经发现固态平台可以改进各种反应条件的优化。
Xpandomer的固态合成可以使用本领域已知的任何合适的支持物平台进行。在某些实施例中,固态支持物可以是常规珠、管、毛细管或微流体芯片或卡。如本文进一步讨论的,在本发明的一些实施例中,寡核苷酸引物,即延伸或“E-寡核苷酸”与支持物结合以启动固态Xpandomer合成。
表面化学
多种表面化学可用于将寡核苷酸或寡核苷酸/模板复合物固定在固体支持物上。合适的表面化学的示例性实施例示于图4A-4E中。图4A中描绘的实施例采用常规链霉亲和素/生物素相互作用化学,并显示具有包括末端生物素部分410A的连接基的固体支持物400的功能化。在该实施例中,寡核苷酸引物420的5’末端与包括末端生物素部分410B的第二连接基结合。引物-模板复合物425(在该描绘中说明聚合酶介导的Xpandomer合成)与支持物的连接由链霉亲和素部分430介导。本文公开的连接基部分可以具有足够的长度以将寡核苷酸连接到支持物,使得支持物不会显著干扰互补寡核苷酸或核酸复制酶对寡核苷酸的整体结合和识别。因此,连接基还可以包含间隔基单元。间隔基例如将寡核苷酸与切割位点或标记分开。
可替代地,图4B中描绘的实施例说明通过点击反应将引物共价连接到基质上而将引物-模板复合物425固定到固体支持物(即“基质”)400上。在该实施例中,共价键由交联到固体支持物的马来酰亚胺-PEG-炔烃连接基423介导。远离底物的连接基的末端提供的炔烃部分429能够与由引物的5’末端提供的叠氮基团435反应。利用简单的点击化学将核酸固定在底物上的能力提供了优于传统固态核酸合成方案的优势。例如,核酸可以在点击缀合之前预先合成(例如,化学或酶促)和纯化。此外,不同寡核苷酸的组合可以固定在单个支持物上。本发明考虑了结合到固体支持物上的寡核苷酸结构的多种构型。图4C说明引物-模板复合物的树枝状聚合物如何通过如本文所讨论的点击化学在支持物上形成。
根据本发明,可以使用在第一末端提供马来酰亚胺部分和在第二末端提供炔烃部分的任何合适的连接基。连接基的两个反应性基团之间的化学链在本文中可称为“间隔臂”。间隔臂的长度决定了缀合物的柔韧性,并且可以针对特定应用进行优化。通常,间隔臂包括烃链或聚乙二醇(PEG)链。图4D说明了示例性马来酰亚胺-PEG-炔烃连接基423、炔丙基-PEG4-马来酰亚胺,其提供炔烃部分429和马来酰亚胺部分427。图4E说明了具有连接到5′末端的末端叠氮化物部分的延伸寡核苷酸如何通过产生共价键的点击反应固定在固体支持物上。在该实施例中,固体支持物已经通过交联连接基而被功能化,所述连接基包括在靠近支持物的末端的末端马来酰亚胺部分和在远离支持物的末端的末端炔烃基团。
根据本发明,马来酰亚胺部分可以转化为反应性基团,随后通过无催化剂的光化学(例如,光引发的)去质子反应交联到固体表面,例如聚烯烃表面。该反应简化了传统缀合方法所依赖的引发步骤。常规交联技术教导马来酰亚胺化学基团是巯基反应性的靶向(-SH)官能团。然而,本发明人有利地发现,马来酰亚胺基团可以在通过去质子反应活化后交联到刚性聚烯烃底物上。重要的是,已发现马来酰亚胺介导的交联在酸性和条件下以及在点击反应期间是稳定的。合适的聚烯烃表面包括但不限于由聚丙烯或环烯烃共聚物(COC)制造的底物。
为了用炔烃部分功能化底物,例如COC芯片,示例性的无催化剂光化学去质子反应可以包括以下步骤:1)用有机溶剂如DMSO或DMF涂覆芯片;2)加入溶解在例如DMSO和水中的在一端具有马来酰亚胺部分的连接基,例如炔丙基马来酰亚胺;3)在紫外灯下孵育芯片;3)用一系列溶剂清洗芯片,在某些实施例中,这些溶剂可以包括DMSO、DMF以及Na2HPO4、吐温-20和SDS的溶液;以及4)在点击反应之前用水溶液,例如水和/或PBS清洗芯片。
尽管这些实施例说明了延伸寡核苷酸的5′端,即连接到支持物的引物,但应理解,在替代实施例中,表面化学可以适合于连接寡核苷酸的3′,例如,本文进一步讨论的末端帽结构的末端寡核苷酸(或具有作为末端寡核苷酸反向互补序列的寡核苷酸的5’末端)到支持物。
在某些实施例中,寡核苷酸和固体支持物之间的连接是可切割的,使得引物延伸产物能够在合成后从支持物上释放。可切割的连接基和切割此类连接基的方法是已知的,并且可以使用本领域技术人员的知识在所提供的方法中使用。例如,可切割连接基可以被酶、催化剂、化合物、温度、电磁辐射或光切割。任选地,可裂解连接基包括可通过β-消除水解的部分、可通过酸水解切割的部分、酶促切割部分或可光切割部分。在一些实施例中,合适的可切割部分是可从Glen Research获得的可光切割(PC)间隔基或连接基亚磷酰胺。
发明人有利地发现,Xpandomer的固态合成和加工允许优化工作流程中的许多步骤,从而获得超过400个碱基的纳米孔序列读段。在某些实施例中,固态合成可以使用耐酸磁珠作为支持物进行。珠结构的几何形状提供了几个优点,包括有利的模板结合和快速的溶液中反应动力学、增加的表面积、磁性收集等。珠的耐酸性使其成为Xpandomer加工反应的特别合适的支持物。一种制备用于Xpandomer合成的耐酸磁珠的方法的一个实施例如图5所示。此处,耐酸磁珠510(例如
Figure BDA0003221916090000251
Peg胺)用连接基520功能化以产生功能化珠530,提供末端炔烃基团。珠可以使用任何形式的胺型偶联或化学缩合来功能化。在一个实施例中,珠可以通过与珠表面提供的胺NHS-酯缀合来功能化。通过点击化学,提供5′叠氮化物部分的延伸寡核苷酸(“E-寡核苷酸”)540与功能化珠530共价连接以产生支持物结合的E-寡核苷酸550。珠结合的E-寡核苷酸可以与单链模板560杂交,用于例如引物延伸反应以产生模板的Xpandomer拷贝。有利地,随后的Xpandomer加工步骤,包括酸介导的氨基磷酸酯键的切割,可以在相同的珠支持物上进行。
封端
在该实施例中,核酸模板的单链拷贝在3’末端处与和模板的一部分特异性杂交的寡核苷酸“帽”的5’末端可操作连结(例如,连接或附着)。单链拷贝与寡核苷酸帽的连接由核酸聚合酶介导,因为它在模板依赖性期间到达寡核苷酸帽的5’末端。寡核苷酸帽在本文中可替代地称为“末端帽”、“加帽的阻断寡核苷酸”或“末端标签”。末端帽用作分子标签以从可能包括不希望长度的拷贝,例如不完整或截短的产物的拷贝的产物异质群中鉴定和/或分离具有确定长度的核酸模板的拷贝。
在替代实施例中,模板核酸可以是DNA分子或RNA分子。末端帽可以被设计成与模板核酸的任何部分(即,与“末端帽靶序列”)杂交,以便选择性地修饰,例如,“标记”具有确定或所需长度的模板区域的拷贝,即“靶序列”。在一些实施例中,末端帽被设计成与靶序列5’末端附近的序列杂交,以便“标记”靶序列的完整或接近完整的拷贝。在一些实施例中,末端帽靶序列是模板核酸的天然核酸序列的一部分。在其他实施例中,末端帽靶序列是连接或连结到模板核酸的异源序列(例如,衔接子或连接基)。
在某些实施例中,单链核酸模板的拷贝是Xpandomer并且末端帽被设计成与模板DNA文库片段的5’末端杂交。有利地,富集文库片段的全长拷贝的Xpandomer产物群提供了来自本发明的基于纳米孔的测序系统的改进的序列信息或“读段”。
图6A中以简化形式示出了封端策略的一个实施例的概览。在该实施例中,封端使得能够选择性标记DNA靶序列的Xpandomer拷贝,本文由靶序列模板610表示。Xpandomer通过起始于寡核苷酸引物620(即延伸或“E-寡核苷酸”)的引物延伸反应合成,该引物使用合适的DNA聚合酶、XNTP基质和其他延伸试剂和添加剂与单链模板与杂交。发明人已经发现DPO4聚合酶的变体能够利用XNTP作为基质以依赖模板的方式合成Xpandomer,特别是当引物延伸反应包括一种或多种PEM添加剂时(PEM添加剂描述于例如申请人的未决申请号PCT/US18/67763,题为“Enhancement of Nucleic Acid Polymerization by AromaticCompounds”,其全文以引用方式并入本文)。当掺入延伸产物中的寡核苷酸与可检测染料630连接时,引物延伸产物可通过凝胶电泳显现。
末端帽结构的一个实施例的一般特征在图6A的示意图4中示出。在该实施例中,末端帽640包括末端寡核苷酸645(其在本文中可称为“阻断剂”寡核苷酸),其与靶序列模板的5’末端附近的序列互补并特异性杂交。末端帽还包括与双脱氧核糖核苷类似物(即“帽”)结合的5′三磷酸基团647,该类似物能够被DNA聚合酶用作底物。在引物延伸反应(例如Xpandomer合成反应)期间,DNA聚合酶以依赖模板的方式从结合的延伸寡核苷酸合成生长的Xpandomer。到达模板末端后,DNA聚合酶遇到末端帽,并通过在帽的三磷酸基团和Xpandomer的3′末端XNMP之间形成磷酸二酯键,将末端寡核苷酸的5′末端连接到Xpandomer的3′末端,如第五幅草图中所示。相比之下,如图6A的第三幅画中的寡核苷酸645所示,缺少游离的5′三磷酸基团的末端寡核苷酸,不能通过DNA聚合酶连接到Xpandomer。
在某些实施例中,末端帽可连接至可检测染料630以通过例如凝胶电泳显现靶序列的封端的拷贝。图6B显示了示例性凝胶,其中100mer模板的Xpandomer拷贝被标记在末端帽(泳道1-4,对应于图6A的第四幅草图)或引物(泳道5-8,对应于图6A的第一幅草图)。封端取决于与末端寡核苷酸结合的5′核苷三磷酸基团的可用性,如使用缺乏游离5′三磷酸基团的阻断剂寡核苷酸645进行引物延伸反应时没有荧光信号所表明的(数据未显示),对应于图6A的第二副草图和第三副草图)。
在一些实施例中,末端帽或与末端帽的末端寡核苷酸互补的寡核苷酸可以连接至固体支持物以能够分离或纯化(例如,“捕获”)全长Xpandomer产物,如在此更详细地描述。
末端或“阻断剂”寡核苷酸被设计为与模板核酸中的末端帽靶序列强烈杂交。可以优化诸如寡核苷酸的长度和/或寡核苷酸的一个或多个核苷酸单体的化学结构的特征以实现所需的杂交强度。一般而言,末端寡核苷酸-靶序列模板的解链温度将至少为37℃,以实现最佳杂交形成,但较低的解链温度也是可能的。在某些实施例中,末端寡核苷酸的长度为约10个至约30个核苷酸。在一些实施例中,核苷酸类似物,例如一个或多个2’甲氧基核糖核苷酸、LNA(即“锁定的”核酸类似物)或G形夹被掺入末端寡核苷酸以增加结合效率。在一个实施例中,基本上末端核苷酸的所有核苷酸位于2’甲氧基核糖核苷酸。
示例性末端帽结构的某些特征的细节在图7A-7D中示出。图7A和7B描绘了末端寡核苷酸(SEQ ID NO:2)700,其中寡核苷酸的5’末端与柔性连接基710连接。柔性连接基包括末端叠氮化物部分720,其为点击反应提供底物,所述点击反应能够与修饰的5’核苷三磷酸帽(即,“帽”)共价连接,如参考图7C进一步描述的。结合到23mer末端寡核苷酸700的5’末端的柔性连接基710A和710B的示例性实施例分别在图7A和7B中示出。柔性连接基可以是惰性线性聚合物,其包含例如合适长度的烷基和/或PEG部分。在一个实施例中,柔性连接基由C6溴六亚磷酰胺形成。在一些实施例中,寡核苷酸的5’末端可包括一个或多个G形夹核苷酸类似物。
在示例性合成方法中,末端寡核苷酸通过常规自动化亚磷酰胺化学合成,在此期间完成的寡核苷酸的5′-羟基与溴己基亚磷酰胺(可从例如Glen Research获得)偶联。固体支持物用叠氮化钠处理以将溴基转化为叠氮化物。最后,寡核苷酸被去保护并从固体支持物上切割以提供叠氮基寡核苷酸,如图7B所示。
图7C说明了修饰的5’核苷三磷酸帽740的一个实施例,在本文中称为“ddNTP-O”(在该描述中由ddCTP-0表示)。帽的杂环部分用通过辛二炔臂747连接的末端炔烃部分745修饰,以介导通过点击反应连接到末端寡核苷酸的叠氮化物。在某些实施例中,所得末端帽的炔基三磷酸核苷(即,帽740)能够在末端寡核苷酸的5’末端与模板碱基配对。可以使用Ludwig和Eckstein描述的方法或其他5′-三磷酸合成方法合成炔基三磷酸核苷帽,参见,例如,A.R.Kore,A.R,Srinivasan B.,Recent Advances in the Syntheses of NucleosideTriphosphates,Current Organic Synthesis,10(6),903-34(2013),其全部内容以引用方式并入本文。
图7D说明了通过点击反应形成的完整末端帽结构780的一个实施例,以将三磷酸帽740(即炔基核苷三磷酸帽)与末端寡核苷酸(SEQ ID NO:2)700可操作连接。不受理论束缚,假设末端帽的柔性连接基710B为结构提供足够的空间柔性或自由度,使得三磷酸基团750可以进入DNA聚合酶的活性位点并作为底物起作用用于在引物延伸反应期间在末端帽和Xpandomer的3′末端之间形成磷酸二酯键。DPO4 DNA聚合酶的变体特别适合将末端帽结构连接到Xpandomer的3’末端。
在本发明的某些实施例中,考虑了替代的末端帽结构和将末端寡核苷酸连接到Xpandomer的3’末端的方法。在一个实施例中,使用补骨脂素桥连接法。简而言之,末端寡核苷酸的5′末端被修饰以呈现补骨脂素部分,其在暴露于紫外线(UVA)辐射时可与胸腺嘧啶形成单加合物和共价链间交联(ICL)。因此,补骨脂素修饰的末端寡核苷酸可在暴露于UVA辐射时化学交联至Xpandomer中的3’胸腺嘧啶。有利地,补骨脂素桥抗酸切割。
在其他实施例中,补骨脂素修饰的末端寡核苷酸可包括其他特征以能够连接于固体基质并从固体基质释放。例如,寡核苷酸的3’末端可以包括包含核酸酶切割位点的连接基核酸序列。在一些实施例中,切割位点被RNA酶识别和切割。任何合适的RNA酶识别位点可以,例如用于RNA酶A、RNA酶H或RNA酶T1。在其他实施例中,切割位点被nicking核酸内切酶或胰蛋白酶识别和切割。当通过连接基的3’末端与固体支持物结合时,末端寡核苷酸可以通过用合适的核酸酶进行酶处理而选择性地释放。
末端标记
作为封端的替代策略,本发明人设计了组合物和方法以在合成后将前导序列可操作连接(例如,连接或共价附接)至Xpandomer的3′末端。以这种方式,只有基本上全长的Xpandomer将包括3′前导序列,这是将Xpandomer穿过纳米预传感器所必需的。在一个实施例中,末端标签结构基本上是一种修饰的Xpandomer,其中报告子元件被前导元件和增强子元件替代,并且易位控制元件被polyG寡聚物替代。末端标签的氨基磷酸酯键和polyG寡聚物元件都是酸不稳定的。因此,在酸处理后,末端标签的5′半部分将保持与Xpandomer相关联,包括前导元件和增强子元件之一,这使得纳米孔能够从Xpandomer的3′末端穿出。
在一个实施例中,一种对Xpandomer进行末端标记的方法可以包括以下步骤:1)进行固态Xpandomer合成,其中底物结合的延伸寡核苷酸缺少前导序列和增强子序列;2)进行延伸反应足够长的时间以提供大量基本全长的Xpandomer产物群;3)洗涤底物结合产物以去除所有延伸试剂;4)将末端标签结构和聚合酶介导的末端标签与Xpandomer的3′末端的连接所需的其他反应成分添加到底物。在一些实施例中,所述方法可包括以下步骤:在延伸反应之前将末端阻断剂核苷酸与模板杂交,并在延伸之后和洗涤和进行末端标签添加反应之前去除末端阻断剂核苷酸。
B.带封端的固态合成
可以使用本领域已知的任何合适的支持物平台将本文所述的封端方法与固态Xpandomer合成工作流程集成。在某些实施例中,固态支持物可以是常规珠、管、毛细管或微流体芯片。在一个实施例中,固体支持物是耐酸磁珠。如本文进一步讨论的,在本发明的一些实施例中,寡核苷酸引物可以结合到支持物上。在其他实施例中,末端帽的末端寡核苷酸或其反向互补序列可以结合到支持物上。
远离支持物(AFS)Xpandomer合成工作流程
在该实施例中,Xpandomer合成从与支持物结合的引物-模板复合物开始,并远离支持物向与模板的相反(即,3′)末端杂交的末端帽结构延伸。AFS模型的初始构型如图8A所示,三个草图中的每一个都说明了相同的特征。在该实施例中,寡核苷酸引物810的5’末端通过连接基830与固体支持物820结合。单链模板840通过标准氢键与引物杂交。同样,封端寡核苷酸850通过标准氢键与模板的5’末端杂交,并提供游离的5′三磷酸基团855。核酸聚合(即Xpandomer合成)的方向由箭头指示。
从引物810开始的Xpandomer合成反应的示例性产物示于图8B中。顶部和中间的草图描绘了与引物810共价连接并通过氢键与模板840杂交的全长Xpandomer拷贝870。全长Xpandomer产物也通过磷酸二酯键与封端寡核苷酸850共价连接。底部草图描绘了一个不完整的Xpandomer拷贝860,它仍然与引物共价结合,但重要的是,不与封端的寡核苷酸850连接。
如本文别处所讨论的,合成后,Xpandomer被加工并用酸处理以将Xpandomer从图8B中描绘的受约束形式到图8C中描绘的扩展的线性化形式。此处,显示模板840与支持物结合的Xpandomer分离。顶部草图显示线性化的全长Xpandomer 875仍与固体支持物820和封端的寡核苷酸850共价结合。中间的草图显示酸处理的替代结果,其中全长Xpandomer已被切割以生成线性化片段865A和869。片段865A保持与固体支持物连接,而片段869从支持物释放到溶液中。底部草图显示线性化的Xpandomer片段865B,也与固体支持物结合。如图8D说明,洗涤后,全长线性化的Xpandomer 875和线性化片段865A和865B仍与固体支持物结合。重要的是,只有全长Xpandomer 875连接至封端的寡核苷酸850。
图8E说明了封端寡核苷酸850如何可用作分子标签以从包括不完整片段的异质群中分离或“捞出”全长Xpandomer产物。仍与如图8D中所示的初始支持物结合的Xpandomer产物通过光解作用从支持物释放。如本文别处所述,寡核苷酸引物与初始固体支持物的连接被设计为光敏的。释放的Xpandomer 865和875保持与寡核苷酸引物810共价结合,并且全长Xpandomer 875保持与封端寡核苷酸850共价结合。为了分离全长Xpandomer,将样品与第二固体支持物890接触,该固体支持物与为封端寡核苷酸850的反向互补序列的寡核苷酸880缀合。如图所示,只有全长Xpandomer 875会通过寡核苷酸850和880之间的氢键结合到固体支持物上。如图8F所示,所有不完整的Xpandomer产物都可以从固体支持物上洗掉,留下分离的全长Xpandomer 875,然后可以将其从支持物上洗脱下来并用于例如单分子纳米孔测序。在该实施例中,延伸寡核苷酸包括纳米孔定位和易位所必需的特征(例如,前导元件和聚集剂元件)。
在替代实施例中,末端帽寡核苷酸被修饰以包括用于纳米孔穿线的前导和聚集剂特征,而延伸寡核苷酸缺乏这些特征。在该实施例中,只有全长延伸产物将连接至前导元件和聚集剂元件,因此能够通过纳米孔移位以产生序列信息。
在另一个实施例中,延伸寡核苷酸结构被修饰以包括用于纳米孔穿线的前导和聚集剂特征,而末端帽寡核苷酸缺乏这些特征。在该实施例中,Xpandomer合成和封端反应可以在溶液中进行。在Xpandomer合成之后,可以通过将样品与固定在珠支持物上的寡核苷酸接触来纯化封端的产物,例如通过生物素-链霉亲和素化学,其中寡核苷酸包括为末端帽寡核苷酸序列的一部分的反向互补序列的序列。以这种方式,只有那些同时包括延伸寡核苷酸结构(提供前导和聚集剂特征)和末端帽的Xpandomer产物才能穿过纳米孔传感器以提供序列信息。
朝向支持物(TS)Xpandomer合成工丝流程
在本发明的一个替代实施例中,末端帽结构的末端寡核苷酸与底物共价结合。在该实施例中,Xpandomer合成从与末端帽结构的末端寡核苷酸杂交的引物-模板复合物开始,并且Xpandomer合成的方向朝向支持物。TS模型的初始构型如图9A所示,两个与支持物结合的末端帽980中的每一个说明了相同的特征。在该实施例中,末端寡核苷酸950的3’末端通过可光切割连接基930与固体支持物920结合。末端帽980提供游离的5′三磷酸955。
末端帽末端寡核苷酸序列被设计为单链靶核酸模板的5’末端序列的反向互补序列。图9B说明了靶核酸模板940的5’末端与末端帽的末端寡核苷酸之间通过标准碱基配对的关联。在该实施例中,延伸寡核苷酸910与模板3’末端的互补序列杂交。Xpandomer合成从引物910的3’末端开始,并朝着与支持物结合的末端帽前进。该模型中核酸聚合(即Xpandomer合成)的方向由箭头指示。
从引物910开始的Xpandomer合成反应的示例性产物示于图9C中。顶部草图描绘了全长Xpandomer拷贝970通过磷酸二酯键与引物910和封端寡核苷酸950共价连接。底部草图描绘了一个不完整的Xpandomer拷贝960,它仍然与引物共价结合,但重要的是,不与末端帽的末端寡核苷酸950连接。
如本文别处所讨论的,合成后,Xpandomer被加工并用酸处理以将Xpandomer从图9C中描绘的受约束形式到图9D中描绘的扩展的线性化形式。此处,模板840和不完整的Xpandomer 960已从支持物上解离并从结合的材料上洗掉。顶部草图显示线性化的全长Xpandomer 975通过末端帽的末端寡核苷酸950与固体支持物920共价结合。重要的是,只有全长Xpandomer拷贝仍与固体支持物结合。这些可随后通过可光切割部分930的光介导切割释放并用于纳米孔测序。
在某些情况下,例如,如果DNA聚合酶过早地将末端帽结构连接到模板的不完整拷贝,在封端过程中可能会形成截短的副产物。这种现象在本文中称为聚合酶“短路”。为了防止短路,本发明人设计了几种策略来延迟末端帽结构掺入Xpandomer,从而有利于模板的基本全长拷贝的合成。在图10A中概述的一个实施例中,阻断剂核苷酸1010与单链模板1020的3’末端附近的区域杂交。阻断剂寡核苷酸被设计为通过DNA聚合酶防止掺入正在生长的Xpandomer。在一些实施例中,阻断剂寡核苷酸的5’末端缺少5’三磷酸基团,因此不能与Xpandomer的3’末端连接。当聚合酶到达阻断剂寡核苷酸时,寡核苷酸1030的延伸因此停止。此时,可以例如通过热熔解从模板中去除阻断剂寡核苷酸,并被末端帽寡核苷酸1040取代,该寡核苷酸能够通过DNA聚合酶连接到基本上全长的Xpandomer 1050。可以计算合适的解链温度,其导致短阻断剂寡核苷酸解离,同时不影响较长Xpandomer与模板的杂交。
在另一个实施例中,如图10B所示,阻断剂寡核苷酸1015被设计为提供5’磷酸基团。如上所述,DNA聚合酶不能将阻断剂寡核苷酸掺入生长的Xpandomer中,因此当聚合酶遇到阻断剂时合成停止。在该实施例中,阻滞剂可以例如通过核酸外切酶介导的消化被移除。在外切核酸酶处理后,末端帽寡核苷酸1040与模板杂交并通过DNA聚合酶与基本上全长的Xpandomer 1050连接。
C.用封端构建的镜像Xpandomer文库
该通用实施例描述了可用于生成模板构建体文库的新方法和核酸组合物,其中每个单独的构建体包含核酸靶序列(即模板)的相同链的两个单链拷贝,所述两个单链拷贝通过基于寡核苷酸的连接基串联。此类模板构建体的文库在本文中称为“镜像文库”。镜像文库为采用本文公开的封端策略的新Xpandomer合成方案提供模板。简而言之,从每个模板构建体合成单个Xpandomer聚合物,产生包括靶标的相同链的两个拷贝的Xpandomer产物,所述两个拷贝通过共价键合可操作连结至帽分支结构。靶序列的两个拷贝在合成期间通过本文所述的封端方法各自连接到帽分支结构。有利地,从镜像文库构建体合成的Xpandomer在通过纳米孔时提供单个靶序列的两个序列读段。第一次和第二次读段的序列之间的差异表明存在潜在的测序错误,可以将这些差异排除或进行质量评分或某些差异解决方法。
镜像文库模板构建体是通过一系列有序的酶促反应产生的,每个酶促反应产生一个特征前体构建体。图11A说明了镜像文库模板构建体前体的一个实施例的基本结构特征,称为“M1”,1100。M1前体通过Y形衔接子构建体1110、文库片段1120和帽引物衔接子构建体(本文称为“三叉”)1130的可操作连接(即,通过形成共价键连接或附接)形成。在该实施例中,Y形衔接子1110包括3’至5’寡核苷酸链1111和5’至3’寡核苷酸链1113,在本文中按照惯例分别称为“负”和“正”链。衔接子链1111和1113在Y形衔接子的“茎”部分中特异性杂交,所述“茎”部分靠近文库片段,而“臂”部分远离文库片段,保持单链。Y形衔接子的双链茎部分可以连接到文库片段。在该实施例中,衔接子链1113的3’末端具有未配对的核苷酸,此处由游离“T”表示,其可与文库片段提供的游离核苷酸碱基配对以促进连接。Y形衔接子的臂可以设计成为镜像文库工作流程提供几个有用的功能,包括在Xpandomer合成后期使用的寡核苷酸引物(即延伸寡核苷酸)的结合位点。在一些实施例中,Y形衔接子链的一个或两个单链区的末端提供叠氮基团,如本文所述,叠氮基团能够通过点击反应将Y形衔接子固定到功能化固体支持物上。在其他实施例中,Y形衔接子的一条或两条链可以包括可选择性切割元件,其能够例如从固体支持物上释放构建体。在一些实施例中,如本文进一步描述的,负链1111连接到固体支持物,而正链1113提供用于外切核酸酶消化的5′核苷酸底物。
文库片段1120是双链核酸,在一个实施例中,5’磷酸末端和3’核苷酸在两条链上突出,其可以通过本领域公认的技术产生。文库片段在本文中也称为“核酸靶序列”并且是通过SBX确定序列的靶标。文库片段包括“正”链1120A和“负”链1120B。在一些实施例中,负链的3′末端可提供未配对的核苷酸(此处由游离的“A”表示),其与衔接子链1113的3′末端的未配对核苷酸形成碱基对。在其他实施例中,正链的3′末端还提供未配对的核苷酸(此处由游离的“T”表示)以促进与帽引物衔接子1130的连接。文库片段可包括已知或未知序列。对于SBX,文库片段的长度可能高达约50、100、200、500或1000个碱基对。在一些实施例中,文库片段的长度为约100至约200个碱基对。
帽引物衔接子构建体1130包括通过化学分支可操作连结的三个寡核苷酸链,1131A、1133和1131B。链1131B和1133的序列是互补的并且可以杂交。链1131A的序列与1131B相同,并且该链在帽引物衔接子1130中可以保持单链(或在一些情况下可以与链1133杂交)。在一些实施例中,链1131B的3’末端提供未配对的核苷酸(此处由游离“A”表示),其与文库片段的正链1120A的3’末端处的未配对核苷酸形成碱基对。
帽引物衔接子可以通过标准自动化的基于亚磷酰胺的寡核苷酸合成来产生。在一些实施例中,首先在5′到3′方向上合成链1133,然后掺入对称的化学分支(例如,ChemgenesCLP-5215),其能够实现链1131A和1131B的5′到3′合成同时进行。在一些实施例中,在分支和链1131A和1131B的5′末端之间掺入标准亲水性间隔基(例如,PEG6间隔基)提供了柔性连接基,所述连接基使这些链能够在链1133上向后折叠以形成帽引物衔接子的特征“三叉”结构。可以针对特定应用优化帽引物衔接子的寡核苷酸和分支成分的长度和组成。在某些实施例中,寡核苷酸的长度约为15至25个核苷酸,并且能够与下文讨论的帽分支构建体有效杂交。
镜像文库模板构建体可以在溶液中或在固体支持物上形成。在一个实施例中,镜像文库模板构建体通过首先根据以下示例性步骤产生M1前体而在固体支持物上形成:1)Y形衔接子链1111通过点击反应固定在功能化固体支持物(例如,微流体芯片或珠)上,然后Y形衔接子链1113与衔接子链1111特异性杂交;2)帽引物衔接子1130通过正链1120A的3′末端与1133链5′末端的溶液内酶促连接以及负链1120B的5′末端与片段1131A的3′末端连接而与文库片段1120连接;以及3)然后将连接的文库片段-帽引物衔接子结构通过酶促连接到Y形衔接子1110的双链部分的末端而与支持物连接。
M1镜像文库模板构建体前体1100提供用于形成最终镜像文库模板构建体的基质,称为“M3”,图11B中描绘的1150。在一个实施例中,模板构建体1150可以通过两个酶促步骤产生:产生正链1120A的互补序列的第一DNA聚合步骤,随后去除该相同正链的第二外切核酸酶步骤。在第一步中,帽引物衔接子链1131A被DNA聚合酶(例如链置换热稳定聚合酶)使用链1120A作为模板从3′末端沿箭头所示方向延伸;这产生了三链结构,本文称为模板构建体前体“M2”1140。M2前体包括与负链1120B具有相同序列的子链1120C。在第二步中,M2前体的中间寡核苷酸链通过从Y形衔接子链1113的5′末端开始核酸外切酶消化被酶促去除,这为核酸外切酶提供5′磷酸底物。整个原始正链1120A如帽引物衔接子链1133一样被去除。所得产物是镜像文库模板构建体“M3”1150,其包括由帽引物衔接子的链1131A和1131B连接的文库片段的原始负链的两个相同拷贝1120B和1120C,它们保持连接在一起。M3镜像文库构建体1150可以用作模板来合成包括文库片段1120的相同链的两个拷贝的单个Xpandomer。
如本文所讨论的,M3构建体用作合成Xpandomer的模板,每个Xpandomer包含用于纳米孔测序,即扩增测序(SBX)的靶序列的相同链的两个拷贝。在一些实施例中,镜像文库构建体的SBX在固体支持物上进行并采用本文所述的封端方案。在该实施例中,如图11C所示,延伸寡核苷酸1170和1180的5’末端通过如本文所述的点击化学连接至固体支持物1190。在这些实施例中,延伸寡核苷酸包括5’叠氮化物基团以介导点击连接。在其他实施例中,只有一个延伸寡核苷酸与支持物连接,而另一个延伸寡核苷酸包括用于穿过纳米孔的前导序列。每个延伸寡核苷酸被设计成与M3模板构建体的Y形衔接子元件的单链部分之一特异性杂交。在某些实施例中,延伸寡核苷酸可以包括插入固体支持物和寡核苷酸序列的5’末端之间的可光切割元件或可酸切割元件,以使最终Xpandomer产物能够实现从基质上光或酸介导的释放。M3模板构建体1150通过延伸寡核苷酸中的互补序列与M3构建体的Y形衔接子部分的臂之间的标准杂交而与固定的延伸寡核苷酸1170和1180杂交。帽分支构建体1195与M3构建体杂交。帽分支1195包括两个相同的寡核苷酸1197A和1197B,它们与镜像文库构建体1150的两条链的5′末端互补并杂交。末端寡核苷酸臂1197A和1197B各自提供游离的5’三磷酸基团。帽分支结构可以通过常规亚磷酰胺化学合成,其中两条链1197A和1197B通过化学分支连接。
图12说明了帽分支结构特征的进一步细节。在该实施例中,帽分支1295包括分支结构1220、末端寡核苷酸臂1230A和1230B,其包括三唑部分(“R”)、末端帽(“ddCTP”)和寡核苷酸(SEQ ID NO:3)。帽分支通过标准亚磷酰胺化学,从3’末端部分开始合成,本文以PEG6聚合物为例。将对称的化学分支添加到末端部分的5′末端以实现分支间隔基的平行合成,本文以PEG6聚合物为例。在一些实施例中,可以针对特定应用优化间隔基的长度和组成。在某些实施例中,间隔基可包括C2、C6或PEG3单体。末端寡核苷酸臂1230A和1230B延伸离开分支臂的5’末端。末端寡核苷酸的序列被设计成与M3模板构建体的5′末端杂交,其序列由帽引物衔接子提供。在一些实施例中,末端寡核苷酸的长度为约15至约50个核苷酸,并且包括一个或多个甲氧基核苷酸类似物。末端寡核苷酸的5′末端连接到末端帽结构,本文以ddCTP为例(尽管在某些实施例中可以取代任何其他核碱基),这使得新生的Xpandomer能够通过封端与末端寡核苷酸连接。封端方法的细节在本文中并参考图7A-7D进行了讨论。末端帽通过三唑部分(“R”)连接到末端寡核苷酸,三唑部分是末端帽提供的炔烃部分和末端寡核苷酸提供的叠氮化物部分之间点击反应的产物。在一些实施例中,帽分支被设计为包括其他连接基结构,例如,位于末端帽和末端寡核苷酸之间的精胺聚合物以提供例如,增加的空间柔韧性和与末端帽的结合。
继续参考图11C,进行Xpandomer合成反应,其起始于延伸寡核苷酸1170和1180的3’末端,以相同方向进行(如箭头所示)并终止于帽分支1195的末端寡核苷酸1197A和1197B的5’末端,在该合成反应之后聚合酶根据本文所述的封端方法将完整的Xpandomer拷贝1199A和1199B连接到帽分支。在一个实施例中,第一延伸寡核苷酸包括可光切割连接基元件,第二延伸寡核苷酸包括酸不稳定连接基元件。Xpandomer的酸处理将同时将Xpandomer拷贝从“受约束”构型转变为“开放”构型1000并切割延伸寡核苷酸中的酸不稳定连接基。然后可以通过第二延伸寡核苷酸的可光切割连接基的光解作用从支持物上去除包括文库片段的两个连接的Xpandomer 1199A和1199B的所得产物。在一些实施例中,进行最后的纯化步骤,其中释放的镜像Xpandomer 1000与和连接到第二固体支持物的延伸寡核苷酸之一互补的寡核苷酸杂交。
用于产生M1、M2和M3镜像文库构建体和SBX以合成Xpandomer的反应条件可以通过反复试验来优化。在一些实施例中,这些构建体可以通过以下图13中概述的工作流程产生。在步骤1中,M1前体通过连接Y形衔接子、文库插入物和三叉产生。YAD1∶YAD2∶插入物∶三叉的摩尔比可以针对特定条件或应用进行优化。在一些实施例中,M1前体可以通过首先在炔烃功能化芯片上组装Y形衔接子而在微流体芯片上产生。在一个实施例中,根据以下示例性方案,通过点击化学将提供末端叠氮化物基团的第一Y形衔接子链连接至功能化芯片:1)制备包括3.0mM THPTA、6.0mM抗坏血酸钠、1mM CuSO4、5.0mM氨基胍和10%DMF或DMSO的催化剂混合物,制备包括10%DMF或DMSO、25mM磷酸钠,pH 7.0、1μM叠氮化物-Y形衔接子寡核苷酸链1、2.5mM MgCl2、5mM氨基胍和6.0mM抗坏血酸钠的底物混合物;2)将11μl催化剂混合物添加到44μl底物混合物中,将50μl该反应液加入炔烃功能化微流体芯片,如COC芯片,并室温孵育20′;3)将芯片用300μl溶液I0002(0.3M磷酸钠,pH 8.0,1%吐温20,0.5%SDS,和1mMEDTA)在37℃洗涤5′,然后用900μl缓冲剂A.1(0.5M NH4OAc,pH 6.5、1M尿素、5%NMS,和2%PEG8000)洗涤。在点击连接之后,通过制备在缓冲剂A.1中包括100pmol的第二寡核苷酸的杂交混合物,将第二Y形衔接子链与底物结合的第一链杂交。杂交混合物在90℃下孵育15″,然后冷却至72℃。然后将混合物添加到预热的芯片中,并使用热循环仪将芯片冷却至32℃,持续5′。然后用缓冲剂A.1洗涤芯片。接下来,将文库插入物和三叉衔接子连接到结合的Y形衔接子。插入片段在包括100mM NaCl/20mM Tris,pH 8.0的缓冲剂中于90℃变性3′,然后使用热循环仪在5′内下降至50℃。制备包括在1x连接缓冲剂(66mM Tris、10mM MgCl2、1mMDTT和7.5%PEG6000)中的20pmol双链插入物、50pmol三叉衔接子、3mM ATP、2U/μl T4 PNK和200U/μl T4 DNA连接酶的连接混合物。连接反应在16℃下运行15′,然后将反应加入到结合了Y形衔接子的芯片中。芯片在16℃下孵育15′。然后除去连接混合物,将3μl的5′脱腺苷酸化酶(50,000U/ml)添加到连接混合物中,然后将连接混合物加回到芯片中,并将芯片在16℃下孵育15′。然后在37℃下用4ml缓冲剂I0002洗涤芯片5′。接下来用水洗涤芯片,并可以在4℃下储存在10mM Tris中。
在步骤2中,M2前体通过M1前体的延伸制备。在一个实施例中,在包括1.0X聚合酶缓冲剂、0.2mM每种dNTP、0.28U/μl DNA聚合酶和1mM MgCl2的延伸反应中使用大约2.5-10pmol的芯片结合M1。合适的DNA聚合酶是Vent(exo-)DNA聚合酶或KAPA HiFi。将芯片置于热循环仪中并在95℃下孵育1′,然后在90℃至98℃下20″循环10至40次,然后在76℃下6″。芯片用水洗涤以除去多余的试剂。然后通过在水中加入含有0.05U/μl至0.80U/μl蛋白酶K的溶液并在55℃下孵育5′,然后在95℃孵育5′,用蛋白酶K处理芯片。用水洗涤芯片。
在步骤3中,M3模板构建体是通过外切核酸酶消化产生的。在一些实施例中,将包括在外切核酸酶缓冲剂中的0.45U/μlλ外切核酸酶的外切核酸酶消化混合物添加至芯片并在37℃下孵育5′,然后在75℃孵育10′。芯片先用缓冲剂10002洗涤,然后用水洗涤,然后储存在含有10mM Tris的缓冲剂中。
在步骤4中,结合的M3构建体通过光切割释放。在一些实施例中,芯片经由紫外固化灯(例如,Phoseon Technology FireFly灯)暴露于紫外光(例如,365nm)15”。通过从芯片上吸出液体来回收释放的M3构建体。
在步骤5中,M3模板构建体的Xpandomer拷贝由SBX方法产生。在一些实施例中,Xpandomer在微流体芯片上产生,如步骤1中所述第一延伸寡核苷酸(例如,“E52”EO)通过点击化学共价结合到该微流体芯片上。该EO在本文中可称为“捕获寡核苷酸”。捕获寡核苷酸用于通过杂交在芯片上组装M3模板、第二延伸寡核苷酸和帽分支结构。捕获芯片用缓冲剂A1(0.5M NH4OAc,pH 6.5、1M尿素、5%NMS和2%PEG8000)洗涤,并在65℃下孵育。制备包含约5pmol至约30pmol的M3构建体、约20pmol至约80pmol的第二延伸寡核苷酸(例如“E6 EO”;实际量将由结合到芯片的E52捕获寡核苷酸的量确定),和大约20pmol至80pmol帽分支(实际量将与EO量大致相同)的杂交混合物。杂交混合物在95℃下孵育15″,然后添加到芯片中并在65℃下孵育30″,然后以0.1℃/秒的速率下降至37℃,并在此温度保持5′。芯片孵育温度由装有原位杂交适配板的标准热循环仪控制。
对于Xpandomer合成,通过混合缓冲剂P(0.6mM MnCl2和0.18μg/μl DPO4 DNA聚合酶变体)和缓冲剂X(80μM PP-60.22和80μM每个XNTP),然后添加缓冲剂A(50mM Tris,pH8.84、200mM NH4OAc,pH 6.88、20%PEG8K、5%NMS、0.2μg/μl SSB、0.5M甜菜碱、0.25M尿素、1mM PEM AZ-8,8和4mM PEM添加剂)来制备延伸混合物。将延伸混合物加入芯片并在20-45℃下孵育15′-60′。用缓冲剂B(100mM HEPES、100mM NaHPO4、5%Triton和10%DMF)洗涤芯片。
在步骤6中,Xpandomer被切割并在0-75%乙腈中洗脱。在一个实施例中,捕获寡核苷酸包括可光切割元件。为了从芯片上释放Xpandomer,芯片暴露在紫外光下15″。然后将芯片在37℃下孵育2′,并用移液管移出Xpandomer样品。
对于纳米孔测序,一个或两个延伸寡核苷酸包括设计用于促进Xpandomer穿过纳米孔的前导序列。前导序列的某些实施例的更多细节在申请人授权的美国专利号9,670,526“Concentrating a Target Molecule for Sensing by a Nanopore”,其全文通过引用并入本文。在一个实施例中,示例性延伸寡核苷酸的序列由:RD10(PC)L25Z6[TCATAAGACGAACGGA(SEQ ID NO:4)]表示,其中“R”代表能够通过点击化学连接至功能化固体-底物的5′-叠氮化物基团;“D”代表聚-PEG6间隔基;“PC”代表可光切割的间隔基,以能够从固体基质上释放;“L”代表在纳米孔易位过程中充当前导序列的聚-C2间隔基;“Z”代表聚-C12间隔基,并且TCATAAGACGAACGGA(SEQ ID NO:4)代表将与靶序列杂交并用作DNA聚合酶的延伸引物的寡核苷酸。在其他实施例中,PC间隔基可以被酸不稳定间隔基替代,例如[dT p-乙氧基][DMS(O)MT-NH2-C6或glen amidite 10-1907]亚磷酰胺。设计到延伸寡核苷酸中的每个亚磷酰胺单体(即“间隔基”)的数量是可变的,并且可以针对特定应用进行优化。在其他实施例中,在镜像文库合成期间,前导序列可以包含在启动Xpandomer合成的一个或两个延伸寡核苷酸中。在某些实施例中,前导序列是由未与底物共价结合的第一延伸寡核苷酸提供,而与底物连接的第二延伸寡核苷酸缺少前导序列。在Xpandomer合成和加工之后,任何未连接到第二个延伸寡核苷酸的截短产物都可以通过洗涤从基质上去除。Xpandomer从基质上释放后,任何未连接到第一延伸寡核苷酸的截短产物将缺少前导序列,并且有利地无法穿过纳米孔以提供序列数据。
D.下一代、无YAD、镜像文库构建体和方法
此处讨论的镜像库工作流程的几个特征可以进行修改和/或优化,以为特定实验需求提供优势。在图11A-11C所示的实施例中,Xpandomer延伸寡核苷酸的结合位点和固态连接的官能团由Y形衔接子提供,Y形衔接子通过酶促连接与文库片段连接。在替代的“下一代”实施例中,延伸寡核苷酸的结合位点反而由通过PCR连接到文库片段的寡核苷酸引物提供。这种方法既可以扩增靶序列,又可以消除将YAD连接到文库片段的连接步骤。在将引物序列掺入文库片段后,所得的PCR产物被称为“加尾”或“带标签的”文库片段(或者,可替代地,“带标签的靶序列”)。在一些实施例中,用于固态连接的功能化末端基团由单独的寡核苷酸结构提供,该结构包括本文称为“捕获寡核苷酸”的寡核苷酸序列,其设计为在PCR扩增后与文库标签特异性杂交。一般而言,这些实施例在本文中被称为“无YAD”镜像文库构建。
文库片段(即DNA靶序列)的无YAD标记和捕获的一个实施例,如图14所示。在本实施例中,文库片段的例子是具有正链(SEQ ID NO:5)1410A和负链(SEQ ID NO:6)1410B的双链100mer 1410。正向和反向PCR引物被设计为包括与靶序列互补的在其5′末端与异源序列连接的寡核苷酸序列。在一个实施例中,引物(SEQ ID NO:7)1420包括与文库片段的正链1410A中的互补序列特异性杂交的3′寡核苷酸序列,和将标签引入PCR产物的能够实现对带标签的文库片段的捕获的5′异源序列。在该实施例中,5’异源序列被称为“UP38”,并且是存在于捕获寡核苷酸结构和Xpandomer延伸寡核苷酸两者中的相同序列。在一些实施例中,引物(SEQ ID NO:8)1425包括与靶序列负链1410B中的互补序列特异性杂交的3’寡核苷酸序列,和在Xpandomer合成过程中为掺入的帽衔接子结构提供结合位点的5’异源序列。图14A显示与单链正链1410A(SEQ ID NO:5)和负链1410B(SEQ ID NO:6)杂交的PCR引物。文库片段的PCR扩增产生带标签片段1430,具有正链(SEQ ID NO:9)1430A和负链(SEQ ID NO:10)1430B),其包括第一标签(SEQ ID NO:11)1438和序列由PCR引物的异源序列尾部确定的第二标签(SEQ ID NO:9的核苷酸1-22)1439。在设计引物1420和1425时,遵循在本领域中充分建立的标准引物设计原则。
为了捕获带标签的文库片段,捕获寡核苷酸结构通过例如本文所述的点击化学共价连接至固体支持物。通用捕获寡核苷酸结构的一个实施例可以表示如下:[叠氮化物]DnLnZn(SCL)(CO),其中叠氮化物提供共价连接(即固定)至功能化固体支持物(例如,用叠氮基团或双生物素基团功能化);D代表PEG6,L代表C2,Z代表C6,其中D、L和Z的聚合物可以形成柔性连接基结构;(SLC)代表可选择性切割的连接基,在此实施例是尿嘧啶残基的多聚体;(CO)代表捕获寡核苷酸的寡核苷酸序列。在该实施例中,CO序列是与UP38异源序列(SEQID NO:11)相同的序列,并且将与文库片段的正链的标签序列特异性杂交。在一些实施例中,柔性连接基仅由PEG6单体(例如D16)形成,当PCR反应在如本文所讨论的珠或微流体芯片上进行时,该柔性连接基提供优势。
为了捕获带标签的文库片段,进行第二PCR反应,其中在提供捕获寡核苷酸的固体支持物上进行第二PCR反应。文库片段的捕获以简化形式示于图14B中。在此,捕获寡核苷酸结构1440固定在固体支持物1445上。捕获寡核苷酸结构包括与文库片段负链1430B中的标签序列(SEQ ID NO:11)1438相同的3’寡核苷酸序列。当双链文库片段变性时,正链1430A与捕获寡核苷酸特异性杂交。捕获寡核苷酸提供了用于合成正链1430A的互补序列拷贝的引物,此处由1430C(SEQ ID NO:10).表示。适当数量的PCR循环将产生固定在固体支持物上的双链文库片段1450。
可以通过反复试验优化用于在溶液内标记文库片段,然后在芯片上捕获带标签的扩增子产物的反应条件。在一个实施例中,溶液内PCR标记反应可以如下进行:制备反应混合物,其包括1-15amol合成模板DNA(或在其他实施例中,剪切的天然文库DNA)、2μM每种引物、350μM dNTP、1X KOD缓冲剂(120mM Tris,pH 8.0、20mM KCl、6mM NH4SO4、1.5mM MgSO4和1%Triton X100)、0.05U/μl KOD聚合酶;反应在95℃下循环2′,然后在95℃下10”/68℃下8”/72℃下8”的30个循环,在72℃下进行一次3′延伸;约25pmol的带标签的扩增子的最终产率可以通过例如QIAquick柱(可从QIAGEN获得)进行纯化。
在一个实施例中,捕获芯片可以如下制备:100pmol的UP38捕获寡核苷酸通过点击反应共价连接到炔烃功能化芯片上,该点击反应包括10%DMF、3mM THPTA、25mM Na3PO4、5mM氨基胍、6mM NaAsc和1mM CuSO4;反应在室温下进行20′,然后洗涤芯片,然后进行BSA钝化(在PBS中的10mg/ml未乙酰化的BSA在室温进行约1小时)。
在一个实施例中,芯片上PCR反应可以如下进行:将约1x106个拷贝的带标签的扩增子产物、200pmol UP39引物和5pmol UP38引物添加到含有约100pmol结合的UP38捕获寡核苷酸的芯片中;添加包含KAPA HiFi HS U+、1X ReadyMix缓冲剂(2.5mM Mg)、0.1μg/ml未乙酰化的BSA、1M甜菜碱、2%DMSO、1%PEG和0.5%吐温的PCR混合物;PCR循环条件如下:98℃下2′,100℃下1’/48℃下12”/67℃下30”/80℃下2’的35个循环,然后是最后的在80℃下2′;然后在含有1M NaCl和10mM Tris,pH 8.0的缓冲剂中洗涤芯片。
如本文所讨论的,在固体支持物上捕获的带标签的文库片段提供了用于产生M3镜像文库模板构建体的基质,该M3镜像文库模板构建体为Xpandomer合成提供了模板。本发明考虑了用于M3和Xpandomer产生的几种替代工作流程。以下是对替代“下一代”镜像文库工作流程的某些实施例的非限制性讨论。
利用旁观者延伸寡核苷酸的单支持物镜像文库产生。
在该实施例中,M3镜像文库模板构建体和Xpandomer在相同的固体支持物,例如珠或微流体芯片上合成。用于M3产生的捕获寡核苷酸和用于Xpandomer合成的延伸寡核苷酸都固定在支持物上。在一些实施例中,延伸寡核苷酸被设计成形成防止在基于PCR的捕获期间与文库片段杂交的发夹结构,因此在本文中被称为“旁观者”寡核苷酸。如以下进一步讨论的,在捕获带标签的文库片段之后,旁观者寡核苷酸可以选择性地转化为功能性延伸寡核苷酸。
图15A和15B说明了具有旁观者延伸寡核苷酸的单支持物合成的基本特征。在图15A中,带标签的文库片段1510显示为固定在固体支持物1505上。基于PCR标记文库片段和通过捕获寡核苷酸结构1515与固体支持物的连接如本文所述进行并参考图14。在一个实施例中,捕获寡核苷酸结构可以具有以下序列:5’[叠氮化物]D16(UUUUU)(UP38)3’,其中叠氮化物基团介导与固体支持物的连接,“D”代表PEG6连接基,“U”代表脱氧尿嘧啶,“UP38”代表捕获寡核苷酸序列。U5序列是可选择性切割的,例如通过
Figure BDA0003221916090000431
(尿嘧啶特异性切除试剂),可从NEB获得,它在尿嘧啶残基的位置产生单核苷酸缺口并切割所得的无碱基位点。旁观者延伸寡核苷酸1520A和1520B也固定在支持物上。旁观者寡核苷酸的序列被设计为形成防止在PCR期间中与文库片段杂交的双链发夹结构。在一个实施例中,旁观者寡核苷酸可具有以下序列:5’[叠氮化物]DnLnZn[TCATAAGACGAACGGAGAUUTCCGTTCG(SEQ ID NO:12)]X3,如本文进一步讨论的,其中“D”、“L”和“Z”部分形成在SBX期间执行特定功能的聚合物,而3’末端TCCGTTCG序列与内部CGAACGGA序列折叠回碱基对,从而形成发夹结构,其中插入的GAUU序列保持单链。可以使用
Figure BDA0003221916090000432
切割含尿嘧啶的单链序列。旁观者寡核苷酸的末端“X”部分代表“阻断剂”(例如,PEG或C3间隔基阻断剂),其在PCR期间阻止从寡核苷酸延伸。
为了形成M1前体构建体1530,将三叉衔接子1525连接到固定化的文库片段。在一些实施例中,这可以通过首先向文库片段的游离3’末端添加“A”尾来实现,该“A”尾与由三叉构建体提供的游离3′“T”形成碱基对。示例性的A加尾反应可以包括10pmol PCR扩增子、1x MolTaq缓冲剂、1mM dATP和2.5U MolTaq,并在72℃下运行30′。示例性连接反应可包括40pmol三叉构建体、1x连接缓冲剂、3mM ATP、2U/pl T4 PNK和30U/pl T4 DNA连接酶,并在室温下运行20′,然后添加150U的5′脱腺苷酸化酶并孵育10′。如本文所述并参考图11B,然后将M1前体延伸以使用DNA聚合酶形成三链M2构建体。
图15B显示了M2前体构建体1540,其在旁观者延伸寡核苷酸和由字母“U”指定的捕获寡核苷酸中具有可选择性切割的尿嘧啶部分。为了生成M3模板构建体1550,M2前体经过
Figure BDA0003221916090000441
切割以切开尿嘧啶部分。这导致1)延伸寡核苷酸中发夹结构的切割和2)捕获寡核苷酸的切割以在M2构建体的中间链中产生游离的5’末端。同时,M2前体经过核酸外切酶处理,该处理1)消化旁观者寡核苷酸的末端TCCGTTGC序列以暴露延伸寡核苷酸序列,2)消化M2复合体从5’到3’末端的中间链。暴露的延伸寡核苷酸然后与由M3模板构建体的3’末端提供的互补序列特异性杂交。在一些实施例中,切口和外切核酸酶消化反应可以通过用包括1xλ外切缓冲剂(67mM甘氨酸-KOH、2.5mM MgCl2和50μg/ml BSA)、20%PEG8000、0.15U/μl
Figure BDA0003221916090000442
和0.4U/μlλ核酸外切酶的反应混合物在37℃下,处理M2前体15’来进行。在切割和核酸外切酶消化反应之后,进行后续的磷酸酶反应以去除由旁观者寡核苷酸的
Figure BDA0003221916090000443
切割留下的3′磷酸,使其成为Xpandomer合成的功能性延伸寡核苷酸。在一些实施例中,磷酸酶反应可以用包括1x CutSmart缓冲剂(50mM乙酸钾、20mM Tris-乙酸盐、10mM乙酸镁、100μg/mL BSA)、0.1U/μL Quick小牛肠碱性磷酸酶(CIP)的反应混合物进行)在37℃下5′,然后在80℃下加热灭活2′。
M3构建体为Xpandomer合成提供了模板,该Xpandomer合成可以如本文所述并参考图11C来进行。在一些实施例中,如本公开通篇所述,延伸寡核苷酸可以提供用于从支持物和纳米孔易位选择性释放的附加特征。
卡上两区域镜像文库产生
在该实施例中,微流体芯片,即卡,被设计为具有用于镜像文库工作流程的两个物理上离散的区域,包括用于捕获文库片段和产生M3模板构建体的第一区域,以及用于Xpandomer合成的第二区域。以这种方式将工作流程分成两个区域提供了几个优势,例如,无需旁观者延伸寡核苷酸。
图16A中描绘了两区域卡构型的一个实施例。此处,卡1600被分成物理上离散的室1610和1620,分别称为“区域1”和“区域2”。区域11610专用于M3模板构建体的产生,而区域21620专用于Xpandomer合成。捕获寡核苷酸结构,例如本文所述的UP38引物,例如通过点击化学固定在区域1的表面上。用于Xpandomer合成的延伸寡核苷酸以相同方式固定在区域2的表面上。在一些实施例中,延伸寡核苷酸可包括可光切割、可酸切割或可酶促切割的元件,用于选择性释放Xpandomer产物。M3模板构建体的产生在如本文所述的区域1中进行。简而言之,将带标签的文库片段和PCR混合物添加到区域1,并进行芯片上PCR以将带标签的文库片段连接到捕获寡核苷酸;M1前体是通过A加尾文库片段,然后连接三叉衔接子形成的;三叉衔接子由DNA聚合酶延伸以产生M2前体;并且对M2前体构建体进行尿嘧啶切割,然后进行外切核酸酶消化以切割捕获寡核苷酸并去除中间链,从而产生M3模板构建体1615。
图16B说明了M3模板前体从卡的区域1转移到区域2,然后它与延伸寡核苷酸1625A和1625B特异性杂交。帽衔接子结构1630与M3模板构建体特异性杂交,并且Xpandomer合成从箭头指示的方向上的延伸寡核苷酸开始。Xpandomer合成的帽衔接子的结构和反应条件的细节在本公开全文中进行了描述。
在一个替代实施例中,结合在区域1中的捕获寡核苷酸被设计成包括代替尿嘧啶残基的可光切割元件。在该实施例中,用紫外光处理M2前体切割捕获寡核苷酸,并且提供5’底物用于外切核酸酶消化以产生M3模板构建体。在光切割过程中,可以保护区域2室免受暴露于紫外线阻挡界面。包括可光切割元件的示例性捕获寡核苷酸可具有以下结构:[叠氮化物]D10_L30_Z6_PC_UP038,其中D、L和Z部分的聚合物,例如“间隔基”形成柔性连接基,“PC”代表可光切割元件,UP038代表序列为5′TCATAAGACGAACGGAGACT 3′(SEQ ID NO:13)的寡核苷酸,其被设计用于与文库片段的标签序列杂交。
基于珠的镜像文库产生
该实施例描述了一个工作流程,其中M3模板构建体是通过在基于珠的支持物上进行的一系列步骤产生的。在该实施例中,如参考图4A所讨论的,各种构建体通过链霉亲和素-生物素键连接到珠上。珠作为固体基质具有某些优势,例如,它们适合PCR条件并且具有高度的可扩展性,因此与其他基质相比可提供更高的产率。
图17总结了基于珠的工作流程的一个实施例。有利地,可以在步骤之间洗涤珠以去除过量试剂。如本文所述并参考图14A,在步骤1中,文库片段通过溶液中PCR被加标签。在步骤2中,进行珠上PCR以在捕获寡核苷酸上产生带标签的文库片段。在该实施例中,捕获寡核苷酸包括一个生物素部分,用于连接到SA珠上。可以使用任何合适的SA珠基质,例如,可从ThermoFisher Scientific获得的
Figure BDA0003221916090000461
MyOneC1 SA。使用KAPA HiFi Uracil+聚合酶的35个循环PCR反应将从多达106个拷贝的输入中产生多达1-20pmol的珠结合扩增子。在步骤2之后,将珠在55℃下用蛋白酶K处理5′,然后用PCR后洗涤液(1M NaCl、10mM Tris、0.1%吐温-20)洗涤。在另一个实施例中,可以使用生物素化的捕获寡核苷酸进行溶液中PCR,然后进行基于旋转柱的PCR纯化。然后可以将纯化的生物素化扩增子与SA珠结合。在步骤3中,将3’A“尾”添加到文库片段,然后连接包括5′T突出端的三叉衔接子。示例性的A加尾反应包括2.5U MolTaq酶和1mM dATP,并在65℃下孵育30′。示例性连接反应包括三叉衔接子构建体(具有“T”突出端)、30U/μl T4 DNA连接酶、2U/ml T4 PNK和3U/μl 5′脱腺苷酸化酶,并在室温下孵育20′。在步骤4中,扩展三叉衔接子以生成M2前体。示例性的延伸反应包括可从罗氏商购的1x ReadyMix中的KAPA HiFi U+聚合酶。在步骤4之后,珠再次用蛋白酶K处理并洗涤。在步骤5中,M3模板构建体是通过在M2前体中的尿嘧啶部分切开以在构建体的中间链中产生一个游离的5’末端,然后外切核酸酶消化这条链来产生的。示例性的切口/消化反应包括0.1U/μl
Figure BDA0003221916090000462
and 0.3U/μlλ核酸外切酶,并在37℃下孵育15′。然后可以通过在75℃下孵育珠10′来灭活核酸外切酶。在步骤6中,将游离M3模板前体和帽衔接子构建体添加到包括共价结合的延伸寡核苷酸的微流体芯片中。M3构建体与延伸寡核苷酸和帽衔接子特异性杂交。在步骤7中,如本公开通篇所述,进行Xpandomer合成和加工反应。最终的Xpandomer产物可以通过光切割从芯片上释放出来。在替代实施例中,步骤6和7也可以在基于珠的支持物上进行。
具有分支延伸寡核苷酸的固态Xpandomer合成
如本文所讨论的,本发明人开发的扩展测序(SBX)方案利用延伸寡核苷酸(EO)用于Xpandomer合成,该Xpandomer合成包括在Xpandomer合成、加工和纳米孔易位期间执行独特功能的若干特征。例如,在某些实施例中,EO的5’末端提供了启动最终的Xpandomer产物穿过纳米孔的“前导”序列。前导序列可以包括C2(在本文中表示为“L”)的聚合物,例如L25。在某些情况下,需要产生一个镜像Xpandomer群,其中只有全长拷贝穿过纳米孔并生成序列信息。为了实现该目标,本发明人设计了一种分支延伸寡核苷酸,其包括通过化学分支连接的第一延伸寡核苷酸和第二延伸寡核苷酸。在该实施例中,只有一个EO包括前导序列,并且每个EO包括独特的可选择性切割元件。分支EO的一个实施例如图18所示。
图18描绘了分支EO 1800,其包括通过分支1815连接的第一EO 1810和第二EO1820。分支EO 1800可以通过使用不对称化学分支常规亚磷酰胺化学合成。在该实施例中,仅第一EO 1810包括前导序列,由“L”单元的聚合物表示(其中“L”代表C2间隔基)。同样,只有第一EO包括“Z”单元的聚合物(其中“Z”代表C12间隔基)。Z单元的聚合物也在纳米孔易位中起作用。在该实施例中,第一EO包括尿嘧啶(“U”)残基的聚合物,该聚合物能够通过例如
Figure BDA0003221916090000471
选择性切割EO,并且第二EO包括用于紫外介导的切割的光切割元件(“PC-间隔基”)。每个EO的3’寡核苷酸引物(SEQ ID NO:14)的序列是相同的,并且被设计为与M3模板构建体杂交。在一些实施例中,使用一个或多个2′-OMe碱基类似物合成寡核苷酸引物。发明人已经发现,有利地,Xpandomer合成中使用的DPO4聚合酶的变体能够利用2′-OMe类似物作为底物。分支EO包括一个5′末端叠氮化物基团,用于点击连接到底物上。该示例性实施例中描述的L、Z、D和U聚合物的长度不旨在限制;本发明被理解为考虑多种合适的聚合物长度和分支EO结构。
图19A和19B说明分支EO如何能够产生和分离用于纳米孔测序的全长Xpandomer群。在步骤1中,M3模板构建体1910和与支持物1930结合的分支EO 1920杂交。分支结构中只有一个EO包含前导序列1925。在步骤2中,帽衔接子结构1940与M3模板构建体杂交。在步骤3中,Xpandomer拷贝1950A和1950B通过延伸寡核苷酸引物1927A和1927B合成。如本文所述,Xpandomer的3’末端通过封端连接到帽引物构建体的游离末端。在步骤4中,Xpandomer经过
Figure BDA0003221916090000481
处理,该处理选择性地切割第一延伸寡核苷酸,暴露前导序列1925。在步骤5中,Xpandomer被切割和加工以从“受约束”构型转变为“扩展”构型。在该步骤中,可以洗掉不完整或截短的Xpandomer副产物。在步骤6中,Xpandomer通过第二延伸寡核苷酸的光切割从底物释放。有利地,只有全长Xpandomer 1950包括前导序列1925,并且将穿过纳米孔并提供序列信息。
本文公开的所有参考文献,包括专利参考文献和非专利参考文献,均通过引用整体并入本文,就好像每篇文献均单独并入一样。
应理解,本文使用的术语只是为了描述具体实施例的目的,并非旨在进行限制。还应理解的是,除非在此具体定义,否则在此使用的术语将被赋予其在相关领域中已知的传统含义。
贯穿本说明书的对“一个实施例”、“某一实施例”及其变体的引用,意指结合该实施例描述的特定特征、结构或特性包括在至少一个实施例中。因此,在本说明书中的不同位置出现的短语“在一个实施例中”或“在某一实施例中”不一定都是指同一个实施例。此外,具体特征、结构或特性可在一个或多个实施例中以任何合适的方式组合。
如在本说明书和所附权利要求中所用,单数形式“一个”、“一种”、“该”和“所述”包括复数指代物,即一个或多个,除非上下文另外明确规定。还应注意的是,连接术语“和”和“或”通常以最广泛的含义使用以包括“和/或”,除非内容和上下文根据具体情况明确规定了包容性或排他性。因此,替代方案(例如,“或”)的使用应被理解为表示替代方案中的任一个、两者或其任何组合。此外,“和”和“或”的组成在本文中被引用为“和/或”时旨在涵盖包括所有相关项或想法的实施例,以及包括少于所有相关项或想法的一个或多个其他替代实施例。
除非上下文另有要求,在整个说明书和随后的权利要求书中,词语“包括”及其同义词和变体,例如“具有”和“包括”,以及其变体,例如“包含”以开放的、包容性的意义来解释,例如,“包括但不限于”。术语“基本上由......组成”将权利要求的范围限制为特定的材料或步骤,或者对所要求保护的发明的基本和新特征没有实质性影响的那些。
缩写,“例如”源自拉丁语exempli gratia,在此用于表示非限制性示例。因此,缩写“例如”与术语“举个例子”同义。还应理解,本文和所附权利要求中使用的单数形式“一个”、“一种”和“所述”包括复数形式,除非上下文另有明确规定,术语“X和/或Y”表示“X”或“Y”或“X”和“Y”,名词后面的字母“s”表示该名词的复数和单数形式。此外,在根据马库什基团描述本发明的特征或方面的情况下,意图并且本领域技术人员将认识到,本发明包括并因此也在马库什基因的任何个体成员和任何成员亚基团方面进行描述,并且申请人保留修改申请或权利要求的权利,以明确提及马库什基团的任何个体成员或任何成员亚基团。
本文件中使用的任何标题仅用于加快读者的审阅,不应被解释为以任何方式限制本发明或权利要求。因此,本文提供的本公开的标题和摘要仅为方便起见,并不解释实施例的范围或含义。
在本文提供数值范围的情况下,应当理解,介于该范围的上限和下限之间的每个中间值(以下限单位的十分之一为基准,除非上下文另有明确规定)和所述范围内的任何其它所述的或中间值均包括在本发明内。这些较小范围的上限和下限可独立地包括在该较小范围内,并且也为本发明所涵盖,以所指定范围内任何明确排除的限制为准。若所指定范围包括一个或两个限值,则排除那些所包括限制中的任意一个或两个的范围也包括在本发明中。
例如,除非另有说明,本文提供的任何浓度范围、百分比范围、比例范围或整数范围应理解为包括所述范围内的任何整数的值以及在适当时其分数的值(例如一个整数的十分之一和百分之一)。此外,除非另有说明,否则本文引用的与任何物理特征(例如聚合物亚单元、尺寸或厚度)相关的任何数字范围应理解为包括所述范围内的任何整数。如本文所用,除非另有说明,否则术语“约”是指指示范围、值或结构的±20%。
本说明书中提到的和/或申请数据表中列出的所有美国专利、美国专利申请公开、美国专利申请、国外专利、国外专利以及非专利公开均通过引用整体并入本文。为了描述和公开例如出版物中描述的材料和方法的目的,可以通过引用并入这些文件,其可以与当前描述的发明结合使用。提供以上和通篇讨论的出版物仅用于它们在本申请的申请日之前的公开。本文中的任何内容均不应被解释为承认发明人无权凭借在先发明早于任何引用出版物。
本文引用或提及的所有专利、出版物、科学文章、网站和其他文件和材料均表明本发明所属领域技术人员的技能水平,并且每个此类引用文件和材料在此以引用方式并入,其程度就如同其已单独通过引用整体并入或在此整体阐述一样。申请人保留将来自任何此类专利、出版物、科学文章、网站、电子可用信息和其他引用材料或文件的任何和所有材料和信息实际并入到本说明书中的权利。
通常,在以下权利要求中,所使用的术语不应被解释为将权利要求限制在说明书和权利要求中公开的特定实施例,而应被解释为包括所有可能的实施例以及这些权利要求所授权的等效物的完整范围。因此,权利要求不受本公开的限制。
此外,该专利的书面说明部分包括所有权利要求。此外,所有权利要求,包括所有原始权利要求以及来自任何和所有优先权文件的所有权利要求,特此通过引用整体并入说明书的书面说明部分,并且申请人保留物理并入本申请的书面说明或任何其他部分、任何和所有此类权利要求的权利。因此,例如,在任何情况下,专利都不能被解释为据称没有为权利要求提供书面描述,因为在专利的书面描述部分中没有用这些短语阐明权利要求的准确措辞。.
权利要求将依法解释。然而,尽管在解释任何权利要求或其部分时声称或认为容易或困难,在任何情况下,在导致本专利的一个或多个申请的审查期间对权利要求或其任何部分的任何调整或修改均不得解释为已被没收对不构成现有技术一部分的任何和所有等效物的任何权利。
其他非限制性实施例在以下权利要求内。该专利不能被解释为限于本文具体和/或明确公开的具体示例或非限制性实施例或方法。在任何情况下,专利都不得解释为受任何审查员或专利商标局的任何其他官员或雇员所作的任何声明的限制,除非该声明是由申请人在响应性书面材料中明确采用的,并且没有限制或保留。
本发明已经在本文中广泛和一般地进行了描述。属于一般公开内容的每个较窄的物种和亚属组也构成本发明的一部分。这包括本发明的一般性描述,带有从属中去除任何主题的附带条件或否定限制,无论此处是否具体引用了切除的材料。
实例
实例1
固态Xpandomer合成-
延伸寡核苷酸与微流体芯片的直接缀合
本实例描述了Xpandomer的固态合成,Xpandomer是包含XNTP核苷酸类似物的单链多核苷酸模板的可扩展拷贝,并具有改进的纳米孔测序的独特性质。固态Xpandomer合成是在微流体芯片基质上进行的,该基质通过将延伸寡核苷酸(“E-寡核苷酸”)共价连接到芯片而功能化。聚合酶介导的结合的E-寡核苷酸与XNTP的延伸产生Xpandomer产物,这些产物仍然连接在芯片上,并且可以以有效和受控的方式进行清洗、加工和释放。
该实验中使用的E-寡核苷酸(“E52 SIMA PC叠氮化物”)包括以下特征:5′叠氮化物基团后跟PEG-6单体、可光切割间隔基、“前导”聚合物序列、“聚集剂”聚合序列、荧光标记的核苷酸和寡核苷酸引物。前导聚合物和聚集剂聚合物的作用是,例如,通过纳米孔传感器提高Xpandomer易位的效率,并在申请人授权的美国专利号9,670,526,标题为“Concentrating a target molecule for sensing by a nanopore”,其全文通过引用并入本文。
A.芯片功能化
由Zeonor(一种环烯烃热塑性聚合物)制造的市售连续流动PCR芯片用作该实验中的固体支持物。芯片通过本文所述的光提取方案使用直接缀合用炔烃部分功能化。简而言之,芯片用350μL的80%DMS涂覆;然后加入60μL的80%DMSO中的10mM炔丙基马来酰亚胺,芯片在20W紫外灯下孵育20分钟;然后依次用300μL 80%DMSO、300μL 100%DMF、300μL水、300μL的300mM Na2HPO4、1%吐温-20和0.5%SDS溶液洗涤芯片,37℃孵育5分钟;最后用300μL水洗涤芯片,然后用300μL 3X PBS洗涤。
B.点击反应
用于点击反应的溶液如下制备:1)通过混合5.0μL水、1.5μL 100mM THPTA、1.5μL100mM抗坏血酸钠、0.5μL 10mM CuSO4、0.5μL 100mM氨基胍和1.0μL 100%DMF制备催化剂混合物,并将该催化剂混合物在室温下孵育5-15分钟;2)通过混合29.22μL水、4.00μL100%DMF、1.25μL 1000mM磷酸钠,pH 7.0、0.78μL 25.6μM延伸寡核苷酸(20pmol E52 SIMAPC叠氮化物)、1.25μL 100mM MgCl2、2.0μL 100mM氨基胍和1.5μL 100mM抗坏血酸钠制备底物混合物;3)将底物混合物加入催化剂混合物中并涡旋。用300μL水洗涤功能化芯片并加入50μL点击反应混合物,然后在室温下孵育20分钟。
C.延伸反应
对于延伸反应,使用20pmol:20pmol的DNA模板与E-寡核苷酸的比例。模板是源自HIV2基因组的单链100mer序列;E-寡核苷酸引物的序列是5’TCATAAGACGAACGGA 3’(SEQ IDNO:4)。通过将20pmol模板与芯片在37℃下孵育5分钟,然后用300μL MEB缓冲剂洗涤,将单链DNA模板分子与支持物结合的E-寡核苷酸杂交。
延伸反应包括以下试剂:4nmol XNTP、0.08mM多磷酸盐、0.6mM MnCl2、0.5M甜菜碱、0.25M尿素、10μg单链结合蛋白(SSB)、9μgDNA聚合酶蛋白(C4760)、1.4mM PEM combo(AZ8-8和AZ43-43)。使用5%NMS使最终反应体积达到50μL,并在42℃下进行延伸。
延伸后,对芯片进行处理和洗涤以去除延伸试剂,通过光切割(用Firefly紫外固化灯处理15分钟)从芯片上释放结合的Xpandomer产物,并在60μL 40%乙腈中从芯片上洗脱出切割的Xpandomer产物。Xpandomer产物通过凝胶电泳,通过用1X TAE缓冲剂在2.5%Nusieve凝胶中每泳道运行约0.75pmol产物进行分析。代表性凝胶示于图20,其中固态Xpandomer合成的产物示于泳道3,全长产物由箭头表示。作为参考,使用相同模板在溶液中进行的Xpandomer合成反应的产物显示在泳道1中。在泳道3中观察到的更紧密的条带表明固态Xpandomer合成可以改善产物分布,减少部分或截短的产物(泳道1中涂污的带的明显较大尺寸反映了基于溶液的延伸反应中使用的E-寡核苷酸的组成差异)。泳道2是阴性对照,其中使用的模板不与E-寡核苷酸杂交,并且泳道4是阳性对照,显示在不同反应条件下进行的固态延伸产物。这些结果证明了Xpandomer固态合成的概念验证。
实例2
用于扩展测序(SBX)的固态Xpandomer合成
本实例描述了222mer模板的Xpandomer拷贝的固态合成和处理,然后使用纳米孔传感器系统对产物进行测序。测序前的所有工作流程步骤均使用Xpandomer中间体和与基质结合的最终产物进行。该方案与基于溶液的工作流程相比具有许多优势,例如,能够以减少的体积为每个反应依次添加纯试剂。在该实验中,Xpandomer延伸反应在微流体芯片基质上进行,该基质涂覆有E-寡核苷酸的直接共价连接。如实例1中所述进行芯片的功能化和E-寡核苷酸的点击连接。
A.延伸反应
以10pmol∶20pmol的DNA模板与E-寡核苷酸的摩尔比进行延伸反应。使用的模板是源自HIV2基因组的单链222mer序列,使用的E-寡核苷酸是实例1中描述的E52寡核苷酸。通过将10pmol模板与芯片在500mM NH4OAc、5%NMS、1M尿素和2%PEG 8K的溶液中在37℃下孵育5分钟,然后用300μL MEB缓冲剂洗涤,将单链DNA模板分子与结合的E-寡核苷酸杂交。在延伸反应之前,用300μL的50mM TrisCl、200mM NH4OAc、5%NMS、10%PEG 8K和1M尿素溶液洗涤芯片。
延伸反应包括以下试剂:4nmol XNTP、0.08mM多磷酸盐、0.6mM MnCl2、0.5M甜菜碱、0.25M尿素、10μg单链结合蛋白(SSB)、9μg DNA聚合酶蛋白(C4760)、1.0mM AZ-8,8和4mMAZ-43,43PEM添加剂。使用5%NMS和由50mM Tris HCl,pH 8.84、200mM NH4OAc,pH 6.73和20%PEG组成的缓冲剂,使最终反应体积达到50μL。延伸反应在42℃下进行30分钟。
延伸后,将芯片用300μL洗涤液洗涤3次,该洗涤液含有在D2O中的100mM HEPES,pH8.0、100mM Na2HPO4、1%吐温20、3%SDS、15%DMF和5mM EDTA。
B.Xpandomer加工
如图1C所示,结合的延伸产物首先用酸处理以破坏Xpandomer中的亚磷酰胺键以使分子线性化。酸介导的切割通过向芯片中加入200μL的在D2O中的7.5M DCl,并在室温下孵育30分钟来完成的。然后通过添加900μL在D2O中的100mM HEPES,pH 8.0、100mM Na2HPO4,pH 8.0、1%吐温-20、3%SDS、15%DMF和5mM EDTA的溶液来中和并洗涤结合的产物。然后通过添加300μL在D2O中的100mM HEPES,pH 8.0、100mM Na2HPO4,pH 8.0、1%吐温20、3%SDS、15%DMF、5mM EDTA的溶液,同时将200μmol琥珀酸酐(单独装入注射器)直接加入芯片中,然后在23℃下孵育5分钟。然后用500μL在H2O中的15%ACN和5%DMSO的溶液洗涤修饰的产物。
C.从芯片中释放Xpandomer
结合的Xpandomer产物通过光切割从芯片基质上释放出来。首先,将60μL在H2O中的15%ACN和5%DMSO的溶液加入芯片,然后使用紫外固化灯对芯片照射15分钟。释放的Xpandomer用5%DMS和15%乙腈溶液从芯片上洗脱下来。如图21A所示,洗脱的物质首先通过凝胶电泳进行分析。15%的样品在凝胶的泳道3中运行(在0.5X TBE中的2.5%NuSieve琼脂糖),全长Xpandomer产物用箭头表示。作为参考,使用相同模板的基于溶液的Xpandomer合成反应的产物显示在泳道1和2中。可以看出,固相合成与基于溶液的合成相比,产生更紧密的条带,表明样品中全长产物的百分比更大。
D.纳米孔测序
对于测序,通过将α-溶血素插入缓冲剂B1中的DPhPE/十六烷双层成员中来制备蛋白质纳米孔,其中缓冲剂B1含有2M NH4Cl和100mM HEPES,pH 7.4。顺式孔灌注缓冲剂B2,其中缓冲剂B2含有0.4M NH4Cl、0.6M GuCl和100mM HEPES,pH 7.4。将Xpandomer样品加热至70℃2分钟,完全冷却,然后将2μL样品加入顺式孔中。然后施加90mV/390mV/10μs的电压脉冲,并通过以下方式Labview获取软件获取数据。
通过来自单个SBX反应的序列读段群的直方图显示来分析序列数据。分析软件将每个序列读段与模板序列对齐,并修整与正确模板序列不对齐的读段末端的序列范围。222Mer模板的纳米孔测序的代表性直方图呈现在图21B中。值得注意的是,固态合成和加工产生的Xpandomer产物在被纳米孔传感器读取时在222mer分子的整个长度上产生高度准确的序列读段。
实例3
带封端的Xpandomer合成
本实例描述了在合成过程中对Xpandomer产物的封端以及使用不同反应添加剂优化工艺的努力。以下实验中使用的模板是源自HIV2基因组的121mer序列,所使用的E-寡核苷酸(“EO”)是具有以下特征的E52EO:5′SIMA(荧光标签)后接前导聚合物,聚集剂聚合物,以及具有序列5’TCATAAGACGAACGGA 3’(SEQ ID NO:4)的寡核苷酸引物。末端帽包括具有以下序列的末端寡核苷酸,5’K[GCGTTAGGTCCCAGTGTTTAC(SEQ ID NO:15)]X 3’,其中K代表G形夹并且X代表PEG3部分。末端寡核苷酸与模板的5’末端互补并杂交。末端寡核苷酸的5’末端通过图7A的特征710A中所示的连接基与ddCTP帽连接以形成完整的末端帽结构。
在该实验中,运行了五个延伸反应,每个反应包括以下试剂:1∶1摩尔比的模板与E-寡核苷酸、2mM AZ-8,8和10mM AZ-43,43PEM添加剂,5%NMS、1.8μg DNA聚合酶、0.08mMXNTP、0.08mM多磷酸盐和0.6mM MnCl2。反应2-5包括相对于模板和EO两倍摩尔过量的末端帽,而反应1不包括末端帽。反应还包括各种添加剂,如下所示。反应1:0.5M甜菜碱、0.25M尿素和2μg单链结合蛋白(SSB);反应2:0.5M甜菜碱、0.25M尿素和2μg SSB;反应3:0.25M尿素;反应4:0.5M甜菜碱和0.25M尿素;反应5:0.25M尿素和2μg SSB。每个的最终反应体积为10μL,反应在42℃下运行。
通过凝胶电泳分析延伸反应的产物,如图22所示。泳道1显示了反应1的产物,其中不包括末端帽。在该反应中,SIMA染料与EO连接,延伸产物是121mer Xpandomer。泳道2-5分别显示了反应2-5的产物,每个都包括末端帽。在这些反应中,SIMA染料与末端帽连接,这与反应1不同。可以看出,在反应2-5的每一个中,末端帽已通过DNA聚合酶成功连接到Xpandomer,表明Xpandomer代表了DNA模板的完整拷贝。由于末端帽的末端寡核苷酸掺入到延伸产物中,反应2-5的产物是100mer Xpandomer,并且在凝胶上的迁移速度比反应1的121mer更快。这些结果显示凝胶上的Xpandomer带非常紧密,表明在测试的实验条件下封端反应非常有效。重要的是,封端提供了一种标记和捕获例如用于纳米孔测序的全长Xpandomer的方法。
实例4
带封端的固态Xpandomer合成
本实例描述了222mer Xpandomer的固态合成以及全长产物的封端。如实例1中所述,固态合成在微流体芯片基质上进行,该基质通过将延伸寡核苷酸(“E-oligo”)共价连接到基质而功能化。在完成模板的全长拷贝后,DNA聚合酶遇到与模板的5’末端杂交的末端帽,并将末端帽的5’末端连接到Xpandomer的3’末端。连接到末端帽的荧光染料可以通过凝胶电泳看到模板的全长拷贝。
A.延伸和封端反应。
以下实验中使用的模板是源自肺炎链球菌基因组的243mer序列,所使用的E-oligo(“EO”)是E52 EO,其包括可光切割的连接基和具有序列5’TCATAAGACGAACGGA 3’(SEQID NO:4)的寡核苷酸引物。末端帽包括具有以下序列的末端寡核苷酸,5’K[GCGTTAGGTCCCAGTGTTTAC(SEQ ID NO:15)]3’,其中K代表G形夹。末端寡核苷酸与模板的5’末端互补并杂交。末端寡核苷酸的5’末端通过图7A的特征710A中所示的连接基与ddCTP帽连接以形成完整的末端帽结构。
在该实验中,使用相同的模板、引物和末端帽运行了四个芯片上的延伸反应。反应1包括以下试剂:摩尔比为16∶20∶32的模板:EO:末端帽、0.08mM XNTP、1mM AZ-8,8和4mMAZ-43,43PEM、9μg DNA聚合酶(DPO4变体C4760)、10μg SSB、0.6mM MnCl2、0.08mM多磷酸盐、50mM Tris HCl,pH 8.84、200mM NH4OAc,pH 6.73、20%PEG、5%NMS、0.25M尿素、0.5M甜菜碱。50μL反应在42℃下运行。反应2包括以下试剂:摩尔比为6:10:12的模板:EO:末端帽、0.08mM XNTP、1mM AZ-8,8和4mM AZ-43,43PEM、9μg DNA聚合酶(C4760)、10μg SSB、0.6mMMnCl2、0.08mM多磷酸盐、50mM Tris HCl,pH 8.84、200mM NH4OAc,pH 6.73、20%PEG、5%NMS、0.25M尿素、0.5M甜菜碱。20μL反应在37℃下运行。反应3包括以下试剂:摩尔比为6∶10∶12的模板:EO:末端帽、0.08mM XNTP、1mM AZ-8,8和4mM AZ-43,43PEM、9μg DNA聚合酶(C4760)、10μg SSB、0.6mM MnCl2、0.08mM多磷酸盐、50mM Tris HCl,pH 8.84、200mMNH4OAc,pH 6.73、20%PEG、5%NMs、0.25M尿素、0.5M甜菜碱。25μL反应在42℃下运行。反应4包括以下试剂:摩尔比为10∶10∶20的模板:EO:末端帽、0.08mM XNTP、1mM AZ-8,8和4mM AZ-43,43PEM、9μg DNA聚合酶(C4760)、10μg SSB、0.6mM MnCl2、0.08mM多磷酸盐、50mM TrisHCl,pH 8.84、200mM NH4OAc,pH 6.73、20%PEG、5%NMS、0.25M尿素、0.5M甜菜碱。25μL反应在42℃下运行。
通过在2.5%NuSieve琼脂糖上的凝胶电泳分析延伸反应的产物,如图23所示。泳道1-4分别显示了反应1-4的产物,每个都包括末端帽。在这些反应中,SIMA染料与末端帽连接。可以看出,在每个反应中,末端帽已通过DNA聚合酶成功连接到Xpandomer,表明Xpandomer代表了DNA模板的完整拷贝。这些结果显示凝胶上的Xpandomer带非常紧密,表明封端反应在固态合成过程中也非常有效。有趣的是,延伸和封端的效率似乎受到反应中存在的添加剂性质的影响。这些结果表明Xpandomer的固态合成可以通过反复试验来优化。
实例5
镜像文库构建-三叉衔接子与文库插入物的连接
本实例描述了生成本发明的镜像文库构建体的初始步骤,其中将三叉衔接子与双链DNA的文库片段连接。图24A说明了本实验中使用的构建体的基本结构特征。文库片段是源自HIV2基因组的双链60mer序列,其中“负”链(对应于插图中的顶部链)和“正”链(对应于插图中的底部链)掺杂3′单碱基突出端。文库链的极性在图中用“5′”编号表示。如图24A所示,三叉衔接子由三条DNA链组成,每条链的极性用“3”′编号表示。三叉的顶部和底部链是具有相同序列的24mer寡核苷酸,而包含中间链的寡核苷酸的序列是顶部和底部链序列的反向互补序列。顶部和底部链也有可以定向连接到文库片段的3′单碱基突出端。三条链的5′末端通过化学分支连接在一起形成三叉衔接子,其中中间和底部链形成双链杂交,而顶部链保持单链。
在该实验中,连接反应在溶液中进行,其中三叉衔接子与文库片段的摩尔比为5∶1。15μL最终反应体积包括以下试剂:连接酶反应缓冲剂、3mM ATP、6%甘油、6%1,2-丙二醇、0.1μM文库片段、0.5μM三叉衔接子、1U/μL PNK和120U/μL DNA连接酶。将反应在15℃下运行5分钟,并通过在6%TBE-U凝胶中凝胶电泳分析连接产物,所述凝胶用SYBR染色以显现产物。代表性凝胶如图24B所示,其中未连接的三叉和文库参考片段在泳道1中运行,连接反应的产物在泳道2中运行。可以看出,连接的三叉/文库片段产物与未连接的产物明显不同。值得注意的是,泳道2中对应于未连接文库片段的条带非常微弱,表明大部分文库片段已转化为三叉/文库连接物。
实例6
镜像文库构建-从三叉衔接子延伸和核酸外切酶消化以产生镜像文库构建体
本实施例描述了生成镜像文库构建体的延伸和消化步骤,图25A中以简化形式描述了这些步骤。对于延伸步骤,M1构建体的三叉衔接子的单链顶部链被DNA聚合酶用作延伸引物,以使用文库片段作为模板合成新的DNA链。M1构建体的延伸产生了图示中的M2构建体。对于消化步骤,M2的原始模板链(由5′符号表示)然后通过外切核酸酶处理去除以产生M3构建体。M3包括文库片段“正”链的两个相同单链拷贝,被称为“镜像文库构建体”。
使用以下试剂进行延伸反应:在Thermo Pol反应缓冲剂中的0.3pmol M1连接产物、0.2mM dNTPS和0.4U/μL DNA聚合酶(
Figure BDA0003221916090000581
(exo-))。
Figure BDA0003221916090000591
(exo-)被选为DNA聚合酶用于延伸反应,因为它没有核酸外切酶活性以及强链置换活性。延伸反应(5μL总体积)在95℃下进行两分钟的初始变性步骤,然后25个在95℃下进行15秒和72℃下进行6秒的循环。在变性/延伸循环之后,将反应猝灭、变性并在凝胶上运行以显现延伸产物。
对于消化反应,在λ外切核酸酶反应缓冲剂中用λ外切核酸酶(1U/μL)处理0.3pmolM2延伸产物。exo添加后,消化反应(10μL总体积)运行5分钟。如上所述通过凝胶电泳分析消化产物。代表性实验的结果显示在图25B中。凝胶的泳道1显示了M1参考产物(0.2pmol产物/泳道),而泳道2和3分别显示了延伸和消化反应的产物。泳道2中的大条带表明M1连接产物成功转化为较大的M2延伸产物,而泳道3中的较小条带表明M2延伸产物成功转化为M3消化产物。
实例7
M1镜像文库构建体的固态合成
本实例描述了在固体支持物上构建M1构建体的工作流程。图26A以简化形式说明了工作流程。在以下实验中,Y形衔接子(“YAD”)首先通过点击化学共价结合到支持物上;然后将文库片段和三叉衔接子连接到结合的YAD以在支持物上产生M1构建体。M1通过切割YAD和支持物之间的光敏键最终从支持物上释放。
A.YAD和固体支持物的点击连接。
由Zeonor(一种环烯烃热塑性聚合物)制造的市售连续流动PCR芯片用作该实验中的固体支持物。芯片如实例1中所述进行功能化。铜点击反应如下进行:通过混合3mMTHPTA、6mM抗坏血酸钠、1mM CuSO4、5mM氨基胍和10%DMF制备60μL催化剂混合物;通过混合10%DMF、25mM磷酸钠,pH 7.0、50mol YAD的E6寡核苷酸臂(连接到叠氮化物部分)、2.5mMMgCl2、5mM氨基胍和6mM抗坏血酸钠制备120μL底物混合物。然后将30μL催化剂混合物添加到底物混合物中,并将75μL这种点击混合物添加到芯片中,然后在室温下孵育30分钟。
B.M1构建体的延伸
点击反应后,用水和溶液“10002”(300mM磷酸钠,pH 8.0、1%吐温-20、0.5%SDS和1mM EDTA)洗涤芯片。通过混合25μL溶液“CHB002”(500mM NH4OAc、2%PEG 8K、1M尿素和5%NMS)和100pmol E52寡核苷酸制备50μL E52 YAD混合物(包含Y形衔接子的第二寡核苷酸臂)并将其应用于芯片。芯片在30℃下孵育20分钟,以使E52寡核苷酸与E6寡核苷酸杂交。然后用300μL CHB002清洗芯片三次。
为了将文库片段和三叉衔接子与基质结合的YAD连接,通过组合15pmol文库插入物(HIV2 60mer)、50pmol三叉衔接子、11mM ATP、1U/μL T4 PNK和blunt/T4连接酶反应混合物(可从NEB获得)制备50μL连接反应混合物。将连接混合物加入芯片,然后在16℃下孵育15分钟。然后从芯片中去除连接混合物,加入5μL 5′脱腺苷酸化酶(50,000U/mL);随后将连接混合物加回到芯片中,然后在16℃下孵育15分钟。然后用300μL CHB002和300μL水洗涤芯片两次。然后加入300μL 10002,并将芯片在37℃下孵育5分钟。然后用300μL CHB002和300μL水洗涤芯片三次。然后从芯片中去除所有液体并加入75μL水。
为了从芯片上释放结合的产物,通过用萤火虫固化灯将芯片暴露在紫外线下15分钟将YAD与芯片的光敏连接切割。从芯片上洗脱释放的产物,并通过凝胶电泳分析1%的回收材料。代表性凝胶示于图26B中。泳道1中的样品代表通过光切割从芯片中回收的材料的1%,而泳道2-5中的样品是在溶液中合成的纯化的、未切割的M1的对照滴定。可以看出,固态合成方案成功地产生了完全组装的M1镜像文库产物。
实例8
通过扩展镜像文库构建体进行测序
本实例说明了镜像文库扩展测序(SBX)的概念验证。本实验中的起始材料是围绕实例7中描述的HIV2 60mer文库片段构建的M1产物。产生M2产物的延伸条件如下:在Thermopol反应缓冲剂中的约7.5pmol M1产物、0.2mM dNTP和0.16U/μL Vent聚合酶。将37.3μL反应液在95℃下孵育2分钟,然后在95℃下15秒和72℃下6秒下进行25个循环。产生M3产物的M2消化条件如下:36.68μL延伸反应在λexo缓冲剂中用0.26U/μLλ核酸外切酶处理。反应在37℃下运行5分钟,然后加热灭活以产生M3镜像文库构建体。
M3产物的Xpandomer拷贝的产生是通过固态合成进行的。如图27所示,作为初始步骤,M3消化产物与微流体芯片杂交。在本实验中,芯片涂覆有点击连接的设计用于与M3 YAD上臂杂交的E52寡核苷酸。E52寡核苷酸为合成M3构建体顶部链的拷贝提供了引物,如图27中的箭头所示。为了将M3消化产物与芯片杂交,并为Xpandomer延伸创建模板,将42.75μL消化反应物与在杂交缓冲剂中的10pmol E6寡核苷酸(设计用于与YAD的底部链臂杂交并提供用于合成M3构建体底部链的拷贝)和10pmol帽寡核苷酸(设计用于与M3三叉衔接子杂交并为M3文库片段的每个拷贝的封端提供游离的5′三磷酸)混合,所述杂交缓冲剂由200mMNH4OAC,pH 6.62、2%PEG8K和0.25M尿素组成。将50μL杂交反应液在95℃下孵育15秒,然后添加到已加热至65℃的芯片中。然后将芯片升至37℃并孵育五分钟。
显示来自镜像文库工作流程的样品的代表性凝胶示于图28。凝胶的泳道1-3显示纯化的M1产物的参考样品(分别为0.5、0.1和.15pmol M1)。泳道4代表产生M2产物的延伸反应的1.3%,泳道5代表产生M3产物的消化反应的1.2%。泳道6代表杂交后保留在芯片上的M3材料的5%。重要的是,尽管消化反应中存在次级产物,但只有完整的M3产物保留在芯片上。
对于扩展测序,Xpandomer合成和加工的所有步骤都在微流体芯片上进行。Xpandomer延伸条件如下:6%NMP,1∶4摩尔比的AZ,8-8与AZ、43-43PEM、0.25M尿素、0.5M甜菜碱、80μM XNTP,10μg SSB和C4760聚合酶在42℃下进行30分钟。延伸后,洗涤芯片。然后通过在23℃下用200μL的7.5M DCl处理芯片30分钟来切割Xpandomer。然后中和并洗涤芯片。然后通过添加300μL的125mM琥珀酸酐并在23℃下孵育5分钟来修饰Xpandomer。洗涤后,Xpandomer从芯片上光切割(15秒紫外处理)并用100μL含有100μM NaPO4、15%ACN和5%DMSO的溶液洗脱。Xpandomer产物的纳米孔测序如实例2中所述进行。该样品的代表性纳米孔迹线如图29所示。迹线显示了两个相同序列读段的部分,“读段1”和“读段2”,它们反映了HIV2文库片段(SEQ ID NO:16)的序列。读段由在图中称为“镜子”的帽寡核苷酸结构产生的信号分隔。
实例9
在耐酸磁珠上带封端的固态Xpandomer合成
本实例表明,在珠上固态合成Xpandomer的效率至少与溶液中合成一样有效。进行了四种不同的Xpandomer合成反应:1)溶液内合成(荧光SIMA染料在延伸寡核苷酸上);2)无封端的珠上合成(染料在延伸寡核苷酸上);3)带封端的珠上合成(染料在端帽末端寡核苷酸上);和4)用阻断剂寡核苷酸代替末端帽进行珠上合成。本实验中使用的延伸寡核苷酸具有以下序列:5’[叠氮化物]D10[PC-间隔基]L25Z6[TCATAAGACGAACGGA(SEQ ID NO:4)]3’,(其中“PC”代表可光切割的间隔基;“D”代表PEG6间隔基;“L”代表C2间隔基;并且“Z”代表C12间隔基)。珠用炔烃基团功能化并与延伸寡核苷酸共价结合,如本文所讨论的并参考图5。4pmol珠上延伸寡核苷酸与4pmol 100mer模板DNA+/-末端帽寡核苷酸杂交。反应3中包括的末端帽具有以下序列:3’ddCTPRK[GCGTTAGGTCCCAGTTTTAC(SEQ ID NO:17)]W 5’,并且反应4中包括的阻断剂寡核苷酸具有以下序列:3’RK[GCGTTAGGTCCCAGTGTTTTAC(SEQ ID NO:18)]X 5’,其中“R”代表亚磷酰胺,“K”代表G形夹,“W”代表SIMA染料,“X”代表PEG3。使用相对于模板DNA两倍摩尔过量的帽或阻断剂寡核苷酸。所有延伸反应包括:50mM Tris-HCl、200mM NH4OAc、20%PEG、1M尿素(反应4为0.25M)、5%NMS、10mM PEM、0.26μg/ul DPO4聚合酶变体、1.6mM MnCl2、100μM dXTP和300μM多磷酸盐。反应3和4还包括0.02%吐温,反应4还包括0.5M甜菜碱。如图30所示,延伸反应在37℃下运行60′,并通过凝胶电泳分析延伸产物。可以看出,珠上延伸(泳道2)与溶液中延伸(泳道1)一样有效。此外,在珠上进行封端(泳道3,染料在末端帽上)也非常有效。
实例10
耐酸磁珠的固态Xpandomer合成与加工
本实例说明Xpandomer的高效珠上合成和加工。在引物延伸反应之后,Xpandomer产物通过酸处理来切割氨基磷酸酯键,产生扩展的聚合物。扩展的产物通过光切割从珠中释放出来并通过凝胶电泳进行分析。
如实例9中所述进行珠功能化和延伸寡核苷酸连接。模板DNA以1∶1的摩尔比(每个4pmol)与延伸寡核苷酸杂交。延伸反应包括:50mM Tris-HCl、200mM NH4OAc、50mM TMACl、50mM GuCl、20%PEG、0.1M尿素、6%NMP、15mM PEM、0.26μg/ul DPO4聚合酶变体、1.4mMMnCl2、100μM dXTP、0.05μg/μl Kod单链结合蛋白、0.02%SDS和300μM多磷酸盐。延伸反应在37℃下运行60′。然后将样品用缓冲剂B(100mM HEPES、100mM NaHPO4、5%Triton和15%DMF)在55℃下用蛋白酶K处理5′,并再次用缓冲剂B洗涤。样品用7.5M DCI/1%Triton进行酸切割,用缓冲剂B中和,并用缓冲剂B中的琥珀酸酐修饰。然后用缓冲剂E(40%ACN)洗涤样品,然后进行光切割(1′暴露于紫外线),释放的Xpandomer产物被回收和凝胶电泳分析,如图31所示。泳道1代表在溶液中合成和加工的Xpandomer产物,而泳道2-4代表在耐酸磁珠上合成和加工的Xpandomer产物,其中洗脱缓冲剂中包含不同的添加剂(泳道2中的100mM PI;泳道3中的100mM GuHCl;和泳道4中的100mM HEPES)。可以观察到,珠上工作流程比溶液中工作流程显示出更好的结果,因为Xpandomer条带更紧密,表明样品富集了全长产物。
本说明书中提及和/或申请数据表中列出的所有美国专利、美国专利申请公开、美国专利申请、国外专利、国外专利以及非专利公开,包括但不限于2019年2月21日提交的美国临时专利申请号62/808,768和2019年3月29日提交的美国临时专利申请号62/826,805,均通过引用整体并入本文。为了描述和公开例如出版物中描述的材料和方法的目的,可以通过引用并入这些文件,其可以与当前描述的发明结合使用。
Figure IDA0003221916170000011
Figure IDA0003221916170000021
Figure IDA0003221916170000031
Figure IDA0003221916170000041
Figure IDA0003221916170000051

Claims (35)

1.一种在固体支持物上合成核酸模板的拷贝的方法,所述方法包括以下步骤:
(a)将连接基固定在所述固体支持物上,其中所述连接基包含靠近所述固体支持物的第一末端和远离所述固体支持物的第二末端,其中所述第一末端与马来酰亚胺部分偶联,并且所述第二末端与炔烃部分偶联,并且其中所述马来酰亚胺部分与所述固体支持物交联;
(b)将寡核苷酸引物连接到所述连接基,其中所述寡核苷酸引物包含与所述核酸模板的3’末端的一部分互补的核酸序列,其中所述寡核苷酸引物的5’末端与叠氮化物部分偶联,并且其中所述叠氮化物部分与所述炔烃部分反应以形成三唑部分;
(c)提供包含所述核酸模板、核酸聚合酶、核苷酸底物或其类似物、合适的缓冲剂和任选的一种或多种添加剂的反应混合物,其中所述核酸模板与所述寡核苷酸引物特异性杂交;以及
(d)进行引物延伸反应以产生所述核酸模板的拷贝。
2.根据权利要求1所述的方法,其中所述马来酰亚胺部分通过光引发的去质子反应与固体基质交联。
3.根据权利要求1所述的方法,其中所述固体基质包含聚烯烃。
4.根据权利要求3所述的方法,其中所述聚烯烃是环烯烃共聚物(COC)或聚丙烯。
5.根据权利要求1所述的方法,其中所述核酸模板是DNA模板。
6.根据权利要求5所述的方法,其中所述DNA模板的拷贝是可扩展聚合物,其中所述可扩展聚合物包含非天然核苷酸类似物的链,并且其中所述非天然核苷酸类似物中的每一者通过氨基磷酸酯键与相邻的非天然核苷酸类似物可操作连结。
7.根据权利要求6所述的方法,其中所述可扩展聚合物是Xpandomer。
8.根据权利要求1所述的方法,其中所述连接基进一步包含插入在所述第一末端和所述第二末端之间的间隔臂,其中所述间隔臂包含乙二醇的一个或多个单体。
9.根据权利要求1所述的方法,其中所述连接基进一步包含可切割部分。
10.根据权利要求1所述的方法,其中所述固体支持物选自由以下项组成的组:珠、管、毛细管和微流体芯片。
11.一种选择性修饰核酸靶序列的拷贝的3′末端的方法,所述方法包括以下步骤:
(a)提供具有与所述核酸靶序列的第一序列互补的序列的第一寡核苷酸和具有与所述核酸靶序列的第二序列互补的序列的第二寡核苷酸,其中所述核酸靶序列的第一序列在所述核酸靶序列的第二序列的3′,其中所述第一寡核苷酸提供核酸聚合酶的延伸引物并且所述第二寡核苷酸的5’末端与双脱氧核苷5’三磷酸可操作连结,其中所述双脱氧核苷5’三磷酸为所述核酸聚合酶提供底物;
(b)提供包含所述第一寡核苷酸和所述第二寡核苷酸、所述核酸靶序列、所述核酸聚合酶、核苷酸底物或其类似物、合适的缓冲剂和任选的一种或多种添加剂的反应混合物,其中所述第一寡核苷酸和所述第二寡核苷酸与所述核酸靶序列特异性杂交;以及
(c)进行引物延伸反应以产生所述靶序列的拷贝,其中所述第二寡核苷酸的5’末端通过所述核酸聚合酶与所述核酸靶序列的拷贝的3’末端可操作连结。
12.根据权利要求11所述的方法,其中所述双脱氧核苷5’三磷酸通过柔性连接基与所述第二寡核苷酸的5’末端可操作连结。
13.根据权利要求12所述的方法,其中所述柔性连接基包含一个或多个己基(C6)单体。
14.根据权利要求13所述的方法,其中所述第二寡核苷酸包含一个或多个2’甲氧基核糖核酸类似物。
15.根据权利要求11所述的方法,其中所述第二寡核苷酸的3’末端固定在第一固体支持物上。
16.根据权利要求15所述的方法,其进一步包括洗涤所述第一固体支持物以纯化与所述第二寡核苷酸可操作连结的核酸靶标的拷贝的步骤。
17.根据权利要求11所述的方法,其中所述第一寡核苷酸固定至第一固体支持物。
18.根据权利要求17所述的方法,其进一步包括从所述第一固体支持物释放所述核酸靶序列的拷贝,并使所述核酸靶序列的拷贝与第三寡核苷酸接触的步骤,其中所述第三寡核苷酸具有与所述第二寡核苷酸的序列互补的序列,其中所述第三寡核苷酸与所述第二寡核苷酸特异性杂交,并且其中所述第三寡核苷酸的5’末端固定在第二固体支持物上。
19.根据权利要求18所述的方法,其进一步包括洗涤所述第二固体支持物以纯化在3’末端与所述第二寡核苷酸可操作连结的所述核酸靶序列的拷贝的步骤。
20.根据权利要求11所述的方法,其中所述第二寡核苷酸包含一个或多个增加所述第二寡核苷酸对所述核酸靶序列的结合亲和力的核苷酸类似物。
21.根据权利要求11所述的方法,其中所述第二寡核苷酸与和所述核酸靶序列的5’末端可操作连结的异源核酸序列互补。
22.根据权利要求11所述的方法,其中所述核酸靶序列是单链DNA并且所述靶序列的拷贝是可扩展聚合物,其中所述可扩展聚合物包含非天然核苷酸类似物的链,并且其中所述非天然核苷酸类似物中的每一者通过氨基磷酸酯键与相邻的非天然核苷酸类似物可操作连结。
23.根据权利要求11或权利要求18所述的方法,其中所述第一固体支持物和所述第二固体支持物选自由以下项组成的组:珠、管、毛细管和微流体芯片。
24.一种用于制备单链DNA模板构建体文库的方法,其中所述模板构建体中的每一者包含DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:
(a)提供DNA Y形衔接子群,其中所述Y形衔接子中的每一者包含第一寡核苷酸和第二寡核苷酸,其中所述第一寡核苷酸的3′区和所述第二寡核苷酸的5′区通过序列互补形成双链区,其中所述第一寡核苷酸的5’区和所述第二寡核苷酸的3’区是单链的并且包含寡核苷酸引物的结合位点,并且其中所述第一寡核苷酸和所述第二寡核苷酸的单链区的末端任选地固定在固体基质上;
(b)提供双链DNA分子群,其中所述双链DNA分子中的每一者包含第一链和第二链,其中所述双链DNA分子中的每一者的第一末端与所述Y形衔接子的双链末端相容;
(c)提供帽引物衔接子群,其中所述帽引物衔接子中的每一者包含第一寡核苷酸、第二寡核苷酸和第三寡核苷酸,其中所述第二寡核苷酸插入在所述第一寡核苷酸和所述第三寡核苷酸之间,其中所述第一寡核苷酸、所述第二寡核苷酸和所述第三寡核苷酸通过化学分支在所述第一寡核苷酸和所述第三寡核苷酸的5’末端和所述第二寡核苷酸的3’末端可操作连结,其中所述第一寡核苷酸的序列的一部分与所述第三寡核苷酸的序列的一部分相同,其中所述第二寡核苷酸的序列的一部分是所述第一寡核苷酸和所述第三寡核苷酸的序列的部分的反向互补序列,并且其中所述第二寡核苷酸的5’末端和所述第三寡核苷酸的3’末端形成与所述双链DNA分子中的每一者的第二末端相容的双链区;
(d)将所述双链DNA分子中的每一者的第二末端连接到所述帽引物衔接子之一的所述第二寡核苷酸的5’末端和第三寡核苷酸的3′末端;
(e)将所述双链DNA分子中的每一者的第一末端连接到所述DNA Y形衔接子之一的双链末端;
(f)用DNA聚合酶从经连接的帽引物衔接子中的每一者的第一寡核苷酸的3’末端延伸,其中经连接的双链DNA分子的第一链为所述DNA聚合酶提供模板,并且其中所述DNA聚合酶产生第三链,所述第三链包含所述双链DNA分子的所述第一链的序列和所述Y形衔接子的所述第一寡核苷酸的序列的反向互补序列;以及
(g)用核酸外切酶从经连接的Y形衔接子的所述第一寡核苷酸中的每一者的5′末端消化,其中所述消化去除所述第一寡核苷酸、所述双链DNA分子的第一链和所述帽引物衔接子的第二寡核苷酸以产生单链模板构建体,其中所述单链模板构建体中的每一者包含两个模板分子,每个所述模板分子包含所述双链DNA分子的第二链的序列,并且其中所述两个模板分子通过所述帽引物衔接子的所述第一寡核苷酸和所述第三寡核苷酸可操作连结。
25.一种单链DNA模板构建体文库,其中所述模板构建体中的每一者包含DNA靶序列的相同链的第一拷贝和第二拷贝,其中所述靶序列的所述第一拷贝和所述第二拷贝可操作连结;并且其中所述单链DNA模板构建体文库是通过根据权利要求24所述的方法产生的。
26.一种产生镜像Xpandomer分子文库的方法,其中所述Xpandomer分子中的每一者包含DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:
(a)提供根据权利要求25所述的单链DNA模板构建体文库;
(b)提供与所述Y形衔接子的第一链的单链部分互补的第一延伸寡核苷酸群和与所述Y形衔接子的第二链的单链部分互补的第二延伸寡核苷酸群,并且其中所述第一延伸寡核苷酸或所述第二延伸寡核苷酸任选地固定在固体基质上;
(c)将所述单链DNA模板构建体文库与所述第一延伸寡核苷酸群和所述第二延伸寡核苷酸群特异性杂交;
(d)提供帽分支构建体群,其中所述帽分支构建体包含与第二寡核苷酸可操作连结的第一寡核苷酸,其中所述第一寡核苷酸和所述第二寡核苷酸包含与所述帽引物衔接子构建体的所述第一寡核苷酸和所述第三寡核苷酸的序列的一部分互补的序列,并且其中所述帽分支构建体的所述第一寡核苷酸和所述第二寡核苷酸提供游离的5’三磷酸核苷部分;
(e)使所述帽分支构建体群与所述单链DNA模板构建体群特异性杂交;以及
(f)进行引物延伸反应以产生所述DNA靶序列的第一拷贝和第二拷贝的Xpandomer拷贝,其中所述Xpandomer拷贝通过所述帽分支构建体可操作连结。
27.一种在固体支持物上产生带标签的双链DNA扩增子文库的方法,所述方法包括以下步骤:
(a)提供双链DNA分子群,其中所述双链DNA分子中的每一者包含与第二链特异性杂交的第一链;
(b)提供正向PCR引物和反向PCR引物,其中所述正向PCR引物包含第一5′异源标签序列,所述第一5′异源标签序列与和所述双链DNA分子的第二链的3′末端的一部分互补的3′序列可操作连结,并且其中所述反向PCR引物包含第二5’异源标签序列,所述第二5′异源标签序列与和所述双链DNA分子的第一链的3’末端的一部分互补的3’序列可操作连结;
(c)进行第一PCR反应,其中所述双链DNA分子群被扩增以产生第一DNA扩增子产物群,其中所述第一DNA扩增子产物包含第一末端上的第一异源序列标签和第二末端上的第二异源序列标签;
(d)提供固定在固体支持物上的捕获寡核苷酸结构,其中所述捕获寡核苷酸结构包含第一末端和第二末端,其中所述第一末端共价连接至所述固体支持物,其中所述第二末端包含捕获寡核苷酸,所述捕获寡核苷酸包含与第一DNA扩增子产物群的所述第二异源序列标签的一部分互补的序列,并且其中所述捕获寡核苷酸结构进一步包含插入在所述第一末端和所述捕获寡核苷酸之间的可切割元件;以及
(e)进行第二PCR反应,所述第二PCR反应包含:所述第一DNA扩增子产物群、包含与所述第一异源序列标签的链中的一条链的序列互补的序列的正向引物,和包含与所述第二异源序列标签的链中的一条链互补的序列的反向引物,其中所述第一DNA扩增子产物群的第一链与所述捕获寡核苷酸特异性杂交,并且其中所述第二PCR反应产生固定化DNA扩增子产物群,其中所述固定化DNA扩增子产物的第二链与所述固体支持物可操作连结。
28.一种用于制备单链DNA模板构建体文库的方法,其中所述模板构建体中的每一者包含DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:
(a)提供根据权利要求27所述的固定在固体支持物上的DNA扩增子产物文库;
(b)提供帽引物衔接子群,其中所述帽引物衔接子中的每一者包含第一寡核苷酸、第二寡核苷酸和第三寡核苷酸,其中所述第二寡核苷酸插入在所述第一寡核苷酸和所述第三寡核苷酸之间,其中所述第一寡核苷酸、所述第二寡核苷酸和所述第三寡核苷酸通过化学分支在所述第一寡核苷酸和所述第三寡核苷酸的5’末端和所述第二寡核苷酸的3’末端可操作连结,其中所述第一寡核苷酸的序列的一部分与所述第三寡核苷酸的序列的一部分相同,其中所述第二寡核苷酸的序列的一部分是所述第一寡核苷酸和所述第三寡核苷酸的序列的部分的反向互补序列,并且其中所述第二寡核苷酸的5’末端和所述第三寡核苷酸的3’末端形成与带标签的固定化DNA扩增子产物中的每一者的游离末端相容的双链区;
(c)将所述固定化DNA扩增子产物中的每一者的游离末端连接到所述帽引物衔接子的所述第二寡核苷酸的5’末端和所述第三寡核苷酸的3’末端;
(d)用DNA聚合酶从所述帽引物衔接子的所述第一寡核苷酸中的每一者的3′末端延伸,其中所述固定化DNA扩增子产物的所述第二链为所述DNA聚合酶提供模板,并且其中所述DNA聚合酶产生第三链,其中所述第三链是所述第二链的拷贝;
(e)切割所述捕获寡核苷酸结构中的每一者的可切割元件,其中所述切割从所述固体支持物释放所述DNA扩增子产物,并在所述DNA扩增子产物中的每一者的所述第二链上产生游离的5’末端;以及
(f)用核酸外切酶从所述DNA扩增子产物中的每一者的经切割的第二链的游离5’末端消化,其中所述消化去除所述DNA扩增子产物的所述第二链和所述帽引物衔接子的所述第二寡核苷酸以产生单链模板构建体文库,其中所述单链模板构建体中的每一者包含通过所述帽引物衔接子的所述第一寡核苷酸和所述第三寡核苷酸可操作连结的所述DNA扩增子产物的所述第一链的两个拷贝。
29.一种单链DNA模板构建体文库,其中所述模板构建体中的每一者包含DNA靶序列的相同链的第一拷贝和第二拷贝,其中所述DNA靶序列的所述第一拷贝和所述第二拷贝可操作连结;并且其中所述单链DNA模板构建体文库是通过根据权利要求28所述的方法产生的。
30.一种产生镜像Xpandomer分子文库的方法,其中所述Xpandomer分子中的每一者包含DNA靶序列的相同链的两个拷贝,所述方法包括以下步骤:
(a)提供根据权利要求29所述的单链DNA模板构建体文库;
(b)提供与所述DNA扩增子产物的第二标签互补的延伸寡核苷酸群,其中所述延伸寡核苷酸固定在固体基质上;
(c)将所述单链DNA模板构建体与所述延伸寡核苷酸特异性杂交;
(d)提供帽分支构建体群,其中所述帽分支构建体包含与第二寡核苷酸可操作连结的第一寡核苷酸,其中所述第一寡核苷酸和所述第二寡核苷酸包含与所述帽引物衔接子构建体的所述第一寡核苷酸和所述第三寡核苷酸的序列的一部分互补的序列,并且其中所述帽分支构建体的所述第一寡核苷酸和所述第二寡核苷酸提供游离的5’三磷酸核苷部分;
(e)使所述帽分支构建体群与所述DNA模板构建体群特异性杂交;以及
(f)进行引物延伸反应以产生所述DNA靶序列的所述第一拷贝和所述第二拷贝的Xpandomer拷贝,其中所述Xpandomer拷贝与所述帽分支构建体可操作连结。
31.根据权利要求30所述的方法,其中所述捕获寡核苷酸结构和所述延伸寡核苷酸固定在同一固体支持物上,其中所述延伸寡核苷酸包含可切割发夹结构,并且其中所述可切割发夹结构在切割步骤期间被切割以为所述DNA扩增子产物提供结合位点。
32.根据权利要求30所述的方法,其中所述捕获寡核苷酸结构固定在微流体卡的第一室的第一基质上,并且所述延伸寡核苷酸固定在所述微流体卡的第二室的第二基质上,并且其中所述第一室配置为产生所述单链DNA模板构建体群,且所述第二室配置为产生所述单链DNA模板构建体的Xpandomer拷贝群。
33.根据权利要求30所述的方法,其中所述捕获寡核苷酸结构固定在珠支持物上,且所述延伸寡核苷酸固定在COC芯片支持物上,其中所述珠支持物配置为产生所述单链DNA模板构建体群,并且所述COC芯片支持物配置为产生所述DNA模板构建体的Xpandomer拷贝群。
34.根据权利要求30所述的方法,其中所述捕获寡核苷酸结构和所述延伸寡核苷酸固定在珠支持物上,其中所述珠支持物配置为产生所述单链DNA模板构建体群和所述DNA模板构建体的Xpandomer拷贝群。
35.根据权利要求30所述的方法,其中所述延伸寡核苷酸由分支寡核苷酸结构提供,其中所述分支寡核苷酸结构包含通过化学分支与第二延伸寡核苷酸可操作连结的第一延伸寡核苷酸,其中所述第一延伸寡核苷酸包含前导序列、聚集剂序列和插入在所述化学分支与所述前导序列和所述聚集剂序列之间的第一可切割部分,并且其中所述第二延伸寡核苷酸包含第二可切割部分。
CN202080015860.6A 2019-02-21 2020-02-20 用于固态合成在单分子测序中使用的可扩展聚合物的方法、组合物和装置 Pending CN113631764A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962808768P 2019-02-21 2019-02-21
US62/808768 2019-02-21
US201962826805P 2019-03-29 2019-03-29
US62/826805 2019-03-29
PCT/US2020/019131 WO2020172479A1 (en) 2019-02-21 2020-02-20 Methods, compositions, and devices for solid-state synthesis of expandable polymers for use in single molecule sequencing

Publications (1)

Publication Number Publication Date
CN113631764A true CN113631764A (zh) 2021-11-09

Family

ID=72144173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080015860.6A Pending CN113631764A (zh) 2019-02-21 2020-02-20 用于固态合成在单分子测序中使用的可扩展聚合物的方法、组合物和装置

Country Status (7)

Country Link
US (1) US20220042075A1 (zh)
EP (1) EP3927869A4 (zh)
JP (2) JP2022523362A (zh)
CN (1) CN113631764A (zh)
AU (1) AU2020224663B2 (zh)
CA (1) CA3131115A1 (zh)
WO (1) WO2020172479A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3140425A1 (en) * 2019-05-23 2020-11-26 Stratos Genomics, Inc. Translocation control elements, reporter codes, and further means for translocation control for use in nanopore sequencing
WO2024083982A1 (en) 2022-10-21 2024-04-25 F. Hoffmann-La Roche Ag Detection of modified nucleobases in nucleic acid samples

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998032790A1 (en) * 1997-01-27 1998-07-30 Flowgenix Corporation Porous articles with surface functionality and uses thereof
US20070275387A1 (en) * 2004-03-03 2007-11-29 Trustees Of Columbia University In The City Of New York, The Photocleavable Fluorescent Nucleotides for Dna Sequencing on Chip Constructed by Site-Specific Coupling Chemistry
US20080050731A1 (en) * 2006-02-10 2008-02-28 Invitrogen Corporation Labeling and detection of nucleic acids
CN101838696A (zh) * 2009-02-25 2010-09-22 霍夫曼-拉罗奇有限公司 用于高通量核酸分析的珠子
CN102083998A (zh) * 2007-06-19 2011-06-01 斯特拉托斯基因公司 通过展开进行高通量核酸测序
CN103502448A (zh) * 2010-11-12 2014-01-08 Gen9股份有限公司 核酸合成的方法和设备
WO2016093838A1 (en) * 2014-12-11 2016-06-16 New England Biolabs, Inc. Enrichment of target sequences

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1828381T3 (da) * 2004-11-22 2009-02-23 Peter Birk Rasmussen Templatedirigeret split-and-mix-syntese af småmolekylebiblioteker
US9670526B2 (en) * 2012-11-09 2017-06-06 Stratos Genomics, Inc. Concentrating a target molecule for sensing by a nanopore
BR112015023069A2 (pt) * 2013-03-14 2017-07-18 Nvs Tech Inc superfície de oxidação para o sequestro de biomoléculas e métodos relacionados
US20160194625A1 (en) * 2013-09-03 2016-07-07 Moderna Therapeutics, Inc. Chimeric polynucleotides
US20170283864A1 (en) * 2016-03-31 2017-10-05 Agilent Technologies, Inc. Use of transposase and y adapters to fragment and tag dna
CN113286893A (zh) * 2018-08-28 2021-08-20 10X基因组学股份有限公司 生成阵列的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998032790A1 (en) * 1997-01-27 1998-07-30 Flowgenix Corporation Porous articles with surface functionality and uses thereof
US20070275387A1 (en) * 2004-03-03 2007-11-29 Trustees Of Columbia University In The City Of New York, The Photocleavable Fluorescent Nucleotides for Dna Sequencing on Chip Constructed by Site-Specific Coupling Chemistry
US20080050731A1 (en) * 2006-02-10 2008-02-28 Invitrogen Corporation Labeling and detection of nucleic acids
CN102083998A (zh) * 2007-06-19 2011-06-01 斯特拉托斯基因公司 通过展开进行高通量核酸测序
CN101838696A (zh) * 2009-02-25 2010-09-22 霍夫曼-拉罗奇有限公司 用于高通量核酸分析的珠子
CN103502448A (zh) * 2010-11-12 2014-01-08 Gen9股份有限公司 核酸合成的方法和设备
WO2016093838A1 (en) * 2014-12-11 2016-06-16 New England Biolabs, Inc. Enrichment of target sequences

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AFAF H. EL-SAGHEE等: "Biocompatible artificial DNA linker that is read through by DNA polymerases and is functional in Escherichia coli", PNAS, vol. 108, no. 28, pages 11338, XP055196445, DOI: 10.1073/pnas.1101519108 *
SOO HYUN LEE等: "A polymer lab-on-a-chip for reverse transcription (RT)-PCR based point-of-care clinical diagnostics", LAB ON A CHIP, vol. 8, pages 2121 - 2127, XP008159600, DOI: 10.1039/B811131F *
王阳等: "三核苷酸双链重复序列扩展合成特性及其机理", 生物化学与生物物理进展, vol. 40, no. 04, pages 345 - 355 *

Also Published As

Publication number Publication date
EP3927869A1 (en) 2021-12-29
WO2020172479A1 (en) 2020-08-27
JP2024026147A (ja) 2024-02-28
JP2022523362A (ja) 2022-04-22
CA3131115A1 (en) 2020-08-27
AU2020224663A1 (en) 2021-07-22
EP3927869A4 (en) 2023-04-26
AU2020224663B2 (en) 2022-12-08
US20220042075A1 (en) 2022-02-10

Similar Documents

Publication Publication Date Title
US11697843B2 (en) Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
CN105121655B (zh) 新型连接酶活性
US11274335B2 (en) Methods for the epigenetic analysis of DNA, particularly cell-free DNA
CN102083998B (zh) 通过展开进行高通量核酸测序
US11326206B2 (en) Methods of quantifying target nucleic acids and identifying sequence variants
US11486004B2 (en) Methods of sequencing circular template polynucleotides
WO2013019361A1 (en) Sequencing methods
JP2024026147A (ja) 単一分子配列決定における使用のための拡張可能ポリマーの固体合成のための方法、組成物、およびデバイス
CN111801427B (zh) 用于单分子的单链环状dna模板的产生
CN115667507A (zh) 用于长读出测序的多核苷酸条形码
EP3652345A2 (en) Sequencing method for genomic rearrangement detection
CN111542532B (zh) 酶法合成寡核苷酸的方法和体系
WO2022144003A1 (zh) 一种用于高通量靶向测序的多重pcr文库构建方法
KR20240024835A (ko) 비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물
WO2018048911A1 (en) Tri-nucleotide rolling circle amplification
JP7275148B2 (ja) 副溝結合成分による核酸重合の強化
CN116970690A (zh) 一种dna序列的熔解测定方法及试剂盒
CN116710573A (zh) 插入段和标识无变性测序方法
CN118048419A (zh) 酶法合成寡核苷酸的方法和系统
JP2011055787A (ja) プライマー固定化基板による標的核酸の特異的検出法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: U.S.A.

Address after: Washington State

Applicant after: Roche Diagnostics (Seattle) Co.

Address before: Washington State

Applicant before: STRATOS GENOMICS Inc.

Country or region before: U.S.A.

TA01 Transfer of patent application right

Effective date of registration: 20240412

Address after: California, USA

Applicant after: Roche sequencing solutions Co.

Country or region after: U.S.A.

Address before: Washington State

Applicant before: Roche Diagnostics (Seattle) Co.

Country or region before: U.S.A.