CN102083998A

CN102083998A - 通过展开进行高通量核酸测序

Info

Publication number: CN102083998A
Application number: CN2008801029353A
Authority: CN
Inventors: 马克·斯达马蒂奥斯·可可里斯; 罗伯特·N·麦克卢尔
Original assignee: Stratos Genomics Inc
Current assignee: F Hoffmann La Roche AG
Priority date: 2007-06-19
Filing date: 2008-06-19
Publication date: 2011-06-01
Anticipated expiration: 2028-06-19
Also published as: HK1143188A1; EP2171088B1; IL202821A; EP2952587A1; US20090035777A1; ES2959127T3; JP2010530759A; KR20100044790A; CA2691364A1; EP2171088A2; US20110251079A1; WO2008157696A3; CA2691364C; DK2171088T3; US9920386B2; IL224295A; HK1217736A1; US20110237787A1; US20180334729A1; US8324360B2

Abstract

本发明公开了核酸测序的方法与相关产物。用于靶核酸测序的方法包括，提供通过模板指导合成所产生的子链，该子链包含耦合于序列中的多个亚基，该序列对应于全部或部分靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、至少一个探针或核碱基残基以及至少一个选择性可剪切键。剪切所述选择性可剪切键产生长度比子链的多个亚基更长的Xpandomer，该Xpandomer包含连接臂和报道元件，该报道元件用于解析序列中的遗传信息，该序列对应于全部或部分靶核酸的连续核苷酸序列。随后检测该Xpandomer的报道元件。还公开了相应的产物，包括Xpandomer以及寡聚底物构建体和单体底物构建体。

Description

通过展开进行高通量核酸测序

引用的相关申请

本申请要求按照35U.S.C.§119(e)的规定享有以下美国临时专利申请的优先权：于2007年6月19日提出的60/945,031、于2007年10月23日提出的60/981,916，以及于2007年10月25日提出的61/000,305；在此通过引用将所有这些申请的全部内容并入。

背景技术

技术领域

本发明主要涉及核酸测序，以及与之相关的方法和产物。

相关技术描述

核酸序列编码生物体发挥功能和繁殖所必需的信息，实质上是生命的基本信息(blueprint)。因此测定这些序列在对生物体如何以及在何处存活的纯理论研究中，以及在如药物研发的应用科学中，都是有用的方法。在医学中，测序方法可用于诊断以及研发多种疾病的治疗方法，包括癌症、心脏病、自身免疫病症、多发性硬化或肥胖症。在工业中，测序可用于设计改良的酶促方法或合成生物体。在生物学中，这种方法可以用于研究诸如生态系统的健康状态，因此拥有广泛的应用。

个体的独特DNA序列为他们对特定疾病的敏感性提供了有用的信息。序列可以为病人提供机会来做早期检测的筛选以及获得预防性治疗。并且，如果获得一个病人的个体基本信息，临床医生就可以实施个体化治疗来使药物效力最大化并使药物不良事件最小化。同样，测定病原生物体的基本信息能够为传染性疾病带来新的治疗方法以及更有力的病原体监测机制。全基因组DNA测序将为现代医学提供基础。

DNA测序是测定给定DNA多聚体化学成分的排列顺序的方法。这些化学成分，称为核苷酸，以四种普遍的形式存在于DNA中：脱氧腺苷(A)、脱氧鸟苷(G)、脱氧胞苷(C)和脱氧胸苷(T)。二倍体人类基因组的测序需要测定大约60亿个核苷酸的连续顺序。

目前，大多数DNA测序是使用Frederick Sanger研发的链终止方法来进行的。这种技术，称为Sanger测序，运用DNA合成的序列特异性终止和荧光修饰的核苷酸报道底物来获得序列信息。这种方法通过用改良的聚合酶链式反应来测定靶核酸链的序列或读长，可以达到1000个碱基。在这种改良的反应中，测序可以在选择的碱基类型处(A、C、G或T)被随机打断，并且可以通过毛细管凝胶电泳测定打断的序列的长度。然后所得的长度可以确定哪种类型的碱基位于那个长度上。产生了很多重叠的读长，并且使用数据处理将其序列重叠从而测定最可靠的数据配合。这种产生序列读长的方法是非常费力和昂贵的并且正在被效率更高的新方法取代。

Sanger法曾用于提供人类基因组计划的大部分序列数据，该计划产生人类基因组的首次完整序列。完成这项计划花费了10年和将近30亿美元。考虑到巨大的通量和成本限制，显然，DNA测序技术需要彻底的改善来达到科学界提出的规定的目标。为了达到这一目标，一些二代技术，其远远超越Sanger测序法的通量和每碱基成本的局限性，正占有越来越多的测序市场。然而，这些“合成测序”法仍然达不到市场要求的通量、成本和质量目标，例如用于个性化医疗的全基因组测序。

例如，454 Life Sciences公司正在生产可以在7.5个小时内以200个核苷酸的平均读长处理1亿个碱基的仪器(例如，基因组测序仪)。他们的方法是，用改变的聚合酶链式反应(“PCR”)在珠子的表面产生均一的靶核酸的克隆，长度为数百个碱基。这一过程术语上称为乳液PCR。然后将成千上万的珠子排列于“铬尖晶石平板”上。然后准备该平板用于进一步的测序，从而使每个核酸碱基类型从平板上依次被漂洗下来。带有并入碱基的靶标的珠子产生焦磷酸副产物，该副产物可用于催化随后被成像系统监测的光产生反应。

Illumina公司也有相似的方法，该方法用可逆的终止核苷酸和荧光标记进行核酸测序。Illumina的1G分析仪的平均读长少于40个核苷酸。不同于用乳液PCR来扩增序列靶标，Illumina的方法是在阵列表面扩增PCR克隆。454和Illumina公司的方法都用复杂化的聚合酶扩增来增强信号强度，在有速度限制的序列延伸循环中进行碱基测定，并且由于并入错误降低了与读长成比例的测量信噪比从而限制了读长。

Applied Biosystem公司用可逆的终止连接而不是通过合成测序来阅读DNA。像454公司的基因组测序仪一样，该技术用基于珠子的乳液PCR来扩增样品。由于大部分的珠子不承载PCR产物，于是研究人员接下来使用富集步骤选择包被有DNA的珠子。将生物素包被的珠子涂布并固定于覆盖有链霉抗生物素的玻片阵列上。然后使固定的珠子经过与长度为8mer(单元单体)的探针杂交(每个用4种不同的荧光染料标记)、连接和剪切(在第5和第6个碱基之间剪切从而产生用于下一轮连接的位点)的处理过程。每个探针在第4和第5个碱基位置用双碱基编码系统检测两个碱基，可由成像系统记录。与Illumina公司的方法相似，Applied Biosystem公司的SOLID平台的平均读长也少于40个核苷酸。

通过直接测定DNA单个分子来消除聚合酶扩增步骤的时间和费用的其他方法正在研发之中。因所述碱基通过将第二种荧光团加入到改造的DNA聚合酶中并用Foster共振能量转移(FRET)来鉴定核苷酸而得以测序，Visigen Biotechnologies公司正在测定带荧光标记的碱基。这种技术面临分辨碱基信号的难题，将这些碱基信号经由低于1纳米以及经由聚合酶并入作用分辨出来，会带来很大的统计学偏差。

Ling Vitae研发的一种方法可以测定插入到固定的质粒载体中的cDNA的序列。该方法使用IIS类限制酶剪切靶核酸并将寡聚体连接到靶标上。通常，由限制酶产生的5’或3’末端突出端的一个或两个核苷酸决定了在连接混合物中哪种寡聚体文库会被加到靶标的粘性切割末端。每个寡聚体含有“信号”序列，该序列特异性识别它所取代的核苷酸。然后重复剪切和连接过程。接下来用各种寡聚体的特异性标签，对新的分子进行测序。该方法的产物被称为“设计多聚体”并且总是由比其所取代核酸更长的核酸组成(例如，一个二核苷酸靶序列被一个“放大”的多达100个碱基对的多核苷酸序列所取代)。该方法的优势在于，如果需要，可以扩增双链体产物链。缺点在于该方法必须是循环的，并且如果同时发生多个限制性切割，那么模板的连续性将会丢失。

Kless的美国专利7,060,440描述了一种测序方法，该方法包括用聚合酶的聚合作用来并入寡聚体。改良的Sanger方法，以末端终止的寡聚体为底物，通过凝胶电泳或毛细管层析法用于建立测序序列梯。虽然用末端连接使寡聚体耦合是众所周知的，但是在模板指导过程中用聚合酶耦合寡聚体以新的优势被应用。

期望聚合反应技术能被大力发展，因为改良的聚合酶(和连接酶)可以通过基因工程学和生物勘探方法获得，并通过聚合酶修饰去除核酸外切酶活性的方法也是已知的。例如，Williams的已公开的美国专利申请2007/0048748描述了使用突变的聚合酶来并入染料标记的和其他修饰的核苷酸。这些聚合酶的底物也包括γ-磷酸标记的核苷酸。发现用嵌合的和突变的聚合酶可以提高并入速度以及降低错误率。

此外，学术和工业团队都做了很大的努力利用非合成的方法来测定天然DNA的序列。例如，Agilent Technologies公司与大学合作者正研发一种单分子检测方法，该方法使DNA通过一个纳米孔，通过它穿过纳米孔来完成测定。跟Visigen和LingVitae一样，这种方法必须克服有效地和准确地从由亚纳米尺寸所分离的个体核碱基获得清晰信号的问题，以及研发相似大小的可再生孔径的问题。同样，在高通量过程中，还未实现通过检测DNA的组成部分对其直接测序，因为链中的核苷酸小尺寸(大概4埃，中心对中心)以及相应的信噪比和信号分辨率的限制。DNA的固有的二级结构使直接检测更加复杂，它并不轻易地延伸成完美的线性多聚体。

虽然DNA测序领域已做了重大的进步，但是该领域仍然需要新的改进的方法。本发明满足了这些需要并提供了其他相关优势。

发明概述

总的而言，本发明公开了克服了现有高通量核酸测序技术表现出的空间分辨率难题的方法和相应的设备及产物。这是通过编码在更易检测到的长度延伸的替代多聚体上的核酸信息来实现的。替代多聚体(本文称为“Xpandomer”)通过模板指导合成(template-directed synthesis)而形成，其保留了靶核酸的原始遗传信息，同时也提高了序列数据个体元件的线性分离。

在一个实施方案中，公开了一种用于靶核酸测序的方法，包括：a)提供通过模板指导合成所产生的子链，该子链包含耦合于序列中的多个亚基，该序列对应于全部或部分靶核酸的连续核苷酸序列，其中个体亚基包含连接臂(tether)、至少一个探针或核碱基(nucleobase)残基以及至少一个选择性可剪切键；b)剪切至少一个选择性可剪切键，产生长度比子链的多个亚基更长的Xpandomer，该Xpandomer包含连接臂和报道元件(reporterelement)，该报道元件用于解析序列中的遗传信息，该序列对应于全部或部分靶核酸的连续核苷酸序列；c)检测该Xpandomer的报道元件。

在更具体的实施方案中，用于解析遗传信息的报道元件可以与Xpandomer的连接臂、在至少一个选择性可剪切键剪切前与子链和/或在至少一个选择性可剪切键剪切后与Xpandomer相连。Xpandomer还可以包含至少一个探针或核碱基残基的全部或部分，且用于解析遗传信息的报道元件可以与至少一个探针或核碱基残基相连，或者可以是探针或核碱基残基自身。另外，选择性可剪切键可以是共价键、连接臂内的键、子链的探针或核碱基残基之间或之内的键，和/或子链的探针或核碱基残基和靶模板之间的键。

在其他实施方案中，Xpandomer具有以下结构(I)-(X)：

结构(I)：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；以及

α表示选自亚基基序文库的亚基基序的种类，其中每个种类都包含部分靶核酸的连续核苷酸序列的序列信息。

结构(II)：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个种类都包含部分靶核酸的连续核苷酸序列的序列信息；以及

χ表示与相邻亚基的连接臂的键。

结构(III)：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

结构(IV)：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

结构(V)：

其中

T表示连接臂；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

结构(VI)：

其中

T表示连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂连接的键。

结构(VII)：

其中

T表示连接臂；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

结构(VIII)：

其中

T表示连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

结构(IX)：

其中

T表示连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个种类都包含部分靶核酸的连续核苷酸序列的序列信息；

χ1表示与相邻亚基的连接臂的键；以及

χ2表示连接臂之间的键。

结构(X)：

其中

T表示连接臂；

n¹和n²分别表示核碱基残基的第一部分和第二部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；以及

在其他的实施方案中，公开了用于靶核酸测序的模板指导合成中所用的寡聚体底物构建体(oligomer substrate constructs)。寡聚体底物构建体包含连接到第二探针部分的第一探针部分和带有第一末端和第二末端的连接臂，第一和第二探针部分中每一部分都具有适用于模板指导合成的末端基团，该连接臂的至少第一末端连接于第一和第二探针部分至少之一，其中，寡聚体底物构建体当用于模板指导合成时，能够形成子链，该子链包含受约束的Xpandomer并具有耦合于序列中的多个亚基，该序列对应于全部或部分靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、第一和第二探针部分，以及至少一个选择性可剪切键。

在另一个实施方案中，公开了用于靶核酸测序的模板指导合成中所用的单体底物构建体(monomer substrate construct)。单体底物构建体包含带有适用于模板指导合成的末端基团的核碱基残基，和带有第一末端和第二末端的连接臂，该连接臂的至少第一末端连接于核碱基残基，其中，单体底物构建体当用于模板指导合成中时能够形成子链，该子链包含受约束的Xpandomer并具有耦合于序列中的多个亚基，该序列对应于全部或部分靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、核碱基残基以及至少一个选择性可剪切键。

此外，在其他实施方案中，公开了模板-子链双链体，其包含与模板链双链体化的子链，以及由模板链和寡聚体或单体底物构建体形成该模板-子链双链体的方法。

本发明的这些方面和其他方面通过参照附图和下面的详细描述将变得显而易见。为此，本文提及了各种参考文献，用于更详尽地描述某些程序、化合物和/或成分，并通过引用将其全部内容并入。

附图简要说明

在附图中，同样的编号标识相同的元件。附图中元件的大小和相对位置没必要按照刻度绘制，并且为了使这些图更容易理解，一些元件是任意放大和放置的。另外，所绘制的元件的具体形状并非意图反映有关该具体元件真实形状的任何信息，仅仅为在图中易于识别而选择。

图1A与1B表示核碱基之间有限的分离，必须解决这一问题来测定核酸靶标中的核苷酸序列。

图2A通过二维图示意性说明本发明中有用的底物的几个代表性结构。

图3A、3B与3C是展示由靶核酸合成Xpandomer的简化步骤的图表。

图4是表示用于对Xpandomer进行测序的FRET纳米孔型设备的简单模型。

图5是带有红色、绿色和蓝色荧光发光通道的标绘图，阐明模拟信号如何被解码成数字信息，该数字信息对应于Xpandomer编码的遗传学序列信息。附表(图6)显示这些数据如何被解码的。通过使用三个多态荧光团，当Xpandomer穿过纳米孔时，碱基序列可以实时从单分子中以数字形式被高分辨率地阅读。

图6是一个查询表，是图5数据的来源。

图7A-E是连接产物的凝胶。

图8是寡聚Xpandomer的概貌。

图9是单体Xpandomer的概貌。

图10A至10E以符号和绘图的形式描述了I型Xpandomer、中间体和前体。这些前体如果是单磷酸盐即称为Xprobes，如果是三磷酸盐则称为Xmers。

图11是使用末端终止发夹结构引物和I型底物构建体经由溶液连接来合成Xpandomer的方法的浓缩示意图。

图12是使用双末端发夹结构引物和I型底物构建体经由溶液连接来合成Xpandomer的方法的浓缩示意图。

图13是使用I型底物构建体通过在无引物的情况下在固定的模板上连接来合成Xpandomer的方法的浓缩示意图。

图14是使用与固定的引物退火的模板上可逆的I型底物构建体，经循环逐步连接来合成Xpandomer的方法的浓缩示意图。

图15是使用I型底物构建体而无需引物，经由混合组装和化学耦合来合成Xpandomer的方法的浓缩示意图。

图16是使用发夹结构引物和I型底物构建体，经由溶液聚合反应来合成Xpandomer的方法的浓缩示意图。

图17是使用I型三磷酸盐底物构建体和聚合酶，在固定的模板上合成Xpandomer的方法的浓缩示意图。

图18A-18E以符号和图形语言描述了II型Xpandomer、Xpandomer中间体以及底物构建体。

图19A-19E以符号和图形语言描述了III型Xpandomer、Xpandomer中间体以及底物构建体。

图20是使用II型底物构建体结合杂交和无引物化学耦合(primer-lesschemical coupling)，在固定的模板上合成Xpandomer的方法的浓缩示意图。

图21是使用引物、II型底物构建体和连接酶，在固定的模板上合成Xpandomer的方法的浓缩示意图。

图22A-22E以符号和绘图的形式描述了IV型Xpandomer、Xpandomer中间体以及底物构建体。

图23A-23E以符号和绘图的形式描述了V型Xpandomer、Xpandomer中间体以及底物构建体。

图24是使用衔接引物和V型三磷酸盐底物构建体，经由溶液聚合反应来合成Xpandomer的方法的浓缩示意图。

图25展示了脱氧腺苷(A)、脱氧胞苷(C)、脱氧鸟苷(G)和脱氧胸苷(T)的结构。

图26A和26B展示了用功能基团衍生的核苷酸。

图27A和27B展示并入衍生的核碱基的探针成员。

图28A-28D更详尽地展示了本发明的I-IV型底物，这里显示了探针主链中选择性可剪切键的剪切位点的实例，并显示了桥接剪切位点的环端连接。

图29A-29D更详尽地展示了本发明的I-IV型底物，这里显示探针主链中选择性可剪切键的剪切位点的实例，并显示桥接剪切位点的环端连接。

图30展示了组装诸如Xprobe和Xmer的“探针-环”构建体的一种方法。

图31展示了组装I型底物构建体的方法，其中环含有报道构件体(reporter construct)。

图32A-32C展示了PEG作为聚合的连接臂的使用。

图33A-33D展示了作为聚合的连接臂的多赖氨酸与衍生于多赖氨酸支架的树枝状聚合物构建体(dendrimeric constructs)。

图34A-34C展示了的经选择的连接臂闭合的方法，其与由片段组装的报道构建体整合。

图35A和35B展示了通过前体模块(precursor blocks)随机聚合来合成个体报道片段(reporter segment)的方法。

图36A至36I展示了报道构建体。

图37是显示组装报道构建体的组分和化学方法以及它们的相应报道密码(reporter codes)的表格。

图38A-38F是适用于靶核酸末端发挥功能的衔接子。

图39是用于将末端ANH功能基团导入dsDNA模版上的衔接子盒。

图40是固定和制备模板用于Xpandomer合成的图解。

图41A-41E展示了所选的物理延伸方法。

图42A-42C展示了所选的电延伸方法。

图43A-43D展示了在凝胶矩阵中用于延伸的方法、反应物和衔接子。

图44A-44C表述了“拖曳标签(drag tags)”的构建和使用。

图45描绘了基于混合杂交/连接的合成Xpandomer的方法。

图46A和B描绘了用于填充缺口的核碱基。

图47A和B描绘了缺口产生的模拟过程。

图48A和B描绘了缺口产生的模拟过程。

图49展示了如何用2mers和3mers填充缺口。

图50A和B描绘了用2mers和3mers的组合填充缺口的模拟过程。

图51展示了使用2mers和3mers的佐剂来破坏二级结构。

图52描绘了可用作佐剂的碱基。

图53表述了用于减少二级结构的核苷酸取代物。

图54描绘了磁珠转运的纳米孔检测模型。

图55展示了常规的纳米孔检测方法。

图56展示了横向电极纳米孔检测方法。

图57展示了显微镜检测方法。

图58展示了用电子显微镜检测。

图59展示了使用原子力显微镜检测。

图60A-60E以符号和图形语言描绘了VI型Xpandomer、Xpandomer中间体以及底物构建体。这些前体称为RT-NTP。

图61是使用可逆地终止的VI型三磷酸盐底物构建体和聚合酶，在固定的模板上合成Xpandome的方法的浓缩示意图。

图62A-62E以符号和图形语言描述了VII型Xpandomer、Xpandomer中间体以及底物结件。这些前体称为RT-NTP。

图63A-63E以符号和图形语言描述了VIII型Xpandomer、Xpandomer中间体以及底物构建体。这些前体称为RT-NTP。

图64A至64E以符号和图形语言描述了IX型Xpandomer、Xpandomer中间体以及底物构建体。这些前体称为RT-NTP。

图65是使用IX型三磷酸盐底物构建体和聚合酶，在固定的模板上合成Xpandome的方法的浓缩示意图。

图66A-66E以符号和图形语言描述了X型Xpandomer、Xpandomer中间体以及底物构建体。这些前体称为XNTP。

图67是使用发夹结构引物和X型三磷酸盐底物构建体，经由溶液聚合反应来合成Xpandomer的方法的浓缩示意图。

发明的详细描述

在以下描述中，对某些具体细节进行了阐述，以提供对各种实施方案的深入理解。然而，本领域技术人员应当理解，本发明可以在没有这些细节的情况下实施。在其他情况中，并未详细展示或详细描述已知的结构，以避免对实施方案不必要的含糊的描述。除非本文另作要求，在整个说明书和下述权利要求书中，词语“包含(comprise)”及其变化，例如，“包含(comprises)”和“包含(comprising)”以开放的、包含在内的意义解释换句话说，解释为“包括，但不限于”。此外，本文所提供的标题只是为了方便表述而不是用于解释本发明要求保护的范围或含义。

整个说明书中提到的“一个实施方案”(或“实施方案”)意指与所描述实施方案相关的具体特征、结构或特性是包含于至少一个实施方案中的。因此，整个说明书在不同地方出现的短语“在一个实施方案中”或“在实施方案中”并不一定都是指同一个实施方案。另外，具体的特征、结构或特性可以在一个或更多实施方案中以任何适当的方式组合。同样，除非文中另有明确说明，如本说明书和附加的权利要求书中所用的，单数形式“一个(a)”、“一个(an)”和“这种(the)”包含复数个对象。同样需要注意的是，除非文中另有明确说明，术语“或”一般包括“和/或”的意思。

定义

除非文中另有明确说明，本文所用的下列术语具有下文指定的意思。

“核碱基”是杂环的碱基，例如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤腺苷、黄嘌呤、次黄嘌呤，或者它们的杂环衍生物、类似物或互变异构体。核碱基可以是天然存在的或合成的。核碱基的非限制性实例为腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶、尿嘧啶、黄嘌呤、次黄嘌呤、8-氮杂嘌呤(8-azapurine)、在第8位由甲基或溴取代的嘌呤、9-O-N6-甲基腺嘌呤、2-氨基腺嘌呤、7-脱氮黄嘌呤、7-脱氮鸟嘌呤、7-脱氮腺嘌呤、N4-乙醇基胞嘧啶、2，6-二氨基嘌呤、N6-乙醇基-2，6-二氨基嘌呤、5-甲基胞嘧啶、5-(C3-C6)-炔基胞嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、硫尿嘧啶、假异胞嘧啶、2-羟基-5-甲基-4-三唑吡啶、异胞嘧啶、异鸟嘌呤、次黄嘌呤核苷、7，8-二甲基咯嗪、6-二氢胸腺嘧啶、5，6-二氢尿嘧啶、4-甲基-吲哚、亚乙烯基腺嘌呤，以及美国专利5,432,272、6,150,510和PCT申请WO 92/002258、WO 93/10820、WO 94/22892和WO 94/24144以及Fasman(“Practical Handbook of Biochemistry and Molecular Biology(生物化学和分子生物学操作手册)”，pp.385-394，1989，CRC Press，BocaRaton，LO)所述的非天然存在的核碱基，在此通过引用将其全部内容并入。

“核碱基残基”包括核苷酸、核苷、其片段，以及具有结合互补核苷酸特性的相关分子。脱氧核苷酸和核糖核苷酸，以及它们的各种类似物，也在本定义所考虑的范围内。核碱基残基可以是寡聚体和探针的成员。除非文中另有说明，“核碱基”和“核碱基残基”在本文中可以交换使用，并且通常是同义的。

“多核苷酸”，也称为核酸，是核苷酸的共价连接系，其中一个核苷酸的戊糖的3’位通过磷酸二酯基团连接到下一个戊糖的5’位。DNA(脱氧核糖核酸)和RNA(核糖核酸)是生物学上存在的多核苷酸，其中核苷酸残基通过磷酸二酯键连接于具体序列中。本文所用的术语“多核苷酸”或“寡核苷酸”包括任何具有核苷酸线性主链的多聚体化合物。寡核苷酸，也称为寡聚体，通常是较短的链式多核苷酸。

正如本领域技术人员所理解的，“互补”通常指特定核苷酸双链体化形成标准的Watson-Crick碱基对。然而，这里所提到的互补也包括核苷酸类似物的碱基配对，包括但不限于，2’-脱氧次黄苷和5-硝基吲哚-2’-脱氧核糖核苷，它们能与A、T、G或C核苷酸以及锁核酸进行广泛的碱基配对，从而提高双链体的热稳定性。本领域技术人员公认杂交严格性是杂交形成的双链体配对或不配对程度的决定因素。

“核酸”是多核苷酸或寡核苷酸。核酸分子可以是脱氧核糖核酸(DNA)、核糖核酸(RNA)或二者的结合。当作为测序靶标时，核酸通常称为“靶核酸”或“靶序列”。核酸可以是作为测序靶标的分子的混合物或库。

“探针”是短链核碱基残基，一般指通常为单链且与核酸的靶序列互补的两个或多个连续核碱基残基。如在“底物成员”和“底物构建体”中所示，探针长度可达20个核碱基残基。探针可以包括修饰的核碱基残基和修饰的核碱基内键的任意结合。探针主链可以通过多种类型的共价键连接在一起，所述共价键包括但不限于，酯键、磷酸二酯键、磷酰胺键、磷酸酯键、硫代磷酸酯键、硫羟磷酸酯(phosphorothiolate)键、氨键以及它们的任意组合。探针也可以具有5’和3’末端的连接，其包括但不限于以下部分：单磷酸盐、三磷酸盐、羟基、氢、酯、醚、乙二醇、胺、酰胺，以及硫酯。

“选择性杂交”指特异性的互补结合。多核苷酸、寡核苷酸、探针、核碱基残基及其片段，在使非特异性结合最小化的杂交和漂洗条件下，与靶核酸链选择性地杂交。正如本领域已知的，高严格条件可用于实现利于完美配对的选择性杂交条件。可以改变杂交的条件，如盐浓度、温度、去垢剂、PEG以及诸如甜菜碱的GC中和剂，来提高杂交的严格性，即对于C与G碱基对、A与T或U碱基对沿连续的双链体核酸链精确配对的需要。

“模板指导合成”、“模板指导组装”、“模板指导杂交”、“模板指导结合”和其他任何模板指导方法，是指核碱基残基或探针选择性结合于互补的靶核酸，并且并入到新生的子链中的方法。通过模板指导合成所产生的子链与作为其合成来源的单链靶标是互补的。应当注意的是，如果子链序列已知，靶链的相应序列可以由它的子链序列推断。“模板指导聚合”和“模板指导连接”是模板指导合成的特殊情况，据此，所得的子链分别是聚合的或连接的。

“连续的”指序列延续而无中断或核碱基缺失。认为模板链核苷酸的连续序列与子链的连续序列互补。

“底物”或“底物成员”是对靶模板具有结合特异性的寡聚体、探针或核碱基残基。底物通常与连接臂结合，形成底物构建体。形成子链一级主链的底物构建体的底物也是子链的底物或底物成员。

“底物构建体(susbstrate construct)”是用于子链的模板指导合成的反应物，并且通常以文库的形式提供。底物构建体通常含有与靶模板和可以结合连接臂的连接臂成员或连接臂连接位点互补结合的底物成员。底物构建体以适于本发明的各种形式提供。底物构建体包括“寡聚底物构建体(oligomeric substrate constructs)”(也称为“探针底物构建体”)和“单体底物构建体”(也称为“核碱基底物构建体”)。

“亚基基序”或“基序”指多聚体主链的重复亚基，该亚基具有重复亚基的所有形式的特性，但也具有编码遗传信息的种类特异性元件。根据每个基序中基本互补序列结合核碱基元件的可能组合的数量，互补核碱基残基的基序在底物构建体文库中有所描述。如果核碱基结合元件为四种(例如A、C、G和T)，四种元件组合的可能基序的数量是4x，其中x是基序中核碱基残基的数量。然而，基于简并配对碱基的其他基序，经尿嘧啶取代核糖核残基或其他核碱基残基组中的胸腺嘧啶，可以导致荷基序底物构建体(motif-bearing substrate constructs)的更大文库(或更小的文库)。基序也可以由种类特异性报道构建体代表，例如构成报道连接臂的报道子。通常在识别具体底物种类的报道构建体基序和基序的结合互补性和特异性之间存在一对一的相关性。

“Xpandomer中间体”是由底物构建体组装而来的中间产物(本文也称为“子链”)，是使用靶核酸模板通过底物构建体的模板指导组装而形成。任选地，相邻底物构建体之间可以随意形成其他连接，其可以包括底物的聚合或连接，连接臂与连接臂的连接或连接臂与底物的连接。Xpandomer中间体含有两种结构；即，受约束的Xpandomer和一级主链。受约束的Xpandomer包含子链中所有的连接臂，可以包含本方法所需的所有、部分底物或没有底物。一级主链包含所有的相邻底物。在一级主链片段化或解离的工序中，受约束的Xpandomer不再被约束，并且由于连接臂的展开而得以延伸的Xpandomer产物。“双链体子链(duplex daughterstrand)”是指与靶模板杂交或进行双链体化的Xpandomer中间体。

“一级主链”是指子链底物的连续主链或成段主链。通常遇到的一级主链是天然多核苷酸的5’-3’磷酸二酯核糖主链。然而，子链的一级主链可以具有核苷碱基类似物和寡聚体类似物，它们不通过磷酸二酯键连接或者磷酸二酯键与其他主链键的混合连接，其他主链键包括但不限于以下连接：硫代磷酸酯、硫羟磷酸酯、磷酸酯、氨基磷酸酯和包括膦酰-PNA、丝氨酸-PNA、羟脯氨酸-PNA的肽核酸“PNA”主链键，以及它们的组合。当子链采用双链体形式(例如，双链体子链)，并且底物在亚基间不是共价连接时，底物仍然是连续的并且形成子链的一级主链。

“受约束的Xpandomer”是以展开前的构型中的Xpandomer。该受约束的Xpandomer包含子链的所有连接臂成员。它由展开而成为受约束是通过每个连接臂的至少一个键或连接，连接于一级主链上来进行的。在展开过程中，子链的一级主链成为片段化或解离，将受约束的Xpandomer转化为Xpandomer。

“受约束的Xpandomer主链”是受约束的Xpandomer的主链。它是在子链形成中与一级主链一起共组装而形成的合成的共价主链。在一些情况中，两种主链可以不是离散的但是在它们组成中都可以具有相同的底物或部分底物。受约束的Xpandomer主链总是包含连接臂，而一级主链不包含连接臂成员。

“Xpandomer”或“Xpandomer产物”是由受约束的Xpandomer展开而产生的合成的分子构建体，是由底物构建体通过模板指导组装而自身合成的。Xpandomer相对于其产生它的靶模板而延伸。它由串联的亚基组成，每个亚基由基序组成，每个基序由文库成员组成，包含序列信息、连接臂和任选地底物的部分或全部，所有这些都来自于形成的底物构建体。将Xpandomer设计成为展开至比靶模板更长，从而沿着其长度降低靶模板序列信息的线性密度。此外，Xpandomer任选地提供用于提高报道子的大小和丰度的平台，该平台可依次提高检测的信噪比。更低的线性信息密度和更强的信号可提高分辨率并降低检测和解码模板链序列的灵敏度要求。

“选择性可剪切键”是指在可控条件下可以断裂的键，所述可控条件诸如例如用于选择性剪切以下键的条件：硫羟磷酸酯键、光裂解键(photocleavable bond)、磷酰胺键、3’-O-B-D-呋喃核糖-2’键、硫醚键、硒醚键(selenoether bond)、亚砜键、二硫键、脱氧核糖-5’-3’磷酸二酯键或核糖-5’-3’磷酸二酯键，以及本领域所知的其他可剪切键。选择性可剪切键可以是连接臂内的键或在探针或核碱基残基之间或之内，或可以是探针和模板链杂交形成的键。选择性可剪切键不限于共价键，并且可以是非共价键或缔合，例如那些基于氢键、疏水键、离子键、π键成环堆积相互作用、范德华相互作用等的键。

“部分(moiety)”是指某物所分成的二部分或更多部分中的一个，例如，连接臂、分子或探针的各种部分。

“连接臂”或“连接臂成员”是指具有通常线性尺寸并在两个相反末端中的每一末端都带有末端部分的多聚体或分子构建体。连接臂通过至少一个末端部分的连接，连接于底物上从而形成底物构建体。连接臂的末端部分可以连接到底物的可剪切的连接上或可剪切的连接臂内的键上，该连接臂内的键用于将连接臂约束在“受约束的构型”中。子链合成后，每个末端部分都具有与其他连接臂直接或间接耦合的末端连接。耦合的连接臂包含受约束的Xpandomer，受约束的Xpandomer还包含子链。连接臂具有“受约束的构型”和“展开的构型”。受约束的构型存在于底物构建体和子链中。连接臂的受约束的构型是展开的构型的前体，与在Xpandomer产物发现的一样。受约束的构型向展开的构型的转变导致选择性可剪切键的剪切，该键可以在子链一级主链之内或为连接臂内连接。受约束的构型的连接臂也用于“一级主链”组装后添加连接臂形成子链。连接臂可以任选地沿它的链长包含可以编码底物序列信息的一个或多个报道子或报道构建体。连接臂提供了展开Xpandomer长度并从而降低序列信息线性密度的方法。

“连接臂构建体”是连接臂或连接臂前体，由一个或多个连接臂片断或其他用于组装连接臂的结构成分组成，例如报道构建体，或报道子前体，包括多聚体、嫁接共聚物、嵌段共聚物、亲和配体、寡聚体、半抗原、适体、树枝状聚合物、连接基团或亲和结合基团(例如，生物素)。

“连接臂元件”或“连接臂片段”是具有带两个末端的一般线性尺度的多聚体，其中该末端形成连接连接臂元件的末端连接。连接臂元件可以是连接臂构建体的片段。此类多聚体可以包括，但不限于：聚乙烯乙二醇，聚乙二醇，聚嘧啶，聚异腈，聚异氰酸酯，聚(三芳甲基)甲基丙烯酸酯，聚醛，聚吡咯啉，聚脲，聚乙二醇磷酸二酯，聚丙烯酸酯，聚甲基丙烯酸酯，聚丙烯酰胺，聚乙烯酯，聚苯乙烯，聚酰胺，聚亚安酯，聚碳酸酯，聚丁酸酯，聚丁二烯，聚丁内酯，聚吡咯烷，聚乙烯磷酸酯，聚乙酰胺，多糖，聚透明质酸酯，聚酰胺，聚酰亚胺，聚酯，聚乙烯，聚丙烯，聚苯乙烯，聚碳酸酯，聚对苯二甲酸酯，聚硅烷，聚氨酯，聚醚，聚氨基酸，聚甘氨酸，聚脯氨酸，氮代聚赖氨酸，多肽，侧链氮代肽，多氮代甘氨酸，类肽(peptoids)，侧链羧代肽，同源肽(homopeptides)，寡核苷酸，核糖核酸寡核苷酸，脱氧核酸寡核苷酸，修饰后可阻止Watson-Crick碱基配对的寡核苷酸，寡核苷酸类似物，聚胞嘧啶核苷酸，多聚腺苷酸，多聚尿苷酸，多聚胸苷，多磷酸盐，多核苷酸，多核糖核苷酸，聚乙二醇磷酸二酯，肽多核苷酸类似物，threosyl-多核苷酸类似物，乙二醇-多核苷酸类似物，吗啉代多核苷酸类似物，锁核苷酸寡聚体类似物，多肽类似物，支化聚合物，梳型高聚物，星形高聚物，枝状高聚物，随机的、倾斜的和嵌段共聚物，阴离子聚合物，阳离子聚合物，形成茎环、刚性片段与柔性片段的多聚体。

“肽核酸”或“PNA”是指具有适合与核酸杂交的核碱基残基的核酸类似物，带有包含氨基酸或其衍生物或类似物的主链。

“膦酰肽核酸”或“pPNA”是指主链中包含氨基酸类似物的肽核酸，例如N-(2-羟乙基)膦酰基甘氨酸或N-(2-氨乙基)膦酰基甘氨酸，并且核碱基单位之间是通过膦酰酯或膦酰氨键连接的。

“丝氨酸核酸”或“SerNA”是指主链中包含丝氨酸残基的肽核酸。此类残基可以通过氨基或酯键连接。

“羟脯氨酸核酸”或“HypNA”是指主链中包含4-羟脯氨酸残基的肽核酸。此类残基可以通过氨基或酯键连接。

“报道元件”是信号元件、分子复合物、化合物、分子或原子，其也由相关的“报道子检测特性”构成。其他的报道元件包括但不限于，FRET共振供体或受体、染料、量子点、珠子、树枝状聚合物、上转换荧光团、磁粒、电子散射体(例如，硼)、大分子(mass)、金珠、磁力共振、电离基团、极性基团、疏水基团。除此之外其他是荧光标签的，例如但不限于，溴化乙锭、SYBR绿(SYBR Green)、Texas红(Texas Red)、吖啶橙、芘，4-硝基-1，8-萘二甲酰亚氨、TOTO-1、YOYO-1、氰蓝3(Cy3)、氰蓝5(Cy5)、藻红素、藻青素、别藻蓝素、FITC、若丹明、5(6)-羧基荧光素、荧光蛋白、DOXYL(N-烃氧基-4，4-二甲基唑烷)、PROXYL(N-烃氧基-2，2，5，5-四甲基吡咯烷)、TEMPO(N-烃氧基-2，2，6，6-四甲基哌啶)、二硝基苯基、吖啶、香豆素、Cy3和Cy5(Biological Detection Systems公司)、erytrosine、香豆酸、伞形酮、texas red rhodaine、四甲基若丹明、Rox氧化剂、7-硝基苯1-乙二酸-1-二唑(NBD)、恶唑、噻唑、芘、荧光素或镧；还有放射性同位素(例如³³P、³H、¹⁴C、³⁵S、¹²⁵I、³²P或¹³¹I)、溴乙非啶、铕、钌和钐或其他放射性同位素；或大分子标签(mass tags)，例如，C5位修饰的嘧啶或N7位修饰的嘌呤，其中大分子修饰基团可以是，例如，卤素、乙醚或聚醚、烷基、酯或聚酯，或一般类型的XR，其中X是连接基团而R是大分子修饰基团、化学发光标记物、自旋标记物、酶(例如过氧化物酶、碱性磷酸酶、β-半乳糖苷酶和氧化酶)、抗体片段和亲和配体(例如寡聚体、半抗原和适体)。报道元件和连接臂的连接可以是共价的或非共价的，直接的或间接的。典型的共价连接包括有连接子或无连接子的键。包括与连接臂主链或连接臂成键元件例如树枝状聚合物或侧链的键。典型的非共价键包括氢键、疏水键、离子键、π键成环堆积、范德华相互作用等。配体例如通过与报道元件上结合位点的特异性亲和结合而连接。直接的连接可以发生于连接臂合成时、连接臂合成后以及Xpandomer合成之前或之后。

“报道子”由一个或多个报道元件构成。报道子包括称为“标记”或“标签”的东西。Xpandomer的探针或核碱基残基可以认为是报道子。报道子用于解析靶核酸的遗传信息。

“报道构建体”包含一个或多个能产生可探测信号的报道子，其中可探测信号通常含有序列信息。信号信息被称为“报道密码”，并且随后被解码为遗传序列数据。“报道构建体”也可以包含连接臂片段或其他结构成分，包括多聚体、嫁接共聚物、嵌段共聚物、亲和配体、寡聚体、半抗原、适体、树枝状聚合物、连接基团或亲和结合基团(例如，生物素)。

称为“信号”的“报道子检测特性”描述了所有可能的可测量或可检测的元件、特性或特征，用于将报道子遗传序列信息直接或间接传达到测量设备上。这些包括但不限于，荧光、多波长荧光、发射光谱荧光猝火、FRET、发射率、吸收率、反射系数、染料发射、量子粒发射、珠子成像、分子复合物成像、磁化率、电子散射、离子量、磁性共振、分子复合物尺寸、分子复合物阻抗、分子电荷、感应偶极子、阻抗、分子量、量子状态、电荷容量、磁自旋状态、诱导极性、核衰减、共振或互补性。

“报道密码”是从报道构建体的测定信号获得的遗传信息。将报道密码解码，来提供序列特异性的遗传信息数据。

“Xprobe”是可展开的寡聚底物构建体。每个Xprobe具有探针成员和连接臂成员。连接臂成员通常具有一个或多个报道构建体。5’-单磷酸盐修饰的Xprobe适合通过基于酶促连接的方法用于Xpandomer的合成。5’和3’连接子修饰的Xprobe适合通过基于化学连接的方法用于Xpandomer的合成。

“Xmer”是可展开的寡聚底物构建体。每个Xmer具有寡聚底物成员和连接臂成员。连接臂成员通常有一个或多个报道构建体。Xmer可以是5’-三磷酸盐，适合通过基于聚合酶的方法用于合成Xpandomer。

“RT-NTP”是可展开的、5’-三磷酸盐修饰的核苷酸底物构建体(“单体底物”)，其与模板依赖性酶促聚合反应相适应。RT-NTP具有修饰的脱氧核糖核酸三磷酸(“DNTP”)、核糖核酸三磷酸(“RNTP”)或功能等同的底物类似物，统称为核酸三磷酸(“NTPS”)。RT-NTP具有两个独特的功能元件；即，核碱基5’-三磷酸和连接臂或连接臂前体。子链形成后，连接臂在允许受约束的RT展开的位置连接于每个核苷酸之间。在RT-NTP的一种类型中(例如，IX类)，连接臂在RT-NTP聚合后连接。在一些情况中，RT-NTP具有可逆的末端终止子和可选择性直接交联到相邻连接臂上的连接臂。每个连接臂可以由特异性识别核苷酸的报道子来特异性编码，该核苷酸被连接臂连接。

“XNTP”是适于模板依赖性酶促聚合反应的可展开的、5’-三磷酸岩修饰的核苷酸底物。XNTP有两个独特的功能元件；即，核碱基5’-三磷酸盐和连接臂或连接臂前体，其在通过核苷酸内切而允许受约束的RT展开的位置连接到每个核苷酸内。

“持续的”是指通常是连续的并且定向进行的底物耦合过程。例如，当不受理论的限制时，如果底物不间断的增量添加到新生子链中，连接酶和聚合酶就都呈现持续性工作状态。如果纯粹的效果是新生子链持续增长，那么杂交和连接或杂交和聚合的步骤都不视为独立的步骤。一些而不是所有的引物-依赖型过程是持续性的。

“混合的”是指在模板的多个位点同时发生的、不是引物依赖行的并且表示从多于一个的起始位点平行(同时)发生链的延伸的底物耦合过程。

“单碱基延伸”是指一个接一个增加单体底物的循环逐步的过程。通常，通过使用可逆的封闭基团，禁止耦合反应在任一步骤中进行除单底物延伸外的行动。

“单探针延伸”是指一个接一个加寡聚底物的循环逐步的过程。通常，通过使用可逆的封闭基团，禁止耦合反应在任一步骤中进行除单底物延伸外的行动。

本文所用的“对应于”或“相应的”涉及互补于并因而“对应于”全部或部分靶核酸序列的探针、寡核苷酸、寡核苷酸类似物或子链的连续单链序列。探针的互补序列可以说是对应于其靶标。除非另有说明，探针的互补序列和靶标的互补序列都分别是连续的序列。

“核酸酶抗性”指在DNA或RNA磷酸二酯键通常能被剪切的条件下对核酸酶有抵抗力的键。核酸酶包括但不限于，DNA酶I、核酸外切酶III、绿豆核酸酶、RNA酶I和RNA酶H。本领域技术人员可以很容易地评定给定键的相对核酸酶抗性。

“连接酶”是通常用于连接3’-羟基5’-单磷酸核苷酸、寡聚体及其类似物的酶。连接酶包括但不限于，包括tRNA连接酶在内的NAD+-依赖性连接酶、Taq DNA连接酶、丝状栖热菌(Thermus filiformis)DNA连接酶、大肠杆菌(Escherichia coli)DNA连接酶、Tth DNA连接酶、水管致黑栖热菌(Thermus scotoductus)DNA连接酶、热稳定连接酶、Ampligase热稳定DNA连接酶、VanC-型连接酶、9°N DNA连接酶、Tsp DNA连接酶，以及用生物勘测方法发现的新的连接酶。连接酶还包括但不限于，ATP依赖性连接酶包括T4RNA连接酶在内、T4DNA连接酶、T7DNA连接酶、Pfu DNA连接酶、DNA连接酶I、DNA连接酶III、DNA连接酶IV，以及用生物勘测方法发现的新的连接酶。这些连接酶包括野生型、突变同工型和基因工程变体。

“聚合酶”是通常用于连接3’-羟基5’-三磷酸核苷酸、寡聚体以及其类似物的酶。聚合酶包括但不限于，DNA依赖性DNA聚合酶、DNA依赖性RNA聚合酶、RNA依赖性DNA聚合酶、RNA依赖性RNA聚合酶、T7DNA聚合酶、T3DNA聚合酶、T4DNA聚合酶、T7RNA聚合酶、T3RNA聚合酶、SP6RNA聚合酶、DNA聚合酶I、Klenow片段、水生栖热菌(Thermophilus aquaticus)DNA聚合酶、Tth DNA聚合酶、

DNA聚合酶(New England Biolabs)、Deep

DNA聚合酶(NewEngland Biolabs)、Bst DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、9°N DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Tth DNA聚合酶、RepliPHI Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、Therminator^TM聚合酶(New England Biolabs)、KOD HiFi^TM DNA聚合酶(Novagen)、KOD1 DNA聚合酶、Q-β复制酶、末端转移酶、AMV反转录酶、M-MLV反转录酶、Phi6反转录酶、HIV-1反转录酶、用生物勘测方法发现的新的聚合酶，以及US 2007/0048748、US 6,329,178、US6,602,695和US 6,395,524(通过引用并入)所列举的聚合酶。这些聚合酶包括野生型、突变同工型和基因工程变体。

“编码”或“解析”是指将一种形式转换成另一种的动词，并指将靶模板碱基序列的遗传信息转换成报道子的排列。

“非遗传的”是指在子链中的非一级主链部分的任何结构；例如，非遗传的报道子不是位于一级主链中的核碱基本身。

“异共聚物”是将不同的单位(例如，单体亚基种类)连接入“共聚物”的链而形成的物质。异共聚物由离散的“亚基”构建体制备。“亚基”是由定义明确的基序组成的聚合体的区域，其中每个基序是一个种类并且携带遗传信息。本文也使用术语异共聚物描述所有模块是由重复基序构建的模块的聚合体，其每个基序具有种类特异性元件。子链和Xpandomer都是异共聚物，据此，每个亚基基序编码靶模板序列的一个或多个碱基并且整个靶序列是通过基序序列进一步限定的。

“固相支持体”是表面可用于附着分子、化合物、细胞或其他实体的固体物质。固相支持体的表面可以是平整的或不平整的。固相支持体可以是有孔的或无孔的。固相支持体可以是包含表面的芯片或微阵列，且可以包含玻璃、硅、尼龙、多聚体、塑胶、陶瓷或金属。固相支持体也可以是膜或平板或器皿，所述膜如例如尼龙、硝化纤维或高分子膜，并且可以由玻璃、陶瓷、金属或塑胶组成，例如聚苯乙烯、聚丙烯、聚碳酸酯或异质同晶聚合物。固相支持体也可以是任何形状的珠子、树脂或微粒。这些微粒或珠子可以由任何合适的物质例如玻璃或陶瓷，和/或一种或多种多聚体组成，该多聚体例如尼龙、聚四氟乙烯、特氟纶^TM(TEFLON^TM)、聚苯乙烯、聚丙烯酰胺、琼脂糖(sepaharose)、琼脂粉、纤维素、纤维素衍生物或葡聚糖，和/或可以包含金属，尤其是顺磁性金属例如铁。

“可逆性封闭”或“终止子”是指当其在一部分上结合于第二个化学基团时可阻止第二个化学基团进入具体化学反应的化学基团。在合成有机和生物有机化学中各种保护基团是已知的，它们适用于特定的有机基团并且适合于特定的化学过程，这意味着它们在那些过程中可以保护特定基团并且随后可以被移除或修饰(参见，例如，Metzker et al.，Nucleic AcidsRes.，22(20)：4259，1994)。

“连接子”是连接两个分子或部分，并且为这两个分子或部分之间提供空间使它们能够以它们既定的方式发挥功能的分子或部分。例如，连接子可以包含二胺烃链，该链通过一端的反应基团共价结合于寡核苷酸类似物分子上以及通过另一端的反应基团共价结合于固相支持体上，例如珠子表面。可以通过使用本领域已知的耦合剂将连接子耦合于目的核苷酸和底物构建体上(参见，例如Efimov et al.，Nucleic Acids Res.27：4416-4426，1999)。衍生和耦合有机分子的方法在有机和生物有机化学领域中是众所周知的。连接子也可以是可剪切的或可逆的。

整体概述

总的而言，描述了用于复制单分子靶核酸的方法与相应的设备及产物。这些方法使用可保证靶核酸的测序通量和精确度增高的“Xpandomer”。Xpandomer以线性展开形式编码(解析)靶核酸的核苷酸序列信息，从而提高空间分辨率，并任选地伴随着信号强度的放大。本文将这些方法称为“通过展开进行测序”或“SBX”。

如图1A所示，天然的双链体核酸具有非常紧密的线性数据密度；在双螺旋(1)的每条链的相继堆积的碱基(2)之间大约有

中心对中心的分离，因此要以任何精确度和速度直接成像或测序是非常困难的。当双链形式变性形成单链多核苷酸(3、4)时，产生的碱基与碱基分离距离是相似的，但是由于二级结构的结构域使该问题变得复杂化。

如图1B所示，Xpandomer(5)，在此作为由非遗传的连接臂T(8，9)连接到一起的短的寡聚体串联物(6、7)进行示例，是待测序的核酸靶标的合成代替物或“替代品”。将与模板互补的碱基并入Xpandomer中，而规律性间隔的连接臂可用于增加短的寡聚体之间的距离(在此每个寡聚体显示带由4个以圆圈表示的核碱基)。Xpandomer可由一种方法产生，该方法中合成的双链体中间体首先通过复制模板链而形成。子链是独特的，因为它具有由寡聚体合成的线性主链和由折叠的连接臂组成的受约束的Xpandomer主链。然后将连接臂打开或“展开”，使产物转化为延伸的连接臂链。形象地说，可以将子链看作是有两个重合的主链：一个线性的(一级主链)而另一个带“褶状的”折叠(受约束的Xpandomer)。子链中键的选择性剪切使褶状折叠展开，产生Xpandomer产物。这一过程在下文会有更详细的解释，但是应当注意的是如图1B所示的每个寡聚体的四个核碱基的选择和连接臂的细节只是用于示例的目的，而不能理解为限制本发明。

Xpandomer中的相邻寡聚体之间的分离距离“D”现在是过程依赖性变量并且通过连接臂T的长度测定。如所示的，将连接臂T的长度设计入底物构建体，即作为Xpandomer产生来源的构建模块(building block)。分离距离D可以选择为例如大于0.5nm，或大于2nm，或大于5nm，或大于10nm，或大于50nm。分离距离越高，识别或“解析”个体寡聚体的过程就变得越简单。如果不是寡聚体，而是另一个Xpandomer种类的个体核碱基在连接臂的链上串联到一起，这也将是确切的。

再参见图1A，天然的DNA通过半保留复制过程进行复制；每个新的DNA分子是模板链(3)和天然的子链(4)的“双链体”。通过“模板指导合成”的过程将序列信息从模板传到天然子链从而保留碱基对序列特有的遗传信息。天然子链转而成为下一代天然子链的模板等。Xpandomer可由与模板指导合成相似的过程形成，该过程可以是酶促或化学耦合的过程。然而，不同于天然DNA，Xpandomer一旦形成，就不能通过半保留复制的生物学过程被复制，并且不适于用诸如PCR的方法进行扩增。对Xpandomer产物进行设计以限制不需要的二级结构。

图2A-2D显示有代表性的I型Xpandomer底物(20、21、22、23)。这些是合成Xpandomer的构建模块。其他Xpandomer底物(本文公开了十种)在随后的部分中进行描述。在此所示的Xpandomer底物构建体具有两个功能成分；即，探针成员(10)和处于环状构型中的“连接臂”成员(11)。环形成延伸的终产物的连接臂“T”。仅为了便于解释，再次以图2B中所示的四种核碱基残基(14、15、16、17)对探针成员进行描述。

这些底物构建体可以用R基团进行末端修饰，例如，作为羟基适于和连接酶一起使用的5’-单磷酸3’-(这里称为“Xprobe”)或适于和聚合酶一起使用的5’-三磷酸3’-羟基(本文称为“Xmer”)。其他的R基团可以在各种方法中使用。在图3B所示的第一个实例中，我们展示了使用Xprobe通过连接酶依赖性方法从靶核酸的模板链合成Xpandomer。

选择探针成员(10)的四种核碱基残基(14，15，16，17)，使其与模板的四种核苷酸的连续序列互补。从而将每个“探针”设计为与模板在四种核苷酸的互补序列处杂交。通过提供许多此类探针序列的文库，可以形成模板的连续的互补拷贝。这种子链称为“Xpandomer中间体”。Xpandomer中间体有双链体或单链形式。

将连接臂环在第二和第三个核碱基残基(15，16)处连接于探针成员(10)。第二和第三个核碱基残基(15，16)也通过描述为“V”的“选择性可剪切键”(25)相互连接。这种可剪切键的剪切能使连接臂环展开。线性化的连接臂可以说是“桥接了”子链的一级多核苷酸主链的选择性可剪切键。剪切这些键使一级主链分散并且形成了更长的Xpandomer。

选择性可剪切键(25)的选择性剪切可以通过多种方式进行，包括但不限于，硫羟磷酸酯键的化学剪切，核糖5’-3’磷酸二酯键的核糖核酸酶消化，光裂解键的剪切等等，如下文更加详细地讨论的。

图2A所示的底物构建体(20)有单个连接臂片段，在此用椭圆形(26)表示，用于连接报道元件。该片段的侧面是间隔子连接臂片段(12，13)，所有这些共同形成连接臂构建体。一至许多树枝状聚合物，多聚体，支化聚合物或其组合可用于，例如构建连接臂片段。对于图2B的底物构建体(21)而言，连接臂构建体由三个用于连接报道元件的连接臂片段(27，28，29)组成，每个元件的侧面是间隔子连接臂片段。报道元件的组合共同形成“报道构建体”，产生独特的数字报道密码(用于探针序列的识别)。这些报道元件包括但不限于，荧光团、FRET标签、珠子、配体、适体、肽、半抗原、寡聚体、多核苷酸、树枝状聚合物、茎环结构、亲和标记、质量标签等。图2C中的底物构建体(22)的连接臂环(11)是“裸露的”。这个构建体编码的遗产信息不是编码在连接臂上，而是与探针(10)相关，例如，以带标签的核苷酸的形式。图2D底物构建体(23)说明一般性原则：如星号(*)所示，探针的序列信息以在测序过程中更容易被检测到的修饰的形式在底物构建体中被编码或“解析”。因为序列信息在选择性可剪切键(25)剪切形成线性延伸的Xpandomer多聚体后，更易以物理方式解析，星号(*)代表编码的遗传信息的任何形式，这对它而言是有利的。底物构建体的生物信息元件(*)，无论是何种形式，可以被直接检测到或可以是在组装后的标记步骤中添加了可检测元件的前体。在一些实例中，遗传信息由编码入底物构建体自身的分子特性中，例如多状态的质量标签。在其他实例中，遗传信息由以下编码：一个或多个FRET供体：受体对的荧光团，或纳米分子条形码，或配体或配体的组合，或本领域所描述的某些其他标签技术形式。各种实施方案将在下文进行更详细的讨论。

连接臂通常提供许多的功能：(1)直接或间接地依次连接于相邻的连接臂上从而形成Xpandomer中间体；(2)通过一级主链上或连接臂内的选择性键的剪切，伸展和展开形成延伸的连接臂链(见图1B)；和/或(3)提供分子构建体用于并入报道元件，该分子构建体也称为“标签”或“标记”，编码相关底物的核碱基残基的序列信息。可以通过调节其报道子组成性元件的空间距离、丰度、信息密度和信号强度，设计连接臂而使编码功能最优化。各种报道子特性对于放大底物构建体编码的遗传信息的信号强度是有用的。关于报道子、分子条形码、亲和结合、分子标签和其他报道元件的文献，对于本领域技术人员而言是众所周知的。

可以看出，如果底物构建体的每个底物都含有x个核碱基，那么代表x个核碱基的所有可能的依次组合的文库就会含有4^x个探针(当从A、T、C或G中选择核碱基时)。如果使用其他碱基，那么就可能需要更少的或更多的组合。设计这些底物文库使每个底物构建体含有(1)与待测序核酸的任何一可能的靶序列互补的探针(或至少一核碱基残基)以及(2)编码与该具体探针(或核碱基)互补的靶序列编号(identity)的独特报道构建体。含有两个核碱基的探针文库会有16种独特的成员；含有三个核碱基的探针文库会有64种独特的成员，以此类推。典型的文库会有四个个体核苷酸自身，但是可以通过设定使其适应多种连接方式。

图3A-3C图解了Xpandomer的合成。在此描述的底物是Xprobe，并且该方法可以描述为在自由溶液(free solution)中与引物依赖性持续的连接进行的杂交。

许多众所周知的分子生物学方法，如用于片段化靶DNA和连接末端衔接子的方法，可以适用于测序方法，并且在此用于制备测序用靶DNA(30)。在此我们以本领域技术人员所熟悉的广义措辞描述了使片段末端平滑化以及使设计用于与测序引物一起使用的衔接子(31，32)进行平末端连接的方法。这些反应显示于图3A的步骤I中。在步骤II和III中，使靶核酸变性并且与与衔接子互补的合适引物(33)退火。

在图3B中，将步骤III的引发的模板链与底物构建体文库(36)及连接酶(L)接触，而在步骤IV中，调整条件从而促进杂交反应，随后在引物-模板双链体的游离3’-羟基处进行连接。任选地在步骤V中，连接酶解离，以及在步骤VI和VII中，可以识别杂交和连接的过程，从而通过将底物(37，38)累积添加到引物末端而引发延伸。虽然引发可以从单链模板两端的衔接子开始发生，但是仅仅为了简单起见，在此展示新生Xpandomer子链的生长由于单个引物开始。子链的延伸描述于步骤VI和VII中，这两个步骤是连续重复的(递增的，不中断)。这些反应在自由溶液中发生并且持续进行直至合成足量的产物。在步骤VIII中，展示了完整的Xpandomer中间体(39)的形成过程。

长度相对较长的连续核苷酸序列可以用这种方法进行有效地复制从而形成Xpandomer中间体。可以看出，对应于长模板链片段的连续读长(“重叠群”)可以通过这种技术完成。对于本领域技术人员而言显然的的是，亿万个这些单分子SBX反应可以在单试管中以有效的循环过程同时进行。随后，可以对这些合成的鸟枪法产物进行测序。

在图3C中，描述了SBX方法的随后步骤。步骤IX显示了双链体Xpandomer中间体的变性，随后是主链中选择性可剪切键的剪切，设计选择性可剪切键以便“打开”连接臂环，形成线性延伸的Xpandomer产物(34)。此类选择性剪切可以通过本领域技术人员所知的任何技术来完成，包括但不限于，Mag等(“Synthesis and selective cleavage of anoligodeoxynucleotide containing a bridged internucleotide5′-phosphorothioate linkage”，Nucleic Acids Research 19(7)：1437-1441，1991)公开的用金属阳离子进行硫羟磷酸酯的剪切，Mag等(“Synthesis andselective cleavage of oligodeoxyribonucleotides containing non-chiralinternucleotide phosphoramidate linkages”，Nucleic Acids Research 17(15)：5973-5988，1989)公开的氨基磷酸酯的酸催化的剪切，Gut等(“A novelprocedure for efficient genotyping of single nucleotide polymorphisms”，Nucleic Acids Research 28(5)：E13，2000)和Eckstein等(“Inhibition ofrestriction endonuclease hydrolysis by phosphorothioate-containing DNA”，Nucleic Acids Research，25；17(22)：9495，1989)分别公开的磷酸二酯键的选择性核酸酶剪切，以及Sauer等(“MALDI mass spectrometry analysis ofsingle nucleotide polymorphisms by photocleavage and charge-tagging”，Nucleic Acids Research 31，11 e63，2003)、Vallone等(“Genotyping SNPsusing a UV-photocleavable oligonucleotide in MALDI-TOF MS”，MethodsMol.Bio.297：169-78，2005)和Ordoukhanian等(“Design and synthesis of aversatile photocleavable DNA building block，application to phototriggeredhybridization”，J.Am.Chem.Soc.117，9570-9571，1995)公开的光裂解连接修饰的磷酸二酯主链的选择性剪切。

基本程序的提纯，例如漂洗步骤和严格条件的调整是有经验的分子生物学家所熟练掌握的技术。在这个程序上的变量，包括例如靶链的固定和解析、伸展以及其他技术，用于在Xpandomer合成、展开后标记、末端功能化和连接底物的连接酶的选择方案中减少二级结构，将在以下材料中讨论。

进行Xpandomer的合成，用于促进核酸的检测和测序，而且可适用于所有类型的核酸。该过程是用于“展开”或“延伸”编码序列信息的主链元件(或亚基)的长度(相对于天然核酸的短的核苷酸与核苷酸距离的展开)，以及任选地也可以用于增强信号强度(相对于天然核苷酸中观察到的几乎不能辨别的低强度信号)的方法。同样地，并入到Xpandomer的展开的合成主链中的报道元件，可以利用多种检测方法进行检测与处理，所述方法包括本领域众所周知的检测方法(例如，CCD成像系统、原子力显微镜或门控质谱仪)，以及通过诸如大规模平行纳米孔的感受器阵列的方法或这些方法的结合。在最佳信噪比、通量、费用以及类似因素的基础上选择检测技术。

参见图4，展示了检测技术的简单模型；即，在膜(44)中带有FRET供体(42)的纳米孔(40)，可以被λ₁波长的光激活。按箭头(45)的方向，当Xpandomer产物(41)延伸并被转运通过纳米孔(40)时，可以在该孔的附近检测到来自激活的荧光团的λ₂波长发射的连续脉冲。将发射波长(λ₂)暂时间隔开来作为连接臂长度以及Xpandomer通过纳米孔速度的函数。通过捕获这些模拟信号并且对它们进行数字处理，可以从Xpandomer上直接阅读序列信息。应当注意的是，在这种检测方法中，纳米孔和膜可以有很多通道，Xpandomer可以通过这些通道易位。FRET检测需要沿每个通道上有至少一个激活的FRET供体。相反，基于纳米孔的Coulter计数器在信噪比的代价下可以仅具有额外的易位孔(translocation pore)。

在图4所示的基于纳米孔的检测技术中，图4描述了图2B所示Xprobe链的结构，如沿连接臂排列的盒状报道子成员(27，28，29)所示，连接臂构建体含有多元件报道构建体。相关的纳米孔技术，由例如Branton等公开于美国专利6,627,067中，并由Lee等(Lee，JW and A Meller.2007.Rapid sequencing by direct nanoscale reading of nucleotide bases inindividual DNA chains.In″New High Throughput Technologies for DNASequencing and Genomics，2”，Elsevier)公开。

图5展示了在此由FRET受体荧光团组成的多元件报道子构件体如何呈现定位在FRET闸门处的检测器。在发射的这个多通道位点中可以看出，模拟信号在通常有规律的时间间隔中产生并且可以解析为数字密码的类型(在此称为报道密码，且在这个实例中称为Xprobe ID)，因而公开了Xprobe亚基的编号和顺序并从而公开了所展示Xpandomer的遗传序列。报道子的各种组合可以用于产生报道密码的文库，所述报道子依序编码所述Xprobe的A、T、G或C的任意4种碱基的组合。在本实例中，可以使用三种荧光团的组合产生22种报道密码。这样，可以看出ACTG序列位于GCCG之前；位于AAAT之前。垂直放置的虚线将荧光计数据和Xpandomer的相应亚基(以图表显示)分开。直接在图下面的解释算法显示了如何将有规律地间隔的模拟信号转换成可读的遗传序列。

对图5中所示的Xprobe底物构建体作了进一步详述，该底物构建体使用由三个报道子标记的片段组成的多元件连接臂构建体来编码底物的序列编号，每个报道子标记片段的侧面是间隔子连接臂片段。第一个连接臂片段是报道密码#1(从左向右阅读)，并且在红色通道中作为高信号被阅读。第二个连接臂片段是报道密码#9，并且作为高的绿色信号和低的红色信号被阅读。第三个连接臂片段是报道密码#8，并且作为低的蓝色信号和低的红色信号被阅读。用报道密码#1作为计时器或同步信号；报道密码#9编码探针的第一部分“AC”；报道密码#8编码探针的第二部分“TG”。总之，连续的报道密码“1-9-8”对应于Xprobe的具体种类(Xprobe ID117)，该具体种类通过设计依次对应于序列片段“ACTG”。3个Xprobe ID编码图中所示的整个连续序列，“ACTGGCCGAAAT”。将荧光团发射、解码报道密码和序列片段的表以及报道构建体的相应物理表示，依照Xpandomer的结构亚基，用图中的虚线分开，从而可以容易地看出序列信息是如何被解码和数字化的。

图6是来自于制备图5实例的荧光团标签的表格。这阐明了更广泛地使用多态报道密码的组合来解析以可探测信号形式存在的信息。具有22种可能的发射态的荧光团用于形成本实例的报道构建体。每个寡聚体的3个荧光团标签足以编码A、T、C和G所有可能的4mer组合。通过增加连接臂的长度，将提高荧光团标签发射间的分辨率，从而有利于检测步骤的精确性，这是一般适用的原则。

可与这种类型连接臂构建体一起使用的报道子有多种类型，不仅仅是荧光团，并可以通过相应的各种高通量和精确检测技术来测定，由于分辨率有限，该技术可能对测定天然核酸的序列不是那么有用。Xpandomer更多的可测定特性促进了本领域检测方法的大规模并行状态，例如纳米孔感受器阵列。可以通过预纯化成批的Xpandomer来去除不完整的或短的反应产物，降低测序检测过程的低效率。提供了末端修饰合成的Xpandomer的方法，其可以用于纯化并且作为促进Xpandomer呈现于检测器的方法。此外，阅读过程不受加帽、脱帽、核苷酸延伸、标记或其他并行处理方法的局限的限制。

图7A描述了局部的双链体模板，该模板设计为带有20个碱基的5’端突出端来展示在自由溶液中底物的持续性连接和引物引发的模板指导的连接。图7B是用图7A中所述的引物模板形式，表明底物连接的凝胶照片。对这个实例而言，在引物和T4 DNA连接酶的存在下，将5’磷酸CA3’序列的二核苷酸寡聚底物杂交于模板上。然后将未双链体化的末端突出端(如果有的话)进行核酸酶消化，并且在20％丙烯酰胺凝胶上分离连接产物。该连接产生显然含有连接亚基的产物多聚体。如带型所示，含有长度依次递增的模板(分别是4、8、12、16和20个碱基)的连接阳性反应在泳道1、3、5、7和9跑出，显然证明了2mer底物是依次连接的(核酸外切酶保护的双链体的长度增加)。泳道2、4、6、8和10是不含连接酶的阴性对照，并且显示了未连接的产物完全被核酸外切酶消化。

图7C是显示底物的模板指导连接的第二块凝胶。鉴定与延伸引物再次双链体化的四个长度依次递增的阳性对照模板(分别是4、8、12和16个模板碱基)。再次在引物和T4DNA连接酶的存在下，使5’磷酸CA3’序列的二核苷酸寡聚底物杂交于模板上。然后将未双链体化的末端突出端(如果有的话)进行核酸酶消化并且在20％丙烯酰胺凝胶上被分离连接产物。可以看出在泳道1、2、3和4而不是泳道5和6，寡聚底物(也是2mers)连接到模板上，其中模板链含有5’(磷酸)CA3’二核苷酸的错配(泳道5的模板-5’CGCG 3’；泳道6的模板-5’GGGG 3’)。

图7D所示的凝胶结果显示了双(氨基修饰的)-四核苷酸探针的多模板指导连接。脂肪族的氨基调节物(modifier)是图26中所示的连接和组成中的。对这个实例而言，在引物和T4DNA连接酶的存在下，将5’(磷酸)C(氨基)A(氨基)CA3’序列的四核苷酸寡聚底物与一系列长度依次递增的互补模板(与延伸的引物双链体化)杂交。然后将未双链体化的末端突出端(如果有的话)进行核酸酶降解，并且在20％丙烯酰胺凝胶上分离连接产物。该连接产生显然含有连接亚基的产物多聚体。泳道1、2代表16mer和20mer大小的对照。泳道3、4、5、6、7、8和9显示了长度依次递增的互补模板(分别是4、6、8、12、16、18和20个模板碱基)的连接产物。对于更长的模板反应(泳道6-9)，可以观察到多个四聚体连接。泳道10显示了由于模板-探针的错配而导致的基本上完全的连接酶抑制(模板-5’CGCG 3’)。

图7E的凝胶结果显示了双(氨基修饰的)-四核苷酸探针的多模板指导连接。脂肪族的氨基调节物是图26中所示的连接和组成中的。对这个实例而言，在引物和T4DNA连接酶的存在下，将5’(磷酸)CA(氨基)C(氨基)A C A 3’序列的六核苷酸寡聚底物与一系列长度依次递增的互补模板(与延伸的引物双链体化)杂交。然后将未双链体化的末端突出端(如果有的话)进行核酸酶降解，并且在20％丙烯酰胺凝胶上分离连接产物。该连接产生显然含有连接亚基的产物多聚体。泳道1、2代表16mer和20mer大小的对照。泳道3、4、5、6、7、8和9显示了长度依次递增的互补模板(分别是4、6、8、12、16、18和20个模板碱基)的连接产物。对于更长的模板反应(5-9泳道)，可以观察到多个四聚体连接。泳道10显示了由于模板-探针的错配而导致的几乎完全的连接酶抑制(模板-5’CGCGCG3’)。

底物既包括探针成员(即作为模板特异性结合成员用于组装Xpandomer中间体的寡聚体)，又包括单体(即作为模板特异性结合元件的个体核碱基成员)。我们称为第一“探针类型”的底物和第二“单体类型”的底物。如图8所示，“探针类型”的Xpandomer具有5个基本亚属(sugenera)，而图9显示了单体类型的Xpandomer的5个基本亚属。图8和9的表格包括3列：第一列描述底物构建体，第二列描述Xpandomer中间体，第三列描述了亚属特性的Xpandomer产物(按行排列)。在此将这些表格作为总结来提供，制作和使用类这些表格的方法将在本文的下文作出更详尽的描述。在图8和图9中，”P”是指探针成员，”T”是指连接臂成员(或环状连接臂或连接臂的臂状物前体)，”N”指单体(个体核碱基或核碱基残基)，”R”指末端基团。

具体而言，在图8的表中使用以下术语：

P是探针底物成员并且由P¹-P²组成，P¹是第一探针部分而P²是第二探针部分；

T是连接臂；

括号表示子链的亚基，其中每个亚基是具有种类特异性探针成员的亚基基序，另外，其中所述亚基基序的探针成员与模板链相应的连续核苷酸序列连续互补，形成Xpandomer中间体的一级主链，该联系核苷酸序列在此表示为P¹’-P²’，其中连接臂成员，任选地与探针部分结合，形成受约束的Xpandomer主链。剪切Xpandomer中间体内的一个或多个选择性可剪切键，能使亚基展开产生Xpandomer产物，Xpandomer产物的亚基也用括号表示；

α表示选自亚基基序文库的亚基基序种类；

ε是连接于探针成员或连接臂的第一末端或部分的第一连接基团；在可控条件下，ε能直接或通过交联剂与相邻亚基邻接末端的连接基团δ选择性反应，形成共价连接或等同坚固的连接；

δ是连接于探针成员或连接臂的第一末端或部分的第二连接基团；在可控条件下，δ能直接或通过交联剂与相邻亚基邻接末端的连接基团ε选择性反应，形成共价连接或等同坚固的连接；

χ表示与相邻亚基的键，并且是连接基团δ和ε反应的产物连接；

～表示选择性可剪切键，当出现多个选择性可剪切键时，它可以是相同的或不同的；

R¹包括但不限于，羟基、氢、三磷酸盐、单磷酸盐、酯、醚、乙二醇、胺、酰胺和硫酯；

R²包括但不限于，羟基、氢、三磷酸盐、单磷酸盐、酯、醚、乙二醇、胺、酰胺和硫酯；以及

κ表示m个亚基的链中的第κ个亚基，其中κ＝1、2、...至m，其中m＞3，一般m＞20，优选m＞50，更优选m＞1000。

具体来说，在图9的表中，使用了以下术语：

N是核碱基残基；

T是连接臂；

括号表示子链的亚基，其中，每个亚基是具有种类特异性核碱基残基的亚基基序，此外，其中所述亚基基序的核苷酸残基与模板链的相应连续核苷酸序列连续互补，形成Xpandomer中间体的一级主链，该联系核苷酸序列在此表示为N’，其中连接臂成员，任选地与核碱基残基结合，形成受约束的Xpandomer主链。剪切Xpandomer中间体内的一个或多个选择性可剪切键，能使亚基展开产生Xpandomer产物，Xpandomer产物的亚基也用括号表示；

n¹是核碱基残基的第一部分；

n²是核碱基残基的第二部分；

ε是连接于探针成员或连接臂的第一末端或部分的第一连接基团；在可控条件下，ε能直接或通过交联剂与相邻亚基邻接末端的连接基团δ选择性反应，产生共价连接或等同坚固的连接；

δ是连接于探针成员或连接臂的第一末端或部分的第二连接基团；在可控条件下，δ能直接或通过交联剂与相邻亚基的邻接末端的连接基团ε选择性反应，产生共价连接或等同坚固的连接；

χ与相邻亚基的键并且是连接基团δ和ε反应的产物连接；

χ¹表示连接基团δ₁和ε₁反应的产物连接；

χ²表示连接基团δ₂和ε₂反应的产物连接；

R²包括但不限于，羟基、氢、三磷酸盐、单磷酸盐、酯、醚、乙二醇、胺、酰胺和硫酯；

κ表示m个亚基的链中的第κ个亚基，这里κ＝1、2，...至m，其中m＞10，一般m＞50，通常m＞500或＞5000。

寡聚构建体

基于用于模板指导组装的底物(寡聚的或单体的)，Xpandomer前体和构建体可以分为两种。基于寡聚体底物的Xpandomer的结构、前体和合成方法将在下面讨论。

底物构建体是Xpandomer的反应物前体，并且通常具有连接臂成员和底物。在此讨论的底物是一个寡聚体底物或探针，通常由多个核碱基残基组成。通过产生每个探针二至二十个核碱基残基的组合型文库，一般每个探针2-10个以及通常2、3、4、5或6个核碱基残基，产生在Xpandomer前体的合成中作为反应物的探针文库。

探针通常在下文描述为具有两个探针部分即P¹和P²。这些探针部分在图中通常被描述为二核苷酸，但是一般而言P¹和P²各自具有至少一个核碱基残基。在带有两个核碱基残基的探针的实例中，探针部分P¹和P²是单核碱基残基。每个探针部分的核碱基残基的个数可以适当选择来用于Xpandomer合成方法，而P¹和P²的核碱基残基的个数可以是不相等的。

为了获得用ε和δ连接基团来产生亚基间连接的底物构建体，商业上可获得的各种化学物质(Pierce，Thermo Fisher Scientific，USA)可适用于本目的。常见的可用于连接化学物质包括，例如，带胺的NHS-酯、带巯基的马来酰亚胺、带胺的亚氨酸酯、用于与胺反应的带羧基的EDC、带巯基的二硫吡啶等。其他实施方案包括使用如酰肼(HZ)和4-甲酰苯甲酸酯(4FB)的功能基团，随后可使所述功能基团进一步反应而形成连接。具体来说，各种交联剂(异或同双功能的)广泛使用(Pierce)，其包括但不限于，Sulfo-SMCC(硫代琥珀酰亚胺4-[N-马来酰亚胺甲基]环己胺-1-羧酸盐)、SIA(N-琥珀酰亚胺碘醋酸)、Sulfo-EMCS([N-e-马来酰亚胺癸酰基]硫代琥珀酰亚胺酯)、Sulfo-GMBS(N-[g-马来酰亚胺丁酰基]硫代琥珀酰亚胺酯)、AMAS N-(a-马来酰亚胺乙酰基)琥珀酰亚胺酯)、BMPS(N EMCA(N-e-马来酰亚胺己酸)-[β-马来酰亚胺丙酰基]琥珀酰亚胺酯)、EDC(1-乙基-3-[3-二甲基氨丙基]碳酰二亚胺盐酸盐)、SANPAH(N-琥珀酰亚胺-6-[4’-叠氮基-2′-硝基苯氨基]己酸)、SADP(N-琥珀酰亚胺(4-叠氮苯)-1，3′-二硫代丙酸酯)、PMPI(N-[p-琥珀酰亚胺苯]异氰酸盐)、BMPH(N-[β-马来酰亚胺丙酸]酰肼，三氟乙酸盐)酸酯)、EMCH([N-e-马来酰亚胺己酸]酰肼，三氟乙酸盐)、SANH(琥珀酰亚胺4-烟酰肼丙酮腙)、SHTH(琥珀酰亚胺4-邻苯二甲酸肼盐酸盐)，以及C6-SFB(C6-琥珀酰亚胺4-甲酸基苯甲酸酯)。Letsinger等(“Phosphorothioate oligonucleotides having modifiedinternucleoside linkages(具有修饰的核苷间连接的硫代磷酸酯寡核苷酸)”，美国专利第6,242,589号)公开的方法也可适用于形成硫羟磷酸酯键。

此外，广为接受的保护/去保护的化学物质可以广泛地用于常见的连接部分(Benoiton，“Chemistry of Peptide Synthesis(肽合成化学)”，CRCPress，2005)。氨基保护剂包括但不限于，9-氨基甲酸芴甲酯(Fmoc-NRR′)、t-丁基氨基甲酸盐(Boc-NRR′)、苯甲基氨基甲酸盐(Z-NRR′，Cbz-NRR′)、三氟乙酰胺、酞亚胺、苄胺(Bn-NRR′)、三苯基甲胺(Tr-NRR′)和苯亚甲基胺p-甲苯磺胺(Ts-NRR′)。羧基保护剂包括但不限于，甲酯、t-丁酯、苯甲酯、S-t-丁酯和2-烷基-1，3-唑啉。羰基保护剂包括但不限于，二甲基乙缩醛1，3-二氧杂环乙烷和1，3-二噻烷N，N-二甲基腙。羟基的保护剂包括但不限于，甲氧甲基醚(MOM-OR)、吡喃醚(THP-OR)、t-丁基醚、烯丙醚、苯甲基醚(Bn-OR)、t-丁基二甲基甲硅烷基醚(TBDMS-OR)、t-丁基二苯基甲硅烷基醚(TBDPS-OR)、醋酸酯、新戊酸酯，以及苯甲酸酯。

虽然连接臂通常被描述为带三个报道基团的报道构建体，但是各种报道子构型都可以排列于连接臂上，并且可以包含识别探针组分的单个报道子，识别探针种类的单个报道子，识别探针种类的分子条形码，或者连接臂可以是裸露的多聚体(没有报道子)。在裸露的多聚体的情况下，报道子可以本身就是探针，或可以是连接于探针的第二连接臂。在一些情况下，将一个或多个报道子前体排列于连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

如上面所讨论的，图8提供了本发明寡聚构建体的概述，五个类型被清楚地区分开：I、II、III、IV和V型。这些类型均可用于Xprobe和Xmer。每种类型都将在下文单独进行讨论。

I型寡聚构建体

参见图10，更详尽地描述了I型寡聚构建体。图10A-10B使用了适合显示作为底物和SBX方法的异共聚物产物的分子的符号。从左向右看图，先显示了探针底物构建体(Xpandomer的寡聚前体)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图10A所示，I型底物构建体具有寡聚探针成员(-P¹～P²-)(100)和连接臂成员T(99)。连接臂通过两个末端连接(108，109)连接于探针部分P¹和P²上。这些限制阻止了连接臂延伸或展开并因此使其处于受约束的构型中。在模板指导的组装中，底物与靶模板双链体化从而使底物邻接。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，将在连接方法中使用，而R¹＝5’-三磷酸盐和R²＝3’-OH用于聚合酶方法。任选地，R²可以设置为带有可逆的封闭基团，用于单底物的循环添加。可选性地，R¹和R²可以设置为带有末端连接基团，用于化学耦合，或不带有连接基团而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

图10A和10B的代字号(～)表示分离探针成员两个部分的选择性可剪切键。连接臂的末端连接是连接于由选择性可剪切键分开的探针成员的两个部分上的。连接臂将第一探针部分连接到第二探针部分，形成桥接选择性可剪切键的环。当探针成员完整(未剪切的)时，探针成员可以高保真地结合于模板序列，并且连接臂以“受约束的构型”成环。当该键被剪切时，连接臂环会打开而连接臂成“展开的构型”。

底物构建体是用于子链的模板依赖性组装的反应物，所述子链即是用于产生Xpandomer的中间体成分。图10B显示了双链体子链，其为带有重复亚基的异共聚物，(如括号中所示)。作为双链体(95)，显示了子链一级主链(-P¹～P²-)和靶模板链(-P¹’-P²’-)。子链的每个亚基是由探针成员和连接臂成员T(99)构成的重复基序，连接臂成员处于受约束的构型中。基序具有种类特异的可变性，在此用“α”上标表示。子链中的每个具体亚基是通过模板指导方法选自基序文库，并且它的探针结合于模板链上互补核苷酸的相应序列。因此，探针核碱基残基的序列形成了靶模板链的连续的互补拷贝。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，Xpandomer前体进一步由“受约束的构型”的连接臂构成。当连接臂(99)转变为其“展开的构型”时，受约束的Xpandomer就转变为Xpandomer产物。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的探针底物构成。“受约束的Xpandomer主链”绕过探针部分P¹和P²之间的选择性可剪切连接，并且由连接的主链部分形成，每个主链部分作为P¹与连接臂与P²的线性连接，而其中P²可以进一步连接到下一个主链部分的P¹。可以看出，受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接或环接，并且当这些选择性可剪切键受到剪切和一级主链片段化时，仍然保持共价完整。

图10C表示在模板链解离之后和在一级主链选择性可剪切键剪切之后产生的I型Xpandomer产物。模板链解离的方法包括热变性，或核酸酶的选择性消化，或化学降解。Xpandomer产物链含有多个亚基κ，其中κ表示在构成子链的m个亚基的链中的第κ个亚基，其中κ＝1、2、3至m，其中m＞3，一般m＞20，优选m＞50，更优选m＞1000。每个亚基由连接臂(99)和探针部分P¹和P²形成。可以看出，目前处于“展开的构型”的连接臂成员T，在剪切的探针部分P¹和P²之间伸展至其长度，而探针部分P¹和P²仍然共价连接于相邻的亚基。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图10D显示了作为分子模型图10A的底物构建体，其中探针成员(100)以四个核碱基(101、102、103、104)任意地表示，其中的两个(102、103)通过末端连接(108、109)结合于连接臂(99)。在连接臂的两个末端连接之间是选择性可剪切键，在探针成员(100)中表示为“V”(110)。该键连接图10A中标引的探针部分P¹和P²。在此所示的连接臂环具有三个报道子(105、106、107)，其也可以是基序种类特异性的。

图10E显示了底物中的选择性可剪切键剪切之后产生的产物Xpandomer。剪切导致受约束的Xpandomer的展开，并用”E”表示(黑箭头)。选择性可剪切键的残基(110a、110b)标记了剪切事件。用垂直地将重复亚基括在一起的虚线来表示亚基，如附图10C中用括号表示一样。在Xpandomer产物(图10E)中，一级主链目前已片段化，并且不是共价完整的，因为探针成员已受到剪切从而使每个P¹(92)和P²(94)分离。通过该剪切过程，受约束的Xpandomer得以释放而成为Xpandomer产物。Xpandomer包括序列上的每个连接的亚基。在每个亚基内连接的是探针部分P¹、连接臂和探针部分P²。Xpandomer的连接臂成员(99)，原来是受约束的构型，现在是展开的构型，因此可以行使功能来线性化伸展模板靶标的序列信息。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并且为提高报道子的大小和丰度提供了平台，这依次改善用于模板序列检测和解码的信噪比。

图11描述了用于产生I型Xpandomer实施方案方法的浓缩示意图；该方法阐明了图10D和10E所示的底物和产物的制备和使用。该方法可以在自由溶液中使用并且使用连接酶(L)共价耦合邻接的Xprobe来描述。释放模板中的二级结构的方法将在随后的章节中进行论述。适于杂交和连接的条件在本领域中是众所周知的，并且易于为本领域普通技术人员优化。

连接酶包括但不限于，包括tRNA连接酶在内的NAD⁺-依赖性连接酶、Taq DNA连接酶、丝状栖热菌DNA连接酶、大肠杆菌DNA连接酶、Tth DNA连接酶、水管致黑栖热菌DNA连接酶、热稳定连接酶、Ampligase热稳定DNA连接酶、VanC-型连接酶、9°N DNA连接酶、Tsp DNA连接酶，以及用生物勘测方法发现的新的连接酶。连接酶还包括但不限于，ATP依赖性连接酶包括T4RNA连接酶在内、T4DNA连接酶、T7DNA连接酶、Pfu DNA连接酶、DNA连接酶I、DNA连接酶III、DNA连接酶IV，以及用生物勘测方法发现的新的连接酶。这些连接酶包括野生型、突变同工型和基因工程变体。

参见图11，在合成的准备过程中提供了靶核酸(110)，并且在衔接子钝末端连接的准备过程中使末端平滑化。步骤I显示了发夹结构引物(120)与靶核酸的连接。引物的游离5’末端用可去除的封闭基团(119)封闭。引物将会引发靶核酸的两条链。通常过量添加衔接子。在步骤II中去除引物的高电位端(hot end)上的封闭基团，且模板双链通过变性而分离。在步骤III中，如步骤IV所示，在允许与互补性探针底物(113)杂交以及在引物反应末端连接的条件下，将引发的单链模板(111)与底物构建体文库接触(通过构建体(112)表示，出于示例目的)，并且与连接酶L接触。通常，在比底物熔解温度高的温度下进行杂交和连接，以减少非特异性副反应。本实例中每个底物构建体含有排列有三个报道子的连接臂。每个探针底物在两个连接臂的连接位点之间具有选择性可剪切键(用”V”表示)。在步骤V中，通过模板指导杂交和连接添加第二个底物构建体，依次类推。在步骤VI中，示范了充分展开的Xpandomer中间体(117)的形成。该中间体可以由模板链变性，并且可以在所示的剪切位点进行选择性剪切，从而形成适于测序的产物Xpandomer。在一些实施方案中，并不需要变性，并且模板链可以进行适当的降解。

图12是第二种方法的浓缩示意图，在此用于产生I型Xpandomer的另一个实施方案。在合成的准备过程中，提供了靶核酸(120)，并且在衔接子(121、122)钝末端连接的制备过程中使末端平滑化。步骤I显示了两端封闭的发夹结构引物前体与靶核酸的连接。发夹引物双链体的一端用可去除的封闭基团(125a、125b、125c、125d)封闭，所述封闭基团使用来阻止模板链或衔接子的连接和串联。通常过量添加衔接子。在步骤II中去除封闭基团，且模板双链通过变性而分离。在步骤III中，发夹引物自身退火，形成引发位点(126、127)用于随后的底物构建体的连接，自身退火可以双向进行，例如，从3‘到5’和从5’到3’方向进行。在在步骤IV中，在允许与互补性探针底物杂交以及连接的条件下，将引发的模板与底物构建体文库(128)接触。通过互补性探针底物的杂交以及在新生子链的末端连接，使连接递增地进行(即，以明显的持续能力延伸增长的末端)。本例中每个底物构建体包括排列有报道子组的连接臂环。在步骤V中，描述了完整的Xpandomer中间体(129)的形成。任选地模板链可以通过核酸酶消化而去除，从而释放Xpandomer。中间体可以在所示的剪切位点被选择性剪切，从而形成适于测序的产物Xpandomer。产物Xpandomer在自由溶液中形成。

在图13中，显示了依赖于固定的模板链的方法。在此模板链通过衔接子(131)锚定于珠子(或其他固相支持体)上。模板显示与底物构建体(132)接触，并且在步骤I中，可以调整条件来促进杂交发生。可以看出，形成了相邻接的杂交底物构建体“岛”。在步骤II中，连接酶L的添加导致了相邻底物构建体的连接，从而形成多个被缺口分隔开的连接中间体的连续序列。在步骤III中，调整条件来促进低分子量或错配的杂交物质的解离，并且在步骤IV中，重复步骤II到步骤III的反应一次或多次，来促进更长的延伸产物的形成。这种无引物方法称为“混合连接”。连接可以双向延伸，并且带缺口的结合处可以用连接酶封闭，从而填充缺口。在步骤V中，在对所需的产物长度进行优化后，漂洗固定的双链体，去除未反应的底物和连接酶。然后，在步骤VI中，将子链(在此作为单链Xpandomer中间体显示)(138、139)从模板上解离下来。中间体的选择性可剪切键的选择性剪切导致Xpandomer产物的形成(未显示)。在本实施方案中，固定的模板可以重复使用。一旦对Xpandomer产物进行测序，就可以通过众所周知的搭接和比对数据的算法组装重叠群(contigs)，构建共有序列。

参见图14，显示了使用固定的引物的方法。在步骤I中，将末端适合的(或随机模板序列，依赖于固定的引物的性质)模板(142)，与固定的引物(140)退火。在步骤II中，将固定的模板(143)与底物构建体文库接触，文库的成员如(144)所示，并且调整条件，进行模板指导杂交。在本实例中，探针成员(R基团)的底物构建体3’OH末端被取代(146)，从而可逆性地阻断进一步延伸。在步骤III中，连接相邻的底物构建体和引物的连接末端，或新生子链的自由末端，并通过去除封闭R基团(146)激活新生子链的3’OH末端。如步骤IV和V所示，逐步的循环添加过程可以重复多次。通常，使用漂洗步骤去除在每个延伸步骤间未反应的底物。

因此该过程与称为“循环单碱基延伸”的过程类似，但应更恰当地称为“循环单探针延伸”。尽管展示了连接酶L，但该过程可以使用连接酶、聚合酶，或适合在模板指导合成中用于连接寡聚体的任何化学耦合方法来完成。化学耦合可以在杂交探针的相邻末端自发发生，或者可以在循环中的步骤III和各自随后进行的步骤V的开始时添加冷凝剂。设置末端封闭R基团从而使自由进行的连续聚合反应不会在模板上或溶液中发生。步骤VI显示了完整的Xpandomer中间体(149)的形成；不再添加底物。该中间体可以从模板上解离下来，然后如前所述，剪切单链产物，从而展开主链。

这种方法可以适用于核酸混合物中具体靶标的选择性测序，以及适用于测序阵列中解析的测序方法，例如，通过非随机选择的固定的引物。可选地，可以使用所示的通用引物或随机引物。

图15描述了用于在固定的模板(150)上进行混合杂交的方法(步骤I)，其中文库(152)的底物构建体用与相邻的探针选择性反应的化学功能基团(156)修饰，该基团用空心三角形表示。底物构建体的化学功能基团的细节显示于阴影线圆圈所示的放大部分中(图15a)。在一定密度的杂交中，如步骤II所示开始耦合，从而产生交联产物(157)连接的高分子量的Xpandomer中间体，交联产物用实心三角形表示。在步骤II的产物中，交联探针的细节显示于阴影线圆圈所示的放大部分中(图15b)。这个过程可以伴随着低分子量产物和任何可能的错配产物的选择性解离和去除的步骤。可用于该混合化学耦合方法的耦合化学是本领域技术人员所知的，例如Burgin等的美国专利第6,951,720号中所公开的技术。

在另一个实施方案中，公开了用于组装产物Xpandomer的基于聚合酶的方法。通常，底物三磷酸(Xmer)是用于涉及聚合酶的反应的适合底物。选择适合的聚合酶是优化实验方法的过程的一部分。如图16中所示的，用于示例而非用于限定，在优化的模板指导聚合反应的条件下，将含有模板(160)和引物(161)的反应混合物与底物构建体文库(162)和聚合酶(P)接触。在步骤I中，聚合酶开始使二核苷酸Xmer(带两个报道子的连接臂)持续地添加到模板链上。在步骤II和III中继续进行这个过程。所添加每个探针亚基是特定的种类，该特定的种类是通过特异性结合于模板的下一个相邻的寡聚体来形成模板的连续互补拷贝而选择的。尽管不受理论限制，但认为聚合酶可以帮助确保添加到新生链中的引入的探针种类与模板的下一个可用的相邻片段特异性互补。Loeb和Patel描述了活性增强和保真度提高的突变DNA聚合酶(美国专利第6,329,178号)。例如，Williams在美国专利申请2007/0048748中指出，可以修饰聚合酶，用于提高并入速度和减少错误率，显然，错误率与杂交精确性无关而与聚合酶的持续合成能力有关。步骤III产生完整的Xpandomer中间体(168)。然后用包括使模板链变性的方法来处理单链Xpandomer中间体(未展示)。选择性剪切子链的一级主链，使连接臂展开，从而形成如前所述的适合用于测序方法的Xpandomer产物。

如图17所示，聚合酶驱动的Xpandomer的模板指导合成可以通过可替代的方法来完成。在此，处理过的模板链(171)与固定的引物(170)在步骤I中退火。在步骤II中，聚合酶P在反应混合物中与来自此类底物构建体文库(174所述的)的特异性互补底物构建体(175)持续地进行连接。调整条件和反应物溶液来促进持续的聚合酶活性。如在此所示，步骤II的杂交和步骤III的聚合反应是不同的活性，但是聚合酶的活性不需要那样分离。在步骤IV中，连续地循环(连续不中断地)添加递增的互补性底物构建体，导致Xpandomer中间体被充分装载，如由所述步骤IV产生所示。Xpandomer中间体可以分离并展开以准备用于前面所述的测序方法。需要注意，该方法也可以通过选择适宜的固定的引物而有助于已解析的测序方法。另外，伸展模板来减少二级结构的方法，易于用于本方法，并将在后面的部分中进行讨论。

聚合酶包括但不限于，DNA依赖性DNA聚合酶、DNA依赖性RNA聚合酶、RNA依赖性DNA聚合酶、RNA依赖性RNA聚合酶、T7DNA聚合酶、T3DNA聚合酶、T4DNA聚合酶、T7RNA聚合酶、T3RNA聚合酶、SP6RNA聚合酶、DNA聚合酶I、Klenow片段、水生栖热菌DNA聚合酶、Tth DNA聚合酶、

DNA聚合酶(New EnglandBiolabs)、Deep

DNA聚合酶(New England Biolabs)、Bst DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、9°N DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Tth DNA聚合酶、RepliPHI Phi29聚合酶、TliDNA聚合酶、真核DNA聚合酶β、端粒酶、Therminator^TM聚合酶(NewEngland Biolabs)、KOD HiFi^TM DNA聚合酶(Novagen)、KOD1 DNA聚合酶、Q-β复制酶、末端转移酶、AMV反转录酶、M-MLV反转录酶、Phi6反转录酶、HIV-1反转录酶、用生物勘测方法发现的新的聚合酶，以及US 2007/0048748、US 6,329,178、US 6,602,695和US 6,395,524(通过引用并入本发明)中所列举的聚合酶。这些聚合酶包括野生型，突变同工型，和基因工程变体。

II和III型寡聚构建体

参见图18A-18E，更详尽地描述了II型寡聚构建体，它(与同质异构的III型寡聚构建体一起)可以是Xprobe或Xmer。

从左向右看图18A-18C，先显示了探针底物构建体(Xpandomer的寡聚前体)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图18A所示，II型底物构建体具有寡聚探针成员(-P¹-P²-)(180)和连接臂成员T(181)。连接臂通过第一末端部分的单末端连接(184)连接于探针部分P²上。在连接臂的远端(186)，第二末端部分具有连接基团δ并且位于最接近R²的位置。第二末端部分还具有可剪切的连接臂内的交联键(187)来约束它的位置。可剪切的交联键(187)用虚线表示，其可以表示，例如，二硫键。这些约束阻止连接臂延伸或展开，并因此使其处于受约束的构型。第二连接基团ε位于接近R¹的探针成员的远端附近。在模板指导的组装中，底物与靶模板双链体化从而使底物相邻。在可控的条件下，相邻底物的连接基团δ和ε连接，在相邻的底物构建体之间形成χ键(图18B和18C所示)。这些连接基团位于底物构建体上，限制与相邻的邻接底物构建体的连接反应。底物构建体优选不自身接连。合适的连接和用于δ、ε和χ的保护/去保护的化学物质在寡聚构建体的一般性描述中进行了详细说明。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，可在连接方法中使用，而R¹＝5’-三磷酸盐和R²＝3’-OH，可用于聚合酶方法。任选地，R²可以设置成带有可逆性封闭基团，用于单底物的循环添加。可选地，R¹和R²可以设置成带有末端连接基团，用于化学耦合，或设置成不带有连接基团，而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

底物构建体是用于子链的模板依赖性组装的反应物，所述子链即是用于产生Xpandomer的中间体成分。图18B显示了双链体子链，其为带有重复亚基的异共聚物(括号中所示)。所示的是双链体化(185)的子链一级主链(～P¹-P²～)和靶模板链(-P¹’-P²’-)。子链的每个亚基是包含探针成员和连接臂成员T的重复基序。基序有种类特异的可变性，在此用“α”上标表示。子链中每个具体亚基通过模板指导方法从基序文库中选择，它的探针结合于模板上互补核苷酸的相应序列。因此，探针核碱基残基的序列就形成靶模板链的连续的互补拷贝。

每个代字号(～)表示选择性可剪切键。探针成员的P¹和P²部分之间的内键不是选择性可剪切键，但是由于展开连接臂和Xpandomer的需要，探针间的键(亚基之间)必须是选择性可剪切键。在一个实施方案中，非直接键在单独的亚基探针之间形成，从而消除了对随后的选择性剪切的需要。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，Xpandomer前体进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，受约束的Xpandomer就转变为Xpandomer产物。连接臂受χ连接约束，χ连接由与相邻亚基探针成员的搭接以及，任选地，由连接臂内的连接(如果其仍存在的话)形成。χ连接将第一亚基的连接臂成员连接到相邻第二亚基的相邻末端上，并通过连接并列放置的第一亚基的连接基团δ和第二亚基的连接基团ε而形成。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的探针底物构成。“受约束的Xpandomer主链”绕过亚基底物之间的选择性可剪切连接，并且由χ键连接的主链部分形成，每个主链部分是连接臂与P¹、P²的线性连接，每个χ键将P¹连接到下一个主链部分的连接臂。可以看出，受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接或环接，并且当这些选择性可剪切键受到剪切和一级主链片段化时，仍然可以保持共价完整。

在图18B中，δ和ε连接基团已交联并于此时形成亚基间的键χ。在χ键形成后，连接臂内的键可以断裂，虽然在此显示的是完整的(底物中的虚线)。通常，χ键的形成是依赖于第一亚基上的连接基团δ的接近度以及相邻的第二亚基上的连接基团ε的位置，从而使它们并列放置并且在底物构建体的模板指导组装过程中或之后接触。

在其他实施方案中，交联反应只依赖于与模板的杂交，而使两个连接基团聚在一起。在其他实施方案中，探针成员P沿一级主链的酶促耦合先于χ键的连接，伴随相邻探针之间磷酸二酯键的形成。在此所示的结构中，子链一级主链已形成，且底物间的键用代字号(～)表示来说明它们是选择性可剪切的。在解离或降解模板链、剪切选择性可剪切键(其包括连接臂内的键)之后，受约束的Xpandomer得以释放而形成Xpandomer产物。

图18C表示在模板链解离之后和选择性可剪切键(包括那些在一级主链中以及，如果未被剪切，连接臂内的连接)剪切之后产生的II型Xpandomer产物。模板链解离的方法包括热变性，或核酸酶的选择性消化，或化学降解。Xpandomer产物链含有多个亚基κ，其中κ表示构成子链的具有m个亚基的链中的第κ个亚基，其中κ＝1、2、3至m，其中m＞3，一般m＞20，优选m＞50，更优选m＞1000。每个亚基由连接臂和探针部分P¹和P²形成。可以看出，连接臂T(181)处于展开的构型，并在相邻亚基的P²和P¹之间伸展至其长度。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图18D显示了作为分子模型的图18A的底物构建体，其中探针成员(180)以四个核碱基残基(81、82、83、84)表示，通过连接臂(184)的第一末端部分的连接结合于连接臂(181)。第二末端部分的连接臂内的键(85)位于连接臂的远端。连接基团(δ)(86)也排列于第二末端部分上，且相应的第二连接基团(ε)(87)锚定于与连接基团(δ)相反的探针末端上。在此所示的连接臂环有三个报道子(78、79、80)，这些报道子也可以是基序种类特异性的。

图18E显示了并入产物Xpandomer之后的底物构建体。亚基被剪切和展开并且被χ键(88)连接起来，χ健由图22A所示的连接基团δ和ε连接形成。用垂直地将重复亚基括在一起的虚线表示亚基，如附图18C中用括号表示一样。”E”再次表示展开。

在Xpandomer产物中(图18E)，一级主链已经片段化，并且不是共价连接的，这是因为相邻亚基的探针之间的任何直接键都已受到剪切。通过该剪切过程，受约束的Xpandomer得以释放成为Xpandomer产物。原来是受约束的构型的连接臂成员，现在是展开的构型，因此可以发挥线性展开模板靶标的序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并且为提高报道子的大小和丰度提供了平台，这依次改善用于模板序列检测和解码的信噪比。

虽然通常将连接臂描述为带有三个报道基团的报道构建体，但是各种报道子构型可以排列于连接臂上，并且可以包含识别探针组分的单个报道子，识别探针种类的单个报道子，识别探针种类的分子条形码，或者连接臂可以是裸露的多聚体。在一些情况下，将一个或多个报道子前体排列于连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

在图19A-19E中所展示的III型寡聚构建体，是上面所讨论的II型构建体的异构体。不再进行进一步的描述是因为对II型的描述已经足够用来理解这一类型。

该类型可以用于强调所有的类型都可以反射成镜像应用(即交换R¹和R²基团)。此外，这一类型用于说明虽然所描述的类型不是完整的，而是反映本发明包含的多种可能排列中的一些。

图20描述了用于产生II型Xpandomer的第一实施方案的方法的浓缩示意图；该方法阐明了图18D-18E所示的底物和产物的制备和使用。该方法可以用固相化学物质进行。释放模板的二级结构的方法在随后的章节中会进行谈论。适合杂交和化学耦合的条件在本领域中是众所周知的，并且易于为本领域技术人员优化。

图20的步骤I显示了含有固定的模板(200)和底物反应物(201)文库的反应混合物。可以看出，在模板指导杂交反应中，底物构建体特异性结合模板。调整条件来优化结合的互补性和保真度。如插图所示(见图20a)，每个相邻底物构建体将在连接臂远端的功能基团δ(202)拉近，在此显示为通过连接臂内的交联键(203)和相邻探针成员的功能基团ε(204)结合于连接臂主干上，连接臂内的交联键用邻接的三角形表示。

在步骤II中，在杂交的探针成员的接近的紧邻末端之间发生交联反应，该探针成员包括两个功能基团δ和ε，从而形成亚基间连接臂与探针的键χ(205)，如插图所示(见图20b)，键χ用空心的椭圆表示。在模板的多个不同的位点可以并行发生混合杂交，并且在杂交(步骤III)、严格熔解(stringent melt)和/或漂洗(步骤IV)，以及化学耦合(步骤V)的循环中，可以发生化学耦合。该循环可以重复进行，以增加形成Xpandomer中间体所组装的相邻亚基的数量。步骤VI显示了带两条不同长度的相邻产物链的完整的Xpandomer中间体。相似的方法可以用于III型Xpandomer。

图21描述了II型底物在固定的模板上持续连接的方法。步骤I显示了与模板(212)退火的引物(210)，该引物适合如插图(214)所示(见图21a)的化学反应功能基团ε。然后在步骤II中添加含有II型底物(216)的反应混合物。如插图(图21a)所示，这些底物构建体在探针-连接臂成员的相反末端具有δ(217)和ε(214)反应性。可以看出第一底物构建体在模板指导杂交中特异性与模板结合。调整条件，以优化结合的互补性和保真度。然后用连接酶将第一探针共价与引物结合(步骤II)。

在步骤III和IV，继续进行底物构建体的持续性杂交和连接，以便构建如步骤IV形成的Xpandomer中间体。然后，在步骤V中，在δ(217)和ε(214)基团(见图21b)之间进行交联，从而产生图21c标示为(219)的χ键。如插图(图21b和21c)所示，在连接臂上的功能基团δ(217)受连接臂内的交联键(211)约束，直至形成χ键，连接臂内的交联键用邻接的三角形表示。任选地，完整的Xpandomer中间体从模板上解离下来，并且被剪切形成适合于测序的Xpandomer产物。相似的方法可以用于III型Xpandomer。这个方法也可以通过替代三磷酸底物构建体适合于与聚合酶一起使用。

IV与V型寡聚构建体

见于图22A-22E，更详尽地描述了IV型寡聚构建体。

从左向右看图22A-22C，先显示了探针底物构建体(Xpandomer的Xprobe或Xmer前体)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图22A所示，IV型底物构建体具有带连接于连接臂T(220)的探针部分P¹和P²的寡聚探针成员(229)。连接臂T通过分别与连接臂的第一和第二末端部分适当的连接而连接于P¹和P²。第一末端部分的连接基团ε与第二末端部分的连接基团δ分别位于探针的R¹和R²末端附近(在可选的实施方案中，功能基团的位置可以颠倒)。在可控的条件下，功能基团δ(222)和ε(221)会发生反应，形成如图22B所示的连接χ。这些连接基团位于底物构建体上，将这些连接反应限制于相邻的邻接底物构建体。底物构建体优选不与自身接连。合适的连接和用于δ、ε和χ的保护/去保护的化学物质在寡聚构建体的一般性描述中进行了详细说明。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，被发现在连接方法中使用，而R¹＝5’-三磷酸盐和R²＝3’-OH用于聚合酶方法。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选地，R¹和R²可以设置成带末端连接基团，而用于化学耦合，或设置成不带有连接基团，而用于仅含杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

底物构建体是用于子链的模板指导组装的反应物，所述子链即是用于产生Xpandomer的中间体成分。图22B显示了双链体子链，为带有重复亚基的异共聚物(括号中所示)。所示的是作为双链体(228)的子链一级主链(-P¹～P²-)和靶模板链(-P¹’-P²’-)。子链的每个亚基是包含探针成员和连接臂成员T的重复基序。基序有种类特异的可变性，在此用“α”上标表示。子链中每个具体的亚基通过模板指导方法从基序文库中选择，它的探针结合于模板链上互补核苷酸的相应序列。因此，探针核碱基残基的序列就形成靶模板链的连续的互补拷贝。

代字号(～)表示选择性可剪切键。由于展开连接臂和Xpandomer的需要，探针成员的P¹和P²部分之间的内键必须是选择性可剪切的。在一个实施方案中，在单独的亚基探针之间形成非直接键。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，Xpandomer前体进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，如图22C所示，受约束的Xpandomer就转变为Xpandomer产物。连接臂受χ连接约束，χ连接通过与相邻亚基的探针成员的桥接以及通过探针连接而形成。χ连接将第一亚基的连接臂成员连接到相邻第二亚基的连接臂上，并通过连接并列放置的第一亚基的连接基团δ和第二亚基的连接基团ε而形成。

可以看出，子链具有两种主链，即“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的探针底物构成。“受约束的Xpandomer主链”是每个亚基上的连接臂的线性连接，该连接臂由绕过亚基探针底物的χ连接而连接在一起。χ连接由第一亚基的功能基团ε和相邻的第二亚基的功能基团δ的反应而形成。可以看出，受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接或环接，并且当这些选择性可剪切键受到剪切和一级主链片段化时，仍然可以保持共价完整。

在图22B中，δ和ε连接基团已交联并形成亚基间的键χ。通常，χ键的形成依赖于第一亚基上的连接基团δ和相邻的第二亚基上的连接基团ε的并列放置，从而使它们在底物构建体的模板指导组装过程中或之后接触。

在其他的实施方案中，χ键的交联反应仅依赖于与模板的杂交，该杂交使两个连接基团相聚在一起。在其他实施方案中，探针成员P沿着一级主链的酶促耦合先于χ键的形成，伴随相邻探针之间的磷酸二酯键。在图22B所示的结构中，子链的一级主链已形成，探针部分之间的键用代字号(～)表示来说明它们是选择性可剪切的。在解离或降解靶模板链，剪切选择性可剪切键之后，受约束的Xpandomer得以释放而形成Xpandomer产物，如图22C所示。

基于这点，图22C表示在模板链解离之后和一级主链的选择性可剪切键剪切之后产生的IV型Xpandomer产物。模板链解离的方法包括热变性，或核酸酶的选择性消化，或化学降解。Xpandomer产物链含有多个亚基κ，其中κ表示构成子链的具有m个亚基的链中的第κ个亚基，其中m＞3，一般m＞20，优选m＞50，更优选m＞1000。每个亚基由连接臂(220)和配对的探针部分P¹和P²形成。可以看出，连接臂T，处于展开的构型，并且伸展至其在相邻亚基之间的长度。每个亚基即亚基基序α，都含有种类特异性的遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图22D显示了作为分子模型图22A的底物构建体，其中以四个核碱基残基(空心圆)表示探针成员，通过连接臂的第一末端部分的连接结合于连接臂上。如图22A所示的连接基团ε(222)也位于连接臂(220)的第一末端部分上。如图22A所示的连接基团ε(221)位于连接臂远端的第二末端部分上。在此所示的连接臂环有三个报道子(800，801，802)，这些报道子也可以是基序种类特异性的。用”V”(225)表示的选择性可剪切键，位于探针成员(229)内。

图22E显示了并入产物Xpandomer之后的底物构建体。剪切亚基，如线(225a，225b)所示，展开并通过χ键(223，224)连接，χ键由图22A所示的连接基团δ和ε连接形成。用垂直地将重复亚基括在一起的虚线表示亚基，如附图22C中用括号表示一样。

在图22E的Xpandomer产物中，一级主链已经片段化，并且不是共价相邻的，因为相邻亚基的探针之间的任何直接键都已受到剪切。通过该剪切过程，受约束的Xpandomer得以释放成为Xpandomer产物。原来是受约束的构型的连接臂成员，现在是展开的构型，因此可以发挥线性化伸展模板靶标的序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并且为提高报道子的大小和丰度提供了平台，这依次改善用于模板序列检测和解码的信噪比。

虽然连接臂通常被描述为带三个报道基团的报道构建体，但是各种报道子构型可以排列于连接臂上，并且可以包含识别探针组分的单个报道子，识别探针种类的单个报道子，识别探针种类的分子条形码，或者连接臂可以是裸露的多聚体。在一些情况下，将一个或多个报道子前体排列于连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

V型底物构建体与IV底物构建体相似，主要的不同在于可剪切的连接子的位置。从左向右看图23A-23C，先显示了探针底物构建体(Xpandomer的Xprobe或Xmer前体)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

图23A描述了V型底物具有用两个选择性可剪切末端连接(234，238)(用两个垂直的”～”表示)连接的连接臂(239)的第一和第二末端部分。然后这些可剪切连接连接到寡聚探针成员(235)的第一和第二探针部分，即P¹和P²。所述第一和第二末端部分的连接基团δ(230)和ε(231)位于探针的R¹和R²末端附近(同样，这些功能基团的位置是可以颠倒的)。在可控的条件下，功能基团δ和ε发生反应，形成连接χ。这些连接基团位于底物构建体上，将这些连接反应限制于相邻的邻接底物构建体。底物构建体优选不与自身接连。合适的连接和用于δ、ε和χ的保护/去保护的化学物质在寡聚构建体的一般性描述中进行了详细说明。

R¹和R²是为适用于使用底物构建体合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，可用于在Xprobe中发现的连接方法之中，而R¹＝5’-三磷酸盐和R²＝3’-OH，可用于在Xmer中发现的聚合酶方法中。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选地，R¹和R²可以设置成带有末端连接基团，而用于化学耦合，或设置成不带有连接基团，而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

底物构建体是用于子链的模板指导组装的反应物，所述子链即是用于产生Xpandomer的中间体成分。图23B显示了双链体子链，即带有重复亚基的异共聚物(括号中所示)。所示的是作为双链体(236)的子链的一级主链(-P¹-P²-)和靶模板链(-P¹’-P²’-)。子链的每个亚基是包含探针成员和连接臂成员的重复基序。基序有种类特异的可变性，在此用α上标表示。子链中每个具体的亚基通过模板指导方法从基序文库中选择，它的探针结合于模板链上互补核苷酸的相应序列。因此，探针核碱基残基的序列就形成靶模板链的连续的互补拷贝。

代字号(～)表示选择性可剪切键。该键连接探针成员的P¹和P₂部分和连接臂，并且由于展开连接臂和Xpandomer的需要，其必须是选择性可剪切的。在一个实施方案中，在单独亚基的探针之间不形成直接键。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，Xpandomer前体进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，如图23C所示，受约束的Xpandomer就转变为Xpandomer产物。连接臂受χ连接约束，χ连接由与相邻亚基探针成员的桥接和选择性可剪切键(234，238)形成。χ连接将第一亚基的连接臂成员连接到相邻第二亚基的连接臂上，并通过连接并列放置的第一亚基的连接基团δ和第二亚基的连接基团ε而形成。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的探针底物构成。“受约束的Xpandomer主链”是每个亚基上的连接臂的线性连接，该连接臂由绕过亚基探针底物的χ连接而连接在一起。χ连接由第一亚基的功能基团ε和相邻的第二亚基的功能基团δ的反应而形成。可以看出，受约束的Xpandomer主链在连接于一级主链的选择性可剪切键之上桥接或环接，并且当这些选择性可剪切键受到剪切和一级主链解离或片段化时，仍然可以保持共价完整。

在图23B中，连接基团δ和ε已交联并形成亚基间的键χ。通常χ键的形成依赖于第一亚基上的连接基团δ和相邻的第二亚基上的连接基团ε的并列放置，从而使它们在底物构建体的模板指导组装过程中或之后接触。

在一些方法中，交联反应只依赖于与模板的杂交，该杂交使两个反应基团聚在一起。在其他方法中，探针成员的酶促耦合先于该连接，伴随着在相邻探针之间磷酸二酯键的形成。如图23B所示的结构中，子链一级主链已形成。连接臂通过χ键连接于相邻的亚基，并包含受约束的Xpandomer主链。通过剪切选择性可剪切键(～)，受约束的Xpandomer从一级主链上分离并形成Xpandomer产物，其不受约束的连接臂将被线性化展开至如图23C所示的它们的全长。

基于此，图23C表示选择性可剪切键剪切从而解离一级主链之后产生的V型Xpandomer产物。Xpandomer产物链含有多个亚基κ，其中κ表示构成子链的具有m个亚基的链中的第κ个亚基，其中m＞3，一般m＞20，优选m＞50，更优选m＞1000。每个亚基由连接臂T(239)构成，如其处于展开的构型所看出的，并且伸展至其在相邻亚基之间的长度。每个亚基即亚基基序α，都含有种类特异性的遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图23D显示了作为分子模型的图23A的底物构建体，其中以四个核碱基残基(空心圆)代表探针成员，通过两个可剪切的连接(234，238)结合于连接臂的第一和第二末端部分。如图23A所示的连接基团ε(232)位于连接臂的第一末端部分上，而如图23A所示的连接基团ε(233)位于连接臂的第二末端部分上。在此所示的连接臂环有三个报道子(237a、237b、237c)，这些报道子也可以是基序种类特异性的。

图23E显示了并入产物Xpandomer之后的底物构建体。亚基被剪切(234a，234b，238a，238b)、展开并通过χ键(223，224)连接起来，χ键由图23A所示的连接基团δ和ε连接形成。用垂直地将重复亚基括在一起的虚线表示亚基，如附图23C中用括号表示一样。

在图23E的Xpandomer产物中，一级主链(235)被剪切分开(解离)。通过该剪切过程，受约束的Xpandomer得以释放成为Xpandomer产物。原来是受约束的构型的连接臂成员，现在是展开的构型，因此可以发挥线性伸展模板靶标序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并且为提高报道子的大小和丰度提供了平台，这依次改善用于解码模板序列检测和的信噪比。

虽然连接臂被描述为带三个报道基团的报道构建体，但是各种报道子构型可以排列于连接臂上，并且可以包括识别探针组分的单个报道子，识别探针种类的单个报道子，识别探针种类的分子条形码，或者连接臂可以是裸露的多聚体。在一些情况下，将一个或多个报道子前体排列于连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

图24描述了V型Xpandomer的产生和使用。步骤I为合成的起始，单链模板(245)与测序引物(246)接触并退火。然后引物组件(247)与V型底物构建体文库和聚合酶接触(步骤II)。步骤III中，在模板指导聚合中，持续添加底物。步骤IV中，子链一级主链的聚合完成，并且相邻连接臂侧臂上的活性的功能基团交联，形成连接臂与连接臂的χ键。最后，在步骤V中，剪切连接臂环主干上的可剪切键，从而从寡聚子链和模板上释放出合成的连接臂与连接臂的主链。从而Xpandomer(249)完全地通过连接臂连接而构成，并且显示，在其远离合成的中间体的剩余物时而自发地展开。在此与模板寡核苷酸序列相对应的遗传信息编码于连接臂的相邻亚基中。

Xmer的生产与使用

I型的实施方案包括Xprobe和Xmer。Xprobe是单磷酸盐，而Xmer是三磷酸盐。“Xmer”是可展开的寡核苷酸三磷酸底物构建体，其在Xpandomer的酶依赖性模板指导合成中可以被聚合。跟Xprobe一样，Xmer底物构建体具有特有的“探针环”形式，如图10A和10C所描述，其中R¹是5’-三磷酸盐和R²是3’-OH。要注意的是，底物构建体是寡聚核碱基三磷酸盐或寡聚体类似物三磷酸盐，但是如图10D所示，探针成员(例如，寡聚体)已被修饰带有连接臂构建体和连接臂末端连接之间的选择性可剪切键，该键的功能图10E所述。

DNA和RNA聚合酶可以用Kless的美国专利7,060,440中公开的引物依赖性持续性方法以一定水平的效率和保真度来合并二核苷酸、三核苷酸和四核苷酸三磷酸盐寡核苷酸。长度为n(n＝2、3、4或更多)的寡核苷酸三磷酸盐修饰的连接臂，可以用作底物，用于以聚合酶依赖性方式并入Xpandomer。用于如图16和17所示方法中的合适的酶，包括例如，DNA依赖性DNA聚合酶、DNA依赖性RNA聚合酶、RNA依赖性DNA聚合酶、RNA依赖性RNA聚合酶、T7DNA聚合酶、T3DNA聚合酶、T4DNA聚合酶、T7RNA聚合酶、T3RNA聚合酶、SP6RNA聚合酶、DNA聚合酶I、Klenow片段、水生栖热菌DNA聚合酶、Tth DNA聚合酶、

DNA聚合酶(New England Biolabs)、DeepDNA聚合酶(New England Biolabs)、Bst DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、9°N DNA聚合酶、Pfu DNA聚合酶、Tfl DNA聚合酶、Tth DNA聚合酶、RepliPHI Phi29聚合酶、Tli DNA聚合酶、真核DNA聚合酶β、端粒酶、Therminator^TM聚合酶(New England Biolabs)、KOD HiFi^TM DNA聚合酶(Novagen)、KOD1 DNA聚合酶、Q-β复制酶、末端转移酶、AMV反转录酶、M-MLV反转录酶、Phi6反转录酶、HIV-1反转录酶、用生物勘测方法发现的新的聚合酶，和US 2007/0048748、US 6,329,178、US6,602,695和US 6,395,524(通过引用并入本发明)所列举的聚合酶。这些聚合酶包括野生型，突变同工型，以及基因工程变体。

Xmer聚合反应是合成Xpandomer的方法并在图16中被描述，例如，其中提供作为三磷酸盐的2mer底物。因为Xmer是持续聚合的，所以在这种方法中，任选地删除与通过合成方法循环测序特别相关的延伸、交联、末端激活和高严格性漂洗步骤。因此该反应可以在溶液中进行。用Xmer合成Xpandomer也可以通过用固定的模板进行，如图17所述，其中在依赖于引物的模板指导合成中，4mer的Xmer三磷酸盐持续地聚合。

可以使用各种方法进行5’-三磷酸盐Xmer的稳固合成。如Burgess和Cook(“Syntheses of Nucleoside Triphosphates”，Chem.Rev.100(6)：2047-2060，2000)所描述的，这些方法包括(但不限于)使用核苷亚磷酰胺的反应，通过焦磷酸盐在激活的核苷酸单磷酸盐上的亲核攻击进行的合成，通过磷酸盐在激活的核苷酸焦磷酸盐上的亲核攻击进行的合成，通过二磷酸盐在激活的磷酸盐合成子上的亲核攻击进行的合成，涉及衍生自核苷酸的激活的亚磷酸盐和亚磷酰胺的合成，涉及由三磷酸盐亲核试剂直接替换5’-O-自由基团的合成，以及生物催化方法。用于产生适合二核苷酸底物的聚合酶的典型方法，使用N-甲基咪唑激活5’单磷酸基团；随后与焦磷酸盐(磷酸三丁铵盐)反应产生三磷酸盐(Abramova et al.，，“A facileand effective synthesis of dinucleotide 5’-triphosphates”，Bioorganic and MedChem 15，6549-6555，2007)。

如下文更详尽讨论的，Xmer连接臂构建体在设计、成分和连接方面与用于Xprobe的连接臂构建体有关。在很多实施方案中，在连接臂上编码遗传信息，因此每个底物构建体的每个连接臂是种类特异性的连接臂。连接臂上编码的信息用报道密码编码，该密码使遗传信息数字化。例如，连接臂上编码的5比特会产生32个独特的序列密码(2⁵)，比特是二进制位编码。在不考虑连接臂方向的情况下，这种策略可以用于特异性编码2mer文库的每个探针成员的两个核碱基残基的所有的16种组合。与Xprobe编码相似，多种功能和标记方法可以考虑用于Xmer，包括(但不限于)：功能化的树枝状聚合物、多聚体、支化聚合物、纳米颗粒和作为连接臂支架一部分的纳米晶片，以及报道化学物质和用适当的检测技术可以检测到的报道信号。可以通过共价结合或亲和性指导结合(affinity-directed binding)在Xmer聚合前或后引入(通过连接到连接臂上)碱基特异性标签。

Xprobe和Xmer的设计与合成

合成和剪切策略的概貌呈现如下，先是带选择性可剪切键的探针寡聚体，接着是连接臂和报道子连接臂构建体。

基于Xprobe或Xmer的SBX方法的一个目的是，通过模板指导合成尽量完整高效地组装靶核酸的复制物，模板指导合成通常是选自适宜前体成分杂交、连接、聚合或化学交联的方法或方法的组合，前体成分在此称为“底物”。为此目的，Xprobe和Xmer底物是作为反应物文库(例如，作为测序试剂盒的一些部分)供应的。文库通常是天然组合的，并且包括探针成员，该探针成员被选择来特异性结合任何或所有的互补序列从而如在靶多核苷酸中找到的。为此目的，文库中所需要的探针的数量是随探针大小的函数。每一个探针可以看作是序列片段，并且必须要有足够多样的探针成员来形成靶多核苷酸互补序列片段的连续序列的连续拷贝。对每个寡聚体是二聚体的探针而言，存在16种可能的A、T、C和G的组合。对每个寡聚体是三聚体的探针而言，存在64种可能的A、T、C和G的组合，依此类推。当测定随机基因片段的序列时，有可能在反应物文库中需要所有的这类种类。

Xprobe和Xmer是寡聚底物构建体，寡聚底物构建体分为5种不同的功能类型。寡聚底物构建体有两个独特的功能元件：修饰的寡聚核碱基或“探针”成员，和连接臂成员(“T”)。探针通过“探针-环”结构结合到连接臂成员，其中连接臂环是终产物Xpandomer的线性化连接臂成员的前体。每个连接臂T可以由报道子(通常指“标记”或“标签”)或其组合来编码，报道子可以特异性识别连接臂所连接的探针序列。因此，组装的Xpandomer的序列信息就更容易被检测到。

寡聚体是Xprobe的探针部分。探针是修饰的寡聚体核碱基，它具有含x个脱氧核糖核苷酸、核糖核苷酸、或更普遍的核碱基残基的链(其中x可以是2、3、4、5、6或更多)。在这些讨论中，长度为带有2、3、4、5或6个核碱基残基的探针，可以分别称为2mer、3mer、4mer、5mer或6mer。

底物构建体反应物可以由寡核苷酸5’-3’磷酸二酯键主链、具有核苷酸A、T、G和C(如图25表格里所示的结构)的寡聚体或其他可杂交的核酸类似物合成，所述核酸类似物例如那些具有缩氨酸主链、膦酰基-缩氨酸主链、丝氨酸主链、羟基脯氨酸主链、混合的缩氨酸-膦酰基-缩氨酸主链、混合的缩氨酸-羟基脯氨酸主链、混合的羟基脯氨酸-膦酰基-缩氨酸主链、混合的丝氨酸-膦酰基-缩氨酸主链、苏糖主链、乙二醇主链、呀啉代主链等的核酸类似物，它们是本领域已知的。脱氧核糖核酸寡聚体和核糖核酸寡聚体，以及这两种的混合的寡聚体，也可以用作为探针。其他碱基也可以被取代，例如尿嘧啶取代胸腺嘧啶，而次黄嘌呤核苷作为可降解的碱基。也可以使用具有互补性的核碱基的断裂残基。

本领域已知的关于降解和不稳定碱基的更完整的列举，包括但不限于、黄嘌呤，次黄嘌呤，或黄嘌呤和次黄嘌呤的杂环衍生物、类似物或异构体，8-氮杂嘌呤，第8号位被甲基或溴取代的嘌呤，9-O-N⁶-甲基腺嘌呤，2-氨基腺嘌呤，7-脱氮黄嘌呤，7-脱氮鸟嘌呤，7-脱氮腺嘌呤，N⁴-乙醇基胞嘧啶(ethanocytosine)，2，6-二氨基嘌呤，N⁶-乙醇基-2，6-二氨基嘌呤，5-甲基胞嘧啶，5-(C3-C6)-炔基胞嘧啶，5-氟尿嘧啶，5-溴尿嘧啶，硫尿嘧啶，2-羟基-5-甲基-4-三唑吡啶，异胞嘧啶，假异胞嘧啶，异鸟嘌呤，7，8-二甲基咯嗪，6-二氢胸腺嘧啶，5，6-二氢尿嘧啶，4-甲基-吲哚，亚乙烯基腺嘌呤，以及美国专利5,432,272和6,150,510及公开的PCT专利WO92/002258、WO 93/10820、WO 94/22892和WO 94/24144，以及Fasman在Practical Handbook of Biochemistry and Molecular Biology，pp.385-394，CRC Press，Boca Raton，LA，1989中所描述的核碱基(通过引用将它们的全部内容并入本文)。

如本领域所知的，寡聚体可以设计为包含核苷酸调节物。在一些实施方案中，这些可作为连接臂成员或成员的连接点。嘌呤和嘧啶衍生物适于衍生的寡聚体的合成，是本领域众所周知的。在图26A和26B中显示了两种典型的修饰的碱基，其中描述了5-氨基修饰的胞嘧啶衍生物和8-氨基修饰的鸟嘌呤残基。

如图27A和27B所示，以4mer寡聚体为例(在此显示为5’-单磷酸盐)，可以通过已知的化学物质修饰寡聚体上的四个碱基位置中的任意两个，从而产生连接点。图27A显示了在探针残基2和3(在选择性可剪切键的相反两端，用“V”表示)上的修饰的核苷酸。该图显示了氨基连接子结合到寡聚体的胞嘧啶和鸟嘌呤上的4mer寡聚体。图27B显示了苯甲醛功能基团结合到寡聚体的胞嘧啶和鸟嘌呤上的4mer寡聚体。其细节在本领域众所周知的方法中是例证性的。为简单起见，除非另外说明，本文所提供的大多数图表会假定4mer，但是可以理解的是，可以在本发明的实际操作中使用其他底物构建体文库或文库组合。

剪切

通常，Xprobe和Xmer底物构建体具有选择性可剪切键，其允许连接臂受控制地展开。如前面提到的，这种选择性剪切可以通过本领域技术人员已知的许多技术实现，包括但不限于，用金属阳离子进行硫羟磷酸酯主链的剪切、氨基磷酸酯主链变体的酸性剪切、使用抗核酸酶的硫代磷酸酯变体保护主链来进行标准磷酸二酯键的选择性核酸酶剪切、硝基苄基修饰的主链连接子的光裂解，以及二硫键的还原。

图28A-28D以及图29A-29D显示了通过修饰底物探针来包括选择性可剪切键。图28A显示了在DNA/RNA双链体Xpandomer中间体中的Xprobe二聚体的实例，该Xprobe二聚体带有易被核糖核酸酶H剪切的核糖基2’-OH基团。只要Xprobe中的其他核苷酸对RNA酶剪切是有抗性的(例如2′-o-甲基戊糖，2′脱氧核糖核碱基，“锁”LNA核碱基，和乙二醇或肽连接的核碱基)，该键因此是选择性可剪切的。这些可剪切位点拥有其他用途，例如，位于倒数第二个5’核碱基的核糖核苷酸和衔接子在Xpandomer和固定的支持体之间提供了可剪切的连接子。

图28B显示了一个带有耦合两个核苷酸的磷酸二酯键的Xprobe。在本图以及图28A、28C和28D中，用于桥接探针的选择性可剪切键的连接臂在(282)和(284)处标示。例如，如果将亚基连接臂连接在一起的其他键对核酸酶是有抗性的，那么该键可以用绿豆核酸酶、S1核酸酶、DNA酶I或其他DNA酶进行选择性剪切。2mer文库的合成提供了所需要的剪切模式，例如用连接臂连接点之间的标准磷酸盐连接和在核苷酸主链位置保持完整的硫代磷酸酯连接来合成2mer文库。图28C是通过3’硫羟磷酸酯键连接在一起的Xprobe二聚体，而在图28D中是通过5’硫羟磷酸酯键连接在一起。这些键是通过化学攻击而成为选择性可剪切的，例如，如Gish等(“DNA and RNA sequence determination based onphosphorothioate chemistry”，Science 240(4858)：1520-1522，1988)所述，使用碘乙醇进行化学攻击，或通过Vyle等(“Sequence-and strand-specificcleavage in oligodeoxyribonucleotides and DNA containing 3′-thiothymidine”.Biochemistry 31(11)：3012-8，1992)所述的用二价金属阳离子剪切。其他的主链剪切选择包括但不限于，Vallone等(“Genotyping SNPs using aUV-photocleavable oligonucleotide in MALDI-TOF MS”，Methods Mol.Bio.297：169-78，2005)所述的UV诱导的光氧化还原剪切(通过硝基苄基光裂解基团的适应(adaption))，Obika等(”Acid-Mediated Cleavage ofOligonucleotide P3′→N5′Phosphoramidates Triggered by Sequence-SpecificTriplex Formation”，Nucleosides，Nucleotides and Nucleic Acids 26(8，9)：893-896，2007)所述的氨基磷酸酯键的酸性剪切，以及Nauwelaerts等(“Cleavage of DNA without loss of genetic information by incorporation of adisaccharide nucleoside”，Nucleic Acids Research 31(23)：6758-6769，2003)所述的3’-O-B-D-呋喃核糖基-2’-脱氧主链变体的高碘酸盐催化的剪切。

跟Xprobe一样，剪切多聚Xmer主链来产生Xpandomer可以通过多种方法来完成。如图29A所示，例如，只要Xmer中的其他核苷酸对RNA酶剪切是有抗性的(例如2′-O-甲基戊糖和2′脱氧核糖核碱基，“锁”LNA核碱基，和乙二醇或肽连接的核碱基)，那么含有RNA酶可消化的核糖核酸碱基的Xmer可以在该位点被选择性剪切。对如图29A所示的Xmer而言，5’碱基是标准的2’羟基核糖核酸胞苷，而3’碱基是抗RNA酶的2’脱氧核糖核酸鸟嘌呤。Xmer的设计允许Xmer主链进行选择性RNA酶剪切，从而展开Xpandomer。可选地，如图29B所示，DNA酶可以用于剪切所有的非硫代磷酸酯保护的主链连接。因此，2mer文库，例如带有保持完整的连接臂接合点之间的标准的磷酸盐连接和在核苷酸主链位置的硫代磷酸酯连接，提供了所需要的剪切模式。图29C是通过3’硫羟磷酸酯键连接在一起的Xmer二聚体，而在图29D中是通过5’硫羟磷酸酯键连接在一起。这些键通过例如前面所提到用碘乙醇的化学攻击，或通过用二价金属阳离子剪切，是选择性可剪切的。其他主链剪切其他主链剪切选择包括(但不限于)UV诱导的光氧化还原剪切(通过硝基苄基光裂解基团的适应)和氨基磷酸酯键的酸性剪切，这两种方法均在图28中提到。在图29A-29D中，用于桥接探针的选择性可剪切键的连接臂，标示于(292)和(294)处。

参见图30，在I型“探针-环”底物构建体合成的图解第一个常规实施方案中，在探针的第二和第三位置上的两个核碱基残基(圆圈)经修饰产生接合连接臂的两个末端L1’和L2’的连接点L1和L2。在此将连接臂显示为预先独立组装的，并且在合成步骤中(箭头)被连接到探针成员上。连接臂内的二硫键(用两个三角形表示)可以用于这些底物构建体的组装和使用。在Xpandomer产物中引入还原试剂会选择性地破坏将连接臂连接在一起的二硫键，从而允许Xpandomer主链展开。光裂解键在组装中也用于折叠连接臂，当暴露于光中，连接臂会随后释放和去折叠。

在其他实施方案中，底物的磷酸二酯键主链经修饰可以产生用于连接臂的接合点，如Cook等(“Oligonucleotides with novel，cationic backbonesubstituents：aminoethylphosphonates”，Nucleic Acids Research 22(24)：5416-5424，1994)、Agrawal等(“Site specific functionalization ofoligonucleotides for attaching two different reporter groups”，Nucleic AcidsResearch 18(18)：5419-5423，1990)、De Mesmaeker等(“Amide backbonemodifications for antisense oligonucleotides carrying potential intercalatingsubstituents：Influence on the thermodynamic stability of the correspondingduplexes with RNA-and DNA-complements”，Bioorganic & MedicinalChemistry Letters 7(14)：1869-1874，1997)、Shaw等(Boranophosphates asmimics of natural phosphodiesters in DNA”，Curr Med Chem.8(10)：1147-55，2001)、Cook等(美国专利No.5,378,825)，和Agrawal(“Functionalization ofOligonucleotides with Amino Groups and Attachment of Amino SpecificReporter Groups”，Methods in Molecular Biology Vol.26，1994)所公开的。构成探针成员的核碱基残基可以被核碱基类似物所替代，从而来改变Xprobe的功能性。例如，锁核酸(“LNA”)可以用于提高探针双链体的稳定性。如果需要化学耦合Xprobe(而不是酶连接)，探针的5’和3’可以被进一步衍生以允许化学交联。

报道构建体的设计、成分与合成

在一个实施方案中，“报道构建体”编码连接臂，该报道构建体可以特异性识别连接臂所连接的核碱基残基(或图8的Xprobe、Xmer和其他寡聚体底物的“探针”)或核碱基(图9的XNTP、RT-NTP和单体底物)的序列。报道子是通常与连接臂相连的报道子或报道子的组合，所述连接臂用于“解析”或“编码”底物内在的和将底物并入Xpandomer的顺序的内在的序列信息。在一些实施方案中，连接臂只是间隔子，而报道子是底物或与底物相连。

图31显示了与图30相似的底物连接臂组装方法，但是预组装的连接臂包括报道基团(展示为连接臂的三个矩形部分)并称为“报道构建体”。报道构建体和连接臂可以通过多种聚合体化学物质产生，并在此更详尽地讨论了它们的使用和合成方法。

在本发明的实践中，连接臂可以发挥多种功能，例如：(1)作为连接臂沿核碱基主链直接或间接地按顺序连接相邻的连接臂，(2)作为间隔子通过剪切主链来延伸或展开从而形成连接亚基的延伸的链，称为Xpandomer，和/或(3)任选地包含报道构建体或报道子前体，其编码与连接臂相连的核碱基或个体底物构建体上的寡聚序列信息。

报道构建体是报道密码的物理形式，它在本质上是生物信息的和数字的。报道密码解析或编码与探针或核碱基序列片段相关的遗传信息，报道构建体和连接臂与该探针或核碱基序列片段相连接。通过调整组成性报道子的空间距离、丰度和信号强度来设计报道构建体使报道密码的检测能力得以优化。报道构建体可以并入各种信号和结构元件，包括但不限于，多聚体、树枝状聚合物、珠子、适体、配体和寡聚体。这些报道构建体由多种多聚体化学物质制备，并且在下文进一步讨论。

在一个实施方案中，报道构建体通过多聚体连接臂连接于探针或核碱基上。连接臂可以由一或多种持久的、水或溶剂可溶的多聚体构成，包括但不限于以下片段：聚乙二醇，聚乙二醇，聚嘧啶，聚异腈，聚亚安酯，聚(三芳甲基)甲基丙烯酸酯，聚醛，聚吡咯啉，聚脲，聚乙二醇磷酸二酯，聚丙烯酸酯，聚甲基丙烯酸酯，聚丙烯酰胺，聚乙烯酯，聚苯乙烯，聚酰胺，聚亚安酯，聚碳酸酯，聚丁酸酯，聚丁二烯，聚丁内酯，聚吡咯烷，聚乙烯磷酸酯，聚乙酰胺，多糖，聚透明质酸酯，聚酰胺，聚酰亚胺，聚酯，聚乙烯，聚丙烯，聚苯乙烯，聚碳酸酯，聚对苯二甲酸酯，聚硅烷，聚氨酯，聚醚，聚氨基酸，聚甘氨酸，聚脯氨酸，氮代聚赖氨酸，多肽，侧链氮代肽，多氮代甘氨酸，类肽，侧链羧代肽，同源肽，寡核苷酸，核糖核酸寡核苷酸，脱氧核酸寡核苷酸，修饰后可阻止Watson-Crick碱基配对的寡核苷酸，寡核苷酸类似物，聚胞嘧啶核苷酸，多聚腺苷酸，多聚尿苷酸，多聚胸苷，多磷酸盐，多核苷酸，多核糖核苷酸，聚乙二醇磷酸二酯，肽多核苷酸类似物，threosyl-多核苷酸类似物，乙二醇-多核苷酸类似物，吗啉代多核苷酸类似物，锁核苷酸寡聚体类似物，多肽类似物，支化聚合物，梳型高聚物，星形高聚物，枝状高聚物，随机的、倾斜的和嵌段共聚物，阴离子聚合物，阳离子聚合物，形成茎环、刚性片段与柔性片段的多聚体。这类多聚体可以在例如图30和31所示的底物构建体的连接点上环化。

连接臂通常是抗缠结的或是折叠的从而保持紧凑。聚乙二醇(PEG)、聚环氧乙烷(PEO)、甲氧基聚乙二醇(mPEG)和多种类似构建的PEG衍生物(PEGs)是用于本发明实践中的广泛可获得的多聚体。修饰的PEGs可以通过多种双功能的和异双功能的末端交联剂获得，并且可以合成各种长度。PEGs通常可溶于水、甲醇、苯、二氯甲和许多常见有机溶剂中。PEGs通常是柔性的多聚体，其通常不与生化试剂非特异性地相互作用。

图32A显示了PEG多聚体的重复结构。图32B显示了带有裸露的PEG连接臂的Xprobe或Xmer，该连接臂通过例如胺终止连接子(未展示)使用标准的连接化学物质来固定到探针主链上。图32C显示了在探针主链在选择性可剪切键(“V”)处剪切之后的同样的底物构建体，该PEG多聚体柔软地容纳Xpandomer的延伸。在一些实施方案中，PEG多聚体片段分段组装于连接臂上来延伸长度或使空间位的问题最小化，例如，距末端连接最近的连接臂干处，该末端连接将连接臂的干连接于底物上。

其他可以用作为连接臂并且为报道子提供“支架”的多聚体，包括，例如，多聚甘氨酸、聚脯氨酸、多聚羟脯氨酸、多聚半胱氨酸、多聚丝氨酸、多聚天冬氨酸、多聚谷氨酸等等。侧链的功能性可以用于构建富含功能基团的支架而用于增加的信号容量或复杂体。

图33A显示了多聚赖氨酸的结构。在图33B-33D所述的连接臂构建体实施方案中，多聚赖氨酸连接臂片段产生了用于报道子连接的支架。在图33B中，赖氨酸侧链的ε-氨基基团(用箭头表示)提供了将多个报道元件连接到底物构建体上的功能，从而放大报道密码。图33C显示了通过多聚赖氨酸侧链(箭头)连接于底物构建体的星形放射状的树枝状聚合物。

图33D显示了树枝状寡聚体的装载，该树枝状寡聚体可以通过在组装后标记或“信号放大”步骤中添加标记的互补寡聚体进行检测。其提供了用于准备通用连接臂的有用方法-通过将带多种寡聚报道基团的未标记的树枝状聚合物连接到探针上，然后通过选择一种或两种互补标记的探针处理结合了探针的树枝状聚合物，从而获得对单个底物种类特异性的“修饰的”树枝状聚合物。不同的探针/连接臂构建体可以用不同的互补标记的探针来修饰。

在该方法另一实施方案中，报道子系统的主链包含8个独特的寡核苷酸，这些寡核苷酸是使用两种可辨别的荧光报道子以二进制的方式进行空间编码的，每种荧光报道子通过相同的FRET供体激活。在连接臂构建体耦合于其各自的底物构建体之前或之后，通过使荧光报道元件的适宜混合物杂交来产生正确的探针特异性的二进制编码从而来依次编码连接臂构建体。用编码的、未标记的树枝状聚合物、多聚体、支化聚合物或珠子作为报道子系统的主链，应用该方法的各种变化。寡核苷酸也可以被用于报道构建体的二进制编码。这种方法的优点在于，信号强度被明显放大并且编码并不依赖于信号杂交事件，这二者都能降低测定和/或编码错误的可能性。

在另一个实施方案中，用亲和结合的异特异性配体来替换上述的寡核苷酸编码策略，产生例如类似的二进制编码的报道构建体。通过使用9比特二进制编码策略，这种非普遍的报道构建体以其最简单的形式，使用单一的耦合化学物质同时标记所有的连接臂。

鉴于SBX方法的灵活性，各种报道子可被用于产生独特的、可测定的信号。每个连接臂由一种或多种不同的报道片段特异性编码。连接报道子部分的支架可以通过各种现有的结构特征来构建，所述结构特征包括但不限于，树枝状聚合物、珠子、多聚体和纳米颗粒。根据编码方案，一种或多种明显分开的报道子支架，可以用于每个连接臂的报道密码。可以用多种选择将报道子部分直接或间接地连接于报道子支架上，包括(但不限于)：整合入连接臂构建体的化学活性多聚体的报道编码(reportercoding)；整合入连接臂主链的化学活性树枝状聚合物表面基团的报道编码；以及整合入连接臂的化学活性珠子表面基团的报道编码。在本文中，“珠子”用于广泛表示任何晶状的、多聚的、乳胶的或合成的颗粒或微滴。对所有这三个实例而言，报道子的丰度可以通过将装载多种报道子的多聚体连接于报道子支架来提高。这些多聚体可以是象100个残基的多聚赖氨酸一样简单，或更高级，例如是标记的寡聚探针。

也可以使用尺寸减小的连接臂构建体。例如，连接臂构建体可以在处理后步骤中通过直接的方法并入间隔单元而延伸，从而使报道子连接臂的尺寸减小。

减小底物构建体的大小和体积，也可以通过使用未标记的连接臂来实现。通过去除体积大的报道子(和报道子支架，例如树枝状聚合物，对于一些编码实施方案而言，其包含了连接臂质量的90％以上)，可以提高杂交和/或耦合动力学。然后可以标记组装后的连接臂。使用空间的或组合的策略将报道子结合于一个或更多个沿连接臂构建体分布的连接化学物质，从而来编码碱基序列信息。简单的二进制编码方案可以仅使用一种活性的连接化学物质，进行Xpandomer的组装后标记。更复杂的标记方案，可能需要上百种独特的连接子，使用基于寡核苷酸的方法来进行Xpandomer标记。另一个标记后的Xprobe或Xmer的实施方案，是使用由P¹和P²(见图10)衍生而得的核苷酸序列，所述P¹和P²在用于通过标记的探针文库杂交连接报道子的Xpandomer剪切和展开后，仍然存在。同样，其他标记和/或检测技术可以直接识别空间上分解更彻底的核苷酸。

因为错误的耦合会导致检测无效，也可能导致多聚体终止或报道密码的混乱(例如，如果使用不对称的报道密码)，因此使用以期望水平的精确度连接于底物构建体上的连接臂和报道构建体。SBX过程的保真度与底物构建体的合成纯度有关。在对连接臂/报道构建体进行纯化来富集全长产物之后，构建体可以直接耦合到异双功能的(定向的报道编码)或同双功能的(对称的或导向的报道编码)寡核苷酸探针上。与所有的多聚体合成方法一样，纯化(尺寸、亲和性、HPLC、电泳等)在底物构建体合成和组装完成之后使用，从而确保全长的可展开的探针构建体具有高纯度。

展示报道子的I型底物构建体的合成

具有展示于连接臂上的报道子或报道子前体的I型底物构建体的合成，可以通过多种方法完成。可以采用逐步的方法组装发夹结构连接臂多聚体，该连接臂多聚体通过二硫键在底物构建体的连接臂连接末端附近连接。这使反应末端定向，从而使连接臂与探针的耦合是非常有利的。例如，氨基调节物C6亚磷酰胺对于所有四种核苷酸(Glen Research，USA)而言是商业上可用的，并且可用于连接连接臂来形成完整的底物构建体。可选性，可以使用以苯甲醛修饰的核苷酸形式存在的连接化学物质。尺寸和/或亲和性的纯化对于富集正确组装的底物构建体是有用的。

如同惯例用于寡体和肽的合成一样，探针的异双功能化可以方便地在固相支持基质上进行，或用适当的纯化方法在溶液中进行。各种现货供应的异双功能的和同双功能交联试剂可用于修饰例如胺、羧基、巯基和羟基部分，并可产生多种稳固的和选择性连接的化学物质。由于C6氨基调节物可用于所有的四种脱氧核糖核苷酸，并且可经过制造而用于所有的四种核糖核苷酸，在此描述的功能化策略采用基于现货供应的胺的交联方法和已确定的胺保护/去保护化学物质。但是，考虑到本领域已知的各种亚磷酰胺和交联化学物质，也可以考虑未在此描述的方法，并且其能产生等同的产物。

如果报道编码策略产生了数位对称的编码或使用了定向标记(校验位)来识别编码方向，则可以不需要对探针进行异双功能化。在这种情况下，由于报道构建体在连接臂上的任意耦合方向都会产生独特的探针特异性的序列识别，因此两个内在的胺探针调节物是足够的。

使用化学(例如，交联剂)或酶促(例如，核酸探针杂交和连接)催化的共价连接可以将一个或多个多聚体片段依序组装而形成环状的末端功能化的连接臂。考虑到本领域的多聚体合成方法的现有技术，化学耦合合成方法构成了典型的实施方案。如同惯例用于许多多聚体合成方法一样，固相支持基质可以作为合成支架使用。多聚体片段可以基于末端功能化一次一个地组装为具有不同的末端功能特性的混合配对片段，或组装为结合的对——带有通过二硫键成对的不同的同双功能末端部分(例如，酰肼和胺)的两个多聚体片段。

包括连接子和报道元件部分两者的标记化学物质已研发，并且基于这些化学物质赋予Xpandomer主链的高信号通量和稳定性、低多聚体交叉反应和缠结以及结构刚性(增加刚性)进行优化，这对于下面讨论的样品的制备和检测是重要的。

在上文讨论的图31中，完整的发夹结构的连接臂/报道构建体是不依赖于寡核苷酸探针而组装的，并在随后由同双功能的或连接化学物质而连接到探针成员上。在另一可选的实施方案中，如图34所示，连接臂通过在固定的探针序列上的构建而逐步环化。可以使用直接连接于寡聚苷酸探针的异双功能的(定向的)或同双功能的(对称的或定向的)连接臂片段来进行报道构建体和连接臂的合成。如图34A所示的探针序列是4mer并且包括通过选择性可剪切键(“V”)分开的探针部分P¹和P²(第二个和第三个圆圈)。固态合成技术用于报道构建体的合成。这种合成方法整合有连接臂环的闭合。在图34A的步骤I中，使用以L1和L1’(在一个探针部分上的连接子L1是封闭的，以小矩形表示)表示的特异性功能基团化学物质来添加带第一个报道基团(342)的第一个连接臂片段(341)。在步骤II中，使用以L2和L2’表示的特异性功能基团化学物质来添加带第二个报道基团(345)的第二个连接臂片段(344)。在步骤III中，使用以L2和L1’表示的特异性功能基团化学物质来添加带报道基团(347)的第三个连接臂片段(346)。在步骤IV中，以及在从探针部分P2的L1位点去除封闭基团(仍用小矩形表示)之后，环在L1’和L1耦合之后闭合。

在此外的另一个实施方案中，如图34B所示，异双功能的连接化学物质仍可用于确保连接臂是定向位于探针上的(虽然这对所有的编码策略并不是必需的)。探针4mer仍显示为具有通过选择性可剪切键(“V”)分开的探针部分P¹和P²(第二个和第三个圆圈)。在步骤I中，带有报道片段(342，345)的两个连接臂(341，344)与P¹和P²上的功能基团L1和L2接触；该化学物质对每个连接臂都是特异性的。处于该阶段的连接臂可以用连接臂内的键(用邻接的三角形表示)来稳定。在步骤II中，在去除前体片段上的封闭基团(用小矩形表示)之后，用带有报道片段(347)的第三个连接臂(346)给连接臂“加帽”。帽片段也可以用片段内键(仍用邻接的三角形表示)来稳定。

现在转至图34C，显示了基于将探针部分P¹和P²的添加来分开预成型的连接臂的末端连接的实施方案。在步骤I中，预成型的连接臂通过使L1与L1’接触而首先与P¹反应在步骤II中，连接臂随后通过使L2与L2’的接触而与P²反应。连接臂可以通过连接臂内的键(用邻接的三角形表示)来稳定，这样使P¹接近于P²。两个探针部分随后在步骤III中连接从而在P¹和P²(第二个和第三个圆圈)之间形成选择性可剪切键(“V”)。可以通过使上述的探针部分与互补模板成双链体来任选地促进P¹和P²的连接。

在图35A中，公开了合成报道构建体片段的另一个实施方案。使用固态化学方法，将可剪切连接子(351)首先锚定于固体底物上(350)。带可逆连接(352)的第一连接臂片段在步骤I中与连接子反应，然后在步骤II中，与单体M1和M2的组合文库反应，在本实例中显示为各个单体以4∶1的化学计量混合。以这种方法来进行随机的共聚物合成，从而产生独特的连接臂片段化合物。如果使用肽或氨基酸单体，则可以用混合的酐化学物质来进行，例如，产生随机的各种长度的共聚肽连接臂(Semkin etal.，“Synthesis of peptides on a resin by the mixed anhydride method”，Chemistry of Natural Compounds 3(3)：182-183，1968；Merrifield et al.，“Solid Phase Peptide Synthesis.I.The Synthesis of a Tetrapeptide″.J.Am.Chem.Soc.85(14)：2149-2154，1963)。在步骤III中，在L1上封闭(用小矩形表示)的末端连接子元件(356)随后被添加到肽片段上。在将片段从固相支持体剪切下来之后(未展示)，可以将连接臂片段通过多种方法并入到报道构建体中，其中一些方法描述于图34中。

在图35B中，显示了本实施方案的可选方案。带有随机并入的肽片段的报道构建体，按以前在步骤I、II和III中一样合成，但在步骤III中，末端连接基团(358)具有异功能连接子L2。与前面的实例不同，以等同的比例提供单体。在从固相支持体上剪切下来之后(未展示)，报道构建体可用于进一步地并入到前面实例中的连接臂中，并且是异双功能的连接子。报道构建体用于编码探针序列片段的遗传信息，如下文更详尽地描述的。

多肽是有用的报道构建体并且也可作为连接臂。随机的、周期性的、交替的以及嵌段共聚物，以及同聚体，例如，均可用作连接臂片段和连接臂构建体的组成。例如，使用可将胺转化成酰肼或4-甲酰苯甲酸酯(4FB)的含有琥珀酰亚胺基的异双功能交联剂，可以将多肽片段末端功能化。多肽可以通过化学合成或在生物系统(细菌、酵母、杆状病毒/昆虫、哺乳动物)中克隆和超表达而产生。根据所需的片段长度，连接臂片段可以在N＞2(短片段)到N＞1000(长片段)之间变化。若果需要，可以使用胺侧链基团保护的化学物质。作为对使用现货供应的交联剂的可选方案，多肽可以是使用直接连接的酰肼、4FB和NHS部分进行化学合成。

使用将巯基转化成酰肼或4-甲酰苯甲酸酯(4FB)的含有马来酰亚胺的异双功能交联剂而末端功能化的多肽片段，也可以用于连接臂和报道构建体的合成。使用将羧基转化成酰肼(HZ)或4-甲酰苯甲酸酯的EDC交联剂而末端功能化的多肽片段，同样也可以使用。

可以通过使用上述的合成方法，可以实现具有由报道构建体修饰的连接臂的所有5种类型寡聚底物构建体的合成。同样地，也可以通过使用上述的合成机制，也可以实现具有由报道构建体修饰的连接臂的单体底物的合成。用于这些方案的变式的化学物质对于图8和图9所示的Xpandomer种类的类别通常是可适用的。现在我们转到用于传输带有报道构建体的Xpandomer中的遗传信息的编码策略与规则。

报道构建体与报道密码策略

“报道密码”是包含于具体报道构建体的报道子中的具体信号或信号序列的数字表示。而“报道构建体”是非遗传信息的物理表现，报道密码是它的数字等同物。

数字编码需要报道密码遵循某些规则。例如，至少需要256个报道密码来识别4mer Xprobe文库的所有可能组合。拥有比可能的报道构建体组合更多的报道密码是有利的，因为额外的情形可用于其它目的，例如缺口的标记、提供位置信息或识别奇偶检验误差或高次误差。

可以考虑多种策略用于以物理方式表现报道密码。可以将连接臂分成一个或多个可编码的片段，每个片段可以在Xpandomer组装之前或之后标记。可变的信号水平(标签数量)、长度(信号持续时间)和标记的连接臂构建体片段的形状可以用于增加编码选项。编码也可以通过使用多元化的标签进行展开。例如，通过使用质量标签标记方法，不同光谱的标签的广谱库可用于特异性地编码单个报道片段；在单个连接臂构建体片段上成群的用于三种标签的组合的14种不同的质量标签将产生364种独特的3-质量光谱。对于多片段化的连接臂，大部分或所有的连接臂主链的Xpandomer组装后标记，可以具有提高Xpandomer的刚性的额外益处，从而潜在地使其更容易用于检测操作和提高稳定性。

图36A(和图2A)显示了带有Xprobe或Xmer单个报道片段的连接臂。这种方法得益于诸如质谱标签的高度多元化的报道子标记，从而来产生不同光谱的标签的广谱库。可剪切的质量标签是可剪切报道子的分子或分子复合物，其可以轻易地被电离形成最少量的离子态来产生精确的质谱。当谨慎控制时，可以检测到少至几百个这种质量标签报道子。该报道密码的实例不需要在连接臂主链上的报道子的位置信息来测定密码状态(虽然需要位置信息来区分一个和下一个报道密码)。这种特征简化连接臂的构建并能潜在地缩短连接臂长度需求。

在一个实施方案中，使用可剪切的质量标记标签，可以产生延伸的Xpandomer用于检测，该检测通过纳米孔离子源(电喷离子化、大气压力化学电离、光化电离)或通过表面沉积作用(纳米梳、纳米通道、层析、电泳等)随后用激光、离子束或电子束源解吸电离(基质支持的激光解吸电离″MALDI″、解吸电喷雾电离″DESI″、硅解吸电离“DIOS”、二级离子质谱″SIMS″)。

图36B描述了带两种识别状态(“1”和“0”)、能产生512种密码信息的9比特连接臂构建体的实例。在一个实施方案中，连接臂构建体由片段“1”和“0”组成，所述片段产生在犁刀样(Coulter-like)的纳米孔探测器上测出的两种水平的电阻。在第二个实施方案中，连接臂构建体由导电片段“1”和非导电片段“0”组成。在第三个实施方案中，连接臂构建体由荧光片段“1”和非荧光片段“0”组成。可以考虑许多不同的报道元件用于这种编码类型。对于这些方法中任何方法而言，连接臂组装和探针连接化学可以是一样的——只有报道片段成分需要改变。通过这种简单的形式，可以在Xpandomer组装之前或之后进行标记。因为未标记的报道片段量较少，因而标记后是理想的，同样，在比完全标记的报道构建体的浓度更高时，也是可用的。取决于策略，多聚体片段可以：(1)通过可结合的或活性的表面化学物质(例如，多聚赖氨酸、多聚谷氨酸)被编码，(2)是无活性的(例如，PEG，低活性的多聚体)，或(3)是活性的和无活性的多聚体的混合物。反应基团包括但不限于，伯胺(-NH₃)、羧基(-COOH)、巯基(-SH)、羟基(-OH)、醛基(-RCOH)以及酰肼(-R-N-N)部分。反应片段的标记，其可以包括反应基团的去保护，可以在Xpandomer中间体形成之后、在剪切主链产生Xpandomer之后或在产生最佳结果的SBX过程的其他任何适当的时侯，在底物构建体上直接完成。

如图36C所示的其他水平也是可能的。例如，二进制定向(非对称的报道构建体)编码策略需要至少8个报道编码片段以及第九个片段即可编译的加帽片段(用于闭合连接臂环并且作为可能的中心底物构建体标记)来产生四个碱基的底物的最低限度必需的256个密码(如果编码加帽片段，则需要512个密码)。

见图36D，显示了7比特的报道构建体，每个报道子带有3种检测状态，从而产生2187种可检测的密码信息。可以由于原子空间排列的原因使用柔性的多聚体间隔子。

在图36E中，显示了前面所述的7比特报道构建体的刚性等同物。

图36F显示了4片段刚性连接臂构建体的实例，每个片段带有总共8种不同状态或标签组合。用其中的7种标签组合标记3个连接臂构建体，片段将产生343种独特密码信息并且剩余1个用于亚基边界的识别、奇偶校验、或其他功能目的的片段。如图37所示，该实施方案可以使用混合标记的方法，考虑到不同的报道子类型的组合和报道构建体的化学性质，其中可以将1-3种不同的标签并入到每个片段上，使产生每个片段至少8种不同的组合。此外，可以利用所述的质量标签和荧光标签选项。Xpandomer组装后的连接臂构建体的标记是由如图37所示的3个交联剂部分的丰度和特性决定的。如果要求使用这些检测技术，那么连接臂片段长度对于衍射限制性测定而言可以在100-1000nm之间，或者对于近场测定而言可以＜100nm。更短的连接臂可以用于其他检测方法。

图36G描述了3个片段的刚性连接臂构建体，每个片段有总共22种不同的标签组合。用图37所示的21种标签组合来标记2个连接臂构架，片段会产生441种独特的连接臂构建体信息，并且会剩余1个用于Xprobe亚基边界识别(boundary identification)的片段。该实施方案使用混合标记的方法，其中可以将1-3个不同的标签并入到每个片段来产生每个片段至少22种不同的组合(图37)。此外，本实施方案可以利用质量标签和荧光标签选项。如图37所示，Xpandomer组装后的连接臂构建体的标记是由3个化学部分的丰度和特性决定的。

通过设计反应基团丰度和空间尺寸(多聚体主链的径向距离)可发生改变的报道子/连接臂片段，可以达到编码水平，其中可能有至少共3种密码状态：高水平“2”，中等水平“1”，和低水平“0”(图36H)。另一方面，3个标签、2种水平的编码策略(即每个报道子21种状态)可以仅需要2个报道编码片段来产生441种密码，并且可以使用另外的片段进行密码定位(图36I)。

可以使用几种方法设计报道编码来减少报道构建体和相关检测技术的内在误差。在用纳米孔犁刀样检测的情况下，Xpandomer穿过孔的速度及其产生的电流调制可以依赖于许多因素，包括但不限于，孔内部分Xpandomer的电荷状态、电解液浓度、纳米孔表面电荷状态、实际电压、限制Xpandomer活动的摩擦力以及Xpandomer和纳米孔的相对尺寸。如果速度不是可预计的，那么解码电流调制不能使用时间(和恒定的速度)解析报道子的测定任务。一个编码实施方案用3种状态的编码解决了这一问题。报道子的信号是电阻，其是标记通过纳米孔时对电解液传导率产生的。通过为报道子提供3种可能的电阻水平，通过向下一个标签的转换来编码1比特信息。通过设计，该转变总是变成其他两种状态中的一种。如果3种标签标记为A、B和C，那么报道子的序列就永远不会同时拥有2个A、2个B或2个C。因此，信息在水平转换中被编码并且因此不依赖于穿孔的速度。一个编码方案是将所有的A至B、B至C、C至A赋值为“0”，而将B至A、C至B、A至C赋值为“1”。例如，检测到的序列ABACBCA编码为0，1，1，1，0，0。

虽然校准不能可靠地解析连续的标签，但是它足以区分单个连接臂构建体和下一个相续的连接臂上的标签序列的分离。在报道子标签序列的任意末端的其他间隔子连接臂长度(在底物构建体连接位点)可以提供大量校准的缺口，该缺口能及时地详细记述连接臂构建体密码。

在这种校准不够的情况下，移码错误就会发生。当检测仪从多个连接臂构建体密码(框架)阅读一系列标签但是没有正确记述起始密码(起始框架)时就会发生移码错误。这就导致错误的密码。解决这一问题的一实施方案是在密码中添加比用于识别相应碱基序列(通常长度为1-4个碱基)所需的更多的比特。例如，需要8个碱基来特异性识别4个碱基的序列。每2比特对呈现单个碱基。通过为每个碱基添加一个校验位，将连接臂构建体编码增加到12比特。高奇偶错误率(将近50％)会呈现由缺失状态的改变引起的移码错误。除了缺失状态的改变，另一种会在纳米孔检测技术中发生的错误类型是错读的状态。用奇偶校验位可以将单个报道子错误分离成具体碱基并且可以随后标记为“未知碱基”。

用电阻、导电或荧光片段标记的Xpandomer可以在溶液中利用多种纳米孔、纳米梳或纳米通道形式测定。可选地，利用纳米梳、纳米通道、层析或电泳沉积方法，可以将Xpandomer表面沉积为空间上明显的、线性的多聚体。用溶液方法，表面延伸的Xpandomer的直接检测，可以通过测定标记的连接臂片段的信号特征来进行。取决于沉积材料(传导的，绝缘的)和下面的底物(传导、绝缘的、荧光的)的成分，对于可以考虑多种检测技术用于标签检测。

其他SBX方法

在前面的图中(图11-17、20、21、24)举例说明了一些使用I-V型寡聚底构建体的SBX方法。我们现在考虑补充这些方案的一些可选择的方法。

末端功能化

图38显示了靶末端衔接子的制备和使用。图38A显示了末端功能化的互补的寡核苷酸成链体化从而形成衔接子，该衔接子带有双功能的可结合的末端(“L1”和″L2”)以及酶促可连接的末端(5′磷酸和3’-OH)。这些衔接子也可以设计成带有其他功能。例如，如图38所示，可以合成带有嵌套的、主链交联剂(″L3″)以及可剪切键(“V”)的末端功能化的衔接子。简单地说，尽管如果要求区分独立的剪切步骤，可以使用其他可剪切连接子，但是可剪切键V可以是用于释放或展开Xpandomer的相同的可剪切键的化学性质(或酶学性质)。图38C和38D显示了用于构建图38B的多功能衔接子的步骤。如图所示，表面连有与每个衔接子链(两种不同的磁珠混合物)互补的寡核苷酸的磁珠，可以用于组装差异修饰的寡核苷酸片段。一旦组装，片段可以被酶促连接来共价连接已退火的片段。用这种方法，每个片段可以用不可用于标准寡核苷酸合成的方式来单独修饰。

Xpandomer的处理可以有助于有效的样品呈现和检测。例如，末端亲和标签可以用于选择性修饰Xpandomer的一个末端来用于电泳延伸。将大体积的电荷中性的调节物连接于3′或5′末端(两端不能同时连接)会在Xpandomer上产生电泳拖曳，当它通过检测仪时，会导致未修饰的末端延伸。末端调节物，包括但不限于微珠、纳米颗粒、纳米晶体、多聚体、支化聚合物、蛋白质和树枝状聚合物，可以用于影响Xpandomer呈现于检测仪的结构(延伸)、位置和速度，以所述速度通过赋予Xpandomer末端独特的不同的性质，如电荷(+/-/中性)、浮力(+/-/中性)、疏水性和顺磁性等，将Xpandomer呈现于检测仪。在提供的实例中，末端修饰会产生使Xpandomer延伸的拉力；但是也可以用相反的策略，其中末端修饰用于将Xpandomer拉向并通过检测仪。用这种方法，末端调节物的拖曳促进Xpandomer延伸。模板链上的末端衔接子也可以任选地含有一个或多个核酸，该核酸将用于在完成的Xpandomer中合成框架记录和确认信号(见图54)。

亲和调节物的并入可以在Xpandomer合成(杂交、连接、漂洗、剪切)前、中或后完成。例如，可以将与衔接子序列互补的末端亲和标记的引物在Xpandomer合成之前、在高度特异性的条件下预先装载于ssDNA靶标上。引物及其亲和标签可以并入到全长Xpandomer中，并且可以用于选择性修饰其末端。潜在的更好的方法是酶促并入末端调节物。例如，末端转移酶(TdT)是独立于模板的聚合酶，它催化寡核苷酸向单链或双链DNA分子的3′羟基末端的添加。已证明TdT可将修饰的核苷酸(生物素)添加到3′末端(Igloi et al.，“Enzymatic addition of fluorescein-orbiotin-riboUTP to oligonucleotides results in primers suitable for DNAsequencing and PCR”，Bio Techniques 15，486-497，1993)。各种酶适用于这一目的，包括(但不限于)RNA连接酶、DNA连接酶和DNA聚合酶。

在图38E和38F中，举例说明了发夹结构的衔接子。发夹结构的衔接子可用于平末端连接来产生自我引发的模板链。这一方法的一个优点在于，子链仍然共价耦合于模板链，并且在熔融去除未连接物质和低分子量的片段之后可以更快地再退火。如图38F所示，这些衔接子可以含有用于纯化或下游操作的包埋的预制成的连接功能性，并且也可以含有更有效收获Xpandomer子链的剪切位点用。

靶模板的准备与解析

为了使用基于Xprobe的SBX方法进行长的连续DNA的全基因组测序，假定DNA是以用于杂交、连接、缺口填充(如果需要)、展开和测定的可处理的形式制备的。在一些实施方案中，Xpandomer组装过程可以通过DNA靶标的表面固定来改良，以便(1)减少复杂性和交叉杂交效应，(2)改进漂洗，(3)使靶操作(延伸)，以便促进杂交的改善，和/或(4)如果使用纳米孔感受器，则为检测过程提供无缝界面。如下文所详细描述的，期望靶模板制备、分析和表面连接的方法改善数据质量和序列组装。

大多数全基因测序方法需要将靶基因组片段化成更多易处理的片段。人类基因组最大的染色体(1号染色体)约～227Mb，而最小的染色体(22号染色体)约～36Mb。对于本文所述的大多数高持续性和连续性的实施方案而言，36Mb的连续测序太长而不能被高效地测序。但是，利用SBX固有的长的读长能力的优点，＞1kb的DNA片段长度被靶定。因此，可以应用许多策略完成基因组的片段化，并且本文制备适用于所公开的SBX方法的DNA靶标。

一个实施放案包括将整个基因组片段化成1-10Kb的片段(平均5Kb)。这可以通过限制性酶或水力/机械的剪切来完成。然后片段平末端化并且修复用于准备将平末端连接到序列衔接子(”SA”)或序列衔接子树枝状聚合物(“SAD”)构建体上。SA或SAD构建体的非平末端经设计不能连接从而阻止上述衔接子的多聚体组装。存在的任何SA或SAD连接的靶标可以从游离的衔接子中亲和性纯化出来。这样，如果不将捕获树枝状聚合物导入SA构建体，那么这就可以在纯化分离靶SAD复合物之前完成(使用有效过量的树枝状聚合物)。一旦被纯化，复合物就准备好连接到阵列表面。为此目的，需要每个反应位置只连接单个靶复合物。可选地，捕获树枝状聚合物可以替代地连接于阵列表面，在此情况下，已纯化的靶SA复合物就可以直接连接到已经位于并共价连接于该表面的树枝状聚合物上。Hong等(“DNA microarrays on nanoscale-controlled surface”，Nucleic Acids Research，33(12)：e106，2005)公开了DNA靶标在表面上组装的相似方法。

另一种方法称为“解析”方法，包括粗略地将基因组片段化成0.5-5Mb的片段(使用稀有的剪切限制酶或通过水力/机械剪切)，之后将这类片段捕获到由基因/基因座特异性寡核苷酸捕获探针组成的修饰的微阵列上(或分隔的表面上)。定制的微阵列和寡核苷酸捕获探针组可以从很多商业来源广泛获得(ArrayIt，Euorfins-Operon，Affymetric Inc.)。这种另外的解析可以为后面的序列组装提供优势。捕捉这些大片段包括部分或全部的靶标变性来使捕捉探针能与特异性靶DNA结合或双链体化。为了减少非特异性杂交，有必要在稀释条件下装载捕捉阵列从而阻止模板间的交叉杂交。

每个分隔的捕获探针组可以排列于大的表面上，经设计这些探针组提供约3Mb的线性化基因组的分辨率。为了提供有效的基因组解析，每个个体捕获探针组可以由3-5个基因/基因座特异性寡核苷酸组成，所述寡核苷酸基因组上按每个0.5-1.5Mb线性分开。选择对于靶片段完全唯一的捕捉探针，从而使该方法具有特异性和可重复性。鉴于3Gb基因组的分辨率为3Mb，那么该方法需要由约1000个基因/基因座特异性探针组成的捕获阵列。对人类基因靶标具特异性的现成的微阵列寡核苷酸捕捉探针组，可以由现货供应而广泛获得(Operon Biotechnologies，HuntsvilleAL，USA)。

一旦漂洗掉非特异性结合物质，随后每个捕捉阵列就可以作为独立反应，以如上所述的非特异性方法一样的方式继续进行完成基因组制备流程的剩余流程。主要的不同在于靶样品现在可以在SBX阵列表面解析或作为基于反应的单个解析，从而降低获得数据后序列组装的复杂性。

另一个实施方案是具有非连接的Xprobe-靶标的杂交和Xpandomer产生。在该情况中，在自由溶液中进行SBX分析。这种方法可以使用单个或组合的物理处理方法，例如使用电泳的、磁力的、拖曳标签，或者在静电或层析条件下正/负浮力末端的功能性，作为使靶DNA在探针杂交和连接之前或之中延伸的方法，例如，使剪切的Xpandomer在检测之前延伸或展开。可以使用聚合酶和连接酶(带或不带引物)进行Xpandomer的自由溶液合成，而无需固定，并且也可以使用化学连接方法来进行。可以使用三磷酸盐底物构建体和单磷酸盐底物构建体两者。构想了由多种以及混合的核酸靶标同时合成Xpandomer。通常，三磷酸盐底物构建体能在溶液中连续的、持续的聚合，并且可以适用于例如用于在自由溶液中进行大规模平行的单分子测序的单试管方案。

核酸靶标的表面组装

制备用于测序的靶核酸的一种方法是，使用如图39所示的末端功能化的双链DNA靶标。对本实例而言，每个衔接子通常带有ANH基团(活性酰肼)，该基团用于进一步处理，例如，使用琥珀酰亚胺4-烟酰肼丙酮腙(SANH)的连接化学和胺修饰的末端衔接子寡核苷酸双链体。同样，胺反应性的SANH可以用于产生活性的酰肼部分。SANH容易与醛类如4-甲酰苯甲酸酯(4-FB)结合形成稳定的共价腙键。胺活性的C6-琥珀酰亚胺4-甲酸基苯甲酸酯(C6SFB)可以用于产生活性的苯甲醛部分。将末端功能化的互补寡核苷酸双链体化形成双功能的可结合的末端(SANH和胺)和酶促可连接的末端(3′OH和5′磷酸盐)。衔接子的连接产生末端功能化的dsDNA靶标，该dsDNA靶标可以交联于表面连接的醛基。图39显示了使用SANH和胺修饰的末端衔接寡核苷酸双链体而功能化的d sDNA靶标末端。

对于多种所述的SBX方法而言，可以将核酸靶标共价连接于平的包被的固相支持体(不锈钢、硅、玻璃、金、多聚体)。如图40所述，靶连接点可以由SAM单层的4FB衍生来产生。该方法使用了图39的ANH衔接子，而在图40的步骤I中，ANH与单层上的4FB的头部反应，并且模板变性(步骤II)。模板的另一链，也已被末端标记，可以在单独的反应中被捕获。在步骤III中，单链模板3’末端的自由胺随后与珠子反应，例如在此所示的是浮力珠子，从而可以使靶模板延伸。这些捕获复合物可以通过末端功能化的多聚体(例如，用于靶标连接的巯基-PEG-酰肼；用于自身组装的单层“SAM”加帽的巯基-PEG-甲氧基)的化学计量均衡混合物的随机自身组装而组装，或者通过应用平版技术仿造空间分辨的活性结合点而组装。仿造的平版方法可以产生总是间隔的靶连接点，尽管这对单分子连接而言是困难的，虽然随机的自身组装方法可能会产生更易变的靶连接间距，但是具有高百分比的单分子连接。各种单功能的、双功能的、和异双功能的交联剂可以通过很多商业渠道获得。交联剂相容的单功能的、双功能的与异双功能的多聚体(聚乙二醇、多聚-1-赖氨酸)也可以通过各种商业渠道获得。

100cm²表面上十亿DNA靶标的密度会需要每个靶面积为10um²的平均值。该范围的靶间距提供了足够的靶分离，防止珠子连接的长度为5000个碱基靶核酸发生大量的交叉反应(100-1000nm珠子直径，5KbdsDNA＝1700um)。如果靶标和/或珠子(＞1珠子/靶标)交叉反应被测定为高的不可接受，那么靶面积就可以轻易地展开。

使用珠子或纳米颗粒使靶标延伸

如图40所示，可以用连接于靶DNA自由末端的珠子或纳米颗粒(400)使靶标在例如Xprobe文库杂交时延伸并固定靶标于它的单链构型中。将靶标保持在延伸的构型中可以极大地降低在低温下形成的靶分子内二级结构的概率和稳定性。二级结构影响的减少甚至消除会促进有效的、高保真的底物构建体的组装。

可以使用多种将拉伸力应用于单链靶标上的方法。例如，顺磁性珠子/纳米颗粒/多聚体能够使用磁场将可控的定向力传送到表面连接的靶标上。另外，在漂洗步骤中，通过控制磁场线的方向，顺磁性珠子/颗粒可以用于引导与固定装载Xprobe的靶标到底物表面上。通过沿表面分离靶标，可以使由于剪切力而导致的靶标丢失最小化。作为磁场拉伸的可选方案，可以用分别比水的密度重或轻的正的和负的浮力珠子/颗粒提供拉伸力。所有的珠子/颗粒必须进行表面包被来最小化非特异性相互作用(珠子聚集，探针结合)，并且被功能化，以便能与衔接子修饰的靶标共价交联。

图41A-41D显示了典型的基于珠子的靶标延伸策略。图41A显示了使用被外面的磁场(B)吸引的末端连接的顺磁性珠子/颗粒延伸靶标。图41B显示了使用被外面的磁场吸引的末端连接的顺磁性珠子/颗粒使靶标在底物表面分离(来减少靶标剪切)。图41C和41D分别显示了使用末端连接的负浮力珠子/颗粒(密度比水高)和正浮力珠子/颗粒(密度比水低)延伸靶标。用于靶标延伸的自由溶液方法为减少靶标的二级结构提供了极好的选择，该自由溶液方法使用末端连接的部分，例如使用正的和负的浮力珠子使靶标的相反末端功能化。

图41E显示了这些延伸策略在制备Xpandomer中的使用。在此，在步骤I中，使用经由衔接引物(417)与靶标成双链体的浮力珠子，延伸固定的模板(416)。然后在步骤II中，将模板与底物构建体接触，并且这些底物构建体随后被连接到单链靶标上，从而产生带有特有的探针-环结构与两个主链的双链Xpandomer中间体(411)，其中一个穿过多核苷酸的一级主链，而另一个穿过受约束的Xpandomer主链。在步骤III中，模板链变性，在步骤IV中，单链Xpandomer中间体在一级主链的选择性可剪切键上受到剪切，导致环的打开以及带有完全延伸的替代主链(419)的Xpandomer产物的延伸。

使用多聚体末端修饰延伸DNA靶标

图40所述方法的可选方案，使用长的、功能化的多聚体(代替珠子)延伸靶标，所述多聚体共价连接于表面连接的DNA靶标的自由末端。在捕获(使其隔离)底物内部的多聚体之后，将多聚体末端修饰物电拉伸并穿过多孔底物，产生了明显摆脱二级结构的完全延伸的单链靶DNA。图42A展示了该方法，其显示了将靶链穿过底物的小孔。多孔底物包括但不限于，凝胶矩阵、多孔氧化铝以及多孔膜。完全延伸的多聚体的捕获，可以通过受可控的化学作用过程来完成，其中多聚体与多孔底物的交联或结合可以在靶标完全延伸后选择性地开包可以利用多种交联或结合策略。例如，羧基功能化延伸的多聚体与氨基功能化的多孔底物的交联，可以通过导入交联剂1-乙基-3-[3-二甲基氨基丙基]碳化二亚胺盐酸盐(EDC)来实现。

图42B展示了另一实施方案，是将多聚体电拉伸向与多聚体的交联或结合的功能化的表面。在此情况中，多聚体并不需要穿过底物，但需要交联或结合于表面的功能基团上。对于此方法，底物包括但不限于，凝胶矩阵，、多孔氧化铝、多孔膜以及无孔的、传导表面例如金。可以使用多种现货供应的交联(酰肼-乙醛；金-硫醇)或结合的化学物质(生物素-链霉抗生物素)使多孔的与无孔的底物功能化。

作为选择，可以使用闭合的电门控系统，该系统使用变化的(高、低、基线)电场区捕获带电的多聚体片段。展示于图42C中的方法，产生了法拉第笼(Faraday Cage)型的围场，其可以用于将该多聚体与靶DNA控制于其延伸位置。本方法需要电场的有效分割或约束，并具有通过修改门控参数而允许可调整的靶标延伸(贯穿SBX合成)的优点。在法拉第笼的外面，电场对底物构建体的影响最小的。

在相关的方法中，用弹性多聚体将持续的拉伸力传递到弹性较少的靶核酸上。可以用此方法作为在此所述的任何延伸方法的补充，包括磁珠、浮力变形、密度变形(重力)或电拉伸。蕴藏于多聚体内的弹力提供了对靶链更加一致的、缓冲的拉伸力。

电矫直的基于凝胶矩阵的靶底物

图43A显示了用于单链靶DNA排列(相对于与固相支持体的连接)的可选方法，其中将靶标共价连接于筛选凝胶矩阵(430)上。在图43b(插图)中可以看出底物构建体结合于已经伸直的锚定的模板上。电场可以用于靶标的延伸与底物构建体的呈现。本方法具有超出其他根据靶密度与靶延伸(电矫直，electro-straightening)用于DNA靶标排列方法的优势。例如，DNA经由丙烯酸酯修饰的末端衔接子(连接于寡核苷酸)与丙烯酰胺的交联，可以常规地完成。Acrydite^TM是可用的亚磷酰胺(MatrixTechnologies，Inc.，Hudson，NH，USA)，其已经广泛地应用于将异丁烯5′末端修饰并入到寡核苷酸中：Acrydite基团中的双键与丙烯酰胺的激活的双键反应(Kenney et al.，“Mutation typing using electrophoresis andgel-immobilized Acrydite probes”，Biotechniques 25(3)：516-21，1998)。胺功能化的琼脂糖也可通过现货供应获得(G Biosciences，St.Louis，MO，USA)，并且可以同样用于交联到DNA上，此交联使用现货供应的胺活性的交联化学物质(Spagna et al.，“Stabilization of a β-glucosidase fromAspergillus niger by binding to an amine agarose gel”，J.of Mol.Catalysis B：Enzymatic 11(2，3)：63-69，2000)。

通过前面所述的固相支持体连接方法，通常用末端衔接子使DNA片段功能化，产生例如，5’-Acrydite的修饰。为确保靶标的一致性，将dsDNA靶标变性(与保持处于变性状态)，同时交联于筛选矩阵。靶标可以通过使用多种现有技术进行变性，包括但不限于，尿素、碱性pH以及热熔解。一旦交联于凝胶矩阵，变性的靶DNA就可以通过应用适宜的电场(与电泳相似)进行矫直。与严格的温度控制一起进行的凝胶矩阵内变性剂的扩散、电泳以及中和，和杂交兼容性溶液的添加一起，产生了有益于底物构建体杂交的环境。例如，Xprobe可以通过电泳而连续地呈现于连接的靶标上。此形式使探针重复利用并为Xprobe的流速提供了良好控制。

5mm×50mm×20mm的凝胶矩阵阵列的靶密度，产生了5.0×10¹²μm³的反应容量，其基本上高于在平面上排列的容量。图43C显示了用于酰胺、二酰胺以及Acrydite寡核苷酸末端修饰的化学结构。图43D展示了带有共价连接的DNA靶标的聚丙烯酰胺凝胶矩阵。

底物构建体的酶处理可以在凝胶矩阵内完成。使用聚合酶(PCR)和连接酶的酶试验常规用于修饰共价耦合丙烯酰胺凝胶垫的寡核苷酸(Proudnikov et al.，“Immobilization of DNA in Polyacrylamide Gel for theManufacture of DNA and DNA-Oligonucleotide Microchips”，AnalyticalBiochemistry 259(1)：34-41，1998)。例如，可以通过被动扩散、电泳或二者的结合，将连接酶传递到凝胶矩阵内已组装的Xprobe-靶标上。考虑了各种矩阵密度与孔径，然而被动扩散受益于相对低的密度与大的孔。可以通过将电荷调节物(多聚体与树枝状聚合物)连接于酶来促进其穿过矩阵的移动，实现通过电泳进行连接酶的主动传递。

凝胶矩阵方法的变体是，使末端修饰的单链靶多核苷酸经电泳穿过凝胶矩阵。末端修饰可以用于在靶标的一个末端上产生拖曳。阳离子的末端修饰可以在靶标的另一末端进行，以便拖曳它通过凝胶。也可以将温度梯度或区段引入凝胶中，以便在靶标穿过凝胶矩阵而前进时倾斜或调整杂交严格性。酶促处理可以在凝胶矩阵内完成或在杂交的靶标-底物复合体离开凝胶矩阵之后进行。当需要时，可以重复该处理来产生希望获得的平均Xpandomer长度。

图44展示了拖曳标签对于Xpandomer合成后处理的使用。拖曳标签(表示为菱形)用作拉伸与输送技术的溶液等同物(solution-equivalent)(Meagher et al.，“Free-solution electrophoresis of DNA modified withdrag-tags at both ends”，Electrophoresis 27(9)：1702-12，2006)。在图44A中，拖曳标签通过连接化学物质而连接到在单链模板(拖曳标签的L1’与模板的L1结合)的5’末端功能化的衔接子上。在所示的步骤中，显示底物构建体的持续性添加已经在进行。在图44B中，拖曳标签通过与互补的衔接子退火来添加。在图44C中，首先处理Xpandomer，以便将连接子连接于3’-衔接子(与L1’一起表示为小方块)，并且随后用连接子(L1)在步骤II中将拖曳标签连接到其上。可以延伸单链或双链DNA 3’-OH末端的末端转移酶，使连接子修饰的核苷酸三磷酸例如生物素化的核苷酸发生聚合。也可以用其他的酶添加修饰的碱基或寡聚体。在图44C中，将拖曳标签添加到Xpandomer中间体的3’末端。拖曳标签可以包括但不限于，纳米颗粒、珠子、多聚体、支化聚合物以及树枝状聚合物。

缺口和用底物构建体杂交和连接填充缺口

可以使用多种变化的连接方法进行缺口管理与缺口填充。在一个实施方案中，使用循环逐步连接，其中探针从与靶多核苷酸成双链体的表面连接的引物开始依序组装。在另一个实施方案中，在整个靶DNA序列上同时发生底物构建体的“混合的”杂交与连接，通常无引物。

对于循环的与混合的连接方法而言，例如，使4mer底物构建体的某部分(例如，25％)和5mer底物构建体的某部分(例如，20％)发生相邻杂交从而允许连接，这是有可能的。一定百分比的这些相邻的双链体可能含有错配的序列，其将导致测量错误(如果是连接的)或连接失败。连接失败(由于错配)的大部分实例是没有结果的，因为未连接的探针在下一轮杂交之前就已被除去。如果需要，杂交/漂洗/连接/漂洗的循环可以重复几百次(6分钟/循环＝220循环/天和720循环/3天；10分钟/循环＝144循环/天和432循环/3天)。

在循环过程中(以图14中的Xprobe示例说明)，Xprobe从与靶DNA成双链体的表面连接的引物的一个末端开始依序组装；每个循环一个Xprobe。情况是这样的，靶标的读长可以通过使用以下假定进行计算：带有20％正确的探针双链体保真度的25％相邻杂交(4mer的)在400次循环之后将产生仅20个连续的4mer连接(400×25％×20％)。使用这些假定，400次循环的试验(1.5天，在6’/循环的情况下)可产生平均长度为80个核苷酸的产物。

在混合的过程中(以图45中的I型Xprobe来举例说明)，如果在整个DNA靶标模板上允许Xprobe杂交与连接反应自发地和同时地发生，更长的DNA模板的复制物可以使用更少的循环实现。在杂交与漂洗的每个循环之后，连接可以用于连接剩余的双链体，这些双链体是相邻的并且100％正确。可以使用另外的、更严格的漂洗来去除更小的连接产物(每个是8mer和更少；一些是12mer)以及所有未连接的4mers。伴随着整个1,000-10,000核苷酸靶标序列中发生的连接反应，试验的进展会显著地提升。由于用于Xprobe杂交与连接的混合方法不受DNA靶标模板长度的约束，大多数靶模板可以在连续方法所需的一小部分循环中复制。如果此类调整增加杂交/连接反应的保真度和/或数量，则可以用更长的循环时间弥补动力学上的限制。

图45展示了混合过程的连续进行。步骤I展示了在沿着DNA靶标的多个位点处杂交的4mer Xprobe。步骤II展示了相邻Xprobe的杂交与连接；使连接的Xprobe稳定从而在未连接的Xprobe被熔解掉时可保持杂交状态。步骤III与步骤IV展示了在杂交的另一轮热循环，之后进行未连接Xprobe的连接与热熔解。每个循环优先延伸现有的连接的Xprobe链。如步骤IV中所示，在重复循环之后，用遗留比探针长度更短的缺口的Xprobe，饱和DNA靶标，其中无双链体化发生。为完成Xpandomer，通过步骤IV所示的酶促或化学方法使Xprobe越过缺口而连接。

标准的缺口填充

如图45步骤V中用Xprobe所示，在杂交与连接的循环过程完成后，可以填充序列缺口来产生连续的Xpandomer。沿靶DNA主链的缺口可以使用基于已确定的DNA聚合酶/连接酶的缺口填充方法(Stewart et al.，“Aquantitative assay for assessing allelic proportions by iterative gap ligation”，Nucleic Acids Research 26(4)：961-966，1998)来填充。这些缺口发生于相邻的Xprobe链相遇并在它们之间具有1、2或3个核苷酸的缺口长度时(假定为如图45所示组装的4mer I型Xprobe)。缺口的填充也可以通过化学交联(Burgin et al.)来完成。在完成缺口填充后，靶DNA的产物可以进行适当处理(纯化，剪切，末端修饰，报道子的标记)从而产生可测量的Xpandomer，该靶DNA产物主要由带有周期性的1、2或3个核苷酸填充的连接的Xprobe。由于SBX分析产物是在检测步骤之前的成批处理中制备和纯化的，因此检测是高效的并且不会被任何并发的生物化学处理限制速度。

为了将缺口与核苷酸特异性报道子信号区别开，修饰的脱氧核苷酸三磷酸盐(它是已经标记的或能够在分析之后进行标记的)可以用于识别缺口序列。适宜的脱氧核苷酸三磷酸盐如图46A(连接修饰的碱基)和46B(生物素修饰的碱基)所示。

缺口的长度与频率是由许多合成变量决定的，包括循环次数、杂交严格性、文库策略(鸟枪法对比带有化学计量调节的子库)，靶模板长度(100b-100Mb)以及反应密度(0.1-10B)。缺口频率与缺口长度可以通过使用最大化的严格性条件来显著地降低，如果这些条件适合于特异性的分析时间范围。靶标长度和反应密度也是关于联合的保真度和缺口填充概率的重要因素。

杂交的混合过程可以使用热循环方法改善杂交的严格性并增加相邻底物构建体联合的频率。杂交、连接和热熔解可以在精确的热循环程序下持续，直至靶序列的大部分与探针双链体化。弱结合的、非特异性的探针-靶标双链体可以再次在精确的热控制下通过简单的漂洗步骤而除去。可以进行酶促或化学连接来沿着靶DNA连接任何相邻杂交的寡聚构建体，从而产生更长和更稳定的序列。酶促连接具有附加的益处，由于错配的探针-靶标不能被有效地连接，因此其可以提供另外的双链体保真度的交叉检验。在精确的热循环条件下使用第二次漂洗，未连接的底物构建体可以从DNA主链上熔解掉；更长的中间体将仍然保留。更长的连接的序列可以沿着靶DNA在多个基因座处生长，直至复制几乎完成。杂交/漂洗/连接/漂洗的过程可以重复零至许多次，直至大部分靶模板已经复制。

可以使用温度循环以及由碱基堆积引起的底物构建体稳定性来促进相邻的杂交事件。热循环条件，与“降落PCR(touchdown PCR)”概念相似，可以用于消除低稳定的、非相邻的双链体。例如，通过杂交温度和寡文库的估计(通过单探针熔解测定-例如，非碱基堆积稳定)的上熔解温度(“Tm”)间的重复循环，可以确定选择相邻探针杂交事件。通过充分的富集效率，循环次数可以大大减少。这可以在单浴或多浴条件下进行。

以小的文库大小(例如，256，4mer底物构建体)，文库可以在更窄范围的熔解温度的基础上划分为子文库(sub-libraries)。如果Tm偏差不能通过碱基修饰、杂交溶液佐剂等等来控制，那么这种策略就可以极大地有益于该方法。另外，可以调整(上调或下调)探针的化学计算法来均衡任何仍存在于文库/子文库的残余偏差。

运用计算机建模来评估缺口发生的统计学以及杂交于靶DNA模板的连续连接的底物构建体的长度。该模型模拟了256个4mer Xprobe的完整文库的杂交/连接-热熔解循环。在此呈现的该模型的结果是基于以下模型程序：

i)杂交/连接步骤模拟随机的4mer Xprobe在随机的位置上随机地遇见随机测序的DNA模板，并且如果它们配对就杂交。没有Xprobe可以与核苷酸重叠。杂交延续直至靶标上所有长度大于3个核苷酸的位点都被杂交。

ii)通过去除所有链长比M 4mer Xprobe短(其中M＝2、3、4、5...)的链中的Xprobe来模拟热熔解步骤。更长的链保留在DNA模板上。“链”在此定义为之间没有缺口的多个连续的Xprobe。

iii)重复i)和ii)定义的循环从而使Xprobe在多Xprobe链的已有基因座外随机构建。当两个连续循环之间不发生变化时，循环结束。

图47和图48各有举例说明在随机的DNA模板上运行模型100次的统计表的两幅图表。为了进行处理，选择300个核苷酸长度(但是如果模板长达5000个核苷酸，在此所讨论的统计表并不改变)的DNA靶标。图47显示了M＝3的结果，其中比M＝3短的链从DNA模板上“熔解下来”。图47A显示了最后一轮链长的统计表。这种分布显示为拟似指数，该指数的范围为12mer(M＝3)直至一些极少的大的160mer，平均长度～28个核苷酸。图48B显示了需要5-20个循环的范围利用链“生长”的方法来完成DNA模板，并且运行的90％是在12个循环后完成的。图48A和图48B显示了对于M＝4的更严格热熔解情况的相同类型的信息。在该情况中，链的平均长增至～40个核苷酸，但是需要～18个循环来完成90％的运行。更长链的长度减少了具有预期缺口的可能性。对于M＝4的数据而言，不填充核苷酸位置的平均概率的均值为0.039(大约25个里面有1个)。

用3mer和2mer底物构建体填充缺口

基本的4mer杂交实施方案的延伸，是使用3mer和2mer底物构建体分别填充3个碱基和2个碱基的序列缺口。图49显示了通过依序或同时添加更短的Xprobe填充缺口的实例。如果在4mer杂交后大多数靶模板成功地与Xprobe进行双链体化，那么大多数余下的缺口长度为1、2或3个碱基。如果中等至高等百分比的2个和3个碱基缺口可以用更小的Xprobe填充和连接，那么Xpandomer的平均大小可以极大地提高。由于这些更小的探针的杂交是在大多数靶标双链体化之后完成的，因此可以降低温度的严格性，允许3mer然后2mer分别双链体化。碱基堆积稳定性使更小的Xprobe的双链体稳定性得以提高。连接之后，使用聚合酶来并入核苷酸，然后再通过连接反应来连接所有余下的相邻5′磷酸盐和3′羟基，从而填充余下的缺口。在并入前或后，聚合酶并入连接修饰的核苷酸，使缺口带有标签。这些标签能或不能识别碱基。基于统计学模型，如图59的图表所总结的，全长的Xpandomer多聚体具有大于95％的靶序列盖度(大于16个碱基)。依照该模型，使用3mer/2mer Xprobe的缺口填充使未标记碱基的百分率下降了6倍(假定高效并入)，这对5000个碱基的靶序列而言，可以导致5000个碱基的大部分连续的序列带有遍及靶标复制子的少于50个未识别的单碱基缺口。同样，在16×的盖度中，识别大于99％的未识别的缺口序列。

例如，用更小的3mer和2mer Xprobe填充缺口，使平均Xpandomer长度扩大3倍。如图50A和50B所示概括了统计学建模结果的图表，显示，在所述条件下，平均长度3mer/2mer缺口填充的Xpandomer，在130个碱基序列的范围内。此外，伴随着以此方式合成的50000亿个碱基的Xpandomer序列，其相当于将仅为2.5ng的靶序列转变为Xpandomer，从总数中选择尺寸最长的10％的Xpandomer片段可产生5000亿个碱基的序列，其平均长度在381个碱基的范围内，而选择尺寸最长的2％的Xpandomer片段可产生100个十亿碱基的序列，其平均长度在554个碱基的范围内。这些片段长度的完成可以不需要使用聚合酶的单碱基缺口填充。如果不用任何缺口填充来完成4mer Xprobe杂交，统计学模型显示，最长的10％和2％的片段的平均长度可分别为106和148个碱基。

添加佐剂来减少靶标的二级结构

由于分子内的二级结构，长的表面连接的单链靶DNA会呈现具挑战性的杂交靶标。添加如图41E所示的末端连接的珠子，可减少这些分子内形态的发生，而当它们发生时则破坏它们的稳定性。然而，发现有必要通过添加佐剂进一步减少二级结构形态，从而能够有效地阻止底物构建体杂交。

将未标记的2mer和/或3mer寡核苷酸探针添加至，例如Xprobe杂交混合物中，可以用于该目的。为了排除并入到Xpandomer的可能性，将这些探针合成为不可连接的(无5′磷酸盐或3′羟基)。由于它们的尺寸小，2mer和/或3mer佐剂在4mer Xprobe杂交温度下不太可能形成稳定的双链体；然而，它们以从中到高的浓度在反应混合物中的存在，通过微弱而短暂地阻止分子内可双链体化的核苷酸序列的接近，降低靶标二级结构的频率和稳定性。图51显示了2mer或3mer佐剂的添加如何阻止二级结构的形成(仅为了简单起见，4mer Xprobe并未在图中显示)。结合磁珠连接臂提供的拉伸力，佐剂极大地减少了二级结构形成的频率。

这些二核苷酸和/或三核苷酸佐剂可以由标准的核苷酸、修饰的核苷酸、通用的核苷酸(5-吲哚、3-硝基吡咯和脱氧次黄嘌呤核苷)或其任何组合组成，从而产生所有必需的序列组合。图52显示了用于该目的的常见的通用碱基取代物。

另一种用于减少靶标二级结构的方法是，复制靶DNA来产生与天然DNA相比二级结构稳定性降低的合成的cDNA靶标。如美国专利申请2005/0032053(“Nucleic acid molecules with reduced secondary structure”)所公开的，图53列出了一些可以并入到所描述的合成的cDNA靶标中的核苷酸类似物。这些类似物，包括(但不限于)N4-乙基脱氧胞苷、5′-单磷酸-2-氨基腺苷、单磷酸-2-硫代尿苷、单磷酸次黄嘌呤核苷、单磷酸吡咯嘧啶和单磷酸-2-硫代胞苷，证明可减少cDNA的二级结构。这种方法可以与靶标拉伸和杂交佐剂一起使用来减少二级结构。

检测和测量

如前所述，Xpandomer可以通过多种技术标记和测量。SBX方法的大量数据输出潜能与基于纳米孔或同等技术的感受器阵列很好地匹配。在一个实施方案中，纳米孔阵列可以作为离子化的来源在质谱的前端起作用，其中Xpandomer上的报道密码是可剪切的质谱标签。其他实施方案包括使用纳米孔感受器，例如电阻/电导或FRET。

一检测实施方案使用图54所述的纳米孔阵列。在该实施方案中，使用前面所述的方法组装Xpandomer，除了DNA靶标不是被锚定于固定的固相支持体上而是被锚定于磁珠上，该磁珠具有穿过纳米孔底物的锚定探针。此外，为产生两个发射波长，多种FRET供体荧光团被连接于纳米孔入口(显示为小正方形)。FRET受体荧光团构成Xpandomer上并入的报道子。在剪切Xpandomer的连接的Xprobe之后，Xpandomer受力伸展，该力可以是静电的、磁性的、重力的和/或机械的，并且可以通过用于延伸原始DNA靶标的磁珠(显示为连接于Xpandomer的顶部)得以促进。在最后的测量步骤中，通过运用如纳米孔结构下面所示磁珠的磁力，拖曳Xpandomer通过纳米孔。在纳米孔入口处的供体荧光团受光源(λ1)激发并且当报道子接近供体荧光团时，它们受到激发并且发射可解码为相关核苷酸序列的特征荧光(λ₂)。

图54也举例说明了以报道密码编码序列的实施方案。在每个连接臂上，有3个报道位点，每个装载有两种FRET受体荧光团类型的组合。这在每个位点上提供4种使用相关的强度水平可测量的状态。如果受体荧光团的荧光是红色和绿色，那么将这些状态编码为4种核苷酸可以是：A：绿色＞红色，C：只有红色，G：只有绿色以及T：红色＞绿色。

在另一个实施方案中，Xpandomer标记有质量标签报道子，该报道子可以利用质谱测量。将Xpandomer计量装进窄毛细管中，该毛细管依序将报道子供给电喷雾离子发生器。为了使分离的质量标签报道子进行质谱测量，在质量标签刚刚离子化之前、之中或之后，可以将质量标签从报道子平台上光裂解下来。基于质谱的磁性区域、四极或飞行时间(“TOF”)可以用于质量标签检测。该仪器仅需要区别数量有限的质量间隔的标签。这可以用于提高该仪器的灵敏度和通量。同样，利用具有并行进行离子化和检测的多种通道的仪器，可以将通量提高数个数量级。

质谱方法检测的一个实施方案是，可以同时可读＞100个通道的多通道TOF质量检测仪。适当的仪器可使用多通道电离源，其将Xpandomer以使通道利用率最大化的浓度和速度装进多个通道，从而使优质数据的产出速度最大化。这种电离源需要具有质量标签报道片段的适当分离。当质量标签从纳米孔中出来并且被离子化时可以被光裂解。离散需求不高，因此短的飞行试管是所需要的全部。用多通道质谱检测方法，极高的测量通量是有可能的。例如，以每秒10,000个报道密码的速度阅读的带100个纳米孔离子通道的阵列可以达到＞4M碱基/秒的仪器通量。

在另一个实施方案中，以类似于Coulter计数器的方式使用纳米孔(图55)。在该设备中，Xpandomer的电荷密度经设计，与天然DNA的相似。报道子经设计产生3种水平的电阻，它们可以在例如纳米孔检测仪中测量。Xpandomer呈现于带高浓度电解质，如1M KCl的自由溶液中。纳米孔的直径为2-15nm，长度为4-30nm。为了获得连接臂构建体标签的令人满意的分辨率，选择那些接近相同长度或更长的。用于3种水平的标签直径可以是不同的。连接臂构建体的连接附近的Xpandomer片段不具有报道子(例如PEG)，这个片段将有特定的阻电水平。三种报道子水平之一可以是等同的。不同的电阻特征，包含电阻水平和时间应答，可以通过改变片段长度、电荷密度和分子密度来产生。例如，为了获得3种不同的电阻水平，标记的连接臂构建体片段可以经化学编码而耦合于三种不同多聚体类型之一，每种类型都带有不同的长度和电荷密度。

当Xpandomer穿过纳米孔检测仪时，根据所呈现的标签类型来调整电流。存在于纳米孔中的带电荷的多聚体的数量，既影响电解质种类的电流又影响迁移速度。

通过纳米孔进行基于多聚体的检测，在例如美国专利6,465,193和7,060,507中得到证明，还证明多聚体的物理参数如预期一样调节纳米孔的电输出。在此通过引用将这些专利和相关技术并入。

在另一个基于纳米孔的检测仪器(图56)的实施方案中，当应用电压穿过固相支持体薄膜时，用附于纳米孔上的横向电极测量纳米孔中一侧到另一侧的电阻或电导。这具有区分迁移函数和电阻函数的优势。因为将Xpandomer转运通过纳米孔，因此电流调制再次得以测量。应用微流体和微移液技术以及拖曳标签、磁珠、电拉伸技术等，来转运Xpandomer通过纳米孔。例如，末端标记的自由溶液电泳，也称为ELFSE，是破坏自由穿流的DNA的电荷与摩擦力平衡的方法，该方法可以用于自由溶液的Xpandomer的电泳(Slater et al.，“End-labeled free-solution electrophoresisof DNA”，Electrophoresis 26：331-350，2005)。

连接、拉伸、标记和测量大DNA片段的方法，已确立很久(Schwartzet al.，“A single-molecule barcoding system using nanoslits for DNAanalysis”，PNAS，104(8)：2673-2678，2007；和Blanch et al.，“ElectrokineticStretching of Tethered DNA”，Biophysical Journal 85：2539-2546，2003)。然而，用于天然核酸全基因组测序目的的单核碱基的分辨率，超出了这些技术的能力。在图57-59中，描述了几个“单分子”Xpandomer的检测方法。图57中描绘了显微镜，并可以考虑利用Xpandomer结构更高空间分辨率的任意多种直接成像技术。将Xpandomer分子平放于通常平坦的表面并且沿其长度扫描。实例包括光显微镜和荧光显微镜。使用高分辨率的显微镜在大多数的情况下被限制于仍可能带长连接臂(例如100nm每个报道子)的＞100nm的分辨率。更高的分辨率(例如需要连接臂＜100nm每个报道子)可以使用例如全内反射的荧光显微镜(TIRF：Starr，T.E.et.al.，Biophys.J.80，1575-84，2001)、零模式波导(Levine M.J.et al.，Science 299，682-85，2003)或近场光学显微镜(NSOM：de Lang et al.，J.Cell Sci.114，4153-602001)或共焦激光扫描显微镜来获得。在局部FRET激发的情况下，反应可以被局限于＜10nm从而导致连接臂长度为约10nm每个报道子。

通过电子显微镜检测和分析大DNA分子，已确立立很久(Montoliu etal.，“Visualization of large DNA molecules by electron microscopy withpolyamines：application to the analysis of yeast endogenous and artificialchromosomes”，J.Mol.Bio.246(4)：486-92，1995)，然而，使用这些方法进行多核苷酸的准确和高通量的测序已被证明是困难的。在图58中，概念性地描述了用于检测Xpandomer的透射(TEM)和扫描电子显微镜(SEM)。在此使用聚焦的电子束扫描Xpandomer，其通常又是平放于表面上的。Xpandomer的结构面貌用于解码主链上的遗传信息。可以使用样品固定和喷射技术来提高放大率，该技术能使个体和原子尺寸特征的分子成像。

纳米电极门控的电子通道的电导光谱学也是重要的，其中两个纳米电极端之间的通道电子束由顶端之间的Xpandomer的转运所调节(Lee etal.，“Nanoelectrode-Gated Detection of Individual Molecules with Potentialfor Rapid DNA Sequencing”，Solid State Phenomena 121-123：1379-1386，2007)。Xpandomer可以通过其屏蔽传导效应而干扰通道电流，该作用可以通过使用适宜报道子而在天然DNA上放大。该技术拥有不需要样品固定和真空要求的优势，并且理论上来说，可以用电极门的大量平行阵列并行阅读很多个Xpandomer。

在图59中，概念性地举例说明了原子力显微镜。在简单的实施方案中，放置于敏感的悬臂上的纳米管扫过表面，并且将探针和样品表面之间的吸引力和排斥力翻译成被扫描的表面的拓扑图。这种技术可以达到很高的分辨率但是其扫描速度相对缓慢(M.Miles，Science 277，1845-1847(1997))。扫描通道电子显微镜(STM)是表面成像的相关技术；然而探针并不接触表面，但可测量该表面和探针之间的通道电流。在此，可以将Xpandomer平放于表面，并且用探针尖端进行物理扫描，该探针尖端非常像唱片上的留声机针头。

序列组装

可以用已公开的人类基因组参考序列(或其他参考序列)作为比对工具，协助组装SBX所产生的大量序列数据。尽管可能包含小的位置识别的序列缺口，所述基于Xpandomer的SBX的长读长能力，简化并提高了组装全基因组序列的保真度。如上文所讨论的，该过程可以通过在阵列反应表面的尺寸狭窄的位置上区分相邻的片段而得以进一步简化。在这个实施方案中，该解析方法可以极大地减少组装时间和错误。

单体构建体

图9提供了本发明单体构建体的概貌。总共区分了五种类型，包括四种RT-NTP类型(VI、VII、VIII和IX)和一种XNTP类型(X)。每种类型会在下文分别讨论。

VI-X型的单体构建体与I-V型的寡聚构建体的不同在于它们使用单个核碱基残基作为底物。在以下描述中，N指任何核碱基残基，但通常是本文的核苷酸三磷酸或其类似物。它在连接臂上(也在本文做了描述)有一个连接点，例如连接于碱基的杂环上、核糖基上或核碱基残基的α-磷酸盐上。如所述，用于模板指导合成的主要方法使用了聚合酶，但任何可以进行模板指导合成的方法都是适合的，包括化学和酶促连接方法。

对于使用ε和δ连接基团产生亚基间连接的底物构建体而言，各种商业上可获得的适宜化学物质(Pierce，Thermo Fisher Scientific，USA)可以用于该目的。通常的连接化学物质包括，例如带有胺的NHS-酯、带有巯基的马来酰亚胺、带有胺的亚氨酸酯、用于与胺反应的带羧基的EDC、带巯基的二硫吡啶等。其他实施方案包括使用诸如酰肼(HZ)和4-甲酰苯甲酸酯(4FB)等的功能基团，这些功能基团可以随后进一步反应形成连接。具体来说，各种交联剂(异或同双功能的)是可以广泛获得的(Pierce)，包括但不限于，Sulfo-SMCC(硫代琥珀酰亚胺4-[N-马来酰亚胺甲基]环己胺-1-羧酸盐)、SIA(N-琥珀酰亚胺碘醋酸)、Sulfo-EMCS([N-e-马来酰亚胺癸酰基]硫代琥珀酰亚胺酯)、Sulfo-GMBS(N-[g-马来酰亚胺丁酰基]硫代琥珀酰亚胺酯)、AMAS N-(a-马来酰亚胺乙酰基)琥珀酰亚胺酯)、BMPS(NEMCA(N-e-马来酰亚胺己酸)-[β-马来酰亚胺丙酰基]琥珀酰亚胺酯)、EDC(1-乙基-3-[3-二甲基氨丙基]碳酰二亚胺盐酸盐)、SANPAH(N-琥珀酰亚胺-6-[4′-叠氮基-2′-硝基苯氨基]己酸)、SADP(N-琥珀酰亚胺(4-叠氮苯)-1，3′-二硫代丙酸酯)、PMPI(N-[p-琥珀酰亚胺苯]异氰酸盐、BMPH(N-[β-马来酰亚胺丙酸]酰肼，三氟乙酸盐)酸酯)、EMCH([N-e-马来酰亚胺己酸]酰肼、三氟乙酸盐)、SANH(琥珀酰亚胺4-烟酰肼丙酮腙)、SHTH(琥珀酰亚胺4-邻苯二甲酸肼盐酸盐)，以及C6-SFB(C6-琥珀酰亚胺4-甲酸基苯甲酸酯)。Letsinger等(“Phosphorothioate oligonucleotides having modifiedinternucleoside linkages”，美国专利6,242,589)所公开的方法也可以适用于形成硫羟磷酸酯键。

此外，已确定已久的保护剂/去保护剂化学物质可以广泛地用于通常的连接部分(Benoiton，“Chemistry of Peptide Synthesis(肽合成化学)”，CRC Press，2005)。氨基的保护剂包括但不限于，9-氨基甲酸芴甲酯(Fmoc-NRR′)、t-丁基氨基甲酸盐(Boc-NRR′)、苯甲基氨基甲酸盐(Z-NRR′、Cbz-NRR′)、三氟乙酰胺、酞亚胺、苄胺(Bn-NRR′)、三苯基甲胺(Tr-NRR′)和苯亚甲基胺p-甲苯磺胺(Ts-NRR′)。羧基保护剂包括但不限于，甲酯、t-丁酯、苯甲酯、S-t-丁酯，以及2-烷基-1，3-唑啉。羰基保护剂包括但不限制于，二甲基乙缩醛-1，3-二氧杂环乙烷和1，3-二噻烷N，N-二甲基腙。羟基的保护剂包括但不限于，甲氧甲基醚(MOM-OR)和吡喃醚(THP-OR)、t-丁基醚、烯丙醚、苯甲基醚(Bn-OR)、t-丁基二甲基甲硅烷基醚(TBDMS-OR)、t-丁基二苯基甲硅烷基醚(TBDPS-OR)、醋酸酯、新戊酸酯，以及苯甲酸酯。

在本文中，通常将连接臂描述为带三个报道基团的报道构建体，多种报道子构型可以排列于连接臂上，并且可以包含识别底物的单个报道子、识别底物的多个报道子，或者连接臂可以是裸露的多聚体(无报道子)。需要注意的是报道子可以用于同步检测、误差修正、重复或其他功能。在裸露的多聚体的情况下，报道子可以是底物本身或可以在连接于底物的第二个连接臂上。在一些情况下，将一个或多个报道子前体排列于连接臂上，在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

上文已公开了一些报道编码策略，下文将进一步讨论。例如，假定底物耦合是定向的，2比特的二进制编码的每个单体会产生四种独特的密码序列(11、10、01、00)，该序列可以用于识别每种序列碱基(腺嘌呤″A″、胞嘧啶″C″、鸟嘌呤″G″、胸腺嘧啶″T″)。如果是非定向的，那么第3位比特就可以提供明确的编码。可选地，单个4态多元的报道构建体为每种序列碱基提供了一种独特的报道密码。可以考虑多种功能和标记策略用于连接臂构建体，例如包括作为报道支架一部分的功能化的树枝状聚合物、多聚体、支化聚合物、纳米颗粒和纳米晶体，以及可通过适当的检测技术检测到的带检测特性的报道化学物质，该检测技术包括，例如荧光、FRET发射器或激发器、电荷密度、大小或长度。在Xpandomer组装之前或之后，可以将碱基特异性标签并入到连接臂中作为标记的底物。一旦Xpandomer被完全释放或延伸，可以利用一系列检测方法检测和分析报道密码。

适合作为单体底物的底物文库包括(但不限于)修饰的ATP、ATP、CTP、TTP和UTP。

VI型单体构建体

图60更详细地描述了VI型单体底物构建体(RT-NTP型)。从左向右看图60A-60C，首先显示了单体底物构建体(Xpandomer前体具有单个核碱基残基)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图60A所示，VI型单体底物构建体具有连接臂T(600)，该连接臂通过第一末端部分的连接(601)连接于底物核碱基残基N。连接基团ε被放置于连接臂的第一末端部分(603)上，离R¹最近。在连接臂的远端(604)，带有第二连接基团δ的第二末端部分被放置于离R²最近的位置。连接臂的第二末端部分通过连接臂内的选择性可剪切交联键(或通过其他约束)在接近核碱基处将第一末端部分牢牢地固定。连接臂内的可剪切交联键(605)在此以虚线表示，该键可以表示，例如二硫键或光裂解键。此约束可防止连接臂延伸或展开并处于其“受约束的构型”中。在模板指导组装下，底物与靶模板双链体化而使底物相邻接。在可控的条件下，邻接底物的并列放置的连接基团δ和ε在相邻底物构建体之间连接而形成键。单体底物构建体的连接基团δ和ε由于位置约束而不形成底物内键。适宜的连接和用于δ、ε和χ的保护/去保护的化学物质在单体构建体的一般性描述中进行了详述。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，可用于连接方法中，而R¹＝5’-三磷酸盐和R²＝3’-OH，可用于聚合酶方法。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选地，R¹和R²可以设置成带有末端连接基团，而用于化学耦合，或设置成不带有连接基团，而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

在组装期间，单体底物构建体首先利用单链模板作为向导通过模板指导聚合而聚合在新生子链的可延伸末端。一般，此方法由引物开始并沿5’到3’方向进行。通常用DNA聚合酶或其他聚合酶形成子链，并选择条件，获得模板链的互补拷贝。随后，连接基团δ，其与相邻亚基连接臂的连接基团ε并列放置，经可选择性交联形成χ键，该χ键是连接臂间的、亚基间的键。该χ键结合连续的链中的连接臂，形成称为“双链体子链”的中间体，如图60B中所示。在χ键形成之后，可以断裂连接臂内的键。

该双链体子链(图60B)与括号中所示的亚基是异质共聚物。一级主链(～N～)κ、模板链(-N’-)κ和连接臂(T)显示为双链体化的子链，其中κ表示多个重复亚基。子链的每个亚基是重复基序并且这些基序具有种类特异的可变性，在此以α上标表示。子链由单体底物构建体的种类形成，该种类通过模板指导方法由基序种类文库选择，每个底物构建体种类的单体底物结合于靶模板链上相应的互补核苷酸。因此，子链的核碱基残基(即一级主链)的序列是靶模板链的连续的互补拷贝。

每个代字号(～)表示选择性可剪切键，在此表示为底物间的键。这些键是选择性可剪切的，释放并展开连接臂(和Xpandomer)，而不降解Xpandomer自身。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，该“受约束的Xpandomer”进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，受约束的Xpandomer就转变为Xpandomer产物。连接臂受亚基间的χ连接、底物连接约束，以及任选地受连接臂内的连接约束，如果该连接臂内的连接仍然存在。χ连接将第一亚基的连接臂成员连接到第二亚基相邻末端处的第二连接臂末端上，并通过连接并列放置的第一亚基的连接基团δ和第二亚基的连接基团ε而形成。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的且聚合的单体底物构成。“受约束的Xpandomer主链”绕过单体底物之间的选择性可剪切连接，并且由χ键连接的主链部分构成，每个主链部分是一个连接臂。可以看出，受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接，并且当这些选择性可剪切键受到剪切和一级主链片段化时，仍然保持共价完整。

一般在单体底物的酶促耦合先于连接臂χ键(连接基团δ和ε的交联)，形成一级主链，伴随在相邻碱基之间的例如磷酸二酯键。在此所示的结构中，子链一级主链已经形成，以代字号(～)表示的底物间的键，显示它们是选择性可剪切的。在靶模板链的解离或降解和剪切选择性可剪切键(包括连接臂内的键)之后，受约束的Xpandomer得以释放而成为Xpandomer产物。模板链的解离方法包括热变性，或以核酸酶选择性地消化，或化学降解。用于选择性剪切的方法使用核酸酶消化，其中例如通过核酸酶消化一级主链的磷酸二酯键，而连接臂与连接臂的键是抗核酸酶的。

图60C表示在模板链解离之后和在一级主链选择性可剪切键(包括在一级主链中的那些键，以及尚未被剪切的连接臂内的键)剪切之后产生的VI型Xpandomer产物。Xpandomer产物链含有多个亚基κ，其中κ表示在构成子链的m个亚基的链中的第κ个亚基，其中κ＝1、2、3至m，其中m＞10，一般m＞50，通常m＞500或＞5,000。每个亚基由处于展开的构型的连接臂形成，并且每个亚基在相邻亚基的χ连接之间伸展至其长度。悬垂的底物连接于每个亚基中的连接臂上。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图60D显示了作为分子模型的图60A的底物构建体，其中单体底物成员以核碱基残基(606)来表示，通过连接臂第一末端部分的连接(607)连接于连接臂。连接基团(608)也排列于第一末端部分上，在图60A中表示为ε。第二连接基团(609)，在图60A中表示为δ，排列于连接臂远端的第二末端部分上。选择性可剪切的连接臂内的连接(602)，以邻接的三角形表示，显示出该键通过连接第一和第二末端部分来约束连接臂。将连接基团ε和δ放置在不相互作用的位置，并优先分别在接近底物的R¹和R²侧排列。在此所示的连接臂环(600)具有三个报道子(590、591、592)，它们也可以是基序种类特异性的。

图60E显示了并入到产物Xpandomer之后的底物构建体。该亚基受到剪切、伸展并通过χ键(580、581)连接，以开放的椭圆表示，通过连接在图60A中提到的连接基团δ与ε而形成。亚基用垂直地将重复亚基括在一起的虚线表示，该重复亚基通过附图60C中的括号来呈现。

在图60E的Xpandomer产物中，一级主链已经片段化并且不是共价连续的，因为相邻亚基的底物之间的任何直接键已受到剪切。通过该剪切过程，受约束的Xpandomer得以释放而变成Xpandomer产物。原来处于受约束构型的连接臂成员现在处于展开的构型，从而发挥线性伸展模板靶标的序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并提供了用于增加报道子的尺寸与丰度的平台，这依次改善用于模板序列检测和解码的信噪比。

当连接臂描绘为带有三个报道基团的报道构建体时，可以将各种报道子构型排列在连接臂上，并可以包含能识别单体的单个报道子，或连接臂可以是裸露的多聚体。在一些情况下，将一个或多个报道子前体排列在连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

现在转至图61，展示了使用单体底物构建体的单碱基延伸(single baseextension，SBE)方法。末端适应的靶模板(或随机的靶模板序列，由固定的引物的性质而定)，首先与固定的引物退火。在步骤I之前，将固定的模板(611)与单体底物构建体文库以及聚合酶(P)接触，将该文库的成员出于示例说明而显示(612)。调整条件使之适于模板指导合成。在此实例中，第一单体底物的5’末端(图60A和60D中的R²)发生聚合来启动新生的子链。底物的3’端(图60A与60D中的R¹)已经被取代从而可逆地阻断进一步的延伸。这在放大的图61a中(虚线)进行了更详细的表示，其中单体底物显示为邻接引物。此底物是5’-三磷酸盐，通过聚合酶反应与引物形成磷酸二酯键。需要注意的是，图61c中所示的反应功能基团(图60A中的δ)在添加第一个底物中(如图61a以矩形表示)通常是钝化的(通过反应或其他方法)。

在图61的步骤I中，去除嵌段基团(单个矩形)而使另一单体能够添加(延伸)。用于可逆地封闭3’末端的方法包括，使用钯(Pd)催化去除烯丙基，重建可行的3’羟基末端，或使用′-O-(2-Nitrobenzyl)终止核苷酸，其中活性羟基可以如Ju等所述(“Four-color DNA sequencing by synthesisusing cleavable fluorescent nucleotide reversible terminators”，PNAS 26；103(52)：19635-19640，2006，以及“Four-color DNA sequencing bysynthesis on a chip using photocleavable fluorescent nucleotides”，PNAS 26；102(17)：5926-31，2005)，通过暴露于UV源来光裂解终止部分而再生。该再生的3’-OH更详细地展示于放大的图61b中。在此图中，相邻底物构建体的邻接末端和引物聚合，并且新生子链的3’-OH末端通过去除嵌段基团而激活。在步骤II中，将模板与单体底物构建体文库接触，其中功能性的δ基团在可控的条件下是反应性的，单体底物可以聚合到新生的子链上。该聚合使邻接的底物构建体的ε(608)和δ(609)基团并列放置，如图61c所示。在步骤III中，在可控的条件下，这些基团发生反应而形成χ键(580)，更详细地展示于图61d中。

如举例说明的，经由步骤II、III与IV的循环，使新生的子链每次通过添加的底物(构建体)而延伸。通常可用漂洗步骤去除步骤之间未反应的反应物。因此该过程类似于文献中称为循环的“单碱基延伸”过程。该过程以聚合酶P展示，但可以适用于连接酶或化学连接方法，该方法适宜在模板指导合成中用于结合底物构建体。步骤V显示了Xpandomer(605)的子链中间体。该中间体可以用例如核酸酶从模板和引物中解离，该核酸酶攻击子链的一级主链，从而解除受约束的连接臂并释放Xpandomer产物。

对于所有的SBE方法，在循环之间进行有效的漂洗有助于减少不需要的副反应。为了进一步促进单个碱基经由带有高级二级结构模板区域的并入，可以在贯穿每个延伸的循环中改变延伸的温度和/或也可以添加附加剂或佐剂例如甜菜碱、TMACL或PEG来中和二次结构的影响(如在常规的聚合酶延伸方法中所做的一样)。如果需要，可以变化底物构建体种类的化学计算法，以均衡对某些碱基例如C或G偏好的反应。

产生VI型Xpandomer的可选方法是，进行基于聚合酶的持续的聚合。可以考虑DNA和RNA聚合酶，以及任何已证明可催化RT-NTP精确聚合的同样功能的酶，该RT-NTP缺少可逆地末端封闭R的基团，用于本方法。

各种交联化学物质在本领域是已知的，并且可以用于χ键的形成。这些包括使用带有胺的NHS酯、带有巯基的马来酰亚胺、带有胺的亚氨酸酯、用于与胺反应的带有巯基与羧基的EDC、带有巯基的二硫吡啶等。其他实施方案包括使用如酰肼(HZ)和4-甲酰苯甲酸酯(4FB)的功能基团，这些功能基团可以随后进一步反应连接亚基。在一种选择中，两种不同的连接化学物质ε₁/δ₁和ε₂/δ₂(在本文的其他部分也称为L1/L1′和L2/L2′)反应，分别形成χ¹与χ²键，并可以用于使两组RT-NTP底物构建体进行不同的功能化。例如，如果SBE的一个循环是以ε₁/δ₂功能化的RT-NTP组进行的，随后的SBE循环将使用ε₂/δ₁组，从而导致并列的δ₂/ε₂对反应形成χ¹。交联对的顺序激活可用于最小化交联错误和不需要的副反应。

VII型单体构建体

VII型分子是前面所述VI型的类似物。其主要的不同在于，可剪切键是在连接臂和底物之间而不是在底物之间。在图62中，更详细地公开了VII型单体底物构建体(RT-NTP型)。从左向右看图62A-62C，首先显示了单体底物构建体(Xpandomer前体具有单个核碱基残基)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图62A所示，VII型单体底物构建体具有连接臂T(620)，该连接臂通过选择性可剪切的连接子(621)连接于底物核碱基残基N的第一末端部分。另一连接基团ε(622)排列于连接臂第一末端部分上离R¹最近的位置。在连接臂的远端，带有第二连接基团δ(623)的第二末端部分被排列于离R²最近的位置。连接臂的第二末端部分通过连接臂内的选择性可剪切交联键(624)(或通过其他约束)在接近核碱基处将第一末端部分牢牢地固定。连接臂内的可剪切交联键在此以虚线表示，该键可以表示，例如，二硫键或光裂解键。此约束可防止连接臂延伸或展开并处于“受约束的构型”中。在模板指导组装下，底物与靶模板双链体化而使底物相邻接。在可控的条件下，邻接底物的并列的连接基团δ与ε连接起来而在相邻底物构建体之间成键。单体底物构建体的连接基团δ与ε由于位置约束而不形成底物内键。适宜连接和用于δ、ε和χ的保护/去保护化学物质在单体构建体的一般性描述中进行了详细描述。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，可用于连接方法中，而R¹＝5’-三磷酸盐和R²＝3’-OH，可用于聚合酶方法。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选地，R¹和R²设置成带有末端连接基团，而用于化学耦合，或设置成不带有连接基团，而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

在组装期间，单体底物构建体首先利用单链模板作为向导通过模板指导聚合方法而聚合在新生子链的可延伸末端。一般，此方法由引物开始并沿5’到3’方向进行。通常用DNA聚合酶或其他聚合酶形成子链，并选择条件获得模板链的互补拷贝。随后，使连接基团δ，其与相邻亚基连接臂的连接基团ε并列放置，交联形成χ键，该χ键是连接臂间的、亚基间的键。该χ键结合连续的链中的连接臂，因而形成称为“双链体子链”的中间体，如图62B中所示。在χ键形成之后，可以断裂连接臂内的键。

该双链体子链(图62B)是与括号中所示的亚基的异质共聚物。一级主链(-N-)κ、模板链(-N’-)κ以及连接臂(T)，显示为双链体化的子链，其中κ表示多个重复亚基。子链的每个亚基是重复基序，并且这些基序具有种类特异的可变性，在此以α上标表示。子链由单体底物构建体的种类形成，该种类通过模板指导方法由基序种类文库选择，每个底物构建体种类的单体底物结合于靶模板链上相应的互补核苷酸。因此，子链核碱基残基(即一级主链)的序列是靶模板链的连续的互补拷贝。

代字号(～)表示选择性可剪切键，在此显示为对底物连接子的连接。这些键是选择性可剪切的，释放并展开连接臂(和Xpandomer)而不降解Xpandomer自身。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，该“受约束的Xpandomer”进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，受约束的Xpandomer就转变为Xpandomer产物。连接臂受亚基间的χ连接约束，受底物的可剪切连接约束，以及任选地受连接臂内的连接约束，如果该连接臂内的连接仍然存在的话。χ连接将第一亚基的连接臂第一末端部分连接到位于第二亚基的相邻末端处的连接臂第二末端部分上，并通过连接并列放置的第一亚基的连接基团δ和第二亚基的连接基团ε而形成。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的且聚合的单体底物构成。“受约束的Xpandomer主链”绕过连接底物的选择性可剪切键，并且由χ键连接的主链部分形成，每个主链部分是一个连接臂。可以看出，受约束的Xpandomer主链在连接于一级主链的选择性可剪切键之上桥接，并且当这些选择性可剪切键受到剪切和一级主链解离或片段化时，可以保持共价完整。

一般单体底物的酶耦合先于连接臂χ键(连接基团δ和ε的交联)，形成一级主链，伴随在相邻碱基之间的例如磷酸二酯键。在此所示的结构中，子链一级主链已经形成，以代字号(～)表示的底物间的键，显示它们是选择性可剪切的。在解离或降解靶模板链和剪切选择性可剪切键(包括连接臂内的键)之后，受约束的Xpandomer得以释放而成为Xpandomer产物。模板链的解离方法包括热变性，或以核酸酶选择性地消化，或化学降解。用于选择性剪切的方法使用了核酸酶消化，其中例如通过核酸酶消化一级主链的磷酸二酯键，而连接臂与连接臂的键是抗核酸酶的。

图62C表示在模板链解离之后和在一级主链选择性可剪切键(包括连接于一级主链的那些键，以及尚未被剪切的连接臂内的连接)剪切之后产生的VII型Xpandomer产物。Xpandomer产物链含有多个亚基κ，其中κ表示在构成子链的m个亚基的链中的第κ个亚基，其中κ＝1、2、3至m，其中m＞10，一般m＞50，通常m＞500或＞5,000。每个亚基由处于展开的构型的连接臂(620)构成，并且每个亚基在相邻亚基的χ连接之间伸展至其长度。一级主链已经被完全除去。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图62D显示了作为分子模型图62A的底物构建体，其中单体底物成员，以核碱基残基(626)来表示，通过选择性可剪切的连接(625)连接于连接臂第一末端部分。连接基团(629)也排列于第一末端部分上，在图62A中表示为ε。第二连接基团(628)，在图62A中表示为δ，排列于位于连接臂远端的第二末端部分上。选择性可剪切的连接臂内的连接(627)，以邻接的三角形表示，显示出该连接通过连接第一和第二末端部分来约束连接臂。将连接基团ε(629)和δ(628)放置在不相互作用的位置，并优先分别在接近底物的R¹和R²侧排列。在此所示的连接臂环具有三个报道子(900、901、902)，它们也可以是基序种类特异性的。

图62E显示了并入到产物Xpandomer之后的底物构建体。该亚基受到剪切和伸展，并通过χ键(910)连接，以开放的椭圆表示，通过连接在图62A中提到的连接基团δ和ε而形成。亚基用垂直地将重复亚基括在一起的虚线表示，该重复亚基通过附图62C中的括号来呈现。

在图62E的Xpandomer产物中，一级主链已经解离或片段化，并从Xpandomer分离。通过该剪切过程，受约束的Xpandomer得以释放而变成Xpandomer产物。原来处于受约束构型的连接臂成员现在处于展开的构型，从而发挥线性伸展模板靶标的序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并提供了用于增加报道子的尺寸和丰度的平台，这依次改善用于模板序列检测和解码的信噪比。

当连接臂描述为带有三个报道基团的报道构建体时，各种报道子构型可以排列在连接臂上，并可以包含能识别单体的单个报道子或连接臂可以是裸露的多聚体。在一些情况下，将一个或多个报道子前体排列在连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

VIII型单体构建体

VIII型分子是前面所述VI型的类似物。其主要的不同在于连接基团ε是直接连接于底物而不是连接臂上。在图63中，我们更详细地描述了VIII型单体底物构建体(RT-NTP型)。从左向右看图63A-63C，首先显示了单体底物构建体(Xpandomer前体具有单个核碱基残基)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图63A所示，VIII型单体底物构建体具有连接臂T(630)，该连接臂通过第一末端部分的连接(631)连接于底物核碱基残基N。在连接臂的远端(632)，带有第二连接基团δ的第二末端部分被排列于离R²最近的位置。连接臂的第二末端部分通过连接臂内的选择性可剪切交联键(或通过其他约束)在接近核碱基处将第一末端部分牢牢地固定。连接臂内的可剪切交联键(633)在此以虚线表示，该键可以表示，例如，二硫键或光裂解键。此约束可防止连接臂延伸或展开并处于所说的“受约束的构型”中。连接基团ε(635)连接于优选离R¹最近的单体底物上。在模板指导组装下，底物与靶模板双链体化而使底物相邻接。在可控的条件下，邻接底物的并列放置的连接基团δ和ε连接起来而在相邻底物构建体之间成键。单体底物构建体的连接基团δ和ε由于位置的约束而不形成底物内键。适宜的连接和用于δ、ε和χ的保护/去保护化学物质在单体构建体的一般性描述中进行了详细描述。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，可用于连接方法中，而R¹＝5’-三磷酸盐和R²＝3’-OH，可用于聚合酶方法。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选性地，R¹和R²设置成带有末端连接基团，而用于化学耦合，或设置成不带有连接基团，而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

在组装期间，单体底物构建体首先利用单链模板作为向导通过模板指导聚合而聚合在新生子链的可延伸末端。一般，此方法由引物开始并沿5’到3’方向进行。通常用DNA聚合酶或其他聚合酶子形成链，并选择条件获得模板链的互补拷贝。随后，使连接基团δ，其与相邻亚基连接臂的连接基团ε并列放置，交联形成χ键，该χ键是亚基间的键。该χ键在亚基(聚合的底物间的连接是第一个)之间提供第二连接并形成称为“双链体子链”的中间体，如图63B中所示。

该双链体子链(图63B)与括号中所示的亚基是异质共聚物。一级主链(～N～)κ、模板链(-N’-)κ和连接臂(T)显示为双链体化的子链，其中κ表示多个重复亚基。子链的每个亚基是重复基序，并且所述基序具有种类特异的可变性，在此以α上标表示。子链由单体底物构建体的种类形成，该种类通过模板指导方法由基序种类文库选择，每个底物构建体种类的单体底物结合于靶模板链上相应的互补核苷酸。因此，子链的核碱基残基(即一级主链)的序列是靶模板链的连续的互补拷贝。

每个代字号(～)表示一个选择性可剪切键，在此显示为底物间的键。这些键必需是选择性可剪切的，释放并展开连接臂(和Xpandomer)而不降解Xpandomer自身。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，该“受约束的Xpandomer”进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，受约束的Xpandomer就转变为Xpandomer产物。连接臂受亚基间的χ连接约束，受底物连接约束，以及任选地受连接臂内的连接约束，如果该连接臂内的连接仍然存在的话。χ连接将第一亚基的底物连接到位于第二亚基的连接末端处的连接臂第二末端部分上，并通过连接并列放置的第一亚基的连接基团δ和第二亚基的连接基团ε而形成。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的且聚合的单体底物构成。“受约束的Xpandomer主链”绕过单体底物之间的选择性可剪切连接，并且由χ键连接的主链部分形成，每个主链部分是连接于一个底物的一个连接臂，该底物随后通过χ键连接到下一个主链部分连接臂上。可以看出，受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接，并且当这些选择性可剪切键受到剪切和一级主链片段化时，可以保持共价完整。

一般单体底物的酶促耦合先于连接臂χ键(连接基团δ和ε的交联)，形成一级主链，伴随在相邻碱基之间的例如磷酸二酯键。在此所示的结构中，子链一级主链已经形成，以代字号(～)表示底物间的连接，表示它们是选择性可剪切的。在解离或降解靶模板链和剪切选择性可剪切键(包括连接臂内的键)之后，受约束的Xpandomer得以释放而成为Xpandomer产物。模板链的解离方法包括热变性，或以核酸酶选择性地消化，或化学降解。选择性剪切的方法使用核酸酶消化，其中例如通过核酸酶消化一级主链的磷酸二酯键而连接臂与连接臂的键是抗核酸酶的。

图63C表示在模板链解离之后和在选择性可剪切键(包括连接于一级主链的那些键，以及尚未被剪切的连接臂内的连接)剪切之后产生的VIII型Xpandomer产物。Xpandomer产物链含有多个亚基κ，其中κ表示在构成子链的m个亚基的链中的第κ个亚基，其中κ＝1、2、3至m，其中m＞10，一般m＞50，通常m＞500或＞5,000。每个亚基由处于展开的构型的连接臂形成，并且每个亚基在相邻亚基的χ连接之间伸展至其长度。悬垂的底物连接于每个亚基中的连接臂上。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图63D显示了作为分子模型图63A的底物构建体，其中单体底物成员，以核碱基残基(634)来表示，通过连接臂第一末端部分的连接(631)连接到连接臂上。第二连接基团(639)，在图63A中表示为δ，排列于位于连接臂远端的第二末端部分上。选择性可剪切连接臂内的连接(633)，以邻接的三角形表示，显示出该连接通过连接第一和第二末端部分来约束连接臂。连接基团(638)也连接于底物上，在图63A中表示为ε。将连接基团ε(638)和δ(639)放置在不相互作用的位置，并优选分别在接近底物的R¹和R²侧排列。在此所示的连接臂环具有三个报道子(900、901、902)，它们也可以是基序种类特异性的。将图63D和图63E中所示的可剪切连接臂内的交联键(633)放置在比δ(639)更接近于底物的位置。图60D和图60E中的上述位置是相互交换的。此放置可以用在任意位置，并且在一个实施方案中双方的连接功能可以在单个多功能基团上。

图63E显示了并入到产物Xpandomer之后的底物构建体。该亚基被剪切和展开并通过χ键(970，971)连接，χ键以开放的椭圆表示，通过连接在图63A中提到的连接基团δ和ε而形成。亚基用垂直地将重复亚基括在一起的虚线表示，该重复亚基通过附图63C中的括号来呈现。

在图63E的Xpandomer产物中，一级主链已经被片段化并且不是共价连续的，因为相邻亚基的底物之间的任何直接键已经受到剪切。通过该剪切过程，受约束的Xpandomer得以释放而变成Xpandomer产物。原来处于受约束构型的连接臂成员现在处于展开的构型，从而发挥线性伸展模板目标序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并提供了用于增加报道子的尺寸和丰度的平台，这依次改善用于模板序列检测和解码的信噪比。

当连接臂(630)描述为带有三个报道基团的报道构建体时，各种报道子构型可以排列在连接臂上，并可以包含能识别单体的单个报道子或连接臂可以是裸露的多聚体。在一些情况下，将一个或多个报道子前体排列在连接臂上，并且在Xpandomer产物组装之后，报道子是亲和结合的或共价结合的。

IX型单体构建体

IX型底物构建体是不同于其他RT-NTP的，因为其具有两个连接臂连接位点，在一级主链已经组装之后游离的连接臂可以连接到该位点上。图64更详细地描述了IX型单体底物构建体(RT-NTP型)。从左向右看图64A-64C，首先显示了单体底物构建体(Xpandomer前体具有单个核碱基残基)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图64A所示，IX型单体底物构建体具有底物核碱基残基N，其带有两个连接臂连接位点，连接基团δ₁和δ₂。也展示了游离的连接臂T(640)，其带有第一和第二连接臂末端部分的连接基团ε₁和ε₂。连接臂的第一和第二末端部分通过连接臂内的选择性可剪切交联键(647)约束游离的连接臂并用于使连接基团ε₁与ε₂并列放置。可剪切交联键在此以虚线表示，该键可以表示，例如，二硫键或光裂解键。此约束可防止连接臂延伸或展开并处于所说的“受约束的构型”中。连接基团δ₁和δ₂分别连接到定向于离R¹和R²最近的单体底物上。在模板指导合成下，底物与靶模板双链体化，并且一个底物构建体的连接基团例如δ₁，和邻接底物构建体的连接基团例如δ₂，是并列放置的。在可控的条件下，这些并列放置的连接接触游离的连接臂末端上并列放置的ε连接子。两个选择性的连接反应会发生，ε₁和δ₁形成χ¹而ε₂和δ₂形成χ²；于是相邻的亚基通过受约束的连接臂而桥接。适宜的连接和用于δ、ε和χ的保护/去保护化学物质在单体构建体的一般性描述中进行了详细描述。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-磷酸盐和R²＝3’-OH，可用于连接方法中，而R¹＝5’-三磷酸盐和R²＝3’-OH，可用于聚合酶方法。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选地，R¹和R²可设置成成带有末端连接基团，而用于化学耦合，或设置成成不带有连接基团，而用于仅杂交的方法。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

在组装期间，单体底物构建体(无连接臂)使用单链模板作为向导通过模板指导聚合而聚合在新生子链的可延伸末端。一般，此方法由引物开始并沿5’到3’方向进行。通常，用DNA聚合酶或其他聚合酶形成子链，并选择条件获得模板链的互补拷贝。随后，连接基团δ₁和相邻单体底物的连接基团δ₂并列放置。在一级主链聚合之后，游离的连接臂交联而在两个连接臂和两个相邻底物之间形成χ¹键和χ²键。

在一个实施方案中，游离的连接臂不具有序列信息而称为“裸露的”。在此情况下，可以使用单个连接化学物质，因而连接基团δ₁和δ₂是相同的并且连接基团ε₁和ε₂是同样带有一χ键类型的。

在种类特异性的自由连接臂的实施方案，该自由连接臂包含碱基类型信息(在报道子中的)。一般，存在4种碱基类型，该4种碱基类型将需要4种带有相应碱基信息的游离的连接臂类型。一些方法可以用于将正确的游离连接臂种类连接到其正确的碱基上。在一种方法中，用4种异特异性连接化学物质进一步区分连接对δ₁和ε₁，以δ_1α和ε_1α表示，其中α是4种类型之一并且形成的键类型为χ^1α。一种α类型的δ_1α和ε_1α将只互相结合。在此方法中，仅仅在δ_1α和ε_1α已经形成之后，使连接对δ₂和ε₂结合。在第二种方法中，用不同的可选择性去保护的保护基团选择性封闭连接基团，其中每种保护基团都与一种连接子类型相连。在第一轮循环中，一种碱基类型上没有保护，并且其相连的自由连接臂类型是ε₁和δ₁的结合而形成χ¹键。在第二个循环中，将一种类型的保护基团从一种碱基类型去除，其相连的游离连接臂类型为ε₁和δ₁的结合而形成χ¹键。其后的循环是下两种碱基类型的重复，在其完成之后，使连接对δ₂和ε₂结合。在每个步骤之间，引入漂洗步骤来减少结合错误。在不损害通用性的条件下，剩余的描述将从χ¹键和χ²键方面进行。需要注意的是，在连接臂连接和χ键形成之后，可以断裂连接臂内的键。

如图64B所示，χ¹键在亚基之间提供连接(除聚合的底物间的连接之外)并形成称为“双链体子链”的中间体。一级主链(～N～)κ、模板链(-N’-)κ和连接臂(T)显示为双链体化的子链，其中κ表示多个重复亚基。子链的每个亚基是重复基序，并且所述基序具有种类特异的可变性，在此以α上标表示。子链由单体底物构建体的种类形成，该种类通过模板指导方法由基序种类文库选择，每个底物构建体种类的单体底物结合于靶模板链上相应的互补核苷酸。因此，子链的核碱基残基(即一级主链)的序列是靶模板链的连续的互补拷贝。

每个代字号(～)表示选择性可剪切键，在此显示为底物间的键。这些键必需是选择性可剪切的，释放和展开连接臂(和Xpandomer)而不降解Xpandomer自身。

子链由称为“受约束的Xpandomer”的Xpandomer前体构成，该“受约束的Xpandomer”进一步由“受约束的构型”的连接臂构成。当连接臂转变为它们的“展开的构型”时，受约束的Xpandomer就转变为Xpandomer产物。连接臂受相邻底物的χ连接的约束，以及任选地受连接臂内的连接(如果仍然存在的话)约束。

可以看出，子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续相邻的且聚合的单体底物构成。“受约束的Xpandomer主链”绕过单体底物之间的选择性可剪切连接，并且由χ¹键连接的主链部分形成，每个主链部分是连接于底物(通过χ²键)的连接臂，该底物随后通过χ¹键连接到下一个主链部分连接臂上。可以看出，受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接，并且当这些选择性可剪切键受到剪切和一级主链片段化时，可以保持共价完整。

一般单体底物的酶促耦合先于连接臂χ键(连接基团δ和ε的交联)，形成一级主链，伴随在相邻碱基之间的例如磷酸二酯键。在此所示的结构中，子链一级主链已经形成，以代字号(～)表示底物间的连接，表示它们是选择性可剪切的。在解离或降解靶模板链和剪切选择性可剪切键(包括连接臂内的键)之后，受约束的Xpandomer得以释放而成为Xpandomer产物。模板链的解离方法包括热变性，或以核酸酶选择性地消化，或化学降解。选择性剪切的方法使用了核酸酶消化，其中例如通过核酸酶消化一级主链的磷酸二酯键而连接臂与连接臂的键是抗核酸酶的。

图64C表示在模板链解离之后和在选择性可剪切键(包括连接于一级主链的那些键，以及尚未被剪切的连接臂内的连接)剪切之后产生的IX型Xpandomer产物。Xpandomer产物链含有多个亚基κ，其中κ表示在构成子链的m个亚基的链中的第κ个亚基，其中κ＝1、2、3至m，其中m＞10，一般m＞50，通常m＞500或＞5,000。每个亚基由处于展开构型的连接臂(640)形成，该连接臂连接于单体底物并与下一个相邻亚基连接于χ¹连接。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图64D显示了作为分子模型图64A的底物构建体，其中单体底物成员以核碱基残基(641)来表示，具有两个连接(642、643)，在图64a中表示为δ₁和δ₂，可以作为游离的连接臂的连接位点。游离的连接臂以连接臂的第一和第二末端部分上的两个连接基团连接子基团(644、645)表示，在图64A中表示为ε₁和ε₂。选择性可剪切连接臂内的连接(647)显示出该连接通过连接第一和第二末端部分来约束连接臂。设定连接基团的位置来促进在单体底物之间的连接臂末端的交联，并防止越过单体底物的交联。

在此所示的连接臂环具有三个报道子(900、901、902)，其可以是基序种类特异性的但需要一种方法来使其正确地连接于一级主链中的正确碱基上。

图64E显示了并入到产物Xpandomer之后的底物构建体。该亚基被剪切、伸展并通过连接臂之间的χ¹键(930、931)和连接臂之间的χ²键(932、933)连接。每个亚基是连接于单体底物连接臂，并且连接到下一个χ¹键上。亚基用垂直地将重复亚基括在一起的虚线表示，该重复亚基通过附图64C中的括号来呈现。

在图64E的Xpandomer产物中，一级主链已经片段化并且不是共价连接的，因为相邻亚基的底物之间的任何直接键已经受到剪切。通过该剪切过程，受约束的Xpandomer得以释放而变成Xpandomer产物。原来处于受约束构型的连接臂成员现在处于展开的构型，从而发挥线性伸展模板靶标序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并提供了用于增加报道子的尺寸和丰度的平台，这依次改善用于模板序列检测和解码的信噪比。

图65展示了用IX型RT-NTP底物构建体合成Xpandomer的方法。首先选择靶模板(650)并使与固定引物退火。在步骤I中，该引物通过子链的模板指导合成而延伸。该过程在步骤II中继续，并在图65a中以放大的图(虚线箭头)显示子链。展示了模板链、引物和聚合的IX型核碱基底物构建体(无连接臂)，带有化学功能性的每个底物构建体以锁和钥匙符号表示，用于连接臂反应物的化学添加。选择该功能性以便使每个单体具有碱基特异性连接臂连接位点和通用连接位点。在步骤III中，引入带有4个种类特异性的连接子的发夹结构连接臂。该连接臂以碱基特异方式依照图65b放大的图中(虚线的箭头)所示的碱基特异性连接子连接于一级主链上。在此，白的与黑的圆圈表示通用的连接化学物质，菱形与分叉形表示碱基特异性连接化学物质。在步骤IV和图65c放大的图中(虚线的箭头)，在所有的碱基特异性连接之后，使通用的连接子成键。需要注意的是，在连接臂和一级主链两者上的通用连接子是紧邻它们的特异性连接子对应物，以便避免连接错误。连接臂反应物的化学连接被显示为已经完成，并且受约束的Xpandomer已经形成于模板上。随后通过从模板解离和剪切选择性可剪切键(一级主链和连接臂内的键)，释放Xpandomer(未展示)。

X型单体构建体

X型底物构建体，也称为XNTP，不同于RT-NTP的是连接臂是，包含于每个单体底物内来形成底物内连接臂，每个XNTP底物在底物之内具有选择性可剪切键，其一旦受到剪切，可使受约束的连接臂展开。在图66中，我们更详细地描述了X型单体底物构建体。从左向右看图66A-66C，首先显示了单体底物构建体(具有单个核碱基残基的Xpandomer前体)，然后是位于中间的中间体双链体子链，而右边是准备用来测序的Xpandomer产物。

如图66A所示，X型单体底物构建体具有底物核碱基残基N，该残基具有由选择性可剪切键(665)分开的两部分(662，663)，每个部分连接于连接臂(660)的一个末端。连接臂末端可以连接于杂环、核糖基团或磷酸盐主链上的修饰的连接基团。单体底物也具有放置于核糖基磷酸酯(phosphororibosyl)主链内的底物内剪切位点，从而使剪切可提供受约束的连接臂的展开。例如，为了合成X型ATP单体，可以使用8-[(6-氨基)己基]-氨基-ATP或N6-(6-氨基)己基-ATP上的氨基连接子，作为第一连接臂连接位点，和可以使用混合的主链连接子例如非桥接修饰(N-1-氨基烷基)的氨基磷酸酯或(2-氨乙基)磷酸酯，作为第二连接臂连接位点。此外，桥接的主链修饰例如氨基磷酸酶(3’O-P-N 5’)或硫羟磷酸酯(3’O-P-S 5’)可以用于一级主链的选择性化学剪切。

R¹和R²是为适用于使用底物构建体的合成方法而设置的末端基团。例如，R¹＝5’-三磷酸盐和R²＝3’-OH，可用于聚合酶方法。R¹5’-三磷酸盐可以包括混合的主链修饰，例如氨乙基磷酸酯或3’-O-P-S-5’硫羟磷酸酯，来分别使连接臂连接和主链剪切。任选地，R²可以设置成带有可逆性封闭基团，而用于单底物的循环添加。可选地，R¹和R²可以设置成带有末端连接基团，而用于化学耦合。R¹和R²可以是通常类型的XR，其中X是连接基团而R是功能基团。

在组装期间，单体底物构建体利用单链模板作为向导通过模板指导聚合而聚合在新生子链的可延伸末端。一般，此方法由引物开始并沿5’到3’方向进行。通常用DNA聚合酶或其他聚合酶形成子链，并选择条件来获得模板链的互补拷贝。

如图66B所示，核碱基残基可以一个亚基到下一个亚基地聚合而形成称为“双链体子链”的中间体。一级主链(-N-)κ、模板链(-N’-)κ和连接臂(T)表示为双链体化的子链，其中κ表示多个重复亚基。子链的每个亚基是重复基序，并且所述基序具有种类特异的可变性，在此以α上标表示。子链由单体底物构建体的种类形成，该种类通过模板指导方法由基序种类文库选择，每个底物构建体种类的单体底物结合于靶模板链上相应的互补核苷酸。因此，子链核碱基残基(即一级主链)的序列是靶模板链的连续的互补拷贝。

图66B中所示的在核碱基残基上方的(“V”)表示选择性可剪切键，该键可以将底物分为第一和第二部分。剪切之后，一个亚基的第一部分(669)将保持连接于相邻亚基的第二部分(668)，并且每个部分会在亚基内通过连接臂一个到另一个地进行桥接。这些键必需是选择性可剪切的，释放并展开连接臂(和Xpandomer)而不降解Xpandomer自身。

子链具有两种主链，“一级主链”和“受约束的Xpandomer”的主链。一级主链由连续邻接的且聚合的单体底物构成。“受约束的Xpandomer主链”绕过单体底物内的选择性可剪切连接，并通过主链部分的底物间的键而形成，每个主链部分是连接于依然完整的核碱基残基的两个部分上的连接臂。受约束的Xpandomer主链在一级主链的选择性可剪切键之上桥接，并且当这些选择性可剪切键受到剪切和单体片段化为如图66C中所示的n¹和n²部分时，可以保持共价完整。

底物构建体的酶耦合先于剪切，形成一级主链，伴随主链在相邻碱基之间的例如磷酸二酯或混合的主链键。在此所示的结构中，子链一级主链已经形成。在解离或降解靶模板链和剪切选择性可剪切键之后，受约束的Xpandomer得以释放而成为Xpandomer产物。模板链的解离方法包括例如热变性。

图66C表示在模板链解离之后和在选择性可剪切键剪切之后产生的X型Xpandomer产物。Xpandomer产物链含有多个亚基κ，其中κ表示在构成子链的m个亚基的链中的第κ个亚基，在此κ＝1、2、3至m，其中m＞10，一般m＞50，通常m＞500或＞5,000。每个亚基由连接于单体底物的n¹和n²部分并处于展开构型的连接臂形成，而且每个亚基通过单体聚合键连接于下一个亚基上。每个亚基即亚基基序α，都含有种类特异性遗传信息，该信息由Xpandomer中间体(子链)的模板指导组装而确定。

图66D显示了作为分子模型的底物构建体，其中核碱基成员(664)连接于核碱基的第一和第二部分上，每个部分带有一连接臂的连接位点(662，663)。该连接臂(660)包含报道基团(900、901、902)。将核碱基的两部分分开的选择性可剪切键以“V”(665)表示。

图66E展示了Xpandomer产物。该亚基包含展开的连接臂(660)，其连接于图66C中所示的核碱基部分(669、668)n¹和n²，每个亚基通过核碱基间的键进行结合。通过剪切过程，受约束的Xpandomer被释放而成为Xpandomer产物。原来处于受约束构型的连接臂成员现在处于展开的构型，从而发挥线性伸展模板靶标的序列信息的功能。展开连接臂沿着Xpandomer降低了序列信息的线性密度，并提供了用于增加报道子的尺寸和丰度的平台，这依次改善用于模板序列检测和解码的信噪比。

图67展示了用X型XNTP底物构建体组装Xpandomer的方法。在第一个图形中，用发夹结构引物引发模板且使该模板与聚合酶和X型单体底物接触。步骤I所示的聚合反应，通过模板指导添加单体底物从而持续延伸新生的子链。放大的图(图67a)展示了该细节。互补于模板链的子链显示为由带有内剪切位点(“V”)的修饰的核碱基组成。在步骤II中，形成Xpandomer中间体的过程已完成，而在步骤III中，剪切过程，中间体的解离和子链的展开显示为正在进行的。在放大的图(图67b)中，展示了核碱基底物的内剪切解除连接臂上的约束，连接臂展开，从而延伸主链。

实施例

实施例1：带选择性可剪切核糖基-5’-3’核苷酸间键的嵌合的2merXprobe“CA”的合成

寡聚底物构建体由探针成员和连接臂成员构成并且具有普通的“探针-环”构型。使用确定已久的固相寡聚体合成的方法来完成探针成员的合成。在这些方法中，使用例如亚磷酰胺化学将核碱基添加到树脂上的新生探针链上(美国专利4,415,732和4,458,066)，以及使用易于获得的自动合成仪可以经济地合成毫克级或克级的合成寡聚体。典型的固相寡聚体合成包括重复进行的四个步骤：去保护、耦合、加帽和氧化。然而，在I型Xprobe底物构建体的探针中至少有一个键是选择性可剪切键，并且修饰至少两个探针部分，用于接受连接臂成员。选择性可剪切键位于被选择用于连接连接臂的探针部分之间(即，“之间”不应限于“相邻的核碱基成员之间”的意思，因为连接臂的第一和第二连接位点只能分别放置于探针的第一和第二部分上的任何位置)。在本实施例中，可以由核糖核酸酶H选择性剪切的核糖基5’-3’核苷酸间键，是选择性可剪切键，并且连接臂的两个连位接点是2mer探针的第一和第二核碱基残基。

使用亚磷酰胺来完成连接子修饰的Xprobe的合成，亚磷酰胺可以由商业获得，例如由Glen Research(Sterling，VA，USA)、BioGenex(SanRamon，CA，USA)、Dalton Chemical Laboratories(Toronto，Canada)、Thermo Scientific(USA)、Link Technologies(UK)获得，或者可以常规合成。可以用确定已久的合成方法制备所描述的探针，其中在本案例中是氨基调节物C6脱氧腺苷的3’核碱基，首先利用5′-二甲氧三苯甲基-N6-苯甲酰-N8-[6-(三氟乙酰氨基)-六-1-基]-8-氨基-2′-脱氧腺苷-3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺将氨基调节物C6胞嘧啶核苷连接于通用支持体上，然后利用5′-二甲氧三苯甲基-N-二甲基甲脒-5-[N(三氟乙酰氨己基)-3-丙烯酰基亚胺(acrylimido)]-胞苷，3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺，添加氨基调节物C6胞嘧啶核苷，其中5’胞苷是核糖核苷酸。添加化学磷酸化反应物，然后进行标准剪切、去保护和纯化方法来完成合成。二核苷酸产物是5’磷酸(氨基C6-胞嘧啶)(氨基C6-脱氧腺苷)3’，在每个碱基的中心有可剪切的核糖基-5’，3’键和氨基连接子。

本实施例的Xprobe连接臂是由二-N-琥珀酰亚胺-戊乙二醇酯(Pierce，Rockford IL；Product No 21581)构建而来。依据厂商说明书，将修饰的pCA寡聚体的连接胺与二(NHS)PEG5(bis(NHS)PEG5)进行交联。获得带预期分子量的、用于环化PEG探针构建体的产物。

实施例2：带有选择性可剪切的硫羟磷酸酯键的4mer Xprobe“TATA”的合成

可以合成带有硫羟磷酸酯连接的Xprobe 4mer，该连接作为选择性可剪切键。对于下面的实施例，描述了5’磷酸(dT)(氨基C6-dA)(dT)(氨基C6-dA)3’四核苷酸的合成。

如Mag等(“Synthesis and selective cleavage of anoligodeoxynucleotide containing a bridged internucleotide5’-phosphorothioate linkage”，Nucl Acids Res 19：1437-41，1991)所述，首先制备5’巯基-脱氧胸苷。将胸苷与嘧啶中的二价的p-甲苯磺酰基氯化物在室温下反应，而产生的5’-甲苯磺酸盐通过结晶从乙醇中分离出来。甲苯磺酸盐与5价的三苯甲基硫醇钠(原位制备)一起转变为5’-(S-三苯甲基)-巯基-5’-脱氧-胸苷。纯化5’-(S-三苯甲基)-巯基-胸苷核苷酸，并且在四唑的存在下与2-氰乙基氧-二-(N，N-二异丙基氨基-磷酸酯(phosphane))反应产生3’-O-亚磷酰胺构建模块。

为了开始自动合成，用5′-二甲氧三苯甲基-5-[N-(三氟乙酰氨己基)-3-丙烯酰基亚胺]-2′-脱氧尿苷，3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺先将氨基调节物C6脱氧腺苷连接于通用支持体上，然后添加上述所制备的巯基胸苷亚磷酰胺。在添加下一个氨基C6 dA亚磷酰胺之前，首先用50mM水溶硝酸银使S-三苯甲基基团去保护，并且用水漂洗树脂。然后通常用还原性试剂如DTT处理树脂从而去除剪切过程中伴随形成的二硫化物。然后再次用水和乙腈漂洗柱子，并且在标准的条件下将游离的巯基在四唑存在下与氨基C6脱氧腺苷亚磷酰胺反应，从而形成带有S3’→P5’硫羟磷酸酯键的“ATA”，该键在末端的脱氧腺苷和3-巯基-胸苷之间桥接。在下一轮循环中，添加标准的脱氧胸苷亚磷酰胺。最后，添加化学磷酸化反应物，随后通过标准剪切、去保护以及纯化方法来完成合成。四核苷酸产物是5’磷酸(dT)(氨基C6-dA)(dT)(氨基C6-dA)3’。

硫羟磷酸酯键是选择性可剪切的，例如用AgCl、酸或碘乙醇(Mag etal.，“Synthesis and selective cleavage of an oligodeoxynucleotide containing abridged intemucleotide 5′-phosphorothioate linkage”，Nucleic Acids Research，19(7)：1437-1441，1991)进行剪切。由于选择性可剪切键是在第二和第三核碱基之间，所以连接臂经设计，桥接这个键，并且可以在选择性可剪切键的任意一端被连接于任意两个核碱基上(或任意两个一级主链连接位点上)。用于无连接子和连接子化学物质的方法包括，例如为连接子提供一级胺，该一级胺可用于实施例1所述寡聚体的合成中。“TATA”寡聚体上的胺修饰的连接子在寡聚体合成中通常受到保护，并且在完成寡核苷酸合成的正常过程中去保护。

本实施例的Xprobe连接臂随后由二-环氧化物激活的聚(乙二醇)二环氧醚(SigmaAldrich，St.Louis MO，Product No 475696)构建。胺与激活的PEG末端基团的环氧反应在稀释的溶液中进行来最小化任何竞争性串联反应。相似的反应可用混合的酐或甚至酰基氯获得，并且可以使用异双功能连接基团来定位连接臂的连接。连接臂反应的产物通过预装的HPLC进行分离并通过质谱来鉴别。获得了分子量接近的环化的4mer PEG-探针构建体(约2.5Kd)的产物。用该方法可以获得约为M_n＝500的PEG连接臂的分布。这与大约40埃的连接臂(约3.36

单位)一致。

实施例3：带有选择性可剪切的5’-3’磷酸二酯键的3mer Xprobe“CTA”的合成

Xprobe也可以合成而带有磷酸二酯键作为选择性可剪切键。对于下面的实施例，描述了带有非桥接的硫代磷酸酯修饰的5’磷酸(dT)(氨基C6-dA)(dT)(氨基C6-dA)3’三核苷酸的合成。用多种核酸酶攻击磷酸二酯键。在本实施例中，用带有非桥接硫的硫代磷酸酯键作为抗核酸酶键。

对于以3’到5’方向的自动合成，使用CPG固定的固相支持体(5′-二甲氧三苯甲基-N-苯甲酰-2′-脱氧腺苷，3′-琥珀酰-长链烷氨基CPG 500)。在第一轮循环中，耦合氨基调节物C6脱氧胸苷亚磷酰胺(5′-二甲氧三苯甲基-5-[N-(三氟乙酰氨己基)-3-丙烯酰基亚胺]-2′-脱氧尿苷，3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺)。在加帽之前，根据制造商的方法说明书，将固定的dA与硫化剂即Beaucage试剂(Beaucage Reagent，Glen Research，Sterling VA；Cat No 40-4036)反应。反应物通常通过合成仪的分离槽添加。在硫醇化之后，耦合氨基修饰的C6脱氧胞苷(5′-二甲氧三苯甲基-N-二甲基甲脒-5-[N-(三氟乙酰氨己基)-3-丙烯酰基亚胺]-2′-脱氧胞苷，3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺)。在加帽之前，根据厂家的方法说明书，将固定的dC与硫化剂即Beaucage试剂反应(Glen Research，Sterling VA；Cat No 40-4036)。产生的“CTA”3mer在T和A之间具有硫代磷酸酯键，在C和T之间具有磷酸二酯键。添加化学磷酸化反应物，随后通过标准剪切、去保护以及纯化方法来完成合成。

硫代磷酸酯连接对核酸酶攻击的抵抗性已有很好的描述，例如Matsukura等(“Phosphorothioate analogs of oligodeoxynucleotides：inhibitorsof replication and cytopathic effects of human immunodeficiency virus”，PNAS 84：7706-10，1987)、Agrawal等(“Oliogodeoxynucleosidephosphoramidates and phosphorothioates as inhibitors of humanimmunodeficiency virus”，PNAS 85：7079-83，1988)，以及美国专利5770713中所描述。C和T均为连接子或无连接子修饰的，其衍生作用用于连接臂成员的连接。

实施例4：带有选择性可剪切的5’N-P-O 3’氨基磷酸酯键的3merXprobe“ATA”的合成

用5′-二甲氧三苯甲基-5-[N-(三氟乙酰氨己基)-3-丙烯酰基亚胺]-2′-脱氧尿苷-3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺首先将氨基调节物C6脱氧腺苷连接于通用支持体上，然后在下一轮循环中添加MMT-封闭的5’氨基-dT(5’单甲基氧三苯甲基氨基-2’-脱氧胸苷)。在去封闭之后，在标准条件下将5’-氨基末端与氨基修饰的C6脱氧腺苷亚磷酰胺反应。添加化学磷酸化反应物，随后通过标准剪切、去保护以及纯化方法来完成合成。三核苷酸5’(氨基C6-dA)(O-P-N)(dT)(O-P-O)(氨基C6-dA)3’在5’氨基C6-dA和倒数第二个dT之间具有氨基磷酸酯键。

通过Mag等(”Synthesis and selective cleavage ofoligodeoxynucleotides containing non-chiral internucleotide phosphoramidatelinkages“，Nucl.Acids Res.17：5973-5988，1989)所描述的用80％的醋酸处理该寡聚体，氨基磷酸酯键在磷酸二酯键保持完整的条件下是选择性可剪切的。通过结合连接臂来桥接5’N-P-O氨基磷酸酯键，含有该类型二聚体的Xpandomer，可以通过选择性剪切一级主链的氨基磷酸酯键展开。

实施例5：带内部光裂解键的6mer Xprobe“CACCAC”的合成

在用未修饰的脱氧胞苷和脱氧腺苷亚磷酰胺进行标准的3’到5’的合成之后，耦合氨基修饰的C6 dC(5′-二甲氧三苯甲基-N-二甲基甲脒-5-[N(三氟乙酰氨己基)-3-丙烯酰基亚胺]-2′-脱氧胞苷，3′-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺；Glen Research；Cat No 10-1019)，从而形成CAC三聚体。在下一轮循环中，耦合光裂解连接子(3-(4，4′-二甲氧三苯甲基)-1-(2-硝苯基)-丙醛(propan)-1-基-[(2-氰乙基)-(N，N-二异丙基)]-亚磷酰胺；Glen Research；Cat No 10-4920)。在下一轮循环中，添加第二个氨基修饰的dC，然后最后两轮分别进行dA和dC亚磷酰胺的标准添加。产生的产物，“CAC-pc-CAC”含有在第三和第四碱基位置上的氨基连接子，并且可以通过添加连接臂而进行修饰，该连接臂桥接两个氨基修饰的碱基之间的光裂解硝基苯构建体所形成的选择性可剪切键。光裂解连接子修饰的磷酸二酯键主链的选择性剪切已由，例如Sauer等(“MALDI massspectrometry analysis of single nucleotide polymorphisms by photocleavageand charge-tagging”，Nucleic Acids Research 31，11 e63，2003)、Vallone等(“Genotyping SNPs using a UV-photocleavable oligonucleotide inMALDI-TOF MS”，Methods Mol.Bio.297：169-78，2005)，以及Ordoukhanian等(“Design and synthesis of a versatile photocleavable DNAbuilding block，application to phototriggered hybridization”，J.Am.Chem.Soc.117，9570-9571，1995)公开。

实施例6：Xmer底物构建体的合成

Xmer底物构建体与Xprobe的设计和成分密切相关。Xmer文库通过例如Xprobe的焦磷酸化而合成。用焦磷酸盐处理5’-单磷酸盐的已确立的方法包括，例如Abramova等(“A facile and effective synthesis ofdinucleotide 5’-triphoshates“，Bioorganic Medicinal Chemistry 15：6549-55，2007)所公开的方法。在此方法中，在DMF/DMSO中，用DMAP(4-二甲氨基吡啶)或1-MeIm(1-甲基咪唑)作为亲核催化剂，通过首先将作为十六烷基三甲基铵盐的末端磷酸盐与等摩尔量的三苯基膦(Ph₃P)和2，2’-二吡啶二硫化物(PyS)₂反应，按随后与焦磷酸反应的需要，将寡聚体的末端单磷酸盐激活。产物在丙酮中用LiClO₄沉淀并通过阴离子交换层析纯化。

可以考虑多种其他方法用于5’三磷酸Xmer的稳固合成。如Burgess和Cook(Chem Rev 100(6)：2047-2060)所述，这些方法包括但不限于，使用核苷亚磷酰胺的反应、通过焦磷酸盐在激活的核苷单磷酸盐上的亲核攻击进行的合成、通过磷酸盐在激活的核苷焦磷酸上的亲核攻击进行的合成、通过二磷酸盐在激活的磷酸盐合成子上的亲核攻击进行的合成、包括衍生自核苷的激活的亚磷酸盐或亚磷酰胺的合成、包括由三磷酸盐亲核试剂直接替换5’-O-自由基团的合成，以及生物催化方法。用于生产聚合酶适合的二核苷酸底物的特定方法是，用N-甲基咪唑激活5’单磷酸基团；随后与焦磷酸盐(磷酸三丁铵盐)反应，产生三磷酸盐(Bogachev，1996)。在另一种方法中，Kayushin(Kayushin AL et al.，1996.A convenientapproach to the synthesis of trinucleotide phosphoramidites.Nucl Acids Res24：3748-55)已经合成了三核苷酸氨基磷酸酯。

实施例7：用剪切聚合酶-氨基磷酸酯合成Xpandomer

用以5’-三磷酸盐和3’-OH末端制备底物构建体合成Xpandomer。Kless的美国专利7,060,440公开了用聚合酶聚合三磷酸寡聚体，而这一方法在此适用于Xpandomer的合成。底物构建体由带有核苷酸间5’N-P-O氨基磷酸酯选择性可剪切键的2mer探针成员“pppCA”和PEG连接臂环构建体构成。合成并在使用前纯化模板链和配对的引物。用序列“TGTGTGTGTGTGTGTGTGTGATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”作为引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。引物和模板退火形成模板，该模板带有双链体引物和游离的3’-OH以及长度为20个碱基的5’末端单链突出端。然后添加底物构建体和商标为Sequenase^TM的重组T7DNA聚合酶(USBiochemicals Corp.，Cleveland，OH)，在调整为最适宜的聚合条件下，聚合持续30min(分钟)。将聚合反应的样品与凝胶上样缓冲液混合，并且与无聚合酶的阴性对照和MW标记物一起在20％的TBE丙烯酰胺凝胶(Invitrogen，USA)上电泳，从而来确定Xmer的聚合。

按照Mag等(”Synthesis and selective cleavage ofoligodeoxyribonucleotides containing non-chiral internucleotidephosphoramidate linkages“，Nucl.Acids Res.，17：5973-88，1989)的方法，将Xpandomer中间体用80％的醋酸在室温下处理5小时，以便选择性剪切氨基磷酸酯键，这同样也可以通过电泳来确定。

实施例8：用剪切聚合酶-硫代磷酸酯合成Xpandomer

用以5’-三磷酸盐和3’-OH末端制备的底物构建体合成Xpandomer。Kless的美国专利7,060,440公开了用聚合酶来聚合三磷酸寡聚体。底物构建体是“pppCA”。该底物构建体经设计带有选择性可剪切的核苷酸间的硫羟磷酸酯主链连接和PEG 2000连接臂环构建体。合成并在使用前纯化模板链和配对的引物。用序列“TGTGTGTGTGTGTGTGTGTGATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”用作引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。引物和模板退火形成模板，该模板带有双链体引物和游离的3’-OH以及长度为20个碱基的5’末端单链突出端。然后在优化缓冲液和盐用于聚合的条件下来添加底物构建体和Sequenase^TM DNA聚合酶(New England Biolabs，USA)。在调整为最适宜的聚合条件下，聚合持续60min。将聚合反应的样品与凝胶上样缓冲液混合，并且与无聚合酶的阴性对照和MW标记物一起在20％的TBE丙烯酰胺凝胶(Invitrogen，USA)上电泳，来证实Xmer的聚合。

Xpandomer中间体的硫羟磷酸酯键是选择性可剪切的，例如，用AgCl，酸或碘乙醇(Mag et al.，“Synthesis and selective cleavage of anoligodeoxynucleotide containing a bridged intemucleotide5′-phosphorothioate linkage”，Nucleic Acids Research，19(7)：1437-1441，1991)进行剪切。通过凝胶电泳来确定剪切。

实施例9：用连接酶合成嵌合的Xpandomer

用以带有5’-单磷酸盐和3’-OH末端制备底物构建体合成Xpandomer。底物构建体是嵌合的“5’p dC rA～dC dA 3’”的4mer，其中5’倒数第二个腺苷是核糖核酸而底物的剩下部分是脱氧核糖核酸。该底物构建体经设计带有一个选择性可剪切的核苷酸间核糖基5’-3’磷酸二酯键(用“～”表示)和PEG 2000连接臂环构建体，其中连接臂连接于4mer的末端“C”和“A”上。合成并在使用前纯化模板链和配对的引物。用序列“TGTGTGTGTGTGTGTGTGTG ATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”作为引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。引物和模板退火形成模板，该模板带有双链体引物和游离的3’-OH以及长度为20个碱基的5’末端单链突出端。然后在优化温度、缓冲液和盐用于瞬时探针杂交和连接的条件下添加底物构建体和T4DNA聚合酶(Promega Corp，Madison，WI，USA；Cat No M1801)。连接持续6小时。连接反应的样品与凝胶上样缓冲液混合，并且与无连接酶的阴性对照和MW标记物一起在20％的TBE丙烯酰胺凝胶(Invitrogen，Carlsbad，CA，USA)上电泳，从而来确定Xprobe的连接。

在第二个步骤中，用核糖核酸酶H处理Xpandomer中间体来剪切核糖核酸酶不稳定的5’-3’磷酸二酯键，从而产生Xpandomer产物，这同样也可以通过凝胶电泳确定。

实施例10：制备α-磷酸盐连接构建体

也可以将连接臂连接子连接到了硫代磷酸酯S二酯上或氨基磷酸酯N-酰胺上，如Agrawal(”Site specific functionalization of oligonucleotidesfor attaching two different reporter groups“，Nuc.Acids Res.18：5419-23，1990)所讨论的。公开了使两种不同的核苷酸间的主链连接功能化的方法：氨己基氨基磷酸酯(N-1氨基烷)连接子和硫代磷酸酯。用Agrawal所述制备的C6胺作为合成本发明核碱基间连接臂构建体的连接子。N3’-P5’键的衍生作用也已有报道(Sinyakov et al.，“Functionalization of theoligonucleotides containing an internucleotide phosphoramidate bond”，Russian J Bioorganic Chem，29：100-102，2003)。

实施例11：连接臂构建体的异双功能化方法

实施例1-5描述了含有选择性可剪切键的修饰的寡聚体的合成。在此，用标准的寡聚体合成化学制备4mer，该4mer在第二位上带有C6-氨基修饰的碱基，第三位上带有4-甲酰苯甲酸酯-连接修饰的碱基。第二位和第三位碱基被选择性可剪切键分开，该键选自核糖基5’-3’磷酸二酯键、脱氧核糖基5’-3’磷酸二酯键、硫羟磷酸酯键(5’O-P-S 3’或5’S-P-O3’)、氨基磷酸酯键(5’O-P-N 3’或5’N-P-O 3’)或光裂解键。将C6连接子的胺与Sulfo EGS反应，形成活性酯NHS基团。然后通过使修饰的探针成员与功能化带有带胺和酰肼末端基团的连接臂反应，完成异双功能的连接臂环的合成。获得连接臂-环化的末端产物。

实施例12：染料标记的连接臂构建体

制备带有单个报道子的Xprobe底物构建体。首先用标准方法合成在第一个和第二个碱基上带有C6胺的2mer。第一个和第二个碱基由选择性可剪切键分开，该键选自核糖基5’-3’磷酸二酯键、脱氧核糖基5’-3’磷酸二酯键、硫羟磷酸酯键(5’O-P-S 3’或5’S-P-O 3’)、氨基磷酸酯键(5’O-P-N 3’或5’N-P-O 3’)或光裂解键。在本实施例中，连接臂是带有单个内在连接基团的种类特异性的、末端功能化的PEG 2000分子，在此情况下，该连接基团是马来酰亚胺功能化的、位于连接臂中的连接子。报道子是染料标记的树枝状聚合物，通过树枝状聚合物上的巯基部分连接于连接臂的马来酰亚胺连接基团上。因此产生的报道构建体在连接臂上含有一个报道子。用胱胺树枝状聚合物(Dendritic Nanotechnologies，Mt Pleasant，MI，USA；Cat No DNT-294 G3)作为报道子，该聚合物的直径为5.4nm并且每半个树枝状聚合物就有16个表面胺。通过将特异性染料或染料组合连接于树枝状聚合物的胺基团，底物构建体种类得以特异地标记，用于鉴定。

实施例13：肽标记的连接臂构建体

制备带有单个报道子的Xprobe底物构建体。首先用标准方法合成在第一个和第二个碱基上带有C6胺的2mer。第一个和第二个碱基由选择性可剪切键分开，该键选自核糖基5’-3’磷酸二酯键、脱氧核糖基5’-3’磷酸二酯键、硫羟磷酸酯键(5’O-P-S 3’或5’S-P-O 3’)、氨基磷酸酯键(5’O-P-N 3’或5’N-P-O 3’)或光裂解键。在本实施例中，连接臂是带有单个内在连接基团的种类特异性的、末端功能化的PEG 2000分子，在此情况下，该连接基团是马来酰亚胺功能化的、位于连接臂中的连接子。报道子是染料标记的树枝状聚合物，通过树枝状聚合物上的巯基部分连接于连接臂的马来酰亚胺连接基团上。因此，产生的报道构建体在连接臂上含有一个报道子。用胱胺树枝状聚合物(Dendritic Nanotechnologies，MtPleasant，MI，USA；Cat No DNT-294 G3)作为报道子，该聚合物的直径为5.4nm并且每半个树枝状聚合物就有16个表面胺。通过将特异性染料或染料组合连接于树枝状聚合物的胺基团，底物构建体种类得以特异地标记用于鉴定。通过将特异性肽连接于胺功能化的树枝状聚合物上，底物构建体种类得以标记，用于之后的鉴定。在检测仪器中，用连接的肽的尺寸和电荷可以作为检测特征。

实施例14：连接臂报道构建体的异双功能途径

制备带有多个报道子的底物构建体。用标准有机化学物质制备2mer文库，该2mer在第一位上带有C6-氨基修饰的碱基，在第二位上带有4-甲酰苯甲酸酯-连接修饰的碱基(4FB)。第一个和第二个碱基由选择性可剪切键分开，该键选自核糖基5’-3’磷酸二酯键、脱氧核糖基5’-3’磷酸二酯键、硫羟磷酸酯键(5’O-P-S 3’或5’S-P-O 3’)、氨基磷酸酯键(5’O-P-N 3’或5’N-P-O 3’)或光裂解键。将胺与Sulfo EGS反应，形成活性酯NHS基团。在第二步骤中，将种类特异性的双功能的胺报道片段(片段1)与活性NHS基团反应，而将种类特异性的双功能的酰肼报道片段(片段4)与4FB反应。接下来，片段1上的游离胺与Sulfo EGS反应，形成活性酯NHS。然后将种类特异性的异双功能帽与构建体反应，从而使连接臂环闭合，该帽由带有胺和4FB末端基团的一对报道片段(片段2和3)构成。

由此产生的报道构建体在连接臂构建体上含有四个报道子。在本实施例中，报道子是带有胱胺连接子的聚胺树枝物(DendriticNanotechnologies，Mt Pleasant MI，USA；Cat No DNT-294：G4，直径为4.5nm，每半个树枝状聚合物有32个表面胺)，通过硫醚键共价结合于每个多聚体片段，并且多聚体成员是末端功能化的PEG 2000，每个均带有一个内部连接基团。每个连接臂片段由单个报道子构成。用四个定向耦合的片段，可获得2⁴种可能的报道密码组合。

实施例15：带有合成后标记的报道构建体的异双功能途径

制备带有多个报道子的底物构建体。用标准有机化学制备4mer，该4mer在2mer的第一位上带有C6-氨基修饰的碱基，在2mer的第二位上带有4-甲酰苯甲酸酯-连接修饰的碱基(4FB)。第二个和第三个碱基由选择性可剪切键分开，该键选自核糖基5’-3’磷酸二酯键、脱氧核糖基5’-3’磷酸二酯键、硫羟磷酸酯键(5’O-P-S 3’或5’S-P-O 3’)、氨基磷酸酯键(5’O-P-N 3’或5’N-P-O 3’)或光裂解键。将胺与Sulfo EGS反应形成活性酯NHS基团。在第二个步骤中，将种类特异性双功能的胺报道片段(片段1)与活性NHS基团反应，而将种类特异性的双功能的酰肼报道片段(片段4)与4FB反应。接下来，将片段1上的游离胺与Sulfo EGS反应形成活性酯NHS。然后将种类特异性的异双功能帽与构建体反应从而使连接臂环闭合，该帽由带胺和4FB末端基团的一对报道片段(片段2和3)构成。

因此产生的报道构建体在连接臂构建体上含有四个报道子。在本实施例中，描述了后标记的连接臂构建体。用于连接报道子的16mer寡聚体共价结合于每个连接臂片段上。每个连接臂片段部分地由功能化的PEG分子的构成。报道子是染料标记的带有胱胺连接子的聚胺树枝状聚合物(Dendritic Nanotechnologies，Mt Pleasant MI，USA；Cat No DNT-294：G5，直径4.5nm，每半个树枝状聚合物有64个表面胺)，用于耦合于16mer寡聚体探针。在组装Xpandomer之后，将染料标记的树枝状聚合物与寡聚连接臂片段杂交。该标记方法与DeMattei等(“Designed DendrimerSyntheses by Self-Assembly of Single-Site，ssDNA FunctionalizedDendrons”，Nano Letters，4：771-77，2004)所描述的方法相似。

实施例16：染料标记的报道元件

参见实施例14和15，树枝状聚合的报道元件的表面胺由活性酯化学物质标记。从Molecular Probes(Eugene OR)获得的Alexa Fluor 488(绿色)和Alexa Fluor 680(红色)可作为sNHS活性酯用于一步连接。改变染料的密度和比率从而在每个报道元件上产生独特的分子标签。

实施例17：多态报道元件

染料的各种色彩可由类似于M-FISH和SKY中使用的那些技术来选择，这些技术为本领域技术人员所熟知，并且结合于树枝状聚合的报道子。因此，每个连接臂的报道元件构成“光谱地址”，由此带有多个染料结合位点的单个树枝状聚合的构建体，可以产生多个报道密码。参见实施例14和15所描述的连接臂构建体，一个5态的光谱地址产生625种报道密码组合。

实施例18：PEG-5000间隔子连接臂

连接臂片段由持久的、水/有机溶剂可溶的多聚体组成，该多聚体对SBX反应物有一点甚至没有结合亲合力。修饰的PEG 5000用于柔性的连接臂间隔子，该间隔子位于多聚赖氨酸5000报道子的侧面。功能化游离的PEG末端，用于结合探针成员。用异双功能的连接化学物质使多聚体交联于探针结合点从而成环。

实施例19：制备带有质量标签的报道子合成物

连接臂合成如下：使用标准的胺耦合化学，将可剪切的质量标签共价结合于多聚-1-赖氨酸肽功能化的G5树枝状聚合物上(DendriticNanotechnologies，Mt Pleasant MI)。G5树枝状聚合物的直径为～5.7nm并且可提供128个反应性表面基团。功能化带有分子量为10,000的多聚赖氨酸肽的一排十个G5树枝状聚合物，在～57nm的树枝状聚合物片段上提供了总共约100,000个报道子结合位点。假定可用结合位点的占有率只有10％，那么在完全组装的片段上总共约10,000个质量标签可用于检测。使用前面(图37)所述的3种质量标签报道子的编码方法，每种质量标签约3300个拷贝可用于测量。作为选择，功能化带有分子量为10,000的多聚赖氨酸的单个G9树枝状聚合物(带2048个反应性基团)，在报道构建体的12nm的片段上，可具有约170,000个质量标签结合点。

为了检测带质量标签的序列，使用了在测量位点通过使用光裂解连接子来控制质量标签报道子释放的方法。不需要连接臂连续片段化。在一步法中测量连接于Xpandomer多聚体每个亚基的质量标签报道子。例如，从350道尔顿到710道尔顿的一组13个质量标签报道子(即，以30道尔顿为一阶梯的质量标签报道子)中每3个质量标签拥有286种组合。以这种方式，256种不同4mer的任何一种仅与3种质量标签报道子的一个特定组合相关。Xpandomer编码的序列信息易于通过亚基的质谱分析检测。由于Xpandomer的亚基在空间上是完全分离的，因此Xpandomer处理和检测技术不需要高度精细。

实施例20：未标记的底物构建体的直接分析

合成底物构建体文库；连接臂不含报道子。制备Xpandomer产物之后，通过电子通道光谱学，分析Xpandomer产物的个体碱基。

实施例21：未标记的底物构建体的杂交辅助分析

合成寡聚底物构建体文库；连接臂不含报道子。制备Xpandomer产物之后，将整套的标记的探针随后与Xpandomer产物杂交，并依序分析双链体化的探针。

实施例22：带有Lys-Cys-PEG-聚谷氨酸-PEG-Cys-COOH连接臂的三磷酸脱氧腺苷的合成

将带有BOC-保护的氨基侧链的赖氨酸固定于树脂上，并且使用标准的肽合成方法，将其与半胱氨酸残基反应。赖氨酸的氨基侧链将是RT-NTP连接臂的∈反应性功能基团(见VI、VII型)。半胱氨酸会形成连接臂内的二硫键的第一个一半。半胱氨酸上去保护的氨基经SANH(Pierce-Thermo Fisher，USA；Cat No 22400：Bioconjugate Toolkit)修饰形成酰肼。

个别地，通过用C6-SFB(Pierce-Thermo Fisher，USA；Cat No 22400：Bioconjugate Toolkit)将自由胺功能化而从二氨基PEG 2000(CreativePEGWorks，Winston Salem NC；Cat No PSB 330)中制备间隔片段，从而产生二4FB PEG间隔片段；纯化产物。

随后将二4FB PEG间隔片段耦合于半胱氨酸上的酰肼连接子，留下4FB基团作为末端反应性基团，并且漂洗树脂。

独立地，制备多聚谷氨酸片段(每个谷氨酸在γ-羧基上衍生带有5个PEO单位的顶端加甲基的PEG)。将C端改变为带有EDC耦合剂和二氨基己烷的胺。用SANH形成以二酰肼为末端的多聚谷氨酸片段，并且纯化产物。以二酰肼为末端的多聚谷氨酸片段在树脂上与4FB基团反应，形成末端酰肼，并且漂洗树脂。

独立地，PEG-2000间隔子片段(带胺和羧基末端，Creative PEGWorks；PHB-930)与SFB反应产生4FB末端基团。该间隔子片段在树脂上与酰肼基团反应，形成以羧基为末端的链。再次漂洗树脂。

用标准的肽合成试剂，将半胱氨酸残基耦合于游离的羧基上。半胱氨酸的末端羧基是O-苄基保护的。再次漂洗产生的产物，并且随后从树脂上剪切下来。剪切所产生的游离羧基随后经EDC、氨己基合SANH修饰形成反应性酰肼。

独立地，C6氨基修饰的三磷酸脱氧腺苷(N6-(6-氨基)己基-dATP(JenaBioscience，Jena DE；Cat No NU-835)经SFB处理形成4FB功能基团。通过将修饰的碱基与前面所述步骤的反应性酰肼结合，组装连接臂-探针底物构建体。在使用前赖氨酸侧链的BOC被去除。在通常的氧化条件下，半胱氨酸结合形成连接臂内的二硫键，从而使连接臂稳定在一个受约束的紧凑的形态中。

实施例23：RT-NTP三磷酸盐文库的合成

如实施例22所述，制备带有连接臂内-S-S-键的连接的核苷酸三磷酸碱基A、T、C和G，但是，选择用于每个碱基的PEG化的谷氨酸片段的电荷和物理参数，提供独特的报道子特性。

实施例24：用多聚谷氨酸连接的RT-NTP通过SBE合成Xpandomer

制备带有连接臂内二硫键的修饰的RT-NTP腺苷和鸟苷三磷酸核苷酸。进一步修饰碱基从而在3’-位被可逆性封闭。Ruparel(“Design andsynthesis of a 3’-O-allyl photocleavable fluorescent nucleotide as a reversibleterminator for DNA sequencing by synthesis”PNAS，102：5932-37，2005)描述了基于烯丙基的可逆性封闭化学。如图61所示碱基修饰的连接臂通常经构建带有δ功能基团和∈功能基团。δ功能基团是连接臂悬垂的半胱氨酸的羧基，而∈功能基团是连接臂与嘌呤连接点附近的赖氨酸的侧链胺。进一步修饰连接臂从而含有核碱基特异性修饰的多聚谷氨酸片段。

用序列“TCTCTCTCTCTCTCTCATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”作为引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。Xpandomer的合成方法基本上如图61中所述。在SBE的第一轮引发循环中，在适合聚合的条件下用Klenow聚合酶添加修饰的核碱基，并将修饰的核碱基在引物的3’-OH末端添加到新生的子链上。由于底物构建体在3’位置上受到封闭，所以不能进一步聚合。

在所添加的第一个RT-NTP上的氨基侧链(∈)连接基团被加帽并且会在整个SBE反应中一直保持加帽。连接臂的末端羧基去保护，并且底物上的3’OH去封闭；在下一轮SBE之前漂洗复合物。

在第二轮SBE循环中，将另一个核碱基聚合到新生的Xpandomer中间体上。使用EDC和Sulfo-NHS(Pierce Cat No 22980和24510)作为交联剂，在第一核碱基上的∈连接基团的游离胺和第二核碱基连接臂上的羧基连接基团之间形成χ健。连接臂的δ连接基团上的羧基去保护，并且底物上的3’OH去封闭；在下一轮SBE之前漂洗复合物。

SBE循环可以重复多次，因此形成受约束的构型的Xpandomer中间体。χ键结的核碱基的生长链上的每个连接臂都是受约束的Xpandomer构型。

实施例25：核酸酶和TCEP剪切形成X型Xpandomer

用核酸酶剪切实施例24的Xpandomer中间体，形成由连接臂片段和χ键所连接的个体核碱基构成的Xpandomer产物。核酸酶也降解模板和任何相连的引物，从而释放产物。通过添加还原性剂(TCEP，Pierce Cat.No.20490)剪切连接臂内的二硫键。

过滤和纯化Xpandomer产物，以便去除截短的合成子和核酸酶消化的副产物。可以通过各种现有的和下一代方法，进行线性化的Xpandomer的检测和分析。

实施例26：带连接臂内的光裂解连接子的三磷酸脱氧腺苷的合成

将甘氨酸固定于树脂上并与半胱氨酸反应。半胱氨酸的氨基随后去保护并与谷氨酸反应，所述谷氨酸的侧链用终止于O苄基保护的羧基的光不稳定性连接子进行了修饰，例如根据Holmes等(“Reagents forcombinatorial organic synthesis：development of a new O-nitrobenzylphotolabile linker for solid phase synthesis”，J Org Chem，60：2318-19，1995)所述改造的2-硝基藜芦基胺连接子。半胱氨酸是RT-NTP连接臂的“∈功能基团”。谷氨酸上的去保护的胺经SANH修饰(Pierce-Thermo Fisher，USA；Cat No 22400：Bioconjugate Toolkit)形成酰肼。合成连接臂之后，谷氨酸的侧链将形成光裂解的连接臂内的连接子。

独立地，通过用C6-SFB(Pierce-Thermo Fisher，USA；Cat No 22400：Bioconjugate Toolkit)将自由胺功能化而由二氨基PEG 2000(CreativePEGWorks，Winston Salem NC；Cat No PSB 330)制备间隔片段，从而形生二4FB PEG间隔片段；并纯化产物。二4FB PEG间隔片度随后耦合于谷氨酸的酰肼连接子上，留下4FB基团作为末端反应基团，并漂洗树脂。

独立地，制备多聚谷氨酸片段(带t-丁基保护的侧链)。用EDC耦合剂和二氨基己烷将C端转化为胺。SANH用于形成以二酰肼为末端的多聚谷氨酸片段，并纯化产物。将以二酰肼为末端的多聚谷氨酸片段在树脂上与4FB基团反应，从而在树脂上形成末端酰肼，并漂洗树脂。

用C6SFB修饰PEG-2000间隔片段(带游离的胺和FMOC-保护的氨基末端；Cat No PHB-0982，Creative PEGWorks)，形成4FB和FMOC-氨基修饰的PEG间隔片段。将4FB末端在树脂上与酰肼基团反应，形成以FMOC氨基为末端的链。再次漂洗树脂。

将赖氨酸残基通过肽键耦合于间隔子的游离胺上。赖氨酸残基在侧链上受到BOC保护，而赖氨酸的α-胺受到FMOC保护。光裂解连接子的O-苄基末端羧基和赖氨酸的BOC保护侧链随后去保护，并且与EDC/Sulfo-NHS交联来使连接臂成环。

再次漂洗产生的产物并且随后从树脂上剪切下来。剪切所产生的游离甘氨酸羧基随后用EDC、氨己基和SANH修饰而形成反应性酰肼。

独立地，用SFB(Pierce Bioconjugate Toolkit，Cat No 22419)处理C6氨基修饰的三磷酸脱氧腺苷(N6-(6-氨基)己基-dATP(Jena Bioscience，Jena DE；Cat No NU-835)，形成4FB功能基团。通过将修饰的碱基与前面所述步骤的反应性酰肼结合，组装连接臂-探针底物构建体。光可剪切的连接臂内连接子使连接臂稳定处于受约束的紧凑构型中。随后去除FMOC并将游离的末端胺与Sulfo-EMCS(Pierce；Cat No 22307)反应，从而引入末端马来酰亚胺功能基团。

实施例27：用光裂解的RT-NTP通过SBE合成Xpandomer

制备带有光裂解的连接臂内的键的RT-NTP腺苷和鸟苷三磷酸核苷酸。进一步修饰碱基从而使其在3’-位被可逆性封闭。Ruparel(“Design andsynthesis of a 3’-O-allyl photocleavable fluorescent nucleotide as a reversibleterminator for DNA sequencing by synthesis”PNAS，102：5932-37，2005)描述了基于烯丙基的可逆性封闭化学。如图61所示，碱基修饰的连接臂通常经构建带有δ功能基团和∈功能基团。δ连接基团是连接臂末端悬垂的赖氨酸的胺，而∈连接基团是连接臂连接点附近的半光氨酸的巯基。进一步修饰连接臂从而使其含有种类特异性修饰的多聚谷氨酸片段。

用序列“TCTCTCTCTCTCTCTCATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”作为引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。Xpandomer的合成方法基本上如图61所描述。在SBE的第一轮引发循环中，在适合聚合的条件下用Klenow聚合酶添加修饰的核碱基(A)，并且将单个碱基在引物的3’-OH末端添加到新生的子链上。由于底物构建体在3’位置上受到封闭，所以不能进一步聚合。随后漂洗固定的引物-模板复合物，去除未反应的底物。

在添加的第一个RT-NTP上的巯基侧链(∈)连接基团被加帽，并且会在整个SBE反应中一直保持如此。连接臂的末端氨基基团去保护，并且底物上的3’OH去封闭；在下一轮SBE之前漂洗复合物。

在SBE的第二轮循环中，将另一核碱基聚合到新生的Xpandomer中间体上。使用交联剂GMBS(Pierce；Cat No 22309)，在第一个核碱基上的氨基(δ连接基团)和第二个碱基连接臂上的巯基(∈连接基团)之间形成χ键。第二个RT-NTP上的δ氨基连接基团去保护，并且底物上的3’OH去封闭；在下一轮SBE之前漂洗复合物。

SBE循环可以重复多次，由此形成受约束的构型的Xpandomer中间体。成χ键合的核碱基的生长链上的每个连接臂，都呈受约束的Xpandomer构型。

实施例28：核酸酶和光裂解形成X型Xpandomer

用核酸酶剪切实施例27的Xpandomer中间体，形成由连接臂片段和χ键所连接的个体核碱基构成的Xpandomer产物。核酸酶也降解模板和任何相连的引物，从而释放产物。通过紫外线暴露，剪切连接臂内的光裂解键。

过滤和纯化Xpandomer产物，去除截短的合成子和核酸酶消化的副产物。可以使用各种现有的和下一代方法，进行线性化的Xpandomer的检测和分析。

实施例29：RT-NTP连接臂的原位合成

在固相支持体上使用标准的肽合成方法，制备具有(树脂-C’)-Glu-Cys-(Gly-Ala)₁₀-Pro-Ser-Gly-Ser-Pro-(Ala-Gly)₁₀-Cys-Lys结构的肽。将末端胺与SANH(Pierce，Cat No 22400)反应产生酰肼连接子。

独立地，用SFB(Pierce Bioconjugate Toolkit，Cat No 22419)处理C6氨基修饰的三磷酸脱氧腺苷(N6-(6-氨基)己基-dATP(Jena Bioscience，Jena DE；Cat No NU-835)，形成4FB功能基团。通过将修饰的碱基结合于前面所述步骤的反应性酰肼上，组装连接臂-探针底物构建体。

将构建体随后从树脂上剪切下来。在去保护之后以及在通常的氧化条件下，半胱氨酸结合形成连接臂内的二硫键，从而稳定β发夹结构，该结构含有末端游离的羧基(连接臂上悬垂的δ连接基团)以及连接臂连接点附近的赖氨酸(侧链胺∈连接基团)。

该二硫化物代表II、III、VI、VII和VIII型底物构建体(见图8和9)所述的连接臂内的稳定性，虽然在此更具体地参考VI、VII和VIII型单体底物构建体进行了举例说明。假定C-C肽键长度为

未折叠的连接臂长度则大约是10nm，但是由于β发夹结构中氢键的形成，所以连接臂呈现紧凑的形态。

如Gellman(”Foldamers，a manifesto“，Acc Chem Res 31：173-80，1998)所述，不仅是肽，各种多聚体，都可以折叠成紧凑的形态。此类多聚体包括寡聚吡啶、聚异腈、聚亚安酯、聚(三芳甲基)甲基丙烯酸酯、聚醛、聚脯氨酸、RNA、聚吡咯啉和寡聚脲，所有这些都具有可以折叠成紧凑的二级结构的能力并且在适宜的条件下展开。因此，这里呈现的肽实施例，是更多类型的连接臂化学物质的代表，其中在未展开的连接臂上的约束可包括例如氢键和疏水相互作用，以及例如连接臂内的交联。

实施例30：使用Xprobe合成Xpandomer

在一SBX实施方案中，将256个4mer Xprobe的Xprobe文库呈现于表面连接和延伸的单链DNA靶标上，用于杂交。在精确的热循环程序下的杂交步骤持续进行用于促进长的Xprobe链。再次在精确的热控制下，通过简单的漂洗步骤去除弱结合的、非特异性探针-靶标双链体。进行酶促，以便沿靶DNA连接任何Xprobe链，之后进行第二次漂洗。通过重复杂交/漂洗/连接/漂洗循环，在沿靶DNA的多个基因座上产生更长的连接序列，直至靶模板的复制大部分完成。

用确立已久的基于DNA聚合酶和连接酶的缺口填充方法(Lee，“Ligase Chain Reaction”，Biologicals，24(3)：197-199，1996)填充沿靶DNA的未填充的缺口。并入缺口的核苷酸具有独特的报道密码来表示缺口核苷酸。剪切完整的Xpandomer中间体，产生Xpandomer，所述Xpandomer中间体由带有互补性双链体化的连接的Xprobe的原始的DNA靶标组成，该Xprobe带有偶发的1、2或3个核苷酸缺口填充子。本实施例的可剪切的连接子是3’O-P-N 5’底物主链修饰物。通过在室温下添加醋酸，催化选择性剪切。

过滤和纯化Xpandomer，从而去除截短的产物，并且随后将其延伸，形成连接的报道密码的线性结构。利用各种现有的方法，进行Xpandomer产物的检测和分析。

实施例31：使用聚合酶合成Xntp Xpandomer

用修饰的8-[(6-氨基)己基]-氨基-脱氧腺苷三磷酸底物构建体合成X型Xpandomer，该底物构建体具有混合的主链，该主链由非桥接的2-氨乙基磷酸酯和在α磷酸盐上桥接的硫羟磷酸酯(3’O-P-S 5’)构成。将核苷酸内的连接臂连接于2-氨乙基磷酸酯连接子以及8-[(6-氨基)己基]-氨基-脱氧ATP上的C6氨基连接子。序列“TTTTTTTTTTTTTTTTTTTTATCTACCGTCCGTCCC”用作模板。序列“5’GGGACGGACGGTAGAT”用作引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。引物和模板退火形成模板，该模板带有双链体引物和游离的3’-OH以及长度为20个碱基的5’末端单链突出端。然后添加底物构建体和聚合酶，在调整为最适宜的聚合条件下聚合继续进行60min。将聚合反应的样品与凝胶上样缓冲液混合，并且与无聚合酶的阴性对照和MW标记物一起在20％的TBE丙烯酰胺凝胶(Invitrogen，USA)上电泳，从而确定XNTP的聚合。

用二价阳离子(参见Mag et al.，1991.“Synthesis and selective cleavageof an oligodeoxynucleotide containing a bridged intemucleotide5′-phosphorothioate linkage”，Nucleic Acids Research，19(7)：1437-1441)处理Xpandomer中间体，从而选择性剪切连接臂连接物和脱氧核糖之间的硫羟磷酸酯键，通过电泳来确定所述中间体。

实施例32：使用聚合酶合成Xntp Xpandomer

用修饰的N⁶-(6-氨基)己基-脱氧腺苷三磷酸底物构建体合成X型Xpandomer，该底物构建体具有混合的主链，该主链由非桥接的(N-1-氨烷基)氨基磷酸酯和在α磷酸盐上桥接的硫羟磷酸酯(3’O-P-S 5’)。将核苷酸内的连接臂连接于N-1-氨烷基基团以及N⁶-(6-氨基)己基-脱氧ATP上的C6氨基连接子。用序列“TTTTTTTTTTTTTTTTTTTTATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”作为引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。引物和模板退火形成模板，该模板带有双链体引物和游离的3’-OH以及长度为20个碱基的5’末端单链突出端。然后添加底物构建体和聚合酶，在调整为最适宜的聚合条件下，聚合继续进行60min。将聚合反应的样品与凝胶上样缓冲液混合，并且与无聚合酶的阴性对照和MW标记物一起在20％的TBE丙烯酰胺凝胶(Invitrogen，USA)上电泳，从而确定XNTP的聚合。

用碘乙醇(参见Gish et al.(“DNA and RNA sequence determinationbased on phosphorothioate chemistry”，Science，240(4858)：1520-1522，1988)或如Vyle et al.(“Sequence-and strand-specific cleavage inoligodeoxyribonucleotides and DNA containing 3′-thiothymidine”.Biochemistry 31(11)：3012-8，1992)所述的用二价金属阳离子剪切，处理Xpandomer中间体，从而选择性剪切连接臂连接物和脱氧核糖之间的硫羟磷酸酯键，通过电泳确定所述中间体。

实施例33：使用连接酶合成Xntp Xpandomer

用修饰的8-[(6-氨基)己基]-氨基-脱氧腺苷单磷酸底物构建体合成X型Xpandomer，该底物构建体具有混合的主链，该主链由非桥接的2-氨乙基磷酸酯和在α磷酸盐上桥接的氨基磷酸酯(3’O-P-N 5’)。将核苷酸内的连接臂连接于2-氨乙基连接子以及8-[(6-氨基)己基]-氨基-脱氧AMP上的C6氨基连接子。用序列“TTTTTTTTTTTTTTTTTTTTATCTACCGTCCGTCCC”作为模板。用序列“5’GGGACGGACGGTAGAT”作为引物。用引物上的5’末端HEX(5’六氯-荧光素)作为标签。引物和模板退火形成模板，该模板带有双链体引物和游离的3’-OH以及长度为20个碱基的5’末端单链突出端。然后添加底物构建体和连接酶，在适合连接条件下连接继续进行5小时。将连接反应的样品与凝胶上样缓冲液混合并，并与无聚合酶的阴性对照和MW标记物一起在20％的TBE丙烯酰胺凝胶(Invitrogen，USA)上电泳，从而来确定XNTP的连接。

根据Mag等(”Synthesis and selective cleavage ofoligodeoxynucleotides containing non-chiral internucleotide phosphoramidatelinkages”，Nucl.Acids Res.17：5973-5988，1989)的方法，用80％的醋酸在室温下将Xpandomer中间体处理5小时，从而选择性剪切连接臂连接点和脱氧核糖之间的氨基磷酸酯键，通过电泳确定。

可以组合上文所述的各种实施方案从而提供其他的实施例。将本说明书所提到的和/或申请数据表所列举的所有的美国专利、美国专利申请公开、美国专利申请、外国专利、外国专利申请和非专利出版物通过引用并于本文。如果需要，实施方案的各方面可以进行修改，以便使用各种专利、申请和公开的概念来提供其他的实施例。可以根据以上的详细描述，可对实施方案实施这些和其他变化。一般而言，在以下的权利要求中，所用的术语不应当解释为对说明书和权利要求中所公开的具体实施方案的权益，而应当解释为包括所有可能的实施方案，以及授予此类权利的等同物的全部范围。因此，权利要求并不受该公开的限制。

Claims

1.用于靶核酸测序的方法，包括：

a)提供通过模板指导合成所产生的子链，所述子链包含耦合于序列中的多个亚基，所述序列对应于全部或部分所述靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、至少一个探针或核碱基残基，以及至少一个选择性可剪切键；

b)剪切至少一个选择性可剪切键，产生长度比子链的多个亚基更长的Xpandomer，所述Xpandomer包含所述连接臂和用于解析序列中的遗传信息的报道元件，所述序列对应于全部或部分所述靶核酸的连续核苷酸序列；以及

c)检测所述Xpandomer的报道元件。

2.如权利要求1所述的方法，其中所述用于解析遗传信息的报道元件与所述Xpandomer的连接臂相连。

3.如权利要求1所述的方法，其中所述用于解析遗传信息的报道元件在所述至少一个选择性可剪切键剪切前与子链相连。

4.如权利要求1所述的方法，其中所述用于解析遗传信息的报道元件在所述至少一个选择性可剪切键剪切后与Xpandomer相连。

5.如权利要求1所述的方法，其中所述Xpandomer还包含所述至少一个探针或核碱基残基的全部或部分。

6.如权利要求5所述的方法，其中所述用于解析遗传信息的报道元件是所述至少一个探针或核碱基残基或与所述至少一个探针或核碱基残基相连。

7.如权利要求1所述的方法，其中所述至少一个选择性可剪切键是共价键。

8.如权利要求1所述的方法，其中所述至少一个选择性可剪切键是连接臂内的键。

9.如权利要求1所述的方法，其中所述至少一个选择性可剪切键是在所述子链的探针或核碱基残基之间或之内的键。

10.如权利要求1所述的方法，其中所述至少一个选择性可剪切键是在所述子链的探针或核碱基残基和靶模板之间的键。

11.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息。

12.如权利要求11所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

P¹’表示与P¹互补的模板链的至少一个核苷酸残基的连续核苷酸序列；

P²’表示与P²互补的模板链的至少一个核苷酸残基的连续核苷酸序列；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类都与部分所述靶核酸的连续核苷酸序列互补。

13.如权利要求11所述的方法，其中所述子链由多个具有以下结构的寡聚体底物构建体形成：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；以及

R¹和R²表示用于所述子链的模板指导合成的相同或不同的末端基团。

14.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息；以及

χ表示与相邻亚基的连接臂的键。

15.如权利要求14所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类都与部分所述靶核酸的连续核苷酸序列互补；以及

χ表示与相邻亚基的连接臂的键。

16.如权利要求14所述的方法，其中所述子链由多个具有以下结构的寡聚体底物构建体形成：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

R¹和R²表示用于所述子链的模板指导合成的相同或不同末端基团；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

17.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

18.如权利要求17所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

P²’表示与P¹互补的模板链的至少一个核苷酸残基的连续核苷酸序列；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

19.如权利要求17所述的方法，其中所述子链由多个具有以下结构的寡聚体底物构建体形成：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

R¹和R²表示用于所述子链的模板指导合成的相同或不同的末端基团

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

20.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

21.如权利要求20所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个种类都与部分所述靶核酸的连续核苷酸序列互补；以及

χ表示与相邻亚基的连接臂的键。

22.如权利要求20所述的方法，其中所述子链由多个具有以下结构的寡聚体底物构建体形成：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

ε表示第一连接基团；以及

δ表示第二连接基团。

23.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

24.如权利要求23所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

α表示选自亚基基序文库的亚基基序的类，其中每个所述种类都与部分所述靶核酸的连续核苷酸序列互补；以及

χ表示与相邻亚基的连接臂的键。

25.如权利要求23所述的方法，其中所述子链由多个具有以下结构的寡聚体底物构建体形成：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

ε表示第一连接基团；以及

δ表示第二连接基团。

26.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

27.如权利要求26所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类与部分所述靶核酸的连续核苷酸序列互补；以及

χ表示与相邻亚基的连接臂的键。

28.如权利要求26所述的方法，其中所述子链由多个具有以下结构的单体底物构建体形成：

其中

T表示所述连接臂；

N表示核碱基残基；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

29.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

30.如权利要求29所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

31.如权利要求29所述的方法，其中所述子链由多个具有以下结构的单体底物构建体形成：

其中

T表示所述连接臂；

N表示核碱基残基；

～表示所述至少一个选择性可剪切键；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

32.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

33.如权利要求32所述的方法，其中所述子链在所述至少一个选择性可剪切键剪切前，包含具有以下结构的模板-子链双链体：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

34.如权利要求32所述的方法，其中所述子链由多个具有以下结构的单体底物构建体形成：

其中

T表示所述连接臂；

N表示核碱基残基；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

35.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息；

χ¹表示与相邻亚基的连接臂的键；以及

χ²表示连接臂之间的键。

36.如权利要求35所述的方法，其中所述子链在所述至少一个选择性可剪切键的剪切之前，与模板链双链体化产生具有以下结构的双链体子链：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

α表示选自亚基基序文库的亚基基序的种类，其中每个所述种类都与部分所述靶核酸的连续核苷酸序列互补；

χ¹表示与相邻亚基的连接臂的键；以及

χ²表示连接臂之间的键。

37.如权利要求35所述的方法，其中所述子链由多个具有以下结构的单体底物构建体形成：

其中

T表示所述连接臂；

N表示核碱基残基；

ε₁和ε₂表示相同或不同的第一连接基团；

δ₁和δ₂表示相同或不同的第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

38.如权利要求1所述的方法，其中所述Xpandomer包含以下结构：

其中

T表示所述连接臂；

n¹和n²分别表示核碱基残基的第一部分和第二部分；

39.如权利要求38所述的方法，其中所述子链在所述至少一个选择性可剪切键的剪切之前，与模板链双链体化产生具有以下结构的双链体子链：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的模板链的核苷酸残基；

V表示所述核碱基残基的内剪切位点；

40.如权利要求38所述的方法，其中所述子链由多个具有以下结构的单体底物构建体形成：

其中

T表示所述连接臂；

N表示核碱基残基；

V表示所述核碱基残基的内剪切位点；以及

R¹和R²表示用于所述子链的模板指导合成的相同或不同末端基团。

41.用于靶核酸测序的模板指导合成中所用的寡聚体底物构建体，包含连接于第二探针部分上的第一探针部分和具有第一末端和第二末端的连接臂，所述第一和第二探针部分的每一部分都具有适用于所述模板指导合成的末端基团，所述连接臂的至少第一末端连接于所述第一和第二探针部分中至少之一，其中在用于所述模板指导合成时，所述寡聚体底物构建体能够形成包含受约束的Xpandomer的子链，所述受约束的Xpandomer具有耦合于序列中的多个亚基，所述序列对应于全部或部分所述靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、所述第一和第二探针部分以及至少一个选择性可剪切键。

42.如权利要求41所述的寡聚体底物构建体，具有以下结构：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；以及

R¹和R²表示用于模板指导合成的相同或不同末端基团。

43.如权利要求41所述的寡聚体底物构建体，具有以下结构：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

R¹和R²表示用于模板指导合成的相同或不同末端基团；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

44.如权利要求41所述的寡聚体底物构建体，具有以下结构：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

R¹和R²表示用于模板指导合成的相同或不同末端基团；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

45.如权利要求41所述的寡聚体底物构建体，具有以下结构：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

R¹和R²表示用于模板指导合成的相同或不同的末端基团；

ε表示第一连接基团；以及

δ表示第二连接基团。

46.如权利要求41所述的寡聚体底物构建体，具有以下结构：

其中

T表示连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

R¹和R²表示用于模板指导合成的相同或不同的末端基团；

ε表示第一连接基团；以及

δ表示第二连接基团。

47.用于靶核酸测序的模板指导合成中所用的单体底物构建体，包含带有适用于所述末端指导合成的末端基团的核碱基残基，和具有第一末端和第二末端的连接臂，且所述连接臂的至少第一末端连接于所述核碱基残基，其中在用于所述模板指导合成时，所述单体底物构建体能够形成包含受约束的Xpandomer的子链，所述受约束的Xpandomer具有耦合于序列中的多个亚基，所述序列对应于全部或部分所述靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、核碱基残基以及至少一个选择性可剪切键。

48.如权利要求47所述的单体底物构建体，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

R¹和R²表示用于所述子链的所述模板指导合成的相同或不同末端基团；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

49.如权利要求47所述的单体底物构建体，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

～表示所述至少一个选择性可剪切键；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

50.如权利要求47所述的单体底物构建体，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

ε表示第一连接基团；

δ表示第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

51.单体底物构建体，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

ε₁和ε₂表示相同或不同的第一连接基团；

δ₁和δ₂表示相同或不同的第二连接基团；以及

“----“表示可剪切的连接臂内的交联键。

52.如权利要求47所述的单体底物构建体，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

V表示所述核碱基残基的内剪切位点；以及

R¹和R²表示用于所述子链的所述模板指导合成的相同或不同末端基团。

53.用于靶核酸测序的模板指导合成中所用的双链体子链，包含与模板链双链体化的子链，该子链包含受约束的Xpandomer并具有耦合于序列中的多个亚基，所述序列对应于全部或部分所述靶核酸的连续核苷酸序列，其中个体亚基包含连接臂、至少一个探针或核碱基残基以及至少一个选择性可剪切键。

54.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

P¹’表示与P¹互补的所述模板链的至少一个核苷酸残基的连续核苷酸序列；

P²’表示与P²互补的所述的至少一个核苷酸残基的连续核苷酸序列；

55.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

P²’表示与P²互补的所述模板链的至少一个核苷酸残基的连续核苷酸序列；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

56.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

57.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

58.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

59.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的所述模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

60.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的所述模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

61.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的所述模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

62.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的所述模板链的核苷酸残基；

～表示所述至少一个选择性可剪切键；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ¹表示与相邻亚基的连接臂连接的键；以及

χ²表示连接臂之间的键。

63.如权利要求53所述的双链体子链，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

N’表示与N互补的所述模板链的核苷酸残基；

V表示所述核碱基残基的内剪切位点；

64.用于靶核酸测序的模板指导合成中所用的Xpandomer，包含多个连接臂和用于解析序列中的遗传信息的报道元件，所述序列对应于全部或部分所述靶核酸的连续核苷酸序列。

65.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

66.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

67.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

68.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

P¹表示第一探针部分；

P²表示第二探针部分；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

69.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

κ表示m个亚基的链中的第κ个亚基，其中m是大于3的整数；

χ表示与相邻亚基的连接臂的键。

70.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

71.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

72.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ表示与相邻亚基的连接臂的键。

73.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

N表示核碱基残基；

κ表示m个亚基的链中的第κ个亚基，其中m是大于10的整数；

χ¹表示与相邻亚基的连接臂的键；以及

χ²表示连接臂之间的键。

74.如权利要求64所述的Xpandomer，具有以下结构：

其中

T表示所述连接臂；

n¹和n²分别表示核碱基残基的第一部分和第二部分；