CN103305498A

CN103305498A - 在双链dna片段末端产生预定粘性末端的方法

Info

Publication number: CN103305498A
Application number: CN2012100570735A
Authority: CN
Inventors: 陈威华; 赵国屏
Original assignee: SOUTHERN RESEARCH CENTER NATIONAL HUMAN GENE GROUP; Shanghai Institutes for Biological Sciences SIBS of CAS
Current assignee: Center for Excellence in Molecular Plant Sciences of CAS; Sharp Corp
Priority date: 2012-03-06
Filing date: 2012-03-06
Publication date: 2013-09-18
Anticipated expiration: 2032-03-06
Also published as: CN103305498B

Abstract

本发明涉及在双链DNA片段末端产生预定粘性末端的方法。揭示了一种新的在双链DNA片段末端产生预定粘性末端的方法，所述方法通过构造修饰状态与双链DNA内部不同的含可切割酶切识别位点的双链DNA末端，可以特异性地将双链DNA的末端转变成预设的粘性末端，不需要考虑DNA内部的序列组成和酶切位点组成。利用本发明的方法，可方便、快捷、准确地获得预定的粘性末端，从而实现长链DNA连接，且不引入多余的DNA序列。

Description

在双链DNA片段末端产生预定粘性末端的方法

技术领域

本发明属于生物技术以及基因重组领域；更具体地，本发明涉及在双链DNA片段末端产生预定粘性末端的方法。

背景技术

人工合成生命的诞生是合成生物学领域里程碑式的成就，标志着科学家已经能够合成人工设计的全基因组。在全基因组的合成过程中，文特课题组发展出了一系列的DNA合成组装拼接的关键技术，这些技术将开创人类改造和设计生命的新时代。DNA合成相关技术的发展已经在合成生物学的其他领域产生了重要影响，例如合成青蒿素药物前体，合成复杂的遗传回路，抗生素的组合生物化学合成。在巨大的科学远景和经济预期下，DNA合成相关技术将会飞速发展。而DNA合成相关技术的完善和发展将极大推动合成生物学的繁荣。

文特课题组发展的体外酶法拼接技术，以及更早期的不依赖特定序列和连接酶的体外重组克隆技术，都能够实现在体外有序同步拼接多个片段，这大大缩短了基因组的拼接时间，在合成人工设计的全基因组中优势明显。而且能够为大片段基因和基因簇的研究和改造提供技术可行性。这对那些相对较大的人类和动植物的基因功能研究和改造特别有价值，对那些相对较大的微生物基因簇的功能研究和改造同样有价值。不过这些技术要求被拼接的DNA要存在较长的(15-100碱基对)末端同源序列作为重组连接的连接点。如果能够摆脱拼接技术对末端长同源序列的要求，就可以增加连接点选择的灵活性，简化拼接连接的设计，扩大拼接技术实用的材料来源范围。

限制性核酸内切酶被广泛用来切割双链DNA分子，产生可以用来连接的4碱基突出粘性末端，最常用的IIP型限制性内切酶一般识别对称的回文序列，并在识别位置处切割双链DNA分子，产生的回文粘性末端可以被重组连接，但是连接的次序和方向不能够完全确定，在这种重组连接双链DNA反应过程中有很多非目的产物。

IIS型限制性内切酶可以在识别位点的邻旁确定位置切割双链DNA分子，可以产生非回文的粘性末端。利用这种内切酶可以实现在体外定向定序高通量连接双链DNA分子，还可以实现重复序列较多的基因的合成。不过在这个技术中，为了使IIS酶特异性地作用在DNA双链分子的末端，仅在双链DNA分子末端产生可用于连接的粘性末端，在基因合成过程中设计连接实验的时候需要避免基因内部有多余的酶切位点的存在，这就限制了基因合成的连接点的选择和设计，使得这个方法在合成一些大的基因片段的时候很不方便。

所以人们借助RecA辅助的酶切技术来保护DNA的内部多余酶切位点，但是这个技术涉及较多步骤不仅复杂，而且这个技术中使用的内切酶的识别位点与切割位点只有1-2个碱基的差距，不能够用来去除酶切制备双链DNA时末端通常具有的多余酶切位点。另外也有使用长的识别序列的人工设计的杂合内切酶来减少内部酶切位点带来的限制，但是这个技术中的识别位点与切割位点也只有1-2个碱基的差距，不能够用来去除酶切制备双链DNA时末端通常具有的多余酶切位点。这两个技术中连接点的选择和设计的灵活性都有一定的限制。

综上，本领域还有必要对于长链DNA的拼接方法进行改进，以实现方便、快捷、准确的长链DNA连接。

发明内容

本发明的目的在于提供在双链DNA片段末端产生预定粘性末端的方法。

在本发明的第一方面，提供一种在双链DNA片段末端产生预定粘性末端序列的方法，包括：

(i)提供一种双链DNA片段，其DNA链(较佳地为两条链各自)包括式(I)结构：

B…X-Y (I)；

其中，B为核酸内切酶识别位点序列；B序列与Y序列的修饰状态不同，所述的核酸内切酶特异性识别修饰状态如B的位点序列；

X为核酸内切酶切割位点序列；该切割位点序列经所述核酸内切酶切割后形成预定粘性末端序列；

Y为与所述预定粘性末端序列相连接的来自双链DNA片段的非粘性末端序列(也称为内部序列，该序列的末端需连接预定粘性末端)；

…表示B与X-Y之间存在的化学键或碱基；

-表示化学键；

(ii)利用所述的核酸内切酶切割步骤(i)的双链DNA片段，从而获得末端(一个或两个末端)为预定粘性末端序列的双链DNA片段。

在一个优选例中，式(I)为：5’B…X-Y 3’。

在另一优选例中，当式(I)存在于两条DNA链时，预定粘性末端序列相同或不同；较佳地为不同。

在另一优选例中，B或X各自独立地由若干个碱基组成，一般1-10个，如1、2、3、4、5、6或8个。

在另一优选例中，所述的核酸内切酶对于DNA序列的识别位点和切割位点不相同。

在另一优选例中，根据所述核酸内切酶的识别和切割特性，B位于X-Y的5’端或3’端。较佳地，B位于X-Y的5’端。

在另一优选例中，根据所述核酸内切酶的识别和切割特性，B与X-Y之间存在若干个碱基，一般1-20个，如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18个。

在另一优选例中，根据双链DNA片段上所需产生的粘性末端的位置设计引物；如仅需在一个末端形成粘性末端，则在相应的末端设计式(II)结构的引物；引物与模板的互补配对关系是本领域公知技术。

在另一优选例中，步骤(ii)中，加入酶切激活寡核苷酸，启动基团修饰依赖性核酸内切酶对扩增产物的酶切；较佳地，所述的酶切激活寡核苷酸可以退火形成具有基团修饰依赖性核酸内切酶识别位点的发夹结构。

在另一优选例中，在步骤(i)之前，还包括扩增双链DNA片段的步骤：

(′i)提供待扩增双链DNA片段的上游和下游引物，所述的上游引物或下游引物中包括式(II)结构：

B…X-Y′ (II)；

其中，Y′为与粘性末端序列相连接的且与Y的5’端1-60个(较佳地1-40个，如30个、20个、15个、10个、5个、3个)碱基相同的序列；和

以包含Y序列(含Y及其互补链)的DNA作为模板，利用所述的上游和下游引物进行PCR扩增，获得包含式(I)结构的扩增产物。

在另一优选例中，B序列为预设的或已设的基团修饰状态，Y序列为基团非修饰状态；且所述的核酸内切酶是基团修饰依赖性核酸内切酶；且，步骤(i)中，当B序列为预设的基团修饰状态时，在B序列加上基团修饰后进行步骤(ii)；当B序列为已设的基团修饰状态时，直接进行步骤(ii)。

在另一优选例中，步骤(i)中，B被包含在式(III)结构的Seq中：

Seq’-H-Seq (III)；

其中，Seq是1-30个(如25个、20个、15个、12个、10个、8个、6个)核苷酸的序列，Seq’为与Seq互补的序列；

H为Seq和Seq’之间的间隔序列(通常1-30个碱基；如25个、20个、15个、12个、10个、8个、6个)，所述间隔序列与Seq和Seq’不互补。

在另一优选例中，式(III)可以形成如下二级结构：

其中，||表示在Seq和Seq’之间形成的氢键。

在另一优选例中，式(III)为：5’Seq’-H-Seq 3’。

在另一优选例中，通过在Seq’末端设置可连接的DNA末端(如常规限制性内切酶酶切位点)，将式(III)结构拼接于所述双链DNA片段的链的末端，从而形成包含式(III)结构的式(I)结构。

在另一优选例中，在B与X-Y之间，还包含常规限制性内切酶(为非基团修饰依赖性核酸内切酶)酶切位点序列。

在另一优选例中，所述的基团修饰选自：甲基化修饰，羟甲基化修饰、糖化羟甲基化修饰、甲酰化、羧基化、硫化。

在另一优选例中，在B序列加上基团修饰的方法是：以步骤(i)的双链DNA片段为模板，以包含已设基团修饰的B序列的引物进行PCR扩增，从而在B序列加上基团修饰。

在另一优选例中，所述的基团修饰依赖性核酸内切酶选自(但不限于)：MspJI，FspEI，LpnPI，AspBHI，RlaI，SgrTI；且，

(1)当所述的基团修饰依赖性核酸内切酶是MspJI时：B为^*CNNR，其中R为G或A，^*C为预设的或已设的甲基化(^mC)、羟甲基化(^hmC)；B与X-Y之间存在9个任意碱基；X为4个碱基的序列；或

(2)当所述的基团修饰依赖性核酸内切酶是FspEI时：B为C^*C，其中^*C为预设的或已设的甲基化、羟甲基化；B与X-Y之间存在12个任意碱基；X为4个碱基的序列；或

(3)当所述的基团修饰依赖性核酸内切酶是LpnPI时：B为C^*CDG，其中D为A或G或T，^*C为预设的或已设的甲基化(mC)、羟甲基化(hmC)；B与X-Y之间存在10个任意碱基；X为4个碱基的序列；或

(4)当所述的基团修饰依赖性核酸内切酶是AspBHI时：B为YS^*CNS，其中R为G或A，Y为C或T，S为C或G，N为A或C或G或T，^*C为预设的或已设的甲基化(mC)、羟甲基化(hmC)；B与X-Y之间存在9个任意碱基；X为4个碱基的序列；或

(5)当所述的基团修饰依赖性核酸内切酶是RlaI时：B为S^*CW，其中S为C或G，W为A或T，其中^*C为预设的或已设的甲基化、羟甲基化、或糖化羟甲基化修饰的胞嘧啶；B与X-Y之间存在12个任意碱基；X为4个碱基的序列；或

(6)当所述的基团修饰依赖性核酸内切酶是SgrTI时：B为C^*CDS，其中D为A或G或T，S为C或G，其中^*C为预设的或已设的甲基化、羟甲基化、或糖化羟甲基化修饰的胞嘧啶；B与X-Y之间存在12个任意碱基；X为4个碱基的序列。

在本发明的另一方面，提供一种制备长链DNA的方法，包括：

(a)将待制备的长链DNA分成两条或两条以上的序列片段，依次为序列1、...、序列n；其中n为等于或大于2的正整数(如n＝2-100，更例如n＝3、4、5、10、15、20、30、40、50、60、70、80)；

(b)针对步骤(a)分段的每一序列片段，以前面任一所述的方法分别制备末端为预定粘性末端序列的双链DNA片段；所述的预定粘性末端序列来自于各序列片段的末段，且针对序列n-1获得的双链DNA片段的3’末端预定粘性末端序列与针对序列n获得的双链DNA片段的5’末端预定粘性末端序列相互补；(较佳地，针对每一序列片段设置的预定粘性末端序列不同)

(c)将步骤(b)获得的末端为预定粘性末端序列的双链DNA片段进行连接，从而获得长链DNA。

在一个优选例中，所述的长链DNA选自(但不限于)：基因组DNA，部分序列的基因组DNA，重组质粒的DNA。

在另一优选例中，步骤(b)中，在B序列及其上游和/或下游，预设通用配对引物序列(，从而便于多序列片段批量操作)。

在本发明的另一方面，提供一种用于扩增双链DNA片段的引物，所述的引物中包括式(II)结构：

B…X-Y′(II)

其中，B和X的定义同前述；

Y′为与粘性末端序列相连接的且与Y的5’端1-60个(较佳地1-40个，如30个、20个、15个、10个、5个、3个)碱基相同的序列，Y的定义同前述。

在本发明的另一方面，提供所述的引物的用途，用于制备末端为预定粘性末端序列的双链DNA片段。

在本发明的另一方面，提供一种DNA接头，包含式(III)所示的结构：

Seq’-H-Seq (III)；

其中，Seq是1-30个(如25个、20个、15个、12个、10个、8个、6个)核苷酸的序列，且其中包含有通式(I)中B序列；

Seq’为与Seq互补的序列；

在另一优选例中，所述的DNA接头的一个末端为粘性末端(如Seq’的末端)，从而可与双链DNA片段或引物互补连接。

在本发明的另一方面，提供所述的DNA接头的用途，用于与双链DNA片段连接，将通式(I)中B序列(如基团修饰依赖性核酸内切酶的识别位点序列)引入双链DNA片段。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。

附图说明

图1的示意图显示用一对通用的甲基修饰引物将可被核酸内切酶识别切割的修饰碱基引入到双链DNA的末端，通过修饰依赖性的酶切，实现DNA的无痕拼接。

图2的示意图显示用合成的带甲基化识别位点的引物直接将修饰碱基引入到双链DNA的末端，通过修饰依赖性的酶切，实现DNA的无痕拼接。

图3A的示意图显示用合成的带甲基化识别位点的寡核苷酸接头(发夹状)将识别位点加入到待组装双链DNA末端，通过修饰依赖性的酶切，实现内部无甲基化修饰依赖型切割的双链DNA的无痕拼接。

图3B的示意图显示用合成的带可切割识别位点的寡核苷酸接头(发夹状)将识别位点加入到待组装双链DNA，实现双链DNA(内部的识别位点被修饰保护后不能被选用的限制性内切酶切割)的拼接。

图4、实施例1中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

图5、实施例1中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

图6、实施例2中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

图7、实施例2中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

图8、实施例3、3.1中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

图9、实施例3、3.2中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

图10、实施例2中，经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电泳结果。

具体实施方式

本发明人致力于DNA拼接方法的研究，开发了一种新的在双链DNA片段末端产生预定粘性末端的方法，所述方法通过构造修饰状态与双链DNA内部不同的含酶切识别位点的双链DNA末端，可以特异性地将双链DNA的末端转变成为预定的粘性末端，不需要考虑DNA内部的序列组成和酶切位点组成。利用本发明的方法，可方便、快捷、准确地获得预定的粘性末端，从而实现长链DNA连接，且不引入多余的DNA序列。

术语

如本文所用，所述的“粘性末端”当双链DNA序列中一个特异性的碱基序列处被切断时，在切口处留下若干个未配对的核苷酸片段。所述的“预定粘性末端”是指在切口处留下若干个未配对的核苷酸片段是预先确立的。

如本文所用，除非另外说明，所述的“核酸内切酶”是指识别位点和切割位点不相同的一组酶，并且，其还具有对核酸链的修改状态进行识别的能力。当一条核酸链存在不同的修饰状态时，所述的“核酸内切酶”能够特异性地识别特定的修饰状态的核酸位点，而不识别其它的修饰状态。本文中，也将该“核酸内切酶”称为“修饰相关性核酸内切酶”。

如本文所用，所述的“常规限制性内切酶”是指一类常用的限制性内切酶，其不同于上段所定义的“核酸内切酶”，也不是基团修饰依赖性核酸内切酶。所述的“常规限制性内切酶”的识别位点和切割位点通常位于核苷酸序列的同一位置上。所述的“常规限制性内切酶”例如但不限于：BamHI、XbaI、EcoRI等。

如本文所用，所述的“基团修饰依赖性(限制性)核酸内切酶”是指一类能够区分识别位点的修饰状态并切割双链DNA的酶，而且其识别位点与切割位点不相同；其识别基团修饰的碱基(如甲基化、羟甲基化、糖化羟甲基化修饰的胞嘧啶，即^mC、^hmC、^glc-hmC)，且在识别位点以外的位点上切割DNA双链并形成粘性末端。所述的基团修饰包括(但不限于)甲基化、羟甲基化、糖化羟甲基化修饰、甲酰化、羧基化、硫化。所述的基团修饰依赖性核酸内切酶包括(但不限于)：MspJI，FspEI，LpnPI，AspBHI，RlaI、SgrTI等。

如本文所用，所述的“长链DNA”是指链长较长的DNA，根据其长度，通过人工合成的方法或基因工程方法进行合成时，有必要分成多个DNA片段进行。例如，所述的“长链DNA”长度大于1000bp，2000bp，3000bp，4000bp，5000bp，6000bp。

如本文所用，所述的“预设的基团修饰状态”是指一种核酸序列状态，该序列还没有进行基团修饰，但可通过加入基团修饰(如通过PCR扩增加入基团修饰)。

如本文所用，所述的“已设的基团修饰状态”是指一种核酸序列状态，该序列已经进行基团修饰。

如本文所用，“互补”是指两条单链的核苷酸的序列可以以一种可预见的方式发生相互作用，形成双链结构。相互“互补”的序列通常是指将5’-3’方向的序列转换为其3’-5’方向的序列(如5’ATCG 3’→GCTA)，然后再取其互补序列(如GCTA→5’CGAT 3’)。

如本文所用，“发夹(Hairpin)”结构也被称作“茎环”结构，是指一种寡核苷酸分子，其可形成一种包括双链区域(茎部)的二级结构，所述的双链区域由该寡核苷酸分子的两个区域(位于同一分子上)形成，两个区域分列双链部分的两侧；其还包括至少一个“环”结构，包括非互补的核苷酸分子，即单链区域。发夹结构是本领域技术人员所熟知的，通常在获得了一条具有一级结构的寡核苷酸序列后，本领域技术人员能够确定该核酸是否能形成发夹结构。

如本文所用，所述的“含有”，“具有”或“包括”包括了“包含”、“主要由......构成”、“基本上由......构成”、和“由......构成”；“主要由......构成”、“基本上由......构成”和“由......构成”属于“含有”、“具有”或“包括”的下位概念。

在双链DNA片段末端产生预定粘性末端序列的方法

本发明涉及一种把双链DNA末端转变为预定粘性末端的方法，通过构造修饰状态与双链DNA内部不同的含酶切识别位点的双链DNA末端，利用在识别位点附近进行修饰相关性切割的修饰相关性核酸内切酶，可以特异性地将双链DNA末端转变成为可用于连接反应的粘性末端，不需要考虑待组装的DNA内部的序列组成和酶切位点组成。

与目前直接通过体外连接寡核酸接头来改变DNA末端的粘性末端不同的是，本发明的方法既可以加入碱基来产生粘性末端，包括但不限于1-8个碱基的加入；也可以去除DNA末端多余碱基来产生粘性末端，包括但不限于1-14个碱基的去除。用于连接两段双链DNA分子的粘性末端碱基对可以预先选定，这个方法能够无痕迹地以任意碱基在任意位置连接双链DNA分子，具有广泛的实用性。

以往，基团修饰依赖性核酸内切酶被开发用来进行表观遗传学研究，检测基因组上胞嘧啶的甲基化状态。这种基团修饰依赖性核酸内切酶识别的位点是含修饰基团的碱基，例如MspJI(US20100167942)能够识别位点^mCNNR(R＝G/A)并能在修饰的胞嘧啶3’一侧N₉/N₁₃处切割双链DNA，而对没有发生修饰的碱基序列不会发生切割。

本发明所述的基团修饰依赖性核酸内切酶，其识别位点与切割位点不相同，其识别基团修饰的碱基(如甲基化、羟甲基化，即^mC、^hmC)，且在识别位点以外的位点上切割DNA双链并形成粘性末端。根据该酶的特性，可以在DNA链的近末端区预设或设置该酶的识别位点，并设置适当的碱基间隔，从而使得该酶在切割位点处切割产生粘性末端。

DNA链的上述设计可以通过设计引物、PCR扩增来实现；也可以通过设计包含识别位点的核酸链接头(如Seq’-H-Seq)并与DNA链的其它区域相连接来实现。

上述方法，可以特异性地在双链DNA的末端产生可用于连接反应的粘性末端，对于未修饰的双链DNA分子，完全不用考虑DNA双链内部的碱基序列，大大简化了DNA组装合成的设计，增加了设计的灵活性和方便性。

利用基团修饰依赖性核酸内切酶进行酶切的方法是本领域技术人员已知的，例如可以获自提供该基团修饰依赖性核酸内切酶的厂商，或记载于试剂盒的说明书中。

本发明的方法，由于特异性地构造了双链DNA片段末端与双链DNA片段内部修饰状态的不同，使得修饰依赖的限制性内切酶可以特异性地作用在DNA的末端，这个方法利用的是DNA修饰状态的不同，所以不需要考虑双链DNA内部的碱基序列组成。更重要的是，可以利用识别位点与切割位点之间存在若干个碱基的差距来去除DNA末端的多余酶切位点。通过酶切制备的双链DNA分子末端通常会有这样的酶切位点。这样不仅增加了设计的灵活性，还能够实现无痕迹地以任意碱基在任意位置连接双链DNA分子。

本发明涉及的基团(化)修饰、去基团(化)修饰的方法是本领域技术人员熟知的。例如，利用DNA甲基化转移酶催化，可将胞嘧啶(C)转变为5-甲基胞嘧啶(5mC；简称^mC)，而一种称为TET1的酶可以羟基化5mC形成5hmC(简称^hmC)；此外也存在一些DNA去甲基化酶来实现甲基基团的去除。

序列拼接

利用本发明的方法，在特定酶的识别位点附近进行切割，可以无疤痕地在双链DNA末端产生预定粘性末端。更有利的是这个方法可以去除或/和转换DNA双链末端的多余酶切位点，使得这个技术可以将来源于体内的各种酶切片段无疤痕地按照预定次序和方向地连接在一起。可以设置多条分别带有不同粘性末端的DNA双链，由于粘性末端的设置是可控的，可以设置为针对序列n-1获得的双链DNA片段的3’末端预定粘性末端序列与针对序列n获得的双链DNA片段的5’末端预定粘性末端序列相互补，从而可以以一种预定的次序和方向连接成长链DNA。

引物

为了在DNA链上获得预定的粘性末端，一种途径是利用引物进行PCR扩增来将预设的带有特定酶(如基团修饰依赖性核酸内切酶)识别位点以及切割位点(即预期形成粘性末端的位点)的序列添加到DNA链上。因此，本发明也包括这种经过设计的引物。

作为一种优选方式，本发明的引物的序列包括：预设的或已设的基团修饰依赖性核酸内切酶识别位点序列；基团修饰依赖性核酸内切酶切割位点序列，该切割位点序列经所述基团修饰依赖性核酸内切酶切割后形成预定粘性末端序列；以及与粘性末端序列相连接的且与DNA链的内部序列相同或互补的一段(如1-60个碱基)序列。

所述的引物可被包含在试剂盒中，以用于商业化的用途。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如J.萨姆布鲁克等编著<分子克隆实验指南>，科学出版社，2002中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数按重量计算。

实施例1、用通用的甲基化修饰引物将PCR片段末端加上修饰的可切割酶切识别位点

MspJI是一种修饰依赖性的核酸内切酶，能够识别位点^mCNNR(R＝G/A)并能在修饰的胞嘧啶3’一侧N₉/N₁₃处切割双链DNA。

本实施例中，使用的引物中选用^mCTGG作为识别位点，引物中用粗体表示的碱基是预设的切割位点和连接位点。

具体来看：MspJI切割修饰的A片段后，A片段上游引物端可以产生TATC的5’突出粘性末端，A片段下游引物端可以产生AGTT的5’突出粘性末端(表1)；MspJI切割修饰的B片段后，B片段上游引物端可以产生AACT的5’突出粘性末端，B片段下游引物端可以产生TCGG的5’突出粘性末端；MspJI切割修饰的C片段后，C片段上游引物端可以产生CCGA的5’突出粘性末端，C片段下游引物端可以产生ACCC的5’突出粘性末端；MspJI切割修饰的D片段后，D片段上游引物端可以产生GGGT的5’突出粘性末端，D片段下游引物端可以产生CGGA的5’突出粘性末端；MspJI切割修饰的E片段后，E片段上游引物端可以产生TCCG的5’突出粘性末端，E片段下游引物端可以产生CGCC的5’突出粘性末端；MspJI切割修饰的F片段后，F片段上游引物端可以产生GGCG的5’突出粘性末端，F片段下游引物端可以产生CGGT的5’突出粘性末端；MspJI切割修饰的G片段后，G片段上游引物端可以产生ACCG的5’突出粘性末端，G片段下游引物端可以产生GCGA的5’突出粘性末端。

这样，这些DNA双链片段经MspJI切割后产生的4碱基对的5’突出粘性末端确定了连接的次序和方向。具体来看：A片段下游引物端产生的AGTT的5’突出粘性末端可以与B片段上游引物端产生的AACT的5’突出粘性末端互补连接；B片段下游引物端产生的TCGG的5’突出粘性末端可以与C片段上游引物端产生的CCGA的5’突出粘性末端互补连接；C片段下游引物端产生的ACCC的5’突出粘性末端可以与D片段上游引物端产生的GGGT的5’突出粘性末端互补连接；D片段下游引物端产生的CGGA的5’突出粘性末端可以与E片段上游引物端产生的TCCG的5’突出粘性末端互补连接；E片段下游引物端产生的CGCC的5’突出粘性末端可以与F片段上游引物端产生的GGCG的5’突出粘性末端互补连接；F片段下游引物端产生的CGGT的5’突出粘性末端可以与G片段上游引物端产生的ACCG的5’突出粘性末端互补连接。

成对设计的可以连接的粘性末端互补碱基序列确定了连接的次序和方向。更重要的是这些序列可以选择为待组装的DNA片段本来的碱基序列，不会因为组装的需要引入多余的碱基序列。

实验扩增用引物序列如表1(从5’到3’方向)。

表1

表1中，kky.ACT1、kky.ACT2、kky.ACT3、kky.ACT4、kky.ACT5、kky.ACT6、kky.ACT7、kky.ACT8、kky.ACT9、kky.ACT10、kky.ACT11、kky.ACT12、kky.ACT13、kky.ACT14引物序列中的GGCAGCCGTCTCCCTGGAAG是设计作为加入甲基化修饰时用的通用退火互补序列，CTGG碱基序列是预设为修饰依赖性切割的内切酶MspJI的还未修饰的识别碱基序列，AAGTCTAGA是可以任意选取的9个碱基序列，这里设计了一个XbaI酶切位点TCTAGA以方便进行PCR产物的常规克隆。kjz.ml1的第5位和第22位的胞嘧啶为甲基化修饰碱基，作为酶切激活寡核苷酸kjz.ml1可以退火形成具有内切酶MspJI的识别位点的发夹结构。kjz.ml2的第14位的胞嘧啶为甲基化修饰碱基，kjz.ml2可以作为通用修饰引物，以PCR片段A、B、C、D、E、F、G为模板扩增形成末端甲基化修饰的双链DNA片段。所有引物合成由Invitrogen公司合成。MspJI购自NEB公司(R0661S)。T4 DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。寡核苷酸退火缓冲液20×SSC购买自生工生物(上海)有限公司，配方如下：1升溶液里175.3克氯化钠，88.2克柠檬酸钠，用盐酸调pH值到7.0。6×DNA上样缓冲液购自Fermentas公司(R0611)。1Kb Mark购自Fermentas公司。

实验操作过程如图1中所示(但与示意图相比可能存在片段数的不同)。具体实验步骤如下：

首先用天蓝色链霉菌M145[1](ATCC号BAA-471)基因组DNA为模板，以表1引物分别PCR扩增A片段、B片段、C片段、D片段、E片段、F片段、G片段。这些基因片段来自天蓝色链霉菌中的放线紫红素基因簇(NC 003888.3GI：32141095)(5513563-5542271)，其中：

A片段扩增目的片段长度4092碱基对(5513563-5517654)；

B片段扩增目的片段长度4000碱基对(5517651-5521652)；

C片段扩增目的片段长度4084碱基对(5521648-5525731)；

D片段扩增目的片段长度3865碱基对(5525728-5529592)；

E片段扩增目的片段长度4285碱基对(5529589-5533873)；

F片段扩增目的片段长度4923碱基对(5533870-5538259)；

G片段扩增目的片段长度4016碱基对(5538256-5542271)。

然后以获得的目的扩增产物为模板，使用通用修饰引物kjz.ml2再一次PCR扩增，从而将含修饰碱基的内切酶识别序列特异性地加在了待组装片段的两个末端。

用MspJI酶切处理已加上修饰碱基的A片段、B片段、C片段、E片段、F片段、G片段，MspJI酶切条件参见产品说明书和文献Zheng Y，Cohen-Karni D，Xu D，ChinHG，Wilson G，Pradhan S，Roberts RJ：A unique family of Mrr-likemodification-dependent restriction endonucleases.Nucleic AcidsResearch 2010，38(16)：5527-5534。酶切激活寡核苷酸退火制备条件是：5μL的20×SSC，95μL浓度为100μM的寡核苷酸kjz.ml1，共100μL体积在250μL的薄壁PCR管中，用PCR仪器65℃温育1小时后在室温25℃缓慢冷却。选定MspJI酶切体系为30μL，依次加入3μLNE Buffer 4、20μL的底物DNA约200ng到1000ng、1μL的BSA、1μL的稀释成10μM的酶切激活寡核苷酸、4μL到4.8μL的双蒸水、0.2μL到1μL的酶，37℃酶切3小时。因为PCR片段内部没有甲基化修饰的酶切位点，这样修饰依赖性切割的内切酶MspJI就可以特异性地作用在双链DNA的近末端，把双链DNA的末端转变成为可用于连接反应的粘性末端。而且由于修饰依赖性切割的内切酶MspJI能够在识别位点^mCNNR(R＝G/A)中修饰的胞嘧啶3’一侧N₉/N₁₃处切割双链DNA。这样切割后的产物中不会残留识别位点序列，用于连接两段双链DNA分子的粘性末端碱基对可以预先选定为任意的碱基序列。

然后，将已具有粘性末端的待连接DNA片段用T4DNA连接酶体外连接。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接缓冲液：2μl；DNA底物12-15μl；加水至20μl进行连接反应。将体外连接产物加入6×DNA上样缓冲液5μl后在65℃水浴中变性15分钟后用0.8％的琼脂糖胶块进行电泳分析。结果如图4和图5所示，得到了与设计相符的连接好的目的组装产物。

图4中A+B+C表示经MspJI酶切处理后的A片段、B片段、C片段为底物的体外连接反应；B+C表示经MspJI酶切处理后的B片段、C片段为底物的体外连接反应；A+B表示经MspJI酶切处理后的A片段、B片段为底物的体外连接反应；A表示经MspJI酶切处理后的A片段为底物的体外连接反应；1Kb Mark购自Fermentas公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在16℃水浴中连接2小时。

图5中E+F+G表示经MspJI酶切处理后的E片段、F片段、G片段为底物的体外连接反应；F+G表示经MspJI酶切处理后的F片段、G片段为底物的体外连接反应；E+F表示经MspJI酶切处理后的E片段、F片段为底物的体外连接反应；G表示经MspJI酶切处理后的G片段为底物的体外连接反应；1Kb Mark购自Fermentas公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接1小时。

实施例2、用合成的含可切割甲基化识别位点的寡核苷酸引物扩增待组装片段

MspJI是一种修饰依赖性的核酸内切酶，能够识别位点^mCNNR(R＝G/A)并能在修饰的胞嘧啶3’一侧N₉/N₁₃处切割双链DNA。实施例2中使用的引物klf.A-T1、klf.A-T6、klf.A-T9、klf.A-T14中分别选用^mCTGG、^mCAGG、^mCTGG、^mCAGG作为识别位点作为例证，引物中用粗体表示的碱基是预设的MspJI的切割位点和连接位点。

经修饰依赖性的内切酶MspJI切割后，在V1载体上游引物端可以产生GATA的5’突出粘性末端；在V1载体下游引物端可以产生GGGT的5’突出粘性末端；在V2载体上游引物端可以产生CGGA的5’突出粘性末端；在V2载体下游引物端可以产生TCGC的5’突出粘性末端。

其中V1载体上游引物端酶切后产生GATA的5’突出粘性末端可以与A片段上游引物端形成的TATC的5’突出粘性末端互补连接；其中V1载体下游引物端酶切后产生GGGT的5’突出粘性末端可以与C片段下游引物端形成的ACCC的5’突出粘性末端互补连接；其中V2载体上游引物端酶切后产生CGGA的5’突出粘性末端可以与E片段上游引物端形成的TCCG的5’突出粘性末端互补连接；其中V2载体下游引物端酶切后产生TCGC的5’突出粘性末端可以与G片段下游引物端形成的GCGA的5’突出粘性末端互补连接；这些成对设计了的可以连接的粘性末端互补碱基序列决定了连接的次序和方向。更重要的是这些序列可以选择为待组装的DNA片段本来的序列，不会因为组装的需要引入多余的碱基序列。

实验扩增用引物序列如表2(从5’到3’方向)。

表2

所有引物合成由Invitrogen公司合成。MspJI购自NEB公司(R0661S)。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。寡核苷酸退火缓冲液20×SSC购买自生工生物(上海)有限公司，配方如下：1升溶液里175.3克氯化钠，88.2克柠檬酸钠，用盐酸调pH值到7.0。6×DNA上样缓冲液购自Fermentas公司(R0611)。1Kb Mark购自Fermentas公司。

A片段、B片段、C片段、E片段、F片段、G片段的制备和处理方法与实施例1中相同。

V1，V2片段处理的实验操作过程如图2中所示(但与示意图相比可能存在片段数的不同)。具体实验步骤如下：

以质粒pBluescriptIIKS(Stratagene，Inc)为模板，引物klf.A-T1和klfA-T6扩增V1片段，klf.A-T9和klf.A-T14扩增V2片段。V1片段扩增目的片段长度为2452碱基对，V2片段扩增目的片段长度为2452碱基对。

因为V1、V2载体引物合成的时候已经设计好了甲基化修饰的酶切位点，这样经过PCR扩增的基因片段就已经特异性地在待组装的片段的两个末端上有甲基化修饰的酶切位点。直接用MspJI酶切处理已加上修饰碱基的V1片段、V2片段。设定酶切体系为30μL，依次加入3μL NE Buffer 4、20μL的底物DNA约200ng到1000ng、1μL的BSA、1μL的10μM的酶切激活寡核苷酸、4μL到4.8μL的双蒸水、0.2μL到1μL的酶，37℃酶切3小时。

因为PCR片段内部没有甲基化修饰的酶切位点，这样修饰依赖性切割的内切酶MspJI就可以特异性地作用在双链DNA的近末端，把双链DNA的末端转变成为可用于连接反应的粘性末端。而且由于修饰依赖性切割的内切酶MspJI能够在识别位点^mCNNR(R＝G/A)中修饰的胞嘧啶3’一侧N₉/N₁₃处切割双链DNA。这样切割后的产物中不会残留识别位点序列，用于连接两段双链DNA分子的粘性末端碱基对可以预先选定为任意的碱基序列。

然后将已具有粘性末端的待连接DNA片段用T4DNA连接酶体外连接。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接2小时。将体外连接产物加入6×DNA上样缓冲液5μl后在65℃水浴中变性15分钟后用0.8％的琼脂糖胶块进行电泳分析。结果如图6和图7所示，得到了与设计相符的连接好的目的组装产物。

图6中V1+A+B+C表示经MspJI酶切处理后的V1片段、A片段、B片段、C片段为底物的体外连接反应；V1+A表示经MspJI酶切处理后的V1片段、A片段为底物的体外连接反应；V1表示经MspJI酶切处理后的V1片段的体外连接反应；1KbMark购自Fermentas公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接2小时。

图7中V2+E+F+G表示经MspJI酶切处理后的V2片段、E片段、F片段、G片段为底物的体外连接反应；V2+G表示经MspJI酶切处理后的V2片段、G片段为底物的体外连接反应；V2+E表示经MspJI酶切处理后的V2片段、E片段为底物的体外连接反应；V2表示经MspJI酶切处理后的V2片段为底物的体外连接反应；1KbMark购自Fermentas公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接2小时。

实施例3、用合成的含可切割甲基化识别位点的寡核苷酸接头将识别位点加入到待组装双链DNA末端

3.1、用合成的含可切割甲基化识别位点的寡核苷酸接头将识别位点加入到PCR扩增获得的待组装双链DNA末端

实验扩增用引物序列和寡核苷酸序列如表3(从5’到3’方向)。

表3

所有引物合成由Invitrogen公司合成，MspJI购自NEB公司(R0661S)。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。寡核苷酸退火缓冲液20×SSC购买自生工生物(上海)有限公司，配方如下：1升溶液里175.3克氯化钠，88.2克柠檬酸钠，用盐酸调pH值到7.0。6×DNA上样缓冲液购自Fermentas公司(R0611)。1Kb Mark购自Fermentas公司。XbaI购自Fermentas公司，10×Fastdigestion缓冲液随酶提供。MspJI酶(R0661S)和BbSI(R0539S)酶购自NewEngland Biolabs公司。

E片段上下游引物中，kky.ACT9粗体的碱基对TCCG是预设的切割和连接位点，kky.ACT10粗体的碱基对CGCC是预设的切割和连接位点。其中E片段按设计产生的TCCG的5’突出粘性末端可以与V3载体的上游引物端经BbSI切割后产生CGGA的5’突出粘性末端互补连接。

为了实现这个设计，在引物kky.ACT9和kky.ACT10的预设切割位点的上游5’端设计了一个XbaI酶切位点TCTAGA，以便在PCR扩增后通过酶切连接接头的方式加上甲基化修饰的酶切识别位点。kjz.ml1的第5位和第22位的胞嘧啶为甲基化修饰碱基，作为酶切激活寡核苷酸kjz.ml1可以退火形成具有内切酶MspJI的识别位点的发夹结构。klf.3ML2的第27位的胞嘧啶为甲基化修饰碱基，而且这个寡核苷酸序列5’端有磷酸化修饰，可以退火形成具有内切酶MspJI的识别位点的发夹结构，而且这个发夹结构一端是CTAG的5’突出粘性末端，这样klf.ML2这个寡核苷酸接头可以与XbaI酶切的双链DNA片段互补连接。

寡核苷酸接头和酶切激活寡核苷酸退火制备条件是：5μL的20×SSC，95μL浓度为100μM的寡核苷酸klf.ML2，共100μL体积在250μL的薄壁PCR管中，用PCR仪器65℃温育1小时后在室温25℃缓慢冷却。其中20×SSC购买自生工生物(上海)有限公司，配方如下：1升溶液里175.3克氯化钠，88.2克柠檬酸钠，用盐酸调pH值到7.0。

引物设计中，V3载体的上游引物端经BbSI切割后可以产生CGGA的5’突出粘性末端，V3载体具体过程如下：

以pBluescript II KS(stratagene，Inc)为模板，klf.A-T9和klf.A-T6为引物进行PCR扩增得到V3片段，V3片段扩增的目的片段长度为2452碱基对。用BbSI酶切并纯化目的PCR产物片段。因为V3载体上下游引物合成的时候已经设计了BbSI的酶切位点GAAGAC，而且pBluescript II KS内部没有多余的BbSI的酶切位点，经过BbSI酶切后V3载体上游引物端产生了CGGA的5’突出粘性末端。

E片段上游引物端产生TCCG的5’突出粘性末端的过程如图3A中所示(但与示意图相比可能存在片段数的不同)，具体步骤如下：

寡核苷酸接头加入到双链DNA末端的过程为：首先用E片段上下游引物PCR扩增得到片段E，电泳割胶回收纯化目的PCR片段。以纯化的目的PCR片段为底物，在50μL的1×Fastdigestion缓冲液中37℃XbaI酶切30分钟。加入已退火的寡核苷酸接头至终浓度1μM/L，ATP至终浓度0.5mM/L，T4DNA连接酶2μL在16℃连接4-8小时。琼脂糖电泳后割胶回收连接产物，通过这个方式在E片段末端加上了有甲基化修饰的酶切识别位点。

用MspJI酶切处理已加上修饰碱基的E片段。设定酶切体系为30μL，依次加入3μL NE Buffer 4、20μL的底物DNA约200ng到1000ng、1μL的BSA、1μL的10μM的酶切激活寡核苷酸、4μL的双蒸水、0.2μL到1μL的酶，37℃酶切3小时。这可以特异性地把E片段的末端转变成为设定的可用于连接反应的粘性末端，经MspJI酶切处理的E片段一端具有TCCG的5’突出粘性末端，可以与V3载体上游引物端产生了CGGA的5’突出粘性末端互补连接。用于连接片段的粘性末端碱基对为预先选定的碱基序列，这个实施例中就将双链DNA末端多余的XbaI位点序列完全去除了，最终的连接产物中不会留下酶切位点的疤痕。

然后将已具有粘性末端的待连接DNA片段用T4DNA连接酶体外连接。将体外连接产物进行琼脂糖电泳分析，得到了与设计相符的连接好的大的目的组装产物，结果如图8所示。其中琼脂糖电泳各个泳道中样品为：图中V3+E’表示经MspJI酶切处理后的E片段和与BbSI酶切处理后的V3片段为底物的体外连接反应；结果按照预先设计实现了无疤痕连接两端目的DNA片段。

图8中V3+E’表示经MspJI酶切处理后的E片段和与BbSI酶切处理后的V3片段为底物的体外连接反应；1Kb Mark购自Fermentas公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。MspJI酶(R0661S)和BbSI(R0539S)酶购自New EnglandBiolabs公司。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接2小时。

3.2、用合成的含可切割甲基化识别位点的寡核苷酸接头将识别位点加入到质粒酶切获得的待组装双链DNA末端

实验扩增用引物序列和寡核苷酸序列如表4(从5’到3’方向)。

表4

其中klv.ACTr1、klv.ACTr2、klv.ACTr3、klv.ACTr4、klv.ACTr5、klv.ACTr6、klv.ACTr7、klv.ACTr8引物序列中的用粗体表示的碱基序列是预设的酶切和连接位点。其中I片段下游引物端预设产生CATC的5’突出粘性末端，可以与II片段上游引物端预设产生的GATG的5’突出粘性末端互补连接；III片段下游引物端预设产生TGCT的5’突出粘性末端，可以与IV片段上游引物端预设产生的AGCA的5’突出粘性末端互补连接。

为了实现这个设计，在引物klv.ACTr1、klv.ACTr2、klv.ACTr3、klv.ACTr4、klv.ACTr5、klv.ACTr6、klv.ACTr7、klv.ACTr8的预设切割位点的上游5’端设计了一个XbaI酶切位点TCTAGA，以便在PCR扩增后通过酶切连接接头的方式加上甲基化修饰的酶切识别位点。kjz.ml1的第5位和第22位的胞嘧啶为甲基化修饰碱基，作为酶切激活寡核苷酸kjz.ml1可以退火形成具有内切酶MspJI的识别位点的发夹结构。klf.ML2的第27位的胞嘧啶为甲基化修饰碱基，而且这个寡核苷酸序列5’端有磷酸化修饰，可以退火形成具有内切酶MspJI的识别位点的发夹结构，而且这个发夹结构一端是CTAG的5’突出粘性末端，这样klf.ML2可以与XbaI酶切的双链DNA片段互补连接。

所有引物合成由Invitrogen公司合成。MspJI购自NEB公司(R0661S)。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。

以M145基因组DNA为模板，以表4中引物分别PCR扩增I片段、II片段、III片段、IV片段。这些基因片段来自天蓝色链霉菌中的放线紫红素基因簇(NC 003888.3GI：32141095)(5513441-5542115)其中：

I片段扩增目的片段长度7420碱基对(5513441-5520860)；

II片段扩增目的片段长度8171碱基对(5520857-5529027)；

III片段扩增目的片段长度6410碱基对(5529024-5535433)；

IV片段扩增目的片段长度6686碱基对(5535430-5542115)；

片段I、II、III、IV产生预设的5’突出粘性末端的过程如图3A中所示(但与示意图相比可能存在片段数的不同)。

具体步骤如下：

将片段I、II、III、IV通过XbaI克隆到pBluescriptIIKS(stratagene，Inc)的XbaI位点，先以大肠杆菌DH5α(takara D9027)为克隆宿主菌，然后将验证正确已克隆目的外源片段的质粒转化到大肠杆菌ET12567(ATCC号BAA-525)中去除质粒DNA的甲基化修饰。

寡核苷酸接头加入到双链DNA末端的过程为：以去除了甲基化修饰的质粒DNA为底物，在50μL的1×Fastdigestion缓冲液中37℃XbaI酶切30分钟。加入已退火的寡核苷酸接头至终浓度1μM/L，ATP至终浓度0.5mM/L，T4DNA连接酶2μL在16℃连接4-8小时。琼脂糖电泳后割胶回收相应大小的目的连接产物，通过这个方式在各个质粒酶切来源的DNA片段末端加上了有甲基化修饰的酶切识别位点。

用MspJI酶切处理已加上修饰碱基的片段I、II、III、IV。设定酶切体系为30μL，依次加入3μL NE Buffer 4、20μL的底物DNA约200ng到1000ng、1μL的BSA、1μL的10μM的酶切激活寡核苷酸、4μL的双蒸水、0.2μL到1μL的酶，37℃酶切3小时。这可以特异性地把I、II、III、IV片段的末端转变成为设定的可用于连接反应的粘性末端，经MspJI酶切处理的I片段下游引物端预设产生CATC的5’突出粘性末端，可以与II片段上游引物端预设产生的GATG的5’突出粘性末端互补连接；III片段下游引物端预设产生TGCT的5’突出粘性末端，可以与IV片段上游引物端预设产生的AGCA的5’突出粘性末端互补连接；这些互补序列决定了连接的次序和方向。更重要的是这些序列可以选择为待组装的DNA片段本来的序列，不会因为组装的需要引入多余的碱基序列。用于连接片段的粘性末端碱基对为预先选定的碱基序列，这个实施例中就将双链DNA末端多余的XbaI位点序列完全去除了，最终的连接产物中不会留下酶切位点的疤痕。

图9中I+II表示经MspJI酶切处理后的I片段、II片段为底物的体外连接反应；III+IV表示经MspJI酶切处理后的III片段、IV片段为底物的体外连接反应；1Kb Mark购自Fermentas公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接2小时。

实施例4、用与MspJI同一家族的类似酶酶切处理、组装序列

FspEI是一种修饰依赖性的核酸内切酶，能够识别位点C^mC并能在修饰的胞嘧啶3’一侧N₁₂/N₁₆处切割双链DNA。本实施例中使用的引物中选用C^mC作为识别位点作为例证，引物中用粗体表示的碱基是设计预定好的连接位点。

具体来看：FspEI切割修饰的E片段后，E片段上游引物端可以产生TCCG的5’突出粘性末端，E片段下游引物端可以产生CGCC的5’突出粘性末端；FspEI切割修饰的F片段后，F片段上游引物端可以产生GGCG的5’突出粘性末端，F片段下游引物端可以产生CGGT的5’突出粘性末端；FspEI切割修饰的G片段后，G片段上游引物端可以产生ACCG的5’突出粘性末端，G片段下游引物端可以产生GCGA的5’突出粘性末端；

这样，这些DNA双链片段经FspEI切割后产生的4碱基对的5’突出粘性末端确定了连接的次序和方向。具体来看：E片段下游引物端产生的CGCC的5’突出粘性末端可以与F片段上游引物端产生的GGCG的5’突出粘性末端互补连接；F片段下游引物端产生的CGGT的5’突出粘性末端可以与G片段上游引物端产生的ACCG的5’突出粘性末端互补连接。

实验扩增用引物序列和寡核苷酸序列如表5(从5’到3’方向)。

表5

其中kky.ACT9、kky.ACT10、kky.ACT11、kky.ACT12、kky.ACT13、kky.ACT14引物序列中的GGCAGCCGTCTCCCTGGAAG是设计作为加入甲基化修饰时用的通用退火互补序列，第13和第14的两个CC碱基序列是预设为修饰依赖性切割的内切酶FspEI的还未修饰的识别碱基序列，AAGTCTAGA是可以任意选取的12个碱基序列，这里设计了一个XbaI酶切位点TCTAGA以方便进行PCR产物的常规克隆。kjz.ml1的第5位和第22位的胞嘧啶为甲基化修饰碱基，作为酶切激活寡核苷酸kjz.ml1可以退火形成具有内切酶FspEI的识别位点的发夹结构。kjz.ml2的第14位的胞嘧啶为甲基化修饰碱基，kjz.ml2可以作为通用修饰引物，以PCR片段E、F、G为模板扩增形成末端甲基化修饰的双链DNA片段。所有引物合成由Invitrogen公司合成。FspEI购自NEB公司。T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。寡核苷酸退火缓冲液20×SSC购买自生工生物(上海)有限公司，配方如下：1升溶液里175.3克氯化钠，88.2克柠檬酸钠，用盐酸调pH值到7.0。6×DNA上样缓冲液购自Fermentas公司(R0611)。1Kb Mark购自Fermentas公司。

实验操作过程参照图1示意图。具体实验步骤如下：

首先以M145基因组DNA为模板，用表5中的引物分别PCR扩增E片段、F片段、G片段。这些基因片段来自天蓝色链霉菌中的放线紫红素基因簇(NC 003888.3GI：32141095)(5513563-5542271)，其中：

E片段扩增目的片段长度4285碱基对(5529589-5533873)；

F片段扩增目的片段长度4923碱基对(5533870-5538259)；

G片段扩增目的片段长度4016碱基对(5538256-5542271)。

用FspEI酶切处理已加上修饰碱基的E片段、F片段、G片段，FspEI酶切条件参见产品说明书和文献Zheng Y，Cohen-Karni D，Xu D，Chin HG，Wilson G，Pradhan S，Roberts RJ：A unique family of Mrr-like modification-dependent restrictionendonucleases.Nucleic Acids Research 2010，38(16)：5527-5534。酶切激活寡核苷酸退火制备条件是：5μL的20×SSC，95μL浓度为100μM的寡核苷酸kjz.ml1，共100μL体积在250μL的薄壁PCR管中，用PCR仪器65℃温育1小时后在室温25℃缓慢冷却。选定FspEI酶切体系为30μL，依次加入3μL NE缓冲液4、20μL的底物DNA约200ng到1000ng、1μL的BSA、1μL的稀释成10μM的酶切激活寡核苷酸、4-4.8μL的双蒸水、0.2-1μL的酶，37℃酶切3小时。因为PCR片段内部没有甲基化修饰的酶切位点，这样修饰依赖性切割的内切酶FspEI就可以特异性地作用在双链DNA的近末端，把双链DNA的末端转变成为可用于连接反应的粘性末端。而且由于修饰依赖性切割的内切酶FspEI能够在识别位点C^mC中修饰的胞嘧啶3’一侧N₁₂/N₁₆处切割双链DNA。这样切割后的产物中不会残留识别位点序列，用于连接两段双链DNA分子的粘性末端碱基对可以预先选定为任意的碱基序列。

然后将已具有粘性末端的待连接DNA片段用T4DNA连接酶体外连接。体外连接条件如下：T4DNA连接酶1μl；T4DNA连接酶缓冲液2μl；DNA底物12-15μl；加水至20μl，在16℃水浴中连接2小时。将体外连接产物加入6×DNA上样缓冲液5μl后在65℃水浴中变性15分钟后用0.8％琼脂糖胶块进行电泳分析。结果如图10，得到了与设计相符的连接好的目的组装产物。其中琼脂糖电泳各个泳道中样品为：图中F+G表示经FspEI酶切处理后的F片段、G片段为底物的体外连接反应；E+F表示经FspEI酶切处理后的E片段、F片段为底物的体外连接反应；G表示经FspEI酶切处理后的G片段的体外连接反应。

图10中，F+G表示经FspEI酶切处理后的F片段、G片段为底物的体外连接反应；E+F表示经FspEI酶切处理后的E片段、F片段为底物的体外连接反应；G表示经FspEI酶切处理后的G片段的体外连接反应；T4DNA连接酶购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。所有引物合成由Invitrogen公司合成。体外连接条件如下：T4DNA连接酶：1μl；T4DNA连接酶缓冲液：2μl；DNA底物12-15μl；加水至20μl，在22℃水浴中连接2小时。

经过理论及实验论证，利用其它与MspJI同一家族的类似酶LpnPI，AspBHI，RlaI，或SgrTI也能够藉由与前述类似的设计及操作方法实现产生预定粘性末端序列的功能，准确地实现较长序列的拼接。

实施例5、用合成的带可切割识别位点的寡核苷酸接头将识别位点加入到双链DNA的末端

HgaI(New England Biolabs)在识别位点GACGC的3’一侧N₅/N₁₀处切割双链DNA，未甲基化修饰的识别位点可以被限制性内切酶HgaI切割，甲基化修饰后的识别位点不能被限制性内切酶HgaI切割。根据这个特性可以将待组装双链DNA内部的识别位点用合适的甲基化酶进行甲基化修饰保护，然后利用合成的带可切割识别位点的寡核苷酸接头将识别位点加入到双链DNA的末端，这样就使得限制性内切酶特异性地作用在双链DNA的末端，切割后形成预设的粘性末端。

实验扩增用引物序列和寡核苷酸序列如表6(从5’到3’方向)。

表6

以含BamHI片段上游引物和含BamHI片段下游引物、以质粒supercos (Stratagene公司)为模板扩增产生899碱基对的片段，经BamHI酶切后可以产生GATC的5’突出粘性末端，这个粘性末端可以与退火后的寡核苷酸接头ML6连接，寡核苷酸接头ML6设计有一个HgaI识别位点GACGC。以含XbaI片段上游引物和含XbaI片段下游引物、以质粒supercos(Stratagene公司)为模板扩增产生1113碱基对的片段，经XbaI酶切后可以产生CTAG的5’突出粘性末端，这个粘性末端可以与退火后的寡核苷酸接头ML7连接，寡核苷酸接头ML7设计有一个HgaI识别位点GACGC。

其中lag.Hbbl 1、lag.Hbbl2、lag.Hbbl3、lag.Hbbl4引物序列中的用粗体表示的碱基序列是预设的酶切和连接位点。其中BamHI片段上游引物端预设产生ACCAA的5’突出粘性末端，可以与XbaI片段下游引物端预设产生的TTGGT的5’突出粘性末端互补连接。

寡核苷酸接头退火制备条件是：5μL的20×SSC，95μL浓度为100μM的寡核苷酸ML6或者ML7，共100μL体积在250μL的薄壁PCR管中，用PCR仪器65℃温育1小时后在室温25℃缓慢冷却。其中20×SSC购买自生工生物(上海)有限公司，配方如下：1升溶液里175.3克氯化钠，88.2克柠檬酸钠，用盐酸调pH值到7.0。

所有引物合成由Invitrogen公司合成。HgaI购自NEB公司(R0661S)。T4DNAligase购自Fermentas公司(EL0015)。PCR扩增用聚合酶购自Toyobo公司(KOD-401)。

以质粒supercos(Stratagene公司)为模板分别PCR扩增含BamHI片段和含XbaI片段。用BamHI酶切扩增出的含BamHI片段，用XbaI酶切扩增出含XbaI片段。

之后的流程如图3B的示意图(但与示意图相比可能存在片段数的不同)。首先，用CpG甲基转移酶M.SssI(NEB M0226V)甲基化修饰酶切后的含BamHI片段和含XbaI片段，这样双链DNA内部的HgaI识别位点就被甲基化修饰保护起来了。甲基化修饰条件参见M.SssI(NEB M0226V)使用说明书。

然后，将寡核苷酸接头ML6加入到处理后的含BamHI片段末端。寡核苷酸接头加入到双链DNA末端的过程为：以lag.Hbbl1和lag.Hbbl2的PCR扩增纯化后的片段为底物，在50μL的1×Fastdigestion缓冲液中37℃、BamHI酶切30分钟。加入已退火的寡核苷酸接头ML6至终浓度1μM/L，ATP至终浓度0.5mM/L，T4DNA连接酶2μL，在16℃连接4-8小时。琼脂糖电泳后割胶回收连接产物，通过这个方式在BamHI片段末端加上了可以被HgaI切割的识别位点。

然后，将寡核苷酸接头ML7加入到处理后的XbaI片段末端。寡核苷酸接头加入到双链DNA末端的过程为：以lag.Hbbl2和lag.Hbbl3的PCR扩增纯化后的片段为底物，在50μL的1×Fastdigestion缓冲液中37℃、XbaI酶切30分钟。加入已退火的寡核苷酸接头ML6至终浓度1μM/L，ATP至终浓度0.5mM/L，T4DNA连接酶2μL，在16℃连接4-8小时。琼脂糖电泳后割胶回收连接产物，通过这个方式在XbaI片段末端加上了可以被HgaI切割的识别位点。

用HgaI酶切处理末端已加上可切割的识别位点的含BamHI片段和含XbaI片段。这可以特异性地把含BamHI片段和含XbaI片段的末端转变成为设定的可用于连接反应的粘性末端，经HgaI酶切处理的含BamHI片段上游引物端产生预设的ACCAA的5’突出粘性末端，可以与含XbaI片段下游引物端预设产生的TTGGT的5’突出粘性末端互补连接；这些互补序列决定了连接的次序和方向。更重要的是这些序列可以选择为待组装的DNA片段本来的序列，不会因为组装的需要引入多余的碱基序列。用于连接片段的粘性末端碱基对为预先选定的碱基序列，这个实施例中就将双链DNA末端多余的BamHI位点和XbaI位点序列完全去除了，最终的连接产物中不会留下酶切位点的疤痕。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。