CN113355390A

CN113355390A - 可区分dna和rna来源的共建库方法

Info

Publication number: CN113355390A
Application number: CN202110626541.5A
Authority: CN
Inventors: 江翱; 陈晶晶; 刘娜; 秦雪梅; 罗秉轮; 卢瑶; 王嫚; 曹振; 宋东亮
Original assignee: Yisheng Biotechnology Shanghai Co ltd
Current assignee: Yisheng Biotechnology Shanghai Co ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2021-09-07

Abstract

本发明提供一种可区分DNA和RNA来源的共建库方法，其特征在于：在建库过程中，先将DNA和RNA片段化，在RNA末端加上polyA，在逆转录过程中，在转录的cDNA另一末端加上Poly(dC)，并在cDNA两端分别添加p5和p7接头，然后在DNA两端添加p5和p7接头，DNA和cDNA进行文库扩增及测序。本发明中，RNA来源的cDNA片段的两端会带有一段固定的核苷酸序列，用以区分测序数据的来源，因此不需要对样本中的DNA和RNA进行单独建库和测序，可有效降低NGS检测的成本。

Description

可区分DNA和RNA来源的共建库方法

技术领域

本发明专利涉及一种可区分DNA和RNA来源的共建库方法，属于生物技术领域。

背景技术

高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generation"sequencing technology，NGS)，是一种大规模并行测序技术，能够同时对几十万到几百万条DNA分子进行序列测定，具有通量大、偏好性小、信息齐全等特点。因此，NGS检测成为疾病诊断和科学研究的重要工具。在疾病诊断过程中，NGS检测主要分为DNA检测和RNA检测两大方面。DNA NGS检测主要用于分析单核苷酸变异(Single nucleotidevariants，SNVs)、插入或缺失突变(Insertions and Deletions InDels)、基因拷贝数变异(Copy number variants，CNVs)、肿瘤突变阈值(Tumor mutational burden score，TMB)、微卫星不稳定位点(Microsatellite instability loci，MSI)和DNA甲基化(DNAmethylation)等。RNA NGS检测主要用于分析基因融合(Gene fusions)、基因表达水平(Gene expression level)、RNA加工(RNA processing)和RNA修饰(RNA modification)等。综合利用DNA和RNA NGS检测，为临床疾病的诊断提供了重要的依据。

文库构建是指将DNA或RNA样本转化成适合于测序平台的DNA模板的过程，是影响NGS检测成功率的关键步骤。随着近年来NGS检测的发展和普及，各类文库构建的方法不断地优化和更新，极大地降低了文库构建的难度和成本。但是，对于要同时做DNA和RNA建库的病理学样本，分开建库不仅会增大建库失败的可能性，也提高了建库和测序的成本。因此，一种可用于DNA和RNA共建库的技术，对于病理学诊断，具有重要的意义。

目前已有的DNA和RNA共建库方法主要原理都是把RNA反转录成DNA，再共同进行DNA建库。这种方法无法区分测序的结果是来源于DNA还是来源于RNA，因此具有很大的应用局限性。尤其是针对肿瘤检测领域而言，逆转录酶的低保真性会额外引入基因突变，为肿瘤进程的鉴定带来了很多假阳性的干扰，目前的DNA和RNA共建库测序技术无法应用在肿瘤诊断上。因为目前的DNA和RNA共建库方法无法区分测序信息的具体来源，因此在未知病原鉴定领域上只能通过生物信息学的遗传进化分析和进一步实验验证来确定未知病原是DNA病原还是RNA病原，这增大了未知病原检测的难度。因此，一种可区分DNA和RNA来源的共建库方法，对于疾病诊断领域是迫切需要的。

发明内容

本发明的目的是提供一种可区分DNA和RNA来源的共建库方法，在RNA来源的cDNA片段的两端各带上一段固定的核苷酸序列，用以区分测序数据的来源。

一种可区分DNA和RNA来源的共建库方法，其特征在于：在建库过程中，先将DNA和RNA片段化，在RNA末端加上polyA，在逆转录过程中，在转录的cDNA另一末端加上Poly(dC)，并在cDNA两端分别添加p5和p7接头，然后在DNA两端添加p5和p7接头，DNA和cDNA进行文库扩增及测序。

根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：其步骤包括：

(1)提取样本中的DNA和RNA，将DNA和RNA片段化；

(2)对片段化的DNA和RNA末端进行修复，保证DNA和RNA的5’端是磷酸基团，3’端是羟基基团，同时将RNA多聚腺苷酸化，在RNA一端加上polyA；

(3)使用M-MLV逆转录酶进行RNA逆转录和模板转换，反应体系中加入逆转录引物和接纳模板DNA oligo，其中逆转录引物为Poly(dT)VN引物，在逆转录引物的5’端带有P5序列，所述接纳模板DNA oligo的3’端带有2个以上的G，5’端带有P7序列；

(4)在DNA片段两端加上p5和p7接头；

(5)文库扩增和测序。

优选的，步骤(3)中Poly(dT)VN引物的序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT～TVN，其中Poly(dT)的数量为20～23。优选的，步骤(3)中接纳模板DNA oligo的序列为：TTTTTT/C12Spacer/GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGGGrGrGrG。

优选的，步骤(3)中还加入阻碍rRNA进行逆转录的探针，该探针可参考CN202110257924.X记载的方法进行设计。

优选的，步骤(1)中片段化的方法是先加入核酸酶处理，再加入金属离子高温处理。

优选的，步骤(2)中末端修复使用的是T4 PNK激酶，RNA多聚腺苷酸化使用的是Ecoli poly(A)polymerase。

优选的，步骤(4)中为平末端连接，连接反应分为两轮进行，第一轮为P7接头连接，第二轮为P5接头连接，连接在磁珠上进行。

优选的，第一轮P7接头连接采用T4 DNA连接酶突变体K159L，使用的接头为5’端预腺苷酰化的双链DNA接头。

优选的，第二轮P5接头连接使用的连接酶为Taq DNA连接酶、T4 DNA连接酶和Ecoli DNA连接酶中的一种或多种组合物，使用的接头为含P5序列的单链DNA接头。

本发明的建库方法命名为：DDRC-seq(Differentiable DNA/RNA Co-sequencing)，仅需4个小时即可完成，具有以下几大优点：

1.RNA来源的cDNA片段的两端会带有一段固定的核苷酸序列，用以区分测序数据的来源。不需要对样本中的DNA和RNA进行单独建库和测序，降低了NGS检测的成本。

2.DDRC-seq在RNA文库构建过程中结合之前发明的逆转录阻碍探针法(202110257924.X)能够有效地去除rRNA，从而显著提高了DDRC-seq测序数据中RNA来源数据的利用率。

3.DDRC-seq在RNA逆转录过程使用模板转换(template switch)的方法，提高了文库构建的效率，并有效降低了RNA文库的自连。

4.在DNA文库构建上，使用了T4 DNA连接酶突变体K159L和预腺苷酰化的DNA接头，这不仅提高了DNA接头与DNA底物的连接效率，而且显著降低了DNA底物的自连率。这些能够有效改善测序数据的质量，降低假阳性的基因融合和基因突变事件，提高NGS检测的准确性和效率。

因此，DDRC-seq是一种高效准确且低成本的DNA和RNA共建库测序方法，适用于各类病理学样本和科学研究样本的NGS检测，尤其是珍贵的肿瘤病理样本。

附图说明

图1 DDRC-seq操作流程。

图2 DDRC-seq建库原理示意图。

图3 DDRC-seq用于DNA建库示意图。

图4 DDRC-seq用于不同投入量小牛gDNA建库文库大小分布。

图5 DDRC-seq用于不同投入量小牛gDNA建库文库产量。

图6 DDRC-seq用于不同投入量小牛gDNA建库测序数据在小牛基因组上的比对率。

图7 DDRC-seq用于不同投入量小牛gDNA建库测序数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比。

图8 DDRC-seq用于不同投入量小牛gDNA建库测序数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据在小牛基因组上的比对率。

图9 DDRC-seq用于RNA建库示意图。

图10 DDRC-seq用于不同投入量人类RNA建库文库大小分布。

图11 DDRC-seq用于不同投入量人类RNA建库文库产量。

图12 DDRC-seq用于不同投入量人类RNA建库测序数据在人类转录组上的比对率。

图13 DDRC-seq用于不同投入量人类RNA建库测序数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比。

图14 DDRC-seq用于不同投入量人类RNA建库测序数据中比对到人类转录组上的数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比。

图15 DDRC-seq用于不同投入量人类RNA建库测序数据中不能比对到人类转录组上的数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比。

图16 DDRC-seq用于不同投入量人类RNA建库测序数据中核糖体RNA来源数据的占比。

图17 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库文库大小分布。

图18 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库文库产量。

图19 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中DNA结构数据和RNA结构(G_7-11NN…NNA_18-25)数据的占比。

图20 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库DNA结构数据的比对率。

图21 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)数据的比对率。

图22 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)数据的核糖体RNA数据占比。

图23 DDRC-seq对细胞DNA&RNA共建库文库大小分布。

图24 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据占比。

图25 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA来源数据点突变分析。

图26 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA来源数据Indel突变分析。

图27 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据基因检出数分析。

图28 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据基因表达差异分析。

图29 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据RNA可变剪接分析。

图30 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据点突变共分析。

图31 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据Indel突变共分析。

图32 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据基因融合共分析。

图33三种来源数据检测UV照射后基因点突变性能比较。

图34三种来源数据检测UV照射后基因插入缺失突变性能比较。

图35三种来源数据检测UV照射后基因融合性能比较。

具体实施方式

下面结合附图对本发明的具体实施方式做进一步说明。

本实施例所使用的探针和引物序列及修饰如表1所示，N为随机碱基，即A、T、C、G中任意一种碱基。

表1探针及引物序列

实施例1：DDRC-seq流程的建立

在本实施例中，我们组建了DDRC-seq的流程，流程示意图见图1和图2。具体方式如下：

1)DNA和RNA片段化：

表2

组分	用量
		DNA &RNA	100ng
片段化缓冲液	4μL
		DSN(Evrogen)	2μL
Total	17μL

片段化缓冲液:200mM Tris-HCl，300mM KCl，20mM MgCl₂，pH 8.3。

37℃反应20min，85℃反应15min，4℃保存。

2)RNA末端修复、多聚腺苷酸化

表3

组分	用量
		上述反应体系	17μL
T4 PNK(Yeasen，12902)	1μL
		E.coli Poly(A)Polymerase(NEB,M0276S)	2μL
Total	20μL

37℃反应30min。

3)rRNA去除、逆转录和模板转换

表4

组分	用量
		上述反应体系	20μL
逆转录反应缓冲液	25μL
		10μM Poly(dT)VN引物	1μL
4μM 5.8S/18S/28S rRNA probe mix(202110257924.X)	1μL
		Total	50μL

逆转录反应缓冲液：50mM Tris-HCl，100mM KCl，pH 8.3。

80℃1min，55℃2min，保存于4℃。

表4

组分	用量
		上述反应体系	50μL
100mM DTT/30mM MgCl<sub>2</sub>	3μL
		SUPERaseIn RNase抑制剂(ThermoFisher，AM2694)	2μL
接纳模板DNA oligo(30μM)	1μL
		SuperScript II逆转录酶(ThermoFisher，18064071)	4μL
Total	60μL

42℃15min，50℃15min，70℃15min，保存于4℃。

反应结束后，加入150μL Agencourt AMPure XP beads(Beckman，A63881)混匀后，室温静置孵育10min。将PCR管置于磁力架上，待溶液澄清后，吸去上清，加入200μL新鲜配制的80％乙醇静置30s，吸干净乙醇，室温静置3min。

4)DNA接头连接及回收

使用xGen Prism DNA Library Prep Kit(IDT，10006202)进行DNA接头连接，流程如下：

表5

组分	用量
		上述反应体系磁珠
Ligation 1 buffer	25μL
		Ligation 1 Adaptor	2μL
Ligation 1 Enzyme	3μL
		Total	30μL

吹打重悬磁珠后，20℃15min，65℃15min，保存于4℃。

表6

组分	用量
		上述反应体系	30μL
Ligation 2 buffer	4.5μL
		Ligation 2 Adaptor	4μL
Ligation 2 Enzyme A	0.5μL
		Ligation 2 Enzyme B	1μL
Total	40μL

65℃30min，保存于4℃。

加入100μL PEG/NaCl，吹打混匀。室温静置10min后，将PCR管置于磁力架上，待溶液澄清后，吸去上清，加入200μL新鲜配制的80％乙醇静置30s，吸干净乙醇，室温静置3min。加入21μL EB buffer悬浮磁珠，室温静置5min。将将PCR管置于磁力架上，待溶液澄清后，吸取20μL上清。

5)文库扩增

使用xGen Prism DNA Library Prep Kit(IDT，10006202)进行文库扩增，流程如下：

表7

组分	用量
		上述回收DNA	20μL
xGen UDI Primer Pairs	5μL
		HiFi HotStart ReadyMix	25μL
Total	50μL

吹打重悬磁珠后，按照下述程序进行文库扩增：

表8

65℃30min，保存于4℃。

反应结束后，加入150μL Agencourt AMPure XP beads(Beckman，A63881)混匀后，室温静置孵育10min。将PCR管置于磁力架上，待溶液澄清后，吸去上清。加入200μL新鲜配制的80％乙醇静置30s，吸去上清。加入200μL新鲜配制的80％乙醇静置30s，吸干净乙醇，室温静置3min。加入21μL ddH2O悬浮磁珠，室温静置5min。将将PCR管置于磁力架上，待溶液澄清后，吸取20μL上清。Qubit测量回收文库浓度，Qsep测量回收文库片段大小。文库在NovaSeq6000平台进行测序。获得的测序结果使用cutadaptor去掉接头后，先按照图2文库示意图分DNA来源的文库和RNA来源的文库(数据结构为G_7-11NN…NNA_18-25)，然后将DNA数据比对到基因组上，RNA数据比对到转录组上。

实施例2：DDRC-seq对不同DNA投入量的建库效果

在本实施例中，我们验证了DDRC-seq在小牛胸腺0.1ng-100ng gDNA投入量条件下的建库效果，实验流程见实施例1，流程示意图见图3，PCR循环数和文库产量见表9，文库大小分布见图4，测序结果分析见图5-7。

表9

结果如表9和图4-5所示，DDRC-seq对0.01-100ng小牛gDNA投入量均具有很好的建库产量和文库大小。如图6和图7，在DNA测序数据中，100ng DNA投入量的文库测序数据的小牛基因组比对率达到99.64％，其中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比只有0.007％；0.01ng DNA投入量的文库测序数据的比对率达到95.79％，其中具有DDRC-seq共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比只有4.371％。测序结果中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据在小牛基因组上的比对率低于5％(如图8)，说明这些测序数据不是来源于投入的小牛gDNA模板，可能是来自于实验过程中的其他RNA污染。这些结果说明DDRC-seq中来自DNA的数据可以与共建库RNA结构(G_7-11NN…NNA_18-25)有效的区分开来。

实施例3：DDRC-seq对不同RNA投入量的建库效果

在本实施例中，我们验证了DDRC-seq在HEK293F 0.1ng-1000ng RNA投入量条件下的建库效果，实验流程同实施例1，示意图见图9，PCR循环数和文库产量见表10，文库大小分布见图10，测序结果分析见图11-16。

表10

结果如表10和图10-11所示，DDRC-seq对0.1-1000ng人类RNA投入量均具有很好的建库产量和文库大小。如图11-图15，在DNA测序数据中，1000ng RNA投入量的文库测序数据的人类转录组比对率达到99.34％，其中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比达到99.32％，比对到人类转录组上的数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比达到99.96％，不能比对到人类转录组上的数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比仅有1.43％；0.1ng RNA投入量的文库测序数据的人类转录组比对率达到93.09％，其中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比达到92.23％，比对到人类转录组上的数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比达到98.87％，不能比对到人类转录组上的数据中具有共建库RNA结构(G_7-11NN…NNA_18-25)的数据占比仅有1.35％。其他具有(G_7-11NN…NNA_18-25)结构的数据可能来源于外来RNA污染，具有(G_7-11NN…NNA_18-25)结构的数据可能来源于外来DNA污染。这些结果说明经DDRC-seq流程的RNA建库方法，来源于RNA的数据中具有(G_7-11NN…NNA_18-25)结构的数据可达到99.96％以上。因此，DDRC-seq方法可以根据(G_7-11NN…NNA_18-25)结构来有效区分测序数据中RNA来源的数据。

此外，DDRC-seq可以有效去除RNA建库过程中的核糖体RNA(如图16)，从而显著提高RNA数据的利用率。

实施例4：DDRC-seq对不同DNA和RNA混合物投入量的建库效果

在本实施例中，我们验证了DDRC-seq对0.1ng-1000ng投入量DNA和RNA混合物的建库效果，实验流程见实施例1，流程示意图见图2。

DNA&RNA混合物的制备：取5μg小牛胸腺gDNA，加入50μg人类RNA，混匀后备用。按照实施例1进行DNA和RNA共建库，PCR循环数和文库产量见表11，文库大小分布见图17，测序结果分析见图17-图22。

表11

DNA和RNA投入量/ng	循环数	文库产量/ng
			1000	5	476
100	9	524
			10	12	431
1	16	545
			0.1	20	413

结果如表11和图17-18所示，DDRC-seq对0.1-1000ng小牛gDNA&人类RNA投入量均具有很好的建库产量和文库大小。如图19-21，DDRC-seq可以有效检查DNA&RNA混合物中的DNA和RNA来源数据，且DNA和RNA来源的数据均具有极高的来源特异性。当DNA&RNA投入量为1000ng时，DNA来源结构的数据比对到小牛基因组上的数据占达99.52％，比对到人类转录组上的数据仅有0.06％；RNA来源结构的数据比对到人类转录组上的数据占达99.12％，比对到小牛基因组上的数据仅有0.13％。当DNA&RNA投入量为0.1ng时，DNA来源结构的数据比对到小牛基因组上的数据占达94.26％，比对到人类转录组上的数据仅有0.05％；RNA来源结构的数据比对到人类转录组上的数据占达94.09％，比对到小牛基因组上的数据仅有0.16％。这说明DDRC-seq能够准确有效的区分DNA&RNA共建库中来源于DNA和RNA的测序数据，实现DNA和RNA的共分析。

此外，DDRC-seq可以有效去除DNA&RNA共建库过程中的核糖体RNA(如图22)，从而显著提高RNA数据的利用率。

实施例5：DDRC-seq验证UV照射对细胞DNA和RNA的影响

在本实施例中，我们验证了DDRC-seq对UV照射对细胞DNA和RNA的影响。具体实施方式如下：

UV处理：HEK293F细胞培养到70％细胞密度时，在50J/m2条件下处理细胞，处理后的细胞继续避光培养2天后，收集备用。

DNA&RNA共提取：利用天根生物的DNA/RNA共提取试剂盒(DP422)对HEK293F细胞进行DNA和RNA共提取。

DDRC-seq：提取好的细胞DNA和RNA按照实施例1流程进行DNA和RNA共建库。

结果如图23和图24所示，DDRC-seq能够对细胞中提取的DNA&RNA能够进行有效的共建库，其中RNA的数据占比约在20-25％左右。我们利用DDRC-seq中DNA来源的数据分析了UV照射对基因突变的影响(图25和图26)，利用DDRC-seq中RNA来源的数据分析了UV照射对基因检出数、基因表达差异、RNA可变剪接分析(图27-图29)。同时，我们利用RNA来源的数据验证了DNA来源数据中检测到的SNV、Indel突变和基因融合事件，提高了SNV、Indel突变和基因融合事件检测的准确性(图30-图35)。

Claims

1.一种可区分DNA和RNA来源的共建库方法，其特征在于：在建库过程中，先将DNA和RNA片段化，在RNA末端加上polyA，在逆转录过程中，在转录的cDNA另一末端加上Poly(dC)，并在cDNA两端分别添加p5和p7接头，然后在DNA两端添加p5和p7接头，对DNA和cDNA进行文库扩增及测序。

2.根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：其步骤包括：

(1)提取样本中的DNA和RNA，将DNA和RNA片段化；

(2)对片段化的DNA和RNA末端进行修复，同时将RNA多聚腺苷酸化，在RNA一端加上polyA；

(4)在DNA片段两端加上p5和p7接头；

(5)文库扩增和测序。

3.根据权利要求2所述的可区分DNA和RNA来源的共建库方法，其特征在于：步骤(3)中Poly(dT)VN引物的序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT～TVN，其中Poly(dT)的数量为20～23。

4.根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：步骤(3)中接纳模板DNA oligo的序列为：TTTTTT/C12 Spacer/GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGGGrGrGrG。

5.根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：步骤(3)中还加入阻碍rRNA进行逆转录的探针。

6.根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：步骤(1)中对DNA和RNA片段化，使得处理后的DNA和RNA的长度在200-500bp。。

7.根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：步骤(2)中末端修复使用的是T4 PNK激酶，RNA多聚腺苷酸化使用的是Ecoli poly(A)polymerase。

8.根据权利要求1所述的可区分DNA和RNA来源的共建库方法，其特征在于：步骤(4)中为平末端连接，连接反应分为两轮进行，第一轮为P7接头连接，第二轮为P5接头连接，连接在磁珠上进行。

9.根据权利要求8所述的可区分DNA和RNA来源的共建库方法，其特征在于：第一轮P7接头连接采用T4 DNA连接酶突变体K159L，使用的接头为5’端预腺苷酰化的双链DNA接头。

10.根据权利要求9所述的可区分DNA和RNA来源的共建库方法，其特征在于：第二轮P5接头连接使用的连接酶为Taq DNA连接酶、T4 DNA连接酶和Ecoli DNA连接酶中的一种或多种组合物，使用的接头为含P5序列的单链DNA接头。