CN116376867A

CN116376867A - 改造型DNA聚合酶φ及其应用

Info

Publication number: CN116376867A
Application number: CN202211063781.XA
Authority: CN
Inventors: 衡杰; 倪晓丹; 郭涵博; 赵会敏; 毛俊; 张丰盈; 刘玉洁; 郭春龙
Original assignee: Shuimu Future Beijing Technology Co ltd; Shuimu Future Hangzhou Technology Co ltd
Current assignee: Shuimu Future Beijing Technology Co ltd; Shuimu Future Hangzhou Technology Co ltd
Priority date: 2022-08-31
Filing date: 2022-08-31
Publication date: 2023-07-04

Abstract

本发明公开了一种改造型DNA聚合酶

及其应用。具体地，本发明提供了一种改造型DNA聚合酶

所述改造型DNA聚合酶

包含以下序列中的一种或多种：如SEQ ID NO:2所示的氨基酸序列；与SEQ ID NO:2所示的氨基酸序列具有至少80％同一性的氨基酸序列，并且其保留如SEQ ID NO:2所示的氨基酸序列的DNA结合活性和蛋白结构等。本发明提供的改造型DNA聚合酶

可以用于DNA聚合酶

结构解析、DNA聚合酶φ活性分析、核酸编码小分子库筛选、计算机辅助的药物设计和药物筛选中的用途。

Description

改造型DNA聚合酶φ及其应用

技术领域

本发明属于生物技术领域，更具体地，本发明涉及一种改造型DNA聚合酶

及其应用。

背景技术

维持基因组的稳定性是对于细胞的正常生长至关重要的。尽管细胞有着一套精密的DNA复制以及修复系统来维持其稳定性，但仍不可避免地会产生各种各样的DNA损伤，例如DNA双链断裂(DSBs,Double-strand breaks)。引起DSBs的因素也多种多样，如各种辐射、化学药剂等，DSBs产生的有害后果，包括基因组重排和细胞死亡等。双链DNA断裂作为真核细胞中常见的事件，其主要具有三种主要的修复途径：同源重组(homologousrecombination,HR)，非同源DNA末端连接(nonhomologous DNA end joining,NHEJ)以及DNA聚合酶

介导的末端连接(DNA polymerase theta mediated end-joining,TMEJ)^1,2。NHEJ是发生在复制之外的主要DSB修复途径。在没有NHEJ的情况下，断裂的末端被核酸酶切除，然后暴露的单链DNA尾部被HR或TMEJ修复。TMEJ是主要DSB修复途径(HR和NHEJ)的一个重要替代途径，近年来在越来越多的癌症模型研究中备受关注³。研究表明，DNA聚合酶/>

介导的TMEJ活性对于BRCA突变的癌细胞的存活至关重要⁴。DNA聚合酶/>

在多个不同的肿瘤中呈现上调现象，并且它的过表达与肿瘤预后不佳相关^5–7。研究表明，在HR缺陷的背景下敲除DNA聚合酶/>

被证明会损害细胞的活力，可能的机制是DNA聚合酶/>

和HR因子之间的合成致死关系⁸。由于DNA聚合酶/>

在TMEJ中的活性，HR缺陷的癌细胞存活依赖于DNA聚合酶/>

(或简称为PolQ)。癌细胞的持续增殖导致慢性复制压力，并且当出错的复制叉没有得到解决时，DSBs的负荷增加。虽然这种DSBs在健康细胞中会被HR修复，但HR缺陷的癌细胞却要依靠TMEJ来修复它们⁹。因此，作用于TMEJ通路的LIG3和LIG1的抑制剂，在人类乳腺癌细胞系中与PARP抑制剂协同作用。由于这些原因，目前多个生物技术公司和实验室正在开发靶向DNA聚合酶/>

的抑制剂，这也为个性化的肿瘤治疗提供了新的思路。

全长的DNA聚合酶

是一个由2590个氨基酸组成的多结构域蛋白。它的N端具有一个保守的SF2超家族解旋酶样结构域(简称为解旋酶结构域)，C端具有一个A家族DNA聚合酶结构域，两个结构域由一个无二级结构的中间区域分开¹⁰。根据AlphaFold结构预测，DNA聚合酶/>

蛋白中间的无序区约有近900个氨基酸，这为表达、纯化和制备DNA聚合酶/>

蛋白并用于药物筛选研究设置了障碍。研究表明，DNA聚合酶/>

的N端和C端两个结构域都是潜在的药物靶点，分别针对两个结构域开发小分子或大分子抑制剂具有重要的临床价值¹⁰。结构和功能分析表明，DNA聚合酶/>

的N端的解旋酶结构域在DSB修复过程中挥了核心作用¹¹。

2017年，诺贝尔化学奖授予三位在冷冻电镜技术开发过程中作出卓越贡献的科学家¹²，这标志着以冷冻电镜为主导的结构生物学领域进入一个新时代¹³。基于靶点结构的药物设计是对传统新药研发方案的革新^14,15。在AI赋能创新药研发的时代，如何利用蛋白质的序列信息进行结构解析工作，并基于计算机辅助的药物设计(computer-aided drugdesign，CADD)或基于分子结构的药物设计(structure-based drug design，SBDD)思路，进行活性小分子药物的设计和筛选，亟需创新性的新思维和新方案。同时，DNA编码的小分子化合物库(DNA Encoded Library，DEL)筛选的小分子药苗头化合物的技术名声鹊起。越来越多的大药企开始投资建立自己的DEL技术平台，例如葛兰素史克成功运用DEL技术找到两个可成药的分子并快速推进至临床。

如何获得适用于冷冻电镜结构研究以及DNA编码的小分子化合物库筛选的DNA聚合酶

的N端的解旋酶结构域蛋白，对于创新药物开发具有重要的价值。相关的蛋白研究工作，也会加速开发特异性靶向DNA聚合酶/>

解旋酶结构域蛋白的先导化合物，并进行基于结构的药物优化和改造。

发明内容

发明要解决的问题

基于上述现有技术中存在的问题，本发明目的在于对DNA聚合酶

的序列进行截断和改造，以获得较高表达量和纯度的蛋白，用于药物筛选研究。

用于解决问题的方案

本发明的第一方面提供了一种改造型DNA聚合酶

所述改造型DNA聚合酶/>

包含以下序列中的一种或多种：

(i)如SEQ ID NO:2所示的氨基酸序列；

(ii)与SEQ ID NO:2所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:2所示的氨基酸序列的DNA结合活性和蛋白结构；

(iii)在SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:2所示的氨基酸序列的DNA结合活性和蛋白结构；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留以SEQ IDNO:2所示的氨基酸序列的DNA结合活性和蛋白结构，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

在一些具体的实施方案中，所述改造型DNA聚合酶

还包含标签、蛋白酶切割位点、肽接头或其任意组合。

在一些更具体的实施方案中，所述改造型DNA聚合酶

在其N端和/或C端包含标签。

在一些优选的实施方案中，所述改造型DNA聚合酶

在其N端和C端包含不同的标签。

在一些更优选的实施方案中，所述的改造型DNA聚合酶

包含以下序列中的一种或多种：

(i)如SEQ ID NO:3所示的氨基酸序列；

(ii)与SEQ ID NO:3所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:3所示的氨基酸序列的DNA结合活性和蛋白结构；

(iii)在SEQ ID NO:3所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:3所示的氨基酸序列的DNA结合活性和蛋白结构；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:3所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留以SEQ IDNO:3所示的氨基酸序列的DNA结合活性和蛋白结构，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

本发明的第二方面提供了一种多核苷酸，其编码如本发明第一方面所述的改造型DNA聚合酶

在一些具体的实施方案中，所述多核苷酸的序列如SEQ ID NO:4所示。

本发明的第三方面提供了一种表达载体，其包含如本发明第二方面所述的多核苷酸。

本发明的第四方面提供了一种宿主细胞，其包含如本发明第三方面所述的表达载体。

本发明的第五方面提供了如本发明第一方面所述的改造型DNA聚合酶

如本发明第二方面所述的多核苷酸、如本发明第三方面所述的表达载体或如本发明第四方面所述的宿主细胞在用于DNA聚合酶/>

结构解析、DNA聚合酶/>

活性分析、核酸编码小分子库筛选、计算机辅助的药物设计和药物筛选中的用途；所述用途为非疾病治疗或诊断方法。

发明的效果

本发明提供的改造型DNA聚合酶

适用于冷冻电镜结构研究以及DNA编码的小分子化合物库筛选，对于创新药物开发具有重要的价值。也可用于开发特异性靶向DNA聚合酶/>

的解旋酶结构域蛋白的先导化合物，并进行基于结构的药物优化和改造。

附图说明

图1为改造型DNA聚合酶

的改造小试。

图2为双标签纯化改造型DNA聚合酶

图3为改造型DNA聚合酶

蛋白的活性测试。

图4为负染评估改造型DNA聚合酶

蛋白的聚集状态。

图5为改造型DNA聚合酶

蛋白的单颗粒二维分类。

图6为改造型DNA聚合酶

蛋白的三维分类及模型搭建。

图7为改造型DNA聚合酶

蛋白与野生型蛋白的结构对比；其中图7中的A为改造型DNA聚合酶/>

的结构示意图；图7中的B为野生型DNA聚合酶/>

的结构示意图；图7中的C为二者的结构对比示意图。

具体实施方式

为了更容易理解本发明，以下具体定义了某些技术和科学术语。除非在本文中另有明确定义，本文使用的所有其它技术和科学术语都具有本发明所属领域的一般技术人员通常理解的含义。

本说明书中，使用“数值A～数值B”表示的数值范围是指包含端点数值A、B的范围。

本说明书中，使用“基本上”或“实质上”表示与理论模型或理论数据的标准偏差在5％、优选为3％、更优选为1％范围以内。

本说明书中，使用“可以”表示的含义包括了进行某种处理以及不进行某种处理两方面的含义。

本说明书中，“任选的”或“任选地”是指接下来描述的事件或情况可发生或可不发生，并且该描述包括该事件发生的情况和该事件不发生的情况。

本说明书中，所提及的“一些具体/优选的实施方案”、“另一些具体/优选的实施方案”、“实施方案”等是指所描述的与该实施方案有关的特定要素(例如，特征、结构、性质和/或特性)包括在此处所述的至少一种实施方案中，并且可存在于其它实施方案中或者可不存在于其它实施方案中。另外，应理解，所述要素可以任何合适的方式组合在各种实施方案中。

根据本发明，术语“多肽”、“蛋白质”、“肽”在本文中可互换的使用，指任何长度的氨基酸的聚合形态，可包括编码的和非编码的氨基酸，化学或生物化学修饰的或衍生的氨基酸，和具有相似的肽骨架的多肽。

根据本发明，术语“核酸分子”、“多核苷酸”、“多聚核酸”、“核酸”可互换的使用，指任何长度的核苷酸的聚合形态，不论是脱氧核糖核苷酸或核糖核苷酸，或其类似物。多核苷酸可具有任何三维结构，可实施任何已知或未知的功能。多核苷酸的非限制例子包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、控制区、任何序列的分离的RNA、核酸探针和引物。核酸分子可以是线性或环状的。

根据本发明，所用氨基酸三字母代码和单字母代码如J.biol.chem，243，p3558(1968)中所述。

根据本发明，术语“宿主细胞”是指已向其中引入了表达载体的细胞。宿主细胞可包括细菌、微生物、植物或动物细胞。易于转化的细菌包括肠杆菌科(enterobacteriaceae)的成员，例如大肠杆菌(Escherichia coli)或沙门氏菌(Salmonella)的菌株；芽孢杆菌科(Bacillaceae)例如枯草芽孢杆菌(Bacillus subtilis)；肺炎球菌(Pneumococcus)；链球菌(Streptococcus)和流感嗜血菌(Haemophilus influenzae)。适当的微生物包括酿酒酵母(Saccharomyces cerevisiae)和毕赤酵母(Pichia pastoris)。适当的动物宿主细胞系包括CHO(中国仓鼠卵巢细胞系)和NS0细胞。

根据本发明，氨基酸“添加”指在氨基酸序列的C端或N端添加氨基酸。根据本发明，氨基酸“缺失”指可以从氨基酸序列中删除1、2或3个以上氨基酸。根据本发明，氨基酸“插入”指在氨基酸序列中的适当位置插入氨基酸残基，插入的氨基酸残基也可以全部或部分彼此相邻，或插入的氨基酸之间都不彼此相邻。

根据本发明，氨基酸“取代”指在氨基酸序列中的某个位置的某个氨基酸残基被其他氨基酸残基替代；其中，“取代”可以是保守氨基酸取代。

根据本发明，“保守修饰”、“保守取代”或“保守置换”是指具有类似特征(例如电荷、侧链大小、疏水性/亲水性、主链构象和刚性等)的其它氨基酸置换蛋白中的氨基酸，使得可频繁进行改变而不改变蛋白的生物学活性。本领域技术人员知晓，一般而言，多肽的非必需区域中的单个氨基酸置换基本上不改变生物学活性(参见例如Watson等(1987)Molecular Biology of the Gene，The Benjamin/Cummings Pub.Co.，第224页，(第4版))。另外，结构或功能类似的氨基酸的置换不大可能破坏生物学活性。示例性保守取代于以下“示例性氨基酸保守取代”中陈述。

示例性氨基酸保守取代

原始残基	保守取代
		Ala(A)	Gly；Ser
Arg(R)	Lys；His
		Asn(N)	Gln；His；Asp
Asp(D)	Glu；Asn
		Cys(C)	Ser；Ala；Val
Gln(Q)	Asn；Glu
		Glu(E)	Asp；Gln
Gly(G)	Ala
		His(H)	Asn；Gln
Ile(I)	Leu；Val
		Leu(L)	Ile；Val
Lys(K)	Arg；His
		Met(M)	Leu；Ile；Tyr
Phe(F)	Tyr；Met；Leu
		Pro(P)	Ala
Ser(S)	Thr
		Thr(T)	Ser
Trp(W)	Tyr；Phe
		Tyr(Y)	Trp；Phe
Val(V)	Ile；Leu

根据本发明，“中等至非常高等严格条件”包括“中等严格条件”，“中-高严格条件”，“高严格条件”或“非常高严格条件”，其描述了核酸杂交和洗涤的条件。进行杂交反应的指导参见Current Protocols in Molecular Biology，John Wiley&Sons，N.Y.(1989)，6.3.1-6.3.6，其通过引用并入本文。在该文献中描述了含水的和非含水的方法，且可以使用任一种。例如，具体的杂交条件如下：(1)低严格性杂交条件在6×氯化钠/柠檬酸钠(SSC)中，在约45℃，然后在至少50℃，在0.2×SSC，0.1％SDS中洗涤2次(对于低严格性条件，可以将洗涤温度升高到55℃)；(2)中等严格性杂交条件在6×SSC，在约45℃，然后在60℃，在0.2×SSC，0.1％SDS中洗涤1次或多次；(3)高严格性杂交条件在6×SSC，在约45℃，然后在65℃，在0.2×SSC，0.1％SDS中洗涤1次或多次且优选；(4)非常高的严格性杂交条件是0.5M磷酸钠，7％SDS，在65℃，然后在65℃，在0.2×SSC，1％SDS中洗涤1次或多次。

根据本发明，“同源性”或“同一性”是指两个多核苷酸序列之间或两个多肽之间的序列相似性。当两个比较序列中的位置均被相同碱基或氨基酸单体亚基占据时，例如如果两个DNA分子的每一个位置都被腺嘌呤占据时，那么所述分子在该位置是同源的。两个序列之间的同源性百分率是两个序列共有的匹配或同源位置数除以比较的位置数×100的函数。例如，在序列最佳比对时，如果两个序列中的10个位置有6个匹配或同源，那么两个序列为60％同源；如果两个序列中的100个位置有95个匹配或同源，那么两个序列为95％同源。通常，当比对两个序列时进行比较以给出最大百分比同源性。例如，可以通过BLAST算法执行比较，其中选择算法的参数以在各个参考序列的整个长度上给出各个序列之间的最大匹配。以下参考文献涉及经常用于序列分析的BLAST算法：BLAST算法(BLAST ALGORITHMS):Altschul，S.F.等人，(1990)J.Mol.Biol.215:403-410；Gish，W.等人，(1993)NatureGenet.3:266-272；Madden，T.L.等人，(1996)Meth.Enzymol.266:131-141；Altschul，S.F.等人，(1997)Nucleic Acids Res.25:3389-3402；Zhang，J.等人，(1997)Genome Res.7:649-656。其他如NCBI BLAST提供的常规BLAST算法也为本领域技术人员所熟知。

根据本发明，术语“密码子优化”是指编码多肽的核苷酸序列已被配置为包含宿主细胞或生物体优选的密码子，以改善宿主细胞或生物体中的基因表达并提高翻译效率。

根据本发明，术语“标签”是指这样的短肽，其与目的蛋白(例如本发明的改造型DNA聚合酶

)融合或连接，并由此促进重组蛋白的可溶性表达、检测和/或纯化。标签可融合或连接至目的蛋白的N端和/或C端(任选地通过接头或蛋白酶切割位点)。此类标签是本领域技术人员熟知的，并且已在现有技术文献中进行了详细描述。例如，此类标签包括但不限于，组氨酸标签(Sockolosky,J.T.and F.C.Szoka(2013).Protein Expr Purif 87(2):129-135)、谷胱甘肽转移酶(GST)标签(Hayashi,K.and C.Kojima(2008).ProteinExprPurif62(1):120-127)、麦芽糖结合蛋白(MBP)标签(Bataille,L.,W.Dieryck,A.Hocquellet,C.Cabanne,K.Bathany,S.Lecommandoux,B.Garbay and E.Garanger，Protein Expression and Purification Volume 110,June 2015,Pages165-171)、硫氧还蛋白(Trx)标签(Tomala,M.,A.Lavrentieva,P.Moretti,U.Rinas,C.Kasper,F.Stahl,A.Schambach,E.Warlich,U.Martin,T.Cantz and T.Scheper,2010，Protein ExprPurif73(1):51-57)、NusA标签(Li,K.,T.Jiang,B.Yu,L.Wang,C.Gao,C.Ma,P.Xu and Y.Ma(2013).Sci Rep3:2347)、二硫键异构酶DsbA标签(Zhang,Y.,D.R.Olsen,K.B.Nguyen,P.S.Olson,E.T.Rhodes and D.Mascarenhas(1998).Protein Expr Purif 12(2):159-165)、DsbC标签(Kurokawa,Y.,H.Yanagi and T.Yura(2001).J Biol Chem 276(17):14393-14399)、SUMO标签(Marblestone,J.G.,S.C.Edavettal,Y.Lim,P.Lim,X.Zuo and T.R.Butt(2006).Protein Sci 15(1):182-189)、msyB标签(Zou,Z.,L.Cao,P.Zhou,Y.Su,Y.Sun andW.Li(2008).J Biotechnol 135(4):333-339)、TF标签、引发因子标签(Kim,E.K.,J.C.Moon,J.M.Lee,M.S.Jeong,C.Oh,S.M.Ahn,Y.J.Yoo and H.H.Jang(2012).Protein ExprPurif86(1):53-57)、泛素标签(Sabin,E.A.,Lee-Ng,Chun Ting,Shuster,Jeffrey R.,Barr,Philip J.(1989).Nature Biotechnology7(7):705-709)、Myc标签、Flag标签、荧光蛋白(例如GFP)标签(Pedelacq,J.D.,S.Cabantous,T.Tran,T.C.Terwilliger and G.S.Waldo(2006).Nat Biotechnol24(1):79-88)、Twin-strep标签、生物素标签、以及亲和素标签。

根据本发明，术语“蛋白酶切割位点”是指，能够被蛋白酶特异性识别并切割的位点。各种特异性蛋白酶及其识别位点是本领域技术人员所熟知的，并见于许多现有技术文献中。本领域技术人员可根据实际情况，在融合蛋白中使用合适的蛋白酶切割位点，并用相应的蛋白酶进行切割。蛋白酶切割位点的使用可以是有利的，例如，其可用于从融合蛋白中切除信号肽和/或标签，从而获得具有目的活性的成熟蛋白。

根据本发明，术语“肽接头”或“为人工连接序列”是指用于连接两个分子(例如蛋白)的短肽。通常，通过将编码该短肽的多核苷酸序列引入(例如，通过PCR扩增或连接酶)分别编码所要连接的两种目的蛋白的两个DNA片段之间，并进行蛋白质表达来获得融合蛋白，例如目的蛋白1-肽接头-目的蛋白2。或者，通过将编码该短肽的多核苷酸序列引入分别编码所要连接的目的蛋白以及蛋白酶切割位点和/或标签序列之间，例如目的蛋白-肽接头-蛋白酶切割位点-标签序列。

根据本发明，术语“载体”是指，可将多核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸所编码的蛋白获得表达时，载体称为表达载体。载体可以通过转化，转导或者转染导入宿主细胞，使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的，包括但不限于：质粒、噬菌体、柯斯质粒等等。

根据本发明，术语“细胞”、“细胞系”和“细胞培养物”可互换使用，并且所有这类名称都包括后代。因此，术语“转化体”和“转化细胞”包括原代受试细胞和由其衍生的培养物，而不考虑转移数目。还应当理解的是，由于故意或非有意的突变，所有后代在DNA含量方面不可能精确相同。包括具有与最初转化细胞中筛选的相同的功能或生物学活性的突变后代。在意指不同名称的情况下，其由上下文清楚可见。

以下结合附图，通过实施例进一步说明本发明，但不作为对本发明的限制。以下提供了本发明实施方案中所使用的具体材料及其来源。但是，应当理解的是，这些仅仅是示例性的，并不意图限制本发明，与如下试剂和仪器的类型、型号、品质、性质或功能相同或相似的材料均可以用于实施本发明。下述实施例中所使用的实验方法如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

实施例：改造型DNA聚合酶

的制备

1、序列优化

在本实施例中，所采用的预测蛋白结构软件为AlphaFold本地版(v2.1.0)。

针对野生型DNA聚合酶

的解旋酶结构域具有较长的无序区，在蛋白的表达过程中，容易被蛋白酶降解，并且存在的较长的无序区，不适合蛋白质结构解析。本实施例中，根据AlphaFold结构预测，对全长的DNA聚合酶/>

进行截断，保留解旋酶结构域。

野生型DNA聚合酶

的氨基酸序列(SEQ ID NO:1)：MNLLRRSGKRRRSESGSDSFSGSGGDSSASPQFLSGSVLSPPPGLGRCLKAAAAGECKPTVPDYERDKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLG QVLEGKNLVYSAPTSAGKTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRH FSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLASSLSN AVQIVGMSATLPNLELVASWLNAELYHTDFRPVPLLESVKVGNSIYDSSMKLVREFEPMLQVKGDEDHVVSLCYETI CDNHSVLLFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGLDSVLQKTVPW GVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGRAGRKGVDT VGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKE GKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEASDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGF VLENDLHILYLVTPMFEDWTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRF FTSLVLLDLISEVPLREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQFQKRLTFGIQRELCDL VRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFKSARKAVDEEEEAVEERRNMRTIWVTGRKGLTER EAAALIVEEARMILQQDLVEMGVQWNPCALLHSSTCSLTHSESEVKEHTFISQTKSSYKKLTSKNKSNTIFSDSYIKHSPNIVQDLNKSREHTSSFNCNFQNGNQEHQTCSIFRARKRASLDINKEKPGASQNEGKTSDKKVVQTFSQKTKKAPLNFNSEKMSRSFRSWKRRKHLKRSRDSSPLKDSGACRIHLQGQTLSNPSLCEDPFTLDEKKTEFRNSGPFAKNVSLSGKEKDNKTSFPLQIKQNCSWNITLTNDNFVEHIVTGSQSKNVTCQATSVVSEKGRGVAVEAEKINEVLIQNGSKNQNVYMKHHDIHPINQYLRKQSHEQTSTITKQKNIIERQMPCEAVSSYINRDSNVTINCERIKLNTEENKPSHFQALGDDISRTVIPSEVLPSAGAFSKSEGQHENFLNISRLQEKTGTYTTNKTKNNHVSDLGLVLCDFEDSFYLDTQSEKIIQQMATENAKLGAKDTNLAAGIMQKSLVQQNSMNSFQKECHIPFPAEQHPLGATKIDHLDLKTVGTMKQSSDSHGVDILTPESPIFHSPILLEENGLFLKKNEVSVTDSQLNSFLQGYQTQETVKPVILLIPQKRTPTGVEGECLPVPETSLNMSDSLLFDSFSDDYLVKEQLPDMQMKEPLPSEVTSNHFSDSLCLQEDLIKKSNVNENQDTHQQLTCSNDESIIFSEMDSVQMVEALDNVDIFPVQEKNHTVVSPRALELSDPVLDEHHQGDQDGGDQDERAEKSKLTGTRQNHSFIWSGASFDLSPGLQRILDKVSSPLENEKLKSMTINFSSLNRKNTELNEEQEVISNLETKQVQGISFSSNNEVKSKIEMLENNANHDETSSLLPRKESNIVDDNGLIPPTPIPTSASKLTFPGILETPVNPWKTNNVLQPGESYLFGSPSDIKNHDLSPGSRNGFKDNSPISDTSFSLQLSQDGLQLTPASSSSESLSIIDVASDQNLFQTFIKEWRCKKRFSISLACEKIRSLTSSKTATIGSRFKQASSPQEIPIRDDGFPIKGCDDTLVVGLAVCWGGRDAYYFSLQKEQKHSEISASLVPPSLDPSLTLKDRMWYLQSCLRKESDKECSVVIYDFIQSYKILLLSCGISLEQSYEDPKVACWLLDPDSQEPTLHSIVTSFLPHELPLLEGMETSQGIQSLGLNAGSEHSGRYRASVESILIFNSMNQLNSLLQKENLQDVFRKVEMPSQYCLALLELNGIGFSTAECESQKHIMQAKLDAIETQAYQLAGHSFSFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGSTRRGIDNGRKLRLGRQFSTSKDVLNKLKALHPLPGLILEWRRITNAITKVVFPLQREKCLNPFLGMERIYPVSQSHTATGRITFTEPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPMGRGKYKKGFSVNPRCQAQMEERAADRGMPFSISMRHAFVPFPGGSILAADYSQLELRILAHLSHDRRLIQVLNTGADVFRSIAAEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGEQMGIKENDAACYIDSFKSRYTGINQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYRKAHAERQAINTIVQGSAADIVKIATVNIQKQLETFHSTFKSHGHREGMLQSDQTGLSRKRKLQGMFCPIRGGFFILQLHDELLYEVAEEDVVQVAQIVKNEMESAVKLSVKLKVKVKIGASWGELKDFDV

备注：上述野生型DNA聚合酶

氨基酸序列中，单下划线为改造型DNA聚合酶/>

中保留的氨基酸序列，其具体序列如下(SEQ ID NO:2)：

DKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTSAGKTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPSRHFSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKICYITRKSASCQADLASSLSNAVQIVGMSATLPNLELVASWLNAELYHTDFRPVPLLESVKVGNSIYDSSMKLVREFEPMLQVKGDEDHVVSLCYETICDNHSVLLFCPSKKWCEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEVMDQLRRLPSGLDSVLQKTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGGRPLDILTYKQMVGRAGRKGVDTVGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEEVTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQESVQLGAIEACVMWLLENEFIQSTEASDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGFVLENDLHILYLVTPMFEDWTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVARTERQHRQMAIHKRFFTSLVLLDLISEVPLREINQKYGCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQFQKRLTFGIQRELCDLVRVSLLNAQRARVLYASGFHTVADLARANIVEVEVILKNAVPFKSARKAVDEEEEAVEERRNMRTIWVTGRKGLTEREAAALIVEEARMILQQDLVEMGVQWNPCALLHSSTCSLTHSESEVKEHTFISQTKSSYKKLTSKNKS

改造后的DNA聚合酶

解旋酶结构域(SEQ ID NO:3)：

备注：上述改造型DNA聚合酶

氨基酸序列中，斜体为8×His组氨酸标签，单下划线为人工连接序列(即，肽接头)，双下划线为人类鼻病毒3C蛋白酶切割位点，虚线下划线为Twin-strep标签序列。

2、基因合成及质粒构建

将序列优化后的上述改造型DNA聚合酶

基因，送由北京祥鸿生物科技有限公司进行基因合成，携带NotI和XbaI酶切位点，连接重组至pFastBac-1质粒(购自赛默飞世尔科技公司)。

序列优化后的改造型DNA聚合酶

的核苷酸序列为(SEQ ID NO:4)：

ATGCACCACCACCATCATCACCACCACGACAAACTCCTCCTTGCAAATTGGGGCCTCCCTAAAGCCGTGCTTGAGAAGTACCATTCGTTCGGTGTAAAGAAAATGTTCGAGTGGCAGGCGGAATGCCTGTTGCTCGGTCAGGTCCTCGAAGGTAAAAATCTTGTCTATAGCGCTCCGACATCTGCGGGTAAAACCCTTGTGGCAGAGTTGTTGATTCTCAAGCGTGTCCTGGAAATGCGCAAGAAAGCTCTCTTCATTCTTCCCTTCGTCAGTGTGGCTAAGGAGAAGAAGTACTACTTGCAGAGCCTCTTTCAGGAAGTGGGCATAAAAGTTGATGGCTATATGGGAAGTACGTCGCCATCGAGACACTTTAGTTCACTGGACATCGCGGTGTGTACCATAGAGAGAGCTAACGGTCTGATTAACCGCCTCATTGAGGAGAATAAAATGGACCTCCTCGGAATGGTCGTAGTTGACGAATTGCACATGCTTGGAGATTCACATCGCGGATATTTGCTCGAACTGTTGCTCACCAAGATTTGCTATATCACTCGCAAATCTGCCTCTTGCCAAGCAGATCTTGCAAGCAGTCTCTCAAATGCCGTACAGATCGTAGGAATGTCAGCAACGCTGCCAAACTTGGAGCTGGTGGCTTCTTGGTTGAACGCTGAGCTTTATCATACAGACTTTAGGCCGGTTCCACTGCTGGAGTCGGTCAAAGTAGGAAATTCTATCTACGACAGCAGCATGAAGTTGGTAAGAGAGTTCGAACCTATGCTGCAGGTCAAGGGAGACGAGGACCATGTTGTCAGTCTGTGTTATGAGACGATTTGTGACAATCATTCTGTCCTTTTGTTCTGTCCGTCTAAAAAGTGGTGTGAGAAGTTGGCCGATATTATAGCTCGTGAATTTTATAACCTGCACCACCAGGCAGAAGGATTGGTGAAACCGTCAGAGTGTCCCCCCGTTATTCTTGAACAGAAGGAATTGTTGGAAGTCATGGACCAACTTCGCCGTTTGCCTAGTGGCCTGGACTCAGTCCTTCAGAAGACAGTTCCGTGGGGCGTAGCATTCCACCACGCAGGACTCACGTTTGAAGAACGCGACATAATCGAAGGCGCCTTTAGACAAGGTCTCATTCGCGTTCTTGCCGCTACGAGTACACTGTCAAGTGGAGTGAACCTGCCTGCAAGAAGAGTCATAATAAGAACACCTATATTCGGCGGAAGACCGCTCGATATATTGACCTACAAACAAATGGTCGGACGCGCAGGACGCAAGGGCGTCGACACCGTCGGAGAATCTATTCTTATTTGCAAGAATTCCGAAAAGAGTAAGGGTATTGCCCTTCTGCAAGGATCGCTGAAGCCCGTAAGAAGTTGTTTGCAGAGAAGAGAAGGCGAAGAGGTGACCGGATCTATGATACGTGCTATCCTTGAGATTATAGTGGGCGGTGTCGCATCGACGTCTCAGGATATGCATACTTACGCGGCTTGTACCTTTCTGGCCGCTAGTATGAAGGAGGGTAAACAGGGTATACAGCGCAATCAGGAATCTGTGCAATTGGGAGCGATAGAGGCGTGTGTGATGTGGCTTCTCGAAAATGAGTTTATACAATCAACCGAAGCGTCCGACGGTACGGAAGGTAAAGTATATCATCCCACTCACCTCGGCAGCGCAACACTCTCGTCATCACTGTCGCCTGCCGACACTTTGGACATATTCGCCGATCTTCAAAGGGCCATGAAAGGCTTTGTCCTCGAAAATGATCTTCACATTCTTTACTTGGTTACCCCCATGTTCGAAGACTGGACTACTATTGATTGGTATCGTTTTTTTTGCCTCTGGGAAAAGCTTCCCACGTCGATGAAACGCGTGGCGGAGTTGGTCGGAGTTGAGGAGGGATTCCTCGCGCGTTGCGTTAAGGGCAAAGTTGTGGCCCGTACAGAGCGTCAGCACCGTCAGATGGCCATCCACAAGCGCTTCTTCACGAGCTTGGTGCTCCTTGATTTGATTTCCGAAGTTCCCCTCAGGGAGATCAATCAAAAATATGGTTGCAACCGCGGACAGATCCAGTCACTTCAACAAAGCGCAGCCGTGTACGCTGGCATGATTACAGTCTTTTCAAATAGGCTCGGTTGGCATAATATGGAATTGCTTCTGTCGCAGTTCCAAAAAAGGCTGACATTCGGTATTCAGCGTGAGTTGTGCGATCTGGTTAGGGTAAGTCTGTTGAATGCGCAGCGCGCCCGTGTTCTGTATGCGAGCGGCTTCCACACGGTTGCCGATTTGGCACGTGCGAATATAGTAGAGGTAGAGGTGATACTGAAGAACGCAGTACCATTTAAAAGCGCGAGAAAAGCGGTCGACGAAGAGGAGGAGGCGGTTGAAGAGCGCCGCAATATGAGAACAATTTGGGTGACCGGCAGAAAGGGTCTCACAGAGCGTGAAGCAGCAGCTTTGATAGTTGAAGAAGCACGCATGATCCTCCAGCAAGACCTGGTAGAGATGGGTGTACAATGGAATCCCTGTGCTTTGCTGCATTCCAGTACCTGCTCACTCACGCATTCAGAATCAGAAGTGAAGGAACACACTTTCATCTCCCAAACAAAGTCATCGTATAAAAAGTTGACCAGTAAGAATAAGAGTGGCAGCGGTAGCGGATCTGGATCGGGTTCTGAAGTTCTGTTTCAGGGTCCGGGCTCGGCCTGGTCTCACCCCCAATTTGAAAAGGGCGGTGGCAGCGGAGGCGGTGGTTCTGGAGGCAGTGCGTGGAGCCACCCGCAGTTCGAGAAAtaa

3、重组杆状病毒的制备

3.1通过热激转化，将含有目的基因的重组pFastBac-1质粒导入到大肠杆菌DH10Bac感受态细胞(博迈德生物)中，在含有50μg/mL卡那霉素(BioBomei)、7μg/mL庆大霉素(BioBomei)、10μg/mL四环霉素(BioBomei)、200μg/mL X-gal(inalco)、40μg/mL IPTG(inalco)的LB固体培养基中，于37℃培养48小时。挑选均匀的白斑至3mL含有三种抗生素(50μg/mL卡那霉素、7μg/mL庆大霉素、10μg/mL四环霉素)的LB液体培养基中，37℃，200rpm条件下培养过夜，待菌液OD600约为0.6时，抽提重组杆状病毒质粒。

3.2取1mL昆虫细胞培养基(Insect Medium,Graces)加入15μL转染试剂(FuGENE)、5μg重组杆状病毒质粒室温下孵育15分钟，用此混合物溶液重悬10-12×10⁶sf9昆虫细胞(购自Expression System公司，该昆虫细胞由细胞培养液在室温，500rpm的条件下离心10分钟获得)，于27℃，200rpm的条件下培养4个小时，之后加入5mL ESF921昆虫细胞培养基(Expression Systems)，于27℃，200rpm的条件下继续培养48小时。将培养了48小时的sf9细胞转移100mL锥形瓶中，27℃，110rpm条件下培养至细胞密度达2-4×10⁶/mL时，室温下2500rpm离心10分钟上清即为P1代重组杆状病毒。

3.3取P1代重组杆状病毒按照1:10000的比例转染100mL细胞密度为1.5×10⁶/mLsf9昆虫细胞，27℃，110rpm的条件下进行培养，待细胞密度达6×10⁶/mL左右，细胞体积膨大且较为均匀时，室温下，2500rpm离心10分钟，上清液用0.22μm针头滤器过滤后即为P2代重组杆状病毒。

4、蛋白纯化小试

取P2代重组杆状病毒，按照1:50、1:100、1:150和1:200四个不同比例转染20mL密度为4×10⁶/mL sf9昆虫细胞，27℃，110rpm条件下培养细胞48小时。培养结束后，取样进行Western blot检测以确定目的蛋白的表达情况。实验结果如图1所示，不同病毒比例蛋白表达量呈现明显的差异，其中1:50的转染比例目标蛋白的表达量最高。另外，Western blot结果显示，改造型DNA聚合酶

在40kD左右存在降解条带。因此，为了获得全长的改造型DNA聚合酶/>

串联使用N端和C端的标签以进行双步骤纯化。

5、蛋白大量表达与纯化

取P2代重组杆状病毒按照1:50的比例转染1L密度为4×10⁶/mL sf9昆虫细胞，27℃，110rpm条件下培养细胞48小时。

细胞培养结束后，4℃，4000rpm离心20分钟，收集细胞。用Buffer A重悬细胞沉淀，于冰上用匀浆器对细胞悬液进行匀浆，以破碎细胞。匀浆完成后，于4℃，18000rpm的条件下离心1小时，离心后将上清液加载到镍亲和层析填料(Ni柱料)孵育1小时。之后用Buffer B洗脱杂蛋白，用Buffer C洗脱目的蛋白。将含有目的蛋白的洗脱液加载到Strep亲和层析柱(Strep柱料)上，用Buffer D洗脱杂蛋白，Buffer E洗脱目的蛋白，之后用50KDa的超滤管对目的蛋白进行浓缩，浓缩至体积为800μL左右，浓度为1.01mg/mL。最后，使用SDS-PAGE凝胶电泳检测目的蛋白的含量与纯度。

其中，上述缓冲液(Buffer)A-E具体成分如下：

Buffer A：50mM HEPES pH 7.5,150mM NaCl,10mM咪唑(imidazole),0.5mM TCEP，10μM亮肽素(leupeptin)；

Buffer B：50mM HEPES pH 7.5,150mM NaCl,30mM咪唑(imidazole),0.5mM TCEP，10μM亮肽素(leupeptin)，即图2中的30mM咪唑Buffer；

Buffer C：50mM HEPES pH 7.5,150mM NaCl,250mM咪唑(imidazole),0.5mMTCEP，10μM亮肽素(leupeptin)，即图2中的250mM咪唑Buffer；

Buffer D：50mM HEPES pH 7.5,150mM NaCl,0.5mM TCEP，10μM亮肽素(leupeptin)；

Buffer E：50mM HEPES pH 7.5,150mM NaCl,0.5mM TCEP，10μM亮肽素(leupeptin),50mM生物素(biotin)。

实验结果：如图2所示，串联使用Ni柱料及Strep柱料(即，改造型DNA聚合酶

的N端和C端使用两种标签进行纯化)能够获得较纯的改造型DNA聚合酶/>

其中，图2中：

“沉淀”是指：匀浆破碎后的细胞裂解液经离心得到的沉淀；

“上清”是指：匀浆破碎后的细胞裂解液经离心得到的上清；

“镍流穿”是指：与镍亲和层析填料孵育后得到的流穿液；

“30ml咪唑Buffer洗杂”是指：用Buffer B洗脱杂蛋白所得样品；

“250mM咪唑Buffer洗脱”是指：用Buffer C洗脱目的蛋白所得样品；

“Strep流穿”是指：与Strep亲和层析填料孵育后得到的流穿液；

“Strep洗杂”是指：用Buffer D洗脱杂蛋白所得样品；

“Strep洗脱”是指：用Buffer E洗脱目标蛋白所得样品。

测试例

测试例1、改造型DNA聚合酶

蛋白的活性测试

为验证改造型DNA聚合酶

蛋白对于不同序列的DNA的结合活性，本测试例中合成两种序列存在差异的ssDNA序列：ssDNA-PN1(CTCTCTCTCTCTCTCTCTCTCTCTCTCTCT；SEQ IDNO:5)和ssDNA-PN2(CCAGTGAATTGTTGCTCGGTACCTGCTAAC；SEQ ID NO:6)。

首先，配制检测缓冲液Buffer F并用其配置400nM的实施例中制备的改造型DNA聚合酶

蛋白储液，随后按2.5×梯度稀释蛋白(5个不同浓度梯度)。为减小实验误差，直接在384OptiPlate板进行反应体系混合及孵育。向板中加入2.5μL稀释蛋白，1000rpm离心10s，同时用Buffer F配置底物，包含200μM ATP(反应浓度100μM)和1200nM ssDNA-PN1或ssDNA-PN2(反应浓度600nM)。向384OptiPlate每孔中加入2.5μL底物，1000rpm离心10s，封板，震荡20s，1000rpm离心10s，23℃孵育120min。随后，向384OptiPlate每孔中加入5μL ADP-Glo(购自Promega公司)，1000rpm离心10s，封板，震荡20s，1000rpm离心10s，23℃孵育40min。孵育后，向384OptiPlate每孔中加入10μL检测试剂(Detection reagent，购自Promega公司)，1000rpm离心10s，封板，震荡20s，1000rpm离心10s，23℃孵育60min。最后，在Ensight酶标仪上检测冷光(Luminescence)信号，并使用GraphPad Prism 7分析和处理数据。

Buffer F：40mM Tris-HCl pH 7.5,20mM MgCl2,0.01％Triton X-100,0.01％牛血清白蛋白(Bovine albumin,BSA),1mM二硫苏糖醇(Dithiothreitol,DTT)。

实验结果如图3显示，荧光信号(图3中的纵坐标，相对光单位(relative lightunit,RLU)随着蛋白浓度(图3中的横坐标，PolQ-N表示改造型DNA聚合酶

)的提高而提高，确认改造型DNA聚合酶/>

蛋白具有DNA结合活性。另外，针对不同序列的DNA蛋白的荧光信号有明显的强度差异，其中采用ssDNA-PN1的实验窗口比ssDNA-PN2稍高些，说明改造型DNA聚合酶/>

蛋白对不同的ssDNA序列结合活性具有一定的差异，但均具有结合活性。

测试例2、改造型DNA聚合酶

蛋白用于负染评估及结构解析工作

为了进一步的利用改造型DNA聚合酶

蛋白进行小分子药物筛选和小分子药物的靶向性活性口袋分析，本测试例利用改造型DNA聚合酶/>

蛋白进行无配体结合状态下的靶点蛋白结构解析工作。本测试例将实施例中制备、纯化后的改造型DNA聚合酶/>

进行负染评估和单颗粒冷冻结构研究。

1、负染制备步骤：

将样品稀释到合适浓度；做负染所用的超薄碳膜做亲水化处理后辉光放电；把稀释好的样品滴在载网上静置1min，滤纸吸掉样品，超纯水洗样三次后乙酸铀染液染色三次，最后一次染液静置45s，滤纸吸去多余染液，自然干涸并形成梯度；将制备好的载网放入负染样品储存盒中，并标记其放置位置；使用120kV Talos L120C TEM扫描/透射电子显微镜(购自赛默飞世尔科技公司)观察制备好的样品。

负染研究表明：如图4所示，改造型DNA聚合酶

蛋白整体具有较好的均一性，略微有聚集现象，不影响结构研究。

2、冷冻制样步骤：

由于制备获得的改造型DNA聚合酶

蛋白具有较好的均一度，进行冷冻制样，将改造型蛋白用于单颗粒结构研究。制样过程如下：

打开Vitrobot冷冻电镜样品制备系统(购自赛默飞世尔科技公司)，将温度和湿度分别设置为8℃和100％；将样品稀释到冻样所需浓度；

在泡沫杯内充满液氮，中间的铜环内充满液态乙烷；对金载网(Au quantifoilR1.2/1.3，购自德国Quantifoil公司)和GraFuture^TM-GO载网(来自水木未来(北京)科技有限公司，http://shuimubio.uunn.cn/technology/1)和做亲水化处理后辉光发电；设置Vitrobot冷冻电镜样品制备系统(购自赛默飞世尔科技公司)冻样条件，制备冷冻样品，上样量为4μL；制备好的载网在300kv Krios G4冷冻电子显微镜(购自赛默飞世尔科技公司)上用Falcon 4相机观察并采集数据。

3、改造型DNA聚合酶

的结构解析步骤：

制备好的金载网和GraFuture^TM-GO载网在300kv Krios G4冷冻电子显微镜(购自赛默飞世尔科技公司)上用Falcon 4相机采集数据，使用漂移矫正软件(MotionCor2)将原始TIFF格式数据(653张金载网显微照片(micrographs)，4853张GraFuture^TM-GO载网显微照片(micrographs))压缩、对齐、剂量加权，最终得到多帧图像合成为像素大小为

的单帧照片；使用CTFFIND-4.1软件测定衬度传递函数(contrast transfer function,CTF)的参数；利用cryoSPARC软件分别对两种载网的原始数据进行颗粒挑选、挖颗粒、二维分类，将两种载网的二维分类结果整合在一起做三维分类及三维重构，最终得到分辨率为/>

的密度图。

如图5和图6所示，改造型DNA聚合酶

蛋白的二维分类有数种取向，三维分类及重构后得到的密度图密度较为完整，可以完成模型搭建。如图7所示，改造型DNA聚合酶/>

蛋白与野生型DNA聚合酶/>

蛋白(PDB:5A9J)做比对，依据RMSD值判断，改造型DNA聚合酶/>

蛋白构象与野生型DNA聚合酶/>

蛋白构象差别较小，说明改造后的不影响DNA聚合酶/>

的结构。具体地，627个精简的Cα原子对之间的RMSD为0.962埃；所有的722个Cα原子：1.379。

该改造蛋白后续可进一步应用于DNA编码的小分子库筛选，用于寻找靶向DNA聚合酶

的活性化合物，靶向性药物的生物活性分析，以及基于结构的药物评估、改造和优化等工作。

参考文献

1.Lieber,M.R.The Mechanism of Double-Strand DNA Break Repair by theNonhomologous DNA End-Joining Pathway.Annu Rev Biochem 79,181–211(2010).

2.Hwang,T.et al.Defining the mutation signatures of DNA polymeraseθincancer genomes.Nar Cancer 2,zcaa017-(2020).

3.Schrempf,A.,Slyskova,J.&Loizou,J.I.Targeting the DNA Repair EnzymePolymeraseθin Cancer Therapy.Trends Cancer 7,98–111(2021).

4.Mateos-Gomez,P.A.et al.Mammalian polymeraseθpromotes alternativeNHEJ and suppresses recombination.Nature 518,254–257(2015).

5.Kawamura,K.et al.DNA polymeraseθis preferentially expressed inlymphoid tissues and upregulated in human cancers.Int J Cancer 109,9–16(2004).

6.Lemée,F.et al.DNA polymeraseθup-regulation is associated with poorsurvival in breast cancer,perturbs DNA replication,and promotes geneticinstability.Proc National Acad Sci 107,13390–13395(2010).

7.Higgins,G.S.et al.Overexpression of POLQ Confers a Poor Prognosisin Early Breast Cancer Patients.Oncotarget 1,175–184(2010).

8.Dai,C.-H.et al.Co-inhibition of polθand HR genes efficientlysynergize with cisplatin to suppress cisplatin-resistant lung cancer cellssurvival.Oncotarget 7,65157–65170(2016).

9.Tobin,L.A.et al.Targeting Abnormal DNA Repair in Therapy-ResistantBreast Cancers.Mol Cancer Res 10,96–107(2012).

10.Newman,J.A.,Cooper,C.D.O.,Aitkenhead,H.&Gileadi,O.Structure of theHelicase Domain of DNA Polymerase Theta Reveals a Possible Role in theMicrohomology-Mediated End-Joining Pathway.Struct Lond Engl 1993 23,2319–2330(2015).

11.Mateos-Gomez,P.A.et al.The helicase domain of Polθcounteracts RPAto promote alt-NHEJ.Nat Struct Mol Biol 24,1116–1123(2017).

12.Shen,P.S.The 2017 Nobel Prize in Chemistry:cryo-EM comes ofage.Anal Bioanal Chem 410,2053–2057(2018).

13.Callaway,E.Revolutionary cryo-EM is taking over structuralbiology.Nature 578,201–201(2020).

14.Schneider,G.&Fechner,U.Computer-based de novo design of drug-likemolecules.Nat Rev Drug Discov 4,649–663(2005).

15.Renaud,J.-P.et al.Cryo-EM in drug discovery:achievements,limitations and prospects.Nat Rev Drug Discov 17,471–492(2018).