CN110407945A

CN110407945A - 一种腺嘌呤碱基编辑工具及其用途

Info

Publication number: CN110407945A
Application number: CN201910514432.7A
Authority: CN
Inventors: 黄行许; 李佳楠; 李广磊
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2019-06-14
Filing date: 2019-06-14
Publication date: 2019-11-05

Abstract

本发明涉及生物技术领域，特别是涉及一种腺嘌呤碱基编辑工具及其用途。本发明提供一种融合蛋白，包括ecTadA‑ecTadA*二聚体片段和SpCas9‑D10A nickase片段，所述ecTadA‑ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。本发明所提供的腺嘌呤碱基编辑工具在ecTadA‑ecTadA*二聚体片段中ecTadA片段相对于野生型存在R153P、N46A氨基酸突变，可以限制ecTadA与RNA的结合，在将sgRNA 5’端4‑7位的A突变为G的碱基编辑中，可以极大地降低甚至消除腺嘌呤碱基编辑工具的RNA脱靶效应。

Description

一种腺嘌呤碱基编辑工具及其用途

技术领域

本发明涉及生物技术领域，特别是涉及一种腺嘌呤碱基编辑工具及其用途。

背景技术

CRISPR/Cas9(Clustered regularly interspaced short palindromicrepeats/CRISPR-associated protein)是目前最有效、最便捷的基因组编辑技术。Cas9核酸酶在引导RNA(guide RNA,sgRNA) 引导下，可以到达基因组特定靶点，对其进行切割，从而产生DNA双链断裂(double strand breaks,DSB)，然后通过内源的DNA修复机制来实现编辑。DNA修复机制包括非同源末端连接(Non-Homologous End Join,NHEJ)和同源重组修复(Homologous Directly Repair,HDR)。其中， NHEJ修复的结果是随机引入插入、缺失，导致基因的失活，这在基因组修复中占据主要地位。而HDR可利用模版进行准确修复，从而完成基因突变的校正。

但实际上，HDR介导的准确修复的几率很低，通常小于5％，因此极大限制了CRISPR/Cas9 从科研向应用的转化方面的应用。尤其是基因精准治疗方面，一直是基因编辑领域的一大难题。

最近新开发的碱基编辑器(Base Editor,BE)成功解决了上述问题，大大提高了基因突变的校正效率。现有的碱基编辑器有胞嘧啶碱基编辑工具(Cytosine Base Editor，CBE)和腺嘌呤碱基编辑工具(Adenine Base Editor,ABE)两种。

CBE和ABE是将RuvC结构域失活的Cas9D10Anickase(nCas9)和胞嘧啶脱氨酶/腺嘌呤脱氨酶整合在一起，在sgRNA的引导下到达靶向位点并与sgRNA互补的DNA链进行结合，胞嘧啶脱氨酶对周边一定范围的胞嘧啶C进行脱氨成为尿嘧啶U，U可以与腺嘌呤A互补配对，经过DNA的复制，U最终会被A的互补配对碱基T所取代；类似的，腺嘌呤脱氨酶对周边一定范围的腺嘌呤A进行脱氨成为次黄嘌呤I，I可以与胞嘧啶C互补配对，经过DNA 的复制，I最终会被C的互补配对碱基G所取代。从而达到C-to-T或A-to-G的目的。在经过核定位信号以及密码子的优化后，目前BE4max和ABEmax的效率最高，BE4max对应的编辑窗口是sgRNA5’端的4-8位，ABEmax对应的编辑窗口是sgRNA 5’端的4-7位。

目前应用最广泛的ABEmax中的脱氨酶是大肠杆菌腺嘌呤脱氨酶ecTadA进化后的变体，其中，内源状态的ecTadA只具有编辑RNA的功能。近期研究发现ABEmax碱基编辑器作用过程中会产生严重的RNA脱靶效应(off-Target)⁵，极大的限制了此碱基编辑器的应用。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种腺嘌呤碱基编辑工具及其用途，用于解决现有技术中的问题。

为实现上述目的及其他相关目的，本发明一方面提供一种融合蛋白，包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段，所述ecTadA-ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。

在本发明一些实施方式中，所述ecTadA片段的氨基酸序列包括：

a)如SEQ ID NO.41所示的氨基酸序列；或，

b)与SEQ ID NO.41具有80％以上序列相似性的氨基酸序列、且具有a)所限定的氨基酸序列的功能，优选为能够与ecTadA*片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性。

在本发明一些实施方式中，所述ecTadA*片段的氨基酸序列包括：

c)如SEQ ID NO.42所示的氨基酸序列；或，

d)与SEQ ID NO.42具有80％以上序列相似性的氨基酸序列、且具有c)所限定的氨基酸序列的功能，优选为能够与ecTadA片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性。

在本发明一些实施方式中，所述SpCas9-D10A nickase片段的氨基酸序列包括：

e)如SEQ ID NO.43所示的氨基酸序列；或，

f)与SEQ ID NO.43具有80％以上序列相似性的氨基酸序列、且具有e)所限定的氨基酸序列的功能，优选为能够识别NG作为PAM。

在本发明一些实施方式中，所述融合蛋白自N端至C端依次包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段；

和/或，所述ecTadA-ecTadA*二聚体片段自N端至C端依次包括ecTad片段和ecTadA* 片段。

在本发明一些实施方式中，所述融合蛋白还包括核定位信号片段，优选的，所述核定位信号片段位于ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段的N端和/或C端，优选的，所述核定位信号片段的氨基酸序列如SEQ ID NO.44所示；

和/或，所述融合蛋白还包括柔性连接肽片段，优选的，所述柔性连接肽段的氨基酸序列如SEQ ID NO.45、SEQ ID NO.46所示。

在本发明一些实施方式中，所述融合蛋白的氨基酸序列如SEQ ID No.47所示。

本发明另一方面提供一种分离的多核苷酸，编码所述的融合蛋白。

本发明另一方面提供一种构建体，所述构建体含有所述的分离的多核苷酸。

本发明另一方面提供一种表达系统，所述表达系统含有所述的构建体或基因组中整合有外源的所述的多核苷酸。

在本发明一些实施方式中，所述表达系统的宿主细胞选自真核细胞或原核细胞，优选选自小鼠细胞、人细胞，更优选选自小鼠脑神经瘤细胞、人胚胎肾细胞、或人宫颈癌细胞、人结肠癌细胞、人骨肉瘤细胞，更优选选自N2a细胞、HEK293FT细胞、Hela细胞、HCT116细胞、或U2OS细胞。

本发明另一方面提供所述的融合蛋白、所述的分离的多核苷酸、所述的构建体或所述的表达系统在基因编辑中的用途。

在本发明一些实施方式中，所述用途具体为在真核生物的基因编辑中的用途。

本发明另一方面提供一种碱基编辑体系，包括所述的融合蛋白，所述碱基编辑体系还包括sgRNA。

本发明另一方面提供一种基因编辑方法，包括：通过所述的融合蛋白、或所述的碱基编辑体系进行基因编辑。

附图说明

图1显示为本发明实施例中所使用的eABEmax质粒和ABEmax质粒结构示意图。

图2显示为本发明eABEmax的编辑能力验证示意图，其中，a为hokB过表达报告系统示意图；b为该报告系统中ABEmax以及eABEmax在hokB位点的RNA以及DNA编辑效率统计图；c为ABEmax以及eABEmax在HEK293Site3位点的编辑效率的统计图。

图3为eABEmax在HEK293T细胞中对内源基因位点编辑的效率统计图。

具体实施方式

本发明发明人经过大量探索性研究，提供了一种融合蛋白，所述融合蛋白是一种新的腺嘌呤碱基编辑工具，所述融合蛋白可以识别NG位点并进行精确的碱基编辑，可以极大降低甚至消除RNA脱靶效应，在此基础上完成了本发明。

本发明第一方面提供一种融合蛋白，包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段，所述ecTadA-ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。所述融合蛋白可以以NGG为PAM序列，与靶向靶点区域的sgRNA相配合，实现对靶点区域内sgRNA5’ 端4-7位的A-to-G的高效碱基编辑，在目标位点具有更高的编辑效率、更高的编辑准确性。

本发明所提供的融合蛋白中，所述ecTadA片段的氨基酸序列可以包括：a)如SEQID NO. 41所示的氨基酸序列；或，b)与SEQ ID NO.41具有80％以上序列相似性的氨基酸序列、且具有a)所限定的氨基酸序列的功能。具体的，所述b)中的氨基酸序列具体指：如SEQID No.49所示的氨基酸序列经过取代、缺失或者添加一个或多个(具体可以是1-50、1-30个、 1-20个、1-10个、1-5个、1-3个、1个、2个、或3个)氨基酸而得到的，或者在N-末端和/ 或C-末端添加一个或多个(具体可以是1-50个、1-30个、1-20个、1-10个、1-5个、1-3个、 1个、2个、或3个)氨基酸而得到的，且具有氨基酸如SEQ ID No.49所示的多肽片段的功能的多肽片段，例如，可以是具有能够与ecTadA*片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性，更具体可以是将腺嘌呤(adenine，A)脱氨产生次黄嘌呤(hypoxanthine，I)的功能。所述b)中的氨基酸序列可与SEQ ID No.41具有80％、85％、90％、93％、95％、97％、或99％以上的相似性。所述ecTadA片段源自大肠杆菌(Escherichia coli)，相对于野生型的 ecTadA来说，本发明中的ecTadA片段存在R153P、N46A氨基酸突变，可以限制ecTadA与 RNA的结合，从而极大地降低甚至消除腺嘌呤碱基编辑工具的RNA脱靶效应。

本发明所提供的融合蛋白中，所述ecTadA*片段的氨基酸序列可以包括：c)如SEQID NO. 42所示的氨基酸序列；或，d)与SEQ ID NO.42具有80％以上序列相似性的氨基酸序列、且具有c)所限定的氨基酸序列的功能。具体的，所述d)中的氨基酸序列具体指：如SEQID No.50所示的氨基酸序列经过取代、缺失或者添加一个或多个(具体可以是1-50、1-30个、 1-20个、1-10个、1-5个、1-3个、1个、2个、或3个)氨基酸而得到的，或者在N-末端和/ 或C-末端添加一个或多个(具体可以是1-50个、1-30个、1-20个、1-10个、1-5个、1-3个、 1个、2个、或3个)氨基酸而得到的，且具有氨基酸如SEQ ID No.50所示的多肽片段的功能的多肽片段，例如，可以是具有能够与ecTadA片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性，更具体可以是将腺嘌呤(adenine，A)脱氨产生次黄嘌呤(hypoxanthine，I)的功能。所述d)中的氨基酸序列可与SEQ ID No.42具有80％、85％、90％、93％、95％、97％、或99％以上的相似性。所述ecTadA*片段源自大肠杆菌(Escherichia coli)，由人工定向进化获得。

本发明所提供的融合蛋白中，所述SpCas9-D10A nickase的氨基酸序列可以包括：e)如 SEQ ID NO.43所示的氨基酸序列；或，f)与SEQ ID NO.51具有80％以上序列相似性的氨基酸序列、且具有e)所限定的氨基酸序列的功能。具体的，所述f)中的氨基酸序列具体指：如SEQ ID No.43所示的氨基酸序列经过取代、缺失或者添加一个或多个(具体可以是1-50、 1-30个、1-20个、1-10个、1-5个、1-3个、1个、2个、或3个)氨基酸而得到的，或者在 N-末端和/或C-末端添加一个或多个(具体可以是1-50个、1-30个、1-20个、1-10个、1-5 个、1-3个、1个、2个、或3个)氨基酸而得到的，且具有氨基酸如SEQ ID No.43所示的多肽片段的功能的多肽片段，例如，可以是能够识别NG作为PAM的功能，具体可以是能够将NG序列作为PAM，并可以与特异性靶向位点的sgRNA以及ecTadA-ecTadA*二聚体片段相配合，实现靶点区域内sgRNA 5’端4-7位的A-to-G的碱基编辑。所述f)中的氨基酸序列可与SEQ ID No.43具有80％、85％、90％、93％、95％、97％、或99％以上的相似性。CRISPR/Cas9 系统的靶向识别通常需要靶位点旁边具有前间隔序列邻近基序(protospacer adjacent motif, PAM)，作为一种最为频繁用于基因组编辑的Cas9酶，来自酿脓链球菌(Streptococcus pyogenes)的Cas9(SpCas9)仅能够识别NGG序列的PAM，这就限制了基因组中能够被靶向的范围，而本发明中的SpCas9-D10A nickase来源于酿脓链球菌(Streptococcus pyogenes)，能够识别NG序列作为PAM。

本发明所提供的融合蛋白中，所述的取代、缺失或者添加可以是保守氨基酸取代。所述 “保守氨基酸取代”具体可以是指氨基酸残基被其他具有相似侧链的氨基酸残基取代的情况。具有相似侧链的氨基酸残基家族对于本领域技术人员来说应该是已知的，例如，可以是包括但不限于碱性侧链(例如赖氨酸，精氨酸，组氨酸)，酸性侧链(例如天冬氨酸，谷氨酸)，不带电荷的极性侧链(例如，甘氨酸，天冬酰胺，谷氨酰胺，丝氨酸，苏氨酸，酪氨酸，半胱氨酸)，非极性侧链(例如丙氨酸，缬氨酸，亮氨酸，异亮氨酸，脯氨酸，苯丙氨酸，甲硫氨酸，色氨酸)异亮氨酸)和芳族侧链(例如酪氨酸，苯丙氨酸，色氨酸，组氨酸)等家族。保守型氨基酸取代更具体可以包括但不限于下表中所列的具体情况，表1(氨基酸相似度矩阵)中的数字表示两个氨基酸之间的相似度，当数字大于等于0时认为是保守氨基酸取代，表2为示例性的保守氨基酸取代的方案。

表1

	C	G	P	S	A	T	D	E	N	Q	H	K	R	V	M	I	L	F	Y	W
																					W	-8	-7	-6	-2	-6	-5	-7	-7	-4	-5	-3	-3	2	-6	-4	-5	-2	0	0	17
Y	0	-5	-5	-3	-3	-3	-4	-4	-2	-4	0	-4	-5	-2	-2	-1	-1	7	10
																					F	-4	-5	-5	-3	-4	-3	-6	-5	-4	-5	-2	-5	-4	-1	0	1	2	9
L	-6	-4	-3	-3	-2	-2	-4	-3	-3	-2	-2	-3	-3	2	4	2	6
																					I	-2	-3	-2	-1	-1	0	-2	-2	-2	-2	-2	-2	-2	4	2	5
M	-5	-3	-2	-2	-1	-1	-3	-2	0	-1	-2	0	0	2	6
																					V	-2	-1	-1	-1	0	0	-2	-2	-2	-2	-2	-2	-2	4
R	-4	-3	0	0	-2	-1	-1	-1	0	1	2	3	6
																					K	-5	-2	-1	0	-1	0	0	0	1	1	0	5
H	-3	-2	0	-1	-1	-1	1	1	2	3	6
																					Q	-5	-1	0	-1	0	-1	2	2	1	4
N	-4	0	-1	1	0	0	2	1	2
																					E	-5	0	-1	0	0	0	3	4
D	-5	1	-1	0	0	0	4
																					T	-2	0	0	1	1	3
A	-2	1	1	1	2
																					S	0	1	1	1
P	-3	-1	6
																					G	-3	5
C	12

表2

本发明所提供的融合蛋白中，还可以包括核定位信号片段(NLS)，所述核定位信号片段通常可以与入核载体相互作用，从而可以使蛋白能够被运送进细胞核。所述核定位信号片段可以位于ecTadA-ecTadA*二聚体片段的N端，也可以位于SpCas9-D10A nickase的C端。所述核定位信号片段的氨基酸序列可以包括如SEQ ID NO.44所示的氨基酸序列。

本发明所提供的融合蛋白中，还可以包括柔性连接肽段，所述柔性连接肽段可以位于 ecTadA-ecTadA*二聚体片段的N端、ecTad片段和ecTadA*片段之间、ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase之间、或SpCas9-D10A nickase的C端。本领域技术人员通常可以选择合适的柔性连接肽段以连接各多肽片段，例如，ecTad片段和ecTadA*片段之间可以设有第一柔性连接肽段，所述第一柔性连接肽段的氨基酸序列可以包括如SEQID NO.45所示的氨基酸序列；再例如，ecTadA-ecTadA*二聚体片段和SpCas9-D10Anickase之间可以设有第二柔性连接肽段，所述第二柔性连接肽段的氨基酸序列可以包括如SEQ ID NO.46所示的氨基酸序列。

本发明所提供的融合蛋白中，所述融合蛋白自N端至C端可以依次包括ecTadA-ecTadA* 二聚体片段和SpCas9-D10A nickase，所述ecTadA-ecTadA*二聚体片段自N端至C端可以依次包括ecTadA片段和ecTadA*片段，优选可以依次包括ecTadA片段、第一柔性连接肽段和 ecTadA*片段。在本发明一具体实施例中，所述融合蛋白自N端至C端可以依次包括第一核定位信号片段、ecTadA-ecTadA*二聚体片段、第二柔性连接肽段、SpCas9-D10Anickase、第二核定位信号片段，所述融合蛋白的氨基酸序列如SEQ ID No.47所示。

本发明第二方面提供一种分离的多核苷酸，编码本发明第一方面所提供的融合蛋白。

本发明第三方面提供一种构建体，所述构建体含有本发明第二方面所提供的分离的多核苷酸。所述构建体通常可以通过将所述分离的多核苷酸插入合适的表达载体中构建获得，本领域技术人员可选择合适的表达载体，例如，所述表达载体可以是包括但不限于pCMV表达载体、pSV2表达载体、pGL3表达载体等。

本发明第四方面提供一种表达系统，所述表达系统含有本发明第三方面所提供的构建体或基因组中整合有外源的本发明第二方面所提供的分离的多核苷酸。所述表达系统可以是宿主细胞，所述宿主细胞可以表达如上所述的融合蛋白，所述融合蛋白可以与sgRNA相配合，从而可以将所述融合蛋白定位到目标区域，实现目标区域的碱基编辑。在本发明另一具体实施例中，所述宿主细胞可以是真核细胞和/或原核细胞，更具体可以是小鼠细胞、人细胞等，更具体可以是小鼠脑神经瘤细胞、人胚胎肾细胞、人宫颈癌细胞、人结肠癌细胞、人骨肉瘤细胞等，更具体可以是N2a细胞、HEK293FT细胞、Hela细胞、HCT116细胞、或U2OS细胞等。

本发明第五方面提供本发明第一方面所提供的融合蛋白、或本发明第二方面所提供的分离的多核苷酸、或本发明第三方面所提供的构建体、或本发明第四方面所提供的表达系统在基因编辑中的用途，优选为真核生物的基因编辑中的用途，所述真核生物具体可以是后生动物，具体可以是包括但不限于人、小鼠等。所述用途具体可以是包括但不限于由A到G的碱基编辑(更具体为靶点区域内sgRNA 5’端4-7位的A-to-G的碱基编辑)、编辑剪接受体/供体位点来调节RNA剪接、利用本工具进行模型(例如，疾病模型、细胞模型、动物模型等)的构建或人类疾病的治疗等。在本发明一具体实施例中，所述用途具体为细胞株的构建，更具体为细胞中特定基因位点的碱基编辑，具体的编辑位点可以是靶点sgRNA区域5’端4-7位。本发明另一具体实施例中，被编辑的对象可以是胚胎、细胞等。

本发明第六方面提供一种碱基编辑体系，包括本发明第一方面所提供的融合蛋白，所述碱基编辑体系还包括sgRNA。本领域技术人员可以根据基因的目标编辑区域，选择合适的靶向特异性位点的sgRNA。例如，所述sgRNA的序列通常可以与目标区域至少部分互补，从而可以与所述融合蛋白相配合，将所述融合蛋白定位到目标区域，实现靶点区域内sgRNA 5’ 端4-7位的A-to-G的碱基编辑，具体可以是腺嘌呤脱氨基反应，即将腺嘌呤(A)编辑为次黄嘌呤(I)。本发明所提供的碱基编辑体系地拓宽了基因组可靶向的范围，可以将NG序列作为PAM，实现sgRNA靶点区域内5’端4-7位的A-to-G的碱基，且突变具有很高的精准性，，可以极大降低甚至消除RNA脱靶效应。在本发明一具体实施例中，所述用途具体为细胞株的构建，更具体为细胞中特定基因位点的碱基编辑，具体的编辑位点可以是任意基因中符合 sgRNA设计要求的位点。本发明另一具体实施例中，被编辑的对象可以是胚胎、细胞等。

本发明第七方面提供一种碱基编辑方法，包括：通过本发明第一方面所提供的融合蛋白、或本发明第六方面所提供的碱基编辑体系进行基因编辑。例如，所述基因编辑方法可以包括：在适当条件下培养本发明第四方面所提供的表达系统，从而表达所述融合蛋白，所述融合蛋白可以在与其配合的靶向目标区域的sgRNA存在的条件下，对靶标区域进行碱基编辑。提供所述sgRNA存在的条件的方法对于本领域技术人员来说应该是已知的，例如，可以是在适当条件下培养能够表达所述sgRNA的表达系统，所述表达系统可以是包括含有编码所述sgRNA 的多核苷酸的表达载体的宿主细胞、或染色体中整合有编码所述sgRNA的多核苷酸的宿主细胞。在本发明一具体实施例中，所述sgRNA与所述融合蛋白可以在同一宿主细胞中表达，所述宿主细胞可以为靶细胞。在本发明另一具体实施例中，所述基因编辑为体外基因编辑。

本发明提供了一种新的腺嘌呤碱基编辑工具(eABEmax)，所述腺嘌呤碱基编辑工具包括 ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase，在ecTadA-ecTadA*二聚体片段中， ecTadA片段相对于野生型存在R153P、N46A氨基酸突变，可以限制ecTadA与RNA的结合，在将sgRNA 5’端4-7位的A突变为G的碱基编辑中，可以极大地降低甚至消除腺嘌呤碱基编辑工具的RNA脱靶效应。另外，本发明所提供的腺嘌呤碱基编辑工具(eABEmax)在DNA上的编辑效率与未存在R153P、N46A氨基酸突变的腺嘌呤碱基编辑工具(ABEmax)持平，在保证了编辑效率的前提下，大大提升了突变的精准性，具有良好的产业化前景。

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

在进一步描述本发明具体实施方式之前，应理解，本发明的保护范围不局限于下述特定的具体实施方案；还应当理解，本发明实施例中使用的术语是为了描述特定的具体实施方案，而不是为了限制本发明的保护范围；在本发明说明书和权利要求书中，除非文中另外明确指出，单数形式“一个”、“一”和“这个”包括复数形式。

当实施例给出数值范围时，应理解，除非本发明另有说明，每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义，本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外，根据本技术领域的技术人员对现有技术的掌握及本发明的记载，还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

除非另外说明，本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明，具体可参见Sambrook等MOLECULAR CLONING：A LABORATORY MANUAL，Second edition，Cold Spring HarborLaboratory Press，1989and Third edition，2001；Ausubel等，CURRENT PROTOCOLS INMOLECULAR BIOLOGY，John Wiley&Sons，New York，1987and periodic updates；theseries METHODS IN ENZYMOLOGY，Academic Press，San Diego；Wolffe，CHROMATINSTRUCTURE AND FUNCTION，Third edition，Academic Press，San Diego，1998；METHODS INENZYMOLOGY，Vol.304，Chromatin(P.M.Wassarman and A.P.Wolffe，eds.)，AcademicPress， San Diego，1999；和METHODS IN MOLECULAR BIOLOGY，Vol.119，ChromatinProtocols(P.B.Becker，ed.)Humana Press，Totowa，1999等。

实施例中所使用的构建eABEmax质粒的构建方法如下：通过Mut Express II FastMutagenesis Kit V2(Vazyme,C214-02)将2个氨基酸突变(N46A和R153P)引入ABEmax质粒中TadA部分(图1)，ABEmax质粒购自Addgene(#112095)。构建得到的eABEmax质粒序列如SEQ ID NO.1所示。

实施例1

本实施例中，利用hokB过表达报告系统在HEK293T上验证eABEmax的编辑能力以及RNA脱靶效应，结果如图2所示。

1.1hokB过表达报告系统质粒构建

通过Mut Express II Fast Mutagenesis Kit V2(Vazyme,C214-02)构建hokB过表达载体。构建得到的hokB过表达报告系统质粒序列见附录序列表SEQ ID NO.2。

1.2sgRNA质粒的构建

设计sgRNA并合成oligos，上游序列为：5’-accgGGCCCAGACTGAGCACGTGA-3’(SEQID NO.3)，下游序列为：5’-aaacTCACGTGCTCAGTCTGGGCC-3’(SEQ ID NO.4)，上下游序列通过程序(95℃，5min；95℃-85℃at-2℃/s；85℃-25℃at-0.1℃/s；hold at 4℃)退火，连接到经过BsaI(NEB：R0539L)线性化的pGL3-U6-sgRNA(Addgene#51133)载体上。线性化体系如下所示：pGL3-U6-sgRNA 2μg；buffer(NEB：R0539L)6μL；BsaI 2μL；ddH2O补齐到60μL。 37℃酶切过夜。连接体系如下：T4连接buffer(NEB：M0202L)1μL，线性化载体20ng，退火的oligo片段(10μM)5μL，T4连接酶(NEB：M0202L)0.5μL，ddH₂O补齐到10μL.16℃连接过夜。连接的载体通过转化，挑菌，鉴定。对阳性克隆摇菌提取质粒(Axygene：AP-MN-P-250G) 并测定浓度。

1.3细胞的培养转染与收取

HEK293T细胞(购自ATCC)接种培养于添加10％FBS的DMEM高糖培养液中(HyClone,SH30022.01B)，其中含1％Penicillin Streptomycin(v/v)(Gibco)。当细胞浓度为80％时，用10％血清的DMEM培养基换液，培养2小时使细胞状态恢复最佳。每孔转染的质粒的量分别是 ABEmax质粒0.5μg，sgRNA质粒0.3μg，hokB过表达报告系统质粒0.2μg；eABEmax质粒0.5μg，sgRNA质粒0.3μg，hokB过表达报告系统质粒0.2μg。两种组合分别做两组。分别将质粒混在25μl的Opti-MEM(Gibco,11058021)培养基。将1μl的Lipofectamine 2000转染试剂(Thermo,11668019)混入25μl的Opti-MEM培养基并混匀，静置5分钟。将混有质粒的 Opti-MEM加入混有Lipofectamine 2000的Opti-MEM，慢速吹打混匀，静置20分钟。将混有质粒和Lipofectamine 2000的Opti-MEM分别加入24孔板(孔板中细胞浓度为80％转染)。转染6小时后用10％FBS的DMEM换液。转染24小时后用puromycin(Invivogen,ant-pr-1) 进行药杀。药杀48h后收取细胞，每种组合中一组用于RNA脱靶检测，一组用于DNA编辑效率检测。

1.4DNA编辑效率检测

DNA检测先是通过裂解得到基因组，裂解液的成分为50mM KCl，1.5mM MgCl2，10mMTris pH 8.0，0.5％Nonidet P-40，0.5％Tween 20，100g/ml protease K。对靶点附近序列进行 PCR扩增，将扩增产物纯化后用Sanger测序进行鉴定。扩增体系如下：2Xbuffer(Vazyme， P505)25μL；dNTP 1μL；F(10pmol/μL)1μL；R(10pmol/μL)1μL；模板1μL；DNA聚合酶(Vazyme， P505)0.5μL；ddH2O补齐到50μL。扩增出来的PCR产物经过下述步骤纯化：加入三倍体积的PCR-A(Axygen：AP-PCR-250G)过柱，离心，12000转/分钟离心1分钟；加入700μLW2，离心1分钟；弃废液，加入700μL W2，离心1分钟；弃废液，空转1分钟；加入20μL水洗脱。所用到的PCR扩增引物如SEQ ID NO.5和SEQ ID NO.6所示。

1.5RNA脱靶效应效率检测

在RNA检测中，先用Trizol(Vazyme,R401-01)抽取总RNA，抽取步骤如下：每孔加入1ml Trizol，混匀后收集，加入200ul三氯甲烷，上下颠倒充分混匀后4℃温度下离心，12000转/分钟离心15分钟；吸取上清400ul，加入等体积异丙醇，上下颠倒混匀后4℃温度下离心，12000转/分钟离心10分钟；弃上清，加入1mL 75％乙醇，上下颠倒混匀后，4℃温度下离心，12000转/分钟离心10分钟；弃上清，风干后加水溶解。配置反转录体系如下：4xbuffer(Vazyme, C215-02)2ul；RNA 1ug,ddH2O补齐到8ul。42度5分钟后加入2ul 5xbuffer，通过程序(42℃ 5min；85℃15min；hold at 4℃)进行反转录。取cDNA 1ul，用P505酶按上述步骤扩增，扩增引物分别如SEQ ID NO.7和SEQ ID NO.8所示。将扩增产物纯化后用Sanger测序进行鉴定，相关结果如图2b所示。

实施例2

本实施例中，利用eABEmax在HEK293T细胞上对内源基因位点进行编辑。

2.1sgRNA质粒的构建

挑选8个人源内源基位点，设计sgRNA，所用到的oligos的多核苷酸序列如SEQ IDNO. 9～26所示，所用到的8条sgRNA在基因组的位置分别为，NC_000004.12：52670026-52670045； NC_000022.11：19401208-19401227；NC_000015.10：47301029-47301048；NC_000014.9： 88099864-88099883；NC_000001.11：154311091-154311110；NC_000001.11：179826686- 179826705；NC_000001.11：184974900-184974919；NC_000001.11：184974901-184974920。按1.2进行sgRNA质粒的构建。

2.2细胞的培养转染与鉴定

HEK293T细胞按1.3进行培养与转染，转染的质粒量为eABEmax 0.6μg，sgRNA表达载体质粒0.3μg，以ABEmax作为对照。转染12小时后按上述1.3中加药puromycin，加药48h后收取细胞，按1.3进行裂解、PCR扩增与纯化，产物用Sanger测序进行鉴定。相关结果如图3所示。扩增引物的多核苷酸序列如SEQ ID NO.27～40所示。由图3可知，eABEmax可以在HEK293T细胞中高效地编辑内源基因位点，而且精准性高、RNA脱靶低。

综上所述，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

序列表

<110> 上海科技大学

<120> 一种腺嘌呤碱基编辑工具及其用途

<160> 47

<170> SIPOSequenceListing 1.0

<210> 1

<211> 8811

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 60

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940

caccacgccc acgacgccta cctaaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080

ctgtctcagc tgggaggtga ctctggcggc tcaaaaagaa ccgccgacgg cagcgaattc 4140

gagcccaaga agaagaggaa agtctaaccg gtcatcatca ccatcaccat tgagtttaaa 4200

cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt tgcccctccc 4260

ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 4320

aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 4380

acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta 4440

tggcttctga ggcggaaaga accagctggg gctcgatacc gtcgacctct agctagagct 4500

tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 4560

acaacatacg agccggaagc ataaagtgta aagcctaggg tgcctaatga gtgagctaac 4620

tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 4680

tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 4740

cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 4800

actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 4860

gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 4920

ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 4980

acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5040

ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5100

cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5160

tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 5220

gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 5280

ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 5340

acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 5400

gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 5460

ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 5520

tttctacggg gtctgacact cagtggaacg aaaactcacg ttaagggatt ttggtcatga 5580

gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 5640

tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 5700

ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 5760

taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 5820

cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 5880

gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 5940

gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6000

tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6060

gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6120

ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6180

ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 6240

cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 6300

ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 6360

gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 6420

ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 6480

ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 6540

tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 6600

ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 6660

cacctgacgt cgacggatcg ggagatcgat ctcccgatcc cctagggtcg actctcagta 6720

caatctgctc tgatgccgca tagttaagcc agtatctgct ccctgcttgt gtgttggagg 6780

tcgctgagta gtgcgcgagc aaaatttaag ctacaacaag gcaaggcttg accgacaatt 6840

gcatgaagaa tctgcttagg gttaggcgtt ttgcgctgct tcgcgatgta cgggccagat 6900

atacgcgttg acattgatta ttgactagtt attaatagta atcaattacg gggtcattag 6960

ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 7020

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 7080

caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 7140

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 7200

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 7260

tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 7320

gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 7380

gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 7440

tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 7500

tgaaccgtca gatccgctag agatccgcgg ccgctaatac gactcactat agggagagcc 7560

gccaccatga aacggacagc cgacggaagc gagttcgagt caccaaagaa gaagcggaaa 7620

gtctctgaag tcgagtttag ccacgagtat tggatgaggc acgcactgac cctggcaaag 7680

cgagcatggg atgaaagaga agtccccgtg ggcgccgtgc tggtgcacaa caatagagtg 7740

atcggagagg gatggaacag gccaatcggc cgccgcgacc ctaccgcaca cgcagagatc 7800

atggcactga ggcagggagg cctggtcatg cagaattacc gcctgatcga tgccaccctg 7860

tatgtgacac tggagccatg cgtgatgtgc gcaggagcaa tgatccacag caggatcgga 7920

agagtggtgt tcggagcacg ggacgccaag accggcgcag caggctccct gatggatgtg 7980

ctgcaccacc ccggcatgaa ccaccgggtg gagatcacag agggaatcct ggcagacgag 8040

tgcgccgccc tgctgagcga tttctttaga atgcggccac aggagatcaa ggcccagaag 8100

aaggcacaga gctccaccga ctctggagga tctagcggag gatcctctgg aagcgagaca 8160

ccaggcacaa gcgagtccgc cacaccagag agctccggcg gctcctccgg aggatcctct 8220

gaggtggagt tttcccacga gtactggatg agacatgccc tgaccctggc caagagggca 8280

cgcgatgaga gggaggtgcc tgtgggagcc gtgctggtgc tgaacaatag agtgatcggc 8340

gagggctgga acagagccat cggcctgcgc gacccaacag cccatgccga aattatggcc 8400

ctgagacagg gcggcctggt catgcagaac tacagactga ttgacgccac cctgtacgtg 8460

acattcgagc cttgcgtgat gtgcgccggc gccatgatcc actctaggat cggccgcgtg 8520

gtgtttggcg tgaggaacgc aaaaaccggc gccgcaggct ccctgatgga cgtgctgcac 8580

taccccggca tgaatcaccg cgtcgaaatt accgagggaa tcctggcaga tgaatgtgcc 8640

gccctgctgt gctatttctt tcggatgcct agacaggtgt tcaatgctca gaagaaggcc 8700

cagagctcca ccgactccgg aggatctagc ggaggctcct ctggctctga gacacctggc 8760

acaagcgaga gcgcaacacc tgaaagcagc gggggcagca gcggggggtc a 8811

<210> 2

<211> 7313

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccgaa ttgacaaatg 2040

gcagtattca tccacaattt taaaagaaaa ggggggattg gggggtacag tgcaggggaa 2100

agaatagtag acataatagc aacagacata caaactaaag aattacaaaa acaaattaca 2160

aaaattcaaa attttcgggt ttattacagg gacagcagag atccagtttg gactagcgat 2220

gctagctgat gcgggccctt agttattaat agtaatcaat tacggggtca ttagttcata 2280

gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 2340

ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 2400

ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 2460

atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 2520

cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 2580

tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 2640

agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 2700

tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 2760

aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc cctatcagtg 2820

atagagatct ccctatcagt gatagagatc gtcgacgagc tcgtttagtg aaccgtcaga 2880

tcgcctggag acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca 2940

gcctttccgg ttaaggtgaa cgcgtgcagg ccctgcaggg cgccaccatg aaacggacag 3000

ccgacggaag cgagttcgag tcaccaaaga agaagcggaa agtctctaga atggcttcaa 3060

actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca gtggctcctt 3120

ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc caggcctaca 3180

aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc atcaaggtgg 3240

aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc gccgcttgga 3300

ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct gactgtgaac 3360

tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct tccgccatcg 3420

ccgctaactc aggtatctac agcggcagcg agactcccgg gacctcagag tccgccacac 3480

ccgaaagtat gaagcacaac cctctggtgg tgtgtctgct cattatctgc attacgattc 3540

tgacattcac actcctgacc cgacaaacgc tctacgaact gcggttccgg gacggtgata 3600

aggaggttgc tgcgctcatg gcctgcacgt ccaggtctgg cggccgctct ggcatcgatg 3660

ggagcctcga gccaaagaaa aagcggaaag tgtaatctag ataatcaacc tctggattac 3720

aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 3780

tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 3840

tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa 3900

cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc 3960

acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc 4020

atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 4080

gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg 4140

attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct 4200

tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg 4260

agtcggatct ccctttgggc cgcctccccg cctgagatcc tttaagacca atgacttaca 4320

aggcagctgt agatcttagc cactttttaa aagaaaaggg gggactggaa gggctaattc 4380

actcccaacg aagacaagat ctgctttttg cttgtactgg gtctctctgg ttagaccaga 4440

tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct 4500

tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat 4560

ccctcagacc cttttagtca gtgtggaaaa tctctagcag tagtagttca tgtcatctta 4620

ttattcagta tttataactt gcaaagaaat gaatatcaga gagtgagagg cccgggttaa 4680

ttaaggaaag ggctagatca ttcttgaaga cgaaagggcc tcgtgatacg cctattttta 4740

taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 4800

gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 4860

agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 4920

catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 4980

ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5040

atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5100

ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tgttgacgcc 5160

gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 5220

ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 5280

ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 5340

gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 5400

ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 5460

gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 5520

ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 5580

gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 5640

gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 5700

caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 5760

cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 5820

ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 5880

taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 5940

tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6000

gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6060

agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 6120

aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 6180

gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 6240

gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 6300

tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 6360

agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 6420

cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 6480

gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 6540

gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 6600

ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 6660

cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 6720

cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagcaagct catggctgac 6780

taattttttt tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt 6840

agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctccccgtg gcacgacagg 6900

tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 6960

taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 7020

ggataacaat ttcacacagg aaacagctat gacatgatta cgaatttcac aaataaagca 7080

tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc 7140

tggatcaact ggataactca agctaaccaa aatcatccca aacttcccac cccataccct 7200

attaccactg ccaattacct gtggtttcat ttactctaaa cctgtgattc ctctgaatta 7260

ttttcatttt aaagaaattg tatttgttaa atatgtacta caaacttagt agt 7313

<210> 3

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

accgggccca gactgagcac gtga 24

<210> 4

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

aaactcacgt gctcagtctg ggcc 24

<210> 5

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ctacgcctgt gatgggctaa 20

<210> 6

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ccatcacttt ctggcctcag t 21

<210> 7

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

cgccacaccc gaaagtatga agcacaaccc t 31

<210> 8

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ccagagcggc cgccagacct ggacgtgcag gc 32

<210> 9

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

accggatgag ataatgatga gtca 24

<210> 10

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

aaactgactc atcattatct catc 24

<210> 11

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

accgggattg acccaggcca gggc 24

<210> 12

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

aaacgccctg gcctgggtca atcc 24

<210> 13

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

accggaatac taagcataga ctcc 24

<210> 14

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

aaacggagtc tatgcttagt attc 24

<210> 15

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

accggaagac caaggataga ctgc 24

<210> 16

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

aaacgcagtc tatccttggt cttc 24

<210> 17

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

accgggacag gcagcataga ctgt 24

<210> 18

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

aaacacagtc tatgctgcct gtcc 24

<210> 19

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

accggtagaa aaagtataga ctgc 24

<210> 20

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

aaacgcagtc tatacttttt ctac 24

<210> 21

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

accggggaat aaatcataga atcc 24

<210> 22

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

aaacggattc tatgatttat tccc 24

<210> 23

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

accgacacac acacttagaa tctg 24

<210> 24

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

aaaccagatt ctaagtgtgt gtgt 24

<210> 25

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

accgcacaca cacttagaat ctgt 24

<210> 26

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

aaacacagat tctaagtgtg tgtg 24

<210> 27

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

gatgccctcc atcttctccg 20

<210> 28

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

taggtttgca tagacctgcc c 21

<210> 29

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

cctccatctt cctacacgcc 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

gaacaggcag cgtattgctt 20

<210> 31

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

aaccacctgc agaggactac t 21

<210> 32

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

gaaggcctag aaagagacag c 21

<210> 33

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

tggtgattat ggttacacag cg 22

<210> 34

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

acccatgtgc ctgacatagg 20

<210> 35

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

tcctgaggtc taggaacccg 20

<210> 36

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

gggaggtgga gagaggatgt 20

<210> 37

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

agctcaagat cacgttgcct 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

ctccttggtc caggttctcg 20

<210> 39

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

agctcaagat cacgttgcct 20

<210> 40

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

ctccttggtc caggttctcg 20

<210> 41

<211> 498

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

tctgaagtcg agtttagcca cgagtattgg atgaggcacg cactgaccct ggcaaagcga 60

gcatgggatg aaagagaagt ccccgtgggc gccgtgctgg tgcacaacaa tagagtgatc 120

ggagagggat ggaacaggcc aatcggccgc cacgacccta ccgcacacgc agagatcatg 180

gcactgaggc agggaggcct ggtcatgcag aattaccgcc tgatcgatgc caccctgtat 240

gtgacactgg agccatgcgt gatgtgcgca ggagcaatga tccacagcag gatcggaaga 300

gtggtgttcg gagcacggga cgccaagacc ggcgcagcag gctccctgat ggatgtgctg 360

caccaccccg gcatgaacca ccgggtggag atcacagagg gaatcctggc agacgagtgc 420

gccgccctgc tgagcgattt ctttagaatg cggagacagg agatcaaggc ccagaagaag 480

gcacagagct ccaccgac 498

<210> 42

<211> 498

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

tctgaggtgg agttttccca cgagtactgg atgagacatg ccctgaccct ggccaagagg 60

gcacgcgatg agagggaggt gcctgtggga gccgtgctgg tgctgaacaa tagagtgatc 120

ggcgagggct ggaacagagc catcggcctg cacgacccaa cagcccatgc cgaaattatg 180

gccctgagac agggcggcct ggtcatgcag aactacagac tgattgacgc caccctgtac 240

gtgacattcg agccttgcgt gatgtgcgcc ggcgccatga tccactctag gatcggccgc 300

gtggtgtttg gcgtgaggaa cgcaaaaacc ggcgccgcag gctccctgat ggacgtgctg 360

cactaccccg gcatgaatca ccgcgtcgaa attaccgagg gaatcctggc agatgaatgt 420

gccgccctgc tgtgctattt ctttcggatg cctagacagg tgttcaatgc tcagaagaag 480

gcccagagct ccaccgac 498

<210> 43

<211> 4101

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 60

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940

caccacgccc acgacgccta cctaaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080

ctgtctcagc tgggaggtga c 4101

<210> 44

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtc 57

<210> 45

<211> 96

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

tctggaggat ctagcggagg atcctctgga agcgagacac caggcacaag cgagtccgcc 60

acaccagaga gctccggcgg ctcctccgga ggatcc 96

<210> 46

<211> 96

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

tctggaggat ctagcggagg atcctctgga agcgagacac caggcacaag cgagtccgcc 60

acaccagaga gctccggcgg ctcctccgga ggatcc 96

<210> 47

<211> 5409

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtctct 60

gaagtcgagt ttagccacga gtattggatg aggcacgcac tgaccctggc aaagcgagca 120

tgggatgaaa gagaagtccc cgtgggcgcc gtgctggtgc acaacaatag agtgatcgga 180

gagggatgga acaggccaat cggccgccgc gaccctaccg cacacgcaga gatcatggca 240

ctgaggcagg gaggcctggt catgcagaat taccgcctga tcgatgccac cctgtatgtg 300

acactggagc catgcgtgat gtgcgcagga gcaatgatcc acagcaggat cggaagagtg 360

gtgttcggag cacgggacgc caagaccggc gcagcaggct ccctgatgga tgtgctgcac 420

caccccggca tgaaccaccg ggtggagatc acagagggaa tcctggcaga cgagtgcgcc 480

gccctgctga gcgatttctt tagaatgcgg ccacaggaga tcaaggccca gaagaaggca 540

cagagctcca ccgactctgg aggatctagc ggaggatcct ctggaagcga gacaccaggc 600

acaagcgagt ccgccacacc agagagctcc ggcggctcct ccggaggatc ctctgaggtg 660

gagttttccc acgagtactg gatgagacat gccctgaccc tggccaagag ggcacgcgat 720

gagagggagg tgcctgtggg agccgtgctg gtgctgaaca atagagtgat cggcgagggc 780

tggaacagag ccatcggcct gcgcgaccca acagcccatg ccgaaattat ggccctgaga 840

cagggcggcc tggtcatgca gaactacaga ctgattgacg ccaccctgta cgtgacattc 900

gagccttgcg tgatgtgcgc cggcgccatg atccactcta ggatcggccg cgtggtgttt 960

ggcgtgagga acgcaaaaac cggcgccgca ggctccctga tggacgtgct gcactacccc 1020

ggcatgaatc accgcgtcga aattaccgag ggaatcctgg cagatgaatg tgccgccctg 1080

ctgtgctatt tctttcggat gcctagacag gtgttcaatg ctcagaagaa ggcccagagc 1140

tccaccgact ccggaggatc tagcggaggc tcctctggct ctgagacacc tggcacaagc 1200

gagagcgcaa cacctgaaag cagcgggggc agcagcgggg ggtcagacaa gaagtacagc 1260

atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga cgagtacaag 1320

gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat caagaagaac 1380

ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg gctgaagaga 1440

accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca agagatcttc 1500

agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga gtccttcctg 1560

gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt ggacgaggtg 1620

gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt ggacagcacc 1680

gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa gttccggggc 1740

cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa gctgttcatc 1800

cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc cagcggcgtg 1860

gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga aaatctgatc 1920

gcccagctgc ccggcgagaa gaagaatggc ctgttcggaa acctgattgc cctgagcctg 1980

ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa actgcagctg 2040

agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg cgaccagtac 2100

gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag cgacatcctg 2160

agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa gagatacgac 2220

gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct gcctgagaag 2280

tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat tgacggcgga 2340

gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat ggacggcacc 2400

gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg gaccttcgac 2460

aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct gcggcggcag 2520

gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat cctgaccttc 2580

cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc ctggatgacc 2640

agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga caagggcgct 2700

tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc caacgagaag 2760

gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga gctgaccaaa 2820

gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga gcagaaaaag 2880

gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca gctgaaagag 2940

gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt ggaagatcgg 3000

ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga caaggacttc 3060

ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct gacactgttt 3120

gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt cgacgacaaa 3180

gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag ccggaagctg 3240

atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct gaagtccgac 3300

ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac ctttaaagag 3360

gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca cattgccaat 3420

ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt ggtggacgag 3480

ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat ggccagagag 3540

aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg gatcgaagag 3600

ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa cacccagctg 3660

cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta cgtggaccag 3720

gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc tcagagcttt 3780

ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa ccggggcaag 3840

agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg gcggcagctg 3900

ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc cgagagaggc 3960

ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga aacccggcag 4020

atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta cgacgagaat 4080

gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt gtccgatttc 4140

cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca cgcccacgac 4200

gcctacctaa acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa gctggaaagc 4260

gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc caagagcgag 4320

caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat gaactttttc 4380

aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat cgagacaaac 4440

ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt gcggaaagtg 4500

ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg cggcttcagc 4560

aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa gaaggactgg 4620

gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt gctggtggtg 4680

gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct gctggggatc 4740

accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga agccaagggc 4800

tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct gttcgagctg 4860

gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg aaacgaactg 4920

gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga gaagctgaag 4980

ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa gcactacctg 5040

gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc cgacgctaat 5100

ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag agagcaggcc 5160

gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc cttcaagtac 5220

tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct ggacgccacc 5280

ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc tcagctggga 5340

ggtgactctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 5400

aggaaagtc 5409

Claims

1.一种融合蛋白，包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段，所述ecTadA-ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。

2.如权利要求1所述的融合蛋白，其特征在于，所述ecTadA片段的氨基酸序列包括：

a)如SEQ ID NO.41所示的氨基酸序列；或，

3.如权利要求1所述的融合蛋白，其特征在于，所述ecTadA*片段的氨基酸序列包括：

c)如SEQ ID NO.42所示的氨基酸序列；或，

4.如权利要求1所述的融合蛋白，其特征在于，所述SpCas9-D10A nickase片段的氨基酸序列包括：

e)如SEQ ID NO.43所示的氨基酸序列；或，

5.如权利要求1所述的融合蛋白，其特征在于，所述融合蛋白自N端至C端依次包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段；

和/或，所述ecTadA-ecTadA*二聚体片段自N端至C端依次包括ecTad片段和ecTadA*片段。

6.如权利要求1所述的融合蛋白，其特征在于，所述融合蛋白还包括核定位信号片段，优选的，所述核定位信号片段位于ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段的N端和/或C端，优选的，所述核定位信号片段的氨基酸序列如SEQ ID NO.44所示；

7.如权利要求1所述的融合蛋白，其特征在于，所述融合蛋白的氨基酸序列如SEQ IDNo.47所示。

8.一种分离的多核苷酸，编码如权利要求1～7任一权利要求所述的融合蛋白。

9.一种构建体，所述构建体含有如权利要求8所述的分离的多核苷酸。

10.一种表达系统，所述表达系统含有如权利要求9所述的构建体或基因组中整合有外源的如权利要求8所述的多核苷酸。

11.如权利要求10所述的表达系统，其特征在于，所述表达系统的宿主细胞选自真核细胞或原核细胞，优选选自小鼠细胞、人细胞，更优选选自小鼠脑神经瘤细胞、人胚胎肾细胞、或人宫颈癌细胞、人结肠癌细胞、人骨肉瘤细胞，更优选选自N2a细胞、HEK293FT细胞、Hela细胞、HCT116细胞、或U2OS细胞。

12.如权利要求1～7任一权利要求所述的融合蛋白、如权利要求8所述的分离的多核苷酸、如权利要求9所述的构建体或如权利要求10～11任一权利要求所述的表达系统在基因编辑中的用途。

13.如权利要求12所述的用途，其特征在于，所述用途具体为在真核生物的基因编辑中的用途。

14.一种碱基编辑体系，包括如权利要求1～7任一权利要求所述的融合蛋白，所述碱基编辑体系还包括sgRNA。

15.一种基因编辑方法，包括：通过如权利要求1～7任一权利要求所述的融合蛋白、或如权利要求14所述的碱基编辑体系进行基因编辑。