CN110564752B

CN110564752B - 差异代理技术在c·t碱基替换细胞富集中的应用

Info

Publication number: CN110564752B
Application number: CN201910938686.1A
Authority: CN
Inventors: 杨进孝; 徐雯; 杨永星; 康桂婷; 武莹; 李璐
Original assignee: Beijing Academy of Agriculture and Forestry Sciences
Current assignee: Beijing Academy of Agriculture and Forestry Sciences
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-07-16
Anticipated expiration: 2039-09-30
Also published as: CN110564752A

Abstract

本发明公开了差异代理技术在C·T碱基替换细胞富集中的应用。本发明的差异代理技术载体包括如下试剂：sgRNA、C·T碱基替换系统和功能丧失的筛选剂抗性基因；sgRNA由靶向目标基因靶点序列的esgRNA和靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA组成；C·T碱基替换系统在靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复。本发明实现了细胞水平上C·T碱基替换细胞富集，大大提高C·T碱基替换效率。

Description

差异代理技术在C·T碱基替换细胞富集中的应用

技术领域

本发明涉及生物技术领域，具体涉及差异代理技术在C·T碱基替换细胞富集中的应用。

背景技术

CRISPR-Cas9技术已经成为强有力的基因组编辑手段，被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上，切割产生DNA双链断裂(dsDNA break，DSB)，而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种，一种是非同源末端连接(non-homologous end joining，NHEJ)，另一种是同源重组(homology-directed repair，HDR)。通常情况下NHEJ占大多数，因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换，因为HDR效率低以及需要DNA模板，所以使用HDR实现碱基精确替换的应用受到很大的限制。

2016年，David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor，CBE)，分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey)，原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine，C)碱基进行编辑，而不再通过产生DSB和启动HDR修复，大大提高了C替换为胸腺嘧啶(Thymine，T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过sgRNA定位到靶点，rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil，U)，通过DNA的修复使得U与腺嘌呤(Adenine，A)配对，又通过DNA复制，最终使得T与A配对，从而实现了C到T的转换。在所测试的编辑器中，SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor，UGI))的平均突变率较高，原因有二：一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase，UDG)催化清除DNA中U，二是SpCas9n(D10A)在非编辑链上产生切口，诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制，促使U:G错配更多的偏好性修复成U:A。

目前，在植物中通过报告基因介导的细胞富集技术富集C·T碱基替换细胞的研究非常有限，尚无利用转化过程中所使用的筛选标记在细胞水平上实现C·T碱基替换细胞的富集，进而提高C·T碱基替换效率的报道。

发明内容

本发明的目的是提供差异代理技术在C·T碱基替换的细胞富集中的应用，本发明的差异代理技术能够在细胞水平上实现C·T碱基替换细胞的富集，进而提高目标靶点的C·T碱基替换效率。

为了实现上述目的，本发明首先提供了一种成套试剂，所述成套试剂包括sgRNA或与所述sgRNA相关的生物材料、C·T碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料；

所述sgRNA由靶向目标基因靶点序列的esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成；

所述靶向目标基因靶点序列的esgRNA结构如下：所述目标基因靶点序列转录的RNA-esgRNA骨架；

所述靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA结构如下：所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架；

所述C·T碱基替换系统包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料；

所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复；

所述sgRNA骨架为S1)或S2)或S3)：

S1)将序列1第571-646位中的T替换为U得到的RNA分子；

S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

S3)与S1)或S2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子；

所述esgRNA骨架为T1)或T2)或T3)：

T1)将序列11中的T替换为U得到的RNA分子；

T2)将T1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

T3)与T1)或T2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子。

上述成套试剂中，所述sgRNA具体可为tRNA-sgRNA；所述tRNA-sgRNA由靶向目标基因靶点序列的tRNA-esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA组成；

所述靶向目标基因靶点序列的tRNA-esgRNA结构如下：tRNA-所述目标基因靶点序列转录的RNA-esgRNA骨架；

所述靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA结构如下：tRNA-所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架；

所述tRNA为R1)或R2)或R3)：

R1)将序列1第474-550位中的T替换为U得到的RNA分子；

R2)将R1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

R3)与R1)或R2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子。

上述成套试剂中，靶向所述目标基因靶点序列的个数可为一个或两个或多个；靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp，进一步可为18-22bp，更进一步可为20bp。

所述功能丧失的筛选剂抗性基因满足如下条件：所述功能丧失的筛选剂抗性基因功能或活性丧失，且通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。所述功能丧失的筛选剂抗性基因靶点序列可为功能丧失的筛选剂抗性基因序列上的靶点序列(位于功能丧失的筛选剂抗性基因序列内部)，也可为额外添加在功能丧失的筛选剂抗性基因序列内部或5’端或3’端的靶点序列。当为了使功能丧失的筛选剂抗性基因在进行C·T碱基替换后可恢复功能而在其序列上额外添加了靶点靶序列(记作代理靶点靶序列)时，所述功能丧失的筛选剂抗性基因序列不仅包括功能丧失的筛选剂抗性基因本身，还包括代理靶点靶序列以及如果需要，为了保证添加代理靶点靶序列后筛选剂抗性基因能够在正常读码框内翻译再额外添加的一个或两个或多个碱基。

进一步的，所述功能丧失的筛选剂抗性基因可为将筛选剂抗性基因的起始密码子(如ATG)删除，且在筛选剂抗性基因5’端添加代理靶点靶序列后得到的序列。所述代理靶点靶序列满足如下条件即可：通过C·T碱基替换系统对所述代理靶点靶序列进行C·T碱基替换后可使所述功能丧失的筛选剂抗性基因功能恢复。代理靶点靶序列依次由功能丧失的筛选剂抗性基因靶点序列和PAM序列组成。需要注意的是，为了保证添加代理靶点靶序列后，去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译，可在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间再添加一个或两个或多个碱基。

在本发明的一个具体实施例中，所述代理靶点靶序列为序列1第11305-11327位。所述功能丧失的筛选剂抗性基因靶点序列为序列1第11305-11324位。所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的向导下，可通过对所述代理靶点靶序列进行C·T碱基替换，使代理靶点靶序列第5位碱基C突变为碱基T，形成ATG，进而使筛选标记基因功能恢复。需要注意的是，为了保证添加代理靶点靶序列后，去除起始密码子的筛选剂抗性基因能够在正常读码框内翻译，此处在代理靶点靶序列和去除起始密码子的筛选剂抗性基因之间又添加了一个碱基C。

在本发明的另一个具体实施例中，所述代理靶点靶序列为序列10。所述功能丧失的筛选剂抗性基因靶点序列为序列10第1-20位。所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的向导下，可通过对所述代理靶点靶序列进行C·T碱基替换，使代理靶点靶序列第7位碱基C突变为碱基T，形成ATG，进而使筛选标记基因功能恢复。

更进一步的，所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因，如Bar/PAT草铵膦-N-乙酰转移酶基因、PMI 6-磷酸甘露糖异构酶基因、EPSPS 5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中，所述筛选剂抗性基因为潮霉素抗性基因。

上述成套试剂中，所述C·T碱基替换系统还包括UGI或与所述UGI相关的生物材料。

上述成套试剂中，所述Cas9核酸酶包括不同来源的Cas9核酸酶或其变体、dead失活酶(dead Cas9，dCas9)或其变体、nickase切刻酶(Cas9 nickase，Cas9n)或其变体。所述不同来源的Cas9核酸酶或其变体包括来源于细菌的Cas9(如SaCas9、SaCas9-KKH等)，Cas9-PAM变体(如xCas9、NG Cas9、Cas9-VQR、Cas9-VRER等)，Cas9高保真酶变体(如HypaCas9、eSpCas9(1.1)、Cas9-HF1等)等。在本发明的一个具体实施例中，所述Cas9核酸酶为Cas9n，具体为SpCas9n蛋白质。在本发明的另一个具体实施例中，所述Cas9核酸酶为Cas9n，具体为HypaCas9n蛋白质。

所述胞嘧啶脱氨酶可为hAPOBE3A蛋白质、human AID蛋白质、PmCDA1蛋白质或rAPOBEC1蛋白质。在本发明的一个具体实施例中，所述胞嘧啶脱氨酶为PmCDA1蛋白质。在本发明的另一个具体实施例中，所述胞嘧啶脱氨酶为rAPOBEC1蛋白质。

进一步的，所述SpCas9n蛋白质为A1)或A2)或A3)：

A1)氨基酸序列是序列2所示的蛋白质；

A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质；

与所述SpCas9n相关的生物材料为B1)至B5)中的任一种：

B1)编码所述SpCas9n的核酸分子；

B2)含有B1)所述核酸分子的表达盒；

B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体；

B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物；

B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系；

所述HypaCas9n蛋白质为C1)或C2)或C3)：

C1)氨基酸序列是序列7所示的蛋白质；

C2)将序列表中序列7所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质；

与所述HypaCas9n相关的生物材料为D1)至D5)中的任一种：

D1)编码所述HypaCas9n的核酸分子；

D2)含有D1)所述核酸分子的表达盒；

D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体；

D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物；

D5)含有D1)所述核酸分子的转基因细胞系、或含有D2)所述表达盒的转基因细胞系；

所述PmCDA1蛋白质为E1)或E2)或E3)：

E1)氨基酸序列是序列3所示的蛋白质；

E2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质；

与所述PmCDA1蛋白质相关的生物材料为F1)至F5)中的任一种：

F1)编码所述PmCDA1蛋白质的核酸分子；

F2)含有F1)所述核酸分子的表达盒；

F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体；

F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物；

F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系；

所述rAPOBEC1蛋白质为G1)或G2)或G3)：

G1)氨基酸序列是序列12所示的蛋白质；

G2)将序列表中序列12所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

G3)在G1)或G2)的N端或/和C端连接标签得到的融合蛋白质；

与所述rAPOBEC1蛋白质相关的生物材料为H1)至H5)中的任一种：

H1)编码所述rAPOBEC1蛋白质的核酸分子；

H2)含有H1)所述核酸分子的表达盒；

H3)含有H1)所述核酸分子的重组载体、或含有H2)所述表达盒的重组载体；

H4)含有H1)所述核酸分子的重组微生物、或含有H2)所述表达盒的重组微生物、或含有H3)所述重组载体的重组微生物；

H5)含有H1)所述核酸分子的转基因细胞系、或含有H2)所述表达盒的转基因细胞系；

所述UGI蛋白质为I1)或I2)或I3)：

I1)氨基酸序列是序列4所示的蛋白质；

I2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

I3)在I1)或I2)的N端或/和C端连接标签得到的融合蛋白质；

与所述UGI蛋白质相关的生物材料为J1)至J5)中的任一种：

J1)编码所述UGI蛋白质的核酸分子；

J2)含有J1)所述核酸分子的表达盒；

J3)含有J1)所述核酸分子的重组载体、或含有J2)所述表达盒的重组载体；

J4)含有J1)所述核酸分子的重组微生物、或含有J2)所述表达盒的重组微生物、或含有J3)所述重组载体的重组微生物；

J5)含有J1)所述核酸分子的转基因细胞系、或含有J2)所述表达盒的转基因细胞系；

与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种：

K1)含有所述功能丧失的筛选剂抗性基因的表达盒；

K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体；

K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物；

K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。

为了使A1)、C1)、E1)、G1)、I1)中的蛋白质便于纯化，可在由序列表中序列2或序列3或序列4或序列7或序列12所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。

表、标签的序列

标签	残基	序列
			Poly-Arg	5-6(通常为5个)	RRRRR
Poly-His	2-10(通常为6个)	HHHHHH
			FLAG	8	DYKDDDDK
Strep-tag II	8	WSHPQFEK
			c-myc	10	EQKLISEEDL

上述A2)、C2)、E2)、G2)、I2)中的蛋白质，为与序列2或序列3或序列4或序列7或序列12所示蛋白质的氨基酸序列具有75％或75％以上同一性且具有相同功能的蛋白质。所述具有75％或75％以上同一性为具有75％、具有80％、具有85％、具有90％、具有95％、具有96％、具有97％、具有98％或具有99％的同一性。

上述A2)、C2)、E2)、G2)、I2)中的蛋白质可人工合成，也可先合成其编码基因，再进行生物表达得到。

上述A2)、C2)、E2)、G2)、I2)中的蛋白质的编码基因可通过将序列1的第3529-7797位(编码序列2所示的蛋白质)、序列1的第8089-8712位(编码序列3所示的蛋白质)、序列1的第8734-9030位(编码序列4所示的蛋白质)、序列6(编码序列7所示的蛋白质)或序列9的第1-687位(编码序列12所示的蛋白质)所示的DNA序列中缺失一个或几个氨基酸残基的密码子，和/或进行一个或几个碱基对的错义突变，和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。

更进一步的，B1)所述核酸分子为b1)或b2)或b3)：

b1)序列表中序列1第3529-7797位所示的cDNA分子或DNA分子；

b2)与b1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述SpCas9n的cDNA分子或DNA分子；

b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交，且编码所述SpCas9n的cDNA分子或DNA分子；

D1)所述核酸分子为d1)或d2)或d3)：

d1)序列表中序列6所示的cDNA分子或DNA分子；

d2)与d1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述HypaCas9n的cDNA分子或DNA分子；

d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交，且编码所述HypaCas9n的cDNA分子或DNA分子；

F1)所述核酸分子为f1)或f2)或f3)：

f1)序列表中序列1第8089-8712位所示的cDNA分子或DNA分子；

f2)与f1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述PmCDA1的cDNA分子或DNA分子；

f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交，且编码所述PmCDA1的cDNA分子或DNA分子；

H1)所述核酸分子为h1)或h2)或h3)：

h1)序列表中序列9第1-687位所示的cDNA分子或DNA分子；

h2)与h1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述rAPOBEC1的cDNA分子或DNA分子；

h3)在严格条件下与h1)或h2)限定的核苷酸序列杂交，且编码所述rAPOBEC1的cDNA分子或DNA分子；

J1)所述核酸分子为j1)或j2)或j3)：

j1)序列表中序列1第8734-9030位所示的cDNA分子或DNA分子；

j2)与j1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述UGI的cDNA分子或DNA分子；

j3)在严格条件下与j1)或j2)限定的核苷酸序列杂交，且编码所述UGI的cDNA分子或DNA分子；

K1)所述功能丧失的筛选剂抗性基因为序列1第11305-12351位所示的DNA分子或将序列1第11305-12351位所示DNA分子中的第11305-11328替换为序列10，且保持其他序列不变后得到的序列。

其中，所述核酸分子可以是DNA，如cDNA、基因组DNA或重组DNA；所述核酸分子也可以是RNA，如mRNA或hnRNA等。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化和点突变的方法，对本发明的编码所述SpCas9n或所述HypaCas9n或所述PmCDA1或所述rAPOBEC1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明的所述SpCas9n或所述HypaCas9n或所述PmCDA1或所述rAPOBEC1或所述UGI的核苷酸序列75％或者更高同一性的核苷酸，只要编码所述SpCas9n或所述HypaCas9n或所述PmCDA1或所述rAPOBEC1或所述UGI且具有相同功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3、4、7或12所示的氨基酸序列组成的蛋白质的核苷酸序列具有75％或更高，或85％或更高，或90％或更高，或95％或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件，两个或多个序列之间的同一性可以用百分比(％)表示，其可以用来评价相关序列之间的同一性。

所述严格条件是在2×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次5min，又于0.5×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次15min；或，0.1×SSPE(或0.1×SSC)、0.1％SDS的溶液中，65℃条件下杂交并洗膜。

上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。

B2)所述的含有编码SpCas9n蛋白质的核酸分子的表达盒(SpCas9n基因表达盒)，是指能够在宿主细胞中表达SpCas9n蛋白质的DNA，该DNA不但可包括启动SpCas9n基因转录的启动子，还可包括终止SpCas9n基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述SpCas9n基因表达盒的重组载体。

D2)所述的含有编码HypaCas9n蛋白质的核酸分子的表达盒(HypaCas9n基因表达盒)，是指能够在宿主细胞中表达HypaCas9n蛋白质的DNA，该DNA不但可包括启动HypaCas9n基因转录的启动子，还可包括终止HypaCas9n基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述HypaCas9n基因表达盒的重组载体。

F2)所述的含有编码PmCDA1蛋白质的核酸分子的表达盒(PmCDA1基因表达盒)，是指能够在宿主细胞中表达PmCDA1蛋白质的DNA，该DNA不但可包括启动PmCDA1基因转录的启动子，还可包括终止PmCDA1基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述PmCDA1基因表达盒的重组载体。

H2)所述的含有编码rAPOBEC1蛋白质的核酸分子的表达盒(rAPOBEC1基因表达盒)，是指能够在宿主细胞中表达rAPOBEC1蛋白质的DNA，该DNA不但可包括启动rAPOBEC1基因转录的启动子，还可包括终止rAPOBEC1基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述rAPOBEC1基因表达盒的重组载体。

J2)所述的含有编码UGI蛋白质的核酸分子的表达盒(UGI基因表达盒)，是指能够在宿主细胞中表达UGI蛋白质的DNA，该DNA不但可包括启动UGI基因转录的启动子，还可包括终止UGI基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述UGI基因表达盒的重组载体。

所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中，所述重组载体具体为DisSUGs-1重组表达载体或DisSUGs-2重组表达载体。

所述DisSUGs-1重组表达载体的序列为将序列1第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位的sgRNA核苷酸序列均替换为序列11(esgRNA核苷酸序列)，且保持其他序列不变后得到的序列。

所述DisSUGs-2重组表达载体的序列为将DisSUGs-1重组表达载体中第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列：ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

所述微生物可为酵母、细菌、藻或真菌。其中，所述细菌可为农杆菌，如农杆菌EHA105。在本发明的具体实施例中，所述重组微生物具体为含有所述DisSUGs-1重组表达载体或所述DisSUGs-2重组表达载体的农杆菌EHA105。

所述转基因细胞系不包括繁殖材料。

上述成套试剂具有如下用途：

M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞；

M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品；

M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率；

M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品；

M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换；

M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。

上述sgRNA或与所述sgRNA相关的生物材料也属于本发明的保护范围。

为了实现上述目的，本发明还提供了上述成套试剂或上述sgRNA或与所述sgRNA相关的生物材料的新用途。

本发明提供了上述成套试剂或上述sgRNA或与所述sgRNA相关的生物材料在M1)-M6)任一种中的应用：

M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换；

M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。

为了实现上述目的，本发明还提供了N1)或N2)或N3)或N4)或N5)所述的方法：

N1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述esgRNA、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N2)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述esgRNA、所述sgRNA和所述胞嘧啶脱氨酶均得到表达；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N3)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N4)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N5)生物突变体的制备方法，包括如下步骤：按照N1)或N2)或N3)或N4)所述的方法对生物体的基因组进行编辑，获得生物突变体；所述生物突变体为发生C·T碱基替换的生物体。

上述方法中，所述转录靶向目标基因靶点序列的esgRNA的DNA分子为转录靶向目标基因靶点序列的tRNA-esgRNA的DNA分子，所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子为转录靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的DNA分子。进一步的，所述转录靶向目标基因靶点序列的tRNA-esgRNA的DNA分子或所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的DNA分子转录后得到的tRNA-esgRNA或tRNA-sgRNA均为不成熟的RNA前体，该RNA前体中的tRNA会被两种酶(RNase P和RNase Z)切割掉后得到成熟的RNA。一个重组表达载体中有多少个靶点，就会得到多少个独立的成熟的RNA，每个成熟的RNA依次由所述靶点序列转录的RNA和所述esgRNA骨架(或sgRNA骨架)组成，或依次由所述tRNA残留的个别碱基、所述靶点序列转录的RNA和所述esgRNA骨架(或sgRNA骨架)组成。

上述方法中，所述N1)或N3)中，所述UGI的个数可为一个或两个或多个。在本发明的具体实施例中，所述UGI的个数具体为一个。

上述方法中，所述N1)中，所述Cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的esgRNA的DNA分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、所述胞嘧啶脱氨酶的编码基因和所述UGI的编码基因通过含有所述Cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的esgRNA的DNA分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子的表达盒、所述胞嘧啶脱氨酶的编码基因的表达盒和所述UGI的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内，也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。

在本发明的具体实施例中，上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内，所述重组表达载体具体为上述DisSUGs-1重组表达载体或上述DisSUGs-2重组表达载体。

上述成套试剂或应用或方法中，所述C·T碱基替换为碱基C突变为碱基T。所述碱基C可为位于所述靶点序列中任意位置的碱基C。

上述成套试剂或应用或方法中，所述生物体为P1)或P2)或P3)或P4)：

P1)植物或动物；

P2)单子叶植物或双子叶植物；

P3)禾本科植物；

P4)水稻(如日本晴水稻)；

所述生物细胞为Q1)或Q2)或Q3)或Q4)：

Q1)植物细胞或动物细胞；

Q2)单子叶植物细胞或双子叶植物细胞；

Q3)禾本科植物细胞；

Q4)水稻细胞(如日本晴水稻细胞)。

本发明的差异代理技术原理如下：将优化的esgRNA应用于C·T碱基替换的细胞富集技术中，使用优化的esgRNA编辑基因组内源目标基因靶点序列，使用sgRNA编辑报告基因的代理靶点序列，进一步提高内源目标基因靶点序列的C·T碱基替换效率。

所述C·T碱基替换的细胞富集技术原理如下：以失活的筛选剂抗性基因为报告基因，建立一种C·T碱基替换的细胞富集技术，使得报告基因上发生了C·T碱基替换的细胞能够在含有筛选剂的培养基中生长出来，没有发生C·T碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上，如果同时对内源目标基因靶点进行C·T碱基替换编辑，在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的C·T碱基替换，从而实现对内源目标基因靶点发生C·T碱基替换的细胞的富集，进而提高内源目标基因靶点的C·T碱基替换效率。

本发明具有以下优点：

1、有多种不同类型的基因可以作为报告基因，在植物中进行C·T碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系，使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集，比其余的如荧光报告基因、内源除草剂抗性基因等，更具有广谱性、通用性。

2、技术设计简便，其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中，以满足不同作物的不同转化筛选体系的需求。

3、本发明的差异代理技术对基于不同的脱氨酶介导的碱基编辑器或者是不同的Cas9酶介导的碱基编辑器的细胞富集技术均适用，均可实现细胞水平上C·T碱基替换细胞富集，大大提高C·T碱基替换效率。

附图说明

图1为非细胞富集技术载体sgRNA-GT结构示意图。

图2为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT结构示意图。

图3为细胞富集技术的工作原理示意图。

图4为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT和非细胞富集技术载体sgRNA-GT在抗性愈伤中对靶点的C·T碱基替换效率比较。

图5为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT和非细胞富集技术载体sgRNA-GT在T0苗中对靶点的C·T碱基替换效率比较。

图6为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT和非细胞富集技术载体sgRNA-GT在T0苗中对靶点的C·T碱基替换纯合替换效率比较。

图7为HypaCas9n&PmCDA1&UGI介导的细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT和非细胞富集技术载体HypaCas9n-sgRNA-GT结构示意图。

图8为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT和非细胞富集技术载体HypaCas9n-sgRNA-GT在T0苗中对靶点的C·T碱基替换效率比较。

图9为rAPOBEC1&Cas9n&UGI介导的细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT和非细胞富集技术载体r-sgRNA-GT结构示意图。

图10为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT和非细胞富集技术载体r-sgRNA-GT在T0苗中对靶点的C·T碱基替换效率比较。

图11为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT、DisSUGs和非细胞富集技术载体sgRNA-GT结构示意图。

图12为细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT与DisSUGs在T0苗中对靶点的C·T碱基替换效率比较。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂、仪器等，如无特殊说明，均可从商业途径得到。下述实施例中，如无特殊说明，序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸，末位均为相应DNA/RNA的3′末端核苷酸。

引物对T1由引物T1-F：5’-gtaagaaccaccagcgacac-3’和引物T1-R：5’-gtaattgtgcttggtgatgga-3’组成，用于扩增靶点ALS-T1。

引物对T2由引物T2-F：5’-aatatgccattcaggtgctgg-3’和引物T2-R：5’-atcataggcagcacatgctcc-3’组成，用于扩增靶点ALS-T2。

引物对T3由引物T3-F：5’-atggctacgaccgccgcgg-3’和引物T3-R：5’-gcctcaattttccctgtcacacgatc-3’组成，用于扩增靶点ALS-T3。

引物对T4由引物T4-F：5’-attgtggctcgtgctctacc-3’和引物T4-R：5’-agacacacccacaggaacatt-3’组成，用于扩增靶点DEP1。

引物对T5由引物T5-F：5’-cttcaaattctaatccccaatcc-3’和引物T5-R：5’-ggttgttgttgaggtttaggatc-3’组成，用于扩增靶点Waxy。

引物对T6由引物T6-F：5’-ttacgaactttataactttgtcgg-3’和引物T6-R：5’-atggaggcgatgaggaagac-3’组成，用于扩增靶点NRT1.1B-T1。

引物对T7由引物T7-F：5’-ctaatcctaccaattaacgagtcg-3’和引物T7-R：5’-accagttgaagaagcgcatc-3’组成，用于扩增靶点NRT1.1B-T2。

引物对T8由引物T8-F：5’-cctccatcctcctcaccg-3’和引物T8-R：5’-tgaccttgtggacgatggtg-3’组成，用于扩增靶点NRT1.1B-T3。

引物对T9由引物T9-F：5’-acatcgagatggagaagcgg-3’和引物T9-R：5’-ccatgctccaatcgatgaatac-3’组成，用于扩增靶点CDC48-T1。

引物对T10由引物T10-F：5’-agacaccatctgcattgttct-3’和引物T10-R：5’-ggatgtaagaaggcgacactag-3’组成，用于扩增靶点CDC48-T2。

引物对T11由引物T11-F：5’-gtagcttcaaattctaatcc-3’和引物T11-R：5’-ggaggccaccgaggacgtc-3’组成，用于扩增靶点Waxy-T2。

以下实施例中，C·T碱基替换是指靶点序列中任何位置的C突变为T。

C·T碱基替换效率＝发生C·T碱基替换的阳性抗性愈伤数(或阳性T0苗数)/分析的总阳性抗性愈伤数(或总阳性T0苗数)×100％。

C·T碱基替换纯合替换效率＝纯合突变的T0苗数/发生C·T碱基替换的T0苗总数×100％。纯合突变的T0苗定义为所有发生C·T碱基替换的位点均为纯合突变的T0苗。

日本晴水稻：参考文献：梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.；公众可以从北京市农林科学院获得。

恢复培养基：含有200mg/L特美汀的N6固体培养基。

筛选培养基：含有50mg/L潮霉素的N6固体培养基。

分化培养基：含有2mg/L KT、0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。

生根培养基：含有0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。

实施例1、C·T碱基替换的细胞富集技术的建立

一、C·T碱基替换的细胞富集技术载体的建立

将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的普通技术(非细胞富集技术)载体命名为sgRNA-GT。以Cas9核酸酶为SpCas9n，胞嘧啶脱氨酶为PmCDA1为例：sgRNA-GT载体的结构示意图如图1所示。

将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的细胞富集技术载体命名为sgRNA^-ATG-Hyg^-ATG/sgRNA-GT。以Cas9核酸酶为SpCas9n，胞嘧啶脱氨酶为PmCDA1为例：sgRNA^-ATG-Hyg^-ATG/sgRNA-GT载体的结构示意图如图2所示。

非细胞富集技术载体中含有完整的筛选剂抗性基因。细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行改造使其功能丧失，同时在sgRNA部分加入相应的代理靶点序列后得到的载体。

以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例：非细胞富集技术载体中的筛选剂抗性基因为完整的潮霉素抗性基因Hygromycin。细胞富集技术载体中的筛选剂抗性基因为功能丧失的潮霉素抗性基因Hygromycin(Hygromycin^-ATG)，功能丧失的潮霉素抗性基因Hygromycin(Hygromycin^-ATG)为将完整的潮霉素抗性基因Hygromycin去掉ATG，且在5’端添加代理靶点靶序列(含有PAM)后得到的序列。

其中，代理靶点靶序列(Efemp1突变靶点)可为如下序列：gcaacgagtggtgtggtgcctgg(斜体所示的碱基为PAM序列)，其为将来源于human cell的Efemp1基因的代理靶点原序列gcaaccagtggtgtggtgcctgg中的碱基C(下划线所示的碱基)突变为碱基G后得到的序列。

代理靶点靶序列(rAPOBEC1-sug)还可为如下序列：cggcgacggcgagcaagtggtgg(斜体所示的碱基为PAM序列)。

二、C·T碱基替换的细胞富集技术的工作原理

C·T碱基替换的细胞富集技术的工作原理如图3所示。以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例：在细胞富集技术中，由于潮霉素抗性基因Hygromycin去掉ATG后，抗性功能丧失，在潮霉素筛选培养基中，植物无法长出抗性愈伤，当细胞富集技术中的C·T碱基替换系统(由Cas9核酸酶、胞嘧啶脱氨酶和UGI组成的C·T碱基替换系统)在sgRNA向导下将代理靶点靶序列(Efemp1突变靶点)中的C5突变为T5(第5位碱基C突变为碱基T)或代理靶点靶序列(rAPOBEC1-sug)中的C7突变为T7(第7位碱基C突变为碱基T)，形成ATG后，能够使潮霉素抗性基因Hygromycin正常表达，抗性功能恢复，进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了C·T碱基替换，那么此细胞对应的内源基因发生C·T碱基替换的效率相对会更高，从而达到富集C·T碱基替换细胞的目的，实现提高植物内源靶点的C·T碱基替换效率。

实施例2、Cas9n&PmCDA1&UGI介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用

一、重组表达载体的构建

本实施例中的重组表达载体为Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的非细胞富集技术载体sgRNA-GT及Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的细胞富集技术载体sgRNA^-ATG-Hyg^-ATG/sgRNA-GT。各载体均为环状质粒。两种重组表达载体各元件结构示意图分别如图1和图2所示。

根据含有的靶点序列不同，每种重组表达载体又各自分成两种，共有如下四种重组表达载体：sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1重组表达载体、sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-2重组表达载体、sgRNA-GT-1重组表达载体、sgRNA-GT-2重组表达载体。

人工合成上述四种重组表达载体，四种重组表达载体的具体结构描述分别如下：

sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1重组表达载体的序列为序列表中的序列1。其中，序列1的第131-467位为OsU3启动子的核苷酸序列，第474-550位、第647-723位、第820-896位、第993-1069位、第1166-1242位、第1339-1415位均为tRNA的核苷酸序列，第551-570位、第724-743位、第897-916位、第1070-1089位、第1243-1262位分别为靶向OsALS、OsCDC48、OsNRT1.1B、OsWax、OsALS基因的五个靶点序列，第1416-1435位为报告基因代理靶点序列。第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位、第1436-1511位为sgRNA的核苷酸序列，第1512-1802位为OsU3终止子的核苷酸序列；序列1的第1809-3522位为OsUbq3启动子的核苷酸序列，第3529-7797位为SpCas9n蛋白质的编码序列(不含有终止密码子)，编码序列2所示的SpCas9n蛋白质；序列1的第8089-8712位为PmCDA1蛋白质的编码序列(不含有终止密码子)，编码序列3所示的PmCDA1蛋白质；序列1的第8734-9030位为UGI蛋白质的编码序列，编码序列4所示的UGI蛋白质；序列1的第9037-9231位为35S终止子的核苷酸序列，第9306-11298位为ZmUbi1启动子的核苷酸序列，第11305-11327位为代理靶点靶序列，第11329-12351位为去掉起始密码子的潮霉素磷酸转移酶的核苷酸序列，第12365-12617位为Nos终止子的核苷酸序列。sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1重组表达载体中六个靶点序列见表1，靶点分别为ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2、Efemp1。

sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-2重组表达载体的序列为将序列1中的五个靶点序列ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2依次分别替换为如下五个靶点序列：ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

sgRNA-GT-1重组表达载体的序列为将序列1第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列，且保持其他序列不变后得到的序列。

sgRNA-GT-2重组表达载体的序列为将sgRNA-GT-1重组表达载体中的五个靶点序列ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2依次分别替换为如下五个靶点序列：ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。

表1

二、水稻阳性抗性愈伤的获得

将步骤一获得的sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1载体，sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-2载体，sgRNA-GT-1载体和sgRNA-GT-2载体分别按照如下步骤1-8进行操作：

1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品，CAT#:AC1010)，得到重组农杆菌。

2、完成步骤1后，采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌，28℃，150rpm震荡培养至OD₆₀₀为1.0-2.0，室温条件下，10000rpm离心1min，用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖，葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD₆₀₀为0.2，得到农杆菌侵染液。

3、完成步骤2后，将水稻品种日本晴成熟种子去壳脱粒，置于100mL三角瓶中，加入70％(v/v)乙醇水溶液浸泡30sec，再置于25％(v/v)次氯酸钠水溶液中，120rpm震荡灭菌30min，无菌水冲洗3次，用滤纸吸干水分，然后将种子胚朝下置于N6固体培养基上，28℃暗培养4-6周，得到水稻愈伤。

4、完成步骤3后，将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体，乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl：50ml)中浸泡10min，然后，放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上，21℃暗培养1天。

5、取步骤4得到的水稻愈伤放入恢复培养基上，25-28℃暗培养3天。

6、取步骤5得到的水稻愈伤，置于筛选培养基上，28℃暗培养2周。

7、取步骤6得到的水稻愈伤，再次置于筛选培养基上，28℃暗培养2周，得到水稻抗性愈伤。

8、分别提取20-24块水稻抗性愈伤的基因组DNA并以其作为模板，采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增，得到PCR扩增产物；将该PCR扩增产物进行琼脂糖凝胶电泳，然后进行如下判断：如果PCR扩增产物中含有约1150bp的DNA片段，则相应的水稻抗性愈伤为水稻阳性抗性愈伤；如果PCR扩增产物中不含有约1150bp的DNA片段，则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。

三、水稻阳性T0苗的获得

1、将步骤一获得的sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1载体，sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-2载体，sgRNA-GT-1载体和sgRNA-GT-2载体分别按照步骤二的1-7进行操作，得到水稻抗性愈伤。

2、取步骤1得到的水稻抗性愈伤放入分化培养基上，25℃光照培养1个月左右，将分化出来的小苗移至生根培养基上，25℃光照培养2周，获取水稻T0苗。

3、分别提取步骤2得到的水稻T0苗的基因组DNA并以其作为模板，采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增，得到PCR扩增产物；将该PCR扩增产物进行琼脂糖凝胶电泳，然后进行如下判断：如果PCR扩增产物中含有约1150bp的DNA片段，则相应的水稻T0苗为水稻阳性T0苗；如果PCR扩增产物中不含有约1150bp的DNA片段，则相应的水稻T0苗不为水稻阳性T0苗。

四、结果分析

一)、水稻愈伤中靶点的编辑情况

1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组DNA作为模板(独立侵染两次，获得平均值和方差)，对于ALS-T1靶点，采用引物对T1进行PCR扩增，得到PCR扩增产物；对于ALS-T2靶点，采用引物对T2进行PCR扩增，得到PCR扩增产物；对于ALS-T3靶点，采用引物对T3进行PCR扩增，得到PCR扩增产物；对于DEP1靶点，采用引物对T4进行PCR扩增，得到PCR扩增产物；对于Waxy靶点，采用引物对T5进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T1靶点，采用引物对T6进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T2靶点，采用引物对T7进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T3靶点，采用引物对T8进行PCR扩增，得到PCR扩增产物；对于CDC48-T1靶点，采用引物对T9进行PCR扩增，得到PCR扩增产物；对于CDC48-T2靶点，采用引物对T10进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性抗性愈伤数，计算得出C·T碱基替换效率，结果见图4。

结果表明：通过使用细胞富集技术载体(sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1载体，sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-2载体)，ALS-T1靶点中第3位C的C·T碱基替换效率从44％增加到75％；ALS-T2靶点中第4位C的C·T碱基替换效率从23％增加到68％；ALS-T3靶点中第3、4、5和6位C的平均C·T碱基替换效率从30％增加到75％；NRT1.1B-T3靶点中第3、4和5位C的平均C·T碱基替换效率从40％增加到75％；NRT1.1B-T2靶点中第8、9、11和12位C的平均C·T碱基替换效率从5％增加到15％；Waxy靶点中第11位C的C·T碱基替换效率从2.5％增加到20％；CDC48-T1靶点中第3和4位C的平均C·T碱基替换效率从36％增加到77％；CDC48-T2靶点中第3位C的C·T碱基替换效率从0增加到15％；NRT1.1B-T1靶点中第4位C的C·T碱基替换效率从44％增加到66％。综上所述，通过使用细胞富集技术大部分靶点的C·T碱基替换效率提升至非细胞富集技术的1.5-8倍。

二)、水稻T0苗中靶点的编辑情况

1、分别取步骤三所获得的sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1载体，sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-2载体，sgRNA-GT-1载体和sgRNA-GT-2载体的水稻阳性T0苗的基因组DNA作为模板，对于ALS-T1靶点，采用引物对T1进行PCR扩增，得到PCR扩增产物；对于ALS-T2靶点，采用引物对T2进行PCR扩增，得到PCR扩增产物；对于ALS-T3靶点，采用引物对T3进行PCR扩增，得到PCR扩增产物；对于DEP1靶点，采用引物对T4进行PCR扩增，得到PCR扩增产物；对于Waxy靶点，采用引物对T5进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T1靶点，采用引物对T6进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T2靶点，采用引物对T7进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T3靶点，采用引物对T8进行PCR扩增，得到PCR扩增产物；对于CDC48-T1靶点，采用引物对T9进行PCR扩增，得到PCR扩增产物；对于CDC48-T2靶点，采用引物对T10进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数，计算得出C·T碱基替换效率。

C·T碱基替换效率分析结果如图5所示。结果表明：在T0苗中，与非细胞富集技术相比，ALS-T1靶点的C·T碱基替换效率由40％增加到66.7％，ALS-T2靶点的C·T碱基替换效率由20.7％增加到63.3％，ALS-T3靶点的C·T碱基替换效率由23.3％增加到47.8％，NRT1.1B-T2靶点的C·T碱基替换效率由50％增加到60％，NRT1.1B-T3靶点的C·T碱基替换效率由30％增加到36.7％，CDC48-T1靶点的C·T碱基替换效率由39.3％增加到56.7％，CDC48-T2靶点的C·T碱基替换效率由13.3％增加到33.3％。除了Waxy和NRT1.1B-T1靶点的替换效率保持不变以外，细胞富集技术增加了大部分靶点的C·T碱基替换效率，平均C·T碱基替换效率从36％增加到49％。

C·T碱基替换纯合替换效率分析结果如图6所示。结果表明：在T0苗中，有5个靶点的纯合C·T碱基替换效率增加。具体的，ALS-T1的纯合替换效率由8.3％增加到45％，ALS-T2的纯合替换效率由16.7％增加到35.3％，ALS-T3的纯合替换效率由0增加到9.1％，NRT1.1B-T3的纯合替换效率由0增加到9.1％，CDC48-T1的纯合替换效率由18.2％增加到37.5％。其余靶点的纯合替换率几乎未改变。综上所述，与非细胞富集技术相比，细胞富集技术能够增加部分靶点的纯合替换效率。

实施例3、HypaCas9n&PmCDA1&UGI介导的细胞富集技术载体的构建及其在水稻T0苗基因组编辑中的应用

一、重组表达载体的构建

本实施例中的重组表达载体为HypaCas9n&PmCDA1&UGI(HypaCas9-PCBE)介导的C·T碱基替换的非细胞富集技术载体(命名为HypaCas9n-sgRNA-GT)及HypaCas9n&PmCDA1&UGI(HypaCas9-PCBE)介导的细胞富集技术载体(命名为sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT)。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图7所示。载体主要结构与Cas9n&PmCDA1&UGI介导的非细胞富集技术载体和细胞富集技术载体相似，二者区别仅在于使用HypaCas9n代替SpCas9n。HypaCas9n&PmCDA1&UGI介导的细胞富集技术工作原理与Cas9n&PmCDA1&UGI介导的细胞富集技术相同。

根据含有的靶点序列不同，每种重组表达载体又各自分成两种，共有如下四种重组表达载体：sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-1重组表达载体，sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-2重组表达载体，HypaCas9n-sgRNA-GT-1重组表达载体，HypaCas9n-sgRNA-GT-2重组表达载体。

sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-1重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列(编码序列7所示的HypaCas9n蛋白质)，且保持其他序列不变后得到的序列。

sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-2重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列，且将第131-1802位替换为序列8，且保持其他序列不变后得到的序列。其中，序列8的第1-337位为OsU3启动子的核苷酸序列，第344-420位、第517-593位、第690-766位为tRNA序列，第441-516位、614-689位、787-862位为sgRNA序列，第421-440位为ALS-T3靶点序列，第594-613位为CDC48-T2靶点序列，第767-786位为Efemp1代理靶点序列，第863-1153位为OsU3终止子的核苷酸序列。对应的靶序列信息见表2。

HypaCas9n-sgRNA-GT-1重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列，且将第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列，且保持其他序列不变后得到的序列。

HypaCas9n-sgRNA-GT-2重组表达载体的序列为将序列1第3529-7797位所示的SpCas9n蛋白质的编码序列替换为序列6所示的HypaCas9n蛋白质的编码序列，且将第131-1802位替换为序列8，且将第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列，且保持其他序列不变后得到的序列。

各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表2所示。

表2

二、水稻阳性T0苗的获得

1、将步骤一获得的sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-1载体，sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-2载体，HypaCas9n-sgRNA-GT-1载体和HypaCas9n-sgRNA-GT-2载体分别按照实施例2中步骤二的1-7进行操作，得到水稻抗性愈伤。

2、取步骤1得到的水稻抗性愈伤按照实施例2中步骤2-3进行操作，得到水稻阳性T0苗及对应的基因组DNA。

三、结果分析

1、分别取步骤二所获得的sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-1载体，sgRNA^-ATG-Hyg^-ATG/HypaCas9n-sgRNA-GT-2载体，HypaCas9n-sgRNA-GT-1载体和HypaCas9n-sgRNA-GT-2载体的水稻阳性T0苗的基因组DNA作为模板，对于ALS-T1靶点，采用引物对T1进行PCR扩增，得到PCR扩增产物；对于ALS-T2靶点，采用引物对T2进行PCR扩增，得到PCR扩增产物；对于ALS-T3靶点，采用引物对T3进行PCR扩增，得到PCR扩增产物；对于Waxy靶点，采用引物对T5进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T1靶点，采用引物对T6进行PCR扩增，得到PCR扩增产物；对于CDC48-T1靶点，采用引物对T9进行PCR扩增，得到PCR扩增产物；对于CDC48-T2靶点，采用引物对T10进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数，计算得出C·T碱基替换效率，结果见图8。

结果表明：在T0苗中，与HypaCas9n&PmCDA1&UGI介导的非细胞富集技术HypaCas9n-sgRNA-GT相比，HypaCas9n&PmCDA1&UGI介导的细胞富集技术对所测的7个靶点均有不同程度的增效。ALS-T1的碱基替换效率由20％增加到50％，ALS-T2的碱基替换效率由5％增加到18.2％，ALS-T3的碱基替换效率由5％增加到11.8％，Waxy的碱基替换效率由15.8％增加到18.2％，NRT1.1B-T1的碱基替换效率由55％增加到81.8％，CDC48-T1的碱基替换效率由15％增加到33％，CDC48-T2的碱基替换效率由0增加到5.9％。

实施例4、rAPOBEC1&Cas9n&UGI介导的细胞富集技术载体及其在水稻T0苗基因组编辑中的应用

一、重组表达载体的构建

本实施例中的重组表达载体为rAPOBEC1&Cas9n&UGI(rCBE)介导的C·T碱基替换的非细胞富集技术载体(命名为r-sgRNA-GT)及rAPOBEC1&Cas9n&UGI(rCBE)介导的C·T碱基替换的细胞富集技术载体(命名为sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT)。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图9所示。rAPOBEC1&Cas9n&UGI介导的细胞富集技术工作原理与Cas9n&PmCDA1&UGI介导的细胞富集技术相同。

人工合成如下重组表达载体：sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT重组表达载体、r-sgRNA-GT重组表达载体。两种重组载体的具体结构描述分别如下：

sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT重组表达载体的序列为将序列1第3529-8712位替换为序列9(rAPOBEC1融合SpCas9n序列)，且将序列1第11305-11328位替换为序列10(rAPOBEC1代理靶点序列)，且将序列1的第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列：ALS-T1、Waxy、NRT1.1B-T1、Waxy-T2、rAPOBEC1-sug，且将序列1第1339-1511位所示的第六个靶点序列及其tRNA的核苷酸序列和sgRNA的核苷酸序列均删除，且保持其他序列不变后得到的序列。对应的靶点序列见表3。

r-sgRNA-GT重组表达载体的核苷酸序列为将序列1第3529-8712位替换为序列9(rAPOBEC1融合SpCas9n序列)，且将序列1的第11305-12351位替换为序列5所示的完整的潮霉素抗性基因序列，且将序列1的第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列：ALS-T1、Waxy、NRT1.1B-T1、Waxy-T2、rAPOBEC1-sug，且将序列1第1339-1511位所示的第六个靶点序列及其tRNA的核苷酸序列和sgRNA的核苷酸序列均删除，且保持其他序列不变后得到的序列。对应的靶点序列见表3。

各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表3所示。

表3

二、水稻阳性T0苗的获得

1、将步骤一获得的sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT载体和r-sgRNA-GT载体分别按照实施例2中步骤二的1-7进行操作，得到水稻抗性愈伤。

三、结果分析

1、分别取步骤二所获得的sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT载体和r-sgRNA-GT载体的水稻阳性T0苗的基因组DNA作为模板，对于ALS-T1靶点，采用引物对T1进行PCR扩增，得到PCR扩增产物；对于Waxy靶点，采用引物对T5进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T1靶点，采用引物对T6进行PCR扩增，得到PCR扩增产物；对于Waxy-T2靶点，采用引物对T11进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数，计算得出C·T碱基替换效率，结果见图10。

结果表明：在T0苗中，与非细胞富集技术r-sgRNA-GT相比，rAPOBEC1&Cas9n&UGI介导的细胞富集技术sgRNA^-ATG-Hyg^-ATG/r-sgRNA-GT对所测的4个靶点(ALS-T1、Waxy、NRT1.1B-T1、Waxy-T2)均有不同程度的增效。Waxy靶点的替换效率由0增加到20％，NRT1.1B-T1靶点的替换效率由5％增加到30％，ALS-T1靶点的替换效率由9.1％增加到33.3％，Waxy-T2靶点的替换效率由6.7％增加到45％。

实施例5、优化的Cas9n&PmCDA1&UGI介导的细胞富集技术在水稻基因组编辑中的应用

为了提高Cas9n&PmCDA1&UGI介导的C·T碱基替换效率，对Cas9n&PmCDA1&UGI介导的细胞富集技术进行优化：将优化的esgRNA应用到Cas9n&PmCDA1&UGI介导的细胞富集技术中，使用优化的esgRNA编辑基因组内源靶点序列，使用sgRNA编辑报告基因的代理靶点序列，并将这个技术命名为差异代理技术，将差异代理技术载体命名为差异代理系统DisSUGs(Discriminated sgRNAs based SurroGate system)。差异代理系统DisSUGs的结构示意图见图11。

一、重组表达载体的构建

人工合成如下重组表达载体：DisSUGs-1重组表达载体、DisSUGs-2重组表达载体。两种重组表达载体均为环状质粒，具体结构描述分别如下：

DisSUGs-1重组表达载体的序列为将序列1第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位的sgRNA核苷酸序列分别替换为序列11(esgRNA核苷酸序列)，且保持其他序列不变后得到的序列。

DisSUGs-2重组表达载体的序列为将DisSUGs-1重组表达载体中第一个表达盒的前五个靶点序列依次分别替换为如下五个靶点序列：ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

各载体的esgRNA或sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。

二、水稻阳性T0苗的获得

1、将步骤一获得的DisSUGs-1载体和DisSUGs-2载体分别按照实施例2中步骤二的1-7进行操作，得到水稻抗性愈伤。

三、水稻T0苗中靶点的编辑情况

1、分别取步骤二所获得的DisSUGs-1重组表达载体，DisSUGs-1重组表达载体的水稻阳性T0苗的基因组DNA作为模板，对于ALS-T1靶点，采用引物对T1进行PCR扩增，得到PCR扩增产物；对于ALS-T2靶点，采用引物对T2进行PCR扩增，得到PCR扩增产物；对于ALS-T3靶点，采用引物对T3进行PCR扩增，得到PCR扩增产物；对于DEP1靶点，采用引物对T4进行PCR扩增，得到PCR扩增产物；对于Waxy靶点，采用引物对T5进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T1靶点，采用引物对T6进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T2靶点，采用引物对T7进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T3靶点，采用引物对T8进行PCR扩增，得到PCR扩增产物；对于CDC48-T1靶点，采用引物对T9进行PCR扩增，得到PCR扩增产物；对于CDC48-T2靶点，采用引物对T10进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性T0苗数,计算得出C·T碱基替换效率，结果见图12。

结果表明：与Cas9n&PmCDA1&UGI介导的细胞富集技术sgRNA^-ATG-Hyg^-ATG/sgRNA-GT相比，在差异代理技术中，测试的10个靶点中有9个靶点的T0苗的C替换为T的概率均升高。具体表现为：ALS-T1的替换效率由66.7％增加到78.6％，ALS-T2的替换效率不变，ALS-T3的替换效率由47.8％增加到76.9％，DEP1的替换效率由58.6％增加到76.9％，Waxy的替换效率由13.3％增加到30％，NRT1.1B-T1的替换效率由58.6％增加到73.3％，NRT1.1B-T2的替换效率由60％增加到76.9％，NRT1.1B-T3的替换效率由36.7％增加到42.3％，CDC48-T1的替换效率由56.7％增加到80.8％，CDC48-T2的替换效率由33.3％增加到65.4％。结果表明差异代理技术比Cas9n&PmCDA1&UGI介导的细胞富集技术sgRNA^-ATG-Hyg^-ATG/sgRNA-GT细胞富集效率更高。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

序列表

<110>北京市农林科学院

<120>差异代理技术在C·T碱基替换细胞富集中的应用

<160>12

<170>PatentIn version 3.5

<210>1

<211>19029

<212>DNA

<213>人工序列(Artificial Sequence)

<400>1

ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60

ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120

ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180

tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240

gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300

aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360

ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420

acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480

caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540

ggctggtgca cgcgtccatg gagatccacc gttttagagc tagaaatagc aagttaaaat 600

aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 660

ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 720

gcagaccagc cagcgtctgg cgcgttttag agctagaaat agcaagttaa aataaggcta 780

gtccgttatc aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag 840

tggtagaata gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcacggc 900

gacggcgagc aagtgggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 960

atcaacttga aaaagtggca ccgagtcggt gcaacaaagc accagtggtc tagtggtaga 1020

atagtaccct gccacggtac agacccgggt tcgattcccg gctggtgcat tgtaatcaac 1080

tccagtgtcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 1140

tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg gtctagtggt agaatagtac 1200

cctgccacgg tacagacccg ggttcgattc ccggctggtg cagaacaacc aacatttggg 1260

tagttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1320

gtggcaccga gtcggtgcaa caaagcacca gtggtctagt ggtagaatag taccctgcca 1380

cggtacagac ccgggttcga ttcccggctg gtgcagcaac gagtggtgtg gtgccgtttt 1440

agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 1500

cgagtcggtg cttttttttt tcgttttgca ttgagttttc tccgtcgcat gtttgcagtt 1560

ttattttccg ttttgcattg aaatttctcc gtctcatgtt tgcagcgtgt tcaaaaagta 1620

cgcagctgta tttcacttat ttacggcgcc acattttcat gccgtttgtg ccaactatcc 1680

cgagctagtg aatacagctt ggcttcacac aacactggtg acccgctgac ctgctcgtac 1740

ctcgtaccgt cgtacggcac agcatttgga attaaagggt gtgatcgata ctgcttgctg 1800

ctaagcttac aaattcgggt caaggcggaa gccagcgcgc caccccacgt cagcaaatac 1860

ggaggcgcgg ggttgacggc gtcacccggt cctaacggcg accaacaaac cagccagaag 1920

aaattacagt aaaaaaaaag taaattgcac tttgatccac cttttattac ctaagtctca 1980

atttggatca cccttaaacc tatcttttca atttgggccg ggttgtggtt tggactacca 2040

tgaacaactt ttcgtcatgt ctaacttccc tttcagcaaa catatgaacc atatatagag 2100

gagatcggcc gtatactaga gctgatgtgt ttaaggtcgt tgattgcacg agaaaaaaaa 2160

atccaaatcg caacaatagc aaatttatct ggttcaaagt gaaaagatat gtttaaaggt 2220

agtccaaagt aaaacttata gataataaaa tgtggtccaa agcgtaattc actcaaaaaa 2280

aatcaacgag acgtgtacca aacggagaca aacggcatct tctcgaaatt tcccaaccgc 2340

tcgctcgccc gcctcgtctt cccggaaacc gcggtggttt cagcgtggcg gattctccaa 2400

gcagacggag acgtcacggc acgggactcc tcccaccacc caaccgccat aaataccagc 2460

cccctcatct cctctcctcg catcagctcc acccccgaaa aatttctccc caatctcgcg 2520

aggctctcgt cgtcgaatcg aatcctctcg cgtcctcaag gtacgctgct tctcctctcc 2580

tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt ttgttgctag atccgattgg 2640

tggttagggt tgtcgatgtg attatcgtga gatgtttagg ggttgtagat ctgatggttg 2700

tgatttgggc acggttggtt cgataggtgg aatcgtggtt aggttttggg attggatgtt 2760

ggttctgatg attgggggga atttttacgg ttagatgaat tgttggatga ttcgattggg 2820

gaaatcggtg tagatctgtt ggggaattgt ggaactagtc atgcctgagt gattggtgcg 2880

atttgtagcg tgttccatct tgtaggcctt gttgcgagca tgttcagatc tactgttccg 2940

ctcttgattg agttattggt gccatgggtt ggtgcaaaca caggctttaa tatgttatat 3000

ctgttttgtg tttgatgtag atctgtaggg tagttcttct tagacatggt tcaattatgt 3060

agcttgtgcg tttcgatttg atttcatatg ttcacagatt agataatgat gaactctttt 3120

aattaattgt caatggtaaa taggaagtct tgtcgctata tctgtcataa tgatctcatg 3180

ttactatctg ccagtaattt atgctaagaa ctatattaga atatcatgtt acaatctgta 3240

gtaatatcat gttacaatct gtagttcatc tatataatct attgtggtaa tttcttttta 3300

ctatctgtgt gaagattatt gccactagtt cattctactt atttctgaag ttcaggatac 3360

gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc ctgttactat ctttttgaat 3420

acatgtatgt tctgttggaa tatgtttgct gtttgatccg ttgttgtgtc cttaatcttg 3480

tgctagttct taccctatct gtttggtgat tatttcttgc agtacgtaat ggactacaag 3540

gaccacgacg gggattacaa agaccacgac atagactaca aggatgacga tgacaaaatg 3600

gcaccgaaga aaaaaaggaa ggtcggaatc catggcgttc cagctgccga taagaaatat 3660

tccatcggac tcgccattgg cacgaatagc gtcggatggg ctgttattac tgatgagtac 3720

aaagttccgt ctaagaagtt caaggtgctg ggcaacacag accgccacag cataaagaaa 3780

aatctcatcg gtgcactcct tttcgatagt ggggagactg cagaagcgac aagattgaaa 3840

aggactgcga gaaggcgcta tacacggcgt aagaatagaa tctgctacct tcaggagatt 3900

ttctctaacg aaatggctaa ggtcgatgac agtttctttc atagacttga ggaatcgttc 3960

ttggttgagg aggataagaa acatgagagg cacccgatat ttggaaacat cgtggatgag 4020

gtcgcatatc atgaaaagta ccccacaatc taccacctga gaaagaaact cgttgattcc 4080

accgacaaag cggatttgag actcatctac ctcgctcttg cccatatgat aaagttccgc 4140

ggacactttc tgatcgaggg cgacctcaac cctgataata gcgacgtcga taagctcttc 4200

atccagttgg ttcaaaccta caatcagctc tttgaggaaa acccaattaa tgctagtgga 4260

gtggatgcaa aagcgatact gtcggccaga ctctccaaga gcagaaggtt ggagaacctg 4320

atcgctcaac ttcctggaga aaagaaaaac ggtctttttg ggaatttgat tgccttgtct 4380

ctgggcctca caccaaactt caagtcaaat tttgacctcg ctgaggatgc caaacttcag 4440

ttgtctaagg atacctatga tgacgatctt gacaatttgc tggcacaaat tggcgaccag 4500

tacgcggatc tgttcctcgc agcgaagaat ctgagtgatg ctattctcct ttcggacata 4560

ctcagggtta acactgagat cacaaaagca cctttgagtg cgtcgatgat taagcgctat 4620

gatgaacatc accaagacct cactttgctg aaggcccttg tgcggcagca attgccagag 4680

aagtacaaag aaatcttctt tgaccaatct aagaacggat acgctggcta tattgatgga 4740

ggagcttctc aggaggaatt ctataagttt atcaaaccta tacttgagaa gatggatggt 4800

acagaggaac tccttgttaa attgaacaga gaagatttgc tgcgcaagca acggaccttt 4860

gacaacggat caattccgca tcagatacac ctcggcgagc ttcatgccat ccttcgccgg 4920

caggaagatt tctacccctt tttgaaggac aaccgcgaga agatagaaaa aatccttacg 4980

ttccggattc cttactatgt gggtccattg gcaaggggga attcccgctt tgcgtggatg 5040

actcggaaaa gcgaggaaac tatcacaccg tggaacttcg aggaagttgt ggacaaggga 5100

gcttctgccc aatcattcat tgagaggatg actaacttcg ataagaacct gccgaacgag 5160

aaagttctcc ccaagcactc cctcctttac gagtatttca ccgtgtataa cgaacttacg 5220

aaggttaaat acgtgactga gggtatgagg aagccagcat tcttgagcgg ggaacaaaag 5280

aaagcgattg ttgatttgct gtttaaaact aatcgcaagg tgacagtcaa gcagctcaaa 5340

gaggattatt tcaagaaaat tgaatgtttc gactctgtgg agatatcagg agtcgaagat 5400

aggtttaacg cttcccttgg cacataccat gacctcctta agatcattaa ggacaaagat 5460

ttcctggata acgaggaaaa tgaggacatc ctcgaagata ttgttcttac cttgacgctg 5520

tttgaggatc gcgaaatgat cgaggaacgg cttaagacgt atgctcactt gttcgacgat 5580

aaggttatga agcagctcaa gcgtagaagg tacactggat ggggccgtct gtctagaaag 5640

ctcatcaacg gaatacgtga taaacaaagt ggcaagacaa ttttggattt tctgaagtcg 5700

gacggattcg ccaacagaaa ttttatgcag ctgattcatg acgatagtct caccttcaaa 5760

gaggacatac agaaggctca agtgagtggt caaggggatt cgctgcatga acacatcgca 5820

aacctcgcgg gttcaccggc cataaagaaa ggaatccttc aaactgttaa ggtcgttgat 5880

gagttggtta aagtgatggg taggcacaag cccgaaaaca tagtgatcga gatggctcgc 5940

gaaaatcaga ctacacaaaa agggcagaag aactctcgcg agcggatgaa aaggattgag 6000

gaaggaatca aggaactggg ctcacagatt ctcaaagagc atccagtcga aaacacacag 6060

ctgcaaaatg agaagctcta tctttactat ctccaaaatg gccgggacat gtatgttgat 6120

caggagcttg acatcaaccg tttgtccgac tatgatgtgg accacattgt cccgcaatct 6180

ttccttaagg acgattcaat cgataataag gtgttgaccc ggagcgataa aaaccgtgga 6240

aagtctgaca atgtcccttc agaggaagtg gttaagaaga tgaagaacta ctggagacaa 6300

ttgctgaatg caaaactgat cacacagaga aagttcgaca acctcaccaa agcagagaga 6360

ggtgggctca gtgaacttga taaagcgggc ttcattaagc gtcagctcgt tgagactaga 6420

cagatcacga agcatgtcgc gcagattttg gattcgcgga tgaacacgaa gtacgacgag 6480

aatgataaac tgatacgtga agtcaaggtt atcactctta agtccaaatt ggtgagcgat 6540

ttcagaaagg acttccaatt ctataaggtc agggagatca acaattatca tcacgctcac 6600

gatgcctacc ttaatgctgt tgtggggacc gcccttatta agaaataccc taaattggag 6660

tctgaattcg tttacgggga ttataaggtc tacgacgtta ggaaaatgat agctaagagt 6720

gagcaggaga tcggtaaagc aactgcgaag tatttctttt actcgaacat catgaatttc 6780

tttaagaccg agataacgct ggcaaatggc gaaattagaa agaggcctct catagagact 6840

aacggtgaga caggggaaat cgtctgggat aagggtaggg actttgcgac agtgcgcaag 6900

gtcctctcta tgccgcaagt taatattgtg aagaaaaccg aggtgcagac gggaggcttc 6960

tccaaggaaa gcatacttcc caaacggaac tctgataagt tgatcgctcg taagaaagat 7020

tgggacccta agaaatatgg tgggttcgat tccccaactg ttgcttacag cgtgctggtc 7080

gttgccaagg tcgagaaggg taaatccaag aaactcaaaa gcgttaagga actccttggg 7140

attactatca tggagagatc ttcattcgaa aagaatccta tcgactttct tgaggccaaa 7200

ggatataagg aagttaagaa agatctgata atcaaactcc caaagtactc attgtttgag 7260

ctggaaaacg gcaggaagcg catgcttgct tccgccggag agttgcagaa agggaacgag 7320

ttggctctgc cttctaagta tgttaacttc ctctatcttg cctctcatta cgagaagctc 7380

aaaggctcac cagaggacaa cgaacagaaa caactttttg tcgagcaaca taagcactat 7440

ttggatgaga ttatagaaca gatcagtgaa ttctcgaaaa gggttatcct tgcagatgcg 7500

aatcttgaca aggtgttgtc tgcatacaac aaacatagag ataagccgat cagggagcaa 7560

gcggaaaata tcattcacct cttcactctt acaaacttgg gtgctcccgc tgccttcaag 7620

tattttgata ccacgattga ccggaaacgt tacacctcaa cgaaggaggt gctggatgcc 7680

accctcatcc accaatctat taccggactc tacgagacta gaatcgatct ctcacagctc 7740

ggcggggata aaagaccagc agcgacgaaa aaggcaggac aggctaagaa gaagaaagag 7800

ctcggaggag gaggcacggg aggaggaggc tccgccgagt atgtgcgcgc gctcttcgac 7860

ttcaacggca atgacgagga ggatctccct ttcaagaagg gcgacatcct ccgcatccgc 7920

gataagccgg aggagcagtg gtggaacgca gaggactccg agggcaagcg gggcatgatc 7980

ctggtgccat acgtcgagaa gtacagcggc gattacaagg accacgatgg cgactacaag 8040

gatcatgaca tcgattacaa ggacgatgac gataagtccg gcgtcgacat gacggacgcg 8100

gagtatgtgc gcatccacga gaagctcgat atctacacct tcaagaagca gttcttcaac 8160

aataagaagt cggtgtccca tcggtgctac gtcctcttcg agctgaagcg caggggagag 8220

cgccgcgcct gcttctgggg ctacgcggtg aataagccgc agtcaggcac agagcgcggc 8280

atccacgccg agatcttctc gatccggaag gtcgaggagt acctccgcga caacccaggc 8340

cagttcacga tcaattggta ctccagctgg tccccttgcg cagattgcgc agagaagatc 8400

ctcgagtggt acaaccagga gctgaggggc aatggccata ccctcaagat ctgggcctgc 8460

aagctgtact acgagaagaa cgcgaggaat cagatcggcc tctggaacct gcgggataat 8520

ggcgtgggcc tcaacgtgat ggtgtccgag cactaccagt gctgccgcaa gatcttcatc 8580

cagtcctccc acaatcagct gaacgagaat aggtggctcg aaaagaccct gaagcgcgcc 8640

gagaagtgga ggagcgagct gtctatcatg atccaggtca agatcctgca caccacaaag 8700

tcaccggcgg tgggcggcgg cggcagcgaa ttctccggcg gcagcacgaa cctcagcgac 8760

atcatcgaga aggagacagg caagcagctc gtgatccagg agtctatcct catgctgcct 8820

gaggaggtgg aggaggtcat cggcaacaag ccggagtccg atatcctcgt gcacaccgcc 8880

tacgacgagt cgacagatga gaatgtcatg ctcctgacct ccgacgcacc agagtacaag 8940

ccatgggcgc tcgtgatcca ggattccaac ggcgagaata agatcaagat gctgtctggc 9000

ggctccccga agaagaagcg caaggtctag actagtctga aatcaccagt ctctctctac 9060

aaatctatct ctctctataa taatgtgtga gtagttccca gataagggaa ttagggttct 9120

tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 9180

aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg gggcgcccga 9240

cctgtactcg cgaaggttaa cttacagaga gtgtccgggc gcgcctggtg gatcgtccgc 9300

ctaggctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat 9360

gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 9420

atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 9480

aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 9540

attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 9600

tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 9660

ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 9720

attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 9780

agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 9840

aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 9900

gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 9960

gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 10020

gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 10080

ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 10140

ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 10200

cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa 10260

atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 10320

ctaccttctc tagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 10380

catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat 10440

gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 10500

cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 10560

tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 10620

gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 10680

cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat 10740

ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc 10800

gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt 10860

ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctagatcg 10920

gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt 10980

gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta 11040

tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca 11100

tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt 11160

gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct 11220

gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt 11280

ttggtgttac ttctgcagga gctcgcaacg agtggtgtgg tgcctggcaa aaagcctgaa 11340

ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg 11400

atgcagctct cggagggcga agaatctcgt gctttcagct tcgatgtagg agggcgtgga 11460

tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg 11520

cactttgcat cggccgcgct cccgattccg gaagtgcttg acattgggga gtttagcgag 11580

agcctgacct attgcatctc ccgccgttca cagggtgtca cgttgcaaga cctgcctgaa 11640

accgaactgc ccgctgttct acaaccggtc gcggaggcta tggatgcgat cgctgcggcc 11700

gatcttagcc agacgagcgg gttcggccca ttcggaccgc aaggaatcgg tcaatacact 11760

acatggcgtg atttcatatg cgcgattgct gatccccatg tgtatcactg gcaaactgtg 11820

atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg atgagctgat gctttgggcc 11880

gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt tcggctccaa caatgtcctg 11940

acggacaatg gccgcataac agcggtcatt gactggagcg aggcgatgtt cggggattcc 12000

caatacgagg tcgccaacat cttcttctgg aggccgtggt tggcttgtat ggagcagcag 12060

acgcgctact tcgagcggag gcatccggag cttgcaggat cgccacgact ccgggcgtat 12120

atgctccgca ttggtcttga ccaactctat cagagcttgg ttgacggcaa tttcgatgat 12180

gcagcttggg cgcagggtcg atgcgacgca atcgtccgat ccggagccgg gactgtcggg 12240

cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg atggctgtgt agaagtactc 12300

gccgatagtg gaaaccgacg ccccagcact cgtccgaggg caaagaaata gggccagtta 12360

ggccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct 12420

tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta 12480

atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta 12540

atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc 12600

atctatgtta ctagatctgt agccctgcag gacgcgttta attaagtgca cgcggccgcc 12660

tacttagtca agagcctcgc acgcgactgt cacgcggcca ggatcgcctc gtgagcctcg 12720

caatctgtac ctagtgttta aactatcagt gtttgacagg atatattggc gggtaaacct 12780

aagagaaaag agcgtttatt agaataacgg atatttaaaa gggcgtgaaa aggtttatcc 12840

gttcgtccat ttgtatgtgc atgccaacca cagggttccc ctcgggatca aagtactttg 12900

atccaacccc tccgctgcta tagtgcagtc ggcttctgac gttcagtgca gccgtcttct 12960

gaaaacgaca tgtcgcacaa gtcctaagtt acgcgacagg ctgccgccct gcccttttcc 13020

tggcgttttc ttgtcgcgtg ttttagtcgc ataaagtaga atacttgcga ctagaaccgg 13080

agacattacg ccatgaacaa gagcgccgcc gctggcctgc tgggctatgc ccgcgtcagc 13140

accgacgacc aggacttgac caaccaacgg gccgaactgc acgcggccgg ctgcaccaag 13200

ctgttttccg agaagatcac cggcaccagg cgcgaccgcc cggagctggc caggatgctt 13260

gaccacctac gccctggcga cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc 13320

acccgcgacc tactggacat tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc 13380

ctggcagagc cgtgggccga caccaccacg ccggccggcc gcatggtgtt gaccgtgttc 13440

gccggcattg ccgagttcga gcgttcccta atcatcgacc gcacccggag cgggcgcgag 13500

gccgccaagg cccgaggcgt gaagtttggc ccccgcccta ccctcacccc ggcacagatc 13560

gcgcacgccc gcgagctgat cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg 13620

cttggcgtgc atcgctcgac cctgtaccgc gcacttgagc gcagcgagga agtgacgccc 13680

accgaggcca ggcggcgcgg tgccttccgt gaggacgcat tgaccgaggc cgacgccctg 13740

gcggccgccg agaatgaacg ccaagaggaa caagcatgaa accgcaccag gacggccagg 13800

acgaaccgtt tttcattacc gaagagatcg aggcggagat gatcgcggcc gggtacgtgt 13860

tcgagccgcc cgcgcacgtc tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg 13920

atgccaagct ggcggcctgg ccggccagct tggccgctga agaaaccgag cgccgccgtc 13980

taaaaaggtg atgtgtattt gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga 14040

tgcgatgagt aaataaacaa atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa 14100

ccagaaaggc gggtcaggca agacgaccat cgcaacccat ctagcccgcg ccctgcaact 14160

cgccggggcc gatgttctgt tagtcgattc cgatccccag ggcagtgccc gcgattgggc 14220

ggccgtgcgg gaagatcaac cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg 14280

cgacgtgaag gccatcggcc ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc 14340

ggacttggct gtgtccgcga tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag 14400

cccttacgac atatgggcca ccgccgacct ggtggagctg gttaagcagc gcattgaggt 14460

cacggatgga aggctacaag cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat 14520

cggcggtgag gttgccgagg cgctggccgg gtacgagctg cccattcttg agtcccgtat 14580

cacgcagcgc gtgagctacc caggcactgc cgccgccggc acaaccgttc ttgaatcaga 14640

acccgagggc gacgctgccc gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact 14700

catttgagtt aatgaggtaa agagaaaatg agcaaaagca caaacacgct aagtgccggc 14760

cgtccgagcg cacgcagcag caaggctgca acgttggcca gcctggcaga cacgccagcc 14820

atgaagcggg tcaactttca gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg 14880

gtacgccaag gcaagaccat taccgagctg ctatctgaat acatcgcgca gctaccagag 14940

taaatgagca aatgaataaa tgagtagatg aattttagcg gctaaaggag gcggcatgga 15000

aaatcaagaa caaccaggca ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg 15060

ttggccaggc gtaagcggct gggttgtctg ccggccctgc aatggcactg gaacccccaa 15120

gcccgaggaa tcggcgtgac ggtcgcaaac catccggccc ggtacaaatc ggcgcggcgc 15180

tgggtgatga cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg caacgcatcg 15240

aggcagaagc acgccccggt gaatcgtggc aagcggccgc tgatcgaatc cgcaaagaat 15300

cccggcaacc gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag ggcgacgagc 15360

aaccagattt tttcgttccg atgctctatg acgtgggcac ccgcgatagt cgcagcatca 15420

tggacgtggc cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag gtgatccgct 15480

acgagcttcc agacgggcac gtagaggttt ccgcagggcc ggccggcatg gccagtgtgt 15540

gggattacga cctggtactg atggcggttt cccatctaac cgaatccatg aaccgatacc 15600

gggaagggaa gggagacaag cccggccgcg tgttccgtcc acacgttgcg gacgtactca 15660

agttctgccg gcgagccgat ggcggaaagc agaaagacga cctggtagaa acctgcattc 15720

ggttaaacac cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac ggccgcctgg 15780

tgacggtatc cgagggtgaa gccttgatta gccgctacaa gatcgtaaag agcgaaaccg 15840

ggcggccgga gtacatcgag atcgagctag ctgattggat gtaccgcgag atcacagaag 15900

gcaagaaccc ggacgtgctg acggttcacc ccgattactt tttgatcgat cccggcatcg 15960

gccgttttct ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc agatggttgt 16020

tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc tgtttcaccg 16080

tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag gaggcggggc 16140

aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa gcatccgccg 16200

gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa aaaggtcgaa 16260

aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac attgggaacc 16320

ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac atgtaagtga 16380

ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa cttattaaaa 16440

ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc gaagagctgc 16500

aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg cgtcggccta 16560

tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta ccagggcgcg 16620

gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc ctgcctcgcg 16680

cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct 16740

tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc 16800

gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta 16860

actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc 16920

acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact 16980

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 17040

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 17100

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 17160

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 17220

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 17280

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 17340

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 17400

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 17460

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 17520

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 17580

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 17640

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 17700

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 17760

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gcattctagg tactaaaaca 17820

attcatccag taaaatataa tattttattt tctcccaatc aggcttgatc cccagtaagt 17880

caaaaaatag ctcgacatac tgttcttccc cgatatcctc cctgatcgac cggacgcaga 17940

aggcaatgtc ataccacttg tccgccctgc cgcttctccc aagatcaata aagccactta 18000

ctttgccatc tttcacaaag atgttgctgt ctcccaggtc gccgtgggaa aagacaagtt 18060

cctcttcggg cttttccgtc tttaaaaaat catacagctc gcgcggatct ttaaatggag 18120

tgtcttcttc ccagttttcg caatccacat cggccagatc gttattcagt aagtaatcca 18180

attcggctaa gcggctgtct aagctattcg tatagggaca atccgatatg tcgatggagt 18240

gaaagagcct gatgcactcc gcatacagct cgataatctt ttcagggctt tgttcatctt 18300

catactcttc cgagcaaagg acgccatcgg cctcactcat gagcagattg ctccagccat 18360

catgccgttc aaagtgcagg acctttggaa caggcagctt tccttccagc catagcatca 18420

tgtccttttc ccgttccaca tcataggtgg tccctttata ccggctgtcc gtcattttta 18480

aatataggtt ttcattttct cccaccagct tatatacctt agcaggagac attccttccg 18540

tatcttttac gcagcggtat ttttcgatca gttttttcaa ttccggtgat attctcattt 18600

tagccattta ttatttcctt cctcttttct acagtattta aagatacccc aagaagctaa 18660

ttataacaag acgaactcca attcactgtt ccttgcattc taaaacctta aataccagaa 18720

aacagctttt tcaaagttgt tttcaaagtt ggcgtataac atagtatcga cggagccgat 18780

tttgaaaccg cggtgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac 18840

cctccgcgag atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc 18900

atcggtaaca tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg 18960

actgatgggc tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt 19020

tggctggct 19029

<210>2

<211>1423

<212>PRT

<213>人工序列(Artificial Sequence)

<400>2

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr

1400 1405 1410

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1415 1420

<210>3

<211>208

<212>PRT

<213>人工序列(Artificial Sequence)

<400>3

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser

180 185 190

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210>4

<211>98

<212>PRT

<213>人工序列(Artificial Sequence)

<400>4

Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly

1 5 10 15

Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val

20 25 30

Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr

35 40 45

Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp

50 55 60

Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly

65 70 75 80

Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg

85 90 95

Lys Val

<210>5

<211>1026

<212>DNA

<213>人工序列(Artificial Sequence)

<400>5

atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60

agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120

gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180

cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240

ggggagttta gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg 300

caagacctgc ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat 360

gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420

atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480

cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540

ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600

tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660

atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720

tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca 780

cgactccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840

ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900

gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960

tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020

aaatag 1026

<210>6

<211>4269

<212>DNA

<213>人工序列(Artificial Sequence)

<400>6

atggactaca aggaccacga cggggattac aaagaccacg acatagacta caaggatgac 60

gatgacaaaa tggcaccgaa gaaaaaaagg aaggtcggaa tccatggcgt tccagctgcc 120

gataagaaat attccatcgg actcgccatt ggcacgaata gcgtcggatg ggctgttatt 180

actgatgagt acaaagttcc gtctaagaag ttcaaggtgc tgggcaacac agaccgccac 240

agcataaaga aaaatctcat cggtgcactc cttttcgata gtggggagac tgcagaagcg 300

acaagattga aaaggactgc gagaaggcgc tatacacggc gtaagaatag aatctgctac 360

cttcaggaga ttttctctaa cgaaatggct aaggtcgatg acagtttctt tcatagactt 420

gaggaatcgt tcttggttga ggaggataag aaacatgaga ggcacccgat atttggaaac 480

atcgtggatg aggtcgcata tcatgaaaag taccccacaa tctaccacct gagaaagaaa 540

ctcgttgatt ccaccgacaa agcggatttg agactcatct acctcgctct tgcccatatg 600

ataaagttcc gcggacactt tctgatcgag ggcgacctca accctgataa tagcgacgtc 660

gataagctct tcatccagtt ggttcaaacc tacaatcagc tctttgagga aaacccaatt 720

aatgctagtg gagtggatgc aaaagcgata ctgtcggcca gactctccaa gagcagaagg 780

ttggagaacc tgatcgctca acttcctgga gaaaagaaaa acggtctttt tgggaatttg 840

attgccttgt ctctgggcct cacaccaaac ttcaagtcaa attttgacct cgctgaggat 900

gccaaacttc agttgtctaa ggatacctat gatgacgatc ttgacaattt gctggcacaa 960

attggcgacc agtacgcgga tctgttcctc gcagcgaaga atctgagtga tgctattctc 1020

ctttcggaca tactcagggt taacactgag atcacaaaag cacctttgag tgcgtcgatg 1080

attaagcgct atgatgaaca tcaccaagac ctcactttgc tgaaggccct tgtgcggcag 1140

caattgccag agaagtacaa agaaatcttc tttgaccaat ctaagaacgg atacgctggc 1200

tatattgatg gaggagcttc tcaggaggaa ttctataagt ttatcaaacc tatacttgag 1260

aagatggatg gtacagagga actccttgtt aaattgaaca gagaagattt gctgcgcaag 1320

caacggacct ttgacaacgg atcaattccg catcagatac acctcggcga gcttcatgcc 1380

atccttcgcc ggcaggaaga tttctacccc tttttgaagg acaaccgcga gaagatagaa 1440

aaaatcctta cgttccggat tccttactat gtgggtccat tggcaagggg gaattcccgc 1500

tttgcgtgga tgactcggaa aagcgaggaa actatcacac cgtggaactt cgaggaagtt 1560

gtggacaagg gagcttctgc ccaatcattc attgagagga tgactaactt cgataagaac 1620

ctgccgaacg agaaagttct ccccaagcac tccctccttt acgagtattt caccgtgtat 1680

aacgaactta cgaaggttaa atacgtgact gagggtatga ggaagccagc attcttgagc 1740

ggggaacaaa agaaagcgat tgttgatttg ctgtttaaaa ctaatcgcaa ggtgacagtc 1800

aagcagctca aagaggatta tttcaagaaa attgaatgtt tcgactctgt ggagatatca 1860

ggagtcgaag ataggtttaa cgcttccctt ggcacatacc atgacctcct taagatcatt 1920

aaggacaaag atttcctgga taacgaggaa aatgaggaca tcctcgaaga tattgttctt 1980

accttgacgc tgtttgagga tcgcgaaatg atcgaggaac ggcttaagac gtatgctcac 2040

ttgttcgacg ataaggttat gaagcagctc aagcgtagaa ggtacactgg atggggccgt 2100

ctgtctagaa agctcatcaa cggaatacgt gataaacaaa gtggcaagac aattttggat 2160

tttctgaagt cggacggatt cgccaacaga gcttttgcgg cactgattgc tgacgatagt 2220

ctcaccttca aagaggacat acagaaggct caagtgagtg gtcaagggga ttcgctgcat 2280

gaacacatcg caaacctcgc gggttcaccg gccataaaga aaggaatcct tcaaactgtt 2340

aaggtcgttg atgagttggt taaagtgatg ggtaggcaca agcccgaaaa catagtgatc 2400

gagatggctc gcgaaaatca gactacacaa aaagggcaga agaactctcg cgagcggatg 2460

aaaaggattg aggaaggaat caaggaactg ggctcacaga ttctcaaaga gcatccagtc 2520

gaaaacacac agctgcaaaa tgagaagctc tatctttact atctccaaaa tggccgggac 2580

atgtatgttg atcaggagct tgacatcaac cgtttgtccg actatgatgt ggaccacatt 2640

gtcccgcaat ctttccttaa ggacgattca atcgataata aggtgttgac ccggagcgat 2700

aaaaaccgtg gaaagtctga caatgtccct tcagaggaag tggttaagaa gatgaagaac 2760

tactggagac aattgctgaa tgcaaaactg atcacacaga gaaagttcga caacctcacc 2820

aaagcagaga gaggtgggct cagtgaactt gataaagcgg gcttcattaa gcgtcagctc 2880

gttgagacta gacagatcac gaagcatgtc gcgcagattt tggattcgcg gatgaacacg 2940

aagtacgacg agaatgataa actgatacgt gaagtcaagg ttatcactct taagtccaaa 3000

ttggtgagcg atttcagaaa ggacttccaa ttctataagg tcagggagat caacaattat 3060

catcacgctc acgatgccta ccttaatgct gttgtgggga ccgcccttat taagaaatac 3120

cctaaattgg agtctgaatt cgtttacggg gattataagg tctacgacgt taggaaaatg 3180

atagctaaga gtgagcagga gatcggtaaa gcaactgcga agtatttctt ttactcgaac 3240

atcatgaatt tctttaagac cgagataacg ctggcaaatg gcgaaattag aaagaggcct 3300

ctcatagaga ctaacggtga gacaggggaa atcgtctggg ataagggtag ggactttgcg 3360

acagtgcgca aggtcctctc tatgccgcaa gttaatattg tgaagaaaac cgaggtgcag 3420

acgggaggct tctccaagga aagcatactt cccaaacgga actctgataa gttgatcgct 3480

cgtaagaaag attgggaccc taagaaatat ggtgggttcg attccccaac tgttgcttac 3540

agcgtgctgg tcgttgccaa ggtcgagaag ggtaaatcca agaaactcaa aagcgttaag 3600

gaactccttg ggattactat catggagaga tcttcattcg aaaagaatcc tatcgacttt 3660

cttgaggcca aaggatataa ggaagttaag aaagatctga taatcaaact cccaaagtac 3720

tcattgtttg agctggaaaa cggcaggaag cgcatgcttg cttccgccgg agagttgcag 3780

aaagggaacg agttggctct gccttctaag tatgttaact tcctctatct tgcctctcat 3840

tacgagaagc tcaaaggctc accagaggac aacgaacaga aacaactttt tgtcgagcaa 3900

cataagcact atttggatga gattatagaa cagatcagtg aattctcgaa aagggttatc 3960

cttgcagatg cgaatcttga caaggtgttg tctgcataca acaaacatag agataagccg 4020

atcagggagc aagcggaaaa tatcattcac ctcttcactc ttacaaactt gggtgctccc 4080

gctgccttca agtattttga taccacgatt gaccggaaac gttacacctc aacgaaggag 4140

gtgctggatg ccaccctcat ccaccaatct attaccggac tctacgagac tagaatcgat 4200

ctctcacagc tcggcgggga taaaagacca gcagcgacga aaaaggcagg acaggctaag 4260

aagaagaaa 4269

<210>7

<211>1423

<212>PRT

<213>人工序列(Artificial Sequence)

<400>7

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Ala Phe Ala Ala Leu Ile

725 730 735

Ala Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr

1400 1405 1410

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1415 1420

<210>8

<211>1153

<212>DNA

<213>人工序列(Artificial Sequence)

<400>8

gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg tgcagtcagg 60

gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg gaagccggga 120

acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt aggagaaaag 180

catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg ccggcccatt 240

acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc acatagatca 300

aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag caccagtggt 360

ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc ggctggtgca 420

cgcccccacc cggcctcgag gttttagagc tagaaatagc aagttaaaat aaggctagtc 480

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt ggtctagtgg 540

tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt gcaccctcaa 600

cagtatcatc aatgttttag agctagaaat agcaagttaa aataaggcta gtccgttatc 660

aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag tggtagaata 720

gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcagcaa cgagtggtgt 780

ggtgccgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 840

aaaagtggca ccgagtcggt gctttttttt ttcgttttgc attgagtttt ctccgtcgca 900

tgtttgcagt tttattttcc gttttgcatt gaaatttctc cgtctcatgt ttgcagcgtg 960

ttcaaaaagt acgcagctgt atttcactta tttacggcgc cacattttca tgccgtttgt 1020

gccaactatc ccgagctagt gaatacagct tggcttcaca caacactggt gacccgctga 1080

cctgctcgta cctcgtaccg tcgtacggca cagcatttgg aattaaaggg tgtgatcgat 1140

actgcttgct gct 1153

<210>9

<211>5004

<212>DNA

<213>人工序列(Artificial Sequence)

<400>9

atgtccagcg agacaggacc agtggcagtc gacccaacac tgcgcaggcg gatcgagcca 60

cacgagttcg aggtgttctt cgatccgagg gagctccgga aggagacatg cctcctgtac 120

gagatcaact ggggcggccg ccactctatc tggaggcata cctcacagaa cacaaataag 180

catgtggagg tcaacttcat cgagaagttc accacagagc ggtacttctg cccgaatacg 240

cgctgctcca tcacctggtt cctgtcgtgg tccccatgcg gagagtgctc gagggcaatc 300

acggagttcc tctcccgcta cccgcacgtc accctgttca tctacatcgc acggctctac 360

caccatgcgg acccgcggaa taggcagggc ctccgcgatc tgatctcttc aggcgtgaca 420

atccagatca tgacggagca ggagtcaggc tactgctgga ggaacttcgt caattacagc 480

ccatctaacg aggcacactg gccgcgctac ccgcatctct gggtgcgcct ctacgtgctc 540

gagctgtact gcatcatcct cggcctgccg ccatgcctca atatcctgcg caggaagcag 600

ccgcagctga cgttcttcac catcgccctc cagagctgcc actaccagcg gctccctccg 660

catatcctgt gggcgacagg cctcaagtca ggctcggaga cacctggcac gtccgagagc 720

gccaccccgg agtctatgga ctacaaggac cacgacgggg attacaaaga ccacgacata 780

gactacaagg atgacgatga caaaatggca ccgaagaaaa aaaggaaggt cggaatccat 840

ggcgttccag ctgccgataa gaaatattcc atcggactcg ccattggcac gaatagcgtc 900

ggatgggctg ttattactga tgagtacaaa gttccgtcta agaagttcaa ggtgctgggc 960

aacacagacc gccacagcat aaagaaaaat ctcatcggtg cactcctttt cgatagtggg 1020

gagactgcag aagcgacaag attgaaaagg actgcgagaa ggcgctatac acggcgtaag 1080

aatagaatct gctaccttca ggagattttc tctaacgaaa tggctaaggt cgatgacagt 1140

ttctttcata gacttgagga atcgttcttg gttgaggagg ataagaaaca tgagaggcac 1200

ccgatatttg gaaacatcgt ggatgaggtc gcatatcatg aaaagtaccc cacaatctac 1260

cacctgagaa agaaactcgt tgattccacc gacaaagcgg atttgagact catctacctc 1320

gctcttgccc atatgataaa gttccgcgga cactttctga tcgagggcga cctcaaccct 1380

gataatagcg acgtcgataa gctcttcatc cagttggttc aaacctacaa tcagctcttt 1440

gaggaaaacc caattaatgc tagtggagtg gatgcaaaag cgatactgtc ggccagactc 1500

tccaagagca gaaggttgga gaacctgatc gctcaacttc ctggagaaaa gaaaaacggt 1560

ctttttggga atttgattgc cttgtctctg ggcctcacac caaacttcaa gtcaaatttt 1620

gacctcgctg aggatgccaa acttcagttg tctaaggata cctatgatga cgatcttgac 1680

aatttgctgg cacaaattgg cgaccagtac gcggatctgt tcctcgcagc gaagaatctg 1740

agtgatgcta ttctcctttc ggacatactc agggttaaca ctgagatcac aaaagcacct 1800

ttgagtgcgt cgatgattaa gcgctatgat gaacatcacc aagacctcac tttgctgaag 1860

gcccttgtgc ggcagcaatt gccagagaag tacaaagaaa tcttctttga ccaatctaag 1920

aacggatacg ctggctatat tgatggagga gcttctcagg aggaattcta taagtttatc 1980

aaacctatac ttgagaagat ggatggtaca gaggaactcc ttgttaaatt gaacagagaa 2040

gatttgctgc gcaagcaacg gacctttgac aacggatcaa ttccgcatca gatacacctc 2100

ggcgagcttc atgccatcct tcgccggcag gaagatttct accccttttt gaaggacaac 2160

cgcgagaaga tagaaaaaat ccttacgttc cggattcctt actatgtggg tccattggca 2220

agggggaatt cccgctttgc gtggatgact cggaaaagcg aggaaactat cacaccgtgg 2280

aacttcgagg aagttgtgga caagggagct tctgcccaat cattcattga gaggatgact 2340

aacttcgata agaacctgcc gaacgagaaa gttctcccca agcactccct cctttacgag 2400

tatttcaccg tgtataacga acttacgaag gttaaatacg tgactgaggg tatgaggaag 2460

ccagcattct tgagcgggga acaaaagaaa gcgattgttg atttgctgtt taaaactaat 2520

cgcaaggtga cagtcaagca gctcaaagag gattatttca agaaaattga atgtttcgac 2580

tctgtggaga tatcaggagt cgaagatagg tttaacgctt cccttggcac ataccatgac 2640

ctccttaaga tcattaagga caaagatttc ctggataacg aggaaaatga ggacatcctc 2700

gaagatattg ttcttacctt gacgctgttt gaggatcgcg aaatgatcga ggaacggctt 2760

aagacgtatg ctcacttgtt cgacgataag gttatgaagc agctcaagcg tagaaggtac 2820

actggatggg gccgtctgtc tagaaagctc atcaacggaa tacgtgataa acaaagtggc 2880

aagacaattt tggattttct gaagtcggac ggattcgcca acagaaattt tatgcagctg 2940

attcatgacg atagtctcac cttcaaagag gacatacaga aggctcaagt gagtggtcaa 3000

ggggattcgc tgcatgaaca catcgcaaac ctcgcgggtt caccggccat aaagaaagga 3060

atccttcaaa ctgttaaggt cgttgatgag ttggttaaag tgatgggtag gcacaagccc 3120

gaaaacatag tgatcgagat ggctcgcgaa aatcagacta cacaaaaagg gcagaagaac 3180

tctcgcgagc ggatgaaaag gattgaggaa ggaatcaagg aactgggctc acagattctc 3240

aaagagcatc cagtcgaaaa cacacagctg caaaatgaga agctctatct ttactatctc 3300

caaaatggcc gggacatgta tgttgatcag gagcttgaca tcaaccgttt gtccgactat 3360

gatgtggacc acattgtccc gcaatctttc cttaaggacg attcaatcga taataaggtg 3420

ttgacccgga gcgataaaaa ccgtggaaag tctgacaatg tcccttcaga ggaagtggtt 3480

aagaagatga agaactactg gagacaattg ctgaatgcaa aactgatcac acagagaaag 3540

ttcgacaacc tcaccaaagc agagagaggt gggctcagtg aacttgataa agcgggcttc 3600

attaagcgtc agctcgttga gactagacag atcacgaagc atgtcgcgca gattttggat 3660

tcgcggatga acacgaagta cgacgagaat gataaactga tacgtgaagt caaggttatc 3720

actcttaagt ccaaattggt gagcgatttc agaaaggact tccaattcta taaggtcagg 3780

gagatcaaca attatcatca cgctcacgat gcctacctta atgctgttgt ggggaccgcc 3840

cttattaaga aataccctaa attggagtct gaattcgttt acggggatta taaggtctac 3900

gacgttagga aaatgatagc taagagtgag caggagatcg gtaaagcaac tgcgaagtat 3960

ttcttttact cgaacatcat gaatttcttt aagaccgaga taacgctggc aaatggcgaa 4020

attagaaaga ggcctctcat agagactaac ggtgagacag gggaaatcgt ctgggataag 4080

ggtagggact ttgcgacagt gcgcaaggtc ctctctatgc cgcaagttaa tattgtgaag 4140

aaaaccgagg tgcagacggg aggcttctcc aaggaaagca tacttcccaa acggaactct 4200

gataagttga tcgctcgtaa gaaagattgg gaccctaaga aatatggtgg gttcgattcc 4260

ccaactgttg cttacagcgt gctggtcgtt gccaaggtcg agaagggtaa atccaagaaa 4320

ctcaaaagcg ttaaggaact ccttgggatt actatcatgg agagatcttc attcgaaaag 4380

aatcctatcg actttcttga ggccaaagga tataaggaag ttaagaaaga tctgataatc 4440

aaactcccaa agtactcatt gtttgagctg gaaaacggca ggaagcgcat gcttgcttcc 4500

gccggagagt tgcagaaagg gaacgagttg gctctgcctt ctaagtatgt taacttcctc 4560

tatcttgcct ctcattacga gaagctcaaa ggctcaccag aggacaacga acagaaacaa 4620

ctttttgtcg agcaacataa gcactatttg gatgagatta tagaacagat cagtgaattc 4680

tcgaaaaggg ttatccttgc agatgcgaat cttgacaagg tgttgtctgc atacaacaaa 4740

catagagata agccgatcag ggagcaagcg gaaaatatca ttcacctctt cactcttaca 4800

aacttgggtg ctcccgctgc cttcaagtat tttgatacca cgattgaccg gaaacgttac 4860

acctcaacga aggaggtgct ggatgccacc ctcatccacc aatctattac cggactctac 4920

gagactagaa tcgatctctc acagctcggc ggggataaaa gaccagcagc gacgaaaaag 4980

gcaggacagg ctaagaagaa gaaa 5004

<210>10

<211>23

<212>DNA

<213>人工序列(Artificial Sequence)

<400>10

cggcgacggc gagcaagtgg tgg 23

<210>11

<211>86

<212>DNA

<213>人工序列(Artificial Sequence)

<400>11

gtttcagagc tatgctggaa acagcatagc aagttgaaat aaggctagtc cgttatcaac 60

ttgaaaaagt ggcaccgagt cggtgc 86

<210>12

<211>229

<212>PRT

<213>人工序列(Artificial Sequence)

<400>12

Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg

1 5 10 15

Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu

20 25 30

Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His

35 40 45

Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val

50 55 60

Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr

65 70 75 80

Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys

85 90 95

Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu

100 105 110

Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg

115 120 125

Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met

130 135 140

Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser

145 150 155 160

Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg

165 170 175

Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys

180 185 190

Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile

195 200 205

Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp

210 215 220

Ala Thr Gly Leu Lys

225

Claims

1.成套试剂，其包括sgRNA或与所述sgRNA相关的生物材料、C·T碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料；

所述sgRNA骨架为将序列1第571-646位中的T替换为U得到的RNA分子；

所述esgRNA骨架为将序列11中的T替换为U得到的RNA分子；

与所述sgRNA相关的生物材料为编码所述sgRNA的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

与所述功能丧失的筛选剂抗性基因相关的生物材料为编码所述功能丧失的筛选剂抗性基因的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

与所述Cas9核酸酶相关的生物材料为编码所述Cas9核酸酶的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

与所述胞嘧啶脱氨酶相关的生物材料为编码所述胞嘧啶脱氨酶的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

所述功能丧失的筛选剂抗性基因为将筛选剂抗性基因的起始密码子删除，且在筛选剂抗性基因5’端添加代理靶点靶序列后得到的序列；所述C·T碱基替换系统在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述代理靶点靶序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复；

所述代理靶点靶序列为序列1第11305-11327位或序列10；

所述筛选剂抗性基因为外源抗性基因。

2.根据权利要求1所述的成套试剂，其特征在于：所述筛选剂抗性基因为潮霉素抗性基因。

3.根据权利要求1所述的成套试剂，其特征在于：所述sgRNA为前体tRNA-sgRNA；所述前体tRNA-sgRNA由靶向目标基因靶点序列的前体tRNA-esgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的前体tRNA-sgRNA组成；

所述靶向目标基因靶点序列的前体tRNA-esgRNA结构如下：前体tRNA-所述目标基因靶点序列转录的RNA-esgRNA骨架；

所述靶向所述功能丧失的筛选剂抗性基因靶点序列的前体tRNA-sgRNA结构如下：前体tRNA-所述功能丧失的筛选剂抗性基因靶点序列转录的RNA-sgRNA骨架；

所述前体tRNA为将序列1第474-550位中的T替换为U得到的RNA分子。

4.根据权利要求1所述的成套试剂，其特征在于：所述C·T碱基替换系统还包括UGI或与所述UGI相关的生物材料；

所述Cas9核酸酶为SpCas9n蛋白质或HypaCas9n蛋白质；

所述胞嘧啶脱氨酶为PmCDA1蛋白质或rAPOBEC1蛋白质；

所述SpCas9n蛋白质为序列2所示的蛋白质；

与所述SpCas9n相关的生物材料为B1）至B5）中的任一种：

B1）编码所述SpCas9n的核酸分子；

B2）含有B1）所述核酸分子的表达盒；

B3）含有B1）所述核酸分子的重组载体、或含有B2）所述表达盒的重组载体；

B4）含有B1）所述核酸分子的重组微生物、或含有B2）所述表达盒的重组微生物、或含有B3）所述重组载体的重组微生物；

B5）含有B1）所述核酸分子的转基因细胞系、或含有B2）所述表达盒的转基因细胞系；

所述HypaCas9n蛋白质为序列7所示的蛋白质；

与所述HypaCas9n相关的生物材料为D1）至D5）中的任一种：

D1）编码所述HypaCas9n的核酸分子；

D2）含有D1）所述核酸分子的表达盒；

D3）含有D1）所述核酸分子的重组载体、或含有D2）所述表达盒的重组载体；

D4）含有D1）所述核酸分子的重组微生物、或含有D2）所述表达盒的重组微生物、或含有D3）所述重组载体的重组微生物；

D5）含有D1）所述核酸分子的转基因细胞系、或含有D2）所述表达盒的转基因细胞系；

所述PmCDA1蛋白质为序列3所示的蛋白质；

与所述PmCDA1蛋白质相关的生物材料为F1）至F5）中的任一种：

F1）编码所述PmCDA1蛋白质的核酸分子；

F2）含有F1）所述核酸分子的表达盒；

F3）含有F1）所述核酸分子的重组载体、或含有F2）所述表达盒的重组载体；

F4）含有F1）所述核酸分子的重组微生物、或含有F2）所述表达盒的重组微生物、或含有F3）所述重组载体的重组微生物；

F5）含有F1）所述核酸分子的转基因细胞系、或含有F2）所述表达盒的转基因细胞系；

所述rAPOBEC1蛋白质为序列12所示的蛋白质；

与所述rAPOBEC1蛋白质相关的生物材料为H1）至H5）中的任一种：

H1）编码所述rAPOBEC1蛋白质的核酸分子；

H2）含有H1）所述核酸分子的表达盒；

H3）含有H1）所述核酸分子的重组载体、或含有H2）所述表达盒的重组载体；

H4）含有H1）所述核酸分子的重组微生物、或含有H2）所述表达盒的重组微生物、或含有H3）所述重组载体的重组微生物；

H5）含有H1）所述核酸分子的转基因细胞系、或含有H2）所述表达盒的转基因细胞系；

所述UGI蛋白质为序列4所示的蛋白质；

与所述UGI蛋白质相关的生物材料为J1）至J5）中的任一种：

J1）编码所述UGI蛋白质的核酸分子；

J2）含有J1）所述核酸分子的表达盒；

J3）含有J1）所述核酸分子的重组载体、或含有J2）所述表达盒的重组载体；

J4）含有J1）所述核酸分子的重组微生物、或含有J2）所述表达盒的重组微生物、或含有J3）所述重组载体的重组微生物；

J5）含有J1）所述核酸分子的转基因细胞系、或含有J2）所述表达盒的转基因细胞系。

5.权利要求1-4任一所述的成套试剂在M1）-M6）任一种中的应用：

M1）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞；

M2）制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品；

M3）提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率；

M4）制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品；

M5）生物体或生物细胞基因组靶点序列中的C·T碱基替换；

M6）制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。

6.N1）或N2）或N3）或N4）或N5）所述的方法：

N1）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-4中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述esgRNA、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N2）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-4中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的esgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述esgRNA、所述sgRNA和所述胞嘧啶脱氨酶均得到表达；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N3）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-4中任一所述的Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N4）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-4中任一所述的Cas9核酸酶、靶向目标基因靶点序列的esgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N5）生物突变体的制备方法，包括如下步骤：按照N1）或N2）或N3）或N4）所述的方法对生物体的基因组进行编辑，获得生物突变体；所述生物突变体为发生C·T碱基替换的生物体。

7.根据权利要求5所述的应用或权利要求6所述的方法，其特征在于：所述生物体为植物或动物；所述生物细胞为植物细胞或动物细胞。

8.根据权利要求7所述的应用或方法，其特征在于：所述植物为单子叶植物或双子叶植物；所述植物细胞为单子叶植物细胞或双子叶植物细胞。

9.根据权利要求8所述的应用或方法，其特征在于：所述单子叶植物为禾本科植物；所述单子叶植物细胞为禾本科植物细胞。

10.根据权利要求9所述的应用或方法，其特征在于：所述禾本科植物为水稻；所述禾本科植物细胞为水稻细胞。