CN110669794B

CN110669794B - 以突变的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用

Info

Publication number: CN110669794B
Application number: CN201910939081.4A
Authority: CN
Inventors: 杨进孝; 杨永星; 赵思; 李璐; 袁爽
Original assignee: Beijing Academy of Agriculture and Forestry Sciences
Current assignee: Beijing Academy of Agriculture and Forestry Sciences
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-07-16
Anticipated expiration: 2039-09-30
Also published as: CN110669794A

Abstract

本发明公开了以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用。所述细胞富集技术包括如下试剂：sgRNA、C·T碱基替换系统和功能丧失的筛选剂抗性基因；sgRNA由靶向目标基因靶点序列的tRNA‑sgRNA和靶向功能丧失的筛选剂抗性基因靶点序列的tRNA‑sgRNA组成；功能丧失的筛选剂抗性基因为将筛选剂抗性基因进行无功能突变后得到的序列；C·T碱基替换系统可通过对含有所述突变位点的靶序列进行C·T碱基替换使功能丧失的筛选剂抗性基因功能恢复。本发明实现了细胞水平上C·T碱基替换细胞富集，大大提高C·T碱基替换效率。

Description

以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用

技术领域

本发明涉及生物技术领域，具体涉及以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用。

背景技术

CRISPR-Cas9技术已经成为强有力的基因组编辑手段，被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上，切割产生DNA双链断裂(dsDNA break，DSB)，而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种，一种是非同源末端连接(non-homologous end joining，NHEJ)，另一种是同源重组(homology-directed repair，HDR)。通常情况下NHEJ占大多数，因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换，因为HDR效率低以及需要DNA模板，所以使用HDR实现碱基精确替换的应用受到很大的限制。

2016年，David Liu和Akihiko Kondo两个实验室分别独立报道了两种不同类型的胞嘧啶碱基编辑器(cytosine base editor，CBE)，分别使用了两种不同的胞苷脱氨酶rAPOBEC1(rat APOBEC1)和PmCDA1(activation-induced cytidine deaminase(AID)ortholog from sea lamprey)，原理都是通过使用胞苷脱氨酶直接实现对单个胞嘧啶(Cytosine，C)碱基进行编辑，而不再通过产生DSB和启动HDR修复，大大提高了C替换为胸腺嘧啶(Thymine，T)的碱基编辑效率。具体为dead Cas9(dCas9)或the Cas9 nickase(Cas9n)连带着rAPOBEC1或PmCDA1通过sgRNA定位到靶点，rAPOBEC1或PmCDA1催化非配对的单链DNA上的C发生胞嘧啶脱氨反应变成尿嘧啶(Uracil，U)，通过DNA的修复使得U与腺嘌呤(Adenine，A)配对，又通过DNA复制，最终使得T与A配对，从而实现了C到T的转换。在所测试的编辑器中，SpCas9n(D10A)&rAPOBEC1/PmCDA1&UGI碱基编辑系统(其含有尿嘧啶DNA糖化酶抑制剂(uracil DNA glycosylase inhibitor，UGI))的平均突变率较高，原因有二：一是UGI可以抑制尿嘧啶DNA糖化酶(uracil DNA glycosylase，UDG)催化清除DNA中U，二是SpCas9n(D10A)在非编辑链上产生切口，诱导真核错配修复机制或long-patch BER(base-excision repair)修复机制，促使U:G错配更多的偏好性修复成U:A。

目前，在植物中通过报告基因介导的细胞富集技术富集C·T碱基替换细胞的研究非常有限，目前尚无利用转化过程中使用筛选标记在细胞水平上实现C·T碱基替换细胞的富集，进而提高C·T碱基替换效率的报道。

发明内容

本发明的目的是提供一种以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术，该细胞富集技术能够在细胞水平上实现C·T碱基替换细胞的富集，进而提高目标靶点的C·T碱基替换效率。

为了实现上述目的，本发明首先提供了一种成套试剂，所述成套试剂包括sgRNA或与所述sgRNA相关的生物材料、C·T碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料；

所述sgRNA由靶向目标基因靶点序列的sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA组成；

所述sgRNA结构如下：所述靶点序列转录的RNA-sgRNA骨架；

所述C·T碱基替换系统包括Cas9核酸酶或与所述Cas9核酸酶相关的生物材料和胞嘧啶脱氨酶或与所述胞嘧啶脱氨酶相关的生物材料；

所述功能丧失的筛选剂抗性基因为将筛选剂抗性基因进行无功能突变后得到的序列；

所述功能丧失的筛选剂抗性基因靶点序列为含有所述突变位点的靶点序列；

所述C·T碱基替换系统在靶向所述含有所述突变位点的靶点序列的sgRNA的向导下，可通过对所述突变位点进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复；

所述sgRNA骨架为S1)或S2)或S3)：

S1)将序列1第571-646位中的T替换为U得到的RNA分子；

S2)将S1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

S3)与S1)或S2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子。

上述成套试剂中，所述sgRNA具体可为tRNA-sgRNA；所述tRNA-sgRNA由靶向所述目标基因靶点序列(内源靶点)的tRNA-sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列(代理靶点)的tRNA-sgRNA组成；

所述tRNA-sgRNA结构如下：tRNA-所述靶点序列转录的RNA-sgRNA骨架；

所述tRNA为R1)或R2)或R3)：

R1)将序列1第474-550位中的T替换为U得到的RNA分子；

R2)将R1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

R3)与R1)或R2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子。

上述成套试剂中，靶向所述目标基因靶点序列的个数可为一个或两个或多个；靶向所述功能丧失的筛选剂抗性基因靶点序列的个数可为一个或两个或多个。所述靶点序列大小可为15-25bp，进一步可为18-22bp，更进一步可为20bp。

所述无功能突变是指将正常的筛选剂抗性基因序列中的某一个或两个或多个碱基T突变为碱基C而使突变后的筛选剂抗性基因功能丧失，且通过对含有所述突变位点的靶点序列进行C·T碱基替换后可使功能丧失的筛选剂抗性基因功能恢复。

进一步的，所述筛选剂抗性基因可为现有技术中常见的筛选剂抗性基因，如Bar/PAT草铵膦-N-乙酰转移酶基因、PMI 6-磷酸甘露糖异构酶基因、EPSPS 5-烯醇丙酮莽草酸-3-磷酸合成酶基因等。在本发明的一个具体实施例中，所述筛选剂抗性基因为潮霉素抗性基因。

更进一步的，所述功能丧失的筛选标记基因为将正常的潮霉素抗性基因(序列5)的第272位由T突变为C，且将第274位由T突变为C后得到的序列。

所述功能丧失的筛选剂抗性基因靶点的靶序列为序列1第11574-11596位。所述功能丧失的筛选剂抗性基因靶点序列(含有突变位点的靶点序列)为序列1第11574-11593位。所述C·T碱基替换系统在靶向所述含有突变位点的靶点序列的tRNA-sgRNA的向导下，可通过对所述含有突变位点的靶点序列进行C·T碱基替换，使含有突变位点的靶点序列中的第3位和第5位的碱基C均突变为碱基T，进而使筛选标记基因功能恢复。

上述成套试剂中，所述C·T碱基替换系统还包括UGI或与所述UGI相关的生物材料。

上述成套试剂中，所述Cas9核酸酶包括不同来源的Cas9核酸酶或其变体、dead失活酶(dead Cas9，dCas9)或其变体、nickase切刻酶(Cas9 nickase，Cas9n)或其变体。所述不同来源的Cas9核酸酶或其变体包括来源于细菌的Cas9(如SaCas9、SaCas9-KKH等)，Cas9-PAM变体(如xCas9、NG Cas9、Cas9-VQR、Cas9-VRER等)，Cas9高保真酶变体(如HypaCas9、eSpCas9(1.1)、Cas9-HF1等)等。在本发明的一个具体实施例中，所述Cas9核酸酶为Cas9n，具体为SpCas9n蛋白质。在本发明的另一个具体实施例中，所述Cas9核酸酶为Cas9n，具体为HypaCas9n蛋白质。

所述胞嘧啶脱氨酶可为hAPOBE3A蛋白质、human AID蛋白质、PmCDA1蛋白质或rAPOBEC1蛋白质。在本发明的一个具体实施例中，所述胞嘧啶脱氨酶为PmCDA1蛋白质。

进一步的，所述SpCas9n蛋白质为A1)或A2)或A3)：

A1)氨基酸序列是序列2所示的蛋白质；

A2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质；

与所述SpCas9n相关的生物材料为B1)至B5)中的任一种：

B1)编码所述SpCas9n的核酸分子；

B2)含有B1)所述核酸分子的表达盒；

B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体；

B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物；

B5)含有B1)所述核酸分子的转基因细胞系、或含有B2)所述表达盒的转基因细胞系；

所述PmCDA1蛋白质为E1)或E2)或E3)：

E1)氨基酸序列是序列3所示的蛋白质；

E2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质；

与所述PmCDA1蛋白质相关的生物材料为F1)至F5)中的任一种：

F1)编码所述PmCDA1蛋白质的核酸分子；

F2)含有F1)所述核酸分子的表达盒；

F3)含有F1)所述核酸分子的重组载体、或含有F2)所述表达盒的重组载体；

F4)含有F1)所述核酸分子的重组微生物、或含有F2)所述表达盒的重组微生物、或含有F3)所述重组载体的重组微生物；

F5)含有F1)所述核酸分子的转基因细胞系、或含有F2)所述表达盒的转基因细胞系；

所述UGI蛋白质为I1)或I2)或I3)：

I1)氨基酸序列是序列4所示的蛋白质；

I2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

I3)在I1)或I2)的N端或/和C端连接标签得到的融合蛋白质；

与所述UGI蛋白质相关的生物材料为J1)至J5)中的任一种：

J1)编码所述UGI蛋白质的核酸分子；

J2)含有J1)所述核酸分子的表达盒；

J3)含有J1)所述核酸分子的重组载体、或含有J2)所述表达盒的重组载体；

J4)含有J1)所述核酸分子的重组微生物、或含有J2)所述表达盒的重组微生物、或含有J3)所述重组载体的重组微生物；

J5)含有J1)所述核酸分子的转基因细胞系、或含有J2)所述表达盒的转基因细胞系；

与所述功能丧失的筛选剂抗性基因相关的生物材料为K1)至K4)中的任一种：

K1)含有所述功能丧失的筛选剂抗性基因的表达盒；

K2)含有所述功能丧失的筛选剂抗性基因的重组载体、或含有K1)所述表达盒的重组载体；

K3)含有所述功能丧失的筛选剂抗性基因的重组微生物、或含有K1)所述表达盒的重组微生物、或含有K2)所述重组载体的重组微生物；

K4)含有所述功能丧失的筛选剂抗性基因的转基因细胞系、或含有K1)所述表达盒的转基因细胞系。

为了使A1)、E1)、I1)中的蛋白质便于纯化，可在由序列表中序列2或序列3或序列4所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。

表、标签的序列

标签	残基	序列
			Poly-Arg	5-6(通常为5个)	RRRRR
Poly-His	2-10(通常为6个)	HHHHHH
			FLAG	8	DYKDDDDK
Strep-tag II	8	WSHPQFEK
			c-myc	10	EQKLISEEDL

上述A2)、E2)、I2)中的蛋白质，为与序列2或序列3或序列4所示蛋白质的氨基酸序列具有75％或75％以上同一性且具有相同功能的蛋白质。所述具有75％或75％以上同一性为具有75％、具有80％、具有85％、具有90％、具有95％、具有96％、具有97％、具有98％或具有99％的同一性。

上述A2)、E2)、I2)中的蛋白质可人工合成，也可先合成其编码基因，再进行生物表达得到。

上述A2)、E2)、I2)中的蛋白质的编码基因可通过将序列1的第3529-7797位(编码序列2所示的蛋白质)、序列1的第8089-8712位(编码序列3所示的蛋白质)、序列1的第8734-9030位(编码序列4所示的蛋白质)所示的DNA序列中缺失一个或几个氨基酸残基的密码子，和/或进行一个或几个碱基对的错义突变，和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。

更进一步的，B1)所述核酸分子为b1)或b2)或b3)：

b1)序列表中序列1第3529-7797位所示的cDNA分子或DNA分子；

b2)与b1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述SpCas9n的cDNA分子或DNA分子；

b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交，且编码所述SpCas9n的cDNA分子或DNA分子；

F1)所述核酸分子为f1)或f2)或f3)：

f1)序列表中序列1第8089-8712位所示的cDNA分子或DNA分子；

f2)与f1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述PmCDA1的cDNA分子或DNA分子；

f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交，且编码所述PmCDA1的cDNA分子或DNA分子；

J1)所述核酸分子为j1)或j2)或j3)：

j1)序列表中序列1的第8734-9030位所示的cDNA分子或DNA分子；

j2)与j1)限定的核苷酸序列具有75％或75％以上同一性，且编码所述UGI的cDNA分子或DNA分子；

j3)在严格条件下与j1)或j2)限定的核苷酸序列杂交，且编码所述UGI的cDNA分子或DNA分子；

K1)所述功能丧失的筛选剂抗性基因为序列1第11305-12330位所示的DNA分子。

其中，所述核酸分子可以是DNA，如cDNA、基因组DNA或重组DNA；所述核酸分子也可以是RNA，如mRNA或hnRNA等。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化和点突变的方法，对本发明的编码所述SpCas9n或所述PmCDA1或所述UGI的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明的所述SpCas9n或所述PmCDA1或所述UGI的核苷酸序列75％或者更高同一性的核苷酸，只要编码所述SpCas9n或所述PmCDA1或所述UGI且具有相同功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75％或更高，或85％或更高，或90％或更高，或95％或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件，两个或多个序列之间的同一性可以用百分比(％)表示，其可以用来评价相关序列之间的同一性。

所述严格条件是在2×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次5min，又于0.5×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次15min；或，0.1×SSPE(或0.1×SSC)、0.1％SDS的溶液中，65℃条件下杂交并洗膜。

上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。

B2)所述的含有编码SpCas9n蛋白质的核酸分子的表达盒(SpCas9n基因表达盒)，是指能够在宿主细胞中表达SpCas9n蛋白质的DNA，该DNA不但可包括启动SpCas9n基因转录的启动子，还可包括终止SpCas9n基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述SpCas9n基因表达盒的重组载体。

F2)所述的含有编码PmCDA1蛋白质的核酸分子的表达盒(PmCDA1基因表达盒)，是指能够在宿主细胞中表达PmCDA1蛋白质的DNA，该DNA不但可包括启动PmCDA1基因转录的启动子，还可包括终止PmCDA1基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述PmCDA1基因表达盒的重组载体。

J2)所述的含有编码UGI蛋白质的核酸分子的表达盒(UGI基因表达盒)，是指能够在宿主细胞中表达UGI蛋白质的DNA，该DNA不但可包括启动UGI基因转录的启动子，还可包括终止UGI基因转录的终止子。进一步，所述表达盒还可包括增强子序列。可用现有的表达载体构建含有所述UGI基因表达盒的重组载体。

所述载体可为质粒、黏粒、噬菌体或病毒载体。在本发明的具体实施例中，所述重组载体具体为sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体或sgRNA^-TP-Hyg^-TP/sgRNA-GT-2重组表达载体。

所述sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体的序列为序列1。所述sgRNA^-ATG-Hyg^-ATG/sgRNA-GT-1重组表达载体含有六个靶点序列，序列见表1。

所述sgRNA^-TP-Hyg^-TP/sgRNA-GT-2重组表达载体的序列为将序列1中的前五个靶点序列依次分别替换为如下五个靶点序列ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

所述微生物可为酵母、细菌、藻或真菌。其中，所述细菌可为农杆菌，如农杆菌EHA105。在本发明的具体实施例中，所述重组微生物具体为含有所述sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体或所述sgRNA^-TP-Hyg^-TP/sgRNA-GT-2重组表达载体。

所述转基因细胞系不包括繁殖材料。

上述成套试剂具有如下用途：

M1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞；

M2)制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品；

M3)提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率；

M4)制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品；

M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换；

M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。

上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料也属于本发明的保护范围。

为了实现上述目的，本发明还提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料的新用途。

本发明提供了上述成套试剂或上述功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料在M1)-M6)任一种中的应用：

M5)生物体或生物细胞基因组靶点序列中的C·T碱基替换；

M6)制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。

为了实现上述目的，本发明还提供了N1)或N2)或N3)或N4)或N5)所述的方法：

N1)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N2)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶均得到表达；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N3)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N4)富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将上述Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N5)生物突变体的制备方法，包括如下步骤：按照N1)或N2)或N3)或N4)所述的方法对生物体的基因组进行编辑，获得生物突变体；所述生物突变体为发生C·T碱基替换的生物体。

上述方法中，所述靶向目标基因靶点序列的sgRNA为靶向目标基因靶点序列的tRNA-sgRNA，所述靶向功能丧失的筛选剂抗性基因靶点序列的sgRNA为靶向功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA。进一步的，所述转录靶向目标基因靶点序列的tRNA-sgRNA的DNA分子或所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA的DNA分子转录后得到的tRNA-sgRNA为不成熟的RNA前体，该RNA前体中的tRNA会被两种酶(RNase P和RNase Z)切割掉后得到成熟的RNA。一个重组表达载体中有多少个靶点，就会得到多少个独立的成熟的RNA，每个成熟的RNA依次由所述靶点序列转录的RNA和所述sgRNA骨架组成，或依次由所述tRNA残留的个别碱基、所述靶点序列转录的RNA和所述sgRNA骨架组成。

上述方法中，所述N1)或N3)中，所述UGI的个数可为一个或两个或多个。在本发明的具体实施例中，所述UGI的个数具体为一个。

上述方法中，所述N1)中，所述Cas9核酸酶的编码基因、所述转录靶向目标基因靶点序列的sgRNA的DNA分子、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、所述胞嘧啶脱氨酶的编码基因和所述UGI的编码基因通过含有所述Cas9核酸酶的编码基因的表达盒、所述转录靶向目标基因靶点序列的sgRNA的DNA分子的表达盒、所述转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子的表达盒、所述胞嘧啶脱氨酶的编码基因的表达盒和所述UGI的编码基因的表达盒的重组载体导入生物体或生物细胞内。上述各个表达盒可通过同一个重组表达载体导入生物体或生物细胞内，也可通过两个或者多个重组表达载体共同导入生物体或生物细胞内。

在本发明的具体实施例中，上述各个表达盒通过同一个重组表达载体导入生物体或生物细胞内，所述重组表达载体具体为上述sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体或上述sgRNA^-TP-Hyg^-TP/sgRNA-GT-2重组表达载体。

上述成套试剂或应用或方法中，所述C·T碱基替换为碱基C突变为碱基T。所述碱基C可为位于所述靶点序列中任意位置的碱基C。

上述成套试剂或应用或方法中，所述生物体为P1)或P2)或P3)或P4)：

P1)植物或动物；

P2)单子叶植物或双子叶植物；

P3)禾本科植物；

P4)水稻(如日本晴水稻)；

所述生物细胞为Q1)或Q2)或Q3)或Q4)：

Q1)植物细胞或动物细胞；

Q2)单子叶植物细胞或双子叶植物细胞；

Q3)禾本科植物细胞；

Q4)水稻细胞(如日本晴水稻细胞)。

本发明的细胞富集技术原理如下：以失活的筛选剂抗性基因为报告基因，建立一种C·T碱基替换的细胞富集技术，使得报告基因上发生了C·T碱基替换的细胞能够在含有筛选剂的培养基中生长出来，没有发生C·T碱基替换的细胞不能够在含有筛选剂的培养基中生长。在此报告基因的基础上，如果同时对内源目标基因靶点进行C·T碱基替换编辑，在含有筛选剂的培养基中生长出来的细胞有更大的概率发生内源目标基因靶点的C·T碱基替换，从而实现对内源目标基因靶点发生C·T碱基替换的细胞的富集，进而提高内源目标基因靶点的C·T碱基替换效率。

本发明具有以下优点：

1、有多种不同类型的基因可以作为报告基因，在植物中进行C·T碱基替换的细胞富集。由于各种作物的遗传转化方法(如农杆菌转化法、基因枪转化法)都有相对成熟、稳定的筛选体系，使用转化用筛选剂对应的抗性基因作为报告基因进行基因组内源突变细胞的富集，比其余的如荧光报告基因、内源除草剂抗性基因等，更具有广谱性、通用性。

2、技术设计简便，其中的代理靶点以及设计形式可以更广泛的应用到更多的筛选剂对应的抗性基因中，以满足不同作物的不同转化筛选体系的需求。

3、本发明的细胞富集技术对不同的脱氨酶介导的碱基编辑器或者是不同的Cas9酶介导的碱基编辑器均实现了细胞水平上C·T碱基替换细胞富集，大大提高C·T碱基替换效率。

附图说明

图1为细胞富集技术载体sgRNA^-TP-Hyg^-TP/sgRNA-GT和非细胞富集技术载体sgRNA-GT的结构示意图。

图2为细胞富集技术的工作原理示意图。

图3为重组载体的结构示意图。

图4为细胞富集技术载体sgRNA^-TP-Hyg^-TP/sgRNA-GT和非细胞富集技术载体sgRNA-GT在抗性愈伤中对靶点的C·T碱基替换效率比较。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂、仪器等，如无特殊说明，均可从商业途径得到。下述实施例中，如无特殊说明，序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸，末位均为相应DNA/RNA的3′末端核苷酸。

引物对T1由引物T1-F：5’-gtaagaaccaccagcgacac-3’和引物T1-R：5’-gtaattgtgcttggtgatgga-3’组成，用于扩增靶点ALS-T1。

引物对T2由引物T2-F：5’-aatatgccattcaggtgctgg-3’和引物T2-R：5’-atcataggcagcacatgctcc-3’组成，用于扩增靶点ALS-T2。

引物对T3由引物T3-F：5’-atggctacgaccgccgcgg-3’和引物T3-R：5’-gcctcaattttccctgtcacacgatc-3’组成，用于扩增靶点ALS-T3。

引物对T4由引物T4-F：5’-attgtggctcgtgctctacc-3’和引物T4-R：5’-agacacacccacaggaacatt-3’组成，用于扩增靶点DEP1。

引物对T5由引物T5-F：5’-cttcaaattctaatccccaatcc-3’和引物T5-R：5’-ggttgttgttgaggtttaggatc-3’组成，用于扩增靶点Waxy。

引物对T6由引物T6-F：5’-ttacgaactttataactttgtcgg-3’和引物T6-R：5’-atggaggcgatgaggaagac-3’组成，用于扩增靶点NRT1.1B-T1。

引物对T7由引物T7-F：5’-ctaatcctaccaattaacgagtcg-3’和引物T7-R：5’-accagttgaagaagcgcatc-3’组成，用于扩增靶点NRT1.1B-T2。

引物对T8由引物T8-F：5’-cctccatcctcctcaccg-3’和引物T8-R：5’-tgaccttgtggacgatggtg-3’组成，用于扩增靶点NRT1.1B-T3。

引物对T9由引物T9-F：5’-acatcgagatggagaagcgg-3’和引物T9-R：5’-ccatgctccaatcgatgaatac-3’组成，用于扩增靶点CDC48-T1。

引物对T10由引物T10-F：5’-agacaccatctgcattgttct-3’和引物T10-R：5’-ggatgtaagaaggcgacactag-3’组成，用于扩增靶点CDC48-T2。

以下实施例中，C·T碱基替换是指靶点序列中任何位置的C突变为T。

C·T碱基替换效率＝发生C·T碱基替换的阳性抗性愈伤数/分析的总阳性抗性愈伤数×100％。

日本晴水稻：参考文献：梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.；公众可以从北京市农林科学院获得。

恢复培养基：含有200mg/L特美汀的N6固体培养基。

筛选培养基：含有50mg/L潮霉素的N6固体培养基。

实施例1、C·T碱基替换的细胞富集技术的建立

一、C·T碱基替换的细胞富集技术载体的建立

将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的普通技术(非细胞富集技术)载体命名为sgRNA-GT。

将Cas9核酸酶、胞嘧啶脱氨酶和UGI介导的C·T碱基替换的细胞富集技术载体命名为sgRNA^-TP-Hyg^-TP/sgRNA-GT。

以Cas9核酸酶为SpCas9n，胞嘧啶脱氨酶为PmCDA1为例：sgRNA^-TP-Hyg^-TP/sgRNA-GT和sgRNA-GT载体的结构示意图均如图1所示。

细胞富集技术载体为在非细胞富集技术载体基础上对筛选剂抗性基因进行基因突变使其功能丧失，同时在sgRNA部分加入相应的含有所述突变位点的靶点序列(代理靶点序列)后得到的载体。

以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例：非细胞富集技术载体中的筛选剂抗性基因为正常的潮霉素抗性基因Hygromycin。细胞富集技术载体中的筛选剂抗性基因为突变的潮霉素抗性基因Hygromycin，突变的潮霉素抗性基因Hygromycin(称为Hygromycin^-TP，简称Hyg^-TP)为将正常的潮霉素抗性基因的第272位由T突变为C，且将第274位由T突变为C后得到的序列，Hyg^-TP基因编码的潮霉素抗性蛋白的氨基酸序列为将正常的潮霉素抗性蛋白的第91位由异亮氨酸(密码子为ATC)突变为苏氨酸(密码子为ACC)，且将第92位由丝氨酸(密码子为TCC)突变为脯氨酸(密码子为CCC)后得到的序列。

Hyg^-TP序列为序列1第11305-12330位，其中，第11574-11596位为含有上述突变位点的代理靶点靶序列：caccccccgccgttcacaggggg(斜体所示的碱基为PAM序列)(序列6)。

二、C·T碱基替换的细胞富集技术的工作原理

C·T碱基替换的细胞富集技术的工作原理如图2所示。以筛选剂抗性基因为潮霉素抗性基因Hygromycin为例：在细胞富集技术中，由于潮霉素抗性基因Hygromycin含有突变位点，抗性功能丧失，在潮霉素筛选培养基中，植物无法长出抗性愈伤，当细胞富集技术中的C·T碱基替换系统(由Cas9核酸酶、胞嘧啶脱氨酶和UGI组成的C·T碱基替换系统)在sgRNA向导下将含有上述突变位点的靶点序列中的第3位和第5位的C均突变为T，使Hyg^-TP恢复为正常的潮霉素抗性基因Hygromycin，能够正常表达，恢复抗性功能，进而使植物在潮霉素筛选培养基中长出抗性愈伤。由于长出抗性愈伤的细胞已经发生了C·T碱基替换，那么此细胞对应的内源基因发生C·T碱基替换的效率相对会更高，从而达到富集C·T碱基替换细胞的目的，实现提高植物内源靶点的C·T碱基替换效率。

实施例2、Cas9n&PmCDA1&UGI介导的细胞富集技术载体的构建及其在水稻基因组编辑中的应用

一、重组表达载体的构建

本实施例中的重组表达载体为Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的普通技术载体sgRNA-GT及Cas9n&PmCDA1&UGI(PCBE)介导的C·T碱基替换的细胞富集技术载体sgRNA^-TP-Hyg^-TP/sgRNA-GT。各载体均为环状质粒。两种重组表达载体各元件结构示意图均如图3所示。

根据含有的靶序列不同，每种重组表达载体又各自分成两种，共有如下四种重组表达载体：sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体、sgRNA^-TP-Hyg^-TP/sgRNA-GT-2重组表达载体、sgRNA-GT-1重组表达载体、sgRNA-GT-2重组表达载体。

人工合成上述四种重组表达载体，四种重组表达载体的具体结构描述分别如下：

sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体的序列为序列表中的序列1。序列1的第131-467位为OsU3启动子的核苷酸序列，第474-550位、第647-723位、第820-896位、第993-1069位、第1166-1242位、第1339-1415位均为tRNA的核苷酸序列，第551-570位、第724-743位、第897-916位、第1070-1089位、第1243-1262位分别为靶向OsALS、OsCDC48、OsNRT1.1B、OsWax、OsALS基因的五个靶点序列，第1416-1435位为Hyg^-TP报告基因代理靶点序列。第571-646位、第744-819位、第917-992位、第1090-1165位、第1263-1338位、第1436-1511位为sgRNA的核苷酸序列，第1512-1802位为OsU3终止子的核苷酸序列；序列1的第1809-3522位为OsUbq3启动子的核苷酸序列，第3529-7797位为SpCas9n蛋白质的编码序列(不含有终止密码子)，编码序列2所示的SpCas9n蛋白质；序列1的第8089-8712位为PmCDA1蛋白质的编码序列(不含有终止密码子)，编码序列3所示的PmCDA1蛋白质；序列1的第8734-9030位为UGI蛋白质的编码序列，编码序列4所示的UGI蛋白质；序列1的第9037-9231位为35S终止子的核苷酸序列，第9306-11298位为ZmUbi1启动子的核苷酸序列，第11305-12330位为Hyg^-TP序列，第12357-12572位为CaMV35S polyA终止子的核苷酸序列。sgRNA^-TP-Hyg^-TP/sgRNA-GT-1重组表达载体中六个靶点序列见表1，靶点分别为ALS-T1、CDC48-T1、NRT1.1B-T1、Waxy、ALS-T2、Hyg^-TP。

sgRNA^-TP-Hyg^-TP/sgRNA-GT-2重组表达载体的序列为将序列1中的前五个靶点序列依次分别替换为如下五个靶点序列ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

sgRNA-GT-1重组表达载体的序列为将序列1第11305-12330位替换为序列5所示的正常的潮霉素抗性基因序列，且保持其他序列不变后得到的序列。

sgRNA-GT-2重组表达载体将sgRNA-GT-1重组表达载体中的前五个靶点序列依次分别替换为如下五个靶点序列ALS-T3、CDC48-T2、NRT1.1B-T3、NRT1.1B-T2、DEP1，且保持其他序列不变后得到的序列。对应的靶序列信息见表1。

各载体的sgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。

表1

二、水稻阳性抗性愈伤的获得

将步骤一获得的sgRNA^-TP-Hyg^-TP/sgRNA-GT-1载体，sgRNA^-TP-Hyg^-TP/sgRNA-GT-2载体，sgRNA-GT-1载体和sgRNA-GT-2载体分别按照如下步骤1-8进行操作：

1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品，CAT#:AC1010)，得到重组农杆菌。

2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌，28℃，150rpm震荡培养至OD₆₀₀为1.0-2.0，室温条件下，10000rpm离心1min，用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖，葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD₆₀₀为0.2，得到农杆菌侵染液。

3、水稻品种日本晴成熟种子去壳脱粒，置于100mL三角瓶中，加入70％(v/v)乙醇水溶液浸泡30sec，再置于25％(v/v)次氯酸钠水溶液中，120rpm震荡灭菌30min，无菌水冲洗3次，用滤纸吸干水分，然后将种子胚朝下置于N6固体培养基上，28℃暗培养4-6周，得到水稻愈伤。

4、完成步骤3后，将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体，乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl：50ml)中浸泡10min，然后，放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上，21℃暗培养1天。

5、取步骤4得到的水稻愈伤放入恢复培养基上，25-28℃暗培养3天。

6、取步骤5得到的水稻愈伤，置于筛选培养基上，28℃暗培养2周。

7、取步骤6得到的水稻愈伤，再次置于筛选培养基上，28℃暗培养2周，得到水稻抗性愈伤。

8、分别提取20-24块水稻抗性愈伤的基因组DNA并以其作为模板，采用引物F(5’-attatgtagcttgtgcgtttcg-3’)和引物R(5’-gatgaagagcttatcgacgt-3’)组成的引物对进行PCR扩增，得到PCR扩增产物；将该PCR扩增产物进行琼脂糖凝胶电泳，然后进行如下判断：如果PCR扩增产物中含有约1150bp的DNA片段，则相应的水稻抗性愈伤为水稻阳性抗性愈伤；如果PCR扩增产物中不含有约1150bp的DNA片段，则相应的水稻抗性愈伤不为水稻阳性抗性愈伤。

三、结果分析

1、每载体分别取步骤二所获得的20-24块水稻阳性抗性愈伤的基因组DNA作为模板(独立侵染两次，获得平均值和方差)，对于ALS-T1靶点，采用引物对T1进行PCR扩增，得到PCR扩增产物；对于ALS-T2靶点，采用引物对T2进行PCR扩增，得到PCR扩增产物；对于ALS-T3靶点，采用引物对T3进行PCR扩增，得到PCR扩增产物；对于DEP1靶点，采用引物对T4进行PCR扩增，得到PCR扩增产物；对于Waxy靶点，采用引物对T5进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T1靶点，采用引物对T6进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T2靶点，采用引物对T7进行PCR扩增，得到PCR扩增产物；对于NRT1.1B-T3靶点，采用引物对T8进行PCR扩增，得到PCR扩增产物；对于CDC48-T1靶点，采用引物对T9进行PCR扩增，得到PCR扩增产物；对于CDC48-T2靶点，采用引物对T10进行PCR扩增，得到PCR扩增产物。

2、将步骤1得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各载体各靶点的发生C·T碱基替换的水稻阳性抗性愈伤数，计算得出C·T碱基替换效率，结果见图4。

结果表明，通过使用细胞富集技术，ALS-T1靶点中第3位C的C·T碱基替换效率从44％增加到64％；ALS-T2靶点中第4位C的C·T碱基替换效率从29％增加到55％；ALS-T3靶点中第5位C的平均C·T碱基替换效率从40％增加到54％；NRT1.1B-T3靶点中第5位C的平均C·T碱基替换效率从40％增加到46％；NRT1.1B-T2靶点中第3位C的平均C·T碱基替换效率从20％增加到35％；Waxy靶点中第11位C的C·T碱基替换效率从4％增加到12％；CDC48-T1靶点中第3位C的平均C·T碱基替换效率从55％增加到62％；CDC48-T2靶点中第3位C的C·T碱基替换效率从0增加到15％。综上所述，通过使用细胞富集技术大部分靶点的C·T碱基替换效率提升至普通技术体系的1.2-3倍。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

序列表

<110>北京市农林科学院

<120>以突变的筛选剂抗性基因为报告体系的C·T碱基替换的细胞富集技术及其应用

<160>6

<170>PatentIn version 3.5

<210>1

<211>18978

<212>DNA

<213>人工序列(Artificial Sequence)

<400>1

ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60

ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120

ttaaggtacc gaagcaactt aaagttatca ggcatgcatg gatcttggag gaatcagatg 180

tgcagtcagg gaccatagca caagacaggc gtcttctact ggtgctacca gcaaatgctg 240

gaagccggga acactgggta cgttggaaac cacgtgatgt gaagaagtaa gataaactgt 300

aggagaaaag catttcgtag tgggccatga agcctttcag gacatgtatt gcagtatggg 360

ccggcccatt acgcaattgg acgacaacaa agactagtat tagtaccacc tcggctatcc 420

acatagatca aagctgattt aaaagagttg tgcagatgat ccgtggcgga tccaacaaag 480

caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 540

ggctggtgca cgcgtccatg gagatccacc gttttagagc tagaaatagc aagttaaaat 600

aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaaca aagcaccagt 660

ggtctagtgg tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt 720

gcagaccagc cagcgtctgg cgcgttttag agctagaaat agcaagttaa aataaggcta 780

gtccgttatc aacttgaaaa agtggcaccg agtcggtgca acaaagcacc agtggtctag 840

tggtagaata gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcacggc 900

gacggcgagc aagtgggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 960

atcaacttga aaaagtggca ccgagtcggt gcaacaaagc accagtggtc tagtggtaga 1020

atagtaccct gccacggtac agacccgggt tcgattcccg gctggtgcat tgtaatcaac 1080

tccagtgtcg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 1140

tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg gtctagtggt agaatagtac 1200

cctgccacgg tacagacccg ggttcgattc ccggctggtg cagaacaacc aacatttggg 1260

tagttttaga gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa 1320

gtggcaccga gtcggtgcaa caaagcacca gtggtctagt ggtagaatag taccctgcca 1380

cggtacagac ccgggttcga ttcccggctg gtgcacaccc cccgccgttc acagggtttt 1440

agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 1500

cgagtcggtg cttttttttt tcgttttgca ttgagttttc tccgtcgcat gtttgcagtt 1560

ttattttccg ttttgcattg aaatttctcc gtctcatgtt tgcagcgtgt tcaaaaagta 1620

cgcagctgta tttcacttat ttacggcgcc acattttcat gccgtttgtg ccaactatcc 1680

cgagctagtg aatacagctt ggcttcacac aacactggtg acccgctgac ctgctcgtac 1740

ctcgtaccgt cgtacggcac agcatttgga attaaagggt gtgatcgata ctgcttgctg 1800

ctaagcttac aaattcgggt caaggcggaa gccagcgcgc caccccacgt cagcaaatac 1860

ggaggcgcgg ggttgacggc gtcacccggt cctaacggcg accaacaaac cagccagaag 1920

aaattacagt aaaaaaaaag taaattgcac tttgatccac cttttattac ctaagtctca 1980

atttggatca cccttaaacc tatcttttca atttgggccg ggttgtggtt tggactacca 2040

tgaacaactt ttcgtcatgt ctaacttccc tttcagcaaa catatgaacc atatatagag 2100

gagatcggcc gtatactaga gctgatgtgt ttaaggtcgt tgattgcacg agaaaaaaaa 2160

atccaaatcg caacaatagc aaatttatct ggttcaaagt gaaaagatat gtttaaaggt 2220

agtccaaagt aaaacttata gataataaaa tgtggtccaa agcgtaattc actcaaaaaa 2280

aatcaacgag acgtgtacca aacggagaca aacggcatct tctcgaaatt tcccaaccgc 2340

tcgctcgccc gcctcgtctt cccggaaacc gcggtggttt cagcgtggcg gattctccaa 2400

gcagacggag acgtcacggc acgggactcc tcccaccacc caaccgccat aaataccagc 2460

cccctcatct cctctcctcg catcagctcc acccccgaaa aatttctccc caatctcgcg 2520

aggctctcgt cgtcgaatcg aatcctctcg cgtcctcaag gtacgctgct tctcctctcc 2580

tcgcttcgtt tcgattcgat ttcggacggg tgaggttgtt ttgttgctag atccgattgg 2640

tggttagggt tgtcgatgtg attatcgtga gatgtttagg ggttgtagat ctgatggttg 2700

tgatttgggc acggttggtt cgataggtgg aatcgtggtt aggttttggg attggatgtt 2760

ggttctgatg attgggggga atttttacgg ttagatgaat tgttggatga ttcgattggg 2820

gaaatcggtg tagatctgtt ggggaattgt ggaactagtc atgcctgagt gattggtgcg 2880

atttgtagcg tgttccatct tgtaggcctt gttgcgagca tgttcagatc tactgttccg 2940

ctcttgattg agttattggt gccatgggtt ggtgcaaaca caggctttaa tatgttatat 3000

ctgttttgtg tttgatgtag atctgtaggg tagttcttct tagacatggt tcaattatgt 3060

agcttgtgcg tttcgatttg atttcatatg ttcacagatt agataatgat gaactctttt 3120

aattaattgt caatggtaaa taggaagtct tgtcgctata tctgtcataa tgatctcatg 3180

ttactatctg ccagtaattt atgctaagaa ctatattaga atatcatgtt acaatctgta 3240

gtaatatcat gttacaatct gtagttcatc tatataatct attgtggtaa tttcttttta 3300

ctatctgtgt gaagattatt gccactagtt cattctactt atttctgaag ttcaggatac 3360

gtgtgctgtt actacctatc tgaatacatg tgtgatgtgc ctgttactat ctttttgaat 3420

acatgtatgt tctgttggaa tatgtttgct gtttgatccg ttgttgtgtc cttaatcttg 3480

tgctagttct taccctatct gtttggtgat tatttcttgc agtacgtaat ggactacaag 3540

gaccacgacg gggattacaa agaccacgac atagactaca aggatgacga tgacaaaatg 3600

gcaccgaaga aaaaaaggaa ggtcggaatc catggcgttc cagctgccga taagaaatat 3660

tccatcggac tcgccattgg cacgaatagc gtcggatggg ctgttattac tgatgagtac 3720

aaagttccgt ctaagaagtt caaggtgctg ggcaacacag accgccacag cataaagaaa 3780

aatctcatcg gtgcactcct tttcgatagt ggggagactg cagaagcgac aagattgaaa 3840

aggactgcga gaaggcgcta tacacggcgt aagaatagaa tctgctacct tcaggagatt 3900

ttctctaacg aaatggctaa ggtcgatgac agtttctttc atagacttga ggaatcgttc 3960

ttggttgagg aggataagaa acatgagagg cacccgatat ttggaaacat cgtggatgag 4020

gtcgcatatc atgaaaagta ccccacaatc taccacctga gaaagaaact cgttgattcc 4080

accgacaaag cggatttgag actcatctac ctcgctcttg cccatatgat aaagttccgc 4140

ggacactttc tgatcgaggg cgacctcaac cctgataata gcgacgtcga taagctcttc 4200

atccagttgg ttcaaaccta caatcagctc tttgaggaaa acccaattaa tgctagtgga 4260

gtggatgcaa aagcgatact gtcggccaga ctctccaaga gcagaaggtt ggagaacctg 4320

atcgctcaac ttcctggaga aaagaaaaac ggtctttttg ggaatttgat tgccttgtct 4380

ctgggcctca caccaaactt caagtcaaat tttgacctcg ctgaggatgc caaacttcag 4440

ttgtctaagg atacctatga tgacgatctt gacaatttgc tggcacaaat tggcgaccag 4500

tacgcggatc tgttcctcgc agcgaagaat ctgagtgatg ctattctcct ttcggacata 4560

ctcagggtta acactgagat cacaaaagca cctttgagtg cgtcgatgat taagcgctat 4620

gatgaacatc accaagacct cactttgctg aaggcccttg tgcggcagca attgccagag 4680

aagtacaaag aaatcttctt tgaccaatct aagaacggat acgctggcta tattgatgga 4740

ggagcttctc aggaggaatt ctataagttt atcaaaccta tacttgagaa gatggatggt 4800

acagaggaac tccttgttaa attgaacaga gaagatttgc tgcgcaagca acggaccttt 4860

gacaacggat caattccgca tcagatacac ctcggcgagc ttcatgccat ccttcgccgg 4920

caggaagatt tctacccctt tttgaaggac aaccgcgaga agatagaaaa aatccttacg 4980

ttccggattc cttactatgt gggtccattg gcaaggggga attcccgctt tgcgtggatg 5040

actcggaaaa gcgaggaaac tatcacaccg tggaacttcg aggaagttgt ggacaaggga 5100

gcttctgccc aatcattcat tgagaggatg actaacttcg ataagaacct gccgaacgag 5160

aaagttctcc ccaagcactc cctcctttac gagtatttca ccgtgtataa cgaacttacg 5220

aaggttaaat acgtgactga gggtatgagg aagccagcat tcttgagcgg ggaacaaaag 5280

aaagcgattg ttgatttgct gtttaaaact aatcgcaagg tgacagtcaa gcagctcaaa 5340

gaggattatt tcaagaaaat tgaatgtttc gactctgtgg agatatcagg agtcgaagat 5400

aggtttaacg cttcccttgg cacataccat gacctcctta agatcattaa ggacaaagat 5460

ttcctggata acgaggaaaa tgaggacatc ctcgaagata ttgttcttac cttgacgctg 5520

tttgaggatc gcgaaatgat cgaggaacgg cttaagacgt atgctcactt gttcgacgat 5580

aaggttatga agcagctcaa gcgtagaagg tacactggat ggggccgtct gtctagaaag 5640

ctcatcaacg gaatacgtga taaacaaagt ggcaagacaa ttttggattt tctgaagtcg 5700

gacggattcg ccaacagaaa ttttatgcag ctgattcatg acgatagtct caccttcaaa 5760

gaggacatac agaaggctca agtgagtggt caaggggatt cgctgcatga acacatcgca 5820

aacctcgcgg gttcaccggc cataaagaaa ggaatccttc aaactgttaa ggtcgttgat 5880

gagttggtta aagtgatggg taggcacaag cccgaaaaca tagtgatcga gatggctcgc 5940

gaaaatcaga ctacacaaaa agggcagaag aactctcgcg agcggatgaa aaggattgag 6000

gaaggaatca aggaactggg ctcacagatt ctcaaagagc atccagtcga aaacacacag 6060

ctgcaaaatg agaagctcta tctttactat ctccaaaatg gccgggacat gtatgttgat 6120

caggagcttg acatcaaccg tttgtccgac tatgatgtgg accacattgt cccgcaatct 6180

ttccttaagg acgattcaat cgataataag gtgttgaccc ggagcgataa aaaccgtgga 6240

aagtctgaca atgtcccttc agaggaagtg gttaagaaga tgaagaacta ctggagacaa 6300

ttgctgaatg caaaactgat cacacagaga aagttcgaca acctcaccaa agcagagaga 6360

ggtgggctca gtgaacttga taaagcgggc ttcattaagc gtcagctcgt tgagactaga 6420

cagatcacga agcatgtcgc gcagattttg gattcgcgga tgaacacgaa gtacgacgag 6480

aatgataaac tgatacgtga agtcaaggtt atcactctta agtccaaatt ggtgagcgat 6540

ttcagaaagg acttccaatt ctataaggtc agggagatca acaattatca tcacgctcac 6600

gatgcctacc ttaatgctgt tgtggggacc gcccttatta agaaataccc taaattggag 6660

tctgaattcg tttacgggga ttataaggtc tacgacgtta ggaaaatgat agctaagagt 6720

gagcaggaga tcggtaaagc aactgcgaag tatttctttt actcgaacat catgaatttc 6780

tttaagaccg agataacgct ggcaaatggc gaaattagaa agaggcctct catagagact 6840

aacggtgaga caggggaaat cgtctgggat aagggtaggg actttgcgac agtgcgcaag 6900

gtcctctcta tgccgcaagt taatattgtg aagaaaaccg aggtgcagac gggaggcttc 6960

tccaaggaaa gcatacttcc caaacggaac tctgataagt tgatcgctcg taagaaagat 7020

tgggacccta agaaatatgg tgggttcgat tccccaactg ttgcttacag cgtgctggtc 7080

gttgccaagg tcgagaaggg taaatccaag aaactcaaaa gcgttaagga actccttggg 7140

attactatca tggagagatc ttcattcgaa aagaatccta tcgactttct tgaggccaaa 7200

ggatataagg aagttaagaa agatctgata atcaaactcc caaagtactc attgtttgag 7260

ctggaaaacg gcaggaagcg catgcttgct tccgccggag agttgcagaa agggaacgag 7320

ttggctctgc cttctaagta tgttaacttc ctctatcttg cctctcatta cgagaagctc 7380

aaaggctcac cagaggacaa cgaacagaaa caactttttg tcgagcaaca taagcactat 7440

ttggatgaga ttatagaaca gatcagtgaa ttctcgaaaa gggttatcct tgcagatgcg 7500

aatcttgaca aggtgttgtc tgcatacaac aaacatagag ataagccgat cagggagcaa 7560

gcggaaaata tcattcacct cttcactctt acaaacttgg gtgctcccgc tgccttcaag 7620

tattttgata ccacgattga ccggaaacgt tacacctcaa cgaaggaggt gctggatgcc 7680

accctcatcc accaatctat taccggactc tacgagacta gaatcgatct ctcacagctc 7740

ggcggggata aaagaccagc agcgacgaaa aaggcaggac aggctaagaa gaagaaagag 7800

ctcggaggag gaggcacggg aggaggaggc tccgccgagt atgtgcgcgc gctcttcgac 7860

ttcaacggca atgacgagga ggatctccct ttcaagaagg gcgacatcct ccgcatccgc 7920

gataagccgg aggagcagtg gtggaacgca gaggactccg agggcaagcg gggcatgatc 7980

ctggtgccat acgtcgagaa gtacagcggc gattacaagg accacgatgg cgactacaag 8040

gatcatgaca tcgattacaa ggacgatgac gataagtccg gcgtcgacat gacggacgcg 8100

gagtatgtgc gcatccacga gaagctcgat atctacacct tcaagaagca gttcttcaac 8160

aataagaagt cggtgtccca tcggtgctac gtcctcttcg agctgaagcg caggggagag 8220

cgccgcgcct gcttctgggg ctacgcggtg aataagccgc agtcaggcac agagcgcggc 8280

atccacgccg agatcttctc gatccggaag gtcgaggagt acctccgcga caacccaggc 8340

cagttcacga tcaattggta ctccagctgg tccccttgcg cagattgcgc agagaagatc 8400

ctcgagtggt acaaccagga gctgaggggc aatggccata ccctcaagat ctgggcctgc 8460

aagctgtact acgagaagaa cgcgaggaat cagatcggcc tctggaacct gcgggataat 8520

ggcgtgggcc tcaacgtgat ggtgtccgag cactaccagt gctgccgcaa gatcttcatc 8580

cagtcctccc acaatcagct gaacgagaat aggtggctcg aaaagaccct gaagcgcgcc 8640

gagaagtgga ggagcgagct gtctatcatg atccaggtca agatcctgca caccacaaag 8700

tcaccggcgg tgggcggcgg cggcagcgaa ttctccggcg gcagcacgaa cctcagcgac 8760

atcatcgaga aggagacagg caagcagctc gtgatccagg agtctatcct catgctgcct 8820

gaggaggtgg aggaggtcat cggcaacaag ccggagtccg atatcctcgt gcacaccgcc 8880

tacgacgagt cgacagatga gaatgtcatg ctcctgacct ccgacgcacc agagtacaag 8940

ccatgggcgc tcgtgatcca ggattccaac ggcgagaata agatcaagat gctgtctggc 9000

ggctccccga agaagaagcg caaggtctag actagtctga aatcaccagt ctctctctac 9060

aaatctatct ctctctataa taatgtgtga gtagttccca gataagggaa ttagggttct 9120

tatagggttt cgctcatgtg ttgagcatat aagaaaccct tagtatgtat ttgtatttgt 9180

aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg gggcgcccga 9240

cctgtactcg cgaaggttaa cttacagaga gtgtccgggc gcgcctggtg gatcgtccgc 9300

ctaggctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat 9360

gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt 9420

atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac 9480

aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca 9540

attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc 9600

tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat 9660

ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct 9720

attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt 9780

agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt 9840

aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc 9900

gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa 9960

gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc 10020

gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc 10080

ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc 10140

ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac 10200

cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa 10260

atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc ccccccctct 10320

ctaccttctc tagatcggcg ttccggtcca tggttagggc ccggtagttc tacttctgtt 10380

catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat 10440

gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat 10500

cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt 10560

tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc 10620

gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt 10680

cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat 10740

ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc 10800

gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt 10860

ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctagatcg 10920

gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt 10980

gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta 11040

tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca 11100

tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt 11160

gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct 11220

gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt 11280

ttggtgttac ttctgcagga gctcatgaaa aagcctgaac tcaccgcgac gtctgtcgag 11340

aagtttctga tcgaaaagtt cgacagcgtc tccgacctga tgcagctctc ggagggcgaa 11400

gaatctcgtg ctttcagctt cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc 11460

tgcgccgatg gtttctacaa agatcgttat gtttatcggc actttgcatc ggccgcgctc 11520

ccgattccgg aagtgcttga cattggggag tttagcgaga gcctgaccta ttgcaccccc 11580

cgccgttcac agggggtcac gttgcaagac ctgcctgaaa ccgaactgcc cgctgttcta 11640

caaccggtcg cggaggctat ggatgcgatc gctgcggccg atcttagcca gacgagcggg 11700

ttcggcccat tcggaccgca aggaatcggt caatacacta catggcgtga tttcatatgc 11760

gcgattgctg atccccatgt gtatcactgg caaactgtga tggacgacac cgtcagtgcg 11820

tccgtcgcgc aggctctcga tgagctgatg ctttgggccg aggactgccc cgaagtccgg 11880

cacctcgtgc acgcggattt cggctccaac aatgtcctga cggacaatgg ccgcataaca 11940

gcggtcattg actggagcga ggcgatgttc ggggattccc aatacgaggt cgccaacatc 12000

ttcttctgga ggccgtggtt ggcttgtatg gagcagcaga cgcgctactt cgagcggagg 12060

catccggagc ttgcaggatc gccacgactc cgggcgtata tgctccgcat tggtcttgac 12120

caactctatc agagcttggt tgacggcaat ttcgatgatg cagcttgggc gcagggtcga 12180

tgcgacgcaa tcgtccgatc cggagccggg actgtcgggc gtacacaaat cgcccgcaga 12240

agcgcggccg tctggaccga tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc 12300

cccagcactc gtccgagggc aaagaaatag agtagatgcc gaccgggatc tgtcgatcga 12360

caagctcgag tttctccata ataatgtgtg agtagttccc agataaggga attagggttc 12420

ctatagggtt tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg 12480

taaaatactt ctatcaataa aatttctaat tcctaaaacc aaaatccagt actaaaatcc 12540

agatcccccg aattaattcg gcgttaattc agcctgcagg acgcgtttaa ttaagtgcac 12600

gcggccgcct acttagtcaa gagcctcgca cgcgactgtc acgcggccag gatcgcctcg 12660

tgagcctcgc aatctgtacc tagtgtttaa actatcagtg tttgacagga tatattggcg 12720

ggtaaaccta agagaaaaga gcgtttatta gaataacgga tatttaaaag ggcgtgaaaa 12780

ggtttatccg ttcgtccatt tgtatgtgca tgccaaccac agggttcccc tcgggatcaa 12840

agtactttga tccaacccct ccgctgctat agtgcagtcg gcttctgacg ttcagtgcag 12900

ccgtcttctg aaaacgacat gtcgcacaag tcctaagtta cgcgacaggc tgccgccctg 12960

cccttttcct ggcgttttct tgtcgcgtgt tttagtcgca taaagtagaa tacttgcgac 13020

tagaaccgga gacattacgc catgaacaag agcgccgccg ctggcctgct gggctatgcc 13080

cgcgtcagca ccgacgacca ggacttgacc aaccaacggg ccgaactgca cgcggccggc 13140

tgcaccaagc tgttttccga gaagatcacc ggcaccaggc gcgaccgccc ggagctggcc 13200

aggatgcttg accacctacg ccctggcgac gttgtgacag tgaccaggct agaccgcctg 13260

gcccgcagca cccgcgacct actggacatt gccgagcgca tccaggaggc cggcgcgggc 13320

ctgcgtagcc tggcagagcc gtgggccgac accaccacgc cggccggccg catggtgttg 13380

accgtgttcg ccggcattgc cgagttcgag cgttccctaa tcatcgaccg cacccggagc 13440

gggcgcgagg ccgccaaggc ccgaggcgtg aagtttggcc cccgccctac cctcaccccg 13500

gcacagatcg cgcacgcccg cgagctgatc gaccaggaag gccgcaccgt gaaagaggcg 13560

gctgcactgc ttggcgtgca tcgctcgacc ctgtaccgcg cacttgagcg cagcgaggaa 13620

gtgacgccca ccgaggccag gcggcgcggt gccttccgtg aggacgcatt gaccgaggcc 13680

gacgccctgg cggccgccga gaatgaacgc caagaggaac aagcatgaaa ccgcaccagg 13740

acggccagga cgaaccgttt ttcattaccg aagagatcga ggcggagatg atcgcggccg 13800

ggtacgtgtt cgagccgccc gcgcacgtct caaccgtgcg gctgcatgaa atcctggccg 13860

gtttgtctga tgccaagctg gcggcctggc cggccagctt ggccgctgaa gaaaccgagc 13920

gccgccgtct aaaaaggtga tgtgtatttg agtaaaacag cttgcgtcat gcggtcgctg 13980

cgtatatgat gcgatgagta aataaacaaa tacgcaaggg gaacgcatga aggttatcgc 14040

tgtacttaac cagaaaggcg ggtcaggcaa gacgaccatc gcaacccatc tagcccgcgc 14100

cctgcaactc gccggggccg atgttctgtt agtcgattcc gatccccagg gcagtgcccg 14160

cgattgggcg gccgtgcggg aagatcaacc gctaaccgtt gtcggcatcg accgcccgac 14220

gattgaccgc gacgtgaagg ccatcggccg gcgcgacttc gtagtgatcg acggagcgcc 14280

ccaggcggcg gacttggctg tgtccgcgat caaggcagcc gacttcgtgc tgattccggt 14340

gcagccaagc ccttacgaca tatgggccac cgccgacctg gtggagctgg ttaagcagcg 14400

cattgaggtc acggatggaa ggctacaagc ggcctttgtc gtgtcgcggg cgatcaaagg 14460

cacgcgcatc ggcggtgagg ttgccgaggc gctggccggg tacgagctgc ccattcttga 14520

gtcccgtatc acgcagcgcg tgagctaccc aggcactgcc gccgccggca caaccgttct 14580

tgaatcagaa cccgagggcg acgctgcccg cgaggtccag gcgctggccg ctgaaattaa 14640

atcaaaactc atttgagtta atgaggtaaa gagaaaatga gcaaaagcac aaacacgcta 14700

agtgccggcc gtccgagcgc acgcagcagc aaggctgcaa cgttggccag cctggcagac 14760

acgccagcca tgaagcgggt caactttcag ttgccggcgg aggatcacac caagctgaag 14820

atgtacgcgg tacgccaagg caagaccatt accgagctgc tatctgaata catcgcgcag 14880

ctaccagagt aaatgagcaa atgaataaat gagtagatga attttagcgg ctaaaggagg 14940

cggcatggaa aatcaagaac aaccaggcac cgacgccgtg gaatgcccca tgtgtggagg 15000

aacgggcggt tggccaggcg taagcggctg ggttgtctgc cggccctgca atggcactgg 15060

aacccccaag cccgaggaat cggcgtgacg gtcgcaaacc atccggcccg gtacaaatcg 15120

gcgcggcgct gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc 15180

aacgcatcga ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc 15240

gcaaagaatc ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg 15300

gcgacgagca accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc 15360

gcagcatcat ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg 15420

tgatccgcta cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg 15480

ccagtgtgtg ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga 15540

accgataccg ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg 15600

acgtactcaa gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa 15660

cctgcattcg gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg 15720

gccgcctggt gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga 15780

gcgaaaccgg gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga 15840

tcacagaagg caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc 15900

ccggcatcgg ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcca 15960

gatggttgtt caagacgatc tacgaacgca gtggcagcgc cggagagttc aagaagttct 16020

gtttcaccgt gcgcaagctg atcgggtcaa atgacctgcc ggagtacgat ttgaaggagg 16080

aggcggggca ggctggcccg atcctagtca tgcgctaccg caacctgatc gagggcgaag 16140

catccgccgg ttcctaatgt acggagcaga tgctagggca aattgcccta gcaggggaaa 16200

aaggtcgaaa aggtctcttt cctgtggata gcacgtacat tgggaaccca aagccgtaca 16260

ttgggaaccg gaacccgtac attgggaacc caaagccgta cattgggaac cggtcacaca 16320

tgtaagtgac tgatataaaa gagaaaaaag gcgatttttc cgcctaaaac tctttaaaac 16380

ttattaaaac tcttaaaacc cgcctggcct gtgcataact gtctggccag cgcacagccg 16440

aagagctgca aaaagcgcct acccttcggt cgctgcgctc cctacgcccc gccgcttcgc 16500

gtcggcctat cgcggccgct ggccgctcaa aaatggctgg cctacggcca ggcaatctac 16560

cagggcgcgg acaagccgcg ccgtcgccac tcgaccgccg gcgcccacat caaggcaccc 16620

tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg 16680

gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg 16740

ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag cggagtgtat 16800

actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat atgcggtgtg 16860

aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc gcttcctcgc 16920

tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 16980

cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 17040

gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 17100

gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 17160

gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 17220

ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 17280

atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 17340

tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 17400

ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 17460

gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 17520

ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 17580

ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 17640

agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 17700

ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg cattctaggt 17760

actaaaacaa ttcatccagt aaaatataat attttatttt ctcccaatca ggcttgatcc 17820

ccagtaagtc aaaaaatagc tcgacatact gttcttcccc gatatcctcc ctgatcgacc 17880

ggacgcagaa ggcaatgtca taccacttgt ccgccctgcc gcttctccca agatcaataa 17940

agccacttac tttgccatct ttcacaaaga tgttgctgtc tcccaggtcg ccgtgggaaa 18000

agacaagttc ctcttcgggc ttttccgtct ttaaaaaatc atacagctcg cgcggatctt 18060

taaatggagt gtcttcttcc cagttttcgc aatccacatc ggccagatcg ttattcagta 18120

agtaatccaa ttcggctaag cggctgtcta agctattcgt atagggacaa tccgatatgt 18180

cgatggagtg aaagagcctg atgcactccg catacagctc gataatcttt tcagggcttt 18240

gttcatcttc atactcttcc gagcaaagga cgccatcggc ctcactcatg agcagattgc 18300

tccagccatc atgccgttca aagtgcagga cctttggaac aggcagcttt ccttccagcc 18360

atagcatcat gtccttttcc cgttccacat cataggtggt ccctttatac cggctgtccg 18420

tcatttttaa atataggttt tcattttctc ccaccagctt atatacctta gcaggagaca 18480

ttccttccgt atcttttacg cagcggtatt tttcgatcag ttttttcaat tccggtgata 18540

ttctcatttt agccatttat tatttccttc ctcttttcta cagtatttaa agatacccca 18600

agaagctaat tataacaaga cgaactccaa ttcactgttc cttgcattct aaaaccttaa 18660

ataccagaaa acagcttttt caaagttgtt ttcaaagttg gcgtataaca tagtatcgac 18720

ggagccgatt ttgaaaccgc ggtgatcaca ggcagcaacg ctctgtcatc gttacaatca 18780

acatgctacc ctccgcgaga tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt 18840

ccgaatagca tcggtaacat gagcaaagtc tgccgcctta caacggctct cccgctgacg 18900

ccgtcccgga ctgatgggct gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg 18960

gggagctgtt ggctggct 18978

<210>2

<211>1423

<212>PRT

<213>人工序列(Artificial Sequence)

<400>2

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala

1010 1015 1020

His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys

1025 1030 1035

Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys

1040 1045 1050

Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1055 1060 1065

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn

1070 1075 1080

Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys

1085 1090 1095

Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp

1100 1105 1110

Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met

1115 1120 1125

Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly

1130 1135 1140

Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu

1145 1150 1155

Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe

1160 1165 1170

Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val

1175 1180 1185

Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu

1190 1195 1200

Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile

1205 1210 1215

Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu

1220 1225 1230

Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn

1250 1255 1260

Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala

1265 1270 1275

Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln

1280 1285 1290

Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1295 1300 1305

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp

1310 1315 1320

Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp

1325 1330 1335

Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr

1340 1345 1350

Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr

1355 1360 1365

Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp

1370 1375 1380

Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg

1385 1390 1395

Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr

1400 1405 1410

Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1415 1420

<210>3

<211>208

<212>PRT

<213>人工序列(Artificial Sequence)

<400>3

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser

180 185 190

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210>4

<211>98

<212>PRT

<213>人工序列(Artificial Sequence)

<400>4

Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly

1 5 10 15

Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val

20 25 30

Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr

35 40 45

Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp

50 55 60

Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly

65 70 75 80

Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg

85 90 95

Lys Val

<210>5

<211>1026

<212>DNA

<213>人工序列(Artificial Sequence)

<400>5

atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60

agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120

gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180

cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240

ggggagttta gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg 300

caagacctgc ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat 360

gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420

atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480

cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540

ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600

tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660

atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720

tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca 780

cgactccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840

ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900

gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960

tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020

aaatag 1026

<210>6

<211>23

<212>DNA

<213>人工序列(Artificial Sequence)

<400>6

caccccccgc cgttcacagg ggg 23

Claims

1.成套试剂，其包括sgRNA、C·T碱基替换系统和功能丧失的筛选剂抗性基因或与所述功能丧失的筛选剂抗性基因相关的生物材料；

所述sgRNA结构如下：所述靶点序列转录的RNA-sgRNA骨架；

所述sgRNA骨架为将序列1第571-646位中的T替换为U得到的RNA分子；

与所述Cas9核酸酶相关的生物材料为编码所述Cas9核酸酶的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

与所述胞嘧啶脱氨酶相关的生物材料为编码所述胞嘧啶脱氨酶的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

与所述功能丧失的筛选剂抗性基因相关的生物材料为编码所述功能丧失的筛选剂抗性基因的核酸分子或含有所述核酸分子的表达盒、重组载体、重组微生物、转基因细胞系；

所述功能丧失的筛选标记基因为将潮霉素抗性基因的第272位由T突变为C，且将第274位由T突变为C后得到的序列；所述潮霉素抗性基因序列为序列5；

所述功能丧失的筛选剂抗性基因靶点序列为序列1第11574-11596位。

2.根据权利要求1所述的成套试剂，其特征在于：所述sgRNA为tRNA-sgRNA；所述tRNA-sgRNA由靶向所述目标基因靶点序列的tRNA-sgRNA和靶向所述功能丧失的筛选剂抗性基因靶点序列的tRNA-sgRNA组成；

所述tRNA为将序列1第474-550位中的T替换为U得到的RNA分子。

3.根据权利要求1所述的成套试剂，其特征在于：所述C·T碱基替换系统还包括UGI或与所述UGI相关的生物材料；

所述Cas9核酸酶为SpCas9n蛋白质；

所述胞嘧啶脱氨酶为PmCDA1蛋白质；

所述SpCas9n蛋白质为序列2所示的蛋白质；

与所述SpCas9n相关的生物材料为B1）至B5）中的任一种：

B1）编码所述SpCas9n的核酸分子；

B2）含有B1）所述核酸分子的表达盒；

B3）含有B1）所述核酸分子的重组载体、或含有B2）所述表达盒的重组载体；

B4）含有B1）所述核酸分子的重组微生物、或含有B2）所述表达盒的重组微生物、或含有B3）所述重组载体的重组微生物；

B5）含有B1）所述核酸分子的转基因细胞系、或含有B2）所述表达盒的转基因细胞系；

所述PmCDA1蛋白质为序列3所示的蛋白质；

与所述PmCDA1蛋白质相关的生物材料为F1）至F5）中的任一种：

F1）编码所述PmCDA1蛋白质的核酸分子；

F2）含有F1）所述核酸分子的表达盒；

F3）含有F1）所述核酸分子的重组载体、或含有F2）所述表达盒的重组载体；

F4）含有F1）所述核酸分子的重组微生物、或含有F2）所述表达盒的重组微生物、或含有F3）所述重组载体的重组微生物；

F5）含有F1）所述核酸分子的转基因细胞系、或含有F2）所述表达盒的转基因细胞系；

所述UGI蛋白质为序列4所示的蛋白质；

与所述UGI蛋白质相关的生物材料为J1）至J5）中的任一种：

J1）编码所述UGI蛋白质的核酸分子；

J2）含有J1）所述核酸分子的表达盒；

J3）含有J1）所述核酸分子的重组载体、或含有J2）所述表达盒的重组载体；

J4）含有J1）所述核酸分子的重组微生物、或含有J2）所述表达盒的重组微生物、或含有J3）所述重组载体的重组微生物；

J5）含有J1）所述核酸分子的转基因细胞系、或含有J2）所述表达盒的转基因细胞系。

4.权利要求1-3任一所述的成套试剂在M1）-M6）任一种中的应用：

M1）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞；

M2）制备富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的产品；

M3）提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率；

M4）制备提高生物体或生物细胞基因组靶点序列的C·T碱基替换效率的产品；

M5）生物体或生物细胞基因组靶点序列中的C·T碱基替换；

M6）制备生物体或生物细胞靶点序列中的C·T碱基替换的产品。

5.N1）或N2）或N3）或N4）或N5）所述的方法：

N1）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-3中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因、UGI的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶和UGI均得到表达；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N2）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-3中任一所述的Cas9核酸酶的编码基因、转录靶向目标基因靶点序列的sgRNA的DNA分子、转录靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的DNA分子、胞嘧啶脱氨酶的编码基因和功能丧失的筛选剂抗性基因导入生物体或生物细胞内，使所述Cas9核酸酶、所述sgRNA、所述胞嘧啶脱氨酶均得到表达；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N3）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-3中任一所述的Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶、UGI和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶、所述胞嘧啶脱氨酶和所述UGI在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而实现富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N4）富集生物体或生物细胞基因组靶点序列发生C·T碱基替换的细胞的方法或提高生物体或生物细胞基因组靶点序列C·T碱基替换效率的方法，包括如下步骤：将权利要求1-3中任一所述的Cas9核酸酶、靶向目标基因靶点序列的sgRNA、靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA、胞嘧啶脱氨酶和功能丧失的筛选剂抗性基因导入生物体或生物细胞内；所述Cas9核酸酶和所述胞嘧啶脱氨酶在靶向所述功能丧失的筛选剂抗性基因靶点序列的sgRNA的向导下，可通过对所述功能丧失的筛选剂抗性基因靶点序列进行C·T碱基替换使所述功能丧失的筛选剂抗性基因功能恢复，进而富集筛选剂抗性基因发生C·T碱基替换的细胞，从而实现富集生物体或生物细胞基因组目标基因靶点序列发生C·T碱基替换的细胞或提高生物体或生物细胞基因组目标基因靶点序列的C·T碱基替换效率；

N5）生物突变体的制备方法，包括如下步骤：按照N1）或N2）或N3）或N4）所述的方法对生物体的基因组进行编辑，获得生物突变体；所述生物突变体为发生C·T碱基替换的生物体。

6.根据权利要求4所述的应用或权利要求5所述的方法，其特征在于：所述生物体为植物或动物；所述生物细胞为植物细胞或动物细胞。

7.根据权利要求6所述的应用或方法，其特征在于：所述植物为单子叶植物或双子叶植物；所述植物细胞为单子叶植物细胞或双子叶植物细胞。

8.根据权利要求7所述的应用或方法，其特征在于：所述单子叶植物为禾本科植物；所述单子叶植物细胞为禾本科植物细胞。

9.根据权利要求8所述的应用或方法，其特征在于：所述禾本科植物为水稻；所述禾本科植物细胞为水稻细胞。