CN114317589B

CN114317589B - SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用

Info

Publication number: CN114317589B
Application number: CN202011055743.0A
Authority: CN
Inventors: 杨进孝; 赵久然; 王飞鹏; 王瑶; 张成伟
Original assignee: Beijing Academy of Agriculture and Forestry Sciences
Current assignee: Beijing Academy of Agriculture and Forestry Sciences
Priority date: 2020-09-30
Filing date: 2020-09-30
Publication date: 2024-01-16
Anticipated expiration: 2040-09-30
Also published as: CN114317589A

Abstract

本发明公开了SpRYn‑ABE碱基编辑系统在植物基因组碱基替换中的应用。本发明的SpRYn‑ABE碱基编辑系统包括SpRYn、腺嘌呤脱氨酶和esgRNA；所述esgRNA靶向靶点序列；所述esgRNA如式I所示：所述靶点序列转录的RNA‑esgRNA骨架(式I)。通过实验证明：本发明的SpRYn‑ABE碱基编辑系统可对位于植物基因组上的PAM序列为NAN或NCN或NTN的靶点序列中的碱基A进行编辑，实现碱基A到碱基G的替换，大大拓展了可编辑的A的范围。

Description

SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用

技术领域

本发明属于生物技术领域，具体涉及SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用。

背景技术

CRISPR-Cas9技术已经成为强有力的基因组编辑手段，被广泛应用到很多组织和细胞中。CRISPR/Cas9 protein-RNA复合物通过向导RNA(guide RNA)定位于靶点上，切割产生DNA双链断裂(dsDNA break，DSB)，而后生物体会本能的启动DNA修复机制修复DSB。修复机制一般有两种，一种是非同源末端连接(non-homologous end joining，NHEJ)，另一种是同源重组(homology-directed repair，HDR)。通常情况下NHEJ占大多数，因此修复产生的随机的indels(insertions or deletions)比精确修复高很多。对于碱基精确替换，因为HDR效率低以及需要DNA模板，所以使用HDR实现碱基精确替换的应用受到很大的限制。

2017年，David Liu实验室报道了一种新型的腺嘌呤碱基编辑器(adenine baseeditors，ABE)。通过七轮进化，研究者将来源于大肠杆菌的tRNA腺嘌呤脱氨酶(tRNAadenosine deaminase，ecTadA)融合在Cas9 nickase(Cas9n)的5’端，在细胞内能够直接实现对单个碱基A(Adenine，A)到G(Guanine，G)的替换，而不再通过产生DSB和启动HDR修复，大大提高了A替换为G的碱基编辑效率。具体过程为：当含有基因组靶向序列的sgRNA与ecTadA&ecTadA&Cas9n结合时，复合体定位到靶点，ecTadA催化非配对的单链DNA上的A发生腺嘌呤脱氨反应变成肌苷(Inosine，I)，在DNA修复的过程中，I会被视为G，Cas9n会在切割配对的DNA链的磷酸二酯键，引入一个胞嘧啶C(Cytosine)与I配对。最终在接下来的修复过程中产生C-G配对，从而实现了A到G的转换。

目前，ABE系统已被广泛应用到植物中，实现A到G的转换，但编辑的靶点主要局限在PAM(Protospacer Adjacent Motif)为NGN的序列，对于NAN，NCN，NTN PAM靶点进行A到G的碱基编辑鲜有报道，大大限制了可编辑的A的范围。

发明内容

本发明的第一个目的是提供一种将植物基因组靶点序列中的A突变为G的方法。

本发明提供的将植物基因组靶点序列中的A突变为G的方法为如下1)或2)：

所述1)包括如下步骤：将SpRYn、腺嘌呤脱氨酶和sgRNA导入植物体内，实现将植物基因组靶点序列中的A突变为G；

所述2)包括如下步骤：将SpRYn的编码基因、腺嘌呤脱氨酶的编码基因和转录sgRNA的DNA分子导入植物体内，使所述SpRYn、所述腺嘌呤脱氨酶和所述sgRNA均得到表达，实现将植物基因组靶点序列中的A突变为G；

所述sgRNA靶向靶点序列；

所述靶点序列的PAM序列为NAN或NCN或NTN；N为A、T、C或G。

上述将植物基因组靶点序列中的A突变为G的方法中，所述sgRNA为esgRNA；

所述esgRNA如式I所示：所述靶点序列转录的RNA-esgRNA骨架(式I)；

所述esgRNA骨架为n1)或n2)或n3)：

n1)将序列1第617-702位中的T替换为U得到的RNA分子；

n2)将n1)所示的RNA分子经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同功能的RNA分子；

n3)与n1)或n2)限定的核苷酸序列具有75％或75％以上同一性且具有相同功能的RNA分子。

上述将植物基因组靶点序列中的A突变为G的方法中，所述SpRYn为A1)或A2)或A3)：

A1)氨基酸序列是序列4所示的蛋白质；

A2)将序列表中序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

A3)在A1)或A2)的N端或/和C端连接标签得到的融合蛋白质。

所述腺嘌呤脱氨酶可为不同来源的腺嘌呤脱氨酶，如来源于大肠杆菌的腺嘌呤脱氨酶(如ecTadA、ecTadA*等蛋白质)、来源于植物的腺嘌呤脱氨酶(如水稻来源的OsTadA、拟南芥来源的AtTadA等蛋白质)。在本发明的具体实施例中，所述腺嘌呤脱氨酶为ecTadA和ecTadA*。

所述ecTadA为C1)或C2)或C3)：

C1)氨基酸序列是序列2所示的蛋白质；

C2)将序列表中序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

C3)在C1)或C2)的N端或/和C端连接标签得到的融合蛋白质；

所述ecTadA*为E1)或E2)或E3)：

E1)氨基酸序列是序列3所示的蛋白质；

E2)将序列表中序列3所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质；

E3)在E1)或E2)的N端或/和C端连接标签得到的融合蛋白质。

为了使A1)、C1)或E1)中的蛋白质便于纯化，可在由序列表中序列4或序列2或序列3所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接上如下表所示的标签。

表、标签的序列

标签	残基	序列
			Poly-Arg	5-6(通常为5个)	RRRRR
Poly-His	2-10(通常为6个)	HHHHHH
			FLAG	8	DYKDDDDK
Strep-tag II	8	WSHPQFEK
			c-myc	10	EQKLISEEDL

上述A2)、C2)或E2)中的蛋白质，为与序列4或序列2或序列3所示蛋白质的氨基酸序列具有75％或75％以上同一性且具有相同功能的蛋白质。所述具有75％或75％以上同一性为具有75％、具有80％、具有85％、具有90％、具有95％、具有96％、具有97％、具有98％或具有99％的同一性。

上述A2)、C2)或E2)中的蛋白质可人工合成，也可先合成其编码基因，再进行生物表达得到。

上述A2)、C2)或E2)中的蛋白质的编码基因可通过将序列1的第4132-8232位、第2944-3441位或第3538-4035位所示的DNA序列中缺失一个或几个氨基酸残基的密码子，和/或进行一个或几个碱基对的错义突变，和/或在其5′端和/或3′端连接上表所示的标签的编码序列得到。序列1的第4132-8232位、第2944-3441位和第3538-4035位分别编码序列4、序列2和序列3所示的蛋白质。

所述SpRYn的编码基因为b1)或b2)或b3)：

b1)序列表中序列1第4132-8232位所示的cDNA分子或DNA分子；

b2)与b1)限定的核苷酸序列具有75％或75％以上同一性，且编码上述SpRYn的cDNA分子或DNA分子；

b3)在严格条件下与b1)或b2)限定的核苷酸序列杂交，且编码上述SpRYn的cDNA分子或DNA分子；

所述ecTadA的编码基因为d1)或d2)或d3)：

d1)序列表中序列1第2944-3441位所示的cDNA分子或DNA分子；

d2)与d1)限定的核苷酸序列具有75％或75％以上同一性，且编码上述ecTadA的cDNA分子或DNA分子；

d3)在严格条件下与d1)或d2)限定的核苷酸序列杂交，且编码上述ecTadA的cDNA分子或DNA分子；

所述ecTadA*的编码基因为f1)或f2)或f3)：

f1)序列表中序列1第3538-4035位所示的cDNA分子或DNA分子；

f2)与f1)限定的核苷酸序列具有75％或75％以上同一性，且编码上述ecTadA*的cDNA分子或DNA分子；

f3)在严格条件下与f1)或f2)限定的核苷酸序列杂交，且编码上述ecTadA*的cDNA分子或DNA分子。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化和点突变的方法，对本发明的编码所述SpRYn、所述ecTadA或所述ecTadA*的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明的所述SpRYn、所述ecTadA或所述ecTadA*的核苷酸序列75％或者更高同一性的核苷酸，只要编码所述SpRYn、所述ecTadA或所述ecTadA*且具有相同功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码序列2、3或4所示的氨基酸序列组成的蛋白质的核苷酸序列具有75％或更高，或85％或更高，或90％或更高，或95％或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件，两个或多个序列之间的同一性可以用百分比(％)表示，其可以用来评价相关序列之间的同一性。

所述严格条件是在2×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次5min，又于0.5×SSC，0.1％SDS的溶液中，在68℃下杂交并洗膜2次，每次15min；或，0.1×SSPE(或0.1×SSC)、0.1％SDS的溶液中，65℃条件下杂交并洗膜。

上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。

上述将植物基因组靶点序列中的A突变为G的方法中，所述2)中，所述SpRYn的编码基因、所述转录sgRNA的DNA分子、所述腺嘌呤脱氨酶的编码基因可通过一个或多个重组表达载体导入植物体内。在本发明的具体实施例中，所述SpRYn的编码基因、所述转录esgRNA的DNA分子、所述ecTadA的编码基因和所述ecTadA*的编码基因通过一个重组表达载体导入植物体内。

进一步的，所述重组载体还包括筛选剂抗性蛋白的编码基因。

更进一步的，所述重组载体包括含有转录esgRNA的DNA分子的表达盒和依次含有所述ecTadA的编码基因、所述ecTadA*的编码基因、所述SpRYn的编码基因、所述自切割寡肽的编码基因和所述筛选剂抗性蛋白的编码基因的表达盒。

所述含有转录esgRNA的DNA分子的表达盒的个数可为一个或两个或多个。具体可为一个或两个或三个。

所述自切割寡肽可为来源于病毒基因组的2A自切割寡肽，如口蹄疫病毒(FMDV)(F2A)肽、马A型鼻炎病毒(ERAV)(E2A)肽、明脉扁刺蛾β四体病毒(Thosea asigna virus)(T2A)肽、猪捷申病毒-1(PTV-1)(P2A)肽、泰勒病毒2A肽以及脑心肌炎病毒2A肽。具体可为P2A肽。

所述筛选剂抗性蛋白具体可为潮霉素磷酸转移酶。

在本发明的具体实施例中，所述重组表达载体具体为SpRYn-ABE-5重组表达载体、SpRYn-ABE-6重组表达载体、SpRYn-ABE-7重组表达载体、SpRYn-ABE-8重组表达载体、SpRYn-ABE-9重组表达载体、SpRYn-ABE-10重组表达载体、SpRYn-ABE-11重组表达载体、SpRYn-ABE-12重组表达载体、SpRYn-ABE-16重组表达载体、SpRYn-ABE-19重组表达载体。

本发明的另一个目的是提供上述将植物基因组靶点序列中的A突变为G的方法的新用途。

本发明提供了上述将植物基因组靶点序列中的A突变为G的方法在植物基因组碱基替换中的应用。

本发明又提供了上述将植物基因组靶点序列中的A突变为G的方法在植物基因组碱基编辑中的应用。

本发明还提供了上述将植物基因组靶点序列中的A突变为G的方法在制备植物突变体中的应用。

本发明还有一个目的是提供成套试剂的新用途；所述成套试剂包括上述SpRYn、上述腺嘌呤脱氨酶和上述sgRNA；

本发明提供了成套试剂在如下T1)-T7)任一种中的应用：

T1)将植物基因组靶点序列中的A突变为G；

T2)制备将植物基因组靶点序列中的A突变为G的产品；

T3)植物基因组碱基替换；

T4)制备植物基因组碱基替换的产品；

T5)植物基因组碱基编辑；

T6)制备植物基因组碱基编辑的产品；

T7)制备植物突变体；

所述靶点序列的PAM序列为NAN或NCN或NTN；N为A、T、C或G。

进一步的，所述成套试剂还包括上述自切割寡肽和上述筛选剂抗性蛋白。

更进一步的，所述成套试剂由上述SpRYn、上述腺嘌呤脱氨酶、上述sgRNA、上述自切割寡肽和上述筛选剂抗性蛋白组成。

上述任一所述方法或应用中，所述PAM序列为与所述靶点序列3′端相连的一段DNA序列。所述PAM序列自5′端起第一个N与所述靶点序列3′端相连。所述靶点序列大小可为15-25bp，进一步可为18-22bp，更进一步可为20bp。

进一步的，所述NAN可为NAG或NAC或NAT。

所述NCN可为NCA或NCG。

所述NTN可为NTG或NTT。

更进一步的，所述NAG可为GAG。

所述NAC可为GAC或AAC。

所述NAT可为CAT、TAT或GAT。

所述NCA可为GCA。

所述NCG可为ACG。

所述NTG可为ATG。

所述NTT可为GTT。

上述任一所述方法或应用中，所述靶点序列可为一个或两个或多个。

上述任一所述方法或应用中，所述碱基编辑或碱基替换为将植物基因组靶点序列中的A突变为G。所述A可为位于所述靶点序列中任意位置的碱基A。

上述任一所述方法或应用中，所述植物为S1)或S2)或S3)：

S1)单子叶植物或双子叶植物；

S2)禾本科植物；

S3)水稻(如日本晴)。

本发明提供了SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用。本发明的SpRYn-ABE碱基编辑系统包括SpRYn、腺嘌呤脱氨酶和esgRNA。通过实验证明：本发明的SpRYn-ABE碱基编辑系统可对位于植物基因组上的PAM序列为NAN或NCN或NTN的靶点序列中的碱基A进行编辑，实现碱基A到碱基G的替换，大大拓展了可编辑的A的范围。

附图说明

图1为SpRYn-ABE碱基编辑系统载体各元件结构示意图。其中，n为靶点个数，具体可为1、2或3，OsU6具体可为OsU6a、OsU6b或OsU6c，一个靶点时使用OsU6a，两个靶点时分别使用OsU6a和OsU6b，三个靶点时分别使用OsU6a，OsU6b和OsU6c。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。下述实施例中的实验方法，如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂、仪器等，如无特殊说明，均可从商业途径得到。下述实施例中，如无特殊说明，序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸，末位均为相应DNA/RNA的3′末端核苷酸。

引物对NAA-A1由引物NAA-A1-F：5’-CGCACGGCGGGAGGTACGTGC-3’和引物NAA-A1-R：5’-ATCAATAGCTGCAGTGTACTCTG-3’组成，用于扩增靶点NAA-A1。

引物对NAA-A2由引物NAA-A2-F：5’-GCACTGCCAGGTGAGTGAACT-3’和引物NAA-A2-R：5’-GCGCCTCCTCAACTGCATGTCA-3’组成，用于扩增靶点NAA-A2。

引物对NAA-A3由引物NAA-A3-F：5’-TATTCAGATCAGCATTTGGTGATAC-3’和引物NAA-A3-R：5’-AAGAAGATACAGTTAAGCTCCTG-3’组成，用于扩增靶点NAA-A3。

引物对NAA-A4由引物NAA-A4-F：5’-GCACTGCCAGGTGAGTGAACT-3’和引物NAA-A4-R：5’-GCGCCTCCTCAACTGCATGTCA-3’组成，用于扩增靶点NAA-A4。

引物对NAA-A5由引物NAA-A5-F：5’-CGCACGGCGGGAGGTACGTGC-3’和引物NAA-A5-R：5’-ATCAATAGCTGCAGTGTACTCTG-3’组成，用于扩增靶点NAA-A5。

引物对NAA-A6由引物NAA-A6-F：5’-CGCACGGCGGGAGGTACGTGC-3’和引物NAA-A6-R：5’-ATCAATAGCTGCAGTGTACTCTG-3’组成，用于扩增靶点NAA-A6。

引物对NAA-A7由引物NAA-A7-F：5’-GCACTGCCAGGTGAGTGAACT-3’和引物NAA-A7-R：5’-GCGCCTCCTCAACTGCATGTCA-3’组成，用于扩增靶点NAA-A7。

引物对NAA-A8由引物NAA-A8-F：5’-GCACTGCCAGGTGAGTGAACT-3’和引物NAA-A8-R：5’-GCGCCTCCTCAACTGCATGTCA-3’组成，用于扩增靶点NAA-A8。

引物对NAT-A1由引物NAT-A1-F：5’-TATTCACTGATGATATGGAAC-3’和引物NAT-A1-R：5’-ATCAATAGCTGCAGTGTACTCTG-3’组成，用于扩增靶点NAT-A1。

引物对NAT-A2由引物NAT-A2-F：5’-GGGCGAGCGCGGAGTGCGT-3’和引物NAT-A2-R：5’-TCAATGCGTGGCCCACATG-3’组成，用于扩增靶点NAT-A2。

引物对NAT-A3由引物NAT-A3-F：5’-CCTAGCAAGGACAAGTACATCA-3’和引物NAT-A3-R：5’-GCCATGATGAGATGAGCAAGC-3’组成，用于扩增靶点NAT-A3。

引物对NAT-A4由引物NAT-A4-F：5’-TATTCAGATCAGCATTTGGTGATAC-3’和引物NAT-A4-R：5’-AAGAAGATACAGTTAAGCTCCTG-3’组成，用于扩增靶点NAT-A4。

引物对NAC-A1由引物NAC-A1-F：5’-TGATGTCACCTGATGATCTG-3’和引物NAC-A1-R：5’-GTGAGGCCGTGCGGGTTGG-3’组成，用于扩增靶点NAC-A1。

引物对NAC-A2由引物NAC-A2-F：5’-ACACAGCAAGGAGTGCCGG-3’和引物NAC-A2-R：5’-GCGTCGCATGTGATATTTGTCA-3’组成，用于扩增靶点NAC-A2。

引物对NAC-A3由引物NAC-A3-F：5’-CAATCCAAATTGTAATAAACTTCA-3’和引物NAC-A3-R：5’-CTGGTATCCCAAGCGTCCT-3’组成，用于扩增靶点NAC-A3。

引物对NAC-A4由引物NAC-A4-F：5’-GCCGCGACGGCCAAGACC-3’和引物NAC-A4-R：5’-AAGCCTCAATTTTCCCTGTC-3’组成，用于扩增靶点NAC-A4。

引物对NAG-A1由引物NAG-A1-F：5’GCTGACCGTCGTCGTCTTCA-3’和引物NAG-A1-R：5’-CTTGAGATCAATTGTAACTCAC-3’组成，用于扩增靶点NAG-A1。

引物对NAG-A2由引物NAG-A2-F：5’-GCTGACCGTCGTCGTCTTCA-3’和引物NAG-A2-R：5’-CTTGAGATCAATTGTAACTCAC-3’组成，用于扩增靶点NAG-A2。

引物对NAG-A3由引物NAG-A3-F：5’-ACACAGCAAGGAGTGCCGG-3’和引物NAG-A3-R：5’-GCGTCGCATGTGATATTTGTCA-3’组成，用于扩增靶点NAG-A3。

引物对NAG-A4由引物NAG-A4-F：5’-GCTGACCGTCGTCGTCTTCA-3’和引物NAG-A4-R：5’-CTTGAGATCAATTGTAACTCAC-3’组成，用于扩增靶点NAG-A4。

引物对NCA-A1由引物NCA-A1-F：5’-GGAGCTGGATGAGGTGCT-3’和引物NCA-A1-R：5’-GGAAGAAGAAAAGTAGGGAGA-3’组成，用于扩增靶点NCA-A1。

引物对NCG-A1由引物NCG-A1-F：5’-CAATCCAAATTGTAATAAACTTCA-3’和引物NCG-A1-R：5’-CTGGTATCCCAAGCGTCCT-3’组成，用于扩增靶点NCG-A1。

引物对NCT-A1由引物NCT-A1-F：5’-TTATTAACAGTGCATTTAGCA-3’和引物NCT-A1-R：5’-TGTGGATGCAGAAAGCAACCTG-3’组成，用于扩增靶点NCT-A1。

引物对NCT-A2由引物NCT-A2-F：5’-TGTTCTGAGTTAGCATGGGCTG-3’和引物NCT-A2-R：5’-TTGAACACAAAATAAGGGCA-3’组成，用于扩增靶点NCT-A2。

引物对NCT-A3由引物NCT-A3-F：5’-TCAATTAGTTGTACCCGGTGA-3’和引物NCT-A3-R：5’-CGCCCACCACTGATCGATCG-3’组成，用于扩增靶点NCT-A3。

引物对NCT-A4由引物NCT-A4-F：5’-GGCTCAATCATGTTAGACA-3’和引物NCT-A4-R：5’-TTCTGGCTTTTGTACTTCACCG-3’组成，用于扩增靶点NCT-A4。

引物对NCC-A1由引物NCC-A1-F：5’-TCAATTAGTTGTACCCGGTGA-3’和引物NCC-A1-R：5’-CGCCCACCACTGATCGATCG-3’组成，用于扩增靶点NCC-A1。

引物对NCC-A2由引物NCC-A2-F：5’-ATATTTGTAGCACTAGCCCACA-3’和引物NCC-A2-R：5’-TCCCATCAAGATAAAGCAGCAA-3’组成，用于扩增靶点NCC-A2。

引物对NCC-A3由引物NCC-A3-F：5’-CAATCCAAATTGTAATAAACTTCA-3’和引物NCC-A3-R：5’-CTGGTATCCCAAGCGTCCT-3’组成，用于扩增靶点NCC-A3。

引物对NCC-A4由引物NCC-A4-F：5’-ACCGGTGGGCTCGTGGACA-3’和引物NCC-A4-R：5’-AGGCCCAGGAGCACATTCTC-3’组成，用于扩增靶点NCC-A4。

引物对NTA-A1由引物NTA-A1-F：5’-GCAGCAGCGGTCGGTGCAGCG-3’和引物NTA-A1-R：5’-TGTGGATGCAGAAAGCAACCTG-3’组成，用于扩增靶点NTA-A1。

引物对NTA-A2由引物NTA-A2-F：5’-TGTTCTGAGTTAGCATGGGCTG-3’和引物NTA-A2-R：5’-TTGAACACAAAATAAGGGCA-3’组成，用于扩增靶点NTA-A2。

引物对NTA-A3由引物NTA-A3-F：5’-ATTCCGTTGATGTTGCAAGCTT-3’和引物NTA-A3-R：5’-AGTCTCTAACAACAGTTATTACTT-3’组成，用于扩增靶点NTA-A3。

引物对NTT-A1由引物NTT-A1-F：5’-GCAGCAGCGGTCGGTGCAGCG-3’和引物NTT-A1-R：5’-TGTGGATGCAGAAAGCAACCTG-3’组成，用于扩增靶点NTT-A1。

引物对NTC-A1由引物NTC-A1-F：5’-ATTCCGTTGATGTTGCAAGCTT-3’和引物NTC-A1-R：5’-AGTCTCTAACAACAGTTATTACTT-3’组成，用于扩增靶点NTC-A1。

引物对NTC-A2由引物NTC-A2-F：5’-CCGTGTGTGTTTCAGGGTACT-3’和引物NTC-A2-R：5’-TTTAACAATGAATCAAATGATAGGA-3’组成，用于扩增靶点NTC-A2。

引物对NTC-A3由引物NTC-A3-F：5’-GAGATCCACCAGGCGCTGA-3’和引物NTC-A3-R：5’-CCCAACACCAGTAGCGATGA-3’组成，用于扩增靶点NTC-A3。

引物对NTC-A4由引物NTC-A4-F：5’-GAGATCCACCAGGCGCTGA-3’和引物NTC-A4-R：5’-CCCAACACCAGTAGCGATGA-3’组成，用于扩增靶点NTC-A4。

引物对NTG-A1由引物NTG-A1-F：5’-CCGTGTGTGTTTCAGGGTACT-3’和引物NTG-A1-R：5’-TTTAACAATGAATCAAATGATAGGA-3’组成，用于扩增靶点NTG-A1。

以下实施例中，A·G碱基替换是指靶点序列中任何位置的A突变为G。

A·G碱基替换效率＝发生A·G碱基替换的阳性T0苗数/分析的总阳性T0苗数×100％。

日本晴水稻：参考文献：梁卫红,王高华,杜京尧,等.硝普钠及其光解产物对日本晴水稻幼苗生长和5种激素标记基因表达的影响[J].河南师范大学学报(自然版),2017(2):48-52.；公众可以从北京市农林科学院获得。

恢复培养基：含有200mg/L特美汀的N6固体培养基。

筛选培养基：含有50mg/L潮霉素的N6固体培养基。

分化培养基：含有2mg/L KT、0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。

生根培养基：含有0.2mg/L NAA、0.5g/L谷氨酸、0.5g/L脯氨酸的N6固体培养基。

实施例1、SpRYn-ABE碱基编辑系统载体的构建及其在水稻基因组中PAM序列为NAN，NCN或NTN的靶点进行碱基替换中的应用

一、SpRYn-ABE碱基编辑系统载体的构建

人工合成如下重组表达载体，各载体均为环状质粒：SpRYn-ABE-1重组表达载体，SpRYn-ABE-2重组表达载体，SpRYn-ABE-3重组表达载体，SpRYn-ABE-4重组表达载体，SpRYn-ABE-5重组表达载体，SpRYn-ABE-6重组表达载体，SpRYn-ABE-7重组表达载体，SpRYn-ABE-8重组表达载体，SpRYn-ABE-9重组表达载体，SpRYn-ABE-10重组表达载体，SpRYn-ABE-11重组表达载体，SpRYn-ABE-12重组表达载体，SpRYn-ABE-13重组表达载体，SpRYn-ABE-14重组表达载体，SpRYn-ABE-15重组表达载体，SpRYn-ABE-16重组表达载体，SpRYn-ABE-17重组表达载体，SpRYn-ABE-18重组表达载体和SpRYn-ABE-19重组表达载体。所有重组表达载体各元件结构示意图如图1所示。具体结构描述分别如下：

SpRYn-ABE-1重组表达载体的序列为序列表中的序列1。序列1的第131-596位为OsU6a启动子的核苷酸序列，第597-616位为靶点NAA-A1的核苷酸序列，第617-702位为esgRNA骨架的核苷酸序列，第703-709位为PolyT序列；序列1的第710-1042位为OsU6b启动子的核苷酸序列，第1043-1062位为靶点NAA-A3的核苷酸序列，第1063-1148位为esgRNA骨架的核苷酸序列，第1149-1160位为PolyT序列；序列1的第1167-2880位为OsUbq3启动子的核苷酸序列，第2944-3441位为ecTadA蛋白质的编码序列(不含有终止密码子)，编码序列2所示的ecTadA蛋白质；序列1的第3538-4035位为ecTadA*蛋白质的编码序列(不含有终止密码子)，编码序列3所示的ecTadA*蛋白质；序列1的第4132-8232位为SpRYn蛋白质的编码序列(不含有起始密码子和终止密码子)，编码序列4所示的SpRYn蛋白质；序列1的第8389-8445位为P2A的编码序列，第8446-9471位为潮霉素磷酸转移酶的编码序列，第9811-10063位为Nos终止子的核苷酸序列。SpRYn-ABE-1重组表达载体含有的两个靶点NAA-A1和NAA-A3，序列见表1。

SpRYn-ABE-2重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NAA-A2靶点序列，NAA-A3靶点序列替换为NAA-A4靶点序列，且保持其他序列不变后得到的序列。NAA-A2靶点序列和NAA-A4靶点序列见表1。

SpRYn-ABE-3重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NAA-A5靶点序列，NAA-A3靶点序列替换为NAA-A6靶点序列，且保持其他序列不变后得到的序列。NAA-A5靶点序列和NAA-A6靶点序列见表1。

SpRYn-ABE-4重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NAA-A7靶点序列，NAA-A3靶点序列替换为NAA-A8靶点序列，且保持其他序列不变后得到的序列。NAA-A7靶点序列和NAA-A8靶点序列见表1。

SpRYn-ABE-5重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NAT-A1靶点序列，NAA-A3靶点序列替换为NAT-A2靶点序列，且保持其他序列不变后得到的序列。NAT-A1靶点序列和NAT-A2靶点序列见表1。

SpRYn-ABE-6重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NAT-A3靶点序列，NAA-A3靶点序列替换为NAT-A4靶点序列，且保持其他序列不变后得到的序列。NAT-A3靶点序列和NAT-A4靶点序列见表1。

SpRYn-ABE-7重组表达载体的序列为将序列表中序列1的第131-1160位的序列替换为序列表中的序列5，且保持其他序列不变后得到的序列。序列5的第1-466位为OsU6a启动子的核苷酸序列，第467-486位为靶点NAC-A1的核苷酸序列，第487-572位为esgRNA骨架的核苷酸序列，第573-579位为PolyT序列；序列5的第580-912位为OsU6b启动子的核苷酸序列，第913-932位为靶点NAC-A2的核苷酸序列，第933-1018位为esgRNA骨架的核苷酸序列，第1019-1025位为PolyT序列；序列5的第1026-1767位为OsU6c启动子的核苷酸序列，第1768-1787位为靶点NAC-A4的核苷酸序列，第1788-1873位为esgRNA骨架的核苷酸序列，第1874-1885位为PolyT序列。NAC-A1靶点序列、NAC-A2靶点序列和NAC-A4靶点序列见表1。

SpRYn-ABE-8重组表达载体的序列为将序列表中序列1的第131-1160位的序列替换为序列表中的序列6，且保持其他序列不变后得到的序列。序列6的第1-466位为OsU6a启动子的核苷酸序列，第467-486位为靶点NAC-A3的核苷酸序列，第487-572位为esgRNA骨架的核苷酸序列，第573-584位为PolyT序列。NAC-A3靶点序列见表1。

SpRYn-ABE-9重组表达载体的序列为将SpRYn-ABE-7重组表达载体序列中NAC-A1靶点序列替换为NAG-A1靶点序列，NAC-A2靶点序列替换为NAG-A2靶点序列，NAC-A4靶点序列替换为NAG-A4靶点序列，且保持其他序列不变后得到的序列。NAG-A1靶点序列、NAG-A2靶点序列和NAG-A4靶点序列见表1。

SpRYn-ABE-10重组表达载体的序列为将SpRYn-ABE-8重组表达载体序列中NAC-A3靶点序列替换为NAG-A3靶点序列，且保持其他序列不变后得到的序列。NAG-A3靶点序列见表1。

SpRYn-ABE-11重组表达载体的序列为将SpRYn-ABE-8重组表达载体序列中NAC-A3靶点序列替换为NCA-A1靶点序列，且保持其他序列不变后得到的序列。NCA-A1靶点序列见表1。

SpRYn-ABE-12重组表达载体的序列为将SpRYn-ABE-8重组表达载体序列中NAC-A3靶点序列替换为NCG-A1靶点序列，且保持其他序列不变后得到的序列。NCG-A1靶点序列见表1。

SpRYn-ABE-13重组表达载体的序列为将SpRYn-ABE-7重组表达载体序列中NAC-A1靶点序列替换为NCT-A1靶点序列，NAC-A2靶点序列替换为NCC-A3靶点序列，NAC-A4靶点序列替换为NCC-A4靶点序列，且保持其他序列不变后得到的序列。NCT-A1靶点序列、NCC-A3靶点序列和NCC-A4靶点序列见表1。

SpRYn-ABE-14重组表达载体的序列为将SpRYn-ABE-7重组表达载体序列中NAC-A1靶点序列替换为NCT-A2靶点序列，NAC-A2靶点序列替换为NCT-A4靶点序列，NAC-A4靶点序列替换为NCC-A2靶点序列，且保持其他序列不变后得到的序列。NCT-A2靶点序列、NCT-A4靶点序列和NCC-A2靶点序列见表1。

SpRYn-ABE-15重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NCT-A3靶点序列，NAA-A3靶点序列替换为NCC-A1靶点序列，且保持其他序列不变后得到的序列。NCT-A3靶点序列和NCC-A1靶点序列见表1。

SpRYn-ABE-16重组表达载体的序列为将SpRYn-ABE-1重组表达载体序列中NAA-A1靶点序列替换为NTA-A1靶点序列，NAA-A3靶点序列替换为NTT-A1靶点序列，且保持其他序列不变后得到的序列。NTA-A1靶点序列和NTT-A1靶点序列见表1。

SpRYn-ABE-17重组表达载体的序列为将SpRYn-ABE-7重组表达载体序列中NAC-A1靶点序列替换为NTA-A2靶点序列，NAC-A2靶点序列替换为NTA-A3靶点序列，NAC-A4靶点序列替换为NTC-A1靶点序列，且保持其他序列不变后得到的序列。NTA-A2靶点序列、NTA-A3靶点序列和NTC-A1靶点序列见表1。

SpRYn-ABE-18重组表达载体的序列为将SpRYn-ABE-7重组表达载体序列中NAC-A1靶点序列替换为NTC-A2靶点序列，NAC-A2靶点序列替换为NTC-A3靶点序列，NAC-A4靶点序列替换为NTC-A4靶点序列，且保持其他序列不变后得到的序列。NTC-A2靶点序列、NTC-A3靶点序列和NTC-A4靶点序列见表1。

SpRYn-ABE-19重组表达载体的序列为将SpRYn-ABE-8重组表达载体序列中NAC-A3靶点序列替换为NTG-A1靶点序列，且保持其他序列不变后得到的序列。NTG-A1靶点序列见表1。

各载体的esgRNA的靶点核苷酸序列及相应的PAM序列如表1所示。

表1、各载体的esgRNA的靶点核苷酸序列及相应的PAM序列

二、水稻植株中对靶点进行碱基编辑

将步骤一获得的SpRYn-ABE-1重组表达载体，SpRYn-ABE-2重组表达载体，SpRYn-ABE-3重组表达载体，SpRYn-ABE-4重组表达载体，SpRYn-ABE-5重组表达载体，SpRYn-ABE-6重组表达载体，SpRYn-ABE-7重组表达载体，SpRYn-ABE-8重组表达载体，SpRYn-ABE-9重组表达载体，SpRYn-ABE-10重组表达载体，SpRYn-ABE-11重组表达载体，SpRYn-ABE-12重组表达载体，SpRYn-ABE-13重组表达载体，SpRYn-ABE-14重组表达载体，SpRYn-ABE-15重组表达载体，SpRYn-ABE-16重组表达载体，SpRYn-ABE-17重组表达载体，SpRYn-ABE-18重组表达载体和SpRYn-ABE-19重组表达载体分别按照如下步骤1-11进行操作：

1、将载体导入农杆菌EHA105(上海唯地生物技术有限公司的产品，CAT#:AC1010)，得到重组农杆菌。

2、采用培养基(含50μg/ml卡那霉素和25μg/ml利福平的YEP培养基)培养重组农杆菌，28℃，150rpm震荡培养至OD₆₀₀为1.0-2.0，室温条件下，10000rpm离心1min，用侵染液(将N6液体培养基中的糖替换为葡萄糖和蔗糖，葡萄糖和蔗糖在侵染液中的浓度分别为10g/L和20g/L)重悬菌体并稀释至OD₆₀₀为0.2，得到农杆菌侵染液。

3、水稻品种日本晴成熟种子去壳脱粒，置于100mL三角瓶中，加入70％(v/v)乙醇水溶液浸泡30sec，再置于25％(v/v)次氯酸钠水溶液中，120rpm震荡灭菌30min，无菌水冲洗3次，用滤纸吸干水分，然后将种子胚朝下置于N6固体培养基上，28℃暗培养4-6周，得到水稻愈伤。

4、完成步骤3后，将水稻愈伤浸泡置于农杆菌侵染液甲(农杆菌侵染液甲为向农杆菌侵染液中加入乙酰丁香酮得到的液体，乙酰丁香酮的添加量满足乙酰丁香酮与农杆菌侵染液的体积比为25μl：50ml)中浸泡10min，然后，放在铺有两层灭菌滤纸的培养皿(内含约200ml不含农杆菌的侵染液)上，21℃暗培养1天。

5、取步骤4得到的水稻愈伤放入恢复培养基上，25-28℃暗培养3天。

6、取步骤5得到的水稻愈伤，置于筛选培养基上，28℃暗培养2周。

7、取步骤6得到的水稻愈伤，再次置于筛选培养基上，28℃暗培养2周，得到水稻抗性愈伤。

8、取步骤7得到的水稻抗性愈伤放入分化培养基上，25℃光照培养1个月左右，将分化出来的小苗移至生根培养基上，25℃光照培养2周，获取水稻T0苗。

9、提取水稻T0苗的基因组DNA并以其作为模板，采用引物F(5’-ttattgccactagttcattctacttat-3’)和引物R(5’-ggggtacttctcgtggtagg-3’)组成的引物对进行PCR扩增，得到PCR扩增产物；将该PCR扩增产物进行琼脂糖凝胶电泳，然后进行如下判断：如果PCR扩增产物中含有约1854bp的DNA片段，则相应的水稻T0苗为水稻阳性T0苗；如果PCR扩增产物中不含有约1854bp的DNA片段，则相应的水稻T0苗不为水稻阳性T0苗。

10、各载体分别取步骤9所获得的水稻阳性T0苗的基因组DNA作为模板，对于NAA-A1靶点，采用引物对NAA-A1进行PCR扩增，得到PCR扩增产物；对于NAA-A2靶点，采用引物对NAA-A2进行PCR扩增，得到PCR扩增产物；对于NAA-A3靶点，采用引物对NAA-A3进行PCR扩增，得到PCR扩增产物；对于NAA-A4靶点，采用引物对NAA-A4进行PCR扩增，得到PCR扩增产物；对于NAA-A5靶点，采用引物对NAA-A5进行PCR扩增，得到PCR扩增产物；对于NAA-A6靶点，采用引物对NAA-A6进行PCR扩增，得到PCR扩增产物；对于NAA-A7靶点，采用引物对NAA-A7进行PCR扩增，得到PCR扩增产物；对于NAA-A8靶点，采用引物对NAA-A8进行PCR扩增，得到PCR扩增产物；对于NAT-A1靶点，采用引物对NAT-A1进行PCR扩增，得到PCR扩增产物；对于NAT-A2靶点，采用引物对NAT-A2进行PCR扩增，得到PCR扩增产物；对于NAT-A3靶点，采用引物对NAT-A3进行PCR扩增，得到PCR扩增产物；对于NAT-A4靶点，采用引物对NAT-A4进行PCR扩增，得到PCR扩增产物；对于NAC-A1靶点，采用引物对NAC-A1进行PCR扩增，得到PCR扩增产物；对于NAC-A2靶点，采用引物对NAC-A2进行PCR扩增，得到PCR扩增产物；对于NAC-A3靶点，采用引物对NAC-A3进行PCR扩增，得到PCR扩增产物；对于NAC-A4靶点，采用引物对NAC-A4进行PCR扩增，得到PCR扩增产物；对于NAG-A1靶点，采用引物对NAG-A1进行PCR扩增，得到PCR扩增产物；对于NAG-A2靶点，采用引物对NAG-A2进行PCR扩增，得到PCR扩增产物；对于NAG-A3靶点，采用引物对NAG-A3进行PCR扩增，得到PCR扩增产物；对于NAG-A4靶点，采用引物对NAG-A4进行PCR扩增，得到PCR扩增产物；对于NCA-A1靶点，采用引物对NCA-A1进行PCR扩增，得到PCR扩增产物；对于NCG-A1靶点，采用引物对NCG-A1进行PCR扩增，得到PCR扩增产物；对于NCT-A1靶点，采用引物对NCT-A1进行PCR扩增，得到PCR扩增产物；对于NCT-A2靶点，采用引物对NCT-A2进行PCR扩增，得到PCR扩增产物；对于NCT-A3靶点，采用引物对NCT-A3进行PCR扩增，得到PCR扩增产物；对于NCT-A4靶点，采用引物对NCT-A4进行PCR扩增，得到PCR扩增产物；对于NCC-A1靶点，采用引物对NCC-A1进行PCR扩增，得到PCR扩增产物；对于NCC-A2靶点，采用引物对NCC-A2进行PCR扩增，得到PCR扩增产物；对于NCC-A3靶点，采用引物对NCC-A3进行PCR扩增，得到PCR扩增产物；对于NCC-A4靶点，采用引物对NCC-A4进行PCR扩增，得到PCR扩增产物；对于NTA-A1靶点，采用引物对NTA-A1进行PCR扩增，得到PCR扩增产物；对于NTA-A2靶点，采用引物对NTA-A2进行PCR扩增，得到PCR扩增产物；对于NTA-A3靶点，采用引物对NTA-A3进行PCR扩增，得到PCR扩增产物；对于NTT-A1靶点，采用引物对NTT-A1进行PCR扩增，得到PCR扩增产物；对于NTC-A1靶点，采用引物对NTC-A1进行PCR扩增，得到PCR扩增产物；对于NTC-A2靶点，采用引物对NTC-A2进行PCR扩增，得到PCR扩增产物；对于NTC-A3靶点，采用引物对NTC-A3进行PCR扩增，得到PCR扩增产物；对于NTC-A4靶点，采用引物对NTC-A4进行PCR扩增，得到PCR扩增产物；对于NTG-A1靶点，采用引物对NTG-A1进行PCR扩增，得到PCR扩增产物。

11、将步骤10得到的PCR扩增产物进行Sanger测序及分析。测序结果只针对各靶点区进行分析。分别统计各靶点发生A·G碱基替换的阳性T0苗数，计算得出A·G碱基替换效率，结果见表2。

结果表明，SpRYn-ABE碱基编辑系统，不能对PAM序列为NAA的八个靶点(NAA-A1、NAA-A2、NAA-A3、NAA-A4、NAA-A5、NAA-A6、NAA-A7和NAA-A8)、PAM序列为NCT的四个靶点(NCT-A1、NCT-A2、NCT-A3和NCT-A4)、PAM序列为NCC的四个靶点(NCC-A1、NCC-A2、NCC-A3和NCC-A4)、PAM序列为NTA的三个靶点(NTA-A1、NTA-A2和NTA-A3)和PAM序列为NTC的四个靶点(NTC-A1、NTC-A2、NTC-A3和NTC-A4)编辑，对PAM序列为NAT、NAC、NAG、NCA、NCG、NTT或NTG的靶点均能够有效编辑，得到A·G碱基替换的T0苗，碱基编辑效率为4.2％-85％。由此表明SpRYn-ABE碱基编辑系统可以对水稻基因组中PAM序列为NAT、NAC、NAG、NCA、NCG、NTT或NTG的靶点序列进行碱基编辑，实现A·G碱基替换，大大拓展了碱基编辑范围。

表2、A·G碱基替换效率

靶点名称	总阳性T0苗数	发生A·G碱基替换的阳性T0苗数	A·G碱基替换效率(％)
				NAA-A1	21	0	0
NAA-A2	32	0	0
				NAA-A3	20	0	0
NAA-A4	31	0	0
				NAA-A5	21	0	0
NAA-A6	21	0	0
				NAA-A7	30	0	0
NAA-A8	30	0	0
				NAT-A1	21	4	19
NAT-A2	21	2	9.5
				NAT-A3	21	1	4.8
NAT-A4	21	1	4.8
				NAC-A1	20	1	5
NAC-A2	24	1	4.2
				NAC-A3	23	7	30.4
NAC-A4	20	9	45
				NAG-A1	19	13	68.4
NAG-A2	19	3	15.8
				NAG-A3	18	2	11.1
NAG-A4	20	17	85
				NCA-A1	19	2	10.5
NCG-A1	21	2	9.5
				NCT-A1	15	0	0
NCT-A2	11	0	0
				NCT-A3	18	0	0
NCT-A4	24	0	0
				NCC-A1	18	0	0
NCC-A2	23	0	0
				NCC-A3	21	0	0
NCC-A4	22	0	0
				NTA-A1	24	0	0
NTA-A2	18	0	0
				NTA-A3	19	0	0
NTT-A1	24	7	29.2
				NTC-A1	16	0	0
NTC-A2	15	0	0
				NTC-A3	20	0	0
NTC-A4	24	0	0
				NTG-A1	15	4	26.7

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

序列表

<110> 北京市农林科学院

<120> SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用

<160> 6

<170> PatentIn version 3.5

<210> 1

<211> 16469

<212> DNA

<213> Artificial Sequence

<400> 1

ggtggcagga tatattgtgg tgtaaacatg gcactagcct caccgtcttc gcagacgagg 60

ccgctaagtc gcagctacgc tctcaacggc actgactagg tagtttaaac gtgcacttaa 120

ttaaggtacc tggaatcggc agcaaaggat tttttcctgt agttttccca caaccatttt 180

ttaccatccg aatgatagga taggaaaaat atccaagtga acagtattcc tataaaattc 240

ccgtaaaaag cctgcaatcc gaatgagccc tgaagtctga actagccggt cacctgtaca 300

ggctatcgag atgccataca agagacggta gtaggaacta ggaagacgat ggttgattcg 360

tcaggcgaaa tcgtcgtcct gcagtcgcat ctatgggcct ggacggaata ggggaaaaag 420

ttggccggat aggagggaaa ggcccaggtg cttacgtgcg aggtaggcct gggctctcag 480

cacttcgatt cgttggcacc ggggtaggat gcaatagaga gcaacgttta gtaccacctc 540

gcttagctag agcaaactgg actgccttat atgcgcgggt gctggcttgg ctgccggtat 600

cccagttaca accactgttt cagagctatg ctggaaacag catagcaagt tgaaataagg 660

ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt gcaagaacga 720

actaagccgg acaaaaaaaa aaggagcaca tatacaaacc ggttttattc atgaatggtc 780

acgatggatg atggggctca gacttgagct acgaggccgc aggcgagaga agcctagtgt 840

gctctctgct tgtttgggcc gtaacggagg atacggccga cgagcgtgta ctaccgcgcg 900

ggatgccgct gggcgctgcg ggggccgttg gatggggatc ggtgggtcgc gggagcgttg 960

aggggagaca ggtttagtac cacctcgcct accgaacaat gaagaaccca ccttataacc 1020

ccgcgcgctg ccgcttgtgt tgcccttcat gagatatatg atgtttcaga gctatgctgg 1080

aaacagcata gcaagttgaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 1140

gtcggtgctt tttttttttt aagcttacaa attcgggtca aggcggaagc cagcgcgcca 1200

ccccacgtca gcaaatacgg aggcgcgggg ttgacggcgt cacccggtcc taacggcgac 1260

caacaaacca gccagaagaa attacagtaa aaaaaaagta aattgcactt tgatccacct 1320

tttattacct aagtctcaat ttggatcacc cttaaaccta tcttttcaat ttgggccggg 1380

ttgtggtttg gactaccatg aacaactttt cgtcatgtct aacttccctt tcagcaaaca 1440

tatgaaccat atatagagga gatcggccgt atactagagc tgatgtgttt aaggtcgttg 1500

attgcacgag aaaaaaaaat ccaaatcgca acaatagcaa atttatctgg ttcaaagtga 1560

aaagatatgt ttaaaggtag tccaaagtaa aacttataga taataaaatg tggtccaaag 1620

cgtaattcac tcaaaaaaaa tcaacgagac gtgtaccaaa cggagacaaa cggcatcttc 1680

tcgaaatttc ccaaccgctc gctcgcccgc ctcgtcttcc cggaaaccgc ggtggtttca 1740

gcgtggcgga ttctccaagc agacggagac gtcacggcac gggactcctc ccaccaccca 1800

accgccataa ataccagccc cctcatctcc tctcctcgca tcagctccac ccccgaaaaa 1860

tttctcccca atctcgcgag gctctcgtcg tcgaatcgaa tcctctcgcg tcctcaaggt 1920

acgctgcttc tcctctcctc gcttcgtttc gattcgattt cggacgggtg aggttgtttt 1980

gttgctagat ccgattggtg gttagggttg tcgatgtgat tatcgtgaga tgtttagggg 2040

ttgtagatct gatggttgtg atttgggcac ggttggttcg ataggtggaa tcgtggttag 2100

gttttgggat tggatgttgg ttctgatgat tggggggaat ttttacggtt agatgaattg 2160

ttggatgatt cgattgggga aatcggtgta gatctgttgg ggaattgtgg aactagtcat 2220

gcctgagtga ttggtgcgat ttgtagcgtg ttccatcttg taggccttgt tgcgagcatg 2280

ttcagatcta ctgttccgct cttgattgag ttattggtgc catgggttgg tgcaaacaca 2340

ggctttaata tgttatatct gttttgtgtt tgatgtagat ctgtagggta gttcttctta 2400

gacatggttc aattatgtag cttgtgcgtt tcgatttgat ttcatatgtt cacagattag 2460

ataatgatga actcttttaa ttaattgtca atggtaaata ggaagtcttg tcgctatatc 2520

tgtcataatg atctcatgtt actatctgcc agtaatttat gctaagaact atattagaat 2580

atcatgttac aatctgtagt aatatcatgt tacaatctgt agttcatcta tataatctat 2640

tgtggtaatt tctttttact atctgtgtga agattattgc cactagttca ttctacttat 2700

ttctgaagtt caggatacgt gtgctgttac tacctatctg aatacatgtg tgatgtgcct 2760

gttactatct ttttgaatac atgtatgttc tgttggaata tgtttgctgt ttgatccgtt 2820

gttgtgtcct taatcttgtg ctagttctta ccctatctgt ttggtgatta tttcttgcag 2880

tacgtaagca tgaagaggac cgccgacggc agcgagttcg agccgaagaa gaagaggaag 2940

gtgtccgagg tggagttctc ccacgagtac tggatgaggc acgcactcac cctcgcaaag 3000

agggcatggg acgagaggga ggtgcctgtg ggagcagtgc tcgtgcacaa caacagggtg 3060

atcggagagg gatggaacag gcctatcgga aggcacgacc ctaccgcaca cgcagagatc 3120

atggcactca ggcagggagg cctcgtgatg cagaactaca ggctcatcga cgccaccctc 3180

tacgtgaccc tcgagccttg cgtgatgtgc gcaggagcca tgatccactc caggatcgga 3240

agggtggtgt tcggagcaag ggacgcaaag accggagcag ccggctccct catggacgtg 3300

ctccaccacc cgggcatgaa ccacagggtg gagatcaccg agggaatcct cgcagacgag 3360

tgcgcagccc tcctctccga cttcttcagg atgaggaggc aggagatcaa ggcccagaag 3420

aaggcccagt cctccaccga ctccggcggc tcatcaggcg gctcctccgg ctccgagaca 3480

ccgggcacct ccgagtccgc caccccggag tcctccggcg gctcctccgg cggctcctcc 3540

gaggtggagt tctcccacga gtactggatg aggcacgcac tcaccctcgc aaagagggca 3600

agggacgaga gggaggtgcc tgtgggagca gtgctcgtgc tcaacaacag ggtgatcgga 3660

gagggatgga acagggcaat cggcctccac gaccctaccg cacacgcaga gatcatggca 3720

ctcaggcagg gaggcctcgt gatgcagaac tacaggctca tcgacgccac cctctacgtg 3780

accttcgagc cttgcgtgat gtgcgcagga gccatgatcc actccaggat cggcagggtg 3840

gtgttcggcg tgaggaacgc aaagaccgga gcagcaggct ccctcatgga cgtgctccac 3900

tacccgggca tgaaccacag ggtggagatc accgagggaa tcctcgcaga cgagtgcgca 3960

gccctcctct gctacttctt caggatgccg aggcaggtgt tcaacgccca gaagaaggcc 4020

cagtcctcca ccgactccgg cggctcatca ggcggctcct ccggctccga gacaccgggc 4080

acctccgagt ccgccacccc ggagtcctcc ggcggctcct ccggcggctc cgacaagaag 4140

tactccatcg gcctcgccat cggcaccaac agcgtcggct gggcggtgat caccgacgag 4200

tacaaggtcc cgtccaagaa gttcaaggtc ctgggcaaca ccgaccgcca ctccatcaag 4260

aagaacctca tcggcgccct cctcttcgac tccggcgaga cggcggagcg cacccgcctc 4320

aagcgcaccg cccgccgccg ctacacccgc cgcaagaacc gcatctgcta cctccaggag 4380

atcttctcca acgagatggc gaaggtcgac gactccttct tccaccgcct cgaggagtcc 4440

ttcctcgtgg aggaggacaa gaagcacgag cgccacccca tcttcggcaa catcgtcgac 4500

gaggtcgcct accacgagaa gtaccccact atctaccacc ttcgtaagaa gcttgttgac 4560

tctactgata aggctgatct tcgtctcatc taccttgctc tcgctcacat gatcaagttc 4620

cgtggtcact tccttatcga gggtgacctt aaccctgata actccgacgt ggacaagctc 4680

ttcatccagc tcgtccagac ctacaaccag ctcttcgagg agaaccctat caacgcttcc 4740

ggtgtcgacg ctaaggcgat cctttccgct aggctctcca agtccaggcg tctcgagaac 4800

ctcatcgccc agctccctgg tgagaagaag aacggtcttt tcggtaacct catcgctctc 4860

tccctcggtc tgacccctaa cttcaagtcc aacttcgacc tcgctgagga cgctaagctt 4920

cagctctcca aggataccta cgacgatgat ctcgacaacc tcctcgctca gattggagat 4980

cagtacgctg atctcttcct tgctgctaag aacctctccg atgctatcct cctttcggat 5040

atccttaggg ttaacactga gatcactaag gctcctcttt ctgcttccat gatcaagcgc 5100

tacgacgagc accaccagga cctcaccctc ctcaaggctc ttgttcgtca gcagctcccc 5160

gagaagtaca aggagatctt cttcgaccag tccaagaacg gctacgccgg ttacattgac 5220

ggtggagcta gccaggagga gttctacaag ttcatcaagc caatccttga gaagatggat 5280

ggtactgagg agcttctcgt taagcttaac cgtgaggacc tccttaggaa gcagaggact 5340

ttcgataacg gctctatccc tcaccagatc caccttggtg agcttcacgc catccttcgt 5400

aggcaggagg acttctaccc tttcctcaag gacaaccgtg agaagatcga gaagatcctt 5460

actttccgta ttccttacta cgttggtcct cttgctcgtg gtaactcccg tttcgcttgg 5520

atgactagga agtccgagga gactatcacc ccttggaact tcgaggaggt tgttgacaag 5580

ggtgcttccg cccagtcctt catcgagcgc atgaccaact tcgacaagaa cctccccaac 5640

gagaaggtcc tccccaagca ctccctcctc tacgagtact tcacggtcta caacgagctc 5700

accaaggtca agtacgtcac cgagggtatg cgcaagcctg ccttcctctc cggcgagcag 5760

aagaaggcta tcgttgacct cctcttcaag accaaccgca aggtcaccgt caagcagctc 5820

aaggaggact acttcaagaa gatcgagtgc ttcgactccg tcgagatcag cggcgttgag 5880

gaccgtttca acgcttctct cggtacctac cacgatctcc tcaagatcat caaggacaag 5940

gacttcctcg acaacgagga gaacgaggac atcctcgagg acatcgtcct cactcttact 6000

ctcttcgagg atagggagat gatcgaggag aggctcaaga cttacgctca tctcttcgat 6060

gacaaggtta tgaagcagct caagcgtcgc cgttacaccg gttggggtag gctctcccgc 6120

aagctcatca acggtatcag ggataagcag agcggcaaga ctatcctcga cttcctcaag 6180

tctgatggtt tcgctaacag gaacttcatg cagctcatcc acgatgactc tcttaccttc 6240

aaggaggata ttcagaaggc tcaggtgtcc ggtcagggcg actctctcca cgagcacatt 6300

gctaaccttg ctggttcccc tgctatcaag aagggcatcc ttcagactgt taaggttgtc 6360

gatgagcttg tcaaggttat gggtcgtcac aagcctgaga acatcgtcat cgagatggct 6420

cgtgagaacc agactaccca gaagggtcag aagaactcga gggagcgcat gaagaggatt 6480

gaggagggta tcaaggagct tggttctcag atccttaagg agcaccctgt cgagaacacc 6540

cagctccaga acgagaagct ctacctctac tacctccaga acggtaggga tatgtacgtt 6600

gaccaggagc tcgacatcaa caggctttct gactacgacg tcgaccacat tgttcctcag 6660

tctttcctta aggatgactc catcgacaac aaggtcctca cgaggtccga caagaacagg 6720

ggtaagtcgg acaacgtccc ttccgaggag gttgtcaaga agatgaagaa ctactggagg 6780

cagcttctca acgctaagct cattacccag aggaagttcg acaacctcac gaaggctgag 6840

aggggtggcc tttccgagct tgacaaggct ggtttcatca agaggcagct tgttgagacg 6900

aggcagatta ccaagcacgt tgctcagatc ctcgattcta ggatgaacac caagtacgac 6960

gagaacgaca agctcatccg cgaggtcaag gtgatcaccc tcaagtccaa gctcgtctcc 7020

gacttccgca aggacttcca gttctacaag gtccgcgaga tcaacaacta ccaccacgct 7080

cacgatgctt accttaacgc tgtcgttggt accgctctta tcaagaagta ccctaagctt 7140

gagtccgagt tcgtctacgg tgactacaag gtctacgacg ttcgtaagat gatcgccaag 7200

tccgagcagg agatcggcaa ggccaccgcc aagtacttct tctactccaa catcatgaac 7260

ttcttcaaga ccgagatcac cctcgccaac ggcgagatcc gcaagcgccc tcttatcgag 7320

acgaacggtg agactggtga gatcgtttgg gacaagggtc gcgacttcgc tactgttcgc 7380

aaggtccttt ctatgcctca ggttaacatc gtcaagaaga ccgaggtcca gaccggtggc 7440

ttctccaagg agtctatccg cccaaagaga aactcggaca agctcatcgc taggaagaag 7500

gattgggacc ctaagaagta cggtggtttc ctgtggccta ctgtcgccta ctccgtcctc 7560

gtggtcgcca aggtggagaa gggtaagtcg aagaagctca agtccgtcaa ggagctcctc 7620

ggcatcacca tcatggagcg ctcctccttc gagaagaacc cgatcgactt cctcgaggcc 7680

aagggctaca aggaggtcaa gaaggacctc atcatcaagc tccccaagta ctctcttttc 7740

gagctcgaga acggtcgtaa gaggatgctg gcttccgcta agcagctcca gaagggtaac 7800

gagcttgctc ttccttccaa gtacgtgaac ttcctctacc tcgcctccca ctacgagaag 7860

ctcaagggtt cccctgagga taacgagcag aagcagctct tcgtggagca gcacaagcac 7920

tacctcgacg agatcatcga gcagatctcc gagttctcca agcgcgtcat cctcgctgac 7980

gctaacctcg acaaggtcct ctccgcctac aacaagcacc gcgacaagcc catccgcgag 8040

caggccgaga acatcatcca cctcttcacg ctcacgcgcc tcggcgcccc tcgcgctttc 8100

aagtacttcg acaccaccat cgaccccaag cagtaccgct ccaccaagga ggttctcgac 8160

gctactctca tccaccagtc catcaccggt ctttacgaga ctcgtatcga cctttcccag 8220

cttggtggtg atgacgatga caaaatggca ccgaagaaaa aaaggaaggt cggcggctcc 8280

ccgaagaaaa aaaggaaggt cggcggctcc ccgaagaaaa aaaggaaggt cggcggctcc 8340

ccgaagaaaa aaaggaaggt cggaatccat ggcgttccag gatcaggagc caccaacttc 8400

tccctcctca agcaggccgg cgacgtggag gagaacccgg gcccaatgaa aaagcctgaa 8460

ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg 8520

atgcagctct cggagggcga agaatctcgt gctttcagct tcgatgtagg agggcgtgga 8580

tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg 8640

cactttgcat cggccgcgct cccgattccg gaagtgcttg acattgggga gtttagcgag 8700

agcctgacct attgcatctc ccgccgttca cagggtgtca cgttgcaaga cctgcctgaa 8760

accgaactgc ccgctgttct acaaccggtc gcggaggcta tggatgcgat cgctgcggcc 8820

gatcttagcc agacgagcgg gttcggccca ttcggaccgc aaggaatcgg tcaatacact 8880

acatggcgtg atttcatatg cgcgattgct gatccccatg tgtatcactg gcaaactgtg 8940

atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg atgagctgat gctttgggcc 9000

gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt tcggctccaa caatgtcctg 9060

acggacaatg gccgcataac agcggtcatt gactggagcg aggcgatgtt cggggattcc 9120

caatacgagg tcgccaacat cttcttctgg aggccgtggt tggcttgtat ggagcagcag 9180

acgcgctact tcgagcggag gcatccggag cttgcaggat cgccacgact ccgggcgtat 9240

atgctccgca ttggtcttga ccaactctat cagagcttgg ttgacggcaa tttcgatgat 9300

gcagcttggg cgcagggtcg atgcgacgca atcgtccgat ccggagccgg gactgtcggg 9360

cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg atggctgtgt agaagtactc 9420

gccgatagtg gaaaccgacg ccccagcact cgtccgaggg caaagaaata gactagttca 9480

gccagtttgg tggagctgcc gatgtgcctg gtcgtcccga gcctctgttc gtcaagtatt 9540

tgtggtgctg atgtctactt gtgtctggtt taatggacca tcgagtccgt atgatatgtt 9600

agttttatga aacagtttcc tgtgggacag cagtatgctt tatgaataag ttggatttga 9660

acctaaatat gtgctcaatt tgctcatttg catctcattc ctgttgatgt tttatctgag 9720

ttgcaagttt gaaaatgctg catattctta ttaaatcgtc atttactttt atcttaatga 9780

gctttgcaat ggcctatggg atataaaaga gatcgttcaa acatttggca ataaagtttc 9840

ttaagattga atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac 9900

gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg 9960

attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac 10020

taggataaat tatcgcgcgc ggtgtcatct atgttactag atccctgcag gacgcgttta 10080

attaagtgca cgcggccgcc tacttagtca agagcctcgc acgcgactgt cacgcggcca 10140

ggatcgcctc gtgagcctcg caatctgtac ctagtgttta aactatcagt gtttgacagg 10200

atatattggc gggtaaacct aagagaaaag agcgtttatt agaataacgg atatttaaaa 10260

gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc 10320

ctcgggatca aagtactttg atccaacccc tccgctgcta tagtgcagtc ggcttctgac 10380

gttcagtgca gccgtcttct gaaaacgaca tgtcgcacaa gtcctaagtt acgcgacagg 10440

ctgccgccct gcccttttcc tggcgttttc ttgtcgcgtg ttttagtcgc ataaagtaga 10500

atacttgcga ctagaaccgg agacattacg ccatgaacaa gagcgccgcc gctggcctgc 10560

tgggctatgc ccgcgtcagc accgacgacc aggacttgac caaccaacgg gccgaactgc 10620

acgcggccgg ctgcaccaag ctgttttccg agaagatcac cggcaccagg cgcgaccgcc 10680

cggagctggc caggatgctt gaccacctac gccctggcga cgttgtgaca gtgaccaggc 10740

tagaccgcct ggcccgcagc acccgcgacc tactggacat tgccgagcgc atccaggagg 10800

ccggcgcggg cctgcgtagc ctggcagagc cgtgggccga caccaccacg ccggccggcc 10860

gcatggtgtt gaccgtgttc gccggcattg ccgagttcga gcgttcccta atcatcgacc 10920

gcacccggag cgggcgcgag gccgccaagg cccgaggcgt gaagtttggc ccccgcccta 10980

ccctcacccc ggcacagatc gcgcacgccc gcgagctgat cgaccaggaa ggccgcaccg 11040

tgaaagaggc ggctgcactg cttggcgtgc atcgctcgac cctgtaccgc gcacttgagc 11100

gcagcgagga agtgacgccc accgaggcca ggcggcgcgg tgccttccgt gaggacgcat 11160

tgaccgaggc cgacgccctg gcggccgccg agaatgaacg ccaagaggaa caagcatgaa 11220

accgcaccag gacggccagg acgaaccgtt tttcattacc gaagagatcg aggcggagat 11280

gatcgcggcc gggtacgtgt tcgagccgcc cgcgcacgtc tcaaccgtgc ggctgcatga 11340

aatcctggcc ggtttgtctg atgccaagct ggcggcctgg ccggccagct tggccgctga 11400

agaaaccgag cgccgccgtc taaaaaggtg atgtgtattt gagtaaaaca gcttgcgtca 11460

tgcggtcgct gcgtatatga tgcgatgagt aaataaacaa atacgcaagg ggaacgcatg 11520

aaggttatcg ctgtacttaa ccagaaaggc gggtcaggca agacgaccat cgcaacccat 11580

ctagcccgcg ccctgcaact cgccggggcc gatgttctgt tagtcgattc cgatccccag 11640

ggcagtgccc gcgattgggc ggccgtgcgg gaagatcaac cgctaaccgt tgtcggcatc 11700

gaccgcccga cgattgaccg cgacgtgaag gccatcggcc ggcgcgactt cgtagtgatc 11760

gacggagcgc cccaggcggc ggacttggct gtgtccgcga tcaaggcagc cgacttcgtg 11820

ctgattccgg tgcagccaag cccttacgac atatgggcca ccgccgacct ggtggagctg 11880

gttaagcagc gcattgaggt cacggatgga aggctacaag cggcctttgt cgtgtcgcgg 11940

gcgatcaaag gcacgcgcat cggcggtgag gttgccgagg cgctggccgg gtacgagctg 12000

cccattcttg agtcccgtat cacgcagcgc gtgagctacc caggcactgc cgccgccggc 12060

acaaccgttc ttgaatcaga acccgagggc gacgctgccc gcgaggtcca ggcgctggcc 12120

gctgaaatta aatcaaaact catttgagtt aatgaggtaa agagaaaatg agcaaaagca 12180

caaacacgct aagtgccggc cgtccgagcg cacgcagcag caaggctgca acgttggcca 12240

gcctggcaga cacgccagcc atgaagcggg tcaactttca gttgccggcg gaggatcaca 12300

ccaagctgaa gatgtacgcg gtacgccaag gcaagaccat taccgagctg ctatctgaat 12360

acatcgcgca gctaccagag taaatgagca aatgaataaa tgagtagatg aattttagcg 12420

gctaaaggag gcggcatgga aaatcaagaa caaccaggca ccgacgccgt ggaatgcccc 12480

atgtgtggag gaacgggcgg ttggccaggc gtaagcggct gggttgtctg ccggccctgc 12540

aatggcactg gaacccccaa gcccgaggaa tcggcgtgac ggtcgcaaac catccggccc 12600

ggtacaaatc ggcgcggcgc tgggtgatga cctggtggag aagttgaagg ccgcgcaggc 12660

cgcccagcgg caacgcatcg aggcagaagc acgccccggt gaatcgtggc aagcggccgc 12720

tgatcgaatc cgcaaagaat cccggcaacc gccggcagcc ggtgcgccgt cgattaggaa 12780

gccgcccaag ggcgacgagc aaccagattt tttcgttccg atgctctatg acgtgggcac 12840

ccgcgatagt cgcagcatca tggacgtggc cgttttccgt ctgtcgaagc gtgaccgacg 12900

agctggcgag gtgatccgct acgagcttcc agacgggcac gtagaggttt ccgcagggcc 12960

ggccggcatg gccagtgtgt gggattacga cctggtactg atggcggttt cccatctaac 13020

cgaatccatg aaccgatacc gggaagggaa gggagacaag cccggccgcg tgttccgtcc 13080

acacgttgcg gacgtactca agttctgccg gcgagccgat ggcggaaagc agaaagacga 13140

cctggtagaa acctgcattc ggttaaacac cacgcacgtt gccatgcagc gtacgaagaa 13200

ggccaagaac ggccgcctgg tgacggtatc cgagggtgaa gccttgatta gccgctacaa 13260

gatcgtaaag agcgaaaccg ggcggccgga gtacatcgag atcgagctag ctgattggat 13320

gtaccgcgag atcacagaag gcaagaaccc ggacgtgctg acggttcacc ccgattactt 13380

tttgatcgat cccggcatcg gccgttttct ctaccgcctg gcacgccgcg ccgcaggcaa 13440

ggcagaagcc agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt 13500

caagaagttc tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga 13560

tttgaaggag gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat 13620

cgagggcgaa gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct 13680

agcaggggaa aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc 13740

aaagccgtac attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa 13800

ccggtcacac atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa 13860

ctctttaaaa cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca 13920

gcgcacagcc gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc 13980

cgccgcttcg cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc 14040

aggcaatcta ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca 14100

tcaaggcacc ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc 14160

tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg 14220

gcgcgtcagc gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata 14280

gcggagtgta tactggctta actatgcggc atcagagcag attgtactga gagtgcacca 14340

tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc 14400

cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 14460

tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 14520

gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 14580

ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 14640

aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 14700

tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 14760

ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 14820

gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 14880

tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 14940

caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 15000

ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 15060

cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 15120

ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 15180

cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 15240

gcattctagg tactaaaaca attcatccag taaaatataa tattttattt tctcccaatc 15300

aggcttgatc cccagtaagt caaaaaatag ctcgacatac tgttcttccc cgatatcctc 15360

cctgatcgac cggacgcaga aggcaatgtc ataccacttg tccgccctgc cgcttctccc 15420

aagatcaata aagccactta ctttgccatc tttcacaaag atgttgctgt ctcccaggtc 15480

gccgtgggaa aagacaagtt cctcttcggg cttttccgtc tttaaaaaat catacagctc 15540

gcgcggatct ttaaatggag tgtcttcttc ccagttttcg caatccacat cggccagatc 15600

gttattcagt aagtaatcca attcggctaa gcggctgtct aagctattcg tatagggaca 15660

atccgatatg tcgatggagt gaaagagcct gatgcactcc gcatacagct cgataatctt 15720

ttcagggctt tgttcatctt catactcttc cgagcaaagg acgccatcgg cctcactcat 15780

gagcagattg ctccagccat catgccgttc aaagtgcagg acctttggaa caggcagctt 15840

tccttccagc catagcatca tgtccttttc ccgttccaca tcataggtgg tccctttata 15900

ccggctgtcc gtcattttta aatataggtt ttcattttct cccaccagct tatatacctt 15960

agcaggagac attccttccg tatcttttac gcagcggtat ttttcgatca gttttttcaa 16020

ttccggtgat attctcattt tagccattta ttatttcctt cctcttttct acagtattta 16080

aagatacccc aagaagctaa ttataacaag acgaactcca attcactgtt ccttgcattc 16140

taaaacctta aataccagaa aacagctttt tcaaagttgt tttcaaagtt ggcgtataac 16200

atagtatcga cggagccgat tttgaaaccg cggtgatcac aggcagcaac gctctgtcat 16260

cgttacaatc aacatgctac cctccgcgag atcatccgtg tttcaaaccc ggcagcttag 16320

ttgccgttct tccgaatagc atcggtaaca tgagcaaagt ctgccgcctt acaacggctc 16380

tcccgctgac gccgtcccgg actgatgggc tgcctgtatc gagtggtgat tttgtgccga 16440

gctgccggtc ggggagctgt tggctggct 16469

<210> 2

<211> 166

<212> PRT

<213> Artificial Sequence

<400> 2

Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr

1 5 10 15

Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val

20 25 30

Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile

35 40 45

Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln

50 55 60

Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr

65 70 75 80

Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser

85 90 95

Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala

100 105 110

Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg

115 120 125

Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu

130 135 140

Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys

145 150 155 160

Ala Gln Ser Ser Thr Asp

165

<210> 3

<211> 166

<212> PRT

<213> Artificial Sequence

<400> 3

Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr

1 5 10 15

Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val

20 25 30

Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile

35 40 45

Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln

50 55 60

Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr

65 70 75 80

Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser

85 90 95

Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala

100 105 110

Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg

115 120 125

Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu

130 135 140

Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys

145 150 155 160

Ala Gln Ser Ser Thr Asp

165

<210> 4

<211> 1368

<212> PRT

<213> Artificial Sequence

<400> 4

Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Arg Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Leu Trp Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Lys

1205 1210 1215

Gln Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Arg Leu Gly Ala Pro Arg Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Pro Lys Gln Tyr Arg Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 5

<211> 1885

<212> DNA

<213> Artificial Sequence

<400> 5

tggaatcggc agcaaaggat tttttcctgt agttttccca caaccatttt ttaccatccg 60

aatgatagga taggaaaaat atccaagtga acagtattcc tataaaattc ccgtaaaaag 120

cctgcaatcc gaatgagccc tgaagtctga actagccggt cacctgtaca ggctatcgag 180

atgccataca agagacggta gtaggaacta ggaagacgat ggttgattcg tcaggcgaaa 240

tcgtcgtcct gcagtcgcat ctatgggcct ggacggaata ggggaaaaag ttggccggat 300

aggagggaaa ggcccaggtg cttacgtgcg aggtaggcct gggctctcag cacttcgatt 360

cgttggcacc ggggtaggat gcaatagaga gcaacgttta gtaccacctc gcttagctag 420

agcaaactgg actgccttat atgcgcgggt gctggcttgg ctgccggcga ccaccatcat 480

gttctggttt cagagctatg ctggaaacag catagcaagt tgaaataagg ctagtccgtt 540

atcaacttga aaaagtggca ccgagtcggt gctttttttt gcaagaacga actaagccgg 600

acaaaaaaaa aaggagcaca tatacaaacc ggttttattc atgaatggtc acgatggatg 660

atggggctca gacttgagct acgaggccgc aggcgagaga agcctagtgt gctctctgct 720

tgtttgggcc gtaacggagg atacggccga cgagcgtgta ctaccgcgcg ggatgccgct 780

gggcgctgcg ggggccgttg gatggggatc ggtgggtcgc gggagcgttg aggggagaca 840

ggtttagtac cacctcgcct accgaacaat gaagaaccca ccttataacc ccgcgcgctg 900

ccgcttgtgt tgttctacct ccatcccata acgtttcaga gctatgctgg aaacagcata 960

gcaagttgaa ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt 1020

tttttctcat tagcggtatg catgttggta gaagtcggag atgtaaataa ttttcattat 1080

ataaaaaagg tacttcgaga aaaataaatg catacgaatt aattcttttt atgtttttta 1140

aaccaagtat atagaattta ttgatggtta aaatttcaaa aatatgacga gagaaaggtt 1200

aaacgtacgg catatacttc tgaacagaga gggaatatgg ggtttttgtt gctcccaaca 1260

attcttaagc acgtaaagga aaaaagcaca ttatccacat tgtacttcca gagatatgta 1320

cagcattacg taggtacgtt ttctttttct tcccggagag atgatacaat aatcatgtaa 1380

acccagaatt taaaaaatat tctttactat aaaaatttta attagggaac gtattatttt 1440

ttacatgaca ccttttgaga aagagggact tgtaatatgg gacaaatgaa caatttctaa 1500

gaaatgggca tatgactctc agtacaatgg accaaattcc ctccagtcgg cccagcaata 1560

caaagggaaa gaaatgaggg ggcccacagg ccacggccca cttttctccg tggtggggag 1620

atccagctag aggtccggcc cacaagtggc ccttgccccg tgggacggtg ggattgcaga 1680

gcgcgtgggc ggaaacaaca gtttagtacc acctcgctca cgcaacgacg cgaccacttg 1740

cttataagct gctgcgctga ggctcagcca ccaaggtaat aatcattgtt tcagagctat 1800

gctggaaaca gcatagcaag ttgaaataag gctagtccgt tatcaacttg aaaaagtggc 1860

accgagtcgg tgcttttttt ttttt 1885

<210> 6

<211> 584

<212> DNA

<213> Artificial Sequence

<400> 6

tggaatcggc agcaaaggat tttttcctgt agttttccca caaccatttt ttaccatccg 60

aatgatagga taggaaaaat atccaagtga acagtattcc tataaaattc ccgtaaaaag 120

cctgcaatcc gaatgagccc tgaagtctga actagccggt cacctgtaca ggctatcgag 180

atgccataca agagacggta gtaggaacta ggaagacgat ggttgattcg tcaggcgaaa 240

tcgtcgtcct gcagtcgcat ctatgggcct ggacggaata ggggaaaaag ttggccggat 300

aggagggaaa ggcccaggtg cttacgtgcg aggtaggcct gggctctcag cacttcgatt 360

cgttggcacc ggggtaggat gcaatagaga gcaacgttta gtaccacctc gcttagctag 420

agcaaactgg actgccttat atgcgcgggt gctggcttgg ctgccgcgta cacgacgacg 480

gagggggttt cagagctatg ctggaaacag catagcaagt tgaaataagg ctagtccgtt 540

atcaacttga aaaagtggca ccgagtcggt gctttttttt tttt 584

Claims

1.一种将植物基因组靶点序列中的A突变为G的方法，为如下1）或2）：

所述1）包括如下步骤：将SpRYn、腺嘌呤脱氨酶和sgRNA导入植物体内，实现将植物基因组靶点序列中的A突变为G；

所述2）包括如下步骤：将SpRYn的编码基因、腺嘌呤脱氨酶的编码基因和转录sgRNA的DNA分子导入植物体内，使所述SpRYn、所述腺嘌呤脱氨酶和所述sgRNA均得到表达，实现将植物基因组靶点序列中的A突变为G；

所述SpRYn为氨基酸序列是序列4所示的蛋白质；

所述腺嘌呤脱氨酶为ecTadA和ecTadA*；

所述ecTadA为氨基酸序列是序列2所示的蛋白质；

所述ecTadA*为氨基酸序列是序列3所示的蛋白质；

所述sgRNA为esgRNA；

所述esgRNA如式I所示：所述靶点序列转录的RNA-esgRNA骨架（式I）；

所述esgRNA骨架为将序列1第617-702位中的T替换为U得到的RNA分子；

所述sgRNA靶向靶点序列；

所述靶点序列的PAM序列为NAN或NCN或NTN；N为A、T、C或G；

所述植物为水稻。

2.根据权利要求1所述的方法，其特征在于：所述SpRYn的编码基因为序列1第4132-8232位所示的DNA分子。

3.根据权利要求1所述的方法，其特征在于：所述ecTadA的编码基因为序列1第2944-3441位所示的DNA分子。

4.根据权利要求1所述的方法，其特征在于：所述ecTadA*的编码基因为序列1第3538-4035位所示的DNA分子。

5.权利要求1-4任一所述方法在植物基因组碱基替换中的应用；所述植物为水稻。

6.权利要求1-4任一所述方法在植物基因组碱基编辑中的应用；所述植物为水稻。

7.权利要求1-4任一所述方法在制备植物突变体中的应用；所述植物为水稻。

8.成套试剂在如下T1）-T7）任一种中的应用：

T1）将植物基因组靶点序列中的A突变为G；

T2）制备将植物基因组靶点序列中的A突变为G的产品；

T3）植物基因组碱基替换；

T4）制备植物基因组碱基替换的产品；

T5）植物基因组碱基编辑；

T6）制备植物基因组碱基编辑的产品；

T7）制备植物突变体；

所述成套试剂包括权利要求1-4中任一所述的SpRYn、权利要求1-4中任一所述的腺嘌呤脱氨酶和权利要求1-4中任一所述的sgRNA；

所述靶点序列的PAM序列为NAN或NCN或NTN；N为A、T、C或G；

所述植物为水稻。