CN109321593A

CN109321593A - 一套用于水稻的人工基因编辑系统

Info

Publication number: CN109321593A
Application number: CN201811320030.5A
Authority: CN
Inventors: 周焕斌; 柳浪
Original assignee: Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Current assignee: Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Priority date: 2018-11-07
Filing date: 2018-11-07
Publication date: 2019-02-12
Anticipated expiration: 2038-11-07
Also published as: CN109321593B; CN114045303B; CN113913454A; CN114045303A; CN113913454B

Abstract

本申请涉及一套用于水稻的基因编辑的人工基因编辑系统，其包括：第I调节元件，其包括能够编码如氨基酸序列I的核苷酸序列，其中所述氨基酸序列I包括如I‑1氨基酸序列、I‑2氨基酸序列和I‑3氨基酸序列中的一种；第II调节元件，其包括依次从5’端到3’端串联的第II‑1核苷酸序列和第II‑2核苷酸序列；所述第II‑1核苷酸序列包括靶核苷酸序列；所述靶核苷酸序列来源于目标生物的基因组中，并且所述靶核苷酸序列中含有目标生物基因组中待突变的靶位点；所述第II‑2核苷酸序列包括来源于化脓链球菌的sgRNA核酸序列；所述第II‑1核苷酸序列和所述第II‑2核苷酸序列转录融合。

Description

一套用于水稻的人工基因编辑系统

技术领域

本申请涉及一套用于水稻的人工基因编辑系统。

背景技术

水稻(Oryza sativa L.)是世界主要粮食作物之一，养活了世界上近一半人口，包括几乎整个东亚和东南亚的人口。中国是世界上水稻总产量最高的国家，水稻产量占全球总量的30％左右。在生产过程中，以稻瘟病、稻曲病和纹枯病为主的水稻三大病害严重制约着水稻的生长发育，导致水稻产量和品质降低，威胁着全球的粮食安全。因此，提高产量，改善稻米品质，增加水稻植株抗病、抗逆性等研究以保证粮食的稳定供给是人类社会可持续性发展的重大课题。水稻作为单子叶植物的模式植物，其研究技术、方法、理论和成果对其它禾本科植物，如小麦、玉米、高粱等具有重要指导作用。

近年来发展起来的CRISPR/Cas9系统因为可以对基因组进行定点修饰而极具应用性。不过CRISPR/Cas9系统在进行核酸切割时，需要识别引导RNA(gRNA)3’端保守的PAM序列。现在最常用的SpCas9所识别PAM序列主要是NGG，尽管SpCas9也可识别NAG，以及SpCas9(VQR)可识别NGA等，但其编辑效率均较低；同时基于CRISPR/SpCas9系统发展而来的碱基编辑技术也会因所编辑靶位点的特殊性及可能没有合适的PAM序列导致碱基编辑效率受到限制，这些都在很大程度上限制了CRISPR/Cas9系统在水稻基因组编辑中应用。

因此，如果能开发出一种可更高效、适用范围更广、通用性更强、DNA特异性更强的对植物基因组，特别是水稻基因组进行定点编辑的CRISPR/Cas9系统，不仅会大大提高对植物基因组编辑的效率，而且将被更广泛的应用于植物基因功能研究、作物育种等方面，将会极大地促进植物基因组编辑领域的进程。

发明内容

本申请提供了一套人工基因编辑系统，所述人工基因编辑系统包括：

第I调节元件，其包括能够编码如氨基酸序列I的核苷酸序列；其中所述氨基酸序列I包括如I-1氨基酸序列、I-2氨基酸序列和I-3氨基酸序列中的一种，其中所述I-1氨基酸序列为如SEQ ID No.1所示的氨基酸序列；所述I-2氨基酸序列包括依次从N端到C端串联的SEQ ID No.2、SEQ ID No.1和SEQ ID No.3所示的氨基酸序列；所述I-3氨基酸序列包括依次从N端到C端串联的SEQ ID No.4和SEQ ID No.1所示的氨基酸序列；

第II调节元件，其包括依次从5’端到3’端串联的第II-1核苷酸序列和第II-2核苷酸序列；所述第II-1核苷酸序列包括靶核苷酸序列；所述靶核苷酸序列来源于目标生物的基因组中，并且所述靶核苷酸序列中含有目标生物基因组中待突变的靶位点；所述第II-2核苷酸序列包括来源于化脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列；所述第II-1核苷酸序列和所述第II-2核苷酸序列转录融合，其产物能引导第I调控元件编码的蛋白至目标生物基因组中待突变的靶位点处，并将靶位点处产生碱基进行突变；

当所述第II调节元件为多个时，包含在每一个所述第II调节元件中的第II-1核苷酸序列两两不相同。另外，当所述第II调节元件为多个时，这些第II调节元件可以串联的形成连接在一起。

本申请中，人工基因编辑系统中的靶核苷酸序列由该人工基因编辑系统本身与目标生物基因组中的待突变的靶位点共同确定，并且，如上所述，靶核苷酸序列来源于目标生物的基因组中，因此，靶核苷酸序列上的所述靶位点与目标生物基因组中的待突变的靶位点序列一致，因此，为了表述简便起见，两者均称之为靶位点，但突变发生在目标生物的基因组的序列上，而非发生在人工基因编辑系统的序列上。

在一个具体实施方式中，当使用所述I-1氨基酸序列时，所述靶核苷酸序列中的靶位点处于所述靶核苷酸序列的从3′端到5′端方向的3至5位置中的任意一处；当使用所述I-2氨基酸序列时，所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5′端到3′端方向的2至10位置中的碱基C；当使用所述I-3氨基酸序列时，所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5′端到3′端方向的2至8位置中的碱基A。

当所述氨基酸序列I为如I-1氨基酸序列时，通过利用本申请的人工基因编辑系统，可以将水稻基因组中内源的特定位点处缺失或在其中插入一个或数个碱基，筛选得到水稻基因相应的缺失或插入突变体。对于这些缺失或插入突变体，有可能会使原基因的功能丢失，也有可能使原基因的功能发生减弱或增强，这取决于实际发生的情况，根据实际需要，选择保留或舍弃那些已完成基因序列检测的突变体。

或者，当所述氨基酸序列I为如I-2氨基酸序列时，当第I调节元件通过利用本申请的人工基因编辑系统，可以将水稻基因组中内源的特定碱基C定点突变为T、A或G中的一种，筛选得到水稻基因功能“矫正”突变体。或者对于其反向互补序列来讲，将G定点突变为A、T或C中的一种，筛选得到水稻基因功能“矫正”突变体，此时，使用的靶核苷酸序列为靶位点处为C那条链上的核苷酸序列。

或者，当所述氨基酸序列I为如I-3氨基酸序列时，通过利用本申请的人工基因编辑系统，可以将水稻基因组中内源的特定碱基A定点突变为G，筛选得到水稻基因功能“矫正”突变体。或对于其反向互补序列来讲，将T定点突变为C，筛选得到水稻基因功能“矫正”突变体，此时，使用的靶核苷酸序列为靶位点处为A那条链上的核苷酸序列。

在一个具体实施方式中，所述目标生物为水稻，所述第I调节元件的核苷酸序列为能够适于在水稻中表达的核苷酸序列，所述第II调节元件的核苷酸序列为能够适于在水稻中发生转录的核苷酸序列。

在一个具体实施方式中，能够编码如SEQ ID No.1所示氨基酸序列的核苷酸编码序列如SEQ ID No.5所示。如SEQ ID No.5所示核苷酸编码序列能够较优的在水稻中使用。

在一个具体实施方式中，能够编码如SEQ ID No.2所示氨基酸序列的核苷酸编码序列如SEQ ID No.6所示。如SEQ ID No.6所示核苷酸编码序列能够较优的在水稻中使用。

在一个具体实施方式中，能够编码如SEQ ID No.3所示氨基酸序列的核苷酸编码序列如SEQ ID No.7所示。如SEQ ID No.7所示核苷酸编码序列能够较优的在水稻中使用。

在一个具体实施方式中，能够编码如SEQ ID No.4所示氨基酸序列的核苷酸编码序列如SEQ ID No.8所示。如SEQ ID No.8所示核苷酸编码序列能够较优的在水稻中使用。

在一个具体实施方式中，所述第II-2核苷酸序列如SEQ ID No.9所示。

在一个具体实施方式中，所述第II-1核苷酸序列还包括含有IIS型限制性内切酶的酶切位点的克隆位点，所述靶核苷酸序列通过所述第II-1核苷酸序列上的所述克隆位点而被克隆到其中(例如通过酶切-连接的方式将所述靶核苷酸序列连接到所述克隆位点上)，以使所述第II-1核苷酸序列与第II-2序列转录融合；当所述第II调节元件为多个时，用于克隆不同靶核苷酸序列的所述IIS型限制性内切酶的酶切位点两两不相同。

其中，由于所述靶核苷酸序列是根据碱基编辑位点而变化的，因此可以将包括事先克隆到相关位置的限制性内切酶的酶切位点在内的其他元件构建好。在使用之前，再根据碱基编辑目的将所述靶核苷酸序列通过限制性内切酶的酶切位点的切割而被克隆。当所述第II调节元件为多个时，包含在其中的多个第II-1核苷酸序列中的限制性内切酶的酶切位点两两不相同，如此，可以有效的保障不同的靶核苷酸顺利的被克隆到目标位置。多个靶核苷酸序列可用于目标生物基因组上的多个待突变的靶位点的碱基替换。

在一个具体实施方式中，优选所述克隆位点的核苷酸序列包括SEQ ID No.10和/或SEQID No.11。

在一个具体实施方式中，通过如下方式确定所述靶核苷酸序列：

1)确定水稻基因组上需要被改造的核苷酸序列；

2)判断步骤1)中所确定的需要被改造的核苷酸序列为基因组中的特异性序列(被改造的核苷酸序列的特异性越高，则在进行基因编辑时越准确，否则可能会产生错误识别)，

并根据所述第I调节元件来判断待突变的核苷酸位点的碱基发生突变后引起的改变是否符合预期；或者根据所述第I调节元件来判断待突变的核苷酸位点的反向互补碱基发生突变后引起的改变是否符合预期；

对于符合预期者，所述待突变的核苷酸位点即为潜在的靶位点；

3)在需要被改造的核苷酸序列或其反向互补序列中筛选靶标序列：向潜在的靶位点的3′端方向搜索以确认存在能够被所述第I调节元件编码的氨基酸序列I识别的识别模序，并且

当所述氨基酸序列I为如I-1氨基酸序列时，所述靶位点处于所述识别模序5′端上游的-3至-5的位置，由此确定的所述识别模序5′端上游17至21个核苷酸序列为所述靶核苷酸序列；

当所述氨基酸序列I为如I-2氨基酸序列时，所述靶位点处于所述识别模序5′端上游的-19至-11的位置，由此确定的所述识别模序5′端上游17至21个核苷酸序列为所述靶核苷酸序列；

当所述氨基酸序列I为如I-3氨基酸序列时，所述靶位点处于所述识别模序5′端上游的-19至-13的位置，由此确定的所述识别模序5′端上游17至21个核苷酸序列为所述靶核苷酸序列。

在一个具体实施方式中，所识别模序为5′-N₁GN₂-3′，所述靶核苷酸序列上游的17至21个核苷酸序列，淘汰含有连续五个T的核苷酸序列；其中，所述N₁和N₂独立地为A、G、C和T中的一种。

在一个具体实施方式中，所述靶核苷酸序列为如SEQ ID No.16、SEQ ID No.17和SEQID No.18中所示的至少一种。

在一个具体实施方式中，所述人工基因编辑系统还包括在所述第I调节元件的5’端的能够用于水稻中的，且能够启动所述第I调节元件转录的第一启动子；和/或所述人工基因编辑系统还包括在所述第II调节元件的5’端的能够用于水稻中的，且能够启动所述第II调节元件转录的第二启动子。

在一个具体实施方式中，所述第一启动子为RNA聚合酶II型启动子；和/或第二启动子为RNA聚合酶III型启动子。

在一个具体实施方式中，第一启动子为SEQ ID No.12；和/或第二启动子为SEQ IDNo.13。

在一个具体实施方式中，所述人工基因编辑系统还包括在所述第I调节元件的3’端的能够终止所述第I调节元件转录的第一终止子；和/或所述人工基因编辑系统还包括在所述第II调节元件的3’端的能够终止所述第II调节元件转录的第二终止子。

在一个具体实施方式中，第一终止子为SEQ ID No.14；和/或第二终止子为SEQ IDNo.15。

在一个具体实施方式中，所述第I调节元件和所述第II元件能够被克隆到至少一个载体上。例如，所述第I调节元件表达盒和所述第II调节元件转录盒能够被克隆或整合到同一个载体上。或第I调节元件表达盒和第II调节元件转录盒分别位于不同的载体上时，可以采用基因枪法、农杆菌侵染法或PEG介导转化法将两个盒或含有两个盒的载体导入到水稻愈伤组织或原生质体细胞中。

在一个具体实施方式中，所述第I调节元件能够被克隆到pCAMBIA1300上；所述第II调节元件被克隆到入门载体pENTR4上。pCAMBIA1300为基于Gateway反应并用于水稻遗传转化的双元载体，也可以使用其他类似的双元载体。

在一个具体实施方式中，所述第一启动子、第I调节元件和第一终止子能够被克隆到pCAMBIA1300载体上。

在一个具体实施方式中，第二启动子、第II调节元件和第二终止子被克隆到pENTR4载体上。当所述第II调节元件为多个时，其5’端的第二启动子和其3’端的终止子也为多个。即第二启动子、第II调节元件和第二终止子形成一组，成套出现。含有不同第II调节元件的多个组可以串联的形成连接在一起。其中，第II调节元件的不同，主要指的是第II-1核苷酸序列的不同。

在一个具体实施方式中，所述第I调节元件和所述第II调节元件能够被整合到同一个载体上，或被分布在两个载体上一起使用。

本申请之二提供了一种如本申请之一中任意一人工基因编辑系统在用于水稻基因组突变中的应用。

本申请之三提供了一种实现水稻基因组定点编辑方法，其包括如下步骤：

1)将本申请之一中任意一人工基因编辑系统通过农杆菌介导、基因枪轰击或PEG介导转化的方法中的一种导入到水稻愈伤组织或水稻原生质体中，然后培养获得水稻植株；

2)筛选获得含有所需突变的水稻植株；进一步地，所述水稻植株能够产生含有所述突变的水稻种子。

在进行所述的人工基因编辑系统导入时，可以采用PEG介导转化的方法，也可以采用基因枪法或农杆菌侵染法中的一种将所述的人工基因编辑系统导入到水稻原生质体或愈伤组织中，这是本领域技术人员容易理解的。本领域的技术人员公知，水稻基因组DNA由两条链组成，因此，所述靶核苷酸序列可以在其中互补的任意一条链上。例如，当所述靶核苷酸序列位于某一功能基因的一正义链中时，如果在该功能基因的特定位点上发生一至数个碱基的缺失或插入，并且如果其中的一种突变能够获得预期的使该基因移码突变而产生基因失活，则可以采用此系统来实现，即可以通过直接进行正义链上的碱基缺失或插入，得到水稻基因敲除突变体；当所述靶核苷酸序列位于某一功能基因的正义条链中时，如果该功能基因的特定位点上的C被定点突变为T后，并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸，则可以采用此系统来实现，即可以通过直接进行正义链上的碱基替换来实现三联体密码子中的C替换为T，得到水稻基因功能“矫正”突变体；或当所述靶核苷酸序列位于某一功能基因的反义链中时，如果该功能基因的特定位点上的G被定点突变为A后，并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸，也可以采用此系统来实现，即可以通过将反义链中的C被定点突变为T，进而使正义链中的相应互补的G替换为A来改变正义链中的所述三联体密码子编码氨基酸，得到水稻基因功能“矫正”突变体；当所述靶核苷酸序列位于某一功能基因的反义链中时，如果该功能基因的特定位点上的T被定点突变为C后，并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸，则可以采用此系统来实现，即可以通过将该反义链中的A被定点突变为G，进而使正义链中的相应互补的T替换为C来改变正义链中的所述三联体密码子编码氨基酸，得到水稻基因功能“矫正”突变体；或当所述靶核苷酸序列位于某一功能基因的正义链中时，如果该功能基因的特定位点上的A被定点突变为G后，并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸，也可以采用此系统来实现，即可以通过直接进行正义链上的碱基替换来实现三联体密码子中的A替换为G，从而得到水稻基因功能“矫正”突变体。

本申请的有益效果在于：

a)第II调节元件可以为多个，这样可以同时编辑水稻细胞内多个基因靶位点。

b)通过选用本申请的人工基因编辑系统中不同的第I调节元件可实现了对水稻基因组中的基因敲除(包括缺失或插入)，或从碱基对AT到碱基对GC的替换，或从碱基对GC到碱基对AT的替换。

c)该全新基因编辑工具盒扩展了已有基因编辑工具盒的PAM序列，具有更宽更广的PAM序列，其能广泛地应用于水稻基因组中靶标基因的敲除或单碱基的定向突变，以此创制基因功能失活或获得性突变体材料。尤其是碱基编辑系统在植物中的应用比通过HR的基因替换或通过NHEJ的基因插入更加有效和经济；而广泛的PAM序列使得实现任意位点碱基替换的可能性加大，为植物研究领域科研人员提供一个重要的基因功能研究工具，并在水稻基因功能研究和分子育种方向上为培育水稻新品种提供了新的策略。

附图说明

图1显示了使用pUbi:Cas9NG在OsCERK1基因靶位点处的编辑效果图。

图2显示了使用pUbi:rBE22在OsRLCK185基因靶位点处的编辑效果图。

图3显示了使用pUbi:rBE23在Os03g02040基因靶位点处的编辑效果图。

具体实施方式

以下通过优选的实施例的形式对本申请的上述内容作进一步的详细说明，但不构成对本发明的限制。

如无特别说明，本申请的实施例中的试剂均可通过商业途径购买。

pCAMBIA1300来源于BioVector NTCC典型培养物保藏中心。在pCAMBIA1300中插入了attR1-ccdB-attR2模块，用于gateway反应接受来自于入门载体的attL1-靶向序列转录模块-attL2模块。

pENTR4载体的来源：购自美国Invitrogen公司。

pBlueScript SK载体的来源：购自Clontech公司。

实施例1

重组质粒的构建

构建该载体的技术路线如下：

1.1 pUbi:Cas9NG重组质粒构建

确定Cas9NG的氨基酸序列如SEQ ID No.1所示，并根据Cas9NG的氨基酸序列确定用于在水稻中表达的基因序列SEQ ID No.5，并人工合成如SEQ ID No.5所示的4299bp的核苷酸序列，将其克隆至pUC57上，命名为pUC57:Cas9NG(由北京擎科新业生物技术有限公司完成)。然后将SEQ ID No.12(玉米泛素启动子UbiP)、SEQ ID No.5、SEQ ID No.14(Nos终止子)按照从5’到3’的方向克隆到pCAMBIA1300载体，命名为pUbi:Cas9NG。

质粒pUbi:Cas9NG的主要构成如下：CaMV35S启动子(genebank登陆号为FJ362600.1，第10382至第11162核苷酸序列)，潮霉素基因(genebank登陆号为KY420085.1)，NOS终止子(SEQ ID No.14)，pVS1RepA(genebank登陆号为KY420084.1，第5755至第6435核苷酸序列)，pVS1复制起点(genebank登陆号为KY420084.1，第4066至第5066核苷酸序列)，attR1(genbank登陆号为KR233518.1，第2055至第2174核苷酸序列)，ccdB表达框genbank登陆号为KR233518.1，第3289至第3594核苷酸序列)，attR2(genbank登陆号为KR233518.1，第3635至第3759核苷酸序列)，Ubip启动子(SEQ ID No.12)，Cas9NG基因(SEQ ID No.5)，NOS终止子(SEQ ID No.14)。

1.2 pUbi:rBE22重组质粒构建

用EcoR I和Spe I对本实验室自有载体pUbi:rBE9(Improved base editor forefficiently inducing genetic variations in rice with CRISPR/Cas9.Ren Bin,YanFang,Kuang Yongjie,Li Na,Zhang Dawei,Zhou Xueping,Lin Honghui and ZhouHuanbin.Molecular Plant,2018,11:623-626)进行双酶切，回收5.05kb的片段；用EcoR I和Spe I对克隆载体pBlueScript SK进行双酶切，回收3kb的线性化载体骨架；然后将两者连接，经转化、菌落PCR和酶切验证后备用，获得的重组质粒命名为pBS:rBE9。

以rAPO-R1(SEQ ID No.19：agcaagtccgattgaatact)和UGI-F1(SEQ ID No.20：tccggcggaagtacaaac)为引物，以重组质粒pBS:rBE9为模板，利用I-5^TM2×HighFidelityMaster Mix(购自克劳宁(北京)生物科技有限公司)进行PCR扩增，获得约4.0kb的载体骨架；同时，以OsCas9-Fg1-F1(SEQ ID No.21：attgggacaaactctgtgg和OsCas9-Fg2-R1(SEQID No.22：gtcaccgcccaactgcga)为引物，以pUC57:Cas9NG为模板，利用I-5^TM2×HighFidelity Master Mix进行PCR扩增，获得约4.3kb的Cas9NG基因的PCR片段，该片段经纯化后进行磷酸化处理，与上述4.0kb载体骨架进行连接，经转化、菌落PCR和酶切验证、测序验证后备用，获得的重组质粒命名为pBS:rBE22。

利用BamH I和Spe I对pBS:rBE22进行双酶切并回收5.03kb的rBE22片段；利用BamH I和Spe I对载体pUbi:cas9NG进行双酶切并回收约12kb的载体骨架；将两者连接，经转化、菌落PCR和酶切验证后备用，获得的重组质粒命名为pUbi:rBE22。

质粒pUbi:rBE22的构成如下：CaMV35S启动子(genebank登陆号为FJ362600.1，第10382至第11162核苷酸序列)，潮霉素基因(genebank登陆号为KY420085.1)，NOS终止子(SEQ ID No.14)，pVS1RepA(genebank登陆号为KY420084.1，第5755至第6435核苷酸序列)，pVS1复制起点(genebank登陆号为KY420084.1，第4066至第5066核苷酸序列)，attR1(genbank登陆号为KR233518.1，第2055至第2174核苷酸序列)，ccdB表达框genbank登陆号为KR233518.1，第3289至第3594核苷酸序列)，attR2(genbank登陆号为KR233518.1，第3635至第3759核苷酸序列)，Ubip启动子(SEQ ID No.12)，AID基因(SEQ ID No.6)，Cas9NG基因(SEQ ID No.5)，UGI基因(SEQ ID No.7)，NOS终止子(SEQ ID No.14)。

1.3 pUbi:rBE23重组质粒构建

根据氨基酸序列SEQ ID No.4确定用于在水稻中表达的基因序列SEQ ID No.8，并人工合成如SEQ ID No.8所示的1191bp的核苷酸序列，将其克隆至pUC57上，命名为pUC57:TadA(由北京擎科新业生物技术有限公司完成)。

以pUC57-F1(SEQ ID No.23：gcgcgcttggcgtaatca)和TadA-R1(SEQ ID No.24：agccagaccaattgagtattttttgtc)为引物，以载体pUC57:TadA为模板，利用I-5^TM2×HighFidelity Master Mix进行PCR扩增，纯化后获得4.13kb的载体骨架；再以OsCas9-Fg1-F1(SEQ ID No.21)和NLS-R2(SEQ ID No.25：cactagttcacccgccaac)为引物，以pUC57:Cas9NG为模板利用I-5^TM2×HighFidelity Master Mix进行PCR扩增，获得约4.3kb的Cas9NG基因的PCR片段，纯化后进行磷酸化处理，与上述4.13kb载体骨架进行连接，经转化、菌落PCR和酶切验证后测序备用，获得的重组质粒命名为pUC57:rBE23。

利用BamH I和Spe I对pUC57:rBE23进行双酶切并回收5.33kb的rBE23片段；利用BamH I和Spe I对载体pUbi:Cas9NG并回收约12kb的载体骨架；然后将两者连接，经转化、菌落PCR和酶切验证后测序备用，获得的重组质粒命名为pUbi:rBE23。

质粒pUbi:rBE23的构成如下：CaMV35S启动子(genebank登陆号为FJ362600.1，第10382至第11162核苷酸序列)，潮霉素基因(genebank登陆号为KY420085.1)，NOS终止子(SEQ ID No.14)，pVS1RepA(genebank登陆号为KY420084.1，第5755至第6435核苷酸序列)，pVS1复制起点(genebank登陆号为KY420084.1，第4066至第5066核苷酸序列)，attR1(genbank登陆号为KR233518.1，第2055至第2174核苷酸序列)，ccdB表达框genbank登陆号为KR233518.1，第3289至第3594核苷酸序列)，attR2(genbank登陆号为KR233518.1，第3635至第3759核苷酸序列)，Ubip启动子(SEQ ID No.12)，TadA基因(SEQ ID No.8)，Cas9NG基因(SEQ ID No.5)，NOS终止子(SEQ ID No.14)。

1.4 pENTR4:sgRNA的构建

按照从5’端到3’端的方向，将依次连接的U6启动子序列(SEQ ID No.13)、含有两个BtgZI酶切位点的核苷酸序列(SEQ ID No.10)、gRNA scaffold序列(SEQ ID No.9)、(T)8终止序列(SEQ ID No.15)、U6启动子序列(SEQ ID No.13)、含有两个BsaI酶切位点的核苷酸序列(SEQ ID No.11)、sgRNA序列(SEQ ID No.9)、(T)8终止序列(SEQ ID No.15)进行人工合成，并克隆到pENTR4载体中，命名为pENTR4:sgRNA。其中的两个BtgZ I或两个Bsa I酶切位点用于克隆中特定基因中的靶核苷酸序列。

实施例2：利用pUbi:Cas9NG进行水稻内源基因OsCERK1的敲除

2.1针对OsCERK1基因的识别序列设计和克隆

OsCERK1(LOC_Os08g42580)基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。

对于OsCERK1基因，设计含有与Btgz I酶切位点末端连接匹配的靶核苷酸序列(SEQ ID No.16：下划线为BamH I酶切位点，加粗为PAM序列)引物如下：gOsCERK1-F1(SEQ ID No.26：tgttggccttccttgggatccgg)和gOsCERK1-R1(SEQ IDNo.27：aaacccggatcccaaggaaggcc)。合成引物后，使用T4多聚核苷酸激酶将引物进行磷酸化处理，退火形成双链，将gOsCERK1-F1/R1克隆到pENTR4:sgRNA载体的BtgZ I酶切位点中，测序确认插入片段完全正确，命名为pENTR4:sgRNA-gOsCERK1。

2.2 PEG介导的pUbi:Cas9NG系统转化粳稻品种Kitaake原生质体及基因编辑检测

1)水稻原生质体的制备：

将去壳的成熟的水稻种子用50％的商业化消毒液处理25min；无菌水清洗3-5次，然后将种子转移至无菌的培养皿中，吸出多余的水份；将种子放置于1/2MS培养基上(2.2g/L MS粉；30g/L蔗糖；6g/L植物凝胶；pH5.7)，于光照培养室培养10天。用剪刀剪取水稻幼苗茎叶，用单面刀片横切茎部，越细越好，并切好的水稻材料转移至无菌三角瓶中，加入10ml酶解液(1.5％纤维素酶；0.3％离析酶R-10；0.4M甘露醇；2mM 2-(N-吗啉)乙磺酸(MES)；0.1×W5溶液；pH5.7)，轻轻混匀后用锡箔纸包住瓶身，抽真空30min，之后置于水平摇床(转速约60rpm)，酶解6h。酶解后，尼龙网(孔径为35μm)过滤收集原生质体溶液。原生质体溶液经室温离心(离心力1000g，时间5min)后弃上清，下层原生质体沉淀加入W5溶液(154mM NaCl；125mM CaCl₂；25mM KCl；2mM MES；pH5.7)重悬并1000g离心5min后弃上清，加入适量MMG溶液(0.4M甘露醇；20mM CaCl₂；25mM MES；pH5.7)重悬原生质体。

2)PEG介导的水稻原生质体转化及原生质体基因组DNA提取

取新圆底离心管，依次加入20μl质粒pUbi:Cas9NG(浓度为1000ng/μl)、20μl质粒pENTR4:sgRNA-gOsCERK1(浓度为1000ng/μl)、400μl原生质体、440μl(等体积)40％PEG4000溶液(40％(w/v)PEG 4000；0.4M甘露醇；100mM Ca(NO₃)₂；pH5.7)，轻轻混匀，放置15min。加入1ml W5溶液稀释中止转化反应，1000g离心2min。弃上清，加入1ml W5溶液，重悬原生质体，并将其转入12孔细胞培养板中，锡箔纸包裹避光，室温培养2天后收集原生质体，采用CTAB法提取原生质体基因组DNA。

3)靶位点突变类型的检测

根据OsCERK1基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物：OsCERK1-F1(SEQ ID No.28：gacgtctacgcctttggtgt)，OsCERK1-R1(SEQ ID No.29：gtcagctgcaaaatgcaatg)，PCR产物片段为393bp。首先利用BamH I对原生质体基因组DNA进行酶切消解2h，再以酶切产物为模板，以OsCERK1-F1(SEQ ID No.28)和OsCERK1-R1(SEQ IDNo.29)为引物，利用I-5^TM2×High Fidelity Master Mix进行PCR扩增，获得393bp的PCR片段。该PCR产物再BamHⅠ酶解3h并利用琼脂糖凝胶电泳除去靶位点未被成功编辑的PCR产物，利用AxyPrep凝胶回收试剂盒回收靶位点发生碱缺失或插入的片段，连接TA克隆载体和Sanger测序分析突变类型。如图1所示，随机测序获得了11个单克隆的序列，共检测到6种突变类型，分别为碱基缺失(-1、-2和-4bp)、碱基插入(+T和+A)以及碱基替换(G替换为A)，这表明Cas9NG可识别NGA PAM基序完成基因编辑。

实施例3：利用pUbi:rBE22进行水稻内源基因OsRLCK185的碱基C向T替换

OsRLCK185(LOC_Os05g30870)基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。

对于OsRLCK185基因，设计含有与Bsa I酶切位点末端连接匹配的靶核苷酸序列(SEQ ID No.17：下划线为Alw44I酶切位点，加粗为PAM序列)引物如下：gOsRLCK185-F1(SEQ ID No.30：gtgtgtgcactgccaagctcacac)和gOsRLCK185-R1(SEQID No.31：aaacgtgtgattggcagtgcac)。合成引物后，使用T4多聚核苷酸激酶将引物进行磷酸化处理，退火形成双链，将gOsRLCK185-F1/R1克隆到pENTR4:sgRNA载体的Bsa I酶切位点中，测序确认插入片段完全正确，命名为pENTR4:sgRNA-gOsRLCK185。

其他操作同实施例2。

根据OsRLCK185基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物：OsRLCK185-F1(SEQ ID No.32：tccatggccttgttcctctt)，OsRLCK185-R1(SEQ ID No.33：tgctgctagacacatccaca)，PCR产物片段为484bp。首先利用Alw44I对原生质体基因组DNA进行酶切消解2h，再以酶切产物为模板，以OsRLCK185-F1(SEQ ID No.32)和OsRLCK185-R1(SEQ ID No.33)为引物，利用I-5^TM2×High Fidelity Master Mix进行PCR扩增，获得484bp的PCR片段。该PCR产物再Alw44I酶解3h并利用琼脂糖凝胶电泳除去靶位点未被成功编辑的PCR产物，利用AxyPrep凝胶回收试剂盒回收成功替换靶位点碱基的片段，连接TA克隆载体和Sanger测序分析突变类型。如图2所示，随机测序获得了10个单克隆的序列，均检测到靶碱基G突变为A，其中有3种突变类型，分别为G_4,6>A、G_4,6,9>A以及G_4,6,9,14>A，这表明rBE22可识别NGC PAM基序完成碱基编辑。

实施例4：利用pUbi:rBE23进行水稻内源基因Os03g02040的碱基A向G替换

Os03g02040基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。

对于Os03g02040基因，设计含有与Bsa I酶切位点末端连接匹配的靶核苷酸序列(SEQ ID No.18：下划线为Xba I酶切位点，加粗为PAM序列)引物如下：gOs03g02040-F1(SEQ ID No.34：tgttgagatctagaggttggtcta)和gOs03g02040-R1(SEQID No.35：aaactagaccaacctctagatctc)。合成引物后，使用T4多聚核苷酸激酶将引物进行磷酸化处理，退火形成双链，将gOs03g02040-F1/R1克隆到pENTR4:sgRNA载体的Bsa I酶切位点中，测序确认插入片段完全正确，命名为pENTR4:sgRNA-gOs03g02040。

其他操作同实施例2。

根据Os03g02040基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物：Os03g02040-F1(SEQ ID No.36：cactagcacgacgcactttc)，Os03g02040-R1(SEQ ID No.37：agaacacgcgcatcatatc)，PCR产物片段为493bp。首先利用Alw44I对原生质体基因组DNA进行酶切消解2h，再以酶切产物为模板，以Os03g02040-F1(SEQ ID No.36)和Os03g02040-R1(SEQ ID No.37)为引物，利用I-5^TM2×High Fidelity Master Mix进行PCR扩增，获得493bp的PCR片段。该PCR产物再Xba I酶解3h后利用琼脂糖凝胶电泳除去靶位点未被成功编辑的PCR产物，利用AxyPrep凝胶回收试剂盒回收成功替换靶位点碱基的片段，连接TA克隆载体和Sanger测序分析突变类型。如图3所示，测序结果显示检测到靶碱基T突变为C，其中，这表明rBE23可识别NGT PAM基序完成碱基编辑。

序列表

<110> 中国农业科学院植物保护研究所

<120> 一套用于水稻的人工基因编辑系统

<130> LHA1860907

<160> 37

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1417

<212> PRT

<213> 人工序列(non)

<400> 1

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val

20 25 30

Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu

35 40 45

Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr

50 55 60

Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His

65 70 75 80

Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu

85 90 95

Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr

100 105 110

Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu

115 120 125

Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe

130 135 140

Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn

145 150 155 160

Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His

165 170 175

Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu

180 185 190

Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu

195 200 205

Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe

210 215 220

Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile

225 230 235 240

Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser

245 250 255

Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys

260 265 270

Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr

275 280 285

Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln

290 295 300

Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln

305 310 315 320

Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser

325 330 335

Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr

340 345 350

Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His

355 360 365

Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu

370 375 380

Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly

385 390 395 400

Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys

405 410 415

Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu

420 425 430

Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser

435 440 445

Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg

450 455 460

Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu

465 470 475 480

Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg

485 490 495

Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile

500 505 510

Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln

515 520 525

Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu

530 535 540

Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr

545 550 555 560

Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro

565 570 575

Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe

580 585 590

Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe

595 600 605

Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp

610 615 620

Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile

625 630 635 640

Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu

645 650 655

Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu

660 665 670

Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys

675 680 685

Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys

690 695 700

Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp

705 710 715 720

Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile

725 730 735

His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val

740 745 750

Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly

755 760 765

Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp

770 775 780

Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile

785 790 795 800

Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser

805 810 815

Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser

820 825 830

Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu

835 840 845

Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp

850 855 860

Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile

865 870 875 880

Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu

885 890 895

Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu

900 905 910

Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala

915 920 925

Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg

930 935 940

Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu

945 950 955 960

Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser

965 970 975

Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val

980 985 990

Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp

995 1000 1005

Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His

1010 1015 1020

Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr

1025 1030 1035 1040

Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp

1045 1050 1055

Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr

1060 1065 1070

Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu

1075 1080 1085

Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr

1090 1095 1100

Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala

1105 1110 1115 1120

Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys

1125 1130 1135

Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys

1140 1145 1150

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys

1155 1160 1165

Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu Val

1170 1175 1180

Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys

1185 1190 1195 1200

Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn

1205 1210 1215

Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp

1220 1225 1230

Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly

1235 1240 1245

Arg Lys Arg Met Leu Ala Ser Ala Arg Phe Leu Gln Lys Gly Asn Glu

1250 1255 1260

Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His

1265 1270 1275 1280

Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu

1285 1290 1295

Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile

1300 1305 1310

Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys

1315 1320 1325

Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln

1330 1335 1340

Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro

1345 1350 1355 1360

Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val Tyr Arg

1365 1370 1375

Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1380 1385 1390

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Arg

1395 1400 1405

Pro Lys Lys Lys Arg Lys Val Gly Gly

1410 1415

<210> 2

<211> 211

<212> PRT

<213> 人工序列(non)

<400> 2

Met Asp Ser Leu Leu Met Asn Arg Arg Glu Phe Leu Tyr Gln Phe Lys

1 5 10 15

Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val

20 25 30

Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr

35 40 45

Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr

50 55 60

Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp

65 70 75 80

Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp

85 90 95

Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg

100 105 110

Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg

115 120 125

Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr

130 135 140

Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Gly Arg Thr Phe Lys

145 150 155 160

Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu

165 170 175

Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala

180 185 190

Phe Arg Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr

195 200 205

Pro Glu Ser

210

<210> 3

<211> 91

<212> PRT

<213> 人工序列(non)

<400> 3

Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly

1 5 10 15

Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val

20 25 30

Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr

35 40 45

Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp

50 55 60

Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly

65 70 75 80

Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser

85 90

<210> 4

<211> 397

<212> PRT

<213> 人工序列(non)

<400> 4

Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu

1 5 10 15

Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala

20 25 30

Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro

35 40 45

Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg

50 55 60

Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu

65 70 75 80

Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His

85 90 95

Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly

100 105 110

Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His

115 120 125

Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu

130 135 140

Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys

145 150 155 160

Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser

165 170 175

Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser

180 185 190

Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr

195 200 205

Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg

210 215 220

Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly

225 230 235 240

Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala

245 250 255

Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg

260 265 270

Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys

275 280 285

Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val

290 295 300

Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His

305 310 315 320

Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala

325 330 335

Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln

340 345 350

Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly

355 360 365

Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

370 375 380

Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser

385 390 395

<210> 5

<211> 4254

<212> DNA

<213> 人工序列(non)

<400> 5

atggactata aggatcacga tggcgactac aaggatcatg acattgacta taaggatgac 60

gacgataaga tggcacctaa gaagaaaagg aaagtcggca ttcatggcgt tccggcagcc 120

gacaaaaagt atagcatcgg cctcgatatt gggacaaact ctgtgggctg ggcggtaatt 180

accgacgagt acaaggtgcc tagtaagaaa tttaaagtgc tcggaaacac tgacaggcac 240

tctataaaga agaacctgat cggggcactg cttttcgact ccggagagac ggcggaggcg 300

acgcgtctca agcgtaccgc gcgccgcagg tacacaagaa ggaagaatag gatctgctac 360

ttgcaggaaa tcttcagtaa cgagatggcg aaggtcgacg atagtttctt tcatcggttg 420

gaagaatcgt tcctcgtaga ggaggacaaa aagcacgagc gtcacccaat attcgggaat 480

attgttgacg aggttgccta ccatgagaaa tatcctacaa tatatcacct ccgtaagaag 540

cttgtcgatt caactgataa ggctgatctc agactcatct atcttgccct cgcacatatg 600

attaagtttc gtggccactt cttgattgaa ggcgacctca acccggacaa ctcagatgtt 660

gacaagcttt ttatacagct cgtccagaca tataaccagc tgtttgaaga gaatcccatc 720

aatgcgagtg gggttgatgc taaagccatt ttgtccgcca ggttgtccaa atctcgcaga 780

ctggaaaacc tgatcgcaca gcttcccggt gaaaagaaaa acgggctctt cggcaatctc 840

atcgcactgt ccctcggcct caccccaaac ttcaagtcta acttcgacct ggccgaggat 900

gcgaagctcc agctgtcaaa agatacatac gacgacgatt tggacaatct gcttgcgcaa 960

ataggcgacc agtatgcgga cctgttcctg gctgccaaaa atctgtcaga tgcaatcctc 1020

ctgtccgata tattgcgtgt gaacaccgaa atcacgaagg caccgcttag cgcatccatg 1080

atcaagagat acgacgagca ccatcaggac ctcacactcc tcaaggcgct tgttcgtcag 1140

cagcttcccg agaaatataa ggaaattttt ttcgatcaaa gcaagaatgg atatgctggc 1200

tatattgacg gtggcgcttc gcaggaggag ttctataaat tcattaagcc gattctggag 1260

aagatggacg gaacggagga gctcctcgtc aagcttaacc gggaagacct gttgcggaag 1320

cagaggactt ttgataacgg ctctattccg caccaaatcc atctgggtga gttgcacgca 1380

atcttgagaa gacaagagga tttctacccg ttccttaagg ataacagaga gaagatagaa 1440

aaaatactga ccttcaggat accatactat gtgggcccac tggcgcgcgg aaatagtcgt 1500

ttcgcatgga tgactagaaa gtccgaagaa acgatcacgc catggaattt tgaggaagtg 1560

gtcgacaagg gcgcctctgc ccagagcttc atcgaaagga tgaccaattt tgacaaaaat 1620

ctgcctaacg aaaaggtgct tccgaagcac agcctgttgt atgaatactt cacagtttat 1680

aacgagctca ctaaggtcaa gtacgtcacg gagggcatgc gtaagcctgc tttcctgtct 1740

ggtgaacaaa aaaaggcgat tgtggacctc cttttcaaga cgaaccgtaa agttactgtg 1800

aagcaactga aagaggatta ctttaagaaa attgagtgct tcgacagtgt ggagatttcc 1860

ggtgtcgagg accggtttaa cgccagcctg ggtacgtatc atgacctgct taaaattatc 1920

aaggataaag atttcctgga taatgaagag aacgaagata tactggagga cattgtgttg 1980

actttgaccc tcttcgagga cagagagatg attgaggaaa gactgaagac ctacgcacac 2040

ctttttgatg acaaggtcat gaaacaactc aagcgccggc gctatactgg ctggggccgg 2100

ctttctcgca agctcatcaa tgggattcgg gataagcaat caggcaagac aattttggac 2160

ttcctcaaat ccgacggatt cgcaaatagg aattttatgc agctgataca tgacgactct 2220

ttgacattca aagaagacat acagaaggct caggtcagcg gccaaggaga ttctttgcac 2280

gagcatatcg ctaacttggc aggtagcccc gccataaaaa agggcattct tcaaacggta 2340

aaagttgttg acgaactcgt gaaggttatg ggccgtcata agccggaaaa cattgttatt 2400

gaaatggcta gggaaaatca gacgacccag aagggacaga aaaatagcag ggagcggatg 2460

aagagaattg aagagggaat taaggagctt ggatctcaga ttcttaagga gcaccctgtg 2520

gagaacaccc aacttcagaa tgaaaagctc tacctttact accttcaaaa cggccgggat 2580

atgtacgtcg atcaggaact tgacattaac cggttgagcg attatgacgt tgaccatatt 2640

gtgccccaat ctttccttaa agacgactct atcgacaata aagtgctgac gcgcagcgat 2700

aaaaatcgcg gtaagtcgga taatgtcccg tcggaagagg tggttaaaaa aatgaagaac 2760

tattggaggc aactcctgaa tgccaagctg atcactcaga ggaaattcga caatctcacc 2820

aaggcagaaa ggggtggact tagcgagctc gacaaggccg gttttatcaa aagacagctg 2880

gtggagacac gccaaatcac caaacacgtt gcccagatcc tggattcgag gatgaacacg 2940

aagtatgacg agaacgacaa gttgattagg gaagtcaagg tcatcacttt gaagtccaag 3000

ctggtgagcg actttcgcaa agacttccag ttttacaaag tcagggaaat taataactac 3060

caccacgccc acgacgccta ccttaacgcc gtggttggca cagcactcat caagaaatac 3120

cctaagctcg aatctgagtt cgtctatggc gactataagg tctacgacgt tagaaaaatg 3180

atcgcgaaat ctgagcagga aataggcaag gcaactgcca agtacttctt ctattccaat 3240

atcatgaact tttttaagac ggagattacc ctggcgaatg gtgagatccg caagcgccct 3300

ttgattgaga caaacggaga aacaggagag atcgtatggg acaaagggcg ggactttgct 3360

actgttagga aggtgctctc tatgccacaa gttaacattg tcaaaaaaac tgaagtgcag 3420

acaggtgggt ttagcaagga atctatccgc ccgaagagga actctgacaa gctgatcgcc 3480

cgcaagaaag attgggaccc gaaaaagtac ggaggattcg tttcccccac agttgcgtac 3540

tccgtgcttg tcgtggccaa agtggagaag ggcaagtcta agaagctcaa gagcgtcaaa 3600

gagttgttgg ggatcacgat tatggagcgg tcgtctttcg aaaagaatcc gatagatttt 3660

ctcgaggcca agggttataa agaagtcaag aaggatctta tcatcaagct ccctaagtac 3720

tccctctttg agcttgaaaa cggacggaaa agaatgctgg cttcagcgcg ctttcttcag 3780

aagggtaatg aactcgctct gccctcaaaa tatgtgaatt tcctttacct ggcatcacac 3840

tatgagaagc ttaagggttc tccagaggac aacgagcaga agcaactgtt cgttgaacaa 3900

cacaagcact accttgacga gattatcgag caaatcagcg agtttagcaa gcgcgttata 3960

ctggcagacg caaatcttga taaggtcctt agcgcctaca acaagcatag agacaaaccc 4020

atccgggagc aggccgagaa cattattcat ctcttcacct tgacgaatct tggggccccg 4080

cgcgcgttca agtacttcga tactaccata gacagaaagg tctatcgctc gacaaaggaa 4140

gttcttgacg ccacgctgat ccaccaaagt ataacaggcc tctatgagac acgcatcgac 4200

ctttcgcagt tgggcggtga ccgccccaaa aagaagagga aagttggcgg gtga 4254

<210> 6

<211> 633

<212> DNA

<213> 人工序列(non)

<400> 6

atggatagcc ttctcatgaa cagaagagag tttctctatc agtttaaaaa tgttcggtgg 60

gcgaagggga ggagagagac atatctctgc tatgttgtta agcggagaga ttctgcgacc 120

tcattctcac tcgattttgg ttatttgagg aacaagaatg gatgtcatgt cgaattgttg 180

tttctccggt atatttccga ctgggatttg gacccagggc ggtgttaccg ggtcacatgg 240

tttatttcct ggagtccatg ttacgactgt gcgcgccatg tcgccgactt cctcaggggt 300

aatcctaact tgtccttgcg gatttttaca gccagactct atttctgtga ggatcggaag 360

gcggaacccg aggggctgag aagactgcac cgcgctggcg tccaaatcgc catcatgact 420

tttaaggatt atttctactg ttggaacacg ttcgtcgaga accacggtcg gaccttcaaa 480

gcctgggaag ggctgcatga aaattccgtg aggttgtccc ggcaactccg cagaatactc 540

ctgccccttt atgaggtcga cgatctcaga gacgccttta gaactagcgg aagcgagacg 600

ccagggactt ctgaatcggc cacccccgag agc 633

<210> 7

<211> 273

<212> DNA

<213> 人工序列(non)

<400> 7

tccggcggaa gtacaaacct ttcagacatt atagaaaagg aaaccggcaa gcaactcgtc 60

atccaggaat ccatacttat gctccctgaa gaggtggaag aagtgatcgg taataaacca 120

gagagcgaca tacttgtcca caccgcttat gacgaaagta cagacgaaaa cgtcatgctt 180

ctgacgagtg atgcccccga atacaaacct tgggcgctcg tcatccagga ttccaatggg 240

gagaataaaa taaagatgct ctctggaggc agc 273

<210> 8

<211> 1191

<212> DNA

<213> 人工序列(non)

<400> 8

atgtccgaag tggaatttag ccatgaatat tggatgcggc acgccctcac gcttgccaag 60

agagcctggg atgagaggga ggttcccgtc ggtgccgtgt tggtccataa caacagggtg 120

attggggaag gatggaacag acccattggg cgccatgatc caactgccca tgcagagatt 180

atggcgctca ggcaaggggg gttggttatg caaaactacc ggcttattga cgcaaccctg 240

tatgtcaccc ttgaaccctg tgttatgtgc gcgggggcca tgatacactc tcggataggg 300

cgggtggtgt tcggggctcg ggatgctaag accggagctg ctggttccct catggatgtc 360

ttgcatcatc ctggtatgaa ccatagagtc gagattactg aaggcattct cgcagacgaa 420

tgcgctgccc ttctctcaga tttctttaga atgcgcagac aggaaataaa ggctcaaaaa 480

aaagcacaga gttccacgga ttccggcggg tcgagcggtg gcagctccgg ctccgagaca 540

cccggtacga gtgaatccgc tacgcccgaa tcctcggggg gaagctctgg aggctcatca 600

gaagtcgagt tctcccatga gtattggatg aggcacgccc tcactcttgc gaagagggcc 660

agggacgaga gggaggtgcc ggtcggtgct gtcctggtct tgaataacag ggtgataggc 720

gaaggttgga acagggctat tggccttcat gaccctactg ctcatgcgga aatcatggca 780

cttagacagg ggggcctcgt tatgcaaaat taccgcctga tcgacgccac tctttatgtc 840

acatttgaac catgtgttat gtgtgcgggc gctatgatcc attcacgcat aggtcgcgtg 900

gtttttggag ttcgcaacgc gaaaacaggg gctgcaggct ctctgatgga cgttttgcac 960

tatccgggaa tgaaccatag agtcgaaatc acagaaggga ttttggcaga cgaatgcgcg 1020

gctcttcttt gttatttttt cagaatgccc cgccaagtgt ttaatgctca aaagaaagcg 1080

cagagtagca cagactcggg gggatcttct gggggctcgt ctggttccga gactcccgga 1140

acttccgagt cggcaacacc tgaatcctcc ggcggctctt cgggcggatc t 1191

<210> 9

<211> 76

<212> DNA

<213> 人工序列(non)

<400> 9

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtgc 76

<210> 10

<211> 25

<212> DNA

<213> 人工序列(non)

<400> 10

tgtgtagaga ccaaaggagg tctca 25

<210> 11

<211> 41

<212> DNA

<213> 人工序列(non)

<400> 11

tgttggctag gatccatcgc agtcagcgat gagtacagca a 41

<210> 12

<211> 1765

<212> DNA

<213> 人工序列(non)

<400> 12

gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 60

aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 120

acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 180

gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 240

gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 300

aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 360

gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 420

aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 480

gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 540

gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 600

aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 660

gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 720

ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 780

ggcctcctcc tcctctcacg gcacggcagc tacgggggat tcctttccca ccgctccttc 840

gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct ctttccccaa 900

cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc cacccgtcgg 960

cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta ccttctctag 1020

atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat gtttgtgtta 1080

gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg acctgtacgt 1140

cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct gggatggctc 1200

tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc atagggtttg 1260

gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc 1320

atgctttttt tttgtcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 1380

ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 1440

atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 1500

gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 1560

tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 1620

attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 1680

ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 1740

cctgttgttt ggtgttactt ctgca 1765

<210> 13

<211> 322

<212> DNA

<213> 人工序列(non)

<400> 13

aagaacgaac taagccggac aaaaaaagga gcacatatac aaaccggttt tattcatgaa 60

tggtcacgat ggatgatggg gctcagactt gagctacgag gccgcaggcg agagaagcct 120

agtgtgctct ctgcttgttt gggccgtaac ggaggatacg gccgacgagc gtgtactacc 180

gcgcgggatg ccgctgggcg ctgcgggggc cgttggatgg ggatcggtgg gtcgcgggag 240

cgttgagggg agacaggttt agtaccacct cgcctaccga acaatgaaga acccacctta 300

taaccccgcg cgctgccgct tg 322

<210> 14

<211> 253

<212> DNA

<213> 人工序列(non)

<400> 14

gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60

atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120

atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 180

gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240

atgttactag atc 253

<210> 15

<211> 8

<212> DNA

<213> 人工序列(non)

<400> 15

tttttttt 8

<210> 16

<211> 22

<212> DNA

<213> 人工序列(non)

<400> 16

ggccttcctt gggatccggc ga 22

<210> 17

<211> 23

<212> DNA

<213> 人工序列(non)

<400> 17

gtgcactgcc aagctcacac tgc 23

<210> 18

<211> 22

<212> DNA

<213> 人工序列(non)

<400> 18

agatctagag gttggtctac gt 22

<210> 19

<211> 20

<212> DNA

<213> 人工序列(non)

<400> 19

agcaagtccg attgaatact 20

<210> 20

<211> 18

<212> DNA

<213> 人工序列(non)

<400> 20

tccggcggaa gtacaaac 18

<210> 21

<211> 19

<212> DNA

<213> 人工序列(non)

<400> 21

attgggacaa actctgtgg 19

<210> 22

<211> 18

<212> DNA

<213> 人工序列(non)

<400> 22

gtcaccgccc aactgcga 18

<210> 23

<211> 18

<212> DNA

<213> 人工序列(non)

<400> 23

gcgcgcttgg cgtaatca 18

<210> 24

<211> 27

<212> DNA

<213> 人工序列(non)

<400> 24

agccagacca attgagtatt ttttgtc 27

<210> 25

<211> 18

<212> DNA

<213> 人工序列(non)

<400> 25

actagttcac ccgccaac 18

<210> 26

<211> 23

<212> DNA

<213> 人工序列(non)

<400> 26

tgttggcctt ccttgggatc cgg 23

<210> 27

<211> 23

<212> DNA

<213> 人工序列(non)

<400> 27

aaacccggat cccaaggaag gcc 23

<210> 28

<211> 20

<212> DNA

<213> 人工序列(non)

<400> 28

gacgtctacg cctttggtgt 20

<210> 29

<211> 19

<212> DNA

<213> 人工序列(non)

<400> 29

tcagctgcaa aatgcaatg 19

<210> 30

<211> 24

<212> DNA

<213> 人工序列(non)

<400> 30

gtgtgtgcac tgccaagctc acac 24

<210> 31

<211> 22

<212> DNA

<213> 人工序列(non)

<400> 31

aaacgtgtga ttggcagtgc ac 22

<210> 32

<211> 20

<212> DNA

<213> 人工序列(non)

<400> 32

tccatggcct tgttcctctt 20

<210> 33

<211> 20

<212> DNA

<213> 人工序列(non)

<400> 33

tgctgctaga cacatccaca 20

<210> 34

<211> 24

<212> DNA

<213> 人工序列(non)

<400> 34

tgttgagatc tagaggttgg tcta 24

<210> 35

<211> 24

<212> DNA

<213> 人工序列(non)

<400> 35

aaactagacc aacctctaga tctc 24

<210> 36

<211> 20

<212> DNA

<213> 人工序列(non)

<400> 36

cactagcacg acgcactttc 20

<210> 37

<211> 20

<212> DNA

<213> 人工序列(non)

<400> 37

cagaacacgc gcatcatatc 20

Claims

1.一套人工基因编辑系统，所述人工基因编辑系统包括：

第I调节元件，其包括能够编码如氨基酸序列I的核苷酸序列；其中所述氨基酸序列I包括如I-1氨基酸序列、I-2氨基酸序列和I-3氨基酸序列中的一种，其中所述I-1氨基酸序列为如SEQ ID No.1所示的氨基酸序列；所述I-2氨基酸序列包括依次从N端到C端串联的SEQID No.2、SEQ ID No.1和SEQ ID No.3所示的氨基酸序列；所述I-3氨基酸序列包括依次从N端到C端串联的SEQ ID No.4和SEQ ID No.1所示的氨基酸序列；

第II调节元件，其包括依次从5’端到3’端串联的第II-1核苷酸序列和第II-2核苷酸序列；所述第II-1核苷酸序列包括靶核苷酸序列；所述靶核苷酸序列来源于目标生物的基因组中，并且所述靶核苷酸序列中含有目标生物基因组中待突变的靶位点；所述第II-2核苷酸序列包括来源于化脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列；所述第II-1核苷酸序列和所述第II-2核苷酸序列转录融合，其产物能引导第I调控元件编码的蛋白至目标生物基因组中待突变的靶位点处，并将所述靶位点处的碱基进行突变；

当所述第II调节元件为多个时，包含在每一个所述第II调节元件中的第II-1核苷酸序列两两不相同。

2.根据权利要求1所述的人工基因编辑系统，其特征在于，当使用所述I-1氨基酸序列时，所述靶核苷酸序列中的靶位点处于所述靶核苷酸序列的从3′端到5′端方向的3至5位置中的任意一处；当使用所述I-2氨基酸序列时，所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5′端到3′端方向的2至10位置中的碱基C；当使用所述I-3氨基酸序列时，所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5′端到3′端方向的2至8位置中的碱基A。

3.根据权利要求1或2所述的人工基因编辑系统，其特征在于，所述目标生物为水稻，所述第I调节元件的核苷酸序列为能够适于在水稻中表达的核苷酸序列，所述第II调节元件的核苷酸序列为能够适于在水稻中发生转录的核苷酸序列；

优选能够编码如SEQ ID No.1所示氨基酸序列的核苷酸编码序列如SEQ ID No.5所示；能够编码如SEQ ID No.2所示氨基酸序列的核苷酸编码序列如SEQ ID No.6所示；能够编码如SEQ ID No.3所示氨基酸序列的核苷酸编码序列如SEQ ID No.7所示；能够编码如SEQ IDNo.4所示氨基酸序列的核苷酸编码序列如SEQ ID No.8所示；

优选所述第II-2核苷酸序列如SEQ ID No.9所示。

4.根据权利要求1-3中任意一项所述的人工基因编辑系统，其特征在于，所述第II-1核苷酸序列的3’端还包括含有IIS型限制性内切酶的酶切位点的克隆位点，所述靶核苷酸序列通过所述第II-1核苷酸序列上的所述克隆位点而被克隆到其中，以使所述第II-1核苷酸序列与第II-2序列转录融合；

当所述第II调节元件为多个时，用于克隆不同靶核苷酸序列的所述IIS型限制性内切酶的酶切位点两两不相同。

5.根据权利要求1-4中任意一项所述的人工基因编辑系统，其特征在于，通过如下方式确定所述靶核苷酸序列：

1)确定水稻基因组上需要被改造的核苷酸序列；

2)判断步骤1)中所确定的需要被改造的核苷酸序列为基因组中的特异性序列，

3)在需要被改造的核苷酸序列或其反向互补序列中筛选靶标序列：向潜在的靶位点的3′端方向搜索以确认存在能够被所述第I调节元件编码的氨基酸序列所识别的识别模序，并且

6.根据权利要求5所述的人工基因编辑系统，其特征在于，

所述识别模序为5′-N₁GN₂-3′，所述靶核苷酸序列为所述识别模序5′端上游的17至21个核苷酸序列，淘汰含有连续五个T的核苷酸序列；

其中，所述N₁和N₂独立地为A、G、C和T中的一种。

7.根据权利要求1-6中任意一项所述的人工基因编辑系统，其特征在于，所述人工基因编辑系统还包括在所述第I调节元件的5′端的能够用于水稻中的，且能够启动所述第I调节元件转录的第一启动子；和/或所述人工基因编辑系统还包括在所述第II调节元件的5′端的能够用于水稻中的，且能够启动所述第II调节元件转录的第二启动子；

优选地，所述第一启动子为RNA聚合酶II型启动子；和/或第二启动子为RNA聚合酶III型启动子；

更优选地，第一启动子为SEQ ID No.12；和/或第二启动子为SEQ ID No.13；

优选地，所述人工基因编辑系统还包括在所述第I调节元件的3’端的能够终止所述第I调节元件转录的第一终止子；和/或所述人工基因编辑系统还包括在所述第II调节元件的3’端的能够终止所述第II调节元件转录的第二终止子；

优选地，第一终止子为SEQ ID No.14；和/或第二终止子为SEQ ID No.15。

8.根据权利要求1-7中任意一项所述的人工基因编辑系统，其特征在于，所述第I调节元件和所述第II元件能够被克隆到至少一个载体上；

优选所述第I调节元件能够被克隆到pCAMBIA1300上，所述第II调节元件被克隆到入门载体pENTR4上；

优选所述第一启动子、第I调节元件和第一终止子能够被克隆到pCAMBIA1300载体上；

优选所述第二启动子、第II调节元件和第二终止子被克隆到pENTR4载体上；

优选所述第I调节元件和所述第II调节元件能够被整合到同一个载体上，或被分布在两个载体上一起使用。

9.如权利要求1-8中任意一项所述的人工基因编辑系统在用于水稻基因组突变中的应用。

10.一种对水稻基因组进行突变的方法，其包括如下步骤：

1)将如权利要求1-8中任意一项所述的人工基因编辑系统通过农杆菌介导、基因枪轰击或PEG介导转化的方法中的一种导入到水稻愈伤组织或水稻原生质体中，然后培养获得水稻植株；