CN114045303B - 一套用于水稻的人工基因编辑系统 - Google Patents
一套用于水稻的人工基因编辑系统 Download PDFInfo
- Publication number
- CN114045303B CN114045303B CN202111388739.0A CN202111388739A CN114045303B CN 114045303 B CN114045303 B CN 114045303B CN 202111388739 A CN202111388739 A CN 202111388739A CN 114045303 B CN114045303 B CN 114045303B
- Authority
- CN
- China
- Prior art keywords
- nucleotide sequence
- regulatory element
- rice
- sequence
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Botany (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本申请涉及一套用于水稻的基因编辑的人工基因编辑系统,其包括:第I调节元件,其包括能够编码如氨基酸序列I的核苷酸序列,其中所述氨基酸序列I包括如I‑1氨基酸序列、I‑2氨基酸序列和I‑3氨基酸序列中的一种;第II调节元件,其包括依次从5’端到3’端串联的第II‑1核苷酸序列和第II‑2核苷酸序列;所述第II‑1核苷酸序列包括靶核苷酸序列;所述靶核苷酸序列来源于目标生物的基因组中,并且所述靶核苷酸序列中含有目标生物基因组中待突变的靶位点;所述第II‑2核苷酸序列包括来源于化脓链球菌的sgRNA核酸序列;所述第II‑1核苷酸序列和所述第II‑2核苷酸序列转录融合。
Description
本申请为2018年11月07日提交的发明名称为一套用于水稻的人工基因编辑系统,申请号为201811320030.8的分案申请。
技术领域
本申请涉及一套用于水稻的人工基因编辑系统。
背景技术
水稻(Oryza sativa L.)是世界主要粮食作物之一,养活了世界上近一半人口,包括几乎整个东亚和东南亚的人口。中国是世界上水稻总产量最高的国家,水稻产量占全球总量的30%左右。在生产过程中,以稻瘟病、稻曲病和纹枯病为主的水稻三大病害严重制约着水稻的生长发育,导致水稻产量和品质降低,威胁着全球的粮食安全。因此,提高产量,改善稻米品质,增加水稻植株抗病、抗逆性等研究以保证粮食的稳定供给是人类社会可持续性发展的重大课题。水稻作为单子叶植物的模式植物,其研究技术、方法、理论和成果对其它禾本科植物,如小麦、玉米、高粱等具有重要指导作用。
近年来发展起来的CRISPR/Cas9系统因为可以对基因组进行定点修饰而极具应用性。不过CRISPR/Cas9系统在进行核酸切割时,需要识别引导RNA(gRNA)3’端保守的PAM序列。现在最常用的SpCas9所识别PAM序列主要是NGG,尽管SpCas9也可识别NAG,以及SpCas9(VQR)可识别NGA等,但其编辑效率均较低;同时基于CRISPR/SpCas9系统发展而来的碱基编辑技术也会因所编辑靶位点的特殊性及可能没有合适的PAM序列导致碱基编辑效率受到限制,这些都在很大程度上限制了CRISPR/Cas9系统在水稻基因组编辑中应用。
因此,如果能开发出一种可更高效、适用范围更广、通用性更强、DNA特异性更强的对植物基因组,特别是水稻基因组进行定点编辑的CRISPR/Cas9系统,不仅会大大提高对植物基因组编辑的效率,而且将被更广泛的应用于植物基因功能研究、作物育种等方面,将会极大地促进植物基因组编辑领域的进程。
发明内容
本申请提供了一套人工基因编辑系统,所述人工基因编辑系统包括:
第I调节元件,其包括能够编码如氨基酸序列I的核苷酸序列;其中所述氨基酸序列I包括如I-1氨基酸序列、I-2氨基酸序列和I-3氨基酸序列中的一种,其中所述I-1氨基酸序列为如SEQ ID No.1所示的氨基酸序列;所述I-2氨基酸序列包括依次从N端到C端串联的SEQ ID No.2、SEQ ID No.1和SEQ ID No.3所示的氨基酸序列;所述I-3氨基酸序列包括依次从N端到C端串联的SEQ ID No.4和SEQ ID No.1所示的氨基酸序列;
第II调节元件,其包括依次从5’端到3’端串联的第II-1核苷酸序列和第II-2核苷酸序列;所述第II-1核苷酸序列包括靶核苷酸序列;所述靶核苷酸序列来源于目标生物的基因组中,并且所述靶核苷酸序列中含有目标生物基因组中待突变的靶位点;所述第II-2核苷酸序列包括来源于化脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列;所述第II-1核苷酸序列和所述第II-2核苷酸序列转录融合,其产物能引导第I调控元件编码的蛋白至目标生物基因组中待突变的靶位点处,并将靶位点处产生碱基进行突变;
当所述第II调节元件为多个时,包含在每一个所述第II调节元件中的第II-1核苷酸序列两两不相同。另外,当所述第II调节元件为多个时,这些第II调节元件可以串联的形成连接在一起。
本申请中,人工基因编辑系统中的靶核苷酸序列由该人工基因编辑系统本身与目标生物基因组中的待突变的靶位点共同确定,并且,如上所述,靶核苷酸序列来源于目标生物的基因组中,因此,靶核苷酸序列上的所述靶位点与目标生物基因组中的待突变的靶位点序列一致,因此,为了表述简便起见,两者均称之为靶位点,但突变发生在目标生物的基因组的序列上,而非发生在人工基因编辑系统的序列上。
在一个具体实施方式中,当使用所述I-1氨基酸序列时,所述靶核苷酸序列中的靶位点处于所述靶核苷酸序列的从3′端到5′端方向的3至5位置中的任意一处;当使用所述I-2氨基酸序列时,所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5′端到3′端方向的2至10位置中的碱基C;当使用所述I-3氨基酸序列时,所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5′端到3′端方向的2至8位置中的碱基A。
当所述氨基酸序列I为如I-1氨基酸序列时,通过利用本申请的人工基因编辑系统,可以将水稻基因组中内源的特定位点处缺失或在其中插入一个或数个碱基,筛选得到水稻基因相应的缺失或插入突变体。对于这些缺失或插入突变体,有可能会使原基因的功能丢失,也有可能使原基因的功能发生减弱或增强,这取决于实际发生的情况,根据实际需要,选择保留或舍弃那些已完成基因序列检测的突变体。
或者,当所述氨基酸序列I为如I-2氨基酸序列时,当第I调节元件通过利用本申请的人工基因编辑系统,可以将水稻基因组中内源的特定碱基C定点突变为T、A或G中的一种,筛选得到水稻基因功能“矫正”突变体。或者对于其反向互补序列来讲,将G定点突变为A、T或C中的一种,筛选得到水稻基因功能“矫正”突变体,此时,使用的靶核苷酸序列为靶位点处为C那条链上的核苷酸序列。
或者,当所述氨基酸序列I为如I-3氨基酸序列时,通过利用本申请的人工基因编辑系统,可以将水稻基因组中内源的特定碱基A定点突变为G,筛选得到水稻基因功能“矫正”突变体。或对于其反向互补序列来讲,将T定点突变为C,筛选得到水稻基因功能“矫正”突变体,此时,使用的靶核苷酸序列为靶位点处为A那条链上的核苷酸序列。
在一个具体实施方式中,所述目标生物为水稻,所述第I调节元件的核苷酸序列为能够适于在水稻中表达的核苷酸序列,所述第II调节元件的核苷酸序列为能够适于在水稻中发生转录的核苷酸序列。
在一个具体实施方式中,能够编码如SEQ ID No.1所示氨基酸序列的核苷酸编码序列如SEQ ID No.5所示。如SEQ ID No.5所示核苷酸编码序列能够较优的在水稻中使用。
在一个具体实施方式中,能够编码如SEQ ID No.2所示氨基酸序列的核苷酸编码序列如SEQ ID No.6所示。如SEQ ID No.6所示核苷酸编码序列能够较优的在水稻中使用。
在一个具体实施方式中,能够编码如SEQ ID No.3所示氨基酸序列的核苷酸编码序列如SEQ ID No.7所示。如SEQ ID No.7所示核苷酸编码序列能够较优的在水稻中使用。
在一个具体实施方式中,能够编码如SEQ ID No.4所示氨基酸序列的核苷酸编码序列如SEQ ID No.8所示。如SEQ ID No.8所示核苷酸编码序列能够较优的在水稻中使用。
在一个具体实施方式中,所述第II-2核苷酸序列如SEQ ID No.9所示。
在一个具体实施方式中,所述第II-1核苷酸序列还包括含有IIS型限制性内切酶的酶切位点的克隆位点,所述靶核苷酸序列通过所述第II-1核苷酸序列上的所述克隆位点而被克隆到其中(例如通过酶切-连接的方式将所述靶核苷酸序列连接到所述克隆位点上),以使所述第II-1核苷酸序列与第II-2序列转录融合;当所述第II调节元件为多个时,用于克隆不同靶核苷酸序列的所述IIS型限制性内切酶的酶切位点两两不相同。
其中,由于所述靶核苷酸序列是根据碱基编辑位点而变化的,因此可以将包括事先克隆到相关位置的限制性内切酶的酶切位点在内的其他元件构建好。在使用之前,再根据碱基编辑目的将所述靶核苷酸序列通过限制性内切酶的酶切位点的切割而被克隆。当所述第II调节元件为多个时,包含在其中的多个第II-1核苷酸序列中的限制性内切酶的酶切位点两两不相同,如此,可以有效的保障不同的靶核苷酸顺利的被克隆到目标位置。多个靶核苷酸序列可用于目标生物基因组上的多个待突变的靶位点的碱基替换。
在一个具体实施方式中,优选所述克隆位点的核苷酸序列包括SEQ ID No.10和/或SEQ ID No.11。
在一个具体实施方式中,通过如下方式确定所述靶核苷酸序列:
1)确定水稻基因组上需要被改造的核苷酸序列;
2)判断步骤1)中所确定的需要被改造的核苷酸序列为基因组中的特异性序列(被改造的核苷酸序列的特异性越高,则在进行基因编辑时越准确,否则可能会产生错误识别),
并根据所述第I调节元件来判断待突变的核苷酸位点的碱基发生突变后引起的改变是否符合预期;或者根据所述第I调节元件来判断待突变的核苷酸位点的反向互补碱基发生突变后引起的改变是否符合预期;
对于符合预期者,所述待突变的核苷酸位点即为潜在的靶位点;
3)在需要被改造的核苷酸序列或其反向互补序列中筛选靶标序列:向潜在的靶位点的3′端方向搜索以确认存在能够被所述第I调节元件编码的氨基酸序列I识别的识别模序,并且
当所述氨基酸序列I为如I-1氨基酸序列时,所述靶位点处于所述识别模序5′端上游的-3至-5的位置,由此确定的所述识别模序5′端上游17至21个核苷酸序列为所述靶核苷酸序列;
当所述氨基酸序列I为如I-2氨基酸序列时,所述靶位点处于所述识别模序5′端上游的-19至-11的位置,由此确定的所述识别模序5′端上游17至21个核苷酸序列为所述靶核苷酸序列;
当所述氨基酸序列I为如I-3氨基酸序列时,所述靶位点处于所述识别模序5′端上游的-19至-13的位置,由此确定的所述识别模序5′端上游17至21个核苷酸序列为所述靶核苷酸序列。
在一个具体实施方式中,所识别模序为5′-N1GN2-3′,所述靶核苷酸序列上游的17至21个核苷酸序列,淘汰含有连续五个T的核苷酸序列;其中,所述N1和N2独立地为A、G、C和T中的一种。
在一个具体实施方式中,所述靶核苷酸序列为如SEQ ID No.16、SEQ ID No.17和SEQ ID No.18中所示的至少一种。
在一个具体实施方式中,所述人工基因编辑系统还包括在所述第I调节元件的5’端的能够用于水稻中的,且能够启动所述第I调节元件转录的第一启动子;和/或所述人工基因编辑系统还包括在所述第II调节元件的5’端的能够用于水稻中的,且能够启动所述第II调节元件转录的第二启动子。
在一个具体实施方式中,所述第一启动子为RNA聚合酶II型启动子;和/或第二启动子为RNA聚合酶III型启动子。
在一个具体实施方式中,第一启动子为SEQ ID No.12;和/或第二启动子为SEQ IDNo.13。
在一个具体实施方式中,所述人工基因编辑系统还包括在所述第I调节元件的3’端的能够终止所述第I调节元件转录的第一终止子;和/或所述人工基因编辑系统还包括在所述第II调节元件的3’端的能够终止所述第II调节元件转录的第二终止子。
在一个具体实施方式中,第一终止子为SEQ ID No.14;和/或第二终止子为SEQ IDNo.15。
在一个具体实施方式中,所述第I调节元件和所述第II元件能够被克隆到至少一个载体上。例如,所述第I调节元件表达盒和所述第II调节元件转录盒能够被克隆或整合到同一个载体上。或第I调节元件表达盒和第II调节元件转录盒分别位于不同的载体上时,可以采用基因枪法、农杆菌侵染法或PEG介导转化法将两个盒或含有两个盒的载体导入到水稻愈伤组织或原生质体细胞中。
在一个具体实施方式中,所述第I调节元件能够被克隆到pCAMBIA1300上;所述第II调节元件被克隆到入门载体pENTR4上。pCAMBIA1300为基于Gateway反应并用于水稻遗传转化的双元载体,也可以使用其他类似的双元载体。
在一个具体实施方式中,所述第一启动子、第I调节元件和第一终止子能够被克隆到pCAMBIA1300载体上。
在一个具体实施方式中,第二启动子、第II调节元件和第二终止子被克隆到pENTR4载体上。当所述第II调节元件为多个时,其5’端的第二启动子和其3’端的终止子也为多个。即第二启动子、第II调节元件和第二终止子形成一组,成套出现。含有不同第II调节元件的多个组可以串联的形成连接在一起。其中,第II调节元件的不同,主要指的是第II-1核苷酸序列的不同。
在一个具体实施方式中,所述第I调节元件和所述第II调节元件能够被整合到同一个载体上,或被分布在两个载体上一起使用。
本申请之二提供了一种如本申请之一中任意一人工基因编辑系统在用于水稻基因组突变中的应用。
本申请之三提供了一种实现水稻基因组定点编辑方法,其包括如下步骤:
1)将本申请之一中任意一人工基因编辑系统通过农杆菌介导、基因枪轰击或PEG介导转化的方法中的一种导入到水稻愈伤组织或水稻原生质体中,然后培养获得水稻植株;
2)筛选获得含有所需突变的水稻植株;进一步地,所述水稻植株能够产生含有所述突变的水稻种子。
在进行所述的人工基因编辑系统导入时,可以采用PEG介导转化的方法,也可以采用基因枪法或农杆菌侵染法中的一种将所述的人工基因编辑系统导入到水稻原生质体或愈伤组织中,这是本领域技术人员容易理解的。本领域的技术人员公知,水稻基因组DNA由两条链组成,因此,所述靶核苷酸序列可以在其中互补的任意一条链上。例如,当所述靶核苷酸序列位于某一功能基因的一正义链中时,如果在该功能基因的特定位点上发生一至数个碱基的缺失或插入,并且如果其中的一种突变能够获得预期的使该基因移码突变而产生基因失活,则可以采用此系统来实现,即可以通过直接进行正义链上的碱基缺失或插入,得到水稻基因敲除突变体;当所述靶核苷酸序列位于某一功能基因的正义条链中时,如果该功能基因的特定位点上的C被定点突变为T后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,则可以采用此系统来实现,即可以通过直接进行正义链上的碱基替换来实现三联体密码子中的C替换为T,得到水稻基因功能“矫正”突变体;或当所述靶核苷酸序列位于某一功能基因的反义链中时,如果该功能基因的特定位点上的G被定点突变为A后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,也可以采用此系统来实现,即可以通过将反义链中的C被定点突变为T,进而使正义链中的相应互补的G替换为A来改变正义链中的所述三联体密码子编码氨基酸,得到水稻基因功能“矫正”突变体;当所述靶核苷酸序列位于某一功能基因的反义链中时,如果该功能基因的特定位点上的T被定点突变为C后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,则可以采用此系统来实现,即可以通过将该反义链中的A被定点突变为G,进而使正义链中的相应互补的T替换为C来改变正义链中的所述三联体密码子编码氨基酸,得到水稻基因功能“矫正”突变体;或当所述靶核苷酸序列位于某一功能基因的正义链中时,如果该功能基因的特定位点上的A被定点突变为G后,并且如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,也可以采用此系统来实现,即可以通过直接进行正义链上的碱基替换来实现三联体密码子中的A替换为G,从而得到水稻基因功能“矫正”突变体。
本申请的有益效果在于:
a)第II调节元件可以为多个,这样可以同时编辑水稻细胞内多个基因靶位点。
b)通过选用本申请的人工基因编辑系统中不同的第I调节元件可实现了对水稻基因组中的基因敲除(包括缺失或插入),或从碱基对AT到碱基对GC的替换,或从碱基对GC到碱基对AT的替换。
c)该全新基因编辑工具盒扩展了已有基因编辑工具盒的PAM序列,具有更宽更广的PAM序列,其能广泛地应用于水稻基因组中靶标基因的敲除或单碱基的定向突变,以此创制基因功能失活或获得性突变体材料。尤其是碱基编辑系统在植物中的应用比通过HR的基因替换或通过NHEJ的基因插入更加有效和经济;而广泛的PAM序列使得实现任意位点碱基替换的可能性加大,为植物研究领域科研人员提供一个重要的基因功能研究工具,并在水稻基因功能研究和分子育种方向上为培育水稻新品种提供了新的策略。
附图说明
图1显示了使用pUbi:Cas9NG在OsCERK1基因靶位点处的编辑效果图。
图2显示了使用pUbi:rBE22在OsRLCK185基因靶位点处的编辑效果图。
图3显示了使用pUbi:rBE23在Os03g02040基因靶位点处的编辑效果图。
具体实施方式
以下通过优选的实施例的形式对本申请的上述内容作进一步的详细说明,但不构成对本发明的限制。
如无特别说明,本申请的实施例中的试剂均可通过商业途径购买。
pCAMBIA1300来源于BioVector NTCC典型培养物保藏中心。在pCAMBIA1300中插入了attR1-ccdB-attR2模块,用于gateway反应接受来自于入门载体的attL1-靶向序列转录模块-attL2模块。
pENTR4载体的来源:购自美国Invitrogen公司。
pBlueScript SK载体的来源:购自Clontech公司。
实施例1
重组质粒的构建
构建该载体的技术路线如下:
1.1 pUbi:Cas9NG重组质粒构建
确定Cas9NG的氨基酸序列如SEQ ID No.1所示,并根据Cas9NG的氨基酸序列确定用于在水稻中表达的基因序列SEQ ID No.5,并人工合成如SEQ ID No.5所示的4299bp的核苷酸序列,将其克隆至pUC57上,命名为pUC57:Cas9NG(由北京擎科新业生物技术有限公司完成)。然后将SEQ ID No.12(玉米泛素启动子UbiP)、SEQ ID No.5、SEQ ID No.14(Nos终止子)按照从5’到3’的方向克隆到pCAMBIA1300载体,命名为pUbi:Cas9NG。
质粒pUbi:Cas9NG的主要构成如下:CaMV35S启动子(genebank登陆号为FJ362600.1,第10382至第11162核苷酸序列),潮霉素基因(genebank登陆号为KY420085.1),NOS终止子(SEQ ID No.14),pVS1 RepA(genebank登陆号为KY420084.1,第5755至第6435核苷酸序列),pVS1复制起点(genebank登陆号为KY420084.1,第4066至第5066核苷酸序列),attR1(genbank登陆号为KR233518.1,第2055至第2174核苷酸序列),ccdB表达框genbank登陆号为KR233518.1,第3289至第3594核苷酸序列),attR2(genbank登陆号为KR233518.1,第3635至第3759核苷酸序列),Ubip启动子(SEQ ID No.12),Cas9NG基因(SEQ ID No.5),NOS终止子(SEQ ID No.14)。
1.2 pUbi:rBE22重组质粒构建
用EcoR I和Spe I对本实验室自有载体pUbi:rBE9(Improved base editor forefficiently inducing genetic variations in rice with CRISPR/Cas9.Ren Bin,YanFang,Kuang Yongjie,Li Na,Zhang Dawei,Zhou Xueping,Lin Honghui and ZhouHuanbin.Molecular Plant,2018,11:623-626)进行双酶切,回收5.05kb的片段;用EcoR I和Spe I对克隆载体pBlueScript SK进行双酶切,回收3kb的线性化载体骨架;然后将两者连接,经转化、菌落PCR和酶切验证后备用,获得的重组质粒命名为pBS:rBE9。
以rAPO-R1(SEQ ID No.19:agcaagtccgattgaatact)和UGI-F1(SEQ ID No.20:tccggcggaagtacaaac)为引物,以重组质粒pBS:rBE9为模板,利用I-5TM2×HighFidelityMaster Mix(购自克劳宁(北京)生物科技有限公司)进行PCR扩增,获得约4.0kb的载体骨架;同时,以OsCas9-Fg1-F1(SEQ ID No.21:attgggacaaactctgtgg和OsCas9-Fg2-R1(SEQID No.22:gtcaccgcccaactgcga)为引物,以pUC57:Cas9NG为模板,利用I-5TM2×HighFidelity Master Mix进行PCR扩增,获得约4.3kb的Cas9NG基因的PCR片段,该片段经纯化后进行磷酸化处理,与上述4.0kb载体骨架进行连接,经转化、菌落PCR和酶切验证、测序验证后备用,获得的重组质粒命名为pBS:rBE22。
利用BamH I和Spe I对pBS:rBE22进行双酶切并回收5.03kb的rBE22片段;利用BamH I和Spe I对载体pUbi:cas9NG进行双酶切并回收约12kb的载体骨架;将两者连接,经转化、菌落PCR和酶切验证后备用,获得的重组质粒命名为pUbi:rBE22。
质粒pUbi:rBE22的构成如下:CaMV35S启动子(genebank登陆号为FJ362600.1,第10382至第11162核苷酸序列),潮霉素基因(genebank登陆号为KY420085.1),NOS终止子(SEQ ID No.14),pVS1 RepA(genebank登陆号为KY420084.1,第5755至第6435核苷酸序列),pVS1复制起点(genebank登陆号为KY420084.1,第4066至第5066核苷酸序列),attR1(genbank登陆号为KR233518.1,第2055至第2174核苷酸序列),ccdB表达框genbank登陆号为KR233518.1,第3289至第3594核苷酸序列),attR2(genbank登陆号为KR233518.1,第3635至第3759核苷酸序列),Ubip启动子(SEQ ID No.12),AID基因(SEQ ID No.6),Cas9NG基因(SEQ ID No.5),UGI基因(SEQ ID No.7),NOS终止子(SEQ ID No.14)。
1.3 pUbi:rBE23重组质粒构建
根据氨基酸序列SEQ ID No.4确定用于在水稻中表达的基因序列SEQ ID No.8,并人工合成如SEQ ID No.8所示的1191bp的核苷酸序列,将其克隆至pUC57上,命名为pUC57:TadA(由北京擎科新业生物技术有限公司完成)。
以pUC57-F1(SEQ ID No.23:gcgcgcttggcgtaatca)和TadA-R1(SEQ ID No.24:agccagaccaattgagtattttttgtc)为引物,以载体pUC57:TadA为模板,利用I-5TM2×HighFidelity Master Mix进行PCR扩增,纯化后获得4.13kb的载体骨架;再以OsCas9-Fg1-F1(SEQ ID No.21)和NLS-R2(SEQ ID No.25:cactagttcacccgccaac)为引物,以pUC57:Cas9NG为模板利用I-5TM2×HighFidelity Master Mix进行PCR扩增,获得约4.3kb的Cas9NG基因的PCR片段,纯化后进行磷酸化处理,与上述4.13kb载体骨架进行连接,经转化、菌落PCR和酶切验证后测序备用,获得的重组质粒命名为pUC57:rBE23。
利用BamH I和Spe I对pUC57:rBE23进行双酶切并回收5.33kb的rBE23片段;利用BamH I和Spe I对载体pUbi:Cas9NG并回收约12kb的载体骨架;然后将两者连接,经转化、菌落PCR和酶切验证后测序备用,获得的重组质粒命名为pUbi:rBE23。
质粒pUbi:rBE23的构成如下:CaMV35S启动子(genebank登陆号为FJ362600.1,第10382至第11162核苷酸序列),潮霉素基因(genebank登陆号为KY420085.1),NOS终止子(SEQ ID No.14),pVS1 RepA(genebank登陆号为KY420084.1,第5755至第6435核苷酸序列),pVS1复制起点(genebank登陆号为KY420084.1,第4066至第5066核苷酸序列),attR1(genbank登陆号为KR233518.1,第2055至第2174核苷酸序列),ccdB表达框genbank登陆号为KR233518.1,第3289至第3594核苷酸序列),attR2(genbank登陆号为KR233518.1,第3635至第3759核苷酸序列),Ubip启动子(SEQ ID No.12),TadA基因(SEQ ID No.8),Cas9NG基因(SEQ ID No.5),NOS终止子(SEQ ID No.14)。
1.4 pENTR4:sgRNA的构建
按照从5’端到3’端的方向,将依次连接的U6启动子序列(SEQ ID No.13)、含有两个BtgZI酶切位点的核苷酸序列(SEQ ID No.10)、gRNA scaffold序列(SEQ ID No.9)、(T)8终止序列(SEQ ID No.15)、U6启动子序列(SEQ ID No.13)、含有两个BsaI酶切位点的核苷酸序列(SEQ ID No.11)、sgRNA序列(SEQ ID No.9)、(T)8终止序列(SEQ ID No.15)进行人工合成,并克隆到pENTR4载体中,命名为pENTR4:sgRNA。其中的两个BtgZ I或两个Bsa I酶切位点用于克隆中特定基因中的靶核苷酸序列。
实施例2:利用pUbi:Cas9NG进行水稻内源基因OsCERK1的敲除
2.1针对OsCERK1基因的识别序列设计和克隆
OsCERK1(LOC_Os08g42580)基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。
对于OsCERK1基因,设计含有与Btgz I酶切位点末端连接匹配的靶核苷酸序列(SEQ ID No.16:ggccttccttgggatccggcga,下划线为BamH I酶切位点,加粗为PAM序列)引物如下:gOsCERK1-F1(SEQ ID No.26:tgttggccttccttgggatccgg)和gOsCERK1-R1(SEQ IDNo.27:aaacccggatcccaaggaaggcc)。合成引物后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链,将gOsCERK1-F1/R1克隆到pENTR4:sgRNA载体的BtgZ I酶切位点中,测序确认插入片段完全正确,命名为pENTR4:sgRNA-gOsCERK1。
2.2 PEG介导的pUbi:Cas9NG系统转化粳稻品种Kitaake原生质体及基因编辑检测
1)水稻原生质体的制备:
将去壳的成熟的水稻种子用50%的商业化消毒液处理25min;无菌水清洗3-5次,然后将种子转移至无菌的培养皿中,吸出多余的水份;将种子放置于1/2MS培养基上(2.2g/L MS粉;30g/L蔗糖;6g/L植物凝胶;pH5.7),于光照培养室培养10天。用剪刀剪取水稻幼苗茎叶,用单面刀片横切茎部,越细越好,并切好的水稻材料转移至无菌三角瓶中,加入10ml酶解液(1.5%纤维素酶;0.3%离析酶R-10;0.4M甘露醇;2mM 2-(N-吗啉)乙磺酸(MES);0.1×W5溶液;pH5.7),轻轻混匀后用锡箔纸包住瓶身,抽真空30min,之后置于水平摇床(转速约60rpm),酶解6h。酶解后,尼龙网(孔径为35μm)过滤收集原生质体溶液。原生质体溶液经室温离心(离心力1000g,时间5min)后弃上清,下层原生质体沉淀加入W5溶液(154mM NaCl;125mM CaCl2;25mM KCl;2mM MES;pH5.7)重悬并1000g离心5min后弃上清,加入适量MMG溶液(0.4M甘露醇;20mM CaCl2;25mM MES;pH5.7)重悬原生质体。
2)PEG介导的水稻原生质体转化及原生质体基因组DNA提取
取新圆底离心管,依次加入20μl质粒pUbi:Cas9NG(浓度为1000ng/μl)、20μl质粒pENTR4:sgRNA-gOsCERK1(浓度为1000ng/μl)、400μl原生质体、440μl(等体积)40%PEG4000溶液(40%(w/v)PEG 4000;0.4M甘露醇;100mM Ca(NO3)2;pH5.7),轻轻混匀,放置15min。加入1ml W5溶液稀释中止转化反应,1000g离心2min。弃上清,加入1ml W5溶液,重悬原生质体,并将其转入12孔细胞培养板中,锡箔纸包裹避光,室温培养2天后收集原生质体,采用CTAB法提取原生质体基因组DNA。
3)靶位点突变类型的检测
根据OsCERK1基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物:OsCERK1-F1(SEQ ID No.28:gacgtctacgcctttggtgt),OsCERK1-R1(SEQ ID No.29:gtcagctgcaaaatgcaatg),PCR产物片段为393bp。首先利用BamH I对原生质体基因组DNA进行酶切消解2h,再以酶切产物为模板,以OsCERK1-F1(SEQ ID No.28)和OsCERK1-R1(SEQ IDNo.29)为引物,利用I-5TM2×High Fidelity Master Mix进行PCR扩增,获得393bp的PCR片段。该PCR产物再BamHⅠ酶解3h并利用琼脂糖凝胶电泳除去靶位点未被成功编辑的PCR产物,利用AxyPrep凝胶回收试剂盒回收靶位点发生碱缺失或插入的片段,连接TA克隆载体和Sanger测序分析突变类型。如图1所示,随机测序获得了11个单克隆的序列,共检测到6种突变类型,分别为碱基缺失(-1、-2和-4bp)、碱基插入(+T和+A)以及碱基替换(G替换为A),这表明Cas9NG可识别NGA PAM基序完成基因编辑。
实施例3:利用pUbi:rBE22进行水稻内源基因OsRLCK185的碱基C向T替换
OsRLCK185(LOC_Os05g30870)基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。
对于OsRLCK185基因,设计含有与Bsa I酶切位点末端连接匹配的靶核苷酸序列(SEQ ID No.17:gtgcactgccaagctcacactgc,下划线为Alw44 I酶切位点,加粗为PAM序列)引物如下:gOsRLCK185-F1(SEQ ID No.30:gtgtgtgcactgccaagctcacac)和gOsRLCK185-R1(SEQ ID No.31:aaacgtgtgattggcagtgcac)。合成引物后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链,将gOsRLCK185-F1/R1克隆到pENTR4:sgRNA载体的Bsa I酶切位点中,测序确认插入片段完全正确,命名为pENTR4:sgRNA-gOsRLCK185。
其他操作同实施例2。
根据OsRLCK185基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物:OsRLCK185-F1(SEQ ID No.32:tccatggccttgttcctctt),OsRLCK185-R1(SEQ ID No.33:tgctgctagacacatccaca),PCR产物片段为484bp。首先利用Alw44 I对原生质体基因组DNA进行酶切消解2h,再以酶切产物为模板,以OsRLCK185-F1(SEQ ID No.32)和OsRLCK185-R1(SEQ ID No.33)为引物,利用I-5TM2×High Fidelity Master Mix进行PCR扩增,获得484bp的PCR片段。该PCR产物再Alw44 I酶解3h并利用琼脂糖凝胶电泳除去靶位点未被成功编辑的PCR产物,利用AxyPrep凝胶回收试剂盒回收成功替换靶位点碱基的片段,连接TA克隆载体和Sanger测序分析突变类型。如图2所示,随机测序获得了10个单克隆的序列,均检测到靶碱基G突变为A,其中有3种突变类型,分别为G4,6>A、G4,6,9>A以及G4,6,9,14>A,这表明rBE22可识别NGC PAM基序完成碱基编辑。
实施例4:利用pUbi:rBE23进行水稻内源基因Os03g02040的碱基A向G替换
Os03g02040基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。
对于Os03g02040基因,设计含有与Bsa I酶切位点末端连接匹配的靶核苷酸序列(SEQ ID No.18:agatctagaggttggtctacgt,下划线为Xba I酶切位点,加粗为PAM序列)引物如下:gOs03g02040-F1(SEQ ID No.34:tgttgagatctagaggttggtcta)和gOs03g02040-R1(SEQ ID No.35:aaactagaccaacctctagatctc)。合成引物后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链,将gOs03g02040-F1/R1克隆到pENTR4:sgRNA载体的Bsa I酶切位点中,测序确认插入片段完全正确,命名为pENTR4:sgRNA-gOs03g02040。
其他操作同实施例2。
根据Os03g02040基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物:Os03g02040-F1(SEQ ID No.36:cactagcacgacgcactttc),Os03g02040-R1(SEQ ID No.37:agaacacgcgcatcatatc),PCR产物片段为493bp。首先利用Alw44 I对原生质体基因组DNA进行酶切消解2h,再以酶切产物为模板,以Os03g02040-F1(SEQ ID No.36)和Os03g02040-R1(SEQ ID No.37)为引物,利用I-5TM2×High Fidelity Master Mix进行PCR扩增,获得493bp的PCR片段。该PCR产物再Xba I酶解3h后利用琼脂糖凝胶电泳除去靶位点未被成功编辑的PCR产物,利用AxyPrep凝胶回收试剂盒回收成功替换靶位点碱基的片段,连接TA克隆载体和Sanger测序分析突变类型。如图3所示,测序结果显示检测到靶碱基T突变为C,其中,这表明rBE23可识别NGT PAM基序完成碱基编辑。
序列表
<110> 中国农业科学院植物保护研究所
<120> 一套用于水稻的人工基因编辑系统
<130> LHA2160703-D2
<160> 37
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1417
<212> PRT
<213> 人工序列(non)
<400> 1
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1010 1015 1020
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1025 1030 1035 1040
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1045 1050 1055
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1060 1065 1070
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1075 1080 1085
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1090 1095 1100
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1105 1110 1115 1120
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1125 1130 1135
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Arg Pro Lys
1140 1145 1150
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1155 1160 1165
Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1170 1175 1180
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1185 1190 1195 1200
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn
1205 1210 1215
Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1220 1225 1230
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Arg Phe Leu Gln Lys Gly Asn Glu
1250 1255 1260
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1265 1270 1275 1280
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1285 1290 1295
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1300 1305 1310
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1315 1320 1325
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1330 1335 1340
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1345 1350 1355 1360
Arg Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Val Tyr Arg
1365 1370 1375
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1380 1385 1390
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Arg
1395 1400 1405
Pro Lys Lys Lys Arg Lys Val Gly Gly
1410 1415
<210> 2
<211> 211
<212> PRT
<213> 人工序列(non)
<400> 2
Met Asp Ser Leu Leu Met Asn Arg Arg Glu Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Gly Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
195 200 205
Pro Glu Ser
210
<210> 3
<211> 91
<212> PRT
<213> 人工序列(non)
<400> 3
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1 5 10 15
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
20 25 30
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr
35 40 45
Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
50 55 60
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
65 70 75 80
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser
85 90
<210> 4
<211> 397
<212> PRT
<213> 人工序列(non)
<400> 4
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
385 390 395
<210> 5
<211> 4254
<212> DNA
<213> 人工序列(non)
<400> 5
atggactata aggatcacga tggcgactac aaggatcatg acattgacta taaggatgac 60
gacgataaga tggcacctaa gaagaaaagg aaagtcggca ttcatggcgt tccggcagcc 120
gacaaaaagt atagcatcgg cctcgatatt gggacaaact ctgtgggctg ggcggtaatt 180
accgacgagt acaaggtgcc tagtaagaaa tttaaagtgc tcggaaacac tgacaggcac 240
tctataaaga agaacctgat cggggcactg cttttcgact ccggagagac ggcggaggcg 300
acgcgtctca agcgtaccgc gcgccgcagg tacacaagaa ggaagaatag gatctgctac 360
ttgcaggaaa tcttcagtaa cgagatggcg aaggtcgacg atagtttctt tcatcggttg 420
gaagaatcgt tcctcgtaga ggaggacaaa aagcacgagc gtcacccaat attcgggaat 480
attgttgacg aggttgccta ccatgagaaa tatcctacaa tatatcacct ccgtaagaag 540
cttgtcgatt caactgataa ggctgatctc agactcatct atcttgccct cgcacatatg 600
attaagtttc gtggccactt cttgattgaa ggcgacctca acccggacaa ctcagatgtt 660
gacaagcttt ttatacagct cgtccagaca tataaccagc tgtttgaaga gaatcccatc 720
aatgcgagtg gggttgatgc taaagccatt ttgtccgcca ggttgtccaa atctcgcaga 780
ctggaaaacc tgatcgcaca gcttcccggt gaaaagaaaa acgggctctt cggcaatctc 840
atcgcactgt ccctcggcct caccccaaac ttcaagtcta acttcgacct ggccgaggat 900
gcgaagctcc agctgtcaaa agatacatac gacgacgatt tggacaatct gcttgcgcaa 960
ataggcgacc agtatgcgga cctgttcctg gctgccaaaa atctgtcaga tgcaatcctc 1020
ctgtccgata tattgcgtgt gaacaccgaa atcacgaagg caccgcttag cgcatccatg 1080
atcaagagat acgacgagca ccatcaggac ctcacactcc tcaaggcgct tgttcgtcag 1140
cagcttcccg agaaatataa ggaaattttt ttcgatcaaa gcaagaatgg atatgctggc 1200
tatattgacg gtggcgcttc gcaggaggag ttctataaat tcattaagcc gattctggag 1260
aagatggacg gaacggagga gctcctcgtc aagcttaacc gggaagacct gttgcggaag 1320
cagaggactt ttgataacgg ctctattccg caccaaatcc atctgggtga gttgcacgca 1380
atcttgagaa gacaagagga tttctacccg ttccttaagg ataacagaga gaagatagaa 1440
aaaatactga ccttcaggat accatactat gtgggcccac tggcgcgcgg aaatagtcgt 1500
ttcgcatgga tgactagaaa gtccgaagaa acgatcacgc catggaattt tgaggaagtg 1560
gtcgacaagg gcgcctctgc ccagagcttc atcgaaagga tgaccaattt tgacaaaaat 1620
ctgcctaacg aaaaggtgct tccgaagcac agcctgttgt atgaatactt cacagtttat 1680
aacgagctca ctaaggtcaa gtacgtcacg gagggcatgc gtaagcctgc tttcctgtct 1740
ggtgaacaaa aaaaggcgat tgtggacctc cttttcaaga cgaaccgtaa agttactgtg 1800
aagcaactga aagaggatta ctttaagaaa attgagtgct tcgacagtgt ggagatttcc 1860
ggtgtcgagg accggtttaa cgccagcctg ggtacgtatc atgacctgct taaaattatc 1920
aaggataaag atttcctgga taatgaagag aacgaagata tactggagga cattgtgttg 1980
actttgaccc tcttcgagga cagagagatg attgaggaaa gactgaagac ctacgcacac 2040
ctttttgatg acaaggtcat gaaacaactc aagcgccggc gctatactgg ctggggccgg 2100
ctttctcgca agctcatcaa tgggattcgg gataagcaat caggcaagac aattttggac 2160
ttcctcaaat ccgacggatt cgcaaatagg aattttatgc agctgataca tgacgactct 2220
ttgacattca aagaagacat acagaaggct caggtcagcg gccaaggaga ttctttgcac 2280
gagcatatcg ctaacttggc aggtagcccc gccataaaaa agggcattct tcaaacggta 2340
aaagttgttg acgaactcgt gaaggttatg ggccgtcata agccggaaaa cattgttatt 2400
gaaatggcta gggaaaatca gacgacccag aagggacaga aaaatagcag ggagcggatg 2460
aagagaattg aagagggaat taaggagctt ggatctcaga ttcttaagga gcaccctgtg 2520
gagaacaccc aacttcagaa tgaaaagctc tacctttact accttcaaaa cggccgggat 2580
atgtacgtcg atcaggaact tgacattaac cggttgagcg attatgacgt tgaccatatt 2640
gtgccccaat ctttccttaa agacgactct atcgacaata aagtgctgac gcgcagcgat 2700
aaaaatcgcg gtaagtcgga taatgtcccg tcggaagagg tggttaaaaa aatgaagaac 2760
tattggaggc aactcctgaa tgccaagctg atcactcaga ggaaattcga caatctcacc 2820
aaggcagaaa ggggtggact tagcgagctc gacaaggccg gttttatcaa aagacagctg 2880
gtggagacac gccaaatcac caaacacgtt gcccagatcc tggattcgag gatgaacacg 2940
aagtatgacg agaacgacaa gttgattagg gaagtcaagg tcatcacttt gaagtccaag 3000
ctggtgagcg actttcgcaa agacttccag ttttacaaag tcagggaaat taataactac 3060
caccacgccc acgacgccta ccttaacgcc gtggttggca cagcactcat caagaaatac 3120
cctaagctcg aatctgagtt cgtctatggc gactataagg tctacgacgt tagaaaaatg 3180
atcgcgaaat ctgagcagga aataggcaag gcaactgcca agtacttctt ctattccaat 3240
atcatgaact tttttaagac ggagattacc ctggcgaatg gtgagatccg caagcgccct 3300
ttgattgaga caaacggaga aacaggagag atcgtatggg acaaagggcg ggactttgct 3360
actgttagga aggtgctctc tatgccacaa gttaacattg tcaaaaaaac tgaagtgcag 3420
acaggtgggt ttagcaagga atctatccgc ccgaagagga actctgacaa gctgatcgcc 3480
cgcaagaaag attgggaccc gaaaaagtac ggaggattcg tttcccccac agttgcgtac 3540
tccgtgcttg tcgtggccaa agtggagaag ggcaagtcta agaagctcaa gagcgtcaaa 3600
gagttgttgg ggatcacgat tatggagcgg tcgtctttcg aaaagaatcc gatagatttt 3660
ctcgaggcca agggttataa agaagtcaag aaggatctta tcatcaagct ccctaagtac 3720
tccctctttg agcttgaaaa cggacggaaa agaatgctgg cttcagcgcg ctttcttcag 3780
aagggtaatg aactcgctct gccctcaaaa tatgtgaatt tcctttacct ggcatcacac 3840
tatgagaagc ttaagggttc tccagaggac aacgagcaga agcaactgtt cgttgaacaa 3900
cacaagcact accttgacga gattatcgag caaatcagcg agtttagcaa gcgcgttata 3960
ctggcagacg caaatcttga taaggtcctt agcgcctaca acaagcatag agacaaaccc 4020
atccgggagc aggccgagaa cattattcat ctcttcacct tgacgaatct tggggccccg 4080
cgcgcgttca agtacttcga tactaccata gacagaaagg tctatcgctc gacaaaggaa 4140
gttcttgacg ccacgctgat ccaccaaagt ataacaggcc tctatgagac acgcatcgac 4200
ctttcgcagt tgggcggtga ccgccccaaa aagaagagga aagttggcgg gtga 4254
<210> 6
<211> 633
<212> DNA
<213> 人工序列(non)
<400> 6
atggatagcc ttctcatgaa cagaagagag tttctctatc agtttaaaaa tgttcggtgg 60
gcgaagggga ggagagagac atatctctgc tatgttgtta agcggagaga ttctgcgacc 120
tcattctcac tcgattttgg ttatttgagg aacaagaatg gatgtcatgt cgaattgttg 180
tttctccggt atatttccga ctgggatttg gacccagggc ggtgttaccg ggtcacatgg 240
tttatttcct ggagtccatg ttacgactgt gcgcgccatg tcgccgactt cctcaggggt 300
aatcctaact tgtccttgcg gatttttaca gccagactct atttctgtga ggatcggaag 360
gcggaacccg aggggctgag aagactgcac cgcgctggcg tccaaatcgc catcatgact 420
tttaaggatt atttctactg ttggaacacg ttcgtcgaga accacggtcg gaccttcaaa 480
gcctgggaag ggctgcatga aaattccgtg aggttgtccc ggcaactccg cagaatactc 540
ctgccccttt atgaggtcga cgatctcaga gacgccttta gaactagcgg aagcgagacg 600
ccagggactt ctgaatcggc cacccccgag agc 633
<210> 7
<211> 273
<212> DNA
<213> 人工序列(non)
<400> 7
tccggcggaa gtacaaacct ttcagacatt atagaaaagg aaaccggcaa gcaactcgtc 60
atccaggaat ccatacttat gctccctgaa gaggtggaag aagtgatcgg taataaacca 120
gagagcgaca tacttgtcca caccgcttat gacgaaagta cagacgaaaa cgtcatgctt 180
ctgacgagtg atgcccccga atacaaacct tgggcgctcg tcatccagga ttccaatggg 240
gagaataaaa taaagatgct ctctggaggc agc 273
<210> 8
<211> 1191
<212> DNA
<213> 人工序列(non)
<400> 8
atgtccgaag tggaatttag ccatgaatat tggatgcggc acgccctcac gcttgccaag 60
agagcctggg atgagaggga ggttcccgtc ggtgccgtgt tggtccataa caacagggtg 120
attggggaag gatggaacag acccattggg cgccatgatc caactgccca tgcagagatt 180
atggcgctca ggcaaggggg gttggttatg caaaactacc ggcttattga cgcaaccctg 240
tatgtcaccc ttgaaccctg tgttatgtgc gcgggggcca tgatacactc tcggataggg 300
cgggtggtgt tcggggctcg ggatgctaag accggagctg ctggttccct catggatgtc 360
ttgcatcatc ctggtatgaa ccatagagtc gagattactg aaggcattct cgcagacgaa 420
tgcgctgccc ttctctcaga tttctttaga atgcgcagac aggaaataaa ggctcaaaaa 480
aaagcacaga gttccacgga ttccggcggg tcgagcggtg gcagctccgg ctccgagaca 540
cccggtacga gtgaatccgc tacgcccgaa tcctcggggg gaagctctgg aggctcatca 600
gaagtcgagt tctcccatga gtattggatg aggcacgccc tcactcttgc gaagagggcc 660
agggacgaga gggaggtgcc ggtcggtgct gtcctggtct tgaataacag ggtgataggc 720
gaaggttgga acagggctat tggccttcat gaccctactg ctcatgcgga aatcatggca 780
cttagacagg ggggcctcgt tatgcaaaat taccgcctga tcgacgccac tctttatgtc 840
acatttgaac catgtgttat gtgtgcgggc gctatgatcc attcacgcat aggtcgcgtg 900
gtttttggag ttcgcaacgc gaaaacaggg gctgcaggct ctctgatgga cgttttgcac 960
tatccgggaa tgaaccatag agtcgaaatc acagaaggga ttttggcaga cgaatgcgcg 1020
gctcttcttt gttatttttt cagaatgccc cgccaagtgt ttaatgctca aaagaaagcg 1080
cagagtagca cagactcggg gggatcttct gggggctcgt ctggttccga gactcccgga 1140
acttccgagt cggcaacacc tgaatcctcc ggcggctctt cgggcggatc t 1191
<210> 9
<211> 76
<212> DNA
<213> 人工序列(non)
<400> 9
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 10
<211> 25
<212> DNA
<213> 人工序列(non)
<400> 10
tgtgtagaga ccaaaggagg tctca 25
<210> 11
<211> 41
<212> DNA
<213> 人工序列(non)
<400> 11
tgttggctag gatccatcgc agtcagcgat gagtacagca a 41
<210> 12
<211> 1765
<212> DNA
<213> 人工序列(non)
<400> 12
gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 60
aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 120
acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 180
gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 240
gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 300
aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 360
gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 420
aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 480
gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 540
gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 600
aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 660
gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 720
ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 780
ggcctcctcc tcctctcacg gcacggcagc tacgggggat tcctttccca ccgctccttc 840
gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct ctttccccaa 900
cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc cacccgtcgg 960
cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta ccttctctag 1020
atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat gtttgtgtta 1080
gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg acctgtacgt 1140
cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct gggatggctc 1200
tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc atagggtttg 1260
gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc 1320
atgctttttt tttgtcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 1380
ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 1440
atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 1500
gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 1560
tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 1620
attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 1680
ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 1740
cctgttgttt ggtgttactt ctgca 1765
<210> 13
<211> 322
<212> DNA
<213> 人工序列(non)
<400> 13
aagaacgaac taagccggac aaaaaaagga gcacatatac aaaccggttt tattcatgaa 60
tggtcacgat ggatgatggg gctcagactt gagctacgag gccgcaggcg agagaagcct 120
agtgtgctct ctgcttgttt gggccgtaac ggaggatacg gccgacgagc gtgtactacc 180
gcgcgggatg ccgctgggcg ctgcgggggc cgttggatgg ggatcggtgg gtcgcgggag 240
cgttgagggg agacaggttt agtaccacct cgcctaccga acaatgaaga acccacctta 300
taaccccgcg cgctgccgct tg 322
<210> 14
<211> 253
<212> DNA
<213> 人工序列(non)
<400> 14
gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60
atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120
atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 180
gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240
atgttactag atc 253
<210> 15
<211> 8
<212> DNA
<213> 人工序列(non)
<400> 15
tttttttt 8
<210> 16
<211> 22
<212> DNA
<213> 人工序列(non)
<400> 16
ggccttcctt gggatccggc ga 22
<210> 17
<211> 23
<212> DNA
<213> 人工序列(non)
<400> 17
gtgcactgcc aagctcacac tgc 23
<210> 18
<211> 22
<212> DNA
<213> 人工序列(non)
<400> 18
agatctagag gttggtctac gt 22
<210> 19
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 19
agcaagtccg attgaatact 20
<210> 20
<211> 18
<212> DNA
<213> 人工序列(non)
<400> 20
tccggcggaa gtacaaac 18
<210> 21
<211> 19
<212> DNA
<213> 人工序列(non)
<400> 21
attgggacaa actctgtgg 19
<210> 22
<211> 18
<212> DNA
<213> 人工序列(non)
<400> 22
gtcaccgccc aactgcga 18
<210> 23
<211> 18
<212> DNA
<213> 人工序列(non)
<400> 23
gcgcgcttgg cgtaatca 18
<210> 24
<211> 27
<212> DNA
<213> 人工序列(non)
<400> 24
agccagacca attgagtatt ttttgtc 27
<210> 25
<211> 18
<212> DNA
<213> 人工序列(non)
<400> 25
actagttcac ccgccaac 18
<210> 26
<211> 23
<212> DNA
<213> 人工序列(non)
<400> 26
tgttggcctt ccttgggatc cgg 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列(non)
<400> 27
aaacccggat cccaaggaag gcc 23
<210> 28
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 28
gacgtctacg cctttggtgt 20
<210> 29
<211> 19
<212> DNA
<213> 人工序列(non)
<400> 29
tcagctgcaa aatgcaatg 19
<210> 30
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 30
gtgtgtgcac tgccaagctc acac 24
<210> 31
<211> 22
<212> DNA
<213> 人工序列(non)
<400> 31
aaacgtgtga ttggcagtgc ac 22
<210> 32
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 32
tccatggcct tgttcctctt 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 33
tgctgctaga cacatccaca 20
<210> 34
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 34
tgttgagatc tagaggttgg tcta 24
<210> 35
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 35
aaactagacc aacctctaga tctc 24
<210> 36
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 36
cactagcacg acgcactttc 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 37
cagaacacgc gcatcatatc 20
Claims (18)
1.一套用于水稻的人工基因编辑系统,所述人工基因编辑系统包括:
第I调节元件,其编码如氨基酸序列I的核苷酸序列;所述氨基酸序列I为依次从N端到C端串联的SEQ ID No. 2、SEQ ID No. 1和SEQ ID No. 3所示的氨基酸序列;
第II调节元件,其为依次从5’端到3’端串联的第II-1核苷酸序列和第II-2核苷酸序列;所述第II-1核苷酸序列包括靶核苷酸序列;所述靶核苷酸序列中的靶位点为处于所述靶核苷酸序列的从5’端到3’端方向的2至10位置中的碱基C,所述靶核苷酸序列来源于水稻的基因组中,并且所述靶核苷酸序列中含有水稻基因组中待突变的靶位点;所述第II-2核苷酸序列包括来源于化脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列,所述第II-2核苷酸序列如SEQ ID No. 9所示;所述第II-1核苷酸序列和所述第II-2核苷酸序列转录融合,其产物能引导第I调节元件编码的蛋白至水稻基因组中待突变的靶位点处,并将所述靶位点处的碱基进行突变;
当所述第II调节元件为多个时,包含在每一个所述第II调节元件中的第II-1核苷酸序列两两不相同;
所述靶核苷酸序列通过如下方式确定:
1)确定水稻基因组上需要被改造的核苷酸序列;
2)判断步骤1)中所确定的需要被改造的核苷酸序列为基因组中的特异性序列,
并根据所述第I调节元件来判断待突变的核苷酸位点的碱基发生突变后引起的改变是否符合预期;或者根据所述第I调节元件来判断待突变的核苷酸位点的反向互补碱基发生突变后引起的改变是否符合预期;
对于符合预期者,所述待突变的核苷酸位点即为潜在的靶位点;
3)在需要被改造的核苷酸序列或其反向互补序列中筛选靶标序列:向潜在的靶位点的3ʹ端方向搜索以确认存在被所述第I调节元件编码的氨基酸序列所识别的识别模序,并且所述靶位点处于所述识别模序5ʹ端上游的-19至-11的位置,由此确定的所述识别模序5ʹ端上游17至21个核苷酸序列为所述靶核苷酸序列;所述识别模序为5’-N1GN2-3’,其中,所述N1和N2独立地为A、G、C和T中的一种。
2.根据权利要求1所述的人工基因编辑系统,其特征在于,所述第I调节元件的核苷酸序列为适于在水稻中表达的核苷酸序列,所述第II调节元件的核苷酸序列为适于在水稻中发生转录的核苷酸序列。
3.根据权利要求2所述的人工基因编辑系统,其特征在于,编码如SEQ ID No. 1所示氨基酸序列的核苷酸编码序列如SEQ ID No. 5所示;编码如SEQ ID No. 2所示氨基酸序列的核苷酸编码序列如SEQ ID No. 6所示;编码如SEQ ID No. 3所示氨基酸序列的核苷酸编码序列如SEQ ID No. 7所示。
4.根据权利要求1所述的人工基因编辑系统,其特征在于,所述第II-1核苷酸序列的3’端还包括含有IIS型限制性内切酶的酶切位点的克隆位点,所述靶核苷酸序列通过所述第II-1核苷酸序列上的所述克隆位点而被克隆到其中,以使所述第II-1核苷酸序列与第II-2序列转录融合;
当所述第II调节元件为多个时,用于克隆不同靶核苷酸序列的所述IIS型限制性内切酶的酶切位点两两不相同。
5.根据权利要求1所述的人工基因编辑系统,其特征在于,所述靶核苷酸序列为所述识别模序5’端上游的17至21个核苷酸序列,淘汰含有连续五个T的核苷酸序列。
6.根据权利要求1所述的人工基因编辑系统,其特征在于,所述人工基因编辑系统还包括在所述第I调节元件的5’端的用于水稻中的,且用于启动所述第I调节元件转录的第一启动子;和/或所述人工基因编辑系统还包括在所述第II调节元件的5’端的用于水稻中的,且用于启动所述第II调节元件转录的第二启动子。
7.根据权利要求6所述的人工基因编辑系统,其特征在于,所述第一启动子为RNA聚合酶II型启动子;和/或第二启动子为RNA聚合酶III型启动子。
8.根据权利要求6所述的人工基因编辑系统,其特征在于,所述第一启动子的序列为SEQ ID No. 12;和/或所述第二启动子的序列为SEQ ID No. 13。
9.根据权利要求1至8中任意一项所述的人工基因编辑系统,其特征在于,所述人工基因编辑系统还包括在所述第I调节元件的3’端的终止所述第I调节元件转录的第一终止子;和/或所述人工基因编辑系统还包括在所述第II调节元件的3’端的终止所述第II调节元件转录的第二终止子。
10.根据权利要求9所述的人工基因编辑系统,其特征在于,所述第一终止子的序列为SEQ ID No. 14;和/或所述第二终止子的序列为SEQ ID No. 15。
11.根据权利要求1所述的人工基因编辑系统,其特征在于,所述第I调节元件和所述第II调节元件被克隆到至少一个载体上。
12.根据权利要求1所述的人工基因编辑系统,其特征在于,所述第I调节元件被克隆到pCAMBIA1300上,所述第II调节元件被克隆到入门载体pENTR4上。
13.根据权利要求1所述的人工基因编辑系统,其特征在于,所述人工基因编辑系统还包括在所述第I调节元件的5’端的用于水稻中的,且用于启动所述第I调节元件转录的第一启动子;
所述人工基因编辑系统还包括在所述第I调节元件的3’端的终止所述第I调节元件转录的第一终止子;
所述第一启动子、第I调节元件和第一终止子被克隆到pCAMBIA1300载体上。
14.根据权利要求1所述的人工基因编辑系统,其特征在于,所述人工基因编辑系统还包括在所述第II调节元件的5’端的用于水稻中的,且用于启动所述第II调节元件转录的第二启动子;
所述人工基因编辑系统还包括在所述第II调节元件的3’端的终止所述第II调节元件转录的第二终止子;
所述第二启动子、第II调节元件和第二终止子被克隆到pENTR4载体上。
15.根据权利要求1所述的人工基因编辑系统,其特征在于,所述第I调节元件和所述第II调节元件被整合到同一个载体上,或被分布在两个载体上一起使用。
16.如权利要求1至15中任意一项所述的人工基因编辑系统在用于水稻基因组突变中的应用。
17.一种对水稻基因组进行突变的方法,其包括如下步骤:
1)将如权利要求1至15中任意一项所述的人工基因编辑系统通过农杆菌介导、基因枪轰击或PEG介导转化的方法中的一种导入到水稻愈伤组织或水稻原生质体中,然后培养获得水稻植株;
2)筛选获得含有所需突变的水稻植株。
18.根据权利要求17所述的方法,其特征在于,所述水稻植株产生含有所述突变的水稻种子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111388739.0A CN114045303B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811320030.5A CN109321593B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
CN202111388739.0A CN114045303B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811320030.5A Division CN109321593B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114045303A CN114045303A (zh) | 2022-02-15 |
CN114045303B true CN114045303B (zh) | 2023-08-29 |
Family
ID=65261106
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811320030.5A Active CN109321593B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
CN202111388744.1A Active CN113913454B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
CN202111388739.0A Active CN114045303B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811320030.5A Active CN109321593B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
CN202111388744.1A Active CN113913454B (zh) | 2018-11-07 | 2018-11-07 | 一套用于水稻的人工基因编辑系统 |
Country Status (1)
Country | Link |
---|---|
CN (3) | CN109321593B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021056302A1 (en) * | 2019-09-26 | 2021-04-01 | Syngenta Crop Protection Ag | Methods and compositions for dna base editing |
CN110760540A (zh) * | 2019-11-29 | 2020-02-07 | 中国农业科学院植物保护研究所 | 一套用于水稻的基因编辑人工系统及其应用 |
CN111100852B (zh) * | 2019-12-16 | 2021-04-13 | 中国农业科学院植物保护研究所 | OsALS1的定向突变及农作物内源基因定向进化的方法 |
CN117402855B (zh) * | 2023-12-14 | 2024-03-19 | 中国农业科学院植物保护研究所 | 一种Cas蛋白、基因编辑系统及应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107177625A (zh) * | 2017-05-26 | 2017-09-19 | 中国农业科学院植物保护研究所 | 一种定点突变的人工载体系统及定点突变方法 |
CN108034671A (zh) * | 2017-12-08 | 2018-05-15 | 中国农业科学院植物保护研究所 | 一种质粒载体及利用其建立植物群体的方法 |
US9982279B1 (en) * | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) * | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150067922A1 (en) * | 2013-05-30 | 2015-03-05 | The Penn State Research Foundation | Gene targeting and genetic modification of plants via rna-guided genome editing |
BR112017007923B1 (pt) * | 2014-10-17 | 2023-12-12 | The Penn State Research Foundation | Método para produzir manipulação genética mediada por reações multiplex com rna em uma célula receptora, construção de ácido nucleico,cassete de expressão, vetor, célula receptora e célula geneticamente modificada |
CN107043779B (zh) * | 2016-12-01 | 2020-05-12 | 中国农业科学院作物科学研究所 | 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用 |
-
2018
- 2018-11-07 CN CN201811320030.5A patent/CN109321593B/zh active Active
- 2018-11-07 CN CN202111388744.1A patent/CN113913454B/zh active Active
- 2018-11-07 CN CN202111388739.0A patent/CN114045303B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107177625A (zh) * | 2017-05-26 | 2017-09-19 | 中国农业科学院植物保护研究所 | 一种定点突变的人工载体系统及定点突变方法 |
US9982279B1 (en) * | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) * | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
CN108034671A (zh) * | 2017-12-08 | 2018-05-15 | 中国农业科学院植物保护研究所 | 一种质粒载体及利用其建立植物群体的方法 |
Non-Patent Citations (1)
Title |
---|
Engineered CRISPR-Cas9 nuclease with expanded targeting space.;Nishimasu H.等;《Science》;第361卷(第6408期);第1259–1262页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113913454B (zh) | 2023-07-21 |
CN114045303A (zh) | 2022-02-15 |
CN109321593A (zh) | 2019-02-12 |
CN109321593B (zh) | 2022-01-25 |
CN113913454A (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114045303B (zh) | 一套用于水稻的人工基因编辑系统 | |
CN107630031B (zh) | 一种调控植物育性的方法和体系 | |
AU2016309392A1 (en) | Method for obtaining glyphosate-resistant rice by site-directed nucleotide substitution | |
EA038896B1 (ru) | Способ осуществления сайт-направленной модификации растительных геномов с использованием ненаследуемых материалов | |
CN107177625A (zh) | 一种定点突变的人工载体系统及定点突变方法 | |
CN108034671B (zh) | 一种质粒载体及利用其建立植物群体的方法 | |
US12116586B2 (en) | Compositions and methods for improving crop yields through trait stacking | |
CN113801891B (zh) | 甜菜BvCENH3基因单倍体诱导系的构建方法与应用 | |
CN110892074A (zh) | 用于增加香蕉的保质期的组成物及方法 | |
CN110066824B (zh) | 一套用于水稻的碱基编辑人工系统 | |
CN115894646B (zh) | OsJDG1基因及其在调控水稻粒型和千粒重中的应用 | |
CN107227303B (zh) | 一种OsGA3ox1基因在水稻雄性不育株系创制中的应用 | |
US20220315938A1 (en) | AUGMENTED sgRNAS AND METHODS FOR THEIR USE TO ENHANCE SOMATIC AND GERMLINE PLANT GENOME ENGINEERING | |
CN109112158A (zh) | 一种基于毒性解毒基因创制智能不育系的方法 | |
KR102516522B1 (ko) | 반수체 식물을 유도하는 pPLAⅡη 유전자 및 이의 용도 | |
CN113493803B (zh) | 紫花苜蓿CRISPR/Cas9基因组编辑系统及其应用 | |
CN103261419B (zh) | 一种调控植物花粉育性的构建体及其使用方法 | |
CN113024645B (zh) | 小麦转录因子wrky70基因在调控植物生长发育中的应用 | |
CN104805100B (zh) | 水稻基因OsSμBP‑2在延缓植物叶片衰老中的应用 | |
CN112080513A (zh) | 一套编辑范围扩展的水稻人工基因组编辑系统及其应用 | |
CN110760540A (zh) | 一套用于水稻的基因编辑人工系统及其应用 | |
KR102551064B1 (ko) | 포도에서 분리된 신규 u6 프로모터 및 이의 용도 | |
CN114181951B (zh) | 一个玉米纹枯病抗病相关基因Zmbzip45及其应用 | |
CN115820691B (zh) | 一种基于LbCpf1变体的水稻碱基编辑系统和应用 | |
KR102550308B1 (ko) | SlHKT1;2 유전자 교정에 의해 내염성이 증가된 유전체 교정 토마토 식물체의 제조 방법 및 상기 방법에 의해 제조된 내염성이 증가된 유전체 교정 토마토 식물체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |