CN114591977A - 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统 - Google Patents

通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统 Download PDF

Info

Publication number
CN114591977A
CN114591977A CN202210187028.5A CN202210187028A CN114591977A CN 114591977 A CN114591977 A CN 114591977A CN 202210187028 A CN202210187028 A CN 202210187028A CN 114591977 A CN114591977 A CN 114591977A
Authority
CN
China
Prior art keywords
sequence
gene
coding
protein
epsps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210187028.5A
Other languages
English (en)
Other versions
CN114591977B (zh
Inventor
夏兰琴
李晶莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Crop Sciences of Chinese Academy of Agricultural Sciences filed Critical Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority to CN202210187028.5A priority Critical patent/CN114591977B/zh
Publication of CN114591977A publication Critical patent/CN114591977A/zh
Application granted granted Critical
Publication of CN114591977B publication Critical patent/CN114591977B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • C12N9/10923-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/010193-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了通过精准编辑内源EPSPS基因获得抗草甘膦水稻的方法及其所用系统。本研究以OsEPSPS为靶标基因,通过自剪切多肽T2A将RAD52和引导编辑器融合表达,构建新型的引导编辑系统,利用RAD52可以促进基因组DNA与同源的ssRNA之间链交换的方法,来提高引导编辑系统的编辑效率,为农作物精准设计分子育种提供了新技术和新方法。另外,草甘膦是世界上应用最多的除草剂,对人畜与环境危害极小。本研究获得的高抗草甘膦除草剂的水稻编辑植株为培育新型高抗草甘膦除草剂的水稻新种质提供了新材料,有望大大提高水稻生产的经济性,也为获得其它新型高抗草甘膦除草剂的作物新种质提供了参考。

Description

通过精准编辑内源EPSPS基因获得抗草甘膦水稻的方法及其 所用系统
技术领域
本发明属于基因工程育种领域,具体涉及通过精准编辑内源EPSPS基因获得抗草甘膦水稻的方法及其所用系统。
背景技术
对重要农作物基因组进行定点修饰,包括关键基因的定点敲除、等位基因替换以及外源基因的定点整合等,将有助于重要农艺性状的功能基因鉴定、复杂农艺性状的调控网络解析和新种质创制,对加快农作物遗传改良进程具有重要意义。近年来,CRISPR/Cas介导的植物基因组定点编辑、单碱基替换和同源重组体系的建立与利用,在农作物基因功能研究和精准育种中发挥了重要作用,展现了广阔的发展潜力和应用前景。然而,CRISPR/Cas介导的植物基因组定点敲除技术只能在基因组特定位点产生随机插入和删除。由CRISPR/Cas系统衍生的胞嘧啶和腺嘌呤碱基编辑器,只能在基因组靶向位点实现C→T,G→A,A→G和T→C等4种单碱基转换,还不能实现其它类型的碱基颠换。通过同源定向修复(HDR)技术,进行基因组精确编辑,在植物中的效率依然非常低,只在少数实验室可行(Li and Xia,2019)。因此,迫切需要建立更高效的植物基因组精准编辑技术体系。
此前,哈佛大学David R.Liu教授研究团队,通过将Cas9缺刻酶nCas9(H840A)与逆转录酶突变体(Engineered M-MLV-RT)融合,在哺乳动物中开发了一系列新的基因组精准编辑体系-引导编辑系统(prime editors)(Anzalone et al.,2019)。在引导编辑系统中,具有引导编辑作用的pegRNA(prime editing guide RNA),通过在sgRNA骨架的3’端引入引物初始结合位点(Primer binding site,PBS)序列结合nCas9断裂的非靶标链,以pegRNA上携带目标突变的逆转录本(RT)为模板,通过延申,产生含有目的突变的单链DNA。细胞进一步通过DNA损伤修复和复制把目的突变引入基因组。此外,在非编辑链上引入能产生缺刻的sgRNA,有助于提高引导编辑的效率。该系统能够在不借助DNA双链断裂缺口和DNA供体修复模板的情况下,即可实现靶向插入、删除和所有类型的单碱基自由转换和颠换,为提高作物精确编辑效率提供了可能。鉴于引导编辑系统在基因组精准修饰方面的巨大应用前景,多家实验室首先探索了其在农作物中的可行性和有效性(Butt et al.,2020;Hua et al.,2020;Li et al.,2020a;Lin et al.,2020;Lu et al.,2020;Tang et al.,2020;Xu etal.,2020a;Xu et al.,2020b)。与人类细胞相比,即使科研人员对引导编辑系统进行了密码子和启动子优化,以及编辑条件的调整等一系列优化措施,引导编辑系统在植物细胞中的效率仍然偏低(Li et al.,2020b)。
5-烯醇丙酮莽草酸-3-磷酸合成酶(EPSPS)是细菌、真菌和高等植物莽草酸途径中芳香族氨基酸合成的关键酶。EPSPS在莽草酸途径中催化磷酸烯醇式丙酮酸(PEP)和shikimate-3-phosphate合成EPSP,最终合成芳香族氨基酸色氨酸、苯丙氨酸和酪氨酸。研究表明,EPSPS合酶在所有植物和大多数细菌中都有一个保守基序,这个基序对于结合PEP或其竞争性抑制剂草甘膦(一种广谱、安全和高效除草剂的有效成分)至关重要(Baersonet al.,2002)。
研究表明,重要农作物的部分优良农艺性状都与碱基突变密切相关,其中大部分变异来自于单核苷酸差异,另外也有相当一部分变异来源于小片段的插入和缺失。目前,基于同源重组修复途径介导的基因任意替换在植物细胞内效率仍然偏低,仅在少数实验室可行(Li and Xia,2019)。另外,单碱基编辑系统只能实现碱基间的转换,而对碱基巅换和小片段的精准插入与删除尚无高效的方法可以实现。近年来兴起的引导编辑系统不需要借助DNA双链断裂缺口和外源供体修复模板的帮助,即可在基因组DNA上实现精准的单碱基替换(包括转换和巅换)以及小片段的插入与删除,在基因组精准修饰方面具有巨大的应用前景,然而目前该系统在植物细胞中的效率偏低。
因此,如何构建高效的引导编辑体系,是农作物精准改良的热点问题。
发明内容
本发明要解决的技术问题是如何精确、快速的制备抗草甘膦水稻。
为解决上述技术问题,第一个方面,本发明提供产生抗草甘膦水稻的方法,所述方法包括将靶向水稻基因组中5-烯醇丙酮莽草酸-3-磷酸合成酶基因的引导编辑系统表达载体导入待编辑水稻,得到抗草甘膦水稻;
所述引导编辑系统表达载体包括融合蛋白的编码基因、pegRNA的编码基因和介导非靶向DNA单链切刻(nick)的sgRNA的编码基因,所述融合蛋白是由核定位信号1-N、nCas9(H840A)、M-MLV-RT、核定位信号1-C、自剪切多肽、核定位信号2-N、RAD52和核定位信号2-C连接而成的蛋白质;所述pegRNA包括介导靶向DNA单链切刻(nick)的sgRNA、引物结合位点和储存有靶向位点编辑信息的反转录模板,所述靶向位点为所述水稻基因组中EPSPS基因。
所述自剪切多肽可为T2A,所述T2A可为如下任一种多肽:
P1)、由编码链的编码序列是序列表中序列1第19643-19696位核苷酸编码的多肽;
P2)、将P1)所示的多肽经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与P1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的多肽。
上述核定位信号1-N、核定位信号1-C、核定位信号2-N和核定位信号2-C的序列可以相同,也可以不同。
所述核定位信号1-N可为编码链的编码序列如序列表中序列1第13268-13312位所示基因编码的多肽。
所述核定位信号1-C可为编码链的编码序列如序列表中序列1第19586-19633位所示基因编码的多肽。
所述核定位信号2-N可为编码链的编码序列如序列表中序列1第19712-19732位所示基因编码的多肽。
所述核定位信号2-C可为编码链的编码序列如序列表中序列1第21008-21055位所示基因编码的多肽。
进一步地,上述的方法中,所述RAD52可为如下B1)-B3)任一种蛋白质:
B1)、由编码链的编码序列是序列表中序列1第19733-21007位核苷酸编码的蛋白质;
B2)、将B1)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
B3)、在B1)或B2)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白;
所述nCas9(H840A)为如下B11)-B13)中任一种蛋白质:
B11)、由编码链的编码序列是序列表中序列1第13313-17413位核苷酸编码的蛋白质;
B12)、将B11)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
B13)、在B11)或B12)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白;
所述M-MLV-RT为如下B21)-B23)中任一种蛋白质:
B21)、由编码链的编码序列是序列表中序列1第17414-19585位核苷酸编码的蛋白质;
B22)、将B21)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
B23)、在B21)或B22)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白。
进一步地,上述的方法中,所述融合蛋白包括如下任一种蛋白质:
R1)、由编码链的编码序列是序列表中序列1第13313-21055位核苷酸编码的蛋白质;
R2)、将R1)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与R1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
R3)、在R1)或R2)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白。
所述蛋白标签(protein-tag)是指利用DNA体外重组技术,与目的蛋白一起融合表达的一种多肽或者蛋白,以便于目的蛋白的表达、检测、示踪和/或纯化。所述蛋白标签可为Flag蛋白标签、His蛋白标签、MBP蛋白标签、HA蛋白标签、myc蛋白标签、GST蛋白标签和/或SUMO蛋白标签等。
上述蛋白质中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述蛋白质中,所述80%以上的同一性可为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
进一步地,上述的方法中,所述融合蛋白的编码基因是序列表中序列1第13313-21055位核苷酸所示的DNA分子。
进一步地,上述的方法中,所述介导靶向DNA单链切刻(nick)的sgRNA的靶标序列可为SEQ ID No.2第453-472所示核苷酸序列,所述反转录模板的编码序列如序列表中序列1第23501-23559位核苷酸所示的DNA分子。
进一步地,上述的方法中,所述引导编辑系统表达载体包括WUS表达盒,所述WUS表达盒如序列表中序列1第8900-11168位核苷酸所示,其中第8900-9954位为PLTP启动子序列,第9955-10915为WUS编码序列,第10916-11168为Nos终止子序列。
所述引导编辑系统表达载体包括序列表中序列1所示的核苷酸序列。
序列1含有如序列1第8900-11168位所示的WUS表达盒基因,其中序列1第8900-9954位为PLTP启动子序列,第9955-10915位为WUS序列,第10916-11168为Nos终止子序列;含有序列1第13268-21058位所示的融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS的编码基因,表达融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS,其中序列1第13268-19633位核苷酸为NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS的编码基因,序列1第19643-21055位核苷酸为T2A-NLS-RAD52-NLS的编码序列;含有核苷酸序列是序列1第23405-23572位所示的pegRNA基因,表达pegRNA;含有核苷酸序列是序列1第23650-23745位所示的介导非靶向DNA单链切刻(nick)的sgRNA基因,表达介导非靶向DNA单链切刻(nick)的sgRNA;含有序列1第1059-2084位所示的HygR基因,表达潮霉素抗性蛋白HygR。
所述抗草甘膦水稻与所述待编辑水稻相比,将所述待编辑水稻基因组中的5-烯醇丙酮莽草酸-3-磷酸合成酶基因突变为下述至少一种基因:
M1)、EPSPS/TIPS基因,所述EPSPS/TIPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),并将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
M2)、EPSPS/PS基因,所述EPSPS/PS基因是将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
M3)EPSPS/TIAVPS基因,所述EPSPS/TIAVPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),将序列表中序列2的第508-510位的核苷酸GCA突变为GTA(A170V),将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
所述突变可以是纯合突变也可以是杂合突变。
为解决上技术问题,第二个方面,本发明还提供上述的方法中的所述引导编辑系统表达载体,或与所述引导编辑系统表达载体相关的生物材料,所述生物材料为含有所述引导编辑系统表达载体的重组微生物、转基因动物细胞系或转基因植物细胞系。
为解决上技术问题,第三个方面,本发明提供上述的方法中的所述融合蛋白,或与所述融合蛋白相关的生物材料,所述生物材料为下述任一种:
C1)、所述融合蛋白的编码基因;
C2)含有C1)所述编码基因的表达盒;
C3)含有C1)所述编码基因的重组载体;
C4)含有C2)所述表达盒的重组载体;
C5)含有C1)所述编码基因的重组微生物;
C6)含有C2)所述表达盒的重组微生物;
C7)含有C3)所述重组载体的重组微生物;
C8)含有C4)所述重组载体的重组微生物;
C9)含有C1)所述编码基因的转基因动物细胞系;
C10)含有C2)所述表达盒的转基因动物细胞系;
C11)含有C3)所述重组载体的转基因动物细胞系;
C12)含有C4)所述重组载体的转基因动物细胞系;
C13)含有C1)所述编码基因的转基因植物细胞系;
C14)含有C2)所述表达盒的转基因植物细胞系;
C15)含有C3)所述重组载体的转基因植物细胞系;
C16)含有C4)所述重组载体的转基因植物细胞系。
为解决上技术问题,第四个方面,本发明提供用于产生抗草甘膦水稻的组合物,所述组合物包括E1)和/或E2),
E1)核酸组合物,所述核酸组合物包括权利要求1-6中任一所述方法中的所述融合蛋白的编码基因、权利要求1-6中任一所述方法中的所述pegRNA的编码基因和权利要求1-6中任一所述方法中的所述介导非靶向DNA单链切刻(nick)的sgRNA的编码基因;
E2)引导编辑系统,所述引导编辑系统包括权利要求1-6中任一所述方法中的所述融合蛋白、权利要求1-6中任一所述方法中的所述pegRNA和权利要求1-6中任一所述方法中的所述介导非靶向DNA单链切刻(nick)的sgRNA。
为解决上技术问题,第五个方面,本发明还提供制备抗草甘膦植物的方法,包括如下T1)、T2)或T3):
T1)用EPSPS/TIPS基因替换水稻基因组中EPSPS编码基因,所述EPSPS/TIPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),并将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
T2)、用EPSPS/PS基因替换水稻基因组中EPSPS编码基因,EPSPS/PS基因,所述EPSPS/PS基因是将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
T3)用EPSPS/TIAVPS基因替换水稻基因组中EPSPS编码基因,所述EPSPS/TIAVPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),将序列表中序列2的第508-510位的核苷酸GCA突变为GTA(A170V),将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子。
本发明取得的有益效果如下:
本研究以OsEPSPS为靶标基因,通过自剪切多肽T2A将RAD52和引导编辑器融合表达,构建新型的引导编辑系统,利用RAD52可以促进基因组DNA与同源的ssRNA之间链交换的方法,来提高引导编辑系统的编辑效率,为农作物精准设计分子育种提供了新技术和新方法。另外,草甘膦是世界上应用最多的除草剂,对人畜与环境危害极小。本研究获得的高抗草甘膦除草剂的水稻编辑植株为培育新型高抗草甘膦除草剂的水稻新种质提供了新材料,有望大大提高水稻生产的经济性,也为获得其它新型高抗草甘膦除草剂的作物新种质提供了参考。
本研究利用同源重组修复途径关键蛋白RAD52,成功优化了引导编辑系统,可使编辑效率高达33.3%(5/15)。与对照组相比(1/8,12.5%),本研究建立的高效精准编辑效率提高了约2.66倍。利用此体系,获得了3种具有不同等位基因(TIAVPS、TIPS和PS)的新一代抗除草剂水稻新种质。利用此体系创制了高抗草甘膦除草剂的水稻新种质,同时为农作物精准设计分子育种提供新技术和新方法。该研究为农作物精准分子设计育种、培育抗草甘膦除草剂水稻新品种,提供了技术和材料支撑。
附图说明
图1为pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体图谱(图1中(A))、prime editor-EPSPS载体图谱(图1中(B))和prime editor-Rad52-EPSPS载体图谱(图1中(C))。
图2为T0代植株基因组特异性PCR产物的电泳图谱;其中:M表示Marker;泳道1,2,4,5,7,8,9,10,14,15,17,18为T0代野生型植株;泳道3为T0代再生植株Rad52-4;泳道6为T0代再生植株Rad52-12;泳道11为T0代再生植株Rad52-24;泳道12为T0代再生植株Rad52-25;泳道13为T0代再生植株Rad52-26;泳道16为T0代再生植株3T-15。
图3为T0代植株基因组特异性PCR产物经MnlI酶切处理后产物的电泳图谱;其中M表示Marker;1和2分别为野生型植株基因组特异性PCR产物不酶切和MnlI酶切处理后产物的电泳结果;3和4为T0代再生植株Rad52-4分单株酶切鉴定结果;5为T0代再生植株Rad52-12分单株酶切鉴定结果;6,7,8,9,10为T0代再生植株Rad52-24分单株酶切鉴定结果;11,12,13为T0代再生植株Rad52-25分单株酶切鉴定结果;14,15,16,17,18,19为T0代再生植株Rad52-26分单株酶切鉴定结果;20,21,22为T0代再生植株3T-15分单株酶切鉴定结果。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
用于遗传转化的水稻材料为中花11,中花11在文献“Editing of Rice EndospermPlastidial Phosphorylase Gene OsPho1Advances Its Function in StarchSynthesis.Molecular Plant.28(3):209-211.”中公开(文献中以Zhonghua 11(ZH11)表示),公众可从申请人获得该生物材料,该生物材料只为重复本发明的实验所用,不可作为其它用途使用。
基因枪转化表达载体pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体在文献“Precise Modifications ofBoth Exogenous and Endogenous Genes in Rice by Prime Editing.Molecular Plant.(13)671–674,2020年05月04日.”中公开,公众可从申请人获得该生物材料,该生物材料只为重复本发明的实验所用,不可作为其它用途使用。
实验中引物合成、DNA合成由北京天一辉远公司完成,序列测定由农科院作物科学研究所重大工程楼测序部完成。
NLS-RAD52-NLS基因由北京擎科生物科技有限公司进行水稻密码子优化和全基因合成。
实施例1、通过精准编辑内源EPSPS基因获得抗草甘膦水稻
1、精准编辑载体的构建
1.1、重叠PCR获得T2A-NLS-RAD52-NLS片段
以由北京擎科生物科技有限公司进行水稻密码子优化并全基因合成的RAD52质粒(2306bp)为模板,利用RAD52F1/R1引物进行PCR扩增,得到第一轮PCR产物(1378bp)。
第一轮引物序列如下(5’→3’):
RAD52F1:GGAGGAGAATCCCGGCCCTgtcgccaccATGGCCCCAAAGAAGAAGCGG;
RAD52R1:CTTCTTTTTCTTAGCCTGTCCGGC。
以第一轮PCR产物为模板,利用RAD52F2/R2引物进行PCR扩增,得到第二轮PCR产物(1431bp)。
第二轮引物序列如下(5’→3’):
RAD52F2:GCAGAGGAAGTCTGTTAACATGCGGTGACGTGGAGGAGAATCCCGGCCC;
RAD52R2:ctcagcctcgacgCTTAAGTCACTTCTTTTTCTTAGCCTGTCCGGC。
以第二轮PCR产物为模板,利用RAD52F3/R3引物进行PCR扩增,得到第三轮PCR产物(1459bp)。
第三轮引物序列如下(5’→3’):
RAD52F3:GAAGAAGAAGGGAAGCGGAGAGGGCAGAGGAAGTCTGTTAACATGCGG;
RAD52R3:ccttactcagcctcgacgCTTAAGTCAC。
以第三轮PCR产物为模板,利用RAD52F4/R3引物进行PCR扩增,得到第四轮PCR产物,即T2A-NLS-RAD52-NLS片段(1471bp)。
第四轮引物序列如下(5’→3’):
RAD52F4:GGGGCAGGCGAAGAAGAAGAAGGGAAGCGGAGAGG;
RAD52R3:ccttactcagcctcgacgCTTAAGTCAC。
T2A-NLS-RAD52-NLS片段如序列表中序列1第19612-21082位所示,其中序列1第19612-19633位为与pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体完全匹配的同源序列,第19643-19696位所示为T2A的编码序列,第19712-19732位所示为NLS的编码序列,第19733-21007位所示为RAD52的编码序列,第21008-21055位所示为NLS的编码序列,第21056-21082位为与pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9基础载体完全匹配的同源序列。
利用同源重组技术将T2A-NLS-RAD52-NLS片段连入AflII酶切后的pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9载体,得到pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS-PolyA-E9载体。
1.2、重叠PCR获得tRNA-sgRNA-tRNA-PolyA片段
首先利用重叠PCR获得tRNA-sgRNA-tRNA-PolyA片段。以gRNA靶标序列片段为模板,利用EPSPS-RT-F1/R1引物进行PCR,获得第一轮PCR产物(96bp)。
gRNA的靶标序列如序列表中序列2第533-552位核苷酸序列的反向互补序列所示(序列2是野生型OsEPSPS编码基因)。
第一轮PCR引物序列如下(5’→3’):
EPSPS-RT-F1:ATTTCCACCAGCAGCAGTCAGTTTTAGAGCTAGAAATAGCAAGTT;
EPSPS-RT-R1:GCACCGACTCGGTGCC。
以tRNA-PolyA片段为模板,利用EPSPS-RT-F2/R2引物进行PCR,获得第二轮PCR产物(335bp)。
第二轮PCR引物序列如下(5’→3’):
EPSPS-RT-F2:GGCACCGAGTCGGTGCAACAAAGCACCAGTGGTCTAGTG;
EPSPS-RT-R2:ACTTTATTGCCAAATGTTTGAACGATCggggaaattcgagctctttaaatttt。
将第一轮PCR产物和第二轮PCR产物混合后作为模板,利用EPSPS-RT-F3/R3引物进行PCR,获得第三轮PCR产物(417bp)。
第三轮PCR引物序列如下(5’→3’):
EPSPS-RT-F3:CAATTTCCACCAGCAGCAGTCAG;
EPSPS-RT-R3:ACTTTATTGCCAAATGTTTGAACGATC。
以tRNA片段为模板,利用EPSPS-RT-F4/R4引物进行PCR,获得第四轮PCR产物(129bp)。
第四轮PCR引物序列如下(5’→3’):
EPSPS-RT-F4:GCTTTTTTGTAGGTAGACCGGTACCAACAAAGCACCAGTGGTCTAGTG;
EPSPS-RT-R4:CTAAAACTGACTGCTGCTGGTGGAAATTGCACCAGCCGGGAATCG。
将第三轮PCR产物和第四轮PCR产物混合后作为模板,利用EPSPS-RT-F5/R5引物进行PCR,获得第五轮PCR产物,即tRNA-sgRNA-tRNA-PolyA片段(517bp)。
第五轮PCR引物序列如下(5’→3’):
EPSPS-RT-F5:GCTTTTTTGTAGGTAGACCGGTACC;
EPSPS-RT-R5:ACTTTATTGCCAAATGTTTGAACGATC。
tRNA-sgRNA-tRNA-PolyA片段包括序列表中序列1第23573-24037位核苷酸所示的基因。序列1中,第23573-23649位为第一tRNA的编码序列,第23650-23745位为sgRNA的编码序列,第23746-23822位为第二tRNA的编码序列,第23823-24037位为PolyA片段的编码序列,第24038-24064位为与pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体完全匹配的同源序列。
1.3、重叠PCR获得tRNA-pegRNA片段
然后利用重叠PCR获得tRNA-pegRNA片段。以引物EPSPS-RT-F7为模板,利用EPSPS-RT-F6/R6引物进行PCR,获得第一轮PCR产物(95bp)。
作为模板的EPSPS-RT-F7序列如下(5’→3’):
EPSPS-RT-F7:TGCTGTCAAGGATCGCATTACAATTCCAGCGTTCCCCAAG。
第一轮引物序列如下(5’→3’):
EPSPS-RT-F6:CATTACAATTCCAGCGTTCCCCAAGAACAGTTGCACTTCTTCCTTCGCA;
EPSPS-RT-R6:CACTAGACCACTGGTGCTTTGTTGAGAAGGATGCGAAGGAAGAAGTGCAACTG。
以gRNA片段为模板,利用EPSPS-RT-F8/R7引物进行PCR,获得第二轮PCR产物(119bp)。
gRNA的靶标序列如序列2第453-472位核苷酸序列所示(序列2是野生型OsEPSPS编码基因)。
第二轮引物序列如下(5’→3’):
EPSPS-RT-F8:TGTTGAGAAGGATGCGAAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGC;
EPSPS-RT-R7:TTGTAATGCGATCCTTGACAGCAGCACCGACTCGGTGCC。
以tRNA片段为模板,利用EPSPS-RT-F9/R8引物进行PCR,获得第三轮PCR产物(129bp)。
引物序列如下(5’→3’):
EPSPS-RT-F9:GCTTTTTTGTAGGTAGACCGGTACAACAAAGCACCAGTGGTCTAGTG;
EPSPS-RT-R8:CTAAAACCTTTCGCATCCTTCTCAACATGCACCAGCCGGGAATCG。
将第一轮PCR产物、第二轮PCR产物和第三轮PCR产物混合后作为模板,利用EPSPS-RT-F10/R9引物进行PCR,获得第四轮PCR产物(264bp)。
引物序列如下(5’→3’):
EPSPS-RT-F10:GCTTTTTTGTAGGTAGACCGGTAC;
EPSPS-RT-R9:GATGCGAAGGAAGAAGTGCAACTG。
以第四轮PCR产物为模板,利用EPSPS-RT-F10/R10引物进行PCR,获得第五轮PCR产物,即tRNA-pegRNA片段(293bp)。
EPSPS-RT-F10/R10引物序列如下(5’→3’):
EPSPS-RT-F10:GCTTTTTTGTAGGTAGACCGGTACC;
EPSPS-RT-R10:CACTAGACCACTGGTGCTTTGTTGAGAAGGATGCGAAGGAAGAAGTGCAACTG。
tRNA-pegRNA片段如SEQ ID No.1第23304-23595所示,其中第23304-23327位为与pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体完全匹配的同源序列,第23328-23404位所示为tRNA的编码序列,第23405-23572位为pegRNA的编码序列,其中第23405-23572位所示的pegRNA的编码序列中,第23405-23500位为介导靶向DNA单链切刻(nick)sgRNA的编码序列,第23501-23559位为逆转录(RT)模板的编码序列,第23560-23572位为引物结合位点(PBS)的编码序列,第23573-23595位为pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体完全匹配的同源序列。
1.4、重组载体的构建
利用同源重组技术将tRNA-sgRNA-tRNA-PolyA片段和tRNA-pegRNA片段先后利用全式金同源重组酶连入KpnI酶切后的pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-Nos基础载体,得到pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体。
pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体含有序列表中序列1第13268-19633位所示的融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS的编码基因,表达融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS;含有核苷酸序列是序列表中序列1第23405-23572位所示的pegRNA基因,表达pegRNA;含有核苷酸序列是序列表中序列1第23650-23745位所示的介导非靶向DNA单链切刻(nick)的sgRNA基因,表达介导非靶向DNA单链切刻(nick)的sgRNA;含有HygR基因,表达潮霉素抗性蛋白HygR。
1.5、同源重组技术获得重组载体
以pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体为模板,利用E9ActinF/E9NosR引物进行PCR扩增,得到Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos片段(2373bp)。
第一轮引物序列如下(5’→3’):
E9ActinF:GCCAATTGATTGACAACGGTACTCG;
E9NosR:CTATGACCATGATTACGAATTCGGGATC。
接着利用同源重组技术,将Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos片段连入经KpnI酶切的pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS-PolyA-E9载体(1.1获得),得到pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体。
pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体含有序列表中序列1第13268-19633位所示的融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS的编码基因,表达融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS;含有核苷酸序列如序列表
中序列1第19643-21055位所示的融合蛋白T2A-NLS-RAD52-NLS的编码基因,编码融合蛋
白T2A-NLS-RAD52-NLS;含有核苷酸序列是序列表中序列1第23405-23572位所示的pegRNA基因,表达pegRNA;含有核苷酸序列是序列表中序列1第23650-23745位所示的介导非靶向DNA单链切刻(nick)的sgRNA基因,表达介导非靶向DNA单链切刻(nick)的sgRNA;含有HygR基因,表达潮霉素抗性蛋白HygR。
1.6、同源重组获得重组载体prime editor-EPSPS和prime editor-Rad52-EPSPS。
以含有WUS表达盒的质粒为模板,利用WUS-F/R引物进行PCR扩增,得到WUS表达盒。
WUS-F/R引物序列如下(5’→3’):
WUS-F:ACGACGGCCAGTGCCACCTAGCTCCTGCGCTG;
WUS-R:GCAGGAATTCGATATCAAGCTTGATCTAGTAACATAGATGACACCGC。
WUS表达盒的序列如序列1第8900-11168位所示,其中序列1第8885-8899位为与pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-Rad52-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体和pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos完全匹配的同源序列,第8900-9954位为PLTP启动子序列,第9955-10915为WUS编码序列,第10916-11168为Nos终止子序列,第11169-11190位为与pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体和pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos完全匹配的同源序列。
接着利用同源重组技术,将WUS表达盒连入经HindIII酶切后的pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体和pCXUN-Ubi-NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS-PolyA-E9-Actin-tRNA-pegRNA-tRNA-sgRNA-tRNA-PolyA-Nos载体中,分别得到prime editor-EPSPS和primeeditor-Rad52-EPSPS载体。
prime editor-EPSPS载体的载体图谱如图1中(B)所示。prime editor-EPSPS载体含有核苷酸序列是序列表中序列1第8900-11168位所示的WUS表达盒,其中序列1第8900-9954位为PLTP启动子序列,第9955-10915位为WUS编码序列,第10916-11168为Nos终止子序列;含有如序列表中序列1第13268-19633位所示的融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS的编码基因,表达融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS;含有核苷酸序列是序列表中序列1第23405-23572位所示的pegRNA基因,表达pegRNA;含有核苷酸序列是序列表中序列1第23650-23745位所示的介导非靶向DNA单链切刻(nick)的sgRNA基因,表达介导非靶向DNA单链切刻(nick)的sgRNA;含有如序列表中序列1第1059-2084位所示的HygR基因,表达潮霉素抗性蛋白HygR。
prime editor-Rad52-EPSPS载体的载体图谱如图1中(C)所示,其核苷酸序列如序列表中序列1所示。prime editor-Rad52-EPSPS载体含有核苷酸序列是序列表中序列1第8900-11168位所示的的WUS表达盒,其中序列1第8900-9954位为PLTP启动子序列,第9955-10915位为WUS编码序列,第10916-11168为Nos终止子序列;含有序列表中序列1第13268-21058位所示的融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS的编码基因,表达融合蛋白NLS-nCas9(H840A)-Linker1(33aa)-M-MLV-RT-Linker2(14aa)-NLS-T2A-NLS-RAD52-NLS;含有核苷酸序列是序列表中序列1第23405-23572位所示的pegRNA基因,表达pegRNA;含有核苷酸序列是序列表中序列1第23650-23745位所示的介导非靶向DNA单链切刻(nick)的sgRNA基因,表达介导非靶向DNA单链切刻(nick)的sgRNA;含有如序列表中序列1第1059-2084位所示的HygR基因,表达潮霉素抗性蛋白HygR。
实施例2、转基因水稻的获得及基因型鉴定
2.1、转基因水稻的获得
选取饱满的中花11水稻种子(来自中国农业科学院作物科学研究所),剥去种皮,灭菌洗涤后,均匀地点入含有2mg/L的2,4-D灭菌NB固体培养基,28℃持续暗培养约30天诱导愈伤组织形成。将愈伤组织用含有0.3M甘露醇和0.3M山梨醇的NB固体培养基(以下简称高渗培养基)培养4-6h后,将实施例1的质粒prime editor-EPSPS和prime editor-Rad52-EPSPS使用基因枪分别轰击水稻愈伤组织,采用0.6μm金粉,轰击压力为900psi进行轰击,轰击后在高渗培养基上继续培养16h后转移至第一轮NB筛选培养基(含有2mg/L的2,4-D、50mg/L的潮霉素),28℃持续暗培养2-3周,然后转移至第二轮NB筛选培养基(含有2mg/L的2,4-D、1mM的草甘膦),28℃持续暗培养3-4周。接着选取生长良好、呈嫩黄色的阳性愈伤组织,用无菌镊子移至NB预分化培养基(含有1mg/L的NAA、5mg/L的ABA和2mg/L的Kinetin),28℃持续光照培养。2周后挑选生长旺盛的愈伤组织转入MS分化培养基(含有0.02mg/L的NAA和2mg/L的Kinetin),28℃持续光照培养。待分化出来的幼苗长至2-5mm,转入不含激素和抗生素的MS培养基培养2到3周,然后移入土中,置于温室生长(温度28-30℃,16h光照/8h黑暗),得到T0代再生植株。利用基因枪将质粒prime editor-EPSPS和prime editor-Rad52-EPSPS分别轰击了120个水稻愈伤组织,经潮霉素筛选和草甘膦筛选,分别获得15簇转primeeditor-Rad52-EPSPS的T0代再生植株和8簇转prime editor-EPSPS的T0代再生植株。
2.2对T0代再生植株的基因型鉴定
成簇剪取T0代再生植株叶片,提取基因组DNA作为模板,利用基因组的上游引物EPSIN-F1和编辑位点的特异引物EPSIN-SR1进行特异PCR和电泳鉴定,鉴定得到146bp条带的成簇样品可能含有预期突变,分别获得5簇转prime editor-Rad52-EPSPS有特异条带的再生植株(这5簇的簇编号分别为RAD52-4,RAD52-12,RAD52-24,RAD52-25,RAD52-26)和1簇转prime editor-EPSPS(其簇编号为3T-15)有特异条带的再生植株(图2)。
引物序列如下(5’→3’):
EPSIN-F1:GGGCTCTCTGTGGAAGCAGATAAAG;
EPSIN-SR1:GCTGCTGTCAAGGATCGCATTACAA;
接着对这些样品分单株取样,分别得到17株转prime editor-Rad52-EPSPS有特异条带的再生植株和3株转prime editor-EPSPS有特异条带的再生植株(表1)。提取基因组DNA作为模板,利用基因组引物EPSIN-F1/R1进行PCR和MnlI酶切鉴定。
引物序列如下(5’→3’):
EPSIN-F1:GGGCTCTCTGTGGAAGCAGATAAAG;
EPSIN-R1:ATTCGTGGCACTCCATCAAGC;
基因组引物EPSIN-F1/R1扩增出的条带大小为281bp,以野生型DNA作为模板扩增出的条带可以被MnlI酶切成96bp和185bp两种大小的条带,发生精准编辑的植株扩增出的条带不能被MnlI酶切(图3)。将酶切不开的PCR产物送测序。
测序结果汇总如表1。测序结果表明,20株不能被限制性内切酶MnlI酶切开的6簇再生植株(簇编号RAD52-4,RAD52-12,RAD52-24,RAD52-25,RAD52-26和3T-15),均为编辑植株。
其中RAD52-24和RAD52-26共11棵植株的两条同源染色体均在序列表中序列1所示的EPSPS氨基酸序列的第169位、170位和173位氨基酸的密码子处发生了精准编辑,使得这三个密码子编码的氨基酸发生了突变,即T169I、A170V和P173S(TIAVPS),将该突变获得的蛋白质命名为EPSPS/TIAVPS,其编码序列为EPSPS/TIAVPS基因,EPSPS/TIAVPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),将序列表中序列2的第508-510位的核苷酸GCA突变为GTA(A170V),将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子。
RAD52-4和RAD52-12共3棵植株的一条染色体在序列表中序列1所示的EPSPS氨基酸序列的第169位和173位氨基酸的密码子处发生了精准编辑,使得这两个密码子编码的氨基酸发生了突变,即T169I和P173S(TIPS),将该突变获得的蛋白质命名为EPSPS/TIPS,其编码序列为EPSPS/TIPS基因;EPSPS/TIPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),并将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子。另一条染色体没有发生编辑,为野生型序列。
RAD52-25共3棵植株的一条染色体在序列表中序列1所示的EPSPS氨基酸序列的第173位氨基酸的密码子处发生了精准编辑,使得这个密码子编码的氨基酸发生了突变,即P173S(PS),将该突变获得的蛋白质命名EPSPS/PS;其编码序列命名为EPSPS/PS基因,EPSPS/PS基因是将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子。另一条染色体没有发生编辑,为野生型序列。
而3T-15共3棵植株的一条染色体在序列表中序列1所示的EPSPS氨基酸序列的第169位、170位和173位氨基酸的密码子处发生了精准编辑,使得这三个密码子编码的氨基酸发生了突变,即T169I、A170V和P173S(TIAVPS),将该突变获得的蛋白质命名为EPSPS/TIAVPS,其编码序列为EPSPS/TIAVPS基因,EPSPS/TIAVPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),将序列表中序列2的第508-510位的核苷酸GCA突变为GTA(A170V),将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子。
M-MLV、HptII、pegRNA检测引物如下所述(5’→3’):
MLV-Fjd:GACCCTCATCCACCAGTCGAT;
MLV-Rjd:GTCTGGCCTCCTGGGACATT;
hpt-F:ATGACGCACAATCCCACTATCCTT;
hpt-R:TTGCCAGTGATACACATGGGGAT;
pegRNA-F:GTGCGGAGCTTTTTTGTAGGTAGAC;
pegRNA-R:cttactcagcctcgacAAGCTTGC。
表1编辑结果的统计
Figure BDA0003523130320000141
注:He,杂合子;Ho,纯合子;+,代表鉴定结果为阳性。
2.3、本实验所设计靶点的脱靶检测
根据网上预测软件CRISPR-GE(http://skl.scau.edu.cn/home/),分别对pegRNA和sgRNA可能存在的脱靶位点进行预测(表2),并根据可能存在脱靶位点的侧翼序列设计引物对:针对pegRNA表达盒的引物对为EPS-pegRNA-OFF1-F/R和EPS-pegRNA-OFF2-F/R,针对sgRNA表达盒的引物对为EPS-sgRNA-OFF1-F/R和EPS-sgRNA-OFF2-F/R。利用上述引物进行PCR扩增和测序,对编辑植株进行脱靶检测。
引物序列如下(5’→3’):
EPS-pegRNA-OFF1-F:CGCAGATGTGAACATGATGACG;
EPS-pegRNA-OFF1-R:GCAGCAACACTGACTGCCA;
EPS-pegRNA-OFF2-F:CCAACACTATCAACACATCGGAGC;
EPS-pegRNA-OFF2-R:GGGTTTAGTCCCACATCAGTAATTG;
EPS-sgRNA-OFF1-F:CCATCAGCTTAAGCACTGGGG;
EPS-sgRNA-OFF1-R:CACACGGTCTAAGTTGAGGCG;
EPS-sgRNA-OFF2-F:GAGGTCAAGGTGCTCTAGCTG;
EPS-sgRNA-OFF2-R:CATTCACGCATTCGATCGCATC;
针对上述编辑植株进行脱靶检测,各个引物对EPS-pegRNA-OFF1-F/R、EPS-pegRNA-OFF2-F/R、EPS-sgRNA-OFF1-F/R和EPS-sgRNA-OFF2-F/R对脱靶植株的扩增片段长度分别为412bp,419bp,479bp和385bp。
利用引物对EPS-pegRNA-OFF1-F/R、EPS-pegRNA-OFF2-F/R、EPS-sgRNA-OFF1-F/R和EPS-sgRNA-OFF2-F/R对20棵植株基因组DNA和野生型基因组DNA进行PCR扩增,并将PCR扩增产物测序,测序结果显示编辑植株的各可能脱靶位点核苷酸序列与野生型序列一致,即在预测的潜在脱靶位点未发现编辑情况。
检测结果汇总见表2,检测结果表明,所设计的引导编辑载体中pegRNA和gRNA潜在的脱靶位点并不存在脱靶情况。
表2脱靶分析
Figure BDA0003523130320000151
注:PAM位点使用下划线标注,错配碱基加粗字体表示。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国农业科学院作物科学研究所
<120> 通过精准编辑内源EPSPS基因获得抗草甘膦水稻的方法及其所用系统
<160> 2
<170> SIPOSequenceListing 1.0
<210> 1
<211> 24298
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 60
catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 120
attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 180
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attggctaga gcagcttgcc 240
aacatggtgg agcacgacac tctcgtctac tccaagaata tcaaagatac agtctcagaa 300
gaccaaaggg ctattgagac ttttcaacaa agggtaatat cgggaaacct cctcggattc 360
cattgcccag ctatctgtca cttcatcaaa aggacagtag aaaaggaagg tggcacctac 420
aaatgccatc attgcgataa aggaaaggct atcgttcaag atgcctctgc cgacagtggt 480
cccaaagatg gacccccacc cacgaggagc atcgtggaaa aagaagacgt tccaaccacg 540
tcttcaaagc aagtggattg atgtgataac atggtggagc acgacactct cgtctactcc 600
aagaatatca aagatacagt ctcagaagac caaagggcta ttgagacttt tcaacaaagg 660
gtaatatcgg gaaacctcct cggattccat tgcccagcta tctgtcactt catcaaaagg 720
acagtagaaa aggaaggtgg cacctacaaa tgccatcatt gcgataaagg aaaggctatc 780
gttcaagatg cctctgccga cagtggtccc aaagatggac ccccacccac gaggagcatc 840
gtggaaaaag aagacgttcc aaccacgtct tcaaagcaag tggattgatg tgatatctcc 900
actgacgtaa gggatgacgc acaatcccac tatccttcgc aagaccttcc tctatataag 960
gaagttcatt tcatttggag aggacacgct gaaatcacca gtctctctct acaaatctat 1020
ctctctcgag ctttcgcaga tccggggggc aatgagatat gaaaaagcct gaactcaccg 1080
cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag cgtctccgac ctgatgcagc 1140
tctcggaggg cgaagaatct cgtgctttca gcttcgatgt aggagggcgt ggatatgtcc 1200
tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg ttatgtttat cggcactttg 1260
catcggccgc gctcccgatt ccggaagtgc ttgacattgg ggagtttagc gagagcctga 1320
cctattgcat ctcccgccgt gcacagggtg tcacgttgca agacctgcct gaaaccgaac 1380
tgcccgctgt tctacaaccg gtcgcggagg ctatggatgc gatcgctgcg gccgatctta 1440
gccagacgag cgggttcggc ccattcggac cgcaaggaat cggtcaatac actacatggc 1500
gtgatttcat atgcgcgatt gctgatcccc atgtgtatca ctggcaaact gtgatggacg 1560
acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg gccgaggact 1620
gccccgaagt ccggcacctc gtgcacgcgg atttcggctc caacaatgtc ctgacggaca 1680
atggccgcat aacagcggtc attgactgga gcgaggcgat gttcggggat tcccaatacg 1740
aggtcgccaa catcttcttc tggaggccgt ggttggcttg tatggagcag cagacgcgct 1800
acttcgagcg gaggcatccg gagcttgcag gatcgccacg actccgggcg tatatgctcc 1860
gcattggtct tgaccaactc tatcagagct tggttgacgg caatttcgat gatgcagctt 1920
gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc gggcgtacac 1980
aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta ctcgccgata 2040
gtggaaaccg acgccccagc actcgtccga gggcaaagaa atagagtaga tgccgaccgg 2100
atctgtcgat cgacaagctc gagtttctcc ataataatgt gtgagtagtt cccagataag 2160
ggaattaggg ttcctatagg gtttcgctca tgtgttgagc atataagaaa cccttagtat 2220
gtatttgtat ttgtaaaata cttctatcaa taaaatttct aattcctaaa accaaaatcc 2280
agtactaaaa tccagatccc ccgaattaat tcggcgttaa ttcagtacat taaaaacgtc 2340
cgcaatgtgt tattaagttg tctaagcgtc aatttgttta caccacaata tatcctgcca 2400
ccagccagcc aacagctccc cgaccggcag ctcggcacaa aatcaccact cgatacaggc 2460
agcccatcag tccgggacgg cgtcagcggg agagccgttg taaggcggca gactttgctc 2520
atgttaccga tgctattcgg aagaacggca actaagctgc cgggtttgaa acacggatga 2580
tctcgcggag ggtagcatgt tgattgtaac gatgacagag cgttgctgcc tgtgatcacc 2640
gcggtttcaa aatcggctcc gtcgatacta tgttatacgc caactttgaa aacaactttg 2700
aaaaagctgt tttctggtat ttaaggtttt agaatgcaag gaacagtgaa ttggagttcg 2760
tcttgttata attagcttct tggggtatct ttaaatactg tagaaaagag gaaggaaata 2820
ataaatggct aaaatgagaa tatcaccgga attgaaaaaa ctgatcgaaa aataccgctg 2880
cgtaaaagat acggaaggaa tgtctcctgc taaggtatat aagctggtgg gagaaaatga 2940
aaacctatat ttaaaaatga cggacagccg gtataaaggg accacctatg atgttgaacg 3000
ggaaaaggac atgatgctat ggctggaagg aaagctgcct gttccaaagg tcctgcactt 3060
tgaacggcat gatggctgga gcaatctgct catgagtgag gccgatggcg tcctttgctc 3120
ggaagagtat gaagatgaac aaagccctga aaagattatc gagctgtatg cggagtgcat 3180
caggctcttt cactccatcg acatatcgga ttgtccctat acgaatagct tagacagccg 3240
cttagccgaa ttggattact tactgaataa cgatctggcc gatgtggatt gcgaaaactg 3300
ggaagaagac actccattta aagatccgcg cgagctgtat gattttttaa agacggaaaa 3360
gcccgaagag gaacttgtct tttcccacgg cgacctggga gacagcaaca tctttgtgaa 3420
agatggcaaa gtaagtggct ttattgatct tgggagaagc ggcagggcgg acaagtggta 3480
tgacattgcc ttctgcgtcc ggtcgatcag ggaggatatc ggggaagaac agtatgtcga 3540
gctatttttt gacttactgg ggatcaagcc tgattgggag aaaataaaat attatatttt 3600
actggatgaa ttgttttagt acctagaatg catgaccaaa atcccttaac gtgagttttc 3660
gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 3720
tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 3780
gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 3840
accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 3900
accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 3960
gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 4020
ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 4080
atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 4140
gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 4200
cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 4260
gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 4320
gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc 4380
tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac 4440
cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ctgatgcggt attttctcct 4500
tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 4560
tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt catggctgcg 4620
ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc 4680
gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca 4740
tcaccgaaac gcgcgaggca gggtgccttg atgtgggcgc cggcggtcga gtggcgacgg 4800
cgcggcttgt ccgcgccctg gtagattgcc tggccgtagg ccagccattt ttgagcggcc 4860
agcggccgcg ataggccgac gcgaagcggc ggggcgtagg gagcgcagcg accgaagggt 4920
aggcgctttt tgcagctctt cggctgtgcg ctggccagac agttatgcac aggccaggcg 4980
ggttttaaga gttttaataa gttttaaaga gttttaggcg gaaaaatcgc cttttttctc 5040
ttttatatca gtcacttaca tgtgtgaccg gttcccaatg tacggctttg ggttcccaat 5100
gtacgggttc cggttcccaa tgtacggctt tgggttccca atgtacgtgc tatccacagg 5160
aaagagacct tttcgacctt tttcccctgc tagggcaatt tgccctagca tctgctccgt 5220
acattaggaa ccggcggatg cttcgccctc gatcaggttg cggtagcgca tgactaggat 5280
cgggccagcc tgccccgcct cctccttcaa atcgtactcc ggcaggtcat ttgacccgat 5340
cagcttgcgc acggtgaaac agaacttctt gaactctccg gcgctgccac tgcgttcgta 5400
gatcgtcttg aacaaccatc tggcttctgc cttgcctgcg gcgcggcgtg ccaggcggta 5460
gagaaaacgg ccgatgccgg gatcgatcaa aaagtaatcg gggtgaaccg tcagcacgtc 5520
cgggttcttg ccttctgtga tctcgcggta catccaatca gctagctcga tctcgatgta 5580
ctccggccgc ccggtttcgc tctttacgat cttgtagcgg ctaatcaagg cttcaccctc 5640
ggataccgtc accaggcggc cgttcttggc cttcttcgta cgctgcatgg caacgtgcgt 5700
ggtgtttaac cgaatgcagg tttctaccag gtcgtctttc tgctttccgc catcggctcg 5760
ccggcagaac ttgagtacgt ccgcaacgtg tggacggaac acgcggccgg gcttgtctcc 5820
cttcccttcc cggtatcggt tcatggattc ggttagatgg gaaaccgcca tcagtaccag 5880
gtcgtaatcc cacacactgg ccatgccggc cggccctgcg gaaacctcta cgtgcccgtc 5940
tggaagctcg tagcggatca cctcgccagc tcgtcggtca cgcttcgaca gacggaaaac 6000
ggccacgtcc atgatgctgc gactatcgcg ggtgcccacg tcatagagca tcggaacgaa 6060
aaaatctggt tgctcgtcgc ccttgggcgg cttcctaatc gacggcgcac cggctgccgg 6120
cggttgccgg gattctttgc ggattcgatc agcggccgct tgccacgatt caccggggcg 6180
tgcttctgcc tcgatgcgtt gccgctgggc ggcctgcgcg gccttcaact tctccaccag 6240
gtcatcaccc agcgccgcgc cgatttgtac cgggccggat ggtttgcgac cgtcacgccg 6300
attcctcggg cttgggggtt ccagtgccat tgcagggccg gcagacaacc cagccgctta 6360
cgcctggcca accgcccgtt cctccacaca tggggcattc cacggcgtcg gtgcctggtt 6420
gttcttgatt ttccatgccg cctcctttag ccgctaaaat tcatctactc atttattcat 6480
ttgctcattt actctggtag ctgcgcgatg tattcagata gcagctcggt aatggtcttg 6540
ccttggcgta ccgcgtacat cttcagcttg gtgtgatcct ccgccggcaa ctgaaagttg 6600
acccgcttca tggctggcgt gtctgccagg ctggccaacg ttgcagcctt gctgctgcgt 6660
gcgctcggac ggccggcact tagcgtgttt gtgcttttgc tcattttctc tttacctcat 6720
taactcaaat gagttttgat ttaatttcag cggccagcgc ctggacctcg cgggcagcgt 6780
cgccctcggg ttctgattca agaacggttg tgccggcggc ggcagtgcct gggtagctca 6840
cgcgctgcgt gatacgggac tcaagaatgg gcagctcgta cccggccagc gcctcggcaa 6900
cctcaccgcc gatgcgcgtg cctttgatcg cccgcgacac gacaaaggcc gcttgtagcc 6960
ttccatccgt gacctcaatg cgctgcttaa ccagctccac caggtcggcg gttgcccata 7020
tgtcgtaagg gcttggctgc accggaatca gcacgaagtc ggctgccttg atcgcggaca 7080
cagccaagtc cgccgcctgg ggcgctccgt cgatcactac gaagtcgcgc cggccgatgg 7140
ccttcacgtc gcggtcaatc gtcgggcggt cgatgccgac aacggttagc ggttgatctt 7200
cccgcacggc cgcccaatcg cgggcactgc cctggggatc ggaatcgact aacagaacat 7260
cggccccggc gagttgcagg gcgcgggcta gatgggttgc gatggtcgtc ttgcctgacc 7320
cgcctttctg gttaagtaca gcgataacct tcatgcgttc cccttgcgta tttgtttatt 7380
tactcatcgc atcatatacg cagcgaccgc atgacgcaag ctgttttact caaatacaca 7440
tcaccttttt agacggcggc gctcggtttc ttcagcggcc aagctggccg gccaggccgc 7500
cagcttggca tcagacaaac cggccaggat ttcatgcagc cgcacggttg agacgtgcgc 7560
gggcggctcg aacacgtacc cggccgcgat catctccgcc tcgatctctt cggtaatgaa 7620
aaacggttcg tcctggccgt cctggtgcgg tttcatgctt gttcctcttg gcgttcattc 7680
tcggcggccg ccagggcgtc ggcctcggtc aatgcgtcct cacggaaggc accgcgccgc 7740
ctggcctcgg tgggcgtcac ttcctcgctg cgctcaagtg cgcggtacag ggtcgagcga 7800
tgcacgccaa gcagtgcagc cgcctctttc acggtgcggc cttcctggtc gatcagctcg 7860
cgggcgtgcg cgatctgtgc cggggtgagg gtagggcggg ggccaaactt cacgcctcgg 7920
gccttggcgg cctcgcgccc gctccgggtg cggtcgatga ttagggaacg ctcgaactcg 7980
gcaatgccgg cgaacacggt caacaccatg cggccggccg gcgtggtggt gtcggcccac 8040
ggctctgcca ggctacgcag gcccgcgccg gcctcctgga tgcgctcggc aatgtccagt 8100
aggtcgcggg tgctgcgggc caggcggtct agcctggtca ctgtcacaac gtcgccaggg 8160
ctaggtggtc aagcatcctg gccagctccg ggcggtcgcg cctggtgccg gtgatcttct 8220
cggaaaacag cttggtgcag ccggccgcgt gcagttcggc ccgttggttg gtcaagtcct 8280
ggtcgtcggt gctgacgcgg gcatagccca gcaggccagc ggcggcgctc ttgttcatgg 8340
cgtaatgtct ccggttctag tcgcaagtat tctactttat gcgactaaaa cacgcgacaa 8400
gaaaacgcca ggaaaagggc agggcggcag cctgtcgcgt aacttaggac ttgtgcgaca 8460
tgtcgttttc agaagacggc tgcactgaac gtcagaagcc gactgcacta tagcagcgga 8520
ggggttggat caaagtactt tgatcccgag gggaaccctg tggttggcat gcacatacaa 8580
atggacgaac ggataaacct tttcacgccc ttttaaatat ccgttattct aataaacgct 8640
cttttctctt aggtttaccc gccaatatat cctgtcaaac actgatagtt taaactgaag 8700
gcgggaaacg acaatctgat ccaagctcaa gctgctctag cattcgccat tcaggctgcg 8760
caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 8820
gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 8880
taaaacgacg gccagtgcca cctagctcct gcgctgtacg cgtcccccat caatctctgt 8940
cttgcggttg tagcctgtgt aacagtgcaa gagtatgtat gataataggt tttaagtctg 9000
cttacatgac attttttatt gtggaagaga catataaaaa ttagagagag tggttctcat 9060
gcaacggcgg acggcccggt gctaaaagag cttcaagaca aaataatgaa acaggaagag 9120
agtagattta tctaagagcc aactttatta tatgaatgtg tttattgttg gctttagatg 9180
atatggtaag gagttagagc taataatata taggctctat tattattatt attaattaaa 9240
ctcgctctaa ggaggaaagt gggaggaagg gacgaggacg aagactactg gaagcatcgt 9300
ccatggatga tggatgtggt gtctcttaat gtaggtggcc ggaggatgta cgtgttaatt 9360
gcgcgataag cactcagatc caaccgcaaa ctacctccac actgacacac tgatagagag 9420
aaagagagac ctccgacgac tgccgccgca gatgagccac gtacgtatac gacgtctgcc 9480
ggccggctca ggctgccgcc atcaccctgc tcgaaagtcg cgttaggcgg cgccagctac 9540
ataggagtat ctagtctagc cagttagtat actactactg cgctgatgat gaattaactc 9600
tgcatatata ctgtacatgc ctccctccaa cacccaacca cctcctgctc ggctcttaat 9660
aacttggaca cggatcgatg ccatccaagg aagaagacga cgacgacgac ggaacatcca 9720
ccatgcaagc ttgcatccat acgccgatac gcgtgcatcc atccatccac cattatttcc 9780
attttccacc gatcacacgt acacaggcct atttaaggag cgacatccca ctgcaactct 9840
cctcaccact catcaccagc tagctctagc aaagcacttg ccatctaccg accgccgcat 9900
tccaaacagc ccgacgagct agcagagcgg caggcacctc cctcctcaag gaaccgctca 9960
ggaaggccgc tgagatagag gcatggcggc caatgcgggc ggcggtggag cgggaggagg 10020
cagcggcagc gtggctgcgc cggcggtgtg ccgccccagc ggctcgcggt ggacgccgac 10080
gccggagcag atcaggatgc tgaaggagct ctactacggc tgcggcatcc ggtcgcccag 10140
ctcggagcag atccagcgca tcaccgccat gctgcggcag cacggcaaga tcgagggcaa 10200
gaacgtcttc tactggttcc agaaccacaa ggcccgcgag cgccagaagc gccgcctcac 10260
cagcctcgac gtcaacgtgc ccgccgccgg cgcggccgac gccaccacca gccaactcgg 10320
cgtcctctcg ctgtcgtcgc cgccgccttc aggcgcggcg cctccctcgc ccaccctcgg 10380
cttctacgcc gccggcaatg gcggcggatc ggctgtgctg ctggacacga gttccgactg 10440
gggcagcagc ggcgctgcca tggccaccga gacatgcttc ctgcaggact acatgggcgt 10500
gacggacacg ggcagctcgt cgcagtggcc acgcttctcg tcgtcggaca cgataatggc 10560
ggcggccgcg gcgcgggcgg cgacgacgcg ggcgcccgag acgctccctc tcttcccgac 10620
ctgcggcgac gacggcggca gcggtagcag cagctacttg ccgttctggg gtgccgcgtc 10680
cacaactgcc ggcgccactt cttccgttgc gatccagcag caacaccagc tgcaggagca 10740
gtacagcttt tacagcaaca gcaacagcac ccagctggcc ggcaccggca accaagacgt 10800
atcggcaaca gcagcagcag ccgccgccct ggagctgagc ctcagctcat ggtgctcccc 10860
ttaccctgct gcagggagta tgtgagagca acgcgagctg ccactgctct tcactgatcg 10920
ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat 10980
tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac 11040
gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat 11100
agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt 11160
actagatcaa gcttgatatc gaattcctgc agtgcagcgt gacccggtcg tgcccctctc 11220
tagagataat gagcattgca tgtctaagtt ataaaaaatt accacatatt ttttttgtca 11280
cacttgtttg aagtgcagtt tatctatctt tatacatata tttaaacttt actctacgaa 11340
taatataatc tatagtacta caataatatc agtgttttag agaatcatat aaatgaacag 11400
ttagacatgg tctaaaggac aattgagtat tttgacaaca ggactctaca gttttatctt 11460
tttagtgtgc atgtgttctc cttttttttt gcaaatagct tcacctatat aatacttcat 11520
ccattttatt agtacatcca tttagggttt agggttaatg gtttttatag actaattttt 11580
ttagtacatc tattttattc tattttagcc tctaaattaa gaaaactaaa actctatttt 11640
agttttttta tttaataatt tagatataaa atagaataaa ataaagtgac taaaaattaa 11700
acaaataccc tttaagaaat taaaaaaact aaggaaacat ttttcttgtt tcgagtagat 11760
aatgccagcc tgttaaacgc cgtcgacgag tctaacggac accaaccagc gaaccagcag 11820
cgtcgcgtcg ggccaagcga agcagacggc acggcatctc tgtcgctgcc tctggacccc 11880
tctcgagagt tccgctccac cgttggactt gctccgctgt cggcatccag aaatgcgtgg 11940
cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca cggcacggca 12000
gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 12060
atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 12120
acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 12180
cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 12240
cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 12300
ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 12360
gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatttc 12420
atgatttttt ttgtttcgtt gcatagggtt tggtttgccc ttttccttta tttcaatata 12480
tgccgtgcac ttgtttgtcg ggtcatcttt tcatgctttt ttttgtcttg gttgtgatga 12540
tgtggtctgg ttgggcggtc gttctagatc ggagtagaat tctgtttcaa actacctggt 12600
ggatttatta attttggatc tgtatgtgtg tgccatacat attcatagtt acgaattgaa 12660
gatgatggat ggaaatatcg atctaggata ggtatacatg ttgatgcggg ttttactgat 12720
gcatatacag agatgctttt tgttcgcttg gttgtgatga tgtggtgtgg ttgggcggtc 12780
gttcattcgt tctagatcgg agtagaatac tgtttcaaac tacctggtgt atttattaat 12840
tttggaactg tatgtgtgtg tcatacatct tcatagttac gagtttaaga tggatggaaa 12900
tatcgatcta ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg 12960
catatgcagc atctattcat atgctctaac cttgagtacc tatctattat aataaacaag 13020
tatgttttat aattattttg atcttgatat acttggatga tggcatatgc agcagctata 13080
tgtggatttt tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg 13140
tcgatgctca ccctgttgtt tggtgttact tctgcagccc taggcctact agatggatta 13200
caaggaccac gacggggatt acaaggacca cgacattgat tacaaggatg atgatgacaa 13260
gatggctccg aagaagaaga ggaaggttgg catccacggg gtgccagctg ctgacaagaa 13320
gtactcgatc ggcctcgata ttgggactaa ctctgttggc tgggccgtga tcaccgacga 13380
gtacaaggtg ccctcaaaga agttcaaggt cctgggcaac accgatcggc attccatcaa 13440
gaagaatctc attggcgctc tcctgttcga cagcggcgag acggctgagg ctacgcggct 13500
caagcgcacc gcccgcaggc ggtacacgcg caggaagaat cgcatctgct acctgcagga 13560
gattttctcc aacgagatgg cgaaggttga cgattctttc ttccacaggc tggaggagtc 13620
attcctcgtg gaggaggata agaagcacga gcggcatcca atcttcggca acattgtcga 13680
cgaggttgcc taccacgaga agtaccctac gatctaccat ctgcggaaga agctcgtgga 13740
ctccacagat aaggcggacc tccgcctgat ctacctcgct ctggcccaca tgattaagtt 13800
caggggccat ttcctgatcg agggggatct caacccggac aatagcgatg ttgacaagct 13860
gttcatccag ctcgtgcaga cgtacaacca gctcttcgag gagaacccca ttaatgcgtc 13920
aggcgtcgac gcgaaggcta tcctgtccgc taggctctcg aagtctcggc gcctcgagaa 13980
cctgatcgcc cagctgccgg gcgagaagaa gaacggcctg ttcgggaatc tcattgcgct 14040
cagcctgggg ctcacgccca acttcaagtc gaatttcgat ctcgctgagg acgccaagct 14100
gcagctctcc aaggacacat acgacgatga cctggataac ctcctggccc agatcggcga 14160
tcagtacgcg gacctgttcc tcgctgccaa gaatctgtcg gacgccatcc tcctgtctga 14220
tattctcagg gtgaacaccg agattacgaa ggctccgctc tcagcctcca tgatcaagcg 14280
ctacgacgag caccatcagg atctgaccct cctgaaggcg ctggtcaggc agcagctccc 14340
cgagaagtac aaggagatct tcttcgatca gtcgaagaac ggctacgctg ggtacattga 14400
cggcggggcc tctcaggagg agttctacaa gttcatcaag ccgattctgg agaagatgga 14460
cggcacggag gagctgctgg tgaagctcaa tcgcgaggac ctcctgagga agcagcggac 14520
attcgataac ggcagcatcc cacaccagat tcatctcggg gagctgcacg ctatcctgag 14580
gaggcaggag gacttctacc ctttcctcaa ggataaccgc gagaagatcg agaagattct 14640
gactttcagg atcccgtact acgtcggccc actcgctagg ggcaactccc gcttcgcttg 14700
gatgacccgc aagtcagagg agacgatcac gccgtggaac ttcgaggagg tggtcgacaa 14760
gggcgctagc gctcagtcgt tcatcgagag gatgacgaat ttcgacaaga acctgccaaa 14820
tgagaaggtg ctccctaagc actcgctcct gtacgagtac ttcacagtct acaacgagct 14880
gactaaggtg aagtatgtga ccgagggcat gaggaagccg gctttcctgt ctggggagca 14940
gaagaaggcc atcgtggacc tcctgttcaa gaccaaccgg aaggtcacgg ttaagcagct 15000
caaggaggac tacttcaaga agattgagtg cttcgattcg gtcgagatct ctggcgttga 15060
ggaccgcttc aacgcctccc tggggaccta ccacgatctc ctgaagatca ttaaggataa 15120
ggacttcctg gacaacgagg agaatgagga tatcctcgag gacattgtgc tgacactcac 15180
tctgttcgag gaccgggaga tgatcgagga gcgcctgaag acttacgccc atctcttcga 15240
tgacaaggtc atgaagcagc tcaagaggag gaggtacacc ggctggggga ggctgagcag 15300
gaagctcatc aacggcattc gggacaagca gtccgggaag acgatcctcg acttcctgaa 15360
gagcgatggc ttcgcgaacc gcaatttcat gcagctgatt cacgatgaca gcctcacatt 15420
caaggaggat atccagaagg ctcaggtgag cggccagggg gactcgctgc acgagcatat 15480
cgcgaacctc gctggctcgc cagctatcaa gaaggggatt ctgcagaccg tgaaggttgt 15540
ggacgagctg gtgaaggtca tgggcaggca caagcctgag aacatcgtca ttgagatggc 15600
ccgggagaat cagaccacgc agaagggcca gaagaactca cgcgagagga tgaagaggat 15660
cgaggagggc attaaggagc tggggtccca gatcctcaag gagcacccgg tggagaacac 15720
gcagctgcag aatgagaagc tctacctgta ctacctccag aatggccgcg atatgtatgt 15780
ggaccaggag ctggatatta acaggctcag cgattacgac gtcgatgcta tcgttccaca 15840
gtcattcctg aaggatgact ccattgacaa caaggtcctc accaggtcgg acaagaaccg 15900
gggcaagtct gataatgttc cttcagagga ggtcgttaag aagatgaaga actactggcg 15960
ccagctcctg aatgccaagc tgatcacgca gcggaagttc gataacctca caaaggctga 16020
gaggggcggg ctctctgagc tggacaaggc gggcttcatc aagaggcagc tggtcgagac 16080
acggcagatc actaagcacg ttgcgcagat tctcgactca cggatgaaca ctaagtacga 16140
tgagaatgac aagctgatcc gcgaggtgaa ggtcatcacc ctgaagtcaa agctcgtctc 16200
cgacttcagg aaggatttcc agttctacaa ggttcgggag atcaacaatt accaccatgc 16260
ccatgacgcg tacctgaacg cggtggtcgg cacagctctg atcaagaagt acccaaagct 16320
cgagagcgag ttcgtgtacg gggactacaa ggtttacgat gtgaggaaga tgatcgccaa 16380
gtcggagcag gagattggca aggctaccgc caagtacttc ttctactcta acattatgaa 16440
tttcttcaag acagagatca ctctggccaa tggcgagatc cggaagcgcc ccctcatcga 16500
gacgaacggc gagacggggg agatcgtgtg ggacaagggc agggatttcg cgaccgtcag 16560
gaaggttctc tccatgccac aagtgaatat cgtcaagaag acagaggtcc agactggcgg 16620
gttctctaag gagtcaattc tgcctaagcg gaacagcgac aagctcatcg cccgcaagaa 16680
ggactgggat ccgaagaagt acggcgggtt cgacagcccc actgtggcct actcggtcct 16740
ggttgtggcg aaggttgaga agggcaagtc caagaagctc aagagcgtga aggagctgct 16800
ggggatcacg attatggagc gctccagctt cgagaagaac ccgatcgatt tcctggaggc 16860
gaagggctac aaggaggtga agaaggacct gatcattaag ctccccaagt actcactctt 16920
cgagctggag aacggcagga agcggatgct ggcttccgct ggcgagctgc agaaggggaa 16980
cgagctggct ctgccgtcca agtatgtgaa cttcctctac ctggcctccc actacgagaa 17040
gctcaagggc agccccgagg acaacgagca gaagcagctg ttcgtcgagc agcacaagca 17100
ttacctcgac gagatcattg agcagatttc cgagttctcc aagcgcgtga tcctggccga 17160
cgcgaatctg gataaggtcc tctccgcgta caacaagcac cgcgacaagc caatcaggga 17220
gcaggctgag aatatcattc atctcttcac cctgacgaac ctcggcgccc ctgctgcttt 17280
caagtacttc gacacaacta tcgatcgcaa gaggtacaca agcactaagg aggtcctgga 17340
cgcgaccctc atccaccagt cgattaccgg cctctacgag acgcgcatcg acctgtctca 17400
gctcgggggc gactccggcg gctcttccgg cggctcatcc ggctctgaga cccctggcac 17460
ctccgagtcc gccacccctg agtcctccgg cggctcctct ggcggctctt ctaccctcaa 17520
catcgaggac gagtacagac tccacgagac atccaaggag cctgacgtgt ctctcggctc 17580
tacctggctc tccgacttcc ctcaggcctg ggccgagaca ggcggcatgg gcctcgctgt 17640
gcgccaggct ccactcatca tcccgctcaa ggcgacctcc acaccggtct ccattaagca 17700
atacccaatg tcccaggagg ccagactcgg cattaagcca cacatccagc gcctcctcga 17760
tcaaggcatc ctcgtgccct gccaatcccc gtggaacacc ccactcctcc ccgtgaagaa 17820
gccaggcacc aacgactacc gccccgtgca ggacctccgc gaggtcaata agcgcgttga 17880
ggacatccac ccaaccgtcc caaacccata caacctcctc tccggcctcc cgccatccca 17940
ccaatggtac accgtgctcg acctcaagga cgccttcttc tgcctccgcc tccacccaac 18000
ctcccagcca ctcttcgcct tcgagtggcg cgaccctgag atgggcatct ccggccaact 18060
cacgtggacc cgcctcccgc aaggcttcaa gaactccccc accctcttca acgaggccct 18120
ccaccgcgac ctcgccgact tcaggattca gcacccggac ctcatcctcc tccagtacgt 18180
ggacgacctc ctcctcgccg cgacctcaga gctcgactgc caacagggca caagagccct 18240
cctccaaacc ctcggcaacc tcggctaccg cgcctccgct aagaaggccc agatctgcca 18300
gaagcaagtc aagtacctcg gctacctcct caaggagggc caacgctggc tcaccgaggc 18360
cagaaaggag acagtgatgg gccagccaac cccgaagaca ccgagacaac tccgcgagtt 18420
cctcggcaag gccggcttct gccgcctctt cattccgggc ttcgcggaga tggccgcgcc 18480
gctctatcca ctcaccaagc caggcacact cttcaactgg ggcccagacc aacagaaggc 18540
ctaccaggag atcaagcagg ccctgctcac cgccccggcc ctcggcctcc cagacctcac 18600
caagcccttc gagctcttcg tggacgagaa gcaaggctac gccaagggcg tcctcaccca 18660
gaagctgggc ccatggaggc gcccggtggc ttatctctcc aagaagctcg atcccgtggc 18720
cgccggctgg ccaccatgcc tcagaatggt ggcggccatt gccgtgctca ccaaggacgc 18780
cggcaagctc accatgggcc aaccgctggt catcctcgcc ccacacgccg tcgaggccct 18840
cgttaagcag cctcctgaca gatggctctc caacgcccgc atgacccact accaggccct 18900
cctcctcgac accgaccgcg tccaattcgg ccctgttgtc gccctcaacc cggccaccct 18960
cctcccactc cctgaggagg gcctccaaca caactgcctc gacatcctcg ccgaggccca 19020
cggcaccaga ccggatctca ccgaccagcc cctcccagac gccgaccaca cctggtacac 19080
cgacggctcc tccctcctcc aggagggcca aaggaaggcc ggcgccgctg tgacaaccga 19140
gaccgaggtg atttgggcca aggccctccc agccggcacc tcagctcaac gcgccgagct 19200
gattgccctc acccaagccc tgaagatggc cgagggcaag aagctcaatg tgtacaccga 19260
ctcccgctac gccttcgcca ccgcccacat ccacggcgag atctacagga ggaggggctg 19320
gctcacctcc gagggcaagg agatcaagaa caaggacgag atcctcgcgc tcctcaaggc 19380
cctcttcctc ccgaagcgcc tctccatcat ccattgcccg ggccaccaga agggccactc 19440
cgctgaggcc cgcggcaaca gaatggccga ccaagccgcc cgcaaggccg ctatcaccga 19500
gaccccagac acctccaccc tcctcatcga gaacagctcc ccctccggcg gcagcaagcg 19560
cacagctgac ggcagcgagt tcgagaagcg gccagcggcg acgaagaagg cggggcaggc 19620
gaagaagaag aagggaagcg gagagggcag aggaagtctg ttaacatgcg gtgacgtgga 19680
ggagaatccc ggccctgtcg ccaccatggc cccaaagaag aagcggaagg tcggtatcca 19740
cggagtccca gcagcctccg gaaccgaaga agccattctc ggcggcaggg attctcatcc 19800
agccgccgga ggaggatctg ttctctgttt tggccagtgt cagtacacag ccgaggagta 19860
ccaggccatc caaaaggccc tcaggcaaag gcttggccca gagtatatct cctccaggat 19920
ggctggcggc ggccaaaaag tgtgctacat cgaaggccac cgcgtgatta atctcgccaa 19980
cgagatgttc ggctacaatg gctgggccca ctccattaca cagcagaacg tggacttcgt 20040
ggacctcaac aacggcaagt tctacgtggg cgtgtgtgct tttgtgcgcg tgcaactcaa 20100
agatggctcc taccacgaag acgtgggcta tggagtttcc gaaggcctca aatccaaggc 20160
cctctccctt gaaaaggcca ggaaagaggc tgtgacagac ggccttaaaa gggccctcag 20220
gtcctttgga aatgccctcg gcaactgcat tctcgacaag gactacctcc gctccctcaa 20280
taaactccca cgccagcttc cactcgaggt ggatctcaca aaggccaaac gccaggatct 20340
cgagccatcc gttgaagagg cccgctacaa ttcctgtcgc ccgaatatgg cccttggaca 20400
cccacaactc caacaagtga catccccgtc caggccatct catgccgtga ttccagccga 20460
tcaggactgt tcctccaggt ccctttcttc ctccgccgtg gaatccgaag ctacccatca 20520
acgcaagctc aggcagaaac agctccagca gcaattccgc gagcgcatgg aaaaacagca 20580
ggtgcgcgtg tctacaccat ccgccgagaa atccgaggct gctccaccag ctccaccagt 20640
gacacattcc accccggtga cagtttccga accactcctc gagaaagatt tcctcgccgg 20700
cgtgacacag gaactcatca agaccctcga ggacaactcc gaaaagtggg ccgtgacacc 20760
agatgctgga gatggagtgg tgaagccatc ttccagggcc gatccagccc aaacatccga 20820
tacactcgcc ctcaacaacc agatggtgac ccagaatcgc acaccgcatt ccgtgtgcca 20880
tcagaaaccg caagccaaat ccggatcctg ggacctccaa acatactccg ccgaccaaag 20940
gacaaccggc aattgggaat cccaccgcaa gtcccaggac atgaagaagc gcaagtacga 21000
cccgtctaag cgtcctgctg ccaccaaaaa ggccggacag gctaagaaaa agaagtgact 21060
taagcgtcga ggctgagtaa ggttaacttt gagtattatg gcattggaaa agccattgtt 21120
ctgcttgtaa tttactgtgt tctttcagtt ttgttttcgg acatcaagtt aacaaaaaaa 21180
aaaaaaaaaa aaaaaaaatt taacaaaaaa aaaaaaaaaa aaaaaaaatt taacaaaaaa 21240
aaaaaaaaaa aaaaaaaatt taaagagctc gaatttcccc agagctttcg ttcgtatcat 21300
cggtttcgac aacgttcgtc aagttcaatg catcagtttc attgcgcaca caccagaatc 21360
ctactgagtt tgagtattat ggcattggga aaactgtttt tcttgtacca tttgttgtgc 21420
ttgtaattta ctgtgttttt tattcggttt tcgctatcga actgtgaaat ggaaatggat 21480
ggagaagagt taatgaatga tatggtcctt ttgttcattc tcaaattaat attatttgtt 21540
ttttctctta tttgttgtgt gttgaatttg aaattataag agatatgcaa acattttgtt 21600
ttgagtaaaa atgtgtcaaa tcgtggcctc taatgaccga agttaatatg aggagtaaaa 21660
cacttgtagt tgtaccatta tgcttattca ctaggcaaca aatatatttt cagacctaga 21720
aaagctgcaa atgttactga atacaagtat gtcctcttgt gttttagaca tttatgaact 21780
ttcctttatg taattttcca gaatccttgt cagattctaa tcattgcttt ataattatag 21840
ttatactcat ggatttgtag ttgagtatga aaatattttt taatgcattt tatgacttgc 21900
caattgattg acaacggtac tcgaggtcat tcatatgctt gagaagagag tcgggatagt 21960
ccaaaataaa acaaaggtaa gattacctgg tcaaaagtga aaacatcagt taaaaggtgg 22020
tataaagtaa aatatcggta ataaaaggtg gcccaaagtg aaatttactc ttttctacta 22080
ttataaaaat tgaggatgtt tttgtcggta ctttgatacg tcatttttgt atgaattggt 22140
ttttaagttt attcgctttt ggaaatgcat atctgtattt gagtcgggtt ttaagttcgt 22200
ttgcttttgt aaatacagag ggatttgtat aagaaatatc tttaaaaaaa cccatatgct 22260
aatttgacat aatttttgag aaaaatatat attcaggcga attctcacaa tgaacaataa 22320
taagattaaa atagctttcc cccgttgcag cgcatgggta ttttttctag taaaaataaa 22380
agataaactt agactcaaaa catttacaaa aacaacccct aaagttccta aagcccaaag 22440
tgctatccac gatccatagc aagcccagcc caacccaacc caacccaacc caccccagtc 22500
cagccaactg gacaatagtc tccacacccc cccactatca ccgtgagttg tccgcacgca 22560
ccgcacgtct cgcagccaaa aaaaaaaaaa gaaagaaaaa aaagaaaaag aaaaaacagc 22620
aggtgggtcc gggtcgtggg ggccggaaac gcgaggagga tcgcgagcca gcgacgaggc 22680
cggccctccc tccgcttcca aagaaacgcc ccccatcgcc actatataca tacccccccc 22740
tctcctccca tccccccaac cctaccacca ccaccaccac cacctccacc tcctcccccc 22800
tcgctgccgg acgacgagct cctcccccct ccccctccgc cgccgccgcg ccggtaacca 22860
ccccgcccct ctcctctttc tttctccgtt ttttttttcc gtctcggtct cgatctttgg 22920
ccttggtagt ttgggtgggc gagaggcggc ttcgtgcgcg cccagatcgg tgcgcgggag 22980
gggcgggatc tcgcggctgg ggctctcgcc ggcgtggatc cggcccggat ctcgcgggga 23040
atggggctct cggatgtaga tctgcgatcc gccgttgttg ggggagatga tggggggttt 23100
aaaatttccg ccatgctaaa caagatcagg aagaggggaa aagggcacta tggtttatat 23160
ttttatatat ttctgctgct tcgtcaggct tagatgtgct agatctttct ttcttctttt 23220
tgtgggtaga atttgaatcc ctcagcattg ttcatcggta gtttttcttt tcatgatttg 23280
tgacaaatgc agcctcgtgc ggagcttttt tgtaggtaga ccggtacaac aaagcaccag 23340
tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg 23400
tgcatgttga gaaggatgcg aaaggtttta gagctagaaa tagcaagtta aaataaggct 23460
agtccgttat caacttgaaa aagtggcacc gagtcggtgc tgctgtcaag gatcgcatta 23520
caattccagc gttccccaag aacagttgca cttcttcctt cgcatccttc tcaacaaagc 23580
accagtggtc tagtggtaga atagtaccct gccacggtac agacccgggt tcgattcccg 23640
gctggtgcaa tttccaccag cagcagtcag ttttagagct agaaatagca agttaaaata 23700
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcaacaa agcaccagtg 23760
gtctagtggt agaatagtac cctgccacgg tacagacccg ggttcgattc ccggctggtg 23820
cagtcgaggc tgagtaaggt taactttgag tattatggca ttggaaaagc cattgttctg 23880
cttgtaattt actgtgttct ttcagttttg ttttcggaca tcaagttaac aaaaaaaaaa 23940
aaaaaaaaaa aaaaatttaa caaaaaaaaa aaaaaaaaaa aaaaatttaa caaaaaaaaa 24000
aaaaaaaaaa aaaaatttaa agagctcgaa tttccccgat cgttcaaaca tttggcaata 24060
aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt 24120
gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt 24180
ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg 24240
cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatc ccgaattc 24298
<210> 2
<211> 1536
<212> DNA
<213> 水稻(Oryza sativa L.)
<400> 2
atggcgtcca acgccgcggc tgcggcggcg gtgtccctgg accaggccgt ggcggcgtcg 60
gcggcgttct cgtcgcggaa gcagctgcgg ctgcccgccg cggcgcgcgg ggggatgcgg 120
gtgcgggtgc gggcgcgggg gcggcgggag gcggtggtgg tggcgtccgc gtcgtcgtcg 180
tcggtggcag cgccggcggc gaaggcggag gagatcgtgc tccagcccat cagggagatc 240
tccggggcgg ttcagctgcc agggtccaag tcgctctcca acaggatcct cctcctctcc 300
gccctctccg agggcacaac agtggtggac aacttgctga acagtgagga tgttcactac 360
atgcttgagg ccctgaaagc cctcgggctc tctgtggaag cagataaagt tgcaaaaaga 420
gctgtagtcg ttggctgtgg tggcaagttt cctgttgaga aggatgcgaa agaggaagtg 480
caactcttct tggggaacgc tggaactgca atgcgaccat tgacagcagc cgtgactgct 540
gctggtggaa atgcaactta tgtgcttgat ggagtgccac gaatgaggga gagaccgatt 600
ggtgacttgg ttgtcgggtt gaaacaactt ggtgcggatg tcgactgttt ccttggcact 660
gaatgcccac ctgttcgtgt caagggaatt ggaggacttc ctggtggcaa ggttaagctc 720
tctggttcca tcagcagtca gtacttgagt gccttgctga tggctgctcc tttggccctt 780
ggggatgtgg agatcgaaat cattgacaaa ctaatctcca ttccttacgt tgaaatgaca 840
ttgagattga tggagcgttt tggtgtgaag gcagagcatt ctgatagttg ggacagattc 900
tatattaagg gagggcagaa gtacaaatct cctggaaatg cctatgttga aggtgatgcc 960
tcaagcgcga gctatttctt ggctggtgct gcaatcactg gaggcactgt gacagttcaa 1020
ggttgtggta cgaccagttt gcagggtgat gtcaaatttg ctgaggtact tgagatgatg 1080
ggagcaaagg ttacatggac tgacaccagt gtaaccgtaa ctggtccacc acgtgagcct 1140
tatgggaaga aacacctgaa agctgttgat gtcaacatga acaaaatgcc tgatgttgcc 1200
atgacccttg ccgttgttgc actcttcgct gatggtccaa ctgctatcag agatgtggct 1260
tcctggagag taaaggaaac cgaaaggatg gttgcaattc ggaccgagct aacaaagctg 1320
ggagcatcgg ttgaagaagg tcctgactac tgcatcatca ccccaccgga gaagctgaac 1380
atcacggcaa tcgacaccta cgatgatcac aggatggcca tggccttctc cctcgctgcc 1440
tgcgccgacg tgcccgtgac gatcagggac cctggttgca cccgcaagac cttccccaac 1500
tacttcgacg ttctaagcac tttcgtcagg aactga 1536

Claims (10)

1.产生抗草甘膦水稻的方法,其特征在于:所述方法包括将靶向水稻基因组中5-烯醇丙酮莽草酸-3-磷酸合成酶基因的引导编辑系统表达载体导入待编辑水稻,得到抗草甘膦水稻;
引导编辑系统表达载体包括融合蛋白的编码基因、pegRNA的编码基因和介导非靶向DNA单链切刻(nick)的sgRNA的编码基因,所述融合蛋白是由核定位信号1-N、nCas9(H840A)、M-MLV-RT、核定位信号1-C、自剪切多肽、核定位信号2-N、RAD52和核定位信号2-C连接而成的蛋白质;所述pegRNA包括介导靶向DNA单链切刻(nick)的sgRNA、引物结合位点和储存有靶向位点编辑信息的反转录模板,所述靶向位点为所述水稻基因组中EPSPS基因。
2.如权利要求1所述的方法,其特征在于:所述RAD52为如下B1)-B3)中任一种蛋白质:
B1)、由编码链的编码序列是序列表中序列1第19733-21007位核苷酸编码的蛋白质;
B2)、将B1)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
B3)、在B1)或B2)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白;
所述nCas9(H840A)为如下B11)-B13)中任一种蛋白质:
B11)、由编码链的编码序列是序列表中序列1第13313-17413位核苷酸编码的蛋白质;
B12)、将B11)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
B13)、在B11)或B12)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白;
所述M-MLV-RT为如下B21)-B23)中任一种蛋白质:
B21)、由编码链的编码序列是序列表中序列1第17414-19585位核苷酸编码的蛋白质;
B22)、将B21)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与B1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
B23)、在B21)或B22)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白。
3.如权利要求1或2所述的方法,其特征在于:所述融合蛋白包括如下任一种蛋白质:
R1)、由编码链的编码序列是序列表中序列1第13313-21055位核苷酸编码的蛋白质;
R2)、将R1)所示的蛋白质经过一个以上氨基酸残基的取代和/或缺失和/或添加得到的与R1)所示的氨基酸序列具有80%以上同一性,且具有相同生物学功能的蛋白质;
R3)、在R1)或R2)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白。
4.如权利要求1-3中任一所述的方法,其特征在于:所述融合蛋白的编码基因是序列表中序列1第13313-21055位核苷酸所示的DNA分子。
5.如权利要求1-4中任一所述的方法,其特征在于:所述介导靶向DNA单链切刻(nick)的sgRNA的靶标序列为SEQ ID No.2第453-472所示核苷酸序列,所述反转录模板的编码序列如序列表中序列1第23501-23559位核苷酸所示的DNA分子。
6.如权利要求1-5中任一所述的方法,其特征在于:所述引导编辑系统表达载体包括WUS表达盒,所述WUS表达盒如序列表中序列1第8900-11168位核苷酸所示,其中第8900-9954位为PLTP启动子序列,第9955-10915为WUS编码序列,第10916-11168为Nos终止子序列。
7.权利要求1-6中任一所述的方法中的所述引导编辑系统表达载体,或与所述引导编辑系统表达载体相关的生物材料,所述生物材料为含有所述引导编辑系统表达载体的重组微生物、转基因动物细胞系或转基因植物细胞系。
8.权利要求1-6中任一所述的方法中的所述融合蛋白,或与所述融合蛋白相关的生物材料,所述生物材料为下述任一种:
C1)、所述融合蛋白的编码基因;
C2)含有C1)所述编码基因的表达盒;
C3)含有C1)所述编码基因的重组载体;
C4)含有C2)所述表达盒的重组载体;
C5)含有C1)所述编码基因的重组微生物;
C6)含有C2)所述表达盒的重组微生物;
C7)含有C3)所述重组载体的重组微生物;
C8)含有C4)所述重组载体的重组微生物;
C9)含有C1)所述编码基因的转基因动物细胞系;
C10)含有C2)所述表达盒的转基因动物细胞系;
C11)含有C3)所述重组载体的转基因动物细胞系;
C12)含有C4)所述重组载体的转基因动物细胞系;
C13)含有C1)所述编码基因的转基因植物细胞系;
C14)含有C2)所述表达盒的转基因植物细胞系;
C15)含有C3)所述重组载体的转基因植物细胞系;
C16)含有C4)所述重组载体的转基因植物细胞系。
9.用于产生抗草甘膦水稻的组合物,包括E1)和E2),
E1)核酸组合物,所述核酸组合物包括权利要求1-6中任一所述方法中的所述融合蛋白的编码基因、权利要求1-6中任一所述方法中的所述pegRNA的编码基因和权利要求1-6中任一所述方法中的所述介导非靶向DNA单链切刻(nick)的sgRNA的编码基因;
E2)引导编辑系统,所述引导编辑系统包括权利要求1-6中任一所述方法中的所述融合蛋白、权利要求1-6中任一所述方法中的所述pegRNA和权利要求1-6中任一所述方法中的所述介导非靶向DNA单链切刻(nick)的sgRNA。
10.一种制备抗草甘膦植物的方法,包括如下T1)、T2)或T1):
T1)用EPSPS/TIPS基因替换水稻基因组中EPSPS编码基因,所述EPSPS/TIPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),并将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
T2)、用EPSPS/PS基因替换水稻基因组中EPSPS编码基因,EPSPS/PS基因,所述EPSPS/PS基因是将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子;
T3)用EPSPS/TIAVPS基因替换水稻基因组中EPSPS编码基因,所述EPSPS/TIAVPS基因是将序列表中序列2的第505-507位的核苷酸ACT突变为ATT(T169I),将序列表中序列2的第508-510位的核苷酸GCA突变为GTA(A170V),将序列表中序列2的第517-519位的核苷酸CCA突变为TCC(P173S),将序列表中序列2的第484-486位的核苷酸CTC突变为CTG(无义突变,编码氨基酸序列不变),并将序列表中序列2的第472-474位的核苷酸GAG突变为GAA(PAM位点突变,编码氨基酸序列不变),保持序列表中序列2的其它核苷酸不变得到的DNA分子。
CN202210187028.5A 2022-02-28 2022-02-28 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统 Active CN114591977B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210187028.5A CN114591977B (zh) 2022-02-28 2022-02-28 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210187028.5A CN114591977B (zh) 2022-02-28 2022-02-28 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统

Publications (2)

Publication Number Publication Date
CN114591977A true CN114591977A (zh) 2022-06-07
CN114591977B CN114591977B (zh) 2023-05-16

Family

ID=81815908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210187028.5A Active CN114591977B (zh) 2022-02-28 2022-02-28 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统

Country Status (1)

Country Link
CN (1) CN114591977B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115725533A (zh) * 2022-11-18 2023-03-03 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统
CN116855518A (zh) * 2023-08-01 2023-10-10 合肥戬谷生物科技有限公司 一种植物抗除草剂epsps突变型基因及其应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107043779A (zh) * 2016-12-01 2017-08-15 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CN113151314A (zh) * 2021-05-10 2021-07-23 安徽省农业科学院水稻研究所 一种植物ACCase突变型基因及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107043779A (zh) * 2016-12-01 2017-08-15 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CN113151314A (zh) * 2021-05-10 2021-07-23 安徽省农业科学院水稻研究所 一种植物ACCase突变型基因及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HUIYUAN LI等: "rice Precise Modifications of Both Exogenous and Endogenous Genes in Rice by Prime Editing" *
MAZINA OM等: "Rad52 Inverse Strand Exchange Drives RNA-Templated DNA Double-Strand Break Repair" *
SONG M等: "Generation of a more efficient prime editor 2 by addition of the Rad51 DNA-binding domain" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115725533A (zh) * 2022-11-18 2023-03-03 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统
CN115725533B (zh) * 2022-11-18 2023-08-25 中国农业科学院作物科学研究所 一种获得抗草甘膦水稻的方法及其所用双碱基融合编辑系统
CN116855518A (zh) * 2023-08-01 2023-10-10 合肥戬谷生物科技有限公司 一种植物抗除草剂epsps突变型基因及其应用
CN116855518B (zh) * 2023-08-01 2024-02-13 合肥戬谷生物科技有限公司 一种植物抗除草剂epsps突变型基因及其应用

Also Published As

Publication number Publication date
CN114591977B (zh) 2023-05-16

Similar Documents

Publication Publication Date Title
Wang et al. Egg cell-specific promoter-controlled CRISPR/Cas9 efficiently generates homozygous mutants for multiple target genes in Arabidopsis in a single generation
JP2022023040A (ja) オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物
KR102107735B1 (ko) 식물 원형질체로부터 식물체를 제조하는 방법
CN114591977B (zh) 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统
CN106133138A (zh) 使用引导多核苷酸/cas内切核酸酶系统的基因组修饰及其使用方法
Ramadan et al. Efficient CRISPR/Cas9 mediated pooled-sgRNAs assembly accelerates targeting multiple genes related to male sterility in cotton
CN112538492B (zh) 一种识别PAM序列为NRTH的SpCas9n变体及相应碱基编辑系统
Xu et al. Use of CRISPR/Cas genome editing technology for targeted mutagenesis in rice
CN113473845A (zh) 经由基因组编辑进行基因沉默
CN111206047B (zh) OsSWEET13基因突变体及其在提高水稻产量中的应用
CN113265406A (zh) 大豆fdl12基因编辑位点及其应用
JP2023515116A (ja) ゲノム編集のための新規なcrispr-casシステム
CN111926034A (zh) 陆地棉基因组单碱基编辑(abe)系统
CN116732070A (zh) 一种能够实现碱基颠换的cgbe单碱基编辑器及其应用
KR102516522B1 (ko) 반수체 식물을 유도하는 pPLAⅡη 유전자 및 이의 용도
CA3105188A1 (en) Artificial marker allele
CN112662687B (zh) 推迟玉米花期的方法、试剂盒、基因
KR20190122595A (ko) 식물의 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법
US20220049263A1 (en) Virus-based replicon for plant genome editing without inserting replicon into plant genome and uses thereof
CN106883291A (zh) 植物株型相关蛋白prog2及其编码基因与应用
Yang et al. A method for generating genome edited plant lines from CRISPR-transformed Shanxin poplar plants
Geng et al. Data-driven optimization yielded a highly-efficient CRISPR/Cas9 system for gene editing in Arabidopsis
JP7452884B2 (ja) Dnaが編集された植物細胞を製造する方法、及びそれに用いるためのキット
CN116286742B (zh) CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用
CN113999871B (zh) 创制矮杆直立株型的水稻种质的方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant