CN113549648A - 一种新型基因编辑系统及相关载体和方法 - Google Patents

一种新型基因编辑系统及相关载体和方法 Download PDF

Info

Publication number
CN113549648A
CN113549648A CN202110812232.7A CN202110812232A CN113549648A CN 113549648 A CN113549648 A CN 113549648A CN 202110812232 A CN202110812232 A CN 202110812232A CN 113549648 A CN113549648 A CN 113549648A
Authority
CN
China
Prior art keywords
sequence
dna
vector
editing
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110812232.7A
Other languages
English (en)
Other versions
CN113549648B (zh
Inventor
陈其军
姜媛媛
柴一萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN202110812232.7A priority Critical patent/CN113549648B/zh
Priority claimed from CN202110812232.7A external-priority patent/CN113549648B/zh
Publication of CN113549648A publication Critical patent/CN113549648A/zh
Application granted granted Critical
Publication of CN113549648B publication Critical patent/CN113549648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2795/00Bacteriophages
    • C12N2795/00011Details
    • C12N2795/18011Details ssRNA Bacteriophages positive-sense
    • C12N2795/18022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种新型基因编辑系统及相关载体和方法。本发明公开的基因编辑系统含有pegRNA、MCP与逆转录酶形成的融合蛋白,pegRNA为由sgRNA、逆转录模板、引物结合位点、源自噬菌体MS2的RNA茎环结构依次连接得到的RNA分子,RNA茎环结构的序列为序列表中序列1或2,MCP为序列14的第11853‑12233位或序列13的第12‑401位编码的蛋白质。使用本发明的系统,进行基因编辑,尤其是植物基因编辑,可以显著提高先导编辑的效率,提高精准编辑效率。

Description

一种新型基因编辑系统及相关载体和方法
技术领域
本发明涉及生物技术领域中,一种新型基因编辑及相关载体和方法。
背景技术
精确的基因组编辑技术在作物育种和基因组功能研究中发挥着重要作用。2019年10月出现的精准基因编辑新工具PE(Prime Editors)为基因编辑领域带来了重大突破(Anzalone,Randolph et al.)。新工具PE以CRISPR-Cas9系统为基础,建立PE1系统,一方面将Cas9切口酶(H840A)与野生型逆转录酶(M-MLV)融合形成新的融合蛋白,另一方面改造单链引导RNA(sgRNA),在其3’末端增加一段含有新遗传信息的逆转录模板(rtT)和引物结合位点(PBS)序列以获得先导编辑引导RNA(pegRNA);在PE1系统的基础上,通过优化M-MLV逆转录酶的氨基酸序列,改善其热稳定性,建立PE2系统。PE系统在不引入双链断裂(DSB)和无需供体DNA模板情况下,可有效实现12种单碱基的自由转换和多碱基的精准插入与删除。
2020年,国内已有多组科研团队相继发表文章阐述该先导编辑系统在植物的应用,但其编辑效率仍有待进一步提高(Lin,Zong et al.2020)。因此,需要开发出一种能显著提高先导编辑效率的方法,以提高该系统的可用性和友好度。
发明内容
本发明所要解决的技术问题是如何对DNA进行精确编辑,并提高精确编辑效率。
为解决上述技术问题,本发明首先提供了一种DNA先导编辑系统,所述系统含有pegRNA,所述pegRNA为由sgRNA、逆转录模板、引物结合位点、源自噬菌体MS2的RNA茎环结构依次连接得到的RNA分子,所述RNA茎环结构的序列为如下a1)-a4)中的任一种:
a1)序列表中序列1;
a2)序列表中序列2;
a3)在a1)或a2)的5′端和/或3′端添加一个或几个核苷酸得到的RNA序列;
a4)与a1)或a2)或a3)的RNA序列具有70%以上的同一性的RNA序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的a1)或a2)的核苷酸序列具有70%或更高,75%或更高,85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
上述70%以上同一性,可为70%、75%、85%、90%或95%以上的同一性。
上述系统还可含有MCP与逆转录酶(M_MLV)形成的融合蛋白,所述MCP为可以特异性结合MS2茎环结构的衣壳蛋白。
具体的,所述MCP可为如下P1)、P2)、P3)或P4):
P1)序列14的第11853-12233位编码的蛋白质;
P2)序列13的第12-401位编码的蛋白质;
P3)将P1)或P2)的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
P4)在P1)或P2)或P3)的N端或/和C端连接标签得到的融合蛋白质。
上述P3)中的蛋白质,为与P1)或P2)的蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。所述具有75%或75%以上同一性为具有75%、具有80%、具有85%、具有90%、具有95%、具有96%、具有97%、具有98%或具有99%的同一性。
上述P3)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
上述P4)中的蛋白质的编码基因可通过将序列14的第11853-12233位或序列13的第12-401位所示的DNA序列中缺失一个或几个氨基酸残基的密码子,和/或进行一个或几个碱基对的错义突变,和/或在其5′端和/或3′端连上标签的编码序列得到。
所述逆转录酶(M_MLV)可为序列14的第12333-14429位编码的蛋白质。
所述DNA先导编辑系统还可含有Cas9切口酶(H840A)。
在本发明的一个实施例中,所述Cas9切口酶(H840A)为序列14的第4820-9091位编码的蛋白质。
本发明还提供了一种载体,所述载体含有转录所述pegRNA的DNA分子。
上述载体中,所述DNA分子可为如下b1)-b4)中的任一种:
b1)由靶向待编辑DNA的靶点DNA分子与序列5的第34-222位所示的DNA分子连接得到的DNA分子;
b2)由靶向待编辑DNA的靶点DNA分子与序列6的第34-211位所示的DNA分子连接得到的DNA分子;
b3)在b1)或b2)的5′端和/或3′端添加一个或几个核苷酸得到的DNA分子;
b4)与b1)或b2)或b3)的DNA序列具有70%以上的同一性的DNA分子;
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的b1)或b2)的核苷酸序列具有70%或更高,75%或更高,85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
上述70%以上同一性,可为70%、75%、85%、90%或95%以上的同一性。
所述载体可含有大于1个的含有转录所述pegRNA的DNA分子,如2个、3个、4个、5个或6个。
上述载体还可含有所述融合蛋白的编码基因的表达盒。
所述表达框是指能够在宿主细胞中表达相应基因的DNA,该DNA不但可以包括启动相应基因转录的启动子,还可以包括终止相应基因转录的终止子。
具体的,含有所述融合蛋白的编码基因的表达盒可为序列表中序列14的第9848-15150位所示的DNA分子,或将序列14的第9848-15150位中的第11853-12233位(MCP基因序列)替换为序列表中序列13的第12-401位(MCP2基因序列)得到的序列。
上述载体还可含有所述Cas9切口酶(H840A)的编码基因的表达盒。所述表达盒可为序列表中序列14的第2815-9730位所示的DNA分子。
所述载体还含有tRNA基因和RNA核酶基因,可选的,位于同一基因表达框中的tRNA基因、pegRNA基因及RNA核酶基因依次相连。
所述载体还含有抗性标记基因。所述抗性标记基因为卡那霉素抗性基因(KmR)、潮霉素抗性基因(Hyg)、草甘膦抗性基因(Gly)、草丁膦抗性基因(Bar)中的一个或一个以上。
上述载体中,所述载体的骨架可根据编辑体的适用性进行选择,即选择编辑体适用的载体骨架。在本发明的实施例中,使用的载体骨架为pGreen3(Zhang,Zhang etal.2019)。所述载体骨架还可为本发明构建的pG3H-840MR-35C或pG3H-840MR-35C.2。
具体的,所述载体可由向所述载体骨架中导入转录所述pegRNA的DNA分子得到。
所述系统或所述载体在基因编辑中的应用,也属于本发明的保护范围。
本发明还提供了一种基因编辑的方法,所述方法包括将能获得所述系统的物质(如载体)或上文所述载体导入待编辑体中实现基因的编辑。
所述待编辑体可为植物。
所述系统或所述载体或所述基因编辑的方法在植物育种中的应用,也属于本发明的保护范围。
本发明提供了一种用于基因编辑的载体系统,该系统利用RNA适配体MS2茎环结构与MS2结合蛋白MCP的特异性结合,进而可以促使pegRNA-MS2招募MCP-RT模块,提高逆转录效率,提高精准编辑效率,使用本发明的载体,进行基因编辑,尤其是植物基因编辑,可以显著提高先导编辑的效率,提高精准编辑效率。
附图说明
图1为载体pG3H-840MR-35C(a)和载体pG3H-PE2-35C(b)的结构及进一步的载体构建过程示意图。
图2为基于MS2策略的先导编辑系统示意图。
图3为不同pegRNA结构图。
图4为序列3-序列7的结构示意图。
图5为原生质体中发生先导编辑细胞的PCR序列测序图;图中列出了空白对照原生质体PCR的序列测序图和转化载体p1879-CK、p1879-23b以及p1879-23b.2的原生质体PCR序列测序图,用“*”标记目标编辑核苷酸,p1879-2f3b、p1879-2f3b.2的序列测序图与p1879-23b相似。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。下述实施例中,如无特殊说明,序列表中各核苷酸序列的第1位均为相应DNA/RNA的5′末端核苷酸,末位均为相应DNA/RNA的3′末端核苷酸。
MS2是一种源自噬菌体MS2的RNA茎环结构,也是一种RNA适配体;
MCP(MS2 Coat Protein):可以特异性结合MS2茎环结构的衣壳蛋白;
本发明提供的pegRNA是改进后的sgRNA,pegRNA包含能够编码新遗传信息的RNA片段,所述pegRNA包括识别基因靶点的间隔子(Spacer)序列、sgRNA支架序列、引物结合位点(PBS)序列、包含新的遗传信息的逆转录模板(rtT)序列以及MS2结构序列,pegRNA根据需要编辑的靶位点设计。Spacer(下文记为T1或T2)与sgRNA支架组成完整的sgRNA。
下表为实施例中所用的引物、先导编辑引导RNA(pegRNA)相关序列:
表1引物、先导编辑引导RNA(pegRNA)相关序列
Figure BDA0003168646830000041
实施例1、先导编辑对照载体的构建
1、构建关于I1879V含有pegRNA的先导编辑对照载体:建立含BsaI的Golden Gate反应,将含有I1879V的靶点,逆转录模板等序列的pegR1-HDV-tMet-pegR2片段(其序列如序列表中序列7所示,靶点和逆转录模板信息如表1中I1879V突变的pegRNA相关序列所示)的两个BsaI酶切位点间的DNA片段替换pG3H-PE2-35C(Jiang et al.Genome Biology(2020)21:257,Prime editing efficiently generates W542L and S621I double mutationsin two ALS genes in maize)两个BsaI酶切位点间的DNA小片段,将得到的序列正确的重组载体命名为p1879-CKp1879-CK的结构特征如下:RB-[35U6p:tGly-pegR-HDV-tMet-pegR-HDV-HSPt]-[ZmUbi1p:Cas9H840A-RT-E9t]-[Hyg]-LB。
2、构建关于S627I位点含有pegRNA的先导编辑对照载体:建立含BsaI的GoldenGate反应,将含有S627I的靶点,逆转录模板等序列的pegR1-HDV-tMet-pegR2片段(其序列如序列表中序列12所示,靶点和逆转录模板信息如表1中S627I突变的pegRNA相关序列所示)的两个BsaI酶切位点间的DNA片段替换pG3H-PE2-35C两个BsaI酶切位点间的DNA小片段,将得到的序列正确的重组载体命名为p627a-CKp627a-CK的结构特征如下:RB-[35U6p:tGly-pegR-HDV-tMet-pegR-HDV-HSPt]-[ZmUbi1p:Cas9H840A-RT-E9t]-[Hyg]-LB。
实施例2、基于MS2策略的先导编辑载体的构建
1、使用引物RT-NXF和RT-SaR(表1所示),以pUC57-PE2(Jiang et al.GenomeBiology(2020)21:257,Prime editing efficiently generates W542L and S621Idouble mutations in two ALS genes in maize)为模板PCR扩增逆转录酶模块,纯化回收PCR产物,将所得产物利用NcoI与SacI进行双酶切,将得到的酶切产物与NcoI和SacI双酶切pR1R4-UBQ1-U6A得到的载体骨架连接,将得到的序列正确的重组载体命名为pR1R4-RT
2、用AscI、EcoRI酶切pR1R4-RT,将得到的逆转录酶(RT)片段与用AscI和EcoRI双酶切pL2R4-U6-mCh得到的载体骨架连接,将得到的序列正确的重组载体记为pL2R4-RT
3、用NcoI和BstXI酶切pL2R4-RT,将其与利用NcoI和BstXI双酶切pUC57-MCP(其序列如序列表中序列14的第11853位到第12233位所示,主要为MCP基因序列)得到的含有MCP基因的片段连接,将得到的序列正确的重组载体记为pL2R4-MCP-RT
4、用HindIII和XbaI酶切pL2R4-MCP-RT,与HindIII和XbaI酶切释放的Ubi启动子片段(其序列如序列表中序列14的第9848位到第11836位所示)连接,将得到的序列正确的重组片段记为pL2R4-ZmUb-MR。pL2R4-ZmUb-MR为将pL2R4-MCP-RT的HindIII和XbaI识别序列间的DNA片段替换为序列表中序列14的第9848位到第11836位所示的DNA片段得到的重组载体。
5、用NcoI和BstXI酶切pL2R4-RT,将其与利用NcoI和BstXI双酶切pUC57-MCP2(其序列如序列表中序列13所示,主要为MCP2基因序列)得到的含有MCP2基因的片段连接,将得到的序列正确的重组载体记为pL2R4-MCP2-RT
6、用HindIII和XbaI酶切pL2R4-MCP2-RT,与HindIII和XbaI酶切释放的Ubi启动子片段(其序列如序列表中序列14的第9848位到第11836位所示)连接,将得到的序列正确的重组片段记为pL2R4-ZmUb-MR2。pL2R4-ZmUb-MR2为将pL2R4-MCP2-RT的HindIII和XbaI识别序列间的DNA片段替换为序列序列14的第9848位到第11836位所示的DNA片段得到的重组载体。
7、利用XbaI和SacI酶切pUC57-zCas9H840A(Xing,Dong et al,A CRISPR/Cas9toolkit for multiplex genome editing in plants),将得到的含有zCas9H840A编码基因的DNA片段与XbaI和SacI酶切pG3R23-PE2-U3A.2(Prime editing efficientlygenerates W542L and S621I double mutations in two ALS genes in maize)得到的载体骨架连接,将得到的序列正确的重组载体命名为pG3R2R3-840-U3
8、利用HindIII和SpeI酶切pG3H-PE2-35C,将得到的DNA片段与HindIII和SpeI酶切pG3R2R3-840-U3的得到的载体骨架连接,将得到的序列正确的重组载体命名为pG3R2R3- 840-35C
9、去除载体pL4L3-U3H.2(Prime editing efficiently generates W542L andS621I double mutations in two ALS genes in maize)中的EcoRI和AscI酶切片段,将得到的序列正确的重组载体命名为pL4L3-Hyg2
10、使用pG3R2R3-840-35C、pL2R4-ZmUb-MR和pL4L3-Hyg2建立MultiSite Gateway(Gateway LR Clonase II Enzyme Mix,ThermoFisher11791020)组装反应,将得到的序列正确的重组载体命名为pG3H-840MR-35CpG3H-840MR-35C的RB与LB间的结构特征(图1)如下:RB-[35U6p:tGly-BsaI-BsaI-HDV-HSPt]-[ZmUbi1p:Cas9H840A-E9t]-[ZmUbip:MCP1-RT-OCSt]-[Hyg]-LB,序列表中序列14。
序列14中,第1-25位为RB的序列,第17628-17653位为LB的序列,LB和RB分别为T-DNA的左右边界;
第254-688位为35Sen(CaMV35S增强子)的序列;第689-1151位为CmYLCV的序列;第1160-1247位为U6的序列;35Sen-CmYLCV为融合聚合酶II启动子,U6为截短的U6-26聚合酶III启动子,第254-1247位形成35Sen-CmYLCV-U6融合启动子(35U6p);第1255-1325位为RNA-Gly的DNA序列;第1452-2312位为Amp抗性基因序列;第2461-2528位为HDV-RZ的DNA序列;第2537-2807位为HSPt终止子序列;
第2815-4803位为ZmUbi1p(玉米Ubi1启动子)的DNA序列;第4820-9091位为Cas9H840A(密码子优化的SpCas9切口酶(H840A))编码基因的序列;第9096-9730位为E9t(豌豆rbcS-E9终止子)的序列;
第9848-11836位为ZmUbi1p的序列;第11853-14429位为MCP1-RT的DNA序列,RT为优化的逆转录酶(M_MLV);第14443-15150位为OCSt终止子的序列;第16311-17336位为Hyg(潮霉素抗性基因)的序列。
11、使用pG3R2R3-840-35C、pL2R4-ZmUb-MR2和pL4L3-Hyg2建立MultiSiteGateway(Gateway LR Clonase II Enzyme Mix,ThermoFisher11791020)组装反应,将得到的序列正确的重组载体命名为pG3H-840MR-35C.2pG3H-840MR-35C.2的RB与LB间的结构特征如下:RB-[35U6p:tGly-BsaI-BsaI-HDV-HSPt]-[ZmUbi1p:Cas9H840A-E9t]-[ZmUbip:MCP2-RT-OCSt]-[Hyg]-LB。pG3H-840MR-35C.2的RB与LB间的DNA序列为将序列表中序列14的第11853-12233位(MCP基因序列)替换为序列表中序列13的第12-401位(MCP2基因序列)得到的序列。
12、构建关于I1879V位点含有MCP蛋白的不同pegRNA先导编辑载体:建立含BsaI的Golden Gate反应,具体过程如下:
(1)将含有I1879V的靶点,逆转录模板等序列的sgRNA-2xMS2-rtT-PBS-HDV-tMet-sgRNA-2xMS2-rtT-PBS片段(如序列表中序列3所示)的两个BsaI酶切位点间的DNA片段替换pG3H-840MR-35C的两个BsaI酶切位点间的DNA小片段,将得到的序列正确的重组载体命名为p1879-23a。p1879-23a的结构特征如下:RB-[35U6p:tGly-MS2pegR-HDV-tMet-MS2pegR-HDV-HSPt]-[ZmUbi1p:Cas9H840A-E9t]-[ZmUbi p:MCP1-RT-OCSt]-[Hyg]-LB。
(2)将sgRNA-MS2-f6-rtT-PBS-HDV-tMet-sgRNA-MS2-f6-rtT-PBS片段(如序列表中序列4所示)的两个BsaI酶切位点间的DNA片段替换pG3H-840MR-35C的两个BsaI酶切位点间的DNA小片段,将得到的序列正确的重组载体命名为p1879-2f3a
(3)将pegRNA-2xMS2-HDV-tMet-pegRNA-2xMS2片段(如序列表中序列5所示)的两个BsaI酶切位点间的DNA片段替换pG3H-840MR-35C的两个BsaI酶切位点间的DNA小片段,将得到的序列正确的重组载体命名为p1879-23b
(4)将pegRNA-MS2-f6-HDV-tMet-pegRNA-MS2-f6片段(如序列表中序列6所示)的两个BsaI酶切位点间的DNA片段替换pG3H-840MR-35C的两个BsaI酶切位点间的DNA小片段,将得到的序列正确的重组载体命名为p1879-2f3b
13、构建关于I1879V位点含有MCP2蛋白的不同pegRNA先导编辑载体,将上述步骤12中的pG3H-840MR-35C替换为pG3H-840MR-35C.2,其他步骤均不变,将由序列表中序列3、4、5、6所示的DNA片段得到的重组载体分别命名为p1879-23a.2p1879-2f3a.2p1879- 23b.2p1879-2f3b.2
14、构建关于S627I位点含有MCP蛋白的不同pegRNA先导编辑载体,将上述步骤12中的序列3、4、5、6分别替换为序列8、9、10、11,其他步骤均不变,将由序列8、9、10、11所示的DNA片段得到的重组载体分别命名为p627a-23ap627a-2f3ap627a-23bp627a-2f3b
15、构建关于S627I位点含有MCP2蛋白的不同pegRNA先导编辑载体,将上述步骤12中的pG3H-840MR-35C替换为pG3H-840MR-35C.2,并序列3、4、5、6分别替换为序列8、9、10、11,其他步骤均不变,将由序列8、9、10、11所示的DNA片段得到的重组载体分别命名为p627a-23a.2p627a-2f3a.2p627a-23b.2p627a-2f3b.2
图1为包含载体T-DNA的物理图谱。其中,MCP基因为密码子优化的MS2结合蛋白MCP或MCP2基因,OCSt为根癌农杆菌T-ocs终止子。
图2为基于MS2策略的先导编辑系统示意图。图3为不同pegRNA结构图。图4为序列3-序列7的结构示意图。
实施例3、水稻原生质体转化及先导编辑效率分析
1、利用威格拉斯试剂盒大提p1879-CK、p1879-23a、p1879-2f3a等载体,将上述载体进行3次独立的水稻原生质体转化实验,所用原生质体来源于日本晴。
2、分析基因OsACC的突变情况,以I1879V-IDF/I1879V-IDR为引物,以转化后的水稻原生质体基因组为模板PCR扩增包含靶点的片段,以I1879V-IDF为检测引物进行Sanger测序,检测突变情况,部分结果如图5所示。
3、为更具体的分析基因OsACC的I1879V和OsALS的S627I突变情况,分别以I1879V-F/I1879V-R和S627I-F/S627I-R为引物,以转化后的水稻原生质体基因组为模板PCR扩增包含靶点的片段,对该片段进行高通量测序,分析突变情况。
4、如表2所示,转化对照载体p1879-CK的原生质体平均精确突变效率为7.1%;原生质体中转化包含peg2.3b,peg2f.3b结构的载体精确突变效率分别为30.0%、26.8%、26.6%、25.2%,编辑效率约为对照载体的3~4倍,说明利用MS2-MS2和MS2-f6招募MCP-RT模块,能够有效提高DNA先导编辑系统的编辑效率。但包含peg2.3a,peg2f.3a结构的p1879-23a、p1879-2f3a等载体转化的原生质体并未检测到高于对照的突变,说明pegRNA2.3a,pegRNA2f.3a结构可能影响了pegRNA的表达,进而影响了编辑效率,也进一步说明,当MS2/f6在pegRNA的3’端时,具有较高的编辑效率。
其中,OsACC的I1879V精确突变是指编码OsACC蛋白第1879位异亮氨酸的密码子由“ATA”突变为缬氨酸的密码子“GTA”。
另外,表2中包含的MCP蛋白载体的编辑效率和MCP2蛋白载体的编辑效率无显著性差异,说明在该系统中MS2/f6对MCP蛋白和MCP2蛋白招募作用相当。
5、关于S627I位点,与上述I1879V位点进行同样的原生质体转化及测序实验,如表3所示,转化对照载体p627a-CK的原生质体平均精确突变效率为6.19%,包含peg2.3b,peg2f.3b结构的载体精确突变效率分别为13.57%、8.48%、7.42%、8.53%,编辑效率约为对照载体的1~2倍,同样的,说明利用MS2-MS2和MS2-f6招募MCP-RT模块,能够有效提高DNA先导编辑系统的编辑效率,且该系统中MS2-MS2和MS2-f6对MCP蛋白和MCP2蛋白招募作用相当。
其中,OsALS的S627I精确突变是指编码OsALS蛋白第627位丝氨酸的密码子由“AGT”突变为异亮氨酸的密码子“ATT”。
表2高通量方法分析原生质体中OsACC-I1879V位点的精准突变效率
Figure BDA0003168646830000071
Figure BDA0003168646830000081
注:平均值为3次独立转化实验数据的平均数(n=1,2,3)
表3高通量方法分析原生质体中OsALS-S627I位点的精准编辑效率
Figure BDA0003168646830000082
注:平均值为3次独立转化实验数据的平均数(n=1,2,3)
实施例4、水稻稳定转化及先导编辑效率分析
1、将实施例2得到的不同载体p1879-CK、p1879-23a、p1879-2f3a、p1879-23b、p1879-2f3b分别导入含有辅助载体pVS1-VIR2的工程农杆菌LBA4404(Zhang,Zhang etal.2019,A Novel Ternary Vector System United with Morphogenic Genes EnhancesCRISPR/Cas Delivery in Maize)中,获得三元载体系统的菌株,利用这些菌株分别对水稻(中花11)的愈伤组织细胞进行转化。
2、分析基因OsACC-I1879V位点的突变情况,以I1879V-IDF/I1879V-IDR为引物,以水稻转基因株系的DNA为模板PCR扩增包含靶点的片段,以I1879V-IDF为检测引物进行Sanger测序,检测突变情况。
4、如表4所示,对照载体p1879-CK的稳定转化精确编辑(编码OsACC蛋白第1879位异亮氨酸的密码子由“ATA”突变为缬氨酸的密码子“GTA”)效率为2.9%;载体p1879-23b/2f3b的编辑效率分别为35.0%,53.1%,说明利用MS2-MS2和MS2-f6招募MCP-RT模块,能够有效提高DNA先导编辑系统的编辑效率,但载体p1879-23a/2f3a的编辑效率分别为0%,3.1%,编辑效率和对照载体相当或降低,说明pegRNA2.3a,pegRNA2f.3a结构可能影响了pegRNA的表达,进而影响了编辑效率,也进一步说明,当MS2-MS2和MS2-f6在pegRNA的3’端时,具有较高的编辑效率。
表4 Sanger测序分析转基因株系中I1879V位点的编辑效率
pegRNA 载体 T0代苗数 精确编辑苗数 编辑效率(%)
对照 p1879-CK 34 1 2.9%
peg2.3a p1879-23a 33 0 0%
peg2f.3a p1879-2f3a 32 1 3.1%
peg2.3b p1879-23b 40 14 35.0%
peg2f.3b p1879-2f3b 32 17 53.1%
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
<110> 中国农业大学
<120> 一种新型基因编辑系统及相关载体和方法
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 67
<212> RNA
<213> 人工序列(Artificial sequence)
<400> 1
gggagcacau gaggaucacc caugugccac gagcgacaug aggaucaccc augucgcucg 60
uguuccc 67
<210> 2
<211> 56
<212> RNA
<213> 人工序列(Artificial sequence)
<400> 2
gggagcacau gaggaucacc caugugcgac ucccacaguc acuggggagu cuuccc 56
<210> 3
<211> 592
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 3
ttggtctcat gcacaaggaa gatggacttg gtggtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgcg 120
ggagcacatg aggatcaccc atgtgccacg agcgacatga ggatcaccca tgtcgctcgt 180
gttcccactt ccatgtacat tgtcgacacc aagtccatct tcggccggca tggtcccagc 240
ctcctcgctg gcgccggctg ggcaacatgc ttcggcatgg cgaatgggac aacaacaaat 300
cagagtggcg cagcggaagc gtggtgggcc cataacccac aggtcccagg atcgaaacct 360
ggctctgata caaggaagat ggacttggtg gtttaagagc tatgctggaa acagcatagc 420
aagtttaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggga 480
gcacatgagg atcacccatg tgccacgagc gacatgagga tcacccatgt cgctcgtgtt 540
cccacttcca tgtacattgt cgacaccaag tccatcttcg gccagagacc aa 592
<210> 4
<211> 570
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 4
ttggtctcat gcacaaggaa gatggacttg gtggtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgcg 120
ggagcacatg aggatcaccc atgtgcgact cccacagtca ctggggagtc ttcccacttc 180
catgtacatt gtcgacacca agtccatctt cggccggcat ggtcccagcc tcctcgctgg 240
cgccggctgg gcaacatgct tcggcatggc gaatgggaca acaacaaatc agagtggcgc 300
agcggaagcg tggtgggccc ataacccaca ggtcccagga tcgaaacctg gctctgatac 360
aaggaagatg gacttggtgg tttaagagct atgctggaaa cagcatagca agtttaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcgggag cacatgagga 480
tcacccatgt gcgactccca cagtcactgg ggagtcttcc cacttccatg tacattgtcg 540
acaccaagtc catcttcggc cagagaccaa 570
<210> 5
<211> 592
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 5
ttggtctcat gcacaaggaa gatggacttg gtggtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgca 120
cttccatgta cattgtcgac accaagtcca tcttcgggag cacatgagga tcacccatgt 180
gccacgagcg acatgaggat cacccatgtc gctcgtgttc ccggccggca tggtcccagc 240
ctcctcgctg gcgccggctg ggcaacatgc ttcggcatgg cgaatgggac aacaacaaat 300
cagagtggcg cagcggaagc gtggtgggcc cataacccac aggtcccagg atcgaaacct 360
ggctctgata caaggaagat ggacttggtg gtttaagagc tatgctggaa acagcatagc 420
aagtttaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactt 480
ccatgtacat tgtcgacacc aagtccatct tcgggagcac atgaggatca cccatgtgcc 540
acgagcgaca tgaggatcac ccatgtcgct cgtgttcccg gccagagacc aa 592
<210> 6
<211> 570
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 6
ttggtctcat gcacaaggaa gatggacttg gtggtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgca 120
cttccatgta cattgtcgac accaagtcca tcttcgggag cacatgagga tcacccatgt 180
gcgactccca cagtcactgg ggagtcttcc cggccggcat ggtcccagcc tcctcgctgg 240
cgccggctgg gcaacatgct tcggcatggc gaatgggaca acaacaaatc agagtggcgc 300
agcggaagcg tggtgggccc ataacccaca ggtcccagga tcgaaacctg gctctgatac 360
aaggaagatg gacttggtgg tttaagagct atgctggaaa cagcatagca agtttaaata 420
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcacttc catgtacatt 480
gtcgacacca agtccatctt cgggagcaca tgaggatcac ccatgtgcga ctcccacagt 540
cactggggag tcttcccggc cagagaccaa 570
<210> 7
<211> 458
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 7
ttggtctcat gcacaaggaa gatggacttg gtggtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgca 120
cttccatgta cattgtcgac accaagtcca tcttcggccg gcatggtccc agcctcctcg 180
ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gacaacaaca aatcagagtg 240
gcgcagcgga agcgtggtgg gcccataacc cacaggtccc aggatcgaaa cctggctctg 300
atacaaggaa gatggacttg gtggtttaag agctatgctg gaaacagcat agcaagttta 360
aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgca cttccatgta 420
cattgtcgac accaagtcca tcttcggcca gagaccaa 458
<210> 8
<211> 578
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 8
ttggtctcat gcaccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgcg 120
ggagcacatg aggatcaccc atgtgccacg agcgacatga ggatcaccca tgtcgctcgt 180
gttccctgcc tatgatacca attgggggcg cattcggccg gcatggtccc agcctcctcg 240
ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gacaacaaca aatcagagtg 300
gcgcagcgga agcgtggtgg gcccataacc cacaggtccc aggatcgaaa cctggctctg 360
ataccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat agcaagttta 420
aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgcg ggagcacatg 480
aggatcaccc atgtgccacg agcgacatga ggatcaccca tgtcgctcgt gttccctgcc 540
tatgatacca attgggggcg cattcggcca gagaccaa 578
<210> 9
<211> 556
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 9
ttggtctcat gcaccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgcg 120
ggagcacatg aggatcaccc atgtgcgact cccacagtca ctggggagtc ttccctgcct 180
atgataccaa ttgggggcgc attcggccgg catggtccca gcctcctcgc tggcgccggc 240
tgggcaacat gcttcggcat ggcgaatggg acaacaacaa atcagagtgg cgcagcggaa 300
gcgtggtggg cccataaccc acaggtccca ggatcgaaac ctggctctga taccttgaat 360
gcgcccccac ttgtttaaga gctatgctgg aaacagcata gcaagtttaa ataaggctag 420
tccgttatca acttgaaaaa gtggcaccga gtcggtgcgg gagcacatga ggatcaccca 480
tgtgcgactc ccacagtcac tggggagtct tccctgccta tgataccaat tgggggcgca 540
ttcggccaga gaccaa 556
<210> 10
<211> 578
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 10
ttggtctcat gcaccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
gcctatgata ccaattgggg gcgcattcgg gagcacatga ggatcaccca tgtgccacga 180
gcgacatgag gatcacccat gtcgctcgtg ttcccggccg gcatggtccc agcctcctcg 240
ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gacaacaaca aatcagagtg 300
gcgcagcgga agcgtggtgg gcccataacc cacaggtccc aggatcgaaa cctggctctg 360
ataccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat agcaagttta 420
aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct gcctatgata 480
ccaattgggg gcgcattcgg gagcacatga ggatcaccca tgtgccacga gcgacatgag 540
gatcacccat gtcgctcgtg ttcccggcca gagaccaa 578
<210> 11
<211> 556
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 11
ttggtctcat gcaccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
gcctatgata ccaattgggg gcgcattcgg gagcacatga ggatcaccca tgtgcgactc 180
ccacagtcac tggggagtct tcccggccgg catggtccca gcctcctcgc tggcgccggc 240
tgggcaacat gcttcggcat ggcgaatggg acaacaacaa atcagagtgg cgcagcggaa 300
gcgtggtggg cccataaccc acaggtccca ggatcgaaac ctggctctga taccttgaat 360
gcgcccccac ttgtttaaga gctatgctgg aaacagcata gcaagtttaa ataaggctag 420
tccgttatca acttgaaaaa gtggcaccga gtcggtgctg cctatgatac caattggggg 480
cgcattcggg agcacatgag gatcacccat gtgcgactcc cacagtcact ggggagtctt 540
cccggccaga gaccaa 556
<210> 12
<211> 444
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 12
ttggtctcat gcaccttgaa tgcgccccca cttgtttaag agctatgctg gaaacagcat 60
agcaagttta aataaggcta gtccgttatc aacttgaaaa agtggcaccg agtcggtgct 120
gcctatgata ccaattgggg gcgcattcgg ccggcatggt cccagcctcc tcgctggcgc 180
cggctgggca acatgcttcg gcatggcgaa tgggacaaca acaaatcaga gtggcgcagc 240
ggaagcgtgg tgggcccata acccacaggt cccaggatcg aaacctggct ctgatacctt 300
gaatgcgccc ccacttgttt aagagctatg ctggaaacag catagcaagt ttaaataagg 360
ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctgcctatg ataccaattg 420
ggggcgcatt cggccagaga ccaa 444
<210> 13
<211> 606
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 13
ccatggtcta gatggcgtcc aacttcaccc agttcgtgct ggtcgacaac ggcggcacgg 60
gcgacgtgac cgtcgctcca agcaacttcg ctaacggcgt ggccgagtgg atctccagca 120
actccaggag tcaggcgtac aaggtgacgt gctcagtcag gcagtccagc gctcagaagc 180
gcaagtacac catcaaggtc gaggtcccga aggtggccac gcagaccgtg ggcggcgtcg 240
agctgccagt cgctgcgtgg cgctcatacc tcaacatgga gctgacgatc ccgatcttcg 300
cgaccaacag cgactgcgag ctgatcgtga aggccatgca gggcctcctg aaggacggca 360
acccaatccc aagcgctatc gctgcgaact ccggcatcta ctcaggcggc tcatcgggcg 420
ggtcaagcgg gtcggagaca ccgggcacat cagagagcgc tacccctgag tcatcaggcg 480
gctcttcagg cggcagctca accctgaaca ttgaggacga gtaccggctg cacgagacga 540
gcaaggagcc agacgtttcg ctcggcagca cttggctctc tgacttccca caggcttggt 600
gagctc 606
<210> 14
<211> 17653
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 14
gtttacccgc caatatatcc tgtcaaacac tgatagttta aactgaaggc gggaaacgac 60
aatctgatcc aagctcaagc tgctctagca ttcgccattc aggctgcgca actgttggga 120
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 180
aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc 240
cagtgccaag cttatggagt caaagattca aatagaggac ctaacagaac tcgccgtaaa 300
gactggcgaa cagttcatac agagtctctt acgactcaat gacaagaaga aaatcttcgt 360
caacatggtg gagcacgaca cacttgtcta ctccaaaaat atcaaagata cagtctcaga 420
agaccaaagg gcaattgaga cttttcaaca aagggtaata tccggaaacc tcctcggatt 480
ccattgccca gctatctgtc actttattgt gaagatagtg gaaaaggaag gtggctccta 540
caaatgccat cattgcgata aaggaaaggc catcgttgaa gatgcctctg ccgacagtgg 600
tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg ttccaaccac 660
gtcttcaaag caagtggatt gatgtgattg gcagacatac tgtcccacaa atgaagatgg 720
aatctgtaaa agaaaacgcg tgaaataatg cgtctgacaa aggttaggtc ggctgccttt 780
aatcaatacc aaagtggtcc ctaccacgat ggaaaaactg tgcagtcggt ttggcttttt 840
ctgacgaaca aataagattc gtggccgaca ggtgggggtc caccatgtga aggcatcttc 900
agactccaat aatggagcaa tgacgtaagg gcttacgaaa taagtaaggg tagtttggga 960
aatgtccact cacccgtcag tctataaata cttagcccct ccctcattgt taagggagca 1020
aaatctcaga gagatagtcc tagagagaga aagagagcaa gtagcctaga agtagtcaag 1080
gcggcgaagt attcaggcac gtggccagga agaagaaaag ccaagacgac gaaaacaggt 1140
aagagctaag catctagata agttgaaaac aatcttcaaa agtcccacat cgcttagata 1200
agaaaacgaa gctgagttta tatacagcta gagtcgaagt agtgattgaa caaagcacca 1260
gtggtctagt ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg 1320
gtgcatgaga ccttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1380
attcaaatat gtatccgctc atgggacaat aaccctgata aatgcttcaa taatattgaa 1440
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1500
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1560
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1620
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1680
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1740
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1800
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1860
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1920
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1980
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 2040
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 2100
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 2160
agcgtggctc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 2220
tagttatcta caccacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 2280
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 2340
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2400
ataatcccat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcaggtctca 2460
ggccggcatg gtcccagcct cctcgctggc gccggctggg caacatgctt cggcatggcg 2520
aatgggactt ttttttgata tctccggggc taattgaata tgaagatgaa gatgaaatat 2580
ttggtgtgtc aaataaaaag ctggtgtgct taagtttgtg tttttttctt ggcttgttgt 2640
gttatgaatt tgtggctttt tctaatatta aatgaatgta agatctcatt ataatgaata 2700
aacaaatgtt tctataatcc attgtgaatg ttttgttgga tctcttctgc agcatataac 2760
tactgtatgt gctatggtat ggactatgga atatgattaa agataagaat tactagtgca 2820
gcgtgacccg gtcgtgcccc tcactagaga taatgagcat tgcatgtcta agttataaaa 2880
aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta tctttataca 2940
tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa tatcagtgtt 3000
ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga gtattttgac 3060
aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt ttttgcaaat 3120
agcttcacct atataatact tcatccattt tattagtaca tccatttagg gtttagggtt 3180
aatggttttt atagactaat ttttttagta catctatttt attctatttt agcctctaaa 3240
ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata taaaatagaa 3300
taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa aactaaggaa 3360
acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga cgagtctaac 3420
ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga cggcacggca 3480
tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg acttgctccg 3540
ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac ggcaggcggc 3600
ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc gctccttcgc 3660
tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct ttccccaacc 3720
tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca cccgtcggca 3780
cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cctctctacc ttctctagat 3840
cggcgttccg gtccatgctt agggcccggt agttctactt ctgttcatgt ttgtgttaga 3900
tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca cggatgcgac ctgtacgtca 3960
gacacgttct gattgctaac ttgccagtgt ttctctttgg ggaatcctgg gatggctcta 4020
gccgttccgc agacgggatc gatttcatga ttttttttgt ttcgttgcat agggtttggt 4080
ttgccctttt cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc atcttttcat 4140
gctttttttt gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc tagatcggag 4200
tacaattctg tttcaaacta cctggtggat ttattaattt tggatctgta tgtgtgtgcc 4260
atacatattc atagttacga attgaagatg atggatggaa atatcgatct aggataggta 4320
tacatgttga tgcgggtttt actgatgcat atacagagat gctttttgtt cgcttggttg 4380
tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta gatcggagta gaatactgtt 4440
tcaaactacc tggtgtattt attaattttg gaactgtatg tgtgtgtcat acatcttcat 4500
agttacgagt ttaagatgga tggaaatatc gatctaggat aggtatacat gttgatgtgg 4560
gttttactga tgcatataca tgatggcata tgcagcatct attcatatgc tctaaccttg 4620
agtacctatc tattataata aacaagtatg ttttataatt attttgatct tgatatactt 4680
ggatgatggc atatgcagca gctatatgtg gattttttta gccctgcctt catacgctat 4740
ttatttgctt ggtactgttt cttttgtcga tgctcaccct gttgtttggt gttacttctg 4800
caggtaccta ggcctctaga tggattacaa ggaccacgac ggggattaca aggaccacga 4860
cattgattac aaggatgatg atgacaagat ggctccgaag aagaagagga aggttggcat 4920
ccacggggtg ccagctgctg acaagaagta ctcgatcggc ctcgatattg ggactaactc 4980
tgttggctgg gccgtgatca ccgacgagta caaggtgccc tcaaagaagt tcaaggtcct 5040
gggcaacacc gatcggcatt ccatcaagaa gaatctcatt ggcgctctcc tgttcgacag 5100
cggcgagacg gctgaggcta cgcggctcaa gcgcaccgcc cgcaggcggt acacgcgcag 5160
gaagaatcgc atctgctacc tgcaggagat tttctccaac gagatggcga aggttgacga 5220
ttctttcttc cacaggctgg aggagtcatt cctcgtggag gaggataaga agcacgagcg 5280
gcatccaatc ttcggcaaca ttgtcgacga ggttgcctac cacgagaagt accctacgat 5340
ctaccatctg cggaagaagc tcgtggactc cacagataag gcggacctcc gcctgatcta 5400
cctcgctctg gcccacatga ttaagttcag gggccatttc ctgatcgagg gggatctcaa 5460
cccggacaat agcgatgttg acaagctgtt catccagctc gtgcagacgt acaaccagct 5520
cttcgaggag aaccccatta atgcgtcagg cgtcgacgcg aaggctatcc tgtccgctag 5580
gctctcgaag tctcggcgcc tcgagaacct gatcgcccag ctgccgggcg agaagaagaa 5640
cggcctgttc gggaatctca ttgcgctcag cctggggctc acgcccaact tcaagtcgaa 5700
tttcgatctc gctgaggacg ccaagctgca gctctccaag gacacatacg acgatgacct 5760
ggataacctc ctggcccaga tcggcgatca gtacgcggac ctgttcctcg ctgccaagaa 5820
tctgtcggac gccatcctcc tgtctgatat tctcagggtg aacaccgaga ttacgaaggc 5880
tccgctctca gcctccatga tcaagcgcta cgacgagcac catcaggatc tgaccctcct 5940
gaaggcgctg gtcaggcagc agctccccga gaagtacaag gagatcttct tcgatcagtc 6000
gaagaacggc tacgctgggt acattgacgg cggggcctct caggaggagt tctacaagtt 6060
catcaagccg attctggaga agatggacgg cacggaggag ctgctggtga agctcaatcg 6120
cgaggacctc ctgaggaagc agcggacatt cgataacggc agcatcccac accagattca 6180
tctcggggag ctgcacgcta tcctgaggag gcaggaggac ttctaccctt tcctcaagga 6240
taaccgcgag aagatcgaga agattctgac tttcaggatc ccgtactacg tcggcccact 6300
cgctaggggc aactcccgct tcgcttggat gacccgcaag tcagaggaga cgatcacgcc 6360
gtggaacttc gaggaggtgg tcgacaaggg cgctagcgct cagtcgttca tcgagaggat 6420
gacgaatttc gacaagaacc tgccaaatga gaaggtgctc cctaagcact cgctcctgta 6480
cgagtacttc acagtctaca acgagctgac taaggtgaag tatgtgaccg agggcatgag 6540
gaagccggct ttcctgtctg gggagcagaa gaaggccatc gtggacctcc tgttcaagac 6600
caaccggaag gtcacggtta agcagctcaa ggaggactac ttcaagaaga ttgagtgctt 6660
cgattcggtc gagatctctg gcgttgagga ccgcttcaac gcctccctgg ggacctacca 6720
cgatctcctg aagatcatta aggataagga cttcctggac aacgaggaga atgaggatat 6780
cctcgaggac attgtgctga cactcactct gttcgaggac cgggagatga tcgaggagcg 6840
cctgaagact tacgcccatc tcttcgatga caaggtcatg aagcagctca agaggaggag 6900
gtacaccggc tgggggaggc tgagcaggaa gctcatcaac ggcattcggg acaagcagtc 6960
cgggaagacg atcctcgact tcctgaagag cgatggcttc gcgaaccgca atttcatgca 7020
gctgattcac gatgacagcc tcacattcaa ggaggatatc cagaaggctc aggtgagcgg 7080
ccagggggac tcgctgcacg agcatatcgc gaacctcgct ggctcgccag ctatcaagaa 7140
ggggattctg cagaccgtga aggttgtgga cgagctggtg aaggtcatgg gcaggcacaa 7200
gcctgagaac atcgtcattg agatggcccg ggagaatcag accacgcaga agggccagaa 7260
gaactcacgc gagaggatga agaggatcga ggagggcatt aaggagctgg ggtcccagat 7320
cctcaaggag cacccggtgg agaacacgca gctgcagaat gagaagctct acctgtacta 7380
cctccagaat ggccgcgata tgtatgtgga ccaggagctg gatattaaca ggctcagcga 7440
ttacgacgtc gatgccatcg ttccacagtc attcctgaag gatgactcca ttgacaacaa 7500
ggtcctcacc aggtcggaca agaaccgggg caagtctgat aatgttcctt cagaggaggt 7560
cgttaagaag atgaagaact actggcgcca gctcctgaat gccaagctga tcacgcagcg 7620
gaagttcgat aacctcacaa aggctgagag gggcgggctc tctgagctgg acaaggcggg 7680
cttcatcaag aggcagctgg tcgagacacg gcagatcact aagcacgttg cgcagattct 7740
cgactcacgg atgaacacta agtacgatga gaatgacaag ctgatccgcg aggtgaaggt 7800
catcaccctg aagtcaaagc tcgtctccga cttcaggaag gatttccagt tctacaaggt 7860
tcgggagatc aacaattacc accatgccca tgacgcgtac ctgaacgcgg tggtcggcac 7920
agctctgatc aagaagtacc caaagctcga gagcgagttc gtgtacgggg actacaaggt 7980
ttacgatgtg aggaagatga tcgccaagtc ggagcaggag attggcaagg ctaccgccaa 8040
gtacttcttc tactctaaca ttatgaattt cttcaagaca gagatcactc tggccaatgg 8100
cgagatccgg aagcgccccc tcatcgagac gaacggcgag acgggggaga tcgtgtggga 8160
caagggcagg gatttcgcga ccgtcaggaa ggttctctcc atgccacaag tgaatatcgt 8220
caagaagaca gaggtccaga ctggcgggtt ctctaaggag tcaattctgc ctaagcggaa 8280
cagcgacaag ctcatcgccc gcaagaagga ctgggatccg aagaagtacg gcgggttcga 8340
cagccccact gtggcctact cggtcctggt tgtggcgaag gttgagaagg gcaagtccaa 8400
gaagctcaag agcgtgaagg agctgctggg gatcacgatt atggagcgct ccagcttcga 8460
gaagaacccg atcgatttcc tggaggcgaa gggctacaag gaggtgaaga aggacctgat 8520
cattaagctc cccaagtact cactcttcga gctggagaac ggcaggaagc ggatgctggc 8580
ttccgctggc gagctgcaga aggggaacga gctggctctg ccgtccaagt atgtgaactt 8640
cctctacctg gcctcccact acgagaagct caagggcagc cccgaggaca acgagcagaa 8700
gcagctgttc gtcgagcagc acaagcatta cctcgacgag atcattgagc agatttccga 8760
gttctccaag cgcgtgatcc tggccgacgc gaatctggat aaggtcctct ccgcgtacaa 8820
caagcaccgc gacaagccaa tcagggagca ggctgagaat atcattcatc tcttcaccct 8880
gacgaacctc ggcgcccctg ctgctttcaa gtacttcgac acaactatcg atcgcaagag 8940
gtacacaagc actaaggagg tcctggacgc gaccctcatc caccagtcga ttaccggcct 9000
ctacgagacg cgcatcgacc tgtctcagct cgggggcgac aagcggccag cggcgacgaa 9060
gaaggcgggg caggcgaaga agaagaagtg agctcagagc tttcgttcgt atcatcggtt 9120
tcgacaacgt tcgtcaagtt caatgcatca gtttcattgc gcacacacca gaatcctact 9180
gagtttgagt attatggcat tgggaaaact gtttttcttg taccatttgt tgtgcttgta 9240
atttactgtg ttttttattc ggttttcgct atcgaactgt gaaatggaaa tggatggaga 9300
agagttaatg aatgatatgg tccttttgtt cattctcaaa ttaatattat ttgttttttc 9360
tcttatttgt tgtgtgttga atttgaaatt ataagagata tgcaaacatt ttgttttgag 9420
taaaaatgtg tcaaatcgtg gcctctaatg accgaagtta atatgaggag taaaacactt 9480
gtagttgtac cattatgctt attcactagg caacaaatat attttcagac ctagaaaagc 9540
tgcaaatgtt actgaataca agtatgtcct cttgtgtttt agacatttat gaactttcct 9600
ttatgtaatt ttccagaatc cttgtcagat tctaatcatt gctttataat tatagttata 9660
ctcatggatt tgtagttgag tatgaaaata ttttttaatg cattttatga cttgccaatt 9720
gattgacaac gaattcgcta ccttaggacc gttatagtta cgttaattaa gaattatcga 9780
accactttgt acaagaaagc tgggtctagc tggcgcgcca tagggataac agggtaataa 9840
gcttgctagt gcagcgtgac ccggtcgtgc ccctcactag agataatgag cattgcatgt 9900
ctaagttata aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat 9960
ctatctttat acatatattt aaactttact ctacgaataa tataatctat agtactacaa 10020
taatatcagt gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat 10080
tgagtatttt gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt 10140
tttttttgca aatagcttca cctatataat acttcatcca ttttattagt acatccattt 10200
agggtttagg gttaatggtt tttatagact aattttttta gtacatctat tttattctat 10260
tttagcctct aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag 10320
atataaaata gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa 10380
aaaaactaag gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt 10440
cgacgagtct aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc 10500
agacggcacg gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt 10560
tggacttgct ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg 10620
cacggcaggc ggcctcctcc tcctctcacg gcaccggcag ctacggggga ttcctttccc 10680
accgctcctt cgctttccct tcctcgcccg ccgtaataaa tagacacccc ctccacaccc 10740
tctttcccca acctcgtgtt gttcggagcg cacacacaca caaccagatc tcccccaaat 10800
ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc ccccctctct 10860
accttctcta gatcggcgtt ccggtccatg cttagggccc ggtagttcta cttctgttca 10920
tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc 10980
gacctgtacg tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc 11040
tgggatggct ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg 11100
catagggttt ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg 11160
gtcatctttt catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg 11220
ttctagatcg gagtacaatt ctgtttcaaa ctacctggtg gatttattaa ttttggatct 11280
gtatgtgtgt gccatacata ttcatagtta cgaattgaag atgatggatg gaaatatcga 11340
tctaggatag gtatacatgt tgatgcgggt tttactgatg catatacaga gatgcttttt 11400
gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga 11460
gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt atgtgtgtgt 11520
catacatctt catagttacg agtttaagat ggatggaaat atcgatctag gataggtata 11580
catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca tctattcata 11640
tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata attattttga 11700
tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt ttagccctgc 11760
cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac cctgttgttt 11820
ggtgttactt ctgcaggtac ctaggcctct agatgcctaa gaagaagagg aaggtgggct 11880
caatggcgtc caacttcacc cagttcgtgc tggtcgacaa cggcggcacg ggcgacgtga 11940
ccgtcgctcc aagcaacttc gctaacggca tcgccgagtg gatctccagc aactccagga 12000
gtcaggcgta caaggtgacg tgctcagtca ggcagtccag cgctcagaac cgcaagtaca 12060
ccatcaaggt cgaggtcccg aagggtgcgt ggcgctcata cctcaacatg gagctgacga 12120
tcccgatctt cgcgaccaac agcgactgcg agctgatcgt gaaggccatg cagggcctcc 12180
tgaaggacgg caacccaatc ccaagcgcta tcgctgcgaa ctccggcatc tactcaggcg 12240
gctcatcggg cgggtcaagc gggtcggaga caccgggcac atcagagagc gctacccctg 12300
agtcatcagg cggctcttca ggcggcagct caaccctgaa cattgaggac gagtaccggc 12360
tgcacgagac gagcaaggag ccagacgttt cgctcggcag cacttggctc tctgacttcc 12420
cacaggcttg ggccgagact ggcggcatgg gcctggccgt gcgccaggct ccactgatca 12480
tccctctgaa ggcgacctcc accccggttt ctattaagca gtacccgatg agccaggagg 12540
ccaggctggg gatcaagcca cacattcagc ggctgctgga ccagggcatc ctggtgccat 12600
gccagtcccc gtggaatact ccgctcctgc cggtgaagaa gcctgggaca aacgactaca 12660
ggccggttca ggatctcagg gaggtgaaca agcgcgtgga ggacatccat ccgacagtgc 12720
cgaacccgta caatctgctg tcgggcctgc ctccgagcca ccagtggtac accgtcctgg 12780
acctcaagga cgctttcttc tgcctgcggc tgcacccgac gtctcagccg ctgttcgcgt 12840
tcgagtggcg cgacccagag atgggcattt ccggccagct gacctggaca cgcctacccc 12900
agggcttcaa gaactccccg actctcttca acgaggctct ccaccgggat ctcgcggact 12960
tcaggattca gcatcccgat ctgatcctgc tccagtatgt tgacgacctc ctcctggccg 13020
cgacgtcgga gctggactgc cagcagggca cccgggcgct gctgcagaca ctgggcaatc 13080
tggggtaccg cgcctctgcg aagaaggcgc agatctgcca gaagcaagtg aagtacctgg 13140
gctacctcct gaaggagggc cagcgctggc tcactgaggc gaggaaggag actgttatgg 13200
gccagcccac tccaaagact ccgaggcagc tcagggagtt cctcggcaag gctgggttct 13260
gccgcctgtt catccctggg ttcgctgaga tggctgcgcc gctctacccg ctgactaagc 13320
cggggacact gttcaactgg gggccagacc agcagaaggc gtaccaggag attaagcagg 13380
cgctgctgac ggccccagcg ctcggcctac cagacctgac gaagccgttc gagctgttcg 13440
ttgacgagaa gcaggggtac gcgaagggcg tgctgacaca gaagctgggg ccttggcgcc 13500
gcccggtcgc gtacctgtcg aagaagctgg acccagtcgc tgctgggtgg cctccatgcc 13560
tccggatggt cgctgctatt gcggttctga ccaaggatgc ggggaagctc acaatggggc 13620
agcctctcgt gatcctggct ccacatgcgg tggaggcgct ggtgaagcag ccaccggacc 13680
ggtggctgtc gaacgctcgg atgacacact accaggcgct cctcctcgat acagaccggg 13740
ttcagttcgg gcctgtggtt gctctgaacc cagccacact gctgccactc cctgaggagg 13800
gcctccagca caattgcctc gacatcctgg ctgaggcgca cggcacccgc cctgatctca 13860
ccgaccagcc tctgccagat gctgaccaca cctggtacac ggatgggtcc tcgctgctgc 13920
aggagggcca gaggaaggcg ggcgccgccg tcaccacaga gacagaggtt atttgggcca 13980
aggccctacc ggctggcacc agcgcccagc gcgctgagct gatcgcgctg actcaggcgc 14040
tgaagatggc cgaggggaag aagctcaatg tttacaccga ctcgcggtac gcgttcgcta 14100
cagctcacat tcatggggag atctaccgcc ggcgcgggtg gctgacttcg gagggcaagg 14160
agattaagaa taaggacgag atcctggccc tgctcaaggc gctgttcctg ccgaagcgcc 14220
tctcaatcat tcactgcccg ggccaccaga agggccattc ggccgaggct aggggcaatc 14280
ggatggctga ccaggcggcg cggaaggcgg ctatcaccga gactcccgat acatctaccc 14340
tcctgatcga gaactcgagc ccaagcggcg ggagcaagcg gactgcggat gggtctgagt 14400
tcgagccaaa gaagaagagg aaggtgtgag ctccctagag tcctgcttta atgagatatg 14460
cgagacgcct atgatcgcat gatatttgct ttcaattctg ttgtgcacgt tgtaaaaaac 14520
ctgagcatgt gtagctcaga tccttaccgc cggtttcggt tcattctaat gaatatatca 14580
cccgttacta tcgtattttt atgaataata ttctccgttc aatttactga ttgtacccta 14640
ctacttatat gtacaatatt aaaatgaaaa caatatattg tgctgaatag gtttatagcg 14700
acatctatga tagagcgcca caataacaaa caattgcgtt ttattattac aaatccaatt 14760
ttaaaaaaag cggcagaacc ggtcaaacct aaaagactga ttacataaat cttattcaaa 14820
tttcaaaagt gccccagggg ctagtatcta cgacacaccg agcggcgaac taataacgct 14880
cactgaaggg aactccggtt ccccgccggc gcgcatgggt gagattcctt gaagttgagt 14940
attggccgtc cgctctaccg aaagttacgg gcaccattca acccggtcca gcacggcggc 15000
cgggtaaccg acttgctgcc ccgagaatta tgcagcattt ttttggtgta tgtgggcccc 15060
aaatgaagtg caggtcaaac cttgacagtg acgacaaatc gttgggcggg tccagggcga 15120
attttgcgac aacatgtcga ggctcagcag gacgaattcg taactataac ggtcctaagg 15180
tagcgaatta attaacatga ttacgccaag ctatcaactt tgtatagaaa agttgttaga 15240
attggcgcga attcgtaatc atgtcatagc tgtttcctgt gtgaaattgt tatccgctca 15300
caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag 15360
tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 15420
cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattggct 15480
agagcagctt gccaacatgg tggagcacga cactctcgtc tactccaaga atatcaaaga 15540
tacagtctca gaagaccaaa gggctattga gacttttcaa caaagggtaa tatcgggaaa 15600
cctcctcgga ttccattgcc cagctatctg tcacttcatc aaaaggacag tagaaaagga 15660
aggtggcacc tacaaatgcc atcattgcga taaaggaaag gctatcgttc aagatgcctc 15720
tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 15780
cgttccaacc acgtcttcaa agcaagtgga ttgatgtgaa catggtggag cacgacactc 15840
tcgtctactc caagaatatc aaagatacag tctcagaaga ccaaagggct attgagactt 15900
ttcaacaaag ggtaatatcg ggaaacctcc tcggattcca ttgcccagct atctgtcact 15960
tcatcaaaag gacagtagaa aaggaaggtg gcacctacaa atgccatcat tgcgataaag 16020
gaaaggctat cgttcaagat gcctctgccg acagtggtcc caaagatgga cccccaccca 16080
cgaggagcat cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa gtggattgat 16140
gtgatatctc cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt 16200
cctctatata aggaagttca tttcatttgg agaggacacg ctgaaatcac cagtctctct 16260
ctacaaatct atctctctcg agctttcgca gatccggggg gcaatgagat atgaaaaagc 16320
ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac agcgtctccg 16380
acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat gtaggagggc 16440
gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat cgttatgttt 16500
atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt ggggagttta 16560
gcgagagcct gacctattgc atctcccgcc gttcacaggg tgtcacgttg caagacctgc 16620
ctgaaaccga actgcccgct gttctacaac cggtcgcgga ggctatggat gcgatcgctg 16680
cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga atcggtcaat 16740
acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat cactggcaaa 16800
ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag ctgatgcttt 16860
gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc tccaacaatg 16920
tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg atgttcgggg 16980
attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct tgtatggagc 17040
agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgcca cgactccggg 17100
cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac ggcaatttcg 17160
atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga gccgggactg 17220
tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc tgtgtagaag 17280
tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag aaatagagta 17340
gatgccgacc gggatctgtc gatcgacaag ctcgagtttc tccataataa tgtgtgagta 17400
gttcccagat aagggaatta gggttcctat agggtttcgc tcatgtgttg agcatataag 17460
aaacccttag tatgtatttg tatttgtaaa atacttctat caataaaatt tctaattcct 17520
aaaaccaaaa tccagtacta aaatccagat cccccgaatt aattcggcgt taattcagta 17580
cattaaaaac gtccgcaatg tgttattaag ttgtctaagc gtcaatttgt ttacaccaca 17640
atatatcctg cca 17653

Claims (10)

1.一种DNA先导编辑系统,含有pegRNA,所述pegRNA为由sgRNA、逆转录模板、引物结合位点、源自噬菌体MS2的RNA茎环结构依次连接得到的RNA分子,所述RNA茎环结构的序列为如下a1)-a4)中的任一种:
a1)序列表中序列1;
a2)序列表中序列2;
a3)在a1)或a2)的5′端和/或3′端添加一个或几个核苷酸得到的RNA序列;
a4)与a1)或a2)或a3)的RNA序列具有70%以上的同一性的RNA序列。
2.根据权利要求1所述的系统,其特征在于:所述系统还含有MCP与逆转录酶形成的融合蛋白,所述MCP为可以特异性结合MS2茎环结构的衣壳蛋白。
3.根据权利要求2所述的系统,其特征在于:所述MCP为如下P1)、P2)、P3)或P4):
P1)序列14的第11853-12233位编码的蛋白质;
P2)序列13的第12-401位编码的蛋白质;
P3)将P1)或P2)的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
P4)在P1)或P2)或P3)的N端或/和C端连接标签得到的融合蛋白质。
4.根据权利要求1-3中任一所述的系统,其特征在于:所述DNA先导编辑系统还含有Cas9切口酶(H840A)。
5.一种载体,含有转录权利要求1中所述pegRNA的DNA分子。
6.根据权利要求5所述的载体,其特征在于:所述DNA分子为如下b1)-b4)中的任一种:
b1)由靶向待编辑DNA的DNA分子与序列5的第34-222位所示的DNA分子连接得到的DNA分子;
b2)由靶向待编辑DNA的DNA分子与序列6的第34-211位所示的DNA分子连接得到的DNA分子;
b3)在b1)或b2)的5′端和/或3′端添加一个或几个核苷酸得到的DNA分子;
b4)与b1)或b2)或b3)的DNA序列具有70%以上的同一性的DNA分子。
7.根据权利要求5或6所述的载体,其特征在于:所述载体还含有权利要求2中所述融合蛋白的编码基因的表达盒。
8.根据权利要求4-6中任一所述的载体,其特征在于:所述载体还含有权利要求4中所述Cas9切口酶(H840A)的编码基因的表达盒。
9.权利要求1-4中任一所述的系统或权利要求5-8中任一所述的载体在基因编辑中的应用;
或,一种基因编辑的方法,包括将权利要求5-8中任一所述的载体导入待编辑体中实现基因的编辑。
10.权利要求1-4中任一所述的系统或权利要求5-8中任一所述的载体或权利要求9所述的方法在植物育种中的应用。
CN202110812232.7A 2021-07-19 一种新型基因编辑系统及相关载体和方法 Active CN113549648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110812232.7A CN113549648B (zh) 2021-07-19 一种新型基因编辑系统及相关载体和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110812232.7A CN113549648B (zh) 2021-07-19 一种新型基因编辑系统及相关载体和方法

Publications (2)

Publication Number Publication Date
CN113549648A true CN113549648A (zh) 2021-10-26
CN113549648B CN113549648B (zh) 2024-06-21

Family

ID=

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023114992A1 (en) * 2021-12-17 2023-06-22 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment
WO2023141734A1 (zh) * 2022-01-25 2023-08-03 西北农林科技大学 一种改造后的先导编辑系统及其应用
WO2023096977A3 (en) * 2021-11-24 2023-08-03 Prime Medicine, Inc. Modified prime editing guide rnas
WO2023227050A1 (zh) * 2022-05-25 2023-11-30 中国科学院遗传与发育生物学研究所 一种在基因组中定点插入外源序列的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111850034A (zh) * 2020-06-24 2020-10-30 中国农业大学 一种基因编辑的载体和方法
WO2021072328A1 (en) * 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021072328A1 (en) * 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
CN111850034A (zh) * 2020-06-24 2020-10-30 中国农业大学 一种基因编辑的载体和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
秦瑞英: "Prime editing 引导植物基因组精确编辑新局面", 遗传HEREDITAS (BEIJING), pages 519 - 523 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023096977A3 (en) * 2021-11-24 2023-08-03 Prime Medicine, Inc. Modified prime editing guide rnas
WO2023114992A1 (en) * 2021-12-17 2023-06-22 Massachusetts Institute Of Technology Programmable insertion approaches via reverse transcriptase recruitment
WO2023141734A1 (zh) * 2022-01-25 2023-08-03 西北农林科技大学 一种改造后的先导编辑系统及其应用
WO2023227050A1 (zh) * 2022-05-25 2023-11-30 中国科学院遗传与发育生物学研究所 一种在基因组中定点插入外源序列的方法

Similar Documents

Publication Publication Date Title
US7491813B2 (en) Promoter polynucleotides identified from Zea mays for use in plants
US20110015084A1 (en) Methods for Identifying Genetic Linkage
Haen et al. Genomic targeting and high‐resolution mapping of the Tsn1 gene in wheat
He et al. Construction of a genomic library of wild rice and Agrobacterium-mediated transformation of large insert DNA linked to BPH resistance locus
CN112457386A (zh) 一种控制玉米穗长和行粒数相关的蛋白ead1及其编码基因与应用
JP4962744B2 (ja) テンサイ黒根病抵抗性品種選抜マーカーとその選抜方法
CN106636192A (zh) 一种应用于草莓上的CRISPR/Cas9载体的构建方法
CN113549648B (zh) 一种新型基因编辑系统及相关载体和方法
CN101012482A (zh) 一种筛选基因组dna中差异位点及其侧翼序列的方法
CN113564197A (zh) 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用
JP2002540799A (ja) 新規なタイプのトランスポゾンに基づいた遺伝子マーカー
CN113549648A (zh) 一种新型基因编辑系统及相关载体和方法
Peng et al. Functional analysis of GUS expression patterns and T-DNA integration characteristics in rice enhancer trap lines
Qu et al. Development of a new transformation-competent artificial chromosome (TAC) vector and construction of tomato and rice TAC libraries
CN101849023A (zh) 赋予玉米斐济病毒抗性的主要qtls
CN107326088B (zh) 检测抗虫耐除草剂玉米gh5112e-117c的方法
CN114717352B (zh) 水稻耐高温调控基因Hsp70的分子标记及其应用
CN113372424B (zh) 玉米南方锈病抗性基因及其应用
WO2012006866A1 (zh) 植物黄矮病抗性蛋白tistk1及其编码基因与应用
BRPI0612511A2 (pt) promotores constitutivos de populus e seus usos
Yang et al. Integration and characterization of T-DNA insertion in upland cotton
CN112662799A (zh) 一种用于检测玉米植物nd4401的核酸分子及其检测方法
EP0829539A2 (en) Cytoplasmic male sterility dna factor and utilization thereof
CN114438100B (zh) 一种高效分离带有野生稻血缘的抗白叶枯病基因及其家族成员的方法
US20030093830A1 (en) Means for identifying the locus of a major resistance gene to the rice yellow mottle virus, and their applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant