CN112746083A - 一种通过单碱基编辑靶基因启动子失活基因的方法 - Google Patents

一种通过单碱基编辑靶基因启动子失活基因的方法 Download PDF

Info

Publication number
CN112746083A
CN112746083A CN202011444311.9A CN202011444311A CN112746083A CN 112746083 A CN112746083 A CN 112746083A CN 202011444311 A CN202011444311 A CN 202011444311A CN 112746083 A CN112746083 A CN 112746083A
Authority
CN
China
Prior art keywords
gene
target gene
single base
target
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011444311.9A
Other languages
English (en)
Other versions
CN112746083B (zh
Inventor
李剑峰
熊翔宇
黎镇祥
梁洁坪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202011444311.9A priority Critical patent/CN112746083B/zh
Publication of CN112746083A publication Critical patent/CN112746083A/zh
Application granted granted Critical
Publication of CN112746083B publication Critical patent/CN112746083B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种通过单碱基编辑靶基因启动子失活基因的方法,所述靶基因的启动子区域包含5’非翻译区(5’UTR),所述方法包括,向靶细胞中导入靶向所述靶基因启动子的5’UTR区域的单碱基编辑系统;使靶基因产生1个或多个上游开放阅读框(uORF)从而导致靶基因失活。本发明具有不引发DNA双链断裂,精确高效以及对靶基因mRNA水平影响小等优点。

Description

一种通过单碱基编辑靶基因启动子失活基因的方法
技术领域
本发明涉及基因工程领域。具体涉及一种通过单碱基编辑靶基因启动子失活基因的方法及应用。
技术背景
基因功能性缺失(Loss of function)是研究基因功能的重要手段,也是理解生命活动,开发新药和进行动植物种质创新的基础途径。常规的使基因失活的方法主要包括EMS诱变和T-DNA随机插入。然而,此二者有着筛选工作强度高,所需实验空间大以及靶向性差等缺点,令多数研究者望而却步。近年来,随着以CRISPR/Cas9系统为代表的、高效精确的基因编辑工具迅速出现以及广泛应用,生物基因功能的研究获得了长足发展。该系统主要由核酸酶Cas9以及向导RNA (sgRNA)组成。在sgRNA的引导下,Cas9结合于目标基因位点处并行使核酸酶功能,产生DNA双链断裂,然后由宿主细胞内源修复机制带来突变。尽管如此,近期一些在哺乳动物细胞中的研究表明,由 CRISPR/Cas9基因编辑系统引发的DNA双链断裂,可能会导致如p53 通路的激活以及基因组大片段的倒置、易位和缺失等难以预料的后果。
上游开放阅读框(uORF)是存在于真核生物基因编码区前,通常被认为属于启动子区域的5’非翻译区(5‘UTR)中可能会发生翻译事件的开放阅读框(ORF)。诸多的研究证据表明,uORF是真核生物应对外界生物和非生物胁迫,调节关键蛋白质翻译的重要着力点。有研究报道,约35%的拟南芥mRNA和超过一半的人类mRNA至少含有一种序列上被确认的uORF。并且,uORF被发现通常会抑制主效开放阅读框(mORF)的翻译。
发明内容
针对现有技术的不足,本发明旨在提供一种通过单碱基编辑靶基因启动子失活基因的方法及应用。
为了实现上述目的,本发明采用的技术方案如下:
一种通过单碱基编辑靶基因启动子失活基因的方法,所述靶基因的启动子区域包含5’非翻译区(5’UTR),所述方法包括,向靶细胞中导入靶向所述靶基因启动子的5’UTR区域的单碱基编辑系统;使靶基因产生1个或多个上游开放阅读框(uORF)从而导致靶基因失活。
需要说明的是,其中导入靶向所述靶基因启动子的5’UTR区域的单碱基编辑系统包括基于CRISPR/Cas9系统的胞嘧啶单碱基系统 (CBEs)、腺嘌呤单碱基编辑系统(ABEs)以及先导编辑系统(PEs)。
“CRISPR/Cas9系统”指的是由细菌免疫系统CRISPR(成簇规律间隔短回文重复序列)/Cas9发展而来的基因组编辑系统。它包含核酸酶Cas9以及向导RNA。核酸酶Cas9在向导RNA的引导下,靶向结合并且切割目标DNA序列,形成DNA双链断裂(DSB)。适用于本发明的CRISPR/Cas9基因编辑系统包括但不限于发表于Li,JF.et al. Multiplex andhomologous recombination-mediated genome editing in Arabidopsis and Nicotianabenthamiana using guide RNA and Cas9.Nature biotechnology,31,688–69,2013的系统。
在本发明中,“sgRNA”和“向导RNA”可互换使用,指的是能与CRISPR/Cas9形成蛋白核酸复合物并将复合物靶向靶序列的具有发卡结构的RNA分子。一般地,决定向导RNA特异性的是其5’端的 20个碱基。
“单碱基编辑系统”指的是近年来基于CRISPR/Cas9系统开发而成的,可对生物体基因组上的单个碱基序列编辑替换的系统。单碱基系统使用的是核酸酶部分失活的nCas9(D10A)蛋白与胞嘧啶脱氨酶或腺嘌呤脱氨酶的融合蛋白,称为胞嘧啶或腺嘌呤单碱基编辑器。在向导RNA的引导下,nCas9(D10A)负责结合到靶标DNA上,由于其核酸酶活性部分缺失,其仅能切割靶标DNA的一条链,而不能形成双链断裂。随后,胞嘧啶脱氨酶或腺嘌呤脱氨酶催化靶标DNA上特定位置的 C胞嘧啶碱基或A腺嘌呤碱基脱氨基化形成U尿嘧啶碱基或I次黄嘌呤碱基。在细胞内源DNA修复机制的作用下,U尿嘧啶碱基或I次黄嘌呤碱基被修复为T胸腺嘧啶碱基或G鸟嘌呤碱基。最终实现了C 或A到T或G的碱基替换。
常用的胞嘧啶脱氨酶包括并不限于来自大鼠的rAPOBEC1、来自七鳃鳗的PmCDA1、来自人的hAID、来自人的hAPOBEC3A、来自人的 hAPOBEC3B、来自人的hAPOBEC3G。胞嘧啶单碱基编辑器除了含有 nCas9(D10A)和胞嘧啶脱氨酶,经常还包含有拷贝数不等的尿嘧啶糖苷酶抑制子(UGI)蛋白。
常用的腺嘌呤脱氨酶包括并不限于大肠杆菌tRNA腺嘌呤脱氨酶 TadA(ecTadA)的变体,特别是以单链DNA作为底物的变体,包括TadA- 7.10和TadA-8e。适用于本发明的CRISPR/Cas9衍生的单碱基编辑系统包括但不限于发表于于Zong,Y.et al.Precise baseediting in rice,wheat and maize with a Cas9-cytidine deaminase fusion.Naturebiotechnology,35,438-440,2017的系统。
先导编辑系统(PEs)通常包括融合有莫洛尼鼠白血病病毒反转录酶(M-MLV RT)变体的nCas9(H840A)缺刻酶以及先导延长向导 RNA(pegRNA),PE2或者PE3(b)是现在最常用的先导编辑系统。其能在pegRNA的引导下,通过M-MLV反转录酶变体的反转录作用,以pegRNA延长出来的骨架为模板合成DNA序列,同时随着nCas9(H840A) 缺刻酶的单链切割作用,促进了特定新DNA序列的整合,最后达到使靶标序列特定区域的单个碱基的随意替换和小片段增加或删除。适用于本发明的CRISPR/Cas9衍生的先导编辑系统系统包括但不限于发表于于Lin,Q.et al.Prime genome editing in rice and wheat. Naturebiotechnology,38,582-585,2020的系统。
本发明所述的单碱基编辑系统可以包含以下之一:
i)核酸酶部分失活的Cas9蛋白和胞苷(腺苷)脱氨酶的融合蛋白,和向导RNA;
ii)包含编码核酸酶部分失活的Cas9蛋白和胞苷(腺苷)脱氨酶的融合蛋白的核苷酸序列的表达构建体,和向导RNA;
iii)核酸酶部分失活的Cas9蛋白和胞苷(腺苷)脱氨酶的融合蛋白,和包含编码向导RNA的核苷酸序列的表达构建体;
iv)包含编码核酸酶部分失活的Cas9蛋白和胞苷(腺苷)脱氨酶的融合蛋白的核苷酸序列的表达构建体,和包含编码向导RNA的核苷酸序列的表达构建体;
或v)包含编码核酸酶部分失活的Cas9蛋白和胞苷(腺苷)脱氨酶的融合蛋白的核苷酸序列和编码向导RNA的核苷酸序列的表达构建体。
在一些实施方案中,所述编码核酸酶部分失活的Cas9蛋白相对于野生型Cas9(化脓链球菌SpCas9)包含氨基酸取代D10A。所述胞苷脱氨酶的实例包括但不限于:APOBEC1脱氨酶、激活诱导的胞苷脱氨酶(AID)、APOBEC3G或CDA1。
在一些优选实施方案中,所述胞苷脱氨酶为来源于人类的激活诱导的胞苷脱氨酶(hAID)及其变体。
本发明所述的先导编辑系统可以包含以下之一:
i)核酸酶部分失活的Cas9蛋白和逆转录酶的融合蛋白,和先导延长向导RNA(pegRNA);
ii)包含编码核酸酶部分失活的Cas9蛋白和逆转录酶的融合蛋白的核苷酸序列的表达构建体,和先导延长向导RNA;
iii)核酸酶部分失活的Cas9蛋白和逆转录酶的融合蛋白,和包含编码先导延长向导RNA的核苷酸序列的表达构建体;
iv)包含编码核酸酶部分失活的Cas9蛋白和逆转录酶的融合蛋白的核苷酸序列的表达构建体,和包含编码先导延长向导RNA的核苷酸序列的表达构建体;
或v)包含编码核酸酶部分失活的Cas9蛋白和逆转录酶的融合蛋白的核苷酸序列和编码先导延长向导RNA的核苷酸序列的表达构建体。
在一些实施方案中,所述核酸酶部分失活的Cas9蛋白相对于野生型Cas9(化脓链球菌SpCas9)包含氨基酸取代H840A。所述逆转录酶的实例包括但不限于,莫洛尼鼠白血病病毒反转录酶(M-MLV RT) 及其变体。
需要说明的是,通过靶位点上单个碱基的替换,使所述靶点产生强翻译起始密码子如ATG或弱翻译起始密码子如GTG、ATC、ACG、TTG 或AAG。
在一些具体实施方案中,所述靶位点上单个碱基的替换包括并不限于,胞嘧啶碱基编辑如5’-ACG-3’到5’-ATG-3’(C到T)或5’- GTG-3’到5’-ATG-3’(G到A),腺嘌呤碱基编辑如5’-ACA-3’到5’-ATG-3’(A到G)’。
需要说明的是,经过编辑后,靶基因编码的完整靶蛋白不表达或者表达量极低。
特别地,检测靶基因表达的手段仅能通过使用靶蛋白的内源抗体或是植物表型的变化,实时定量PCR不适用检测本发明所述基因失活。有大量研究表明基因的开放阅读框(uORF)通常影响蛋白质的翻译效率,而对基因的转录水平不影响或者影响不大。
需要说明的是,所述靶细胞是植物细胞,包括单子叶植物或双子叶植物,如拟南芥、水稻、小麦、大麦、高粱、玉米或大豆。
本发明还提供一种通过单碱基编辑靶基因启动子失活基因方法的应用,即经基因失活的细胞再生出的完整植株,其中所述植株中的靶基因失活。
在一些实施方案中,所述靶基因的失活导致所述植物性状发生变化,优选农艺性状的改良。
“农艺性状”指可测量的指标参数,包括但不限于:叶片绿色、籽粒产量、籽粒品质、生长速率、总生物量或积累速率、成熟时的鲜重、成熟时的干重、果实产量、种子产量、植物氮含量、植物游离氨基酸含量、植物蛋白含量、抗旱性、耐热性、氮的吸收、根的倒伏、收获指数、茎的倒伏、株高、穗高、穗长、抗病性、抗寒性、抗盐性和分蘖数。
在一些具体实施方案中,所述靶基因是BAK1。在一些具体实施方式中,所述BAK1基因是拟南芥的AtBAK1。BAK1是植物中重要的受体激酶,是免疫信号转导和植物激素油菜素甾醇信号转导的中枢蛋白。 AtBAK1的蛋白失活会导致植物叶片变得短缩肥大,也影响了其在黑暗状态下的下胚轴伸长。
在一些实施方式中,本发明的所述经遗传修饰的植物是无转基因的。例如,通过基因组编辑系统的瞬时转化可以获得无转基因的经遗传修饰的植物。或者,在获得整合有外源转基因的经遗传修饰的植物之后,通过后代的遗传分离可以获得不含转基因的经遗传修饰的植物。
另一方面,本发明包括通过本发明所述方法产生的经遗传修饰的植物或其后代。
本发明的有益效果在于,通过运用单碱基编辑器使目的基因启动子5‘非翻译区(5‘UTR)增加1个或多个上游开放阅读框(uORF),大大削弱主效开放阅读框(mORF)的翻译,从而达到失活靶基因的目的。
相比CRISPR/Cas9基因编辑、EMS诱变或T-DNA随机插入等传统基因失活手段,具有不引发DNA双链断裂,精确高效以及对靶基因 mRNA水平影响小等优点。除此之外,实验证据表明使用本发明方法获得的基因突变体,生长发育,蛋白功能等表型与公开发表的经传统T-DNA插入获得的突变体表型一致。
附图说明
图1为筛选AtBAK1基因启动子的5’UTR上能使该基因失活效果最强的潜在uORF位点。
图中,A为AtBAK1基因的5’UTR序列示意图(浅灰色);深灰低标注区域为两个潜在的sgRNA靶位点,其中黑色标注的AC2G,AC8G, AC12G为潜在uORF位点;黑色标记的ATG为该基因的主效ORF。B为筛选最优潜在uORF所构建的一系列荧光素酶报告基因的示意图。C 为荧光素酶报告系统筛选最优潜在uORF位点的结果,即sgRNA-2中 AC2G变为AT2G,削弱启动子活性最明显。”n.s.”表示无显著差异。
图2为使用胞嘧啶单碱基编辑器获得包含有最优uORF突变的纯合转基因拟南芥筛选过程。
图中,A为转基因双元载体示意图,NLS代表入核信号,XTEN代表灵活的连接序列,hAID为单碱基编辑系统核心的脱氨酶,EC1.2p 为特异在卵细胞中表达的启动子,sgRNA使用的是图1中筛选过的sgRNA-2。B是经过测序筛选获得的杂合T1代植株,显示编辑效率为1.5%,全部为AC2G到AT2G突变。C是经过传代筛选获得的纯合T2代基因编辑植株测序情况,显示AC2G到AT2G突变全部为纯合。
图3为包含有最优uORF突变的纯合转基因拟南芥显示出与AtBAK1 基因缺失突变体bak1-4相似的蛋白表达水平,生长发育表型和黑暗下下胚轴伸长表型。
图中,A为western blot实验中,用内源BAK1抗体检测出uORF 纯合突变体与缺失突变体bak1-4具有相似的蛋白水平,均比野生型 (WT)显著降低;且荧光实时定量PCR结果显示,uORF纯合突变体的BAK1转录水平相比野生型仅下降37%-50%,而缺失突变体bak1-4检测不到BAK1转录水平。B为5周龄的野生型(WT)、bak1-4和两个uORF纯合突变体#13-11和#205-3生长发育的表型。C和D为前述几种植株在黑暗条件下生长5天的表型。”n.s.”表示#13-3,#205-10 及bak1-4之间下胚轴长度无显著性差异。“**”表示与Col-0野生型植株相比差异显著。
具体实施例
以下将结合附图对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例1:分析AtBAK1基因编码区前5’UTR区域潜在uORF位点并使用荧光素酶报告系统确定最优潜在uORF位点。
首先从TAIR(https://www.arabidopsis.org/)网站上获取了拟南芥AtBAK1的完整cDNA序列,其中5’UTR序列(前导核苷酸序列)如图1A所示。然后,在其中搜索潜在的uORF位点(以使用胞嘧啶碱基编辑器为例,能定向将C碱基突变为T碱基),即5’-ACG- 3’序列(经胞嘧啶碱基编辑后变为初始密码子ATG)。同时,也兼顾了胞嘧啶碱基编辑器的工作特性,因此选择了两个sgRNA靶位点 (sgRNA-1,如SEQ ID NO:1所示核苷酸序列;sgRNA-2,如SEQ IDNO:2所示核苷酸序列),其中包含了3个潜在uORF位点(可突变 5’-ACG-3’序列)。
研究表明,uORF会影响基因启动子的活性。因此,发明人拟利用荧光素酶报告系统来研究前述哪个潜在的uORF位点突变后影响基因启动子活性的能力最大。具体实验方法如下:
1、构建系列荧光素酶报告基因BAK1p-WT/uORF1st/uORF1st/ uORF2nd-1/uORF2nd-2/uORF2nd/uORF1st+2nd-LUC瞬时表达载体
根据已发表论文描述的方法(Li,Z.et al.Targeted TranscriptionalActivation in Plants Using a Potent Dead Cas9-Derived Synthetic GeneActivator.Current protocols in molecular biology,127,e89,2019)。首先通过PCR的方式将 AtBAK1基因启动子(一般认为,ATG前-2kb左右可作为启动子序列) 从野生型拟南芥Col-0叶片基因组中克隆出来,同时在启动子序列开始和末尾(ATG前,不包含ATG)分别引入BamHI和NcoI内切酶序列;之后,将上述片段经BamHI和NcoI内切酶(NEB公司)双酶切之后,由T4连接酶连接进已使用上述双内切酶消化过的LUC载体,从而克隆出具有AtBAK1启动子序列的BAK1p-WT-LUC报告基因(SEQ ID NO:3 所示核苷酸序列)。随后,根据图1B所示以BAK1p-WT-LUC报告基因为模板,使用购自诺唯赞生物技术有限公司的定点突变试剂盒MutExpress II Fast Mutagenesis Kit V2,定点突变出具有不同人工定制uORF的系列报告基因BAK1p-uORF1st/uORF1st/uORF2nd-1/uORF2nd-2/ uORF2nd/uORF1st+2nd-LUC。
2、拟南芥原生质体的制备
1)12小时光照/12小时黑暗、24℃、60%湿度,培养4周拟南芥;
2)配制酶解溶液(1.5%纤维素酶R10,0.4%果胶酶R10,0.4M 甘露醇,20mM MES(pH 5.7),20mM KCl,10mM CaCl2和0.1%BSA) 并取10mL平铺于植物培养板中;
3)选取20-30片生长健康的拟南芥叶片,用刀片切成0.5-1mm 的条带;
4)将条带放入酶解液中,注意用塑料环将其拨散开来,使其四面都充分与酶液接触,黑暗酶解3小时;
5)在酶解进行2小时左右,配置PEG反应液(40%PEG4000(v/v),0.2M甘露醇和0.1MCaCl2),并将其放置于摇晃的仪器上慢慢溶解;
6)酶解完后,加入10ML W5溶液(154mM NaCl,125mM CaCl2,5mM KCl和2mM MES(pH5.7)),用适当的力度摇晃培养板,使原生质体释放于溶液中。此时可以看到溶液变绿,用75μm的尼龙膜过滤,收集细胞溶液于30mL离心管中;
7)细胞溶液用水平转子以800rpm的转速离心2分钟,之后用真空泵吸去尽可能多的上清液;
8)加入10mL W5溶液重悬细胞,轻轻摇晃使其重悬起来,并将其至于冰上休息0.5小时-1小时;
9)800rpm离心1分钟,将其上清液吸走,加入适量MMg溶液 (0.4M甘露醇,15mMMgCl2和4mM MES(pH5.7))重悬,在光学显微镜下使用细胞计数板将原生质体浓度调节至2×105个/mL。
3、拟南芥原生质体的瞬时转化
在2mL圆底离心管中,加入200μL拟南芥原生质体与4μL(8μ g)BAK1p-WT/uORF1st/uORF2nd-1/uORF2nd-2/uORF2nd/uORF1st+2nd-LUC 质粒(一个组加入一种LUC报告基因质粒,共6组)和1μL(2μg) UBQ10-GUS质粒/组,再加入220μL PEG反应液,轻柔地充分混匀,室温静置(避光15分钟),随后加入880μL W5溶液,混匀以终止转染。水平离心机离心(1000rpm离心2分钟),吸去上清,加入100 μL W5溶液重悬,并转移至1mL WI溶液中,室温黑暗培养12小时。
4、萤光素酶报告基因活性的检测
1)细胞裂解:
转染后的拟南芥原生质体黑暗培养12小时后,1100rpm水平离心 2分钟,吸去上清,加入100μL裂解液[25mM Tris-HCl(pH 7.8),2mM DTT,2mM trans-1,2-diaminocyclohexane-N’N’N’N’-tetraacetic acid,10%(v/v)glycerol和1%(v/v)Triton X-100],剧烈震荡使原生质体充分裂解,裂解液呈绿色。12000rpm离心30秒。此后裂解液须置于冰上,并尽快进行后续测量步骤。
2)GUS检测:
把黑底酶标板置于冰上,向各孔中分别加入10μL裂解上清;用排枪向同一个重复的样品中同时加入50μL MUG工作液[10mM Tris- HCl(pH 8.0),1mM 4-methylumbelliferyl-β-D-glucuronide(MUG), 2mM MgCl2],轻微吹打数下混匀,注意避免气泡产生;37℃避光反应30分钟;反应结束后把酶标板置于冰水浴中5分钟以终止反应;用Varioskan LUX microplate reader酶标仪“GUS程序”读数(程序设置:选择读取荧光——激发波长365nm、发射波长455nm——设置读取区域)。
3)LUC检测:
GUS反应开始后即可进行LUC检测;于白底酶标板各孔中分别加入10μL裂解液;用普通枪(或冲锋枪)按机器读数顺序先后或用排枪同时,向各孔中分别加入100μL LUC工作液;迅速进入酶标仪读数,选取“LUC程序”(化学发光——设置读取间隔为1000ms——设置读数顺序与加样顺序一致——设置每孔读书次数为10次——设置读取区域);注意LUC反应开始时速率能保持数分钟的稳定,随后逐渐衰减,故加入底物后应尽快测量。
4)计算:
数据导出至Excel表后,应首先扣除空白组的背景值,再计算各样品的LUC/GUS比值,接着将对照组(即仅含promoter-LUC和 UBQ10pro-GUS的组)的LUC/GUS值换算成1,再以此为标准计算各样品的Relative LUC activity,该值即为Promoter activity;根据Promoter activity作柱状图,并添加Error bar。
通过上述实验获得图1C结果,通过与各种经突变获得的具有不同uORF数量(1,2,3)的BAK1启动子相比,仅使sgRNA-2靶标序列内AC2G突变为AT2G获得的单个新uORF即可削弱BAK1启动子87.3%的活性,且该uORF削弱效果明显强于其他突变获得的uORF。
上述结果表明,通过单碱基编辑BAK1基因启动子中5’UTR区域,使该基因获得新的uORF,可极大削弱该启动子下游基因(LUC 基因)的翻译。
实施例2:在转基因植株层面使用单碱基编辑器编辑拟南芥内源BAK1,获得具有最优削弱能力uORF的纯合基因编辑植株。
接下来将前述筛选获得的sgRNA-2与已发表的基于hAID脱氨酶单碱基编辑载体,通过简单PCR与酶切连接的方法融合获得如图2A 所示双元载体(SEQ ID NO:4所示核苷酸序列)。将其通过农杆菌花粉管导入法转化拟南芥。具体方法简述如下:
将上述最终双元载体通过电击转化农杆菌(Agrobacterium tumefaciens)株系GV3101中,利用花粉管导入法(floral dip)转化拟南芥植株。具体地,将含有目标双元载体的GV3101菌液,按1:100 的比例接种于含卡那霉素(50mg/L)的液体LB培养基中,在28℃摇床中以转速220rpm培养2天。5000g收集菌体,弃去培养基,加入含 0.05%Silwet L77的5%蔗糖溶液重悬。取已开花的拟南芥植株,倒置并使花序完全浸入农杆菌菌液中,轻轻搅动约10s后取出,置于湿润黑暗环境中1天后,转移至正常生长环境,直到收获成熟种子。
将前述转基因操作获得的成熟种子在无菌环境下播撒于含有 50mg/L的潮霉素B(hygromycin B)的无菌1/2MS(购自Sigma公司) 固体培养基中。10天左右,将生根的阳性苗移至土壤中恢复培养。半个月后,使用购自诺唯赞公司的FastPure Plant DNA IsolationMini Kit试剂盒提取阳性苗的叶片基因组。随后,使用特异性引物 BAK1-F:5’-gggcgaacataacaaac-3’;BAK1-R:5’- gaccatggtttatcctcaagagattaaaaacaa-3’,将待测片段PCR后送擎科公司进行桑格测序。如图1B所示,我们在325颗T1代阳性植株中检测有突变的植株5颗,编辑情况全部为AC2G到AT2G,且均为杂合状态,编辑效率为1.5%。经过筛选传代,我们获得了两株具有纯合最优uORF序列的T2代碱基编辑植株#13-10、#205-3。
实施例3:评估含有最优uORF突变的基因编辑纯合植株的基因失活效果以及表型分析
将含有最优uORF突变的基因编辑纯合植株#13-10和#205-3与来源于ABRC突变体库(https://abrc.osu.edu)的BAK1基因T-DNA插入突变体bak1-4(CS71788)一起背靠背的种在相同的营养土中,5周后观察其生长发育表型同时分别取相同位置的叶片进行免疫印迹实验(Western Blot)和RNA的提取以及实时荧光定量PCR(RT-qPCR)实验,具体方法如下:
1、免疫印迹(Western blot)
1)首先对不同基因型的拟南芥WT、#13-10、#205-3以及bak1-4 植株剪取相同重量的叶片(约15mg)。迅速冻于-80℃液氮中,然后使用研磨仪将样品磨碎,注意随时添加液氮。向前述研磨好的样品中加入一定量10×Protein Loading Buffer(全式金生物),于95℃金属加热仪中煮10分钟,裂解样品。随后,将前述变性后的蛋白样品上样至10%SDS-PAGE胶电泳槽中,没有样品的孔用等量的2×浓度蛋白质缓冲液(全式金生物)补齐,100V恒压电泳2小时30分钟[1x SDS Running Buffer(Glycine 14.4g/L,Tris base 3.02g/L, SDS 1g/L)浸没)]。
2)取一张大小合适的PVDF膜,用甲醇浸泡30秒,然后用纯水洗涤3-5遍,用1×Transfer Buffer(Glycine 14.4g/L,Tris base 3.02g/L)浸泡,将跑胶结束的凝胶取出,去掉浓缩胶,用纯水漂洗2-3次后用1×Transfer Buffer浸泡。
3)取出分离胶,按照阴极板-海绵-滤纸-分离胶-PVDF膜-滤纸- 海绵-阳极板的顺序叠好材料,赶走气泡,350mA恒流下转膜2.5小时。
4)取出PVDF膜,靠近分离胶的一面朝上,用1×TBST[15mM NaCl,25mM Tris base,0.5%Tween-20(v/v),pH 7.4]洗涤一次,然后用5%脱脂奶粉溶液(1g脱脂奶粉溶于20mL 1×TBST缓冲液) 于60rpm的水平摇床室温封闭1小时,弃去溶液。
5)加入含有2μLα-BAK1抗体(Genscript公司)的10mL 5%脱脂奶粉溶液,4℃水平摇床过夜孵育。
6)用1×TBST缓冲液洗涤4次,每次10分钟,弃去溶液,将ECL 显色液按1:1的体积比混匀后加到洗好的膜上,在成像仪中拍照。
2、拟南芥叶片总RNA提取
使用TAKARA公司的RNAiso Plus产品,方法如下:
1)剪取15-30mg约5周大的拟南芥叶片放入装有研磨珠的2 mL研磨管中,迅速放入液氮;将上述样品放入研磨机中研磨,时刻注意补充液氮以避免样品降解;
2)研磨充分后迅速加入1mL RNAiso Plus液体,充分涡旋混匀,室温静置5分钟;
3)4℃,12000g离心5分钟;
4)上清迅速转移至RNase-free的1.5mL离心管中,加入200 μL氯仿,盖紧管盖并上下剧烈震荡15秒,可明显看到溶液乳化,室温静置5分钟;
5)4℃,12000g离心15分钟,液体分为三层,最上层无色上清为RNA。
6)将上清(450μL)转移至新的1.5mL RNase-free的离心管中,注意枪头不要触碰白色中间层;
7)迅速加入500μL异丙醇,上下颠倒,充分混匀,室温静置10 分钟;
8)4℃,12000g离心10分钟,一般可在底部看到白色RNA沉淀;
9)倒掉上清,加入使用DEPC水配制的75%乙醇1mL,轻柔颠倒混匀;
10)4℃,7500g离心5分钟;
11)重复第9),10)步洗涤操作一次,倒掉上清,注意尽量倒干净以免酒精残留过多;必要时可用枪吸干,不能触碰白色RNA沉淀;
12)将上述管子室温晾干或于超净台中吹干,经验表明在沉淀刚刚由白色变为透明状态时加水溶解效果最好,一般依沉淀量加入15- 30μL DEPC水,注意不要离心或加热干燥,可能造成RNA难以完全溶解;
13)将上述RNA水溶液在60℃金属浴中加热5分钟,以促进RNA 充分溶解;
14)最后将RNA样品于-80℃保存。
3、RNA反转录
使用TAKARA公司的PrimeScriptTM RT reagent Kit with gDNA Eraser进行反转录:
1)去除基因组DNA:
Total RNA 1μg
gDNA Eraser 1μL
5×gDNA Eraser Buffer 2μL
RNase-Free dH2O补至10μL
瞬时离心,于42℃反应2分钟后迅速放于冰上;
2)RT-PCR:
第一步反应产物10μL
PrimeScript RT Enzyme Mix I 1μL
RT Primer Mix 1μL
5×Prime Script Buffer 2(for Real Time)4μL
RNase-free dH2O 4μL
Total 20μL
注意:此步最好以配置成Mix的形式分装,若单独反应则需先加水和5×Buffer,混匀使gDNA Eraser活性充分受到抑制后再加入其他组分。
37℃,15min;
85℃,5sec;
4℃,保存。
以上步骤如无特殊说明应全程4℃进行;
合成的cDNA若需长期保存,应保存于至少-20℃。
4、实时荧光定量PCR
使用TAKARA公司的TB GreenTM RT Premix Ex TaqTM(Tli RNaseH Plus)在LightCyceler 96System(Roche Diagnostics)机器上进行实时定量PCR:
1)所使用引物序列:
靶标基因:
AtBAK1-qPCR-F TTATTGAGGGTTTTAGCTTCTGCTG;
AtBAK1-qPCR-R TGGGTTTTAGCTTTCAACAACATTC;
内参基因:
AtACT2-qPCR-F GACCTTTAACTCTCCCGCTATG;
AtACT2-qPCR-R AAACCCTCGTAGATTGGCAC。
2)稀释引物及模板:
配置Primer Mix(4μM,50μL):
qPrimer-F(100μM)2μL
qPrimer-R(100μM)2μL
ddH2O 46μL
模板通常将前述反转录产物稀释8倍来使用(20μL cDNA+80μ L ddH2O)。
3)qPCR:
cDNA(已稀释)3μL
Primer Mix(4μM)1μL
2×TB Green Premix Ex Taq 7μL
ddH2O 4μL
Total 15μL
通常将除cDNA以外的其它组分混成SYBR Mix,然后分装12 μL/孔,最后加cDNA模板,低速离心2分钟,上机测试(注意:2×TB Green Premix Ex Taq应避光吸样,同时避免反复冻融,配置SYBR Mix应分引物配置,至少包含内参与目的基因两种Mix,全程操作保持低温)。
LightCyceler 96System(Roche Diagnostics)机器的qPCR程序:
本实验室通常采用3步法;
变性:95℃,30sec[Ramp rate(升温速率):4.4℃/sec], 1cycle。
PCR:
分析模式:定量分析;
95℃,30sec(Ramp rate:4.4℃/sec);
55℃,30sec(Ramp rate:2.2℃/sec,Acqusition Mode: Single);
72℃,30sec(Ramp rate:2.2℃/sec)。
融解:
分析模式:融解曲线;
95℃,5sec(Ramp rate:4.4℃/sec);
60℃,1min(Ramp rate:2.2℃/sec);
95℃1sec(Ramp rate:0.11℃/sec,Acqusition Mode: Continuous,Acqusitions:5per℃),1cycle。
降温:
50℃,30sec(Ramp rate:2.2℃/sec),1cycle。
4)分析数据
使用
Figure RE-GDA0002999454370000241
96SW 1.1获取数据,通过融解曲线来判断引物是否特异以及数据是否可信,并在EXCEL表上根据2^(-ΔCt) 和2^(-ΔΔCt)计算目的基因的绝对表达量和相对表达量。
如图3A所示,含有最优uORF的碱基编辑纯合植株#13-10和 #205-3的BAK1蛋白质降至与突变体bak1-4水平一致,几乎检测不到。而相应mRNA水平相对野生型植株仅降至50%到67%的水平,与之相对的突变体bak1-4检测不到mRNA的表达。这印证了uORF会极大的影响蛋白质翻译效率而对Mrna水平的影响较小。如图3B所示,#13-10和#205-3BAK1蛋白质水平的极大削弱,反应到整体生长发育的表型就和突变体bak1-4一致,均展现出叶柄短缩,叶片肥大(5周龄)。前人报道,BAK1基因参与到植物激素油菜素甾醇的信号转导,其突变体bak1-4会有一个黑暗条件下下胚轴身长缩短的表型。如图3C所示,#13-10和#205-3展现了与突变体bak1-4相同的下胚轴短缩表型,而作为对照的bri1-116是河南大学王学路教授馈赠的突变体,其具有一个极致的BR缺陷表型。图3C的7天下胚轴长度统计结果也印证了这点。综上,本实施例的结果有力的说明了通过前述实施例获得的具有最优uORF突变的纯合拟南芥,其靶标基因BAK1的蛋白表达几乎丧失,同时其在生长发育与BR信号转导上的表型与突变体bak1-4一致。这些结果证明本发明的核心内容,即通过单碱基编辑靶基因启动子5’UTR区域,使其增加1个或多个 uORF,可以达到失活靶基因的目的。
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。
SEQUENCE LISTING
<110> 中山大学
<120> 一种通过单碱基编辑靶基因启动子失活基因的方法
<130> 123
<160> 4
<170> PatentIn version 3.5
<210> 1
<211> 23
<212> DNA
<213> 人工序列
<400> 1
tagtcaacgg tcagcgatct cgg 23
<210> 2
<211> 23
<212> DNA
<213> 人工序列
<400> 2
acgggtggat acgcgttgag agg 23
<210> 3
<211> 6600
<212> DNA
<213> 人工序列
<400> 3
ccatggatgg aagacgccaa aaacataaag aaaggcccgg cgccattcta tcctctagag 60
gatggaaccg ctggagagca actgcataag gctatgaaga gatacgccct ggttcctgga 120
acaattgctt ttacagatgc acatatcgag gtgaacatca cgtacgcgga atacttcgaa 180
atgtccgttc ggttggcaga agctatgaaa cgatatgggc tgaatacaaa tcacagaatc 240
gtcgtatgca gtgaaaactc tcttcaattc tttatgccgg tgttgggcgc gttatttatc 300
ggagttgcag ttgcgcccgc gaacgacatt tataatgaac gtgaattgct caacagtatg 360
aacatttcgc agcctaccgt agtgtttgtt tccaaaaagg ggttgcaaaa aattttgaac 420
gtgcaaaaaa aattaccaat aatccagaaa attattatca tggattctaa aacggattac 480
cagggatttc agtcgatgta cacgttcgtc acatctcatc tacctcccgg ttttaatgaa 540
tacgattttg taccagagtc ctttgatcgt gacaaaacaa ttgcactgat aatgaattcc 600
tctggatcta ctgggttacc taagggtgtg gcccttccgc atagaactgc ctgcgtcaga 660
ttctcgcatg ccagagatcc tatttttggc aatcaaatca ttccggatac tgcgatttta 720
agtgttgttc cattccatca cggttttgga atgtttacta cactcggata tttgatatgt 780
ggatttcgag tcgtcttaat gtatagattt gaagaagagc tgtttttacg atcccttcag 840
gattacaaaa ttcaaagtgc gttgctagta ccaaccctat tttcattctt cgccaaaagc 900
actctgattg acaaatacga tttatctaat ttacacgaaa ttgcttctgg gggcgcacct 960
ctttcgaaag aagtcgggga agcggttgca aaacgcttcc atcttccagg gatacgacaa 1020
ggatatgggc tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa 1080
ccgggcgcgg tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc 1140
gggaaaacgc tgggcgttaa tcagagaggc gaattatgtg tcagaggacc tatgattatg 1200
tccggttatg taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta 1260
cattctggag acatagctta ctgggacgaa gacgaacact tcttcatagt tgaccgcttg 1320
aagtctttaa ttaaatacaa aggatatcag gtggcccccg ctgaattgga atcgatattg 1380
ttacaacacc ccaacatctt cgacgcgggc gtggcaggtc ttcccgacga tgacgccggt 1440
gaacttcccg ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc 1500
gtggattacg tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt 1560
gtggacgaag taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc 1620
ctcataaagg ccaagaaggg cggaaagtcc aaattgtaaa atgtaactgt attcagcgat 1680
gacgaaattc ttagctattg taatattata tgcaaattga tgaatggtaa ttttgtaatt 1740
gtgggtcact gtactatttt aacgaataat aaaatcaggt ataggtaact aaaaaggaat 1800
tcgagctcga attgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 1860
tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 1920
taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt 1980
atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 2040
cgcggtgtca tctatgttac tagatctcta gaattcgtaa tcatgtcata gctgtttcct 2100
gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt 2160
aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc 2220
gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 2280
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 2340
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 2400
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 2460
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 2520
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 2580
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 2640
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 2700
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 2760
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 2820
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 2880
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 2940
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3000
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3060
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3120
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 3180
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 3240
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 3300
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 3360
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 3420
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 3480
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 3540
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 3600
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 3660
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 3720
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 3780
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 3840
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 3900
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 3960
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4020
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4080
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4140
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 4200
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 4260
atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt 4320
gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 4380
gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 4440
ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 4500
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc gccattcagg 4560
ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 4620
aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 4680
cgttgtaaaa cgacggccag tgccaagctt gcatgcctgc aggctctaga ggatccagag 4740
agggagaaaa gaattggaag agatttggag agagagaatc gctaagacgg tgaaaacaag 4800
gagaagaaac gcccacgaag gtcttgtaat ggcactcaat actgtggtcg gattcttctc 4860
cggttccatt gttttttgga aacagagaga aaactcaaaa gcccatgaag caagctctga 4920
gataaaatta caaacagaag aatgctaaag tgggactttt agatggttgg agagaattat 4980
gcatgtgtgt ggcaatgatt agcgtagtgt ggtggtgaca acaaacaaag gtggaggaag 5040
atagaaagtc gatagatacc ttacctcgaa aattcgtctc tctctttgat tatttttgta 5100
tatataaata gaaaaaagta gtagtaaata agaaaattgg atacagacac agatatgtcg 5160
tgaaaagggc actaaaatat tggatggtgc atgtgaatcg tcaaaaagtg gcaaggagaa 5220
agtgaaagtc ttcacgaatt atattttggt ttatatataa aagaagaaga aagaagaaga 5280
aagaagaaga aagaagatgg atgatacaca atcggtcacg gactcacggg taggaaggat 5340
tgtgaggcgt tacaatctcg tcagacttcc aagtcttaat ctgatgggcc tttaaatagc 5400
ctactgtact gagttgtttg ttgtgttttt gttttgtttt ttaatgccaa actaaggtat 5460
atgtccgtat tttattgctg gcaacatata ctctgtccgt ttgtgttttt tgttttttat 5520
ttcatttttc ctcaaaatta cttttgttct tttaaaaata ttaaatggca taaatagtta 5580
aactatcaac cagtaaatta tatatgatac aataatgttt tttgttttgt ttaattcatt 5640
ggaccagatg gattattcag cttacatttt tcaatattga attgtaattt tttagagcta 5700
taatctttaa aaaagaataa aaaaatcaaa aaagcttttg ctcatctttg gaataaacga 5760
acttgctatt aagaccaagc ccaataaaca ataaaagccc gaaaaaatag agctgggccg 5820
gtaattagga ttatgatgat ggtatataac tcactatcaa ctatcatgag ttcatgacca 5880
tcatggttta tatctaatgt catatgatgg atgatgataa ggtgggcgaa cataacaaac 5940
atgattcgga atgaagtcgt gcgtctttga ctttgactag ctctaaaaaa gctttgaaaa 6000
tgctcgtcca cgtcatcatc ctctttgtcg ttttctcaat cttaaatgtc atttttttaa 6060
tatagttttc acagtacaac aactcaaccc agtaaaatcc cttctttaag caaagaaaat 6120
aattaaaatt cgtcttcctt ccttgctctc ggcgataact tggtttctct cctctctctc 6180
atctctcttt gtttcgaccc ttttttagta tatttccagg aaatatcttc ttcctccttt 6240
cgttttctct atctcagttt tctctcttct cagcattaag tagtcaacgg tcagcgatct 6300
cggcgttcct tctaatcgga aaagtctagc ttcagtttct tttttttttg cttttttggt 6360
ttccgcgatt aatcgatttg ggtattttga ttttctcttc aaattaagtc aacgggtgga 6420
tacgcgttga gagggctttt ctcgtattct gcttctaatt tcatcatctt ggtattacct 6480
tgtgtgggtg gtagcttaat cgaaggattc gagatccctt ttatcagggg ttttaacaat 6540
gatggatttt ctctgatgag ggatagttct agggtttgtt tttaatctct tgaggataaa 6600
<210> 4
<211> 17592
<212> DNA
<213> 人工序列
<400> 4
agctcgctct tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta 60
aactgaaggc gggaaacgac aatctgatcc aagctcaagc tgctctagca ttcgccattc 120
aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg 180
gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca 240
cgacgttgta aaacgacggc cagtgaattc ctcgagtacg taggatccat ttaaattcta 300
gaggcgcgcc gatatcctct cttaaggtag cgagctctta attaataggg ataacagggt 360
aattaactat aacggtccta aggtagcgat ggcaaacagc tattatgggt attatgggtg 420
gttctttatg cggacactga cggctttatg cctgcagaaa aaagcaccga ctcggtgcca 480
ctttttcaag ttgataacgg actagcctta ttttaacttg ctatttctag ctctaaaacc 540
tcaacgcgta tccacccgtc aatcactact tcgactctag ctgtatataa actcagcttc 600
gttttcttat ctaagcgatg tgggactttt gaagattgtt ttcaacttaa atgggcctat 660
ataagaaata ctattgttct ttcccatata aatgggcctg cttctcttct ttcagattcc 720
caggggcctt ttgaagatta tcttcatatc ttaagaatga agatgtttta ttcaatcaaa 780
ttcttgaagg ttcgatgcct aatcattcta atcctgggac aaactatgaa acaagataca 840
aaaactccga atggaaagtt aaaaagaaga aaacgaaagc tacggttcaa gaaaatgtaa 900
gctgataaac aaaaaaaaac tgtatgaacg aagaagaaga aaaaaagctg gtaccgcccg 960
ggcgtcgaca ggcctaagcg aataaaagca tttgcgtttg gtttatcatt gcgtttatac 1020
aaggacagag atccactgag ctggaatagc ttaaaaccat tatcagaaca aaataaacca 1080
ttttttgtta agaatcagag catagtaaac aacagaaaca acctaagaga ggtaacttgt 1140
ccaagaagat agctaattat atctatttta taaaagttat catagtttgt aagtcacaaa 1200
agatgcaaat aacagagaaa ctaggagact tgagaatata cattcttgta tatttgtatt 1260
cgagattgtg aaaatttgac cataagttta aattcttaaa aagatatatc tgatctaggt 1320
gatggttata gactgtaatt ttaccacatg tttaatgatg gatagtgaca cacatgacac 1380
atcgacaaca ctatagcatc ttatttagat tacaacatga aatttttctg taatacatgt 1440
ctttgtacat aatttaaaag taattcctaa gaaatatatt tatacaagga gtttaaagaa 1500
aacatagcat aaagttcaat gagtagtaaa aaccatatac agtatatagc ataaagttca 1560
atgagtttat tacaaaagca ttggttcact ttctgtaaca cgacgttaaa ccttcgtctc 1620
caataggagc gctactgatt caacatgcca atatatacta aatacgtttc tacagtcaaa 1680
tgctttaacg tttcatgatt aagtgactat ttaccgtcaa tcctttccca ttcctcccac 1740
taatccaact ttttaattac tcttaaatca ccactaagct agtaacgcct atcatgaatt 1800
agctctacta aatctagcaa cctttcaaat ttgcagtatt gcaggtgtct ctgtgtcttt 1860
aaaatagttg ccttatgatt tcttcggttt caagatgatc aaatagttat agatttcatg 1920
ctcacacatg ctcattagat gtgtacatac tttacttacc caaatctatt ttctcgcaaa 1980
gattttgatg gtaaagctga tttggttcta ttgaactaaa tcaaacgagt ttcagactga 2040
gtgattctaa tccggcccat tagcccctaa acagacccac taattacgca gcttttaata 2100
gagtaattac acctagttta cccactaaac cactaagcac taattatctc acaatctaat 2160
gagcttccct cgtaattact tgggctttca ctctaccatt tatttgtaac agtcaagtct 2220
ctactgtctc tatataaact ctctaaagtt aacacacaat tctcatcaca aacaaatcaa 2280
ccaaagcaac ttctactctt tcttctttcg accttatcaa tctgttgaga acctaggatg 2340
ccaaagaaga agagaaaggt tggaatccac ggagttccag ctgctgacag cctcttgatg 2400
aaccggaggg agtttcttta ccaattcaaa aatgtccgct gggctaaggg tcggcgtgag 2460
acctacctgt gctacgtagt ggagaggcgt gactgtgcta catccttttc actggacttt 2520
ggttatcttc gcaataagaa cggctgccac gtggaattgc tcttcctccg ctacatctcg 2580
gactgggacc tagaccctgg ccgctgctac cgcgtcacct ggttcatctc ctggagcccc 2640
tgctacgact gtgcccgaca tgtggccgac tttctgcgag ggaaccccaa cctcagtctg 2700
aggatcttcg ccgcgcgcct ctacttctgt gaggaccgca aggctgagcc cgaggggctg 2760
cggcggctgc gccgcgccgg ggtgcaaata gccatcatga ccttcaaaga ttatttttac 2820
tgctggaata cttttgcaga aaaccatgga agaactttca aagcctggga agggctgcat 2880
gaaaattcag ttcgtctctc cggacagctt cggcgcatcc ttagcggcag cgagactccc 2940
gggacctcag agtccgccac acccgaaagt gataagaagt actctatcgg acttgctatc 3000
ggaaccaact ctgttggatg ggctgttatc accgatgagt acaaggttcc atctaagaag 3060
ttcaaggttc ttggaaacac cgatagacac tctatcaaga agaaccttat cggtgctctt 3120
cttttcgatt ctggagagac cgctgaggct accagattga agagaaccgc tagaagaaga 3180
tacaccagaa gaaagaacag aatctgctac cttcaggaaa tcttctctaa cgagatggct 3240
aaggttgatg attctttctt ccacagactt gaggagtctt tccttgttga ggaggataag 3300
aagcacgaga gacacccaat cttcggaaac atcgttgatg aggttgctta ccacgagaag 3360
tacccaacca tctaccacct tagaaagaag ttggttgatt ctaccgataa ggctgatctt 3420
agacttatct accttgctct tgctcacatg atcaagttca gaggacactt ccttatcgag 3480
ggagacctta acccagataa ctctgatgtt gataagttgt tcatccagct tgttcagacc 3540
tacaaccagc ttttcgagga gaacccaatc aacgcttctg gagttgatgc taaggctatc 3600
ctttctgcta gactttctaa gtctcgtaga cttgagaacc ttatcgctca gcttccagga 3660
gagaagaaga acggactttt cggaaacctt atcgctcttt ctcttggact taccccaaac 3720
ttcaagtcta acttcgatct tgctgaggat gctaagttgc agctttctaa ggatacctac 3780
gatgatgatc ttgataacct tcttgctcag atcggagatc agtacgctga tcttttcctt 3840
gctgctaaga acctttctga tgctatcctt ctttctgaca tccttagagt taacaccgag 3900
atcaccaagg ctccactttc tgcttctatg atcaagagat acgatgagca ccaccaggat 3960
cttacccttt tgaaggctct tgttagacag cagcttccag agaagtacaa ggaaatcttc 4020
ttcgatcagt ctaagaacgg atacgctgga tacatcgatg gaggagcttc tcaggaggag 4080
ttctacaagt tcatcaagcc aatccttgag aagatggatg gaaccgagga gcttcttgtt 4140
aagttgaaca gagaggatct tcttagaaag cagagaacct tcgataacgg atctatccca 4200
caccagatcc accttggaga gcttcacgct atccttcgta gacaggagga tttctaccca 4260
ttcttgaagg ataacagaga gaagatcgag aagatcctta ccttcagaat cccatactac 4320
gttggaccac ttgctagagg aaactctcgt ttcgcttgga tgaccagaaa gtctgaggag 4380
accatcaccc cttggaactt cgaggaggtt gttgataagg gagcttctgc tcagtctttc 4440
atcgagagaa tgaccaactt cgataagaac cttccaaacg agaaggttct tccaaagcac 4500
tctcttcttt acgagtactt caccgtttac aacgagctta ccaaggttaa gtacgttacc 4560
gagggaatga gaaagccagc tttcctttct ggagagcaga agaaggctat cgttgatctt 4620
cttttcaaga ccaacagaaa ggttaccgtt aagcagttga aggaggatta cttcaagaag 4680
atcgagtgct tcgattctgt tgaaatctct ggagttgagg atagattcaa cgcttctctt 4740
ggaacctacc acgatctttt gaagatcatc aaggataagg atttccttga taacgaggag 4800
aacgaggaca tccttgagga catcgttctt acccttaccc ttttcgagga tagagagatg 4860
atcgaggaga gactcaagac ctacgctcac cttttcgatg ataaggttat gaagcagttg 4920
aagagaagaa gatacaccgg atggggtaga ctttctcgta agttgatcaa cggaatcaga 4980
gataagcagt ctggaaagac catccttgat ttcttgaagt ctgatggatt cgctaacaga 5040
aacttcatgc agcttatcca cgatgattct cttaccttca aggaggacat ccagaaggct 5100
caggtttctg gacagggaga ttctcttcac gagcacatcg ctaaccttgc tggatctcca 5160
gctatcaaga agggaatcct tcagaccgtt aaggttgttg atgagcttgt taaggttatg 5220
ggtagacaca agccagagaa catcgttatc gagatggcta gagagaacca gaccacccag 5280
aagggacaga agaactctcg tgagagaatg aagagaatcg aggagggaat caaggagctt 5340
ggatctcaaa tcttgaagga gcacccagtt gagaacaccc agcttcagaa cgagaagttg 5400
tacctttact accttcagaa cggaagagat atgtacgttg atcaggagct tgacatcaac 5460
agactttctg attacgatgt tgatcacatc gttccacagt ctttcttgaa ggatgattct 5520
atcgataaca aggttcttac ccgttctgat aagaacagag gaaagtctga taacgttcca 5580
tctgaggagg ttgttaagaa gatgaagaac tactggagac agcttcttaa cgctaagttg 5640
atcacccaga gaaagttcga taaccttacc aaggctgaga gaggaggact ttctgagctt 5700
gataaggctg gattcatcaa gagacagctt gttgagacca gacagatcac caagcacgtt 5760
gctcagatcc ttgattctcg tatgaacacc aagtacgatg agaacgataa gttgatcaga 5820
gaggttaagg ttatcacctt gaagtctaag ttggtttctg atttcagaaa ggatttccag 5880
ttctacaagg ttagagagat caacaactac caccacgctc acgatgctta ccttaacgct 5940
gttgttggaa ccgctcttat caagaagtac ccaaagttgg agtctgagtt cgtttacgga 6000
gattacaagg tttacgatgt tagaaagatg atcgctaagt ctgagcagga gatcggaaag 6060
gctaccgcta agtacttctt ctactctaac atcatgaact tcttcaagac cgagatcacc 6120
cttgctaacg gagagatcag aaagagacca cttatcgaga ccaacggaga gaccggagag 6180
atcgtttggg ataagggaag agatttcgct accgttagaa aggttctttc tatgccacag 6240
gttaacatcg ttaagaaaac cgaggttcag accggaggat tctctaagga gtctatcctt 6300
ccaaagagaa actctgataa gttgatcgct agaaagaagg attgggaccc aaagaagtac 6360
ggaggattcg attctccaac cgttgcttac tctgttcttg ttgttgctaa ggttgagaag 6420
ggaaagtcta agaagttgaa gtctgttaag gagcttcttg gaatcaccat catggagcgt 6480
tcttctttcg agaagaaccc aatcgatttc cttgaggcta agggatacaa ggaggttaag 6540
aaggatctta tcatcaagtt gccaaagtac tctcttttcg agcttgagaa cggaagaaag 6600
agaatgcttg cttctgctgg agagcttcag aagggaaacg agcttgctct tccatctaag 6660
tacgttaact tcctttacct tgcttctcac tacgagaagt tgaagggatc tccagaggat 6720
aacgagcaga agcagctttt cgttgagcag cacaagcact accttgatga gatcatcgag 6780
caaatctctg agttctctaa gagagttatc cttgctgatg ctaaccttga taaggttctt 6840
tctgcttaca acaagcacag agataagcca atcagagagc aggctgagaa catcatccac 6900
cttttcaccc ttaccaacct tggtgctcca gctgctttca agtacttcga taccaccatc 6960
gatagaaaaa gatacacctc taccaaggag gttcttgatg ctacccttat ccaccagtct 7020
atcaccggac tttacgagac cagaatcgat ctttctcagc ttggaggaga tggtggaggt 7080
ggttctggtg gtggtggttc tggtggtggt ggatctggag gcggtgggtc cggaggtggc 7140
ggttcgggcg gaggtggatc cactaacctg tccgacatca tcgagaagga gactggcaag 7200
cagctggtga tccaggagtc tattctgatg ctgccagagg aggtggaaga ggtgatcggc 7260
aacaagccag agtctgatat cctggtgcac actgcctacg acgagtccac tgacgaaaac 7320
gtgatgctgc tgacttccga tgccccagaa tacaagccat gggccctggt gattcaggac 7380
tccaacggcg agaacaagat caagatgctg tctggtggtt ctaagagacc agctgctacc 7440
aagaaggctg gacaggctaa gaagaagaag aggcctcccc cttctgacta caaggacgac 7500
gatgacaagg actacaagga cgacgatgac aagtgagctc agagctttcg ttcgtatcat 7560
cggtttcgac aacgttcgtc aagttcaatg catcagtttc attgcgcaca caccagaatc 7620
ctactgagtt tgagtattat ggcattggga aaactgtttt tcttgtacca tttgttgtgc 7680
ttgtaattta ctgtgttttt tattcggttt tcgctatcga actgtgaaat ggaaatggat 7740
ggagaagagt taatgaatga tatggtcctt ttgttcattc tcaaattaat attatttgtt 7800
ttttctctta tttgttgtgt gttgaatttg aaattataag agatatgcaa acattttgtt 7860
ttgagtaaaa atgtgtcaaa tcgtggcctc taatgaccga agttaatatg aggagtaaaa 7920
cacttgtagt tgtaccatta tgcttattca ctaggcaaca aatatatttt cagacctaga 7980
aaagctgcaa atgttactga atacaagtat gtcctcttgt gttttagaca tttatgaact 8040
ttcctttatg taattttcca gaatccttgt cagattctaa tcattgcttt ataattatag 8100
ttatactcat ggatttgtag ttgagtatga aaatattttt taatgcattt tatgacttgc 8160
caattgattg acaacgaatt cgtaatcatg tcatagctgt ttcctgtgtg aaattgttat 8220
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 8280
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 8340
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 8400
attggctaga gcagcttgcc aacatggtgg agcacgacac tctcgtctac tccaagaata 8460
tcaaagatac agtctcagaa gaccaaaggg ctattgagac ttttcaacaa agggtaatat 8520
cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcaaa aggacagtag 8580
aaaaggaagg tggcacctac aaatgccatc attgcgataa aggaaaggct atcgttcaag 8640
atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc atcgtggaaa 8700
aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgaacat ggtggagcac 8760
gacactctcg tctactccaa gaatatcaaa gatacagtct cagaagacca aagggctatt 8820
gagacttttc aacaaagggt aatatcggga aacctcctcg gattccattg cccagctatc 8880
tgtcacttca tcaaaaggac agtagaaaag gaaggtggca cctacaaatg ccatcattgc 8940
gataaaggaa aggctatcgt tcaagatgcc tctgccgaca gtggtcccaa agatggaccc 9000
ccacccacga ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg 9060
gattgatgtg atatctccac tgacgtaagg gatgacgcac aatcccacta tccttcgcaa 9120
gacccttcct ctatataagg aagttcattt catttggaga ggacacgctg aaatcaccag 9180
tctctctcta caaatctatc tctctcgagc tttcgcagat ccggggggca atgagatatg 9240
aaaaagcctg aactcaccgc gacgtctgtc gagaagtttc tgatcgaaaa gttcgacagc 9300
gtctccgacc tgatgcagct ctcggagggc gaagaatctc gtgctttcag cttcgatgta 9360
ggagggcgtg gatatgtcct gcgggtaaat agctgcgccg atggtttcta caaagatcgt 9420
tatgtttatc ggcactttgc atcggccgcg ctcccgattc cggaagtgct tgacattggg 9480
gagtttagcg agagcctgac ctattgcatc tcccgccgtt cacagggtgt cacgttgcaa 9540
gacctgcctg aaaccgaact gcccgctgtt ctacaaccgg tcgcggaggc tatggatgcg 9600
atcgctgcgg ccgatcttag ccagacgagc gggttcggcc cattcggacc gcaaggaatc 9660
ggtcaataca ctacatggcg tgatttcata tgcgcgattg ctgatcccca tgtgtatcac 9720
tggcaaactg tgatggacga caccgtcagt gcgtccgtcg cgcaggctct cgatgagctg 9780
atgctttggg ccgaggactg ccccgaagtc cggcacctcg tgcacgcgga tttcggctcc 9840
aacaatgtcc tgacggacaa tggccgcata acagcggtca ttgactggag cgaggcgatg 9900
ttcggggatt cccaatacga ggtcgccaac atcttcttct ggaggccgtg gttggcttgt 9960
atggagcagc agacgcgcta cttcgagcgg aggcatccgg agcttgcagg atcgccacga 10020
ctccgggcgt atatgctccg cattggtctt gaccaactct atcagagctt ggttgacggc 10080
aatttcgatg atgcagcttg ggcgcagggt cgatgcgacg caatcgtccg atccggagcc 10140
gggactgtcg ggcgtacaca aatcgcccgc agaagcgcgg ccgtctggac cgatggctgt 10200
gtagaagtac tcgccgatag tggaaaccga cgccccagca ctcgtccgag ggcaaagaaa 10260
tagagtagat gccgaccggg atctgtcgat cgacaagctc gagtttctcc ataataatgt 10320
gtgagtagtt cccagataag ggaattaggg ttcctatagg gtttcgctca tgtgttgagc 10380
atataagaaa cccttagtat gtatttgtat ttgtaaaata cttctatcaa taaaatttct 10440
aattcctaaa accaaaatcc agtactaaaa tccagatccc ccgaattaat tcggcgttaa 10500
ttcagtacat taaaaacgtc cgcaatgtgt tattaagttg tctaagcgtc aatttgttta 10560
caccacaata tatcctgcca ccagccagcc aacagctccc cgaccggcag ctcggcacaa 10620
aatcaccact cgatacaggc agcccatcag tccgggacgg cgtcagcggg agagccgttg 10680
taaggcggca gactttgctc atgttaccga tgctattcgg aagaacggca actaagctgc 10740
cgggtttgaa acacggatga tctcgcggag ggtagcatgt tgattgtaac gatgacagag 10800
cgttgctgcc tgtgatcacc gcggtttcaa aatcggctcc gtcgatacta tgttatacgc 10860
caactttgaa aacaactttg aaaaagctgt tttctggtat ttaaggtttt agaatgcaag 10920
gaacagtgaa ttggagttcg tcttgttata attagcttct tggggtatct ttaaatactg 10980
tagaaaagag gaaggaaata ataaatggct aaaggtaatg actccaactt attgatagtg 11040
ttttatgttc agataatgcc cgatgacttt gtcatgcagc tccaccgatt ttgagaacga 11100
cagcgacttc cgtcccagcc gtgccaggtg ctgcctcaga ttcaggttat gccgctcaat 11160
tcgctgcgta tatcgcttgc tgattacgtg cagctttccc ttcaggcggg attcatacag 11220
cggccagcca tccgtcatcc atatcaccac gtcaaagggt gacagcaggc tcataagacg 11280
ccccagcgtc gccatagtgc gttcaccgaa tacgtgcgca acaaccgtct tccggagact 11340
gtcatacgcg taaaacagcc agcgctggcg cgatttagcc ccgacatagc cccactgttc 11400
gtccatttcc gcgcagacga tgacgtcact gcccggctgt atgcgcgagg ttaccgactg 11460
cggcctgagt tttttaagtg acgtaaaatc gtgttgaggc caacgcccat aatgcgggct 11520
gttgcccggc atccaacgcc attcatggcc atatcaatga ttttctggtg cgtaccgggt 11580
tgagaagcgg tgtaagtgaa ctgcagttgc catgttttac ggcagtgaga gcagagatag 11640
cgctgatgtc cggcggtgct tttgccgtta cgcaccaccc cgtcagtagc tgaacaggag 11700
ggacagctga tagaaacaga agccactgga gcacctcaaa aacaccatca tacactaaat 11760
cagtaagttg gcagcatcac catggctaaa atgagaatat caccggaatt gaaaaaactg 11820
atcgaaaaat accgctgcgt aaaagatacg gaaggaatgt ctcctgctaa ggtatataag 11880
ctggtgggag aaaatgaaaa cctatattta aaaatgacgg acagccggta taaagggacc 11940
acctatgatg tggaacggga aaaggacatg atgctatggc tggaaggaaa gctgcctgtt 12000
ccaaaggtcc tgcactttga acggcatgat ggctggagca atctgctcat gagtgaggcc 12060
gatggcgtcc tttgctcgga agagtatgaa gatgaacaaa gccctgaaaa gattatcgag 12120
ctgtatgcgg agtgcatcag gctctttcac tccatcgaca tatcggattg tccctatacg 12180
aatagcttag acagccgctt agccgaattg gattacttac tgaataacga tctggccgat 12240
gtggattgcg aaaactggga agaagacact ccatttaaag atccgcgcga gctgtatgat 12300
tttttaaaga cggaaaagcc cgaagaggaa cttgtctttt cccacggcga cctgggagac 12360
agcaacatct ttgtgaaaga tggcaaagta agtggcttta ttgatcttgg gagaagcggc 12420
agggcggaca agtggtatga cattgccttc tgcgtccggt cgatcaggga ggatatcggg 12480
gaagaacagt atgtcgagct attttttgac ttactgggga tcaagcctga ttgggagaaa 12540
ataaaatatt atattttact ggatgaattg ttttagtacc tagaatgcat gaccaaaatc 12600
ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 12660
tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 12720
ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 12780
ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac 12840
ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 12900
gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 12960
aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 13020
acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 13080
gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 13140
gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 13200
cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 13260
aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 13320
gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 13380
cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg 13440
atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc 13500
agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg 13560
actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt 13620
gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc 13680
agaggttttc accgtcatca ccgaaacgcg cgaggcaggg tgccttgatg tgggcgccgg 13740
cggtcgagtg gcgacggcgc ggcttgtccg cgccctggta gattgcctgg ccgtaggcca 13800
gccatttttg agcggccagc ggccgcgata ggccgacgcg aagcggcggg gcgtagggag 13860
cgcagcgacc gaagggtagg cgctttttgc agctcttcgg ctgtgcgctg gccagacagt 13920
tatgcacagg ccaggcgggt tttaagagtt ttaataagtt ttaaagagtt ttaggcggaa 13980
aaatcgcctt ttttctcttt tatatcagtc acttacatgt gtgaccggtt cccaatgtac 14040
ggctttgggt tcccaatgta cgggttccgg ttcccaatgt acggctttgg gttcccaatg 14100
tacgtgctat ccacaggaaa cagacctttt cgaccttttt cccctgctag ggcaatttgc 14160
cctagcatct gctccgtaca ttaggaaccg gcggatgctt cgccctcgat caggttgcgg 14220
tagcgcatga ctaggatcgg gccagcctgc cccgcctcct ccttcaaatc gtactccggc 14280
aggtcatttg acccgatcag cttgcgcacg gtgaaacaga acttcttgaa ctctccggcg 14340
ctgccactgc gttcgtagat cgtcttgaac aaccatctgg cttctgcctt gcctgcggcg 14400
cggcgtgcca ggcggtagag aaaacggccg atgccgggat cgatcaaaaa gtaatcgggg 14460
tgaaccgtca gcacgtccgg gttcttgcct tctgtgatct cgcggtacat ccaatcagct 14520
agctcgatct cgatgtactc cggccgcccg gtttcgctct ttacgatctt gtagcggcta 14580
atcaaggctt caccctcgga taccgtcacc aggcggccgt tcttggcctt cttcgtacgc 14640
tgcatggcaa cgtgcgtggt gtttaaccga atgcaggttt ctaccaggtc gtctttctgc 14700
tttccgccat cggctcgccg gcagaacttg agtacgtccg caacgtgtgg acggaacacg 14760
cggccgggct tgtctccctt cccttcccgg tatcggttca tggattcggt tagatgggaa 14820
accgccatca gtaccaggtc gtaatcccac acactggcca tgccggccgg ccctgcggaa 14880
acctctacgt gcccgtctgg aagctcgtag cggatcacct cgccagctcg tcggtcacgc 14940
ttcgacagac ggaaaacggc cacgtccatg atgctgcgac tatcgcgggt gcccacgtca 15000
tagagcatcg gaacgaaaaa atctggttgc tcgtcgccct tgggcggctt cctaatcgac 15060
ggcgcaccgg ctgccggcgg ttgccgggat tctttgcgga ttcgatcagc ggccgcttgc 15120
cacgattcac cggggcgtgc ttctgcctcg atgcgttgcc gctgggcggc ctgcgcggcc 15180
ttcaacttct ccaccaggtc atcacccagc gccgcgccga tttgtaccgg gccggatggt 15240
ttgcgaccgc tcacgccgat tcctcgggct tgggggttcc agtgccattg cagggccggc 15300
aggcaaccca gccgcttacg cctggccaac cgcccgttcc tccacacatg gggcattcca 15360
cggcgtcggt gcctggttgt tcttgatttt ccatgccgcc tcctttagcc gctaaaattc 15420
atctactcat ttattcattt gctcatttac tctggtagct gcgcgatgta ttcagatagc 15480
agctcggtaa tggtcttgcc ttggcgtacc gcgtacatct tcagcttggt gtgatcctcc 15540
gccggcaact gaaagttgac ccgcttcatg gctggcgtgt ctgccaggct ggccaacgtt 15600
gcagccttgc tgctgcgtgc gctcggacgg ccggcactta gcgtgtttgt gcttttgctc 15660
attttctctt tacctcatta actcaaatga gttttgattt aatttcagcg gccagcgcct 15720
ggacctcgcg ggcagcgtcg ccctcgggtt ctgattcaag aacggttgtg ccggcggcgg 15780
cagtgcctgg gtagctcacg cgctgcgtga tacgggactc aagaatgggc agctcgtacc 15840
cggccagcgc ctcggcaacc tcaccgccga tgcgcgtgcc tttgatcgcc cgcgacacga 15900
caaaggccgc ttgtagcctt ccatccgtga cctcaatgcg ctgcttaacc agctccacca 15960
ggtcggcggt ggcccatatg tcgtaagggc ttggctgcac cggaatcagc acgaagtcgg 16020
ctgccttgat cgcggacaca gccaagtccg ccgcctgggg cgctccgtcg atcactacga 16080
agtcgcgccg gccgatggcc ttcacgtcgc ggtcaatcgt cgggcggtcg atgccgacaa 16140
cggttagcgg ttgatcttcc cgcacggccg cccaatcgcg ggcactgccc tggggatcgg 16200
aatcgactaa cagaacatcg gccccggcga gttgcagggc gcgggctaga tgggttgcga 16260
tggtcgtctt gcctgacccg cctttctggt taagtacagc gataaccttc atgcgttccc 16320
cttgcgtatt tgtttattta ctcatcgcat catatacgca gcgaccgcat gacgcaagct 16380
gttttactca aatacacatc acctttttag acggcggcgc tcggtttctt cagcggccaa 16440
gctggccggc caggccgcca gcttggcatc agacaaaccg gccaggattt catgcagccg 16500
cacggttgag acgtgcgcgg gcggctcgaa cacgtacccg gccgcgatca tctccgcctc 16560
gatctcttcg gtaatgaaaa acggttcgtc ctggccgtcc tggtgcggtt tcatgcttgt 16620
tcctcttggc gttcattctc ggcggccgcc agggcgtcgg cctcggtcaa tgcgtcctca 16680
cggaaggcac cgcgccgcct ggcctcggtg ggcgtcactt cctcgctgcg ctcaagtgcg 16740
cggtacaggg tcgagcgatg cacgccaagc agtgcagccg cctctttcac ggtgcggcct 16800
tcctggtcga tcagctcgcg ggcgtgcgcg atctgtgccg gggtgagggt agggcggggg 16860
ccaaacttca cgcctcgggc cttggcggcc tcgcgcccgc tccgggtgcg gtcgatgatt 16920
agggaacgct cgaactcggc aatgccggcg aacacggtca acaccatgcg gccggccggc 16980
gtggtggtgt cggcccacgg ctctgccagg ctacgcaggc ccgcgccggc ctcctggatg 17040
cgctcggcaa tgtccagtag gtcgcgggtg ctgcgggcca ggcggtctag cctggtcact 17100
gtcacaacgt cgccagggcg taggtggtca agcatcctgg ccagctccgg gcggtcgcgc 17160
ctggtgccgg tgatcttctc ggaaaacagc ttggtgcagc cggccgcgtg cagttcggcc 17220
cgttggttgg tcaagtcctg gtcgtcggtg ctgacgcggg catagcccag caggccagcg 17280
gcggcgctct tgttcatggc gtaatgtctc cggttctagt cgcaagtatt ctactttatg 17340
cgactaaaac acgcgacaag aaaacgccag gaaaagggca gggcggcagc ctgtcgcgta 17400
acttaggact tgtgcgacat gtcgttttca gaagacggct gcactgaacg tcagaagccg 17460
actgcactat agcagcggag gggttggatc aaagtacttt gatcccgagg ggaaccctgt 17520
ggttggcatg cacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc 17580
cgattattct aa 17592

Claims (6)

1.一种通过单碱基编辑靶基因启动子失活基因的方法,所述靶基因的启动子区域包含5’非翻译区(5’UTR),其特征在于,所述方法包括,向靶细胞中导入靶向所述靶基因启动子的5’UTR区域的单碱基编辑系统;使靶基因产生1个或多个上游开放阅读框(uORF)从而导致靶基因失活。
2.根据权利要求1所述的通过单碱基编辑靶基因启动子失活基因的方法,其特征在于,其中导入靶向所述靶基因启动子的5’UTR区域的单碱基编辑系统包括基于CRISPR/Cas9系统的胞嘧啶单碱基系统(CBEs)、腺嘌呤单碱基编辑系统(ABEs)以及先导编辑系统(PEs)。
3.根据权利要求1所述的通过单碱基编辑靶基因启动子失活基因的方法,其特征在于,通过靶位点上单个碱基的替换,使所述靶点产生强翻译起始密码子ATG或弱翻译起始密码子GTG、ATC、ACG、TTG或AAG。
4.根据权利要求1所述的通过单碱基编辑靶基因启动子失活基因的方法,其特征在于,经过编辑后,靶基因编码的完整靶蛋白不表达或者表达量极低。
5.根据权利要求1通过单碱基编辑靶基因启动子失活基因的方法,其中所述靶细胞是植物细胞,包括单子叶植物或双子叶植物,如拟南芥、水稻、小麦、大麦、高粱、玉米或大豆。
6.一种利用如权利要求1所述的通过单碱基编辑靶基因启动子失活基因的方法的应用,其特征在于,经基因失活的细胞再生出的完整植株,其中所述植株中的靶基因失活。
CN202011444311.9A 2020-12-11 2020-12-11 一种通过单碱基编辑靶基因启动子失活基因的方法 Active CN112746083B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011444311.9A CN112746083B (zh) 2020-12-11 2020-12-11 一种通过单碱基编辑靶基因启动子失活基因的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011444311.9A CN112746083B (zh) 2020-12-11 2020-12-11 一种通过单碱基编辑靶基因启动子失活基因的方法

Publications (2)

Publication Number Publication Date
CN112746083A true CN112746083A (zh) 2021-05-04
CN112746083B CN112746083B (zh) 2023-08-11

Family

ID=75647840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011444311.9A Active CN112746083B (zh) 2020-12-11 2020-12-11 一种通过单碱基编辑靶基因启动子失活基因的方法

Country Status (1)

Country Link
CN (1) CN112746083B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114561429A (zh) * 2022-03-22 2022-05-31 绍兴市妇幼保健院 一种基于碱基编辑atg起始密码子抑制hbv表面抗原的治疗方法
CN114686456A (zh) * 2022-05-10 2022-07-01 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
WO2023141734A1 (zh) * 2022-01-25 2023-08-03 西北农林科技大学 一种改造后的先导编辑系统及其应用
CN117720672A (zh) * 2024-02-07 2024-03-19 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050037357A1 (en) * 2001-11-29 2005-02-17 Christoph Charle Method for analyzing translation-controlled gene expression
US20060166922A1 (en) * 2005-01-27 2006-07-27 Eichler Duane C Polynucleotides targeted against the extended 5'-UTR region of argininosuccinate synthase and uses thereof
CN106148344A (zh) * 2016-06-30 2016-11-23 中国农业大学 一种具有增强植物基因表达活性的5′utr序列及其应用
CN109694872A (zh) * 2017-10-19 2019-04-30 中国科学院遗传与发育生物学研究所 调控基因表达的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050037357A1 (en) * 2001-11-29 2005-02-17 Christoph Charle Method for analyzing translation-controlled gene expression
US20060166922A1 (en) * 2005-01-27 2006-07-27 Eichler Duane C Polynucleotides targeted against the extended 5'-UTR region of argininosuccinate synthase and uses thereof
CN106148344A (zh) * 2016-06-30 2016-11-23 中国农业大学 一种具有增强植物基因表达活性的5′utr序列及其应用
CN109694872A (zh) * 2017-10-19 2019-04-30 中国科学院遗传与发育生物学研究所 调控基因表达的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LAURA C. PENDLETON ET AL.: "Regulation of Endothelial Argininosuccinate Synthase Expression and NO Production by an Upstream Open Reading Frame", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 *
叶宇华 等: "人类珠蛋白相关基因上游开放阅读框的变异分析", 《遗传》 *
邵洁 等: "植物合成生物学的现在与未来", 《合成生物学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023141734A1 (zh) * 2022-01-25 2023-08-03 西北农林科技大学 一种改造后的先导编辑系统及其应用
CN114561429A (zh) * 2022-03-22 2022-05-31 绍兴市妇幼保健院 一种基于碱基编辑atg起始密码子抑制hbv表面抗原的治疗方法
CN114686456A (zh) * 2022-05-10 2022-07-01 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN114686456B (zh) * 2022-05-10 2023-02-17 中山大学 基于双分子脱氨酶互补的碱基编辑系统及其应用
CN117720672A (zh) * 2024-02-07 2024-03-19 深锐(天津)生物医学有限公司 先导编辑系统及其应用
CN117720672B (zh) * 2024-02-07 2024-04-30 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Also Published As

Publication number Publication date
CN112746083B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN112746083B (zh) 一种通过单碱基编辑靶基因启动子失活基因的方法
KR101992494B1 (ko) 제초제 내성 대두 식물 및 그의 동정 방법
Weeks et al. Development of an in planta method for transformation of alfalfa (Medicago sativa)
CN107988246A (zh) 一种基因敲除载体及其斑马鱼胶质瘤模型
CN111909958B (zh) 血管平滑肌细胞条件性敲除Yap1基因小鼠模型的构建
EP0570422A1 (en) Stamen-specific promoters from corn
BR112015004864B1 (pt) Método para gerar uma célula de planta transgênica compreendendo um polinucleotídeo de interesse
Naylor et al. Construction and properties of a gene-silencing vector based on Poplar mosaic virus (genus Carlavirus)
KR101995698B1 (ko) 식물 게놈 공학에서 통상적으로 사용되는 뉴클레오티드 서열에서 식물 게놈을 변경하는 방법 및 수단
CN110343698B (zh) 构建B2m定点敲入人B2M cDNA小鼠模型的方法
Ferradini et al. Assessment of simple marker-free genetic transformation techniques in alfalfa
Johnson et al. Rapid and highly efficient morphogenic gene-mediated hexaploid wheat transformation
US6603062B1 (en) Method for producing transgenic plants with modified 5-aminolevulinic acid biosynthesis, method for identifying 5-aminolevulinic acid synthesis effectors
Dutt et al. Bifunctional selection–reporter systems for genetic transformation of citrus: mannose-and kanamycin-based systems
Germundsson et al. P1-and VPg-transgenic plants show similar resistance to Potato virus A and may compromise long distance movement of the virus in plant sections expressing RNA silencing-based resistance
CN110982832B (zh) 一种辐射生物剂量计、制备方法及应用
CN107674876B (zh) MoKCS基因、该基因编码的酶及其应用
KR101206928B1 (ko) 배추속 식물의 자가불화합성 인자에 대한 rna 간섭 카세트, 그를 포함하는 벡터 및 상기 rna 간섭 카세트가 도입된 형질전환 배추속 식물
CN115247166A (zh) 一种蛋白酶突变体
CN111378677A (zh) 一种dna组装的方法及其应用
CA2394792C (en) Promoter and intron from maize actin depolymerizing factor
KR20190056576A (ko) 구제역 sat2형 zim의 방어항원이 발현되는 재조합 바이러스
KR101925466B1 (ko) 토마토잎말림방글라데시바이러스 베타 위성 dna를 접종할 수 있는 감염성 클론 및 이의 용도
KR101962902B1 (ko) 칠리잎말림바이러스를 접종할 수 있는 감염성 클론 및 이의 용도
JP2023546008A (ja) ゲノム編集試薬を送達するための接ぎ木植物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant