CN107043779B - 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用 - Google Patents

一种CRISPR/nCas9介导的定点碱基替换在植物中的应用 Download PDF

Info

Publication number
CN107043779B
CN107043779B CN201710098892.7A CN201710098892A CN107043779B CN 107043779 B CN107043779 B CN 107043779B CN 201710098892 A CN201710098892 A CN 201710098892A CN 107043779 B CN107043779 B CN 107043779B
Authority
CN
China
Prior art keywords
sequence
gene
plant
deaminase
ncas9
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710098892.7A
Other languages
English (en)
Other versions
CN107043779A (zh
Inventor
夏兰琴
孙永伟
赵云德
李晶莹
杜晋鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Crop Sciences of Chinese Academy of Agricultural Sciences filed Critical Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Publication of CN107043779A publication Critical patent/CN107043779A/zh
Application granted granted Critical
Publication of CN107043779B publication Critical patent/CN107043779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/10Vectors comprising a non-peptidic targeting moiety

Abstract

本发明公开了一种CRISPR/nCas9介导的定点碱基替换在植物中的应用。本发明提供了一种定点编辑植物基因组的系统,该系统包括BE3植物表达载体(表达由nCas9(D10A)、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白),并以水稻OsPDS和OsSBEIIb为靶基因对该系统进行验证。结果表明,在所选的3个靶点中,均获得预期定点突变植株,在水稻中实现了碱基的精确的点突变,且效率最高达到20%左右,为农作物育种提供了一种可行的有效的碱基替换方法,在农业育种方面具有强大的应用潜力,为快速改良农作物重要农艺性状提供了基础。

Description

一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
技术领域
本发明属于生物技术领域,具体涉及一种CRISPR/nCas9介导的定点碱基替换在植物中的应用。
背景技术
CRISPR/Cas9介导的基因组编辑技术已经成为分子生物学中最强大的工具之一。首次在细菌中发现,由sgRNA和Cas9两部分组成(Jinek et al.,2012)。CRISPR/Cas9是通过自身的核酸内切酶活性引起靶位点DNA序列双链断裂(double-strand breaks,DSBs),然后通过非同源末端连接(non-homologous end joining,NHEJ)或同源重组介导的修复(homology-directed repair,HDR)两种方式引入突变。NHEJ途径诱导产生的突变大部分为核苷酸的插入或缺失,造成移码突变,而HDR则由同源供体DNA介导片段插入或核苷酸修正(Jinek et al.,2012)。CRISPR/Cas9系统对靶位点的识别依赖于核酸之间碱基互补配对,可对任何紧随PAM(NGG)的20bp的靶点序列进行编辑,且其靶点在基因组中的分布频率很高,因此对于需要定点编辑的靶基因,更容易找到合适的靶位点。另外CRISPR/Cas9系统可同时对同一基因的不同位点或多个基因的位点进行定向编辑,使其运用更加灵活。此外,CRISPR/Cas9系统操作简单快捷,每次打靶只需替换原有载体上20-30bp的核苷酸序列,更适宜规模化,高通量操作(Cong et al.,2013;Feng et al.,2014;Gao and Zhao,2014;Zhou et al.,2014;Lawrenson et al.,2015;Liu et al.,2015;Ma et al.,2015;Wang etal.,2015;Xie et al.,2015;Paul III and Qi,2016)。随着CRISPR/Cas9技术在人类与动物细胞系中建立并应用,经过改造的CRISPR/Cas9系统也迅速地被应用到拟南芥、烟草、高粱、水稻、小麦、玉米等不同植物基因组的定向编辑研究中,并且获得较高的诱导突变率和可稳定遗传的基因组编辑植株(Shan et al.,2013;Puchta and Fauser,2014;Voytas andGao,2014;Li et al.,2015;Ma et al.,2015;Svitashev et al.,2015;Endo et al.,2016;Gao et al.,2016;Sun et al.,2016)。
尽管CRISPR/Cas9作为一种新的靶向基因修饰技术,展现了广阔的发展潜力和应用前景,并在农作物改良中得到广泛应用,但目前主要局限于基因随机突变和敲除。农作物中含有大量农艺性状是由单碱基的突变导致,传统CRISPR/Cas9技术引入DSB后,与非同源末端连接的随机过程相比,HDR总是以相当低的频率发生,只有少数报道表明CRISPR/Cas9介导的HDR在作物中可行(Li et al.,2015;Svitashev et al.,2015;Endo et al.,2016;Shi et al.,2016;Sun et al.,2016),使得大量农艺性状无法得到快速的改良。
Nishida et al.(2016)将dCas9或nicked-Cas9(nCas9,D10A)与来自七鳃鳗(sealamprey)免疫系统的激活诱导性胞苷脱氨(activation-induced cytidine deaminase,AID)融合在一起。在正常情况下,这种AID酶在免疫球蛋白和抗体基因中产生突变从而让免疫系统具有多样性。AID作用在单链DNA上,将胞嘧啶(C)替换为尿嘧啶(U),随后在一轮DNA复制中,这种尿嘧啶(U)被转化为胸腺嘧啶(T)。研究结果表明当在向导RNA(gRNA)的引导下,这种蛋白复合物靶向作用于CAN1基因,而且相对于非靶向的选择性标志物,CAN1基因发生突变的频率增加了1000倍。利用全基因组测序,研究人员发现很少的脱靶突变,只比背景突变率略有增加。Komor et al.(2016)将nCas9(D10A)与胞苷脱氨酶融合,在gRNA的指导下,nCas9(D10A)到达指定位点,可作为“单碱基编辑器”将在非目标链的第4-8位目标胞嘧啶定点替换。通 过DNA复制或修复后,尿嘧啶被转化成胸腺嘧啶,最终由C突变成T,或者G突变成A。
发明内容
本发明的一个目的是提供如下(1)-(7)中任一种所述的应用:
(1)CRISPR/Cas9系统、脱氨酶和植物基因表达启动子在定点编辑植物或农作物基因中的应用;
所述植物基因表达启动子启动CRISPR/Cas9系统中Cas9核酸酶和脱氨酶的表达;
(2)CRISPR/Cas9系统和脱氨酶在定点编辑植物或农作物基因中的应用;
(3)由Cas9核酸酶和脱氨酶组成的融合蛋白、待编辑基因的sgRNA和植物基因表达启动子在定点编辑植物或农作物基因中的应用;
所述植物基因表达启动子驱动由所述Cas9核酸酶和所述脱氨酶组成的融合蛋白基因的表达;
(4)CRISPR/Cas9系统、脱氨酶、尿嘧啶DNA糖基化酶抑制蛋白和植物基因表达启动子在定点编辑植物或农作物基因中的应用;
所述植物基因表达启动子启动CRISPR/Cas9系统中Cas9核酸酶、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白的表达;
(5)CRISPR/Cas9系统、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白在定点编辑植物或农作物基因中的应用;
(6)由Cas9核酸酶、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白、待编辑基因的sgRNA和植物基因表达启动子在定点编辑植物或农作物基因中的应用;
所述植物基因表达启动子驱动由所述Cas9核酸酶、所述脱氨酶和所述尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因的表达;
(7)由Cas9核酸酶、脱氨酶、连接所述Cas9核酸酶与所述脱氨酶的连接肽和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白、待编辑基因的sgRNA和植物基因表达启动子在定点编辑植物或农作物基因中的应用;
所述植物基因表达启动子驱动由所述Cas9核酸酶、所述脱氨酶、所述连接肽和所述尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因的表达。
上述应用中,所述脱氨酶为APOBEC1,其编码基因序列为序列1第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白为Uracil DNA glycosylase inhibitor,其编码基因序列为序列1第392-688位;
所述Cas9核酸酶为nCas9(D10A),其编码基因序列为序列1第689-4789位;
所述连接肽的编码基因序列为序列1第4790-4837位;
所述植物基因表达启动子的核苷酸序列为序列1第5545-7535位;
所述融合蛋白的编码基因序列为序列1第392-5524位;
所述待编辑基因为OsSBEIIb和OsPDS;
所述sgRNA的核苷酸序列为序列1第7785-8268位或序列2第7785-8268位或序列3第7785-8268位。
本发明的另一个目的是提供一种定点编辑植物或农作物基因的方法。
本发明提供的方法为如下(1)或(2):
(1)所述方法包括如下步骤:将Cas9核酸酶编码基因、脱氨酶编码基因、待编辑基因的sgRNA的编码基因和植物基因启动子导入出发植物,实现出发植物中靶基因的定点编辑;
(2)所述方法包括如下步骤:将Cas9核酸酶编码基因、脱氨酶编码基因、连接所述Cas9核酸酶与所述脱氨酶的连接肽的编码基因、尿嘧啶DNA糖基化酶抑制蛋白的编码基因、待编辑基因的sgRNA的编码基因和植物基因启动子导入出发植物,实现出发植物中靶基因的定点编辑。
上述方法中,
(1)中,所述Cas9核酸酶编码基因、所述脱氨酶编码基因、所述待编辑基因的sgRNA的编码基因和所述植物基因启动子通过重组质粒导入出发植物中;
所述重组质粒包括由Cas9核酸酶和脱氨酶组成融合蛋白的编码基因、所述待编辑基因的sgRNA的编码基因和植物基因启动子;
所述植物基因启动子驱动由所述Cas9核酸酶和所述脱氨酶组成的融合蛋白基因的表达;
(2)中,所述Cas9核酸酶编码基因、所述脱氨酶编码基因、所述连接所述Cas9核酸酶与所述脱氨酶的连接肽的编码基因、所述尿嘧啶DNA糖基化酶抑制蛋白基因、所述待编辑基因的sgRNA的编码基因和所述植物基因启动子通过重组质粒导入出发植物中;
所述重组质粒包括由Cas9核酸酶、脱氨酶、连接所述Cas9核酸酶与所述脱氨酶的连接肽和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因、所述待编辑基因的sgRNA的编码基因和植物基因启动子;
所述植物基因启动子驱动由所述Cas9核酸酶、所述脱氨酶、所述连接所述Cas9核酸酶与所述脱氨酶的连接肽和所述尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因的表达。
上述方法中,所述脱氨酶为APOBEC1,其编码基因序列为序列1第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白为Uracil DNA glycosylase inhibitor,其编码基因序列为序列1第392-688位;
所述Cas9核酸酶为nCas9(D10A),其编码基因序列为序列1第689-4789位;
所述连接肽的编码基因序列为序列1第4790-4837位;
所述植物基因表达启动子的核苷酸序列为序列1第5545-7535位;
所述融合蛋白的编码基因序列为序列1第392-5524位;
所述待编辑基因为OsSBEIIb和OsPDS;
所述sgRNA的核苷酸序列为序列1第7785-8268位或序列2第7785-8268位或序列3第7785-8268位。
上述方法中,所述重组质粒的核苷酸序列为序列1、序列2或序列3。
上述方法中,所述植物为单子叶植物或双子叶植物;所述单子叶植物具体为水稻;所述水稻品种具体为Kitaake(Oryza sativa L.subsp.japonica)。
上述重组质粒也属于本发明的保护范围。
本发明还有一个目的是提供一种定点编辑植物基因组的系统。
本发明提供的定点编辑植物基因组的系统包括上述重组质粒。
本发明的最后一个目的是提供上述重组质粒或上述系统的新用途。
本发明提供了上述重组质粒或上述系统在定点编辑植物或农作物基因中的应用。
上述应用或方法中,所述定点编辑为定点碱基替换。
上述应用或方法中,所述CRISPR/Cas9系统为CRISPR/nCas9系统,所述CRISPR/nCas9系统具体为CRISPR/nCas9(D10A)系统。
本发明提供了一种定点编辑植物基因组的系统,该系统包括BE3植物表达载体,BE3植物表达载体表达由nCas9(D10A)、脱氨酶(APOBEC1)和尿嘧啶DNA糖基化酶抑制蛋白(UGI)组成的融合蛋白,并以水稻OsPDS和OsSBEIIb为靶基因对该系统进行验证。结果表明,在所选的3个靶点中,均获得预期定点突变植株,既在靶点序列的4-8位置的C突变成T(或G突变成A),在水稻中实现了碱基的精确的点突变,且效率最高达到20%左右,而且该方法操作简单、可行,与构建CRISPR/Cas9并无明显差别,为农作物育种提供了一种可行的有效的碱基替换方法,在农业育种方面具有强大的应用潜力,为快速改良农作物重要农艺性状提供了基础。
附图说明
图1为pCXUN-BE3载体框架图。
图2为转基因植株的鉴定。注:A为载体T-DNA结构图及引物所在位置。B,C和D分别为P2,S3和S5转基因植株的Cas9(D10A),gRNA及hptII基因的检测。
图3为OsSBEIIb基因S5靶点的转基因植株及序列的鉴定。注:A为BE3定点突变系统原理图。B为OsSBEIIb基因结构图及S5靶点所在位置,PCR产物酶切鉴定图。“+”表示PCR产物经过酶切,“-”表示PCR产物没经过酶切。C为所有植株PCR产物的克隆测序结果。D为S5-17和S5-26两个株系基因型测序峰图。PAM由蓝色表示,预期突变成的碱基由红色表示,非预期的突变碱基由绿色表示。
图4为OsSBEIIb基因S3靶点的转基因植株及序列的鉴定。注:A为OsSBEIIb基因结构图及S3靶点所在位置,PCR产物电泳图。B为所有植株PCR产物的克隆测序结果。C为S3-1和S3-18两个株系基因型测序峰图。PAM由蓝色表示,预期突变成的碱基由红色表示,非预期的突变碱基由绿色表示。
图5为OsSBEIIb基因P2靶点的转基因植株及序列的鉴定。注:A为OsSBEIIb基因结构图及P2靶点所在位置,PCR产物酶切鉴定图。“+”表示PCR产物经过酶切,“-”表示PCR产物没经过酶切。C为所有植株PCR产物的克隆测序结果。D为P2-21和P2-79两个株系基因型测序峰图。PAM由蓝色表示,预期突变成的碱基由红色表示,非预期的突变碱基由绿色表示。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中的定量试验,均设置三次重复实验,结果取平均值。
下述实施例中的用于水稻转化的水稻材料为Kitaake(Oryza sativaL.subsp.japonica),由中国农业科学院作物科学研究所获得。
下述实施例中的pCMV-BE3载体在文献“Komor AC,Kim YB,Packer MS,Zuris JA,Liu DR.2016.Programmable editing of a target base in genomic DNA withoutdouble-stranded DNA cleavage.Nature.”中公开过,公众可以从中国农业科学院作物科学研究所获得。
下述实施例中所用的内切酶、试剂盒和PCR酶均购自试剂公司,其他试剂均为国产分析纯。
下述实施例中的引物和DNA合成及测序均在华大公司完成。
下述实施例中的AAM培养基(pH 5.2)是将MS salts&vitamins盐、蔗糖、MES、葡萄糖、酪蛋白氨基酸、乙酰丁香酮和100ml 10x AA amino acids混匀得到的培养基,其中各溶质在AAM培养基中的浓度分别为4.3g/L MS salts&vitamins盐、68.5g/L蔗糖、0.5g/L MES、36g/L葡萄糖、500mg/L酪蛋白氨基酸、40mg/L乙酰丁香酮。上述10x AA amino acids溶液为将L-谷氨酰胺、L-天(门)冬氨酸、L-精氨酸、甘氨酸和水混匀得到的溶液,其中各溶质在10xAA amino acids溶液中的浓度为:8.76g/L L-谷氨酰胺、2.66g/L L-天(门)冬氨酸、1.74g/L L-精氨酸和75mg/L甘氨酸。
下述实施例中的R1培养基(pH 5.8)是将MS&Vitamins盐、蔗糖、MES、酪蛋白氨基酸、L-脯氨酸、2,4-D、植物凝胶和水混匀得到的培养基,其中各溶质在R1培养基中的浓度分别为:4.3g/L MS&Vitamins盐、30g/L蔗糖、0.5g/L MES、300mg/L酪蛋白氨基酸、2.8g/L L-脯氨酸、2mg/L 2,4-D、4g/L植物凝胶。
下述实施例中的R2培养基(pH 5.2)是将MS&Vitamins盐、蔗糖、MES、酪蛋白氨基酸、2,4-D、植物凝胶、乙酰丁香酮和水混匀得到的培养基,其中各溶质在R2培养基中的浓度分别为:4.3g/L MS&Vitamins盐、30g/L蔗糖、0.5g/L MES、300mg/L酪蛋白氨基酸、2mg/L 2,4-D、4g/L植物凝胶、20mg/ml乙酰丁香酮。
下述实施例中的R1筛选培养基(pH 5.8)是将MS&Vitamins盐、蔗糖、MES、酪蛋白氨基酸、L-脯氨酸、2,4-D、植物凝胶和水混匀得到的培养基,其中各溶质在R1筛选培养基中的浓度为:4.3g/L MS&Vitamins盐、30g/L蔗糖、0.5g/L MES、300mg/L酪蛋白氨基酸、2.8g/LL-脯氨酸、2mg/L 2,4-D、4g/L植物凝胶。
下述实施例中的R4分化培养基(pH 5.8)是将MS&Vitamins盐、蔗糖、MES、酪蛋白氨基酸、山梨醇、激动素、NAA、植物凝胶和水混匀得到的培养基,其中各溶质在R4分化培养基中的浓度分别为:4.3g/L MS&Vitamins盐、30g/L蔗糖、0.5g/L MES、2g/L酪蛋白氨基酸、30g/L山梨醇、2mg/L激动素、1mg/L NAA、4g/L植物凝胶。
下述实施例中的R5培养基(pH 5.8)是将MS&Vitamins盐、蔗糖、MES、植物凝胶和水混匀得到的培养基,其中各溶质在R5培养基中的浓度分别为:2.15g/L MS&Vitamins盐、15g/L蔗糖、0.5g/L MES、2g/L植物凝胶。
下述实施例中所用的引物如表1所示:
表1、引物序列
Figure RE-GDA0001256189220000051
Figure RE-GDA0001256189220000061
下述实施例中靶点位置及序列如表2所示。
表2、靶点位置及序列
Figure BDA0001231093850000062
注:PAM位点由波浪线表示,脱氨酶靶点由加粗黑体表示,G#和C#,#代表碱基所在位置,远离PAM位点的起始位点为第一个碱基。酶切位点由下划线表示。
实施例1、一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
一、表达载体的构建
1、pCXUN-BE3载体的构建
(1)用限制性内切酶BamHI酶切pCXUN-Cas9载体,得到线性化的载体;
(2)以BE-F/R为引物,pCMV-BE3载体为模板进行PCR扩增,得到PCR产物,该PCR产物的5’和3’最末端的序列分别和线性化载体两末端序列完全一致;
(3)采用全式金公司的pEASY-Uni Seamless Cloning and Assembly Kit将步骤(1)获得的线性化的载体、步骤(2)获得的PCR产物通过同源重组进行连接,获得载体pCXUN-BE3(图1),从图中可以看出:pCXUN-BE3载体包括表达盒甲,该表达盒甲依次包括玉米Ubiquitin启动子、脱氨酶(APOBEC1)的编码基因、连接nCas9(D10A)核酸酶和脱氨酶的连接肽(XTEN Linker)、nCas9(D10A)核酸酶的编码基因、植物表达启动子Ubi、尿嘧啶DNA糖基化酶抑制蛋白(UGI)的编码基因。
2、利用重叠PCR方法构建P2、S3及S5的gRNA表达盒pCXUN-BE3-P2、pCXUN-BE3-S3和pCXUN-BE3-S5载体
(1)S5的gRNA表达盒pCXUN-BE3-S5的构建
A、用限制性内切酶Pme I酶切pCXUN-BE3载体,得到线性化的载体;
B、以pOsU3-sgRNA质粒为模板,分别利用引物S5-F/hrpme-u3R和hrpme-u3F/S5-R进行PCR扩增,并将扩增产物1:1混合后做为模板,用引物hrpme-u3F/hrpme-u3R进行扩增,回收PCR产物;
C、采用全式金公司的pEASY-Uni Seamless Cloning and Assembly Kit将步骤A获得的线性化的载体、步骤B获得的PCR产物通过同源重组进行连接,鉴定阳性克隆并测序验证,得到S5的gRNA表达盒pCXUN-BE3-S5。
经过测序验证:S5的gRNA表达盒pCXUN-BE3-S5的核苷酸序列为序列1,其中序列1的第392-5524位为由nCas9(D10A)核酸酶、脱氨酶(APOBEC1)、连接nCas9(D10A)核酸酶和脱氨酶的连接肽(XTEN Linker)、尿嘧啶DNA糖基化酶抑制蛋白(UGI)组成的融合蛋白BE3的编码基因序列、第5545-7535位为植物基因表达启动子Ubi的核苷酸序列,第7785-8268位为sgRNA序列。
(2)S3的gRNA表达盒pCXUN-BE3-S3的构建
A、用限制性内切酶PmeI酶切pCXUN-BE3载体,得到线性化的载体;
B、以pOsU3-sgRNA质粒为模板,分别利用引物S3-F/hrpme-u3R和hrpme-u3F/S3-R进行PCR扩增,并将扩增产物1:1混合后做为模板,用引物hrpme-u3F/hrpme-u3R进行扩增,回收PCR产物;
C、采用全式金公司的pEASY-Uni Seamless Cloning and Assembly Kit将步骤A获得的线性化的载体、步骤B获得的PCR产物通过同源重组进行连接,鉴定阳性克隆并测序验证,得到S3的gRNA表达盒pCXUN-BE3-S3。
经过测序验证:S3的gRNA表达盒pCXUN-BE3-S3的核苷酸序列为序列2,其中序列2的第392-5524位为由nCas9(D10A)核酸酶、脱氨酶(APOBEC1)、连接nCas9(D10A)核酸酶和脱氨酶的连接肽(XTEN Linker)、尿嘧啶DNA糖基化酶抑制蛋白(UGI)组成的融合蛋白BE3的编码基因序列、第5545-7535位为植物基因表达启动子Ubi的核苷酸序列,第7785-8268位为sgRNA序列。
(3)P2的gRNA表达盒pCXUN-BE3-P2的构建
A、用限制性内切酶Pme I酶切pCXUN-BE3载体,得到线性化的载体;
B、以pOsU3-sgRNA质粒为模板,分别利用引物P2-F/hrpme-u3R和hrpme-u3F/P2-R进行PCR扩增,并将扩增产物1:1混合后做为模板,用引物hrpme-u3F/hrpme-u3R进行扩增,回收PCR产物;
C、采用全式金公司的pEASY-Uni Seamless Cloning and Assembly Kit将步骤A获得的线性化的载体、步骤B获得的PCR产物通过同源重组进行连接,鉴定阳性克隆并测序验证,得到P2的gRNA表达盒pCXUN-BE3-P2。
经过测序验证:P2的gRNA表达盒pCXUN-BE3-P2的核苷酸序列为序列3,其中序列3的第392-5524位为由nCas9(D10A)核酸酶、脱氨酶(APOBEC1)、连接nCas9(D10A)核酸酶和脱氨酶的连接肽(XTEN Linker)、尿嘧啶DNA糖基化酶抑制蛋白(UGI)组成的融合蛋白BE3的编码基因序列、第5545-7535位为植物基因表达启动子Ubi的核苷酸序列,第7785-8268位为sgRNA序列。
二、重组菌的构建
分别将步骤一获得的重组质粒pCXUN-BE3-S5、pCXUN-BE3-S3和pCXUN-BE3-P2导入农杆菌EHA105,分别得到重组农杆菌pCXUN-BE3-S5/EHA105、pCXUN-BE3-S3/EHA105和pCXUN-BE3-P2/EHA105。
三、转基因水稻的获得
1、分别将重组农杆菌pCXUN-BE3-S5/EHA105、pCXUN-BE3-S3/EHA105及pCXUN-BE3-P2/EHA105在LB培养基上培养两天后,收集农杆菌,并用AAM培养基重悬,OD600调到0.3-0.5,分别得到OD600为0.3-0.5的菌液。
2、选取饱满的kitaake水稻种子,剥去种皮,灭菌洗涤后,均匀的点入R1培养基中,28℃持续光照2-3周诱导愈伤组织的形成。将形成的愈伤组织转移到新的R1培养基上培养3-5天,然后分别转移到上述OD600为0.3-0.5的菌液中侵染5分钟,侵染后用滤纸吸干表面菌液并转移到R2培养基上在25℃下培养三天,再转移至含有浓度为50mg/L潮霉素的R1筛选培养基上,在28℃条件下持续光照2周后转移至新的含有浓度为50mg/L潮霉素的R1筛选培养基,在28℃条件下持续光照2周。选取生长良好呈嫩黄色的阳性愈伤组织,用无菌镊子移至含有浓度为50mg/L潮霉素的R4分化培养基中,在28℃条件下持续光照培养。待分化出来的幼苗长至2-5mm时,将幼苗转入不含激素和抗生素的R5培养基中,在28℃条件下持续光照培养2-3周,之后移入土中置于温室中生长(培养条件为:温度28-30℃,光照为16h光照/8h黑暗),分别得到T0代转P2水稻植株、T0代转S3水稻植株和T0代转S5水稻植株。
3、转基因水稻植株的鉴定
根据载体序列分别设计检测BE3,gRNA和hptII基因引物BE3-F/R,U3-F/R和HPTII-F/R(表2),对获得的所有T0代转S5水稻植株、T0代转S3水稻植株和T0代转P2水稻植株进行PCR鉴定并统计结果。
转基因水稻植株的PCR鉴定结果如图2所示。结果表明:共获得52颗阳性T0代转S5水稻植株、38颗阳性T0代转S3水稻植株及88颗阳性T0代转P2水稻植株。
四、定点编辑的检测
1、定点编辑OsSBEIIb的S5靶点的基因型鉴定
利用引物S5testF/R对步骤三获得的52颗阳性T0代转S5水稻植株的基因组DNA进行扩增,得到PCR产物,用BstNI酶切PCR产物,如果转S5水稻植株中的靶点序列发生所期待的突变,则该转S5水稻植株对应的PCR产物将无法被相对应的限制性内切酶BstNI酶切。
酶切鉴定结果表明:52颗阳性T0代转S5水稻植株中共有23颗阳性T0代转S5水稻植株的PCR产物完全不能或者部分不能被BstNI切开,说明在该酶切位点处发生突变,将上述23颗植株记作定点突变的植株,并对其进行测序。
测序结果如图3所示。根据测序结果可以将23颗定点突变的植株分成如下三类:第一类共有10颗植株,为第五位和第六位碱基由G突变成A(G5突变成A5和G6突变成A6),其中,3颗植株为纯合类型(两条同源染色体的第五位和第六位碱基均由G突变成A,S5-17、S5-36、和S5-46)、6颗为杂合类型(S5-1、S5-8、S5-21、S5-33、S5-42和S5-43),1颗为双等位突变类型(S5-34),第一类(期待突变类型)占所有突变类型的43%(10/23),相对于所有转基因植株而言,效率达到20%(10/52);第二类共有8颗植株,为同时包含第五位和/或第六位碱基由G突变成A及G突变成C或者T,其中,一颗为纯合类型(S5-26),另外7颗为杂合类型(S5-10、S5-25、S5-44、S5-45、S5-48、S5-50和S5-52);第三类共有5颗植株, 这一类型突变均为非期待类型,主要是位点的插入和缺失,3颗为双等位突变(S5-18、S5-31和S4-47),2颗为杂合类型(S5-16和S5-23)。在S5靶点内同样含有其他的G,但都没有发生相应的突变。
2、定点编辑OsSBEIIb的S3靶点的基因型鉴定
利用引物S3testF/R对步骤三获得的38颗阳性T0代转S3水稻植株的基因组DNA进行扩增,得到PCR产物,并对PCR扩增产物直接测序。
测序结果如图4所示。测序结果表明,38颗阳性T0代转S3水稻植株中共有11颗定点突变的植株,根据测序结果可以将11颗定点突变的植株分成如下三类:第一类共包含4颗植株,为只含有所期待的突变类型(C突变成T),分别为S3-1,S3-4,S3-26和S3-29,其中,S3-1,S3-4和S3-29为纯合植株,S3-26为杂合型植株,杂合型植株S3-26的一条同源染色体上的三个靶位点均发生突变(第一,第二和第七位碱基均由C突变为T),另外一条同源染色体的三个靶位点均为野生型;第二类只有一颗植株,为S3-6,S3-6的一条同源染色体的第七位碱基由C突变为T,另外一条同源染色体的第七位碱基由C突变为G;第三类共有6颗植株,均为非期待的类型,其中,4颗为纯合类型,为第七位碱基均由C突变为G,另外2颗植株为一条链在第一位碱基和第七位碱基均由C突变成G,另外一条链仅第七位碱基由C突变成G。
3、定点编辑OsPDS的P2靶点的基因型鉴定
利用引物P2testF/R对获得88颗阳性T0代转P2水稻植株的基因组DNA进行扩增,得到PCR产物,用EcoRI酶切PCR产物,如果转P2水稻植株中的靶点序列发生所期待的突变,则该转P2水稻植株对应的PCR产物将无法被相对应的限制性内切酶BstNI酶切。
利用EcoRI酶切T0代转P2水稻植株的PCR产物,结果表明有2颗T0代转P2水稻植株(P2-21和P2-79)的PCR产物为部分切开,说明在该酶切位点处发生突变,将上述2颗植株记作定点突变的植株,并对其进行测序。
测序结果如图5所示。结果表明,P2-21和P2-79均为杂合类型,P2-21的一条同源染色体在靶点序列的第八位和第十位碱基均由G突变成A,另外一条同源染色体为野生型。P2-79的一条同源染色体在靶点序列的第八位碱基由G突变成C,第十位碱基没有发生变化,另外一条同源染色体为野生型。
序列表
<110>中国农业科学院作物科学研究所
<120>一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
<160>3
<210>1
<211>16981bp
<212>DNA
<213>人工序列
<220>
<223>
<400>1
gaattcgagc tcggtacccc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 60
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tcccgatcta 120
gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat attttgtttt 180
ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat ctcataaata 240
acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga aattatatga 300
taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc caaatgtttg 360
aacgatcggg gaaattcgga tccccaatac tttagacttt cctcttcttc ttgggagaac 420
caccagagag catcttaatc ttgttctcac cgttgctatc ctgtatgacc agagcccaag 480
gcttgtattc aggggcgtcg ctagtcagaa gcatgacatt ctcgtcggtg ctctcgtcgt 540
aggcggtgtg cacgagtata tcgctttccg gcttgttccc aatgacttct tccacctcct 600
ctgggagcat gaggatggat tcctggataa ccagttgctt accggtctcc ttttcaataa 660
tatctgacag attagtagaa ccaccagagt cacccccaag ctgtgacaaa tctatccgag 720
tttcatataa tcccgtgatg gattggtgaa tcagtgtcgc gtctagcacc tccttggtag 780
aagtgtatcg tttgcgatct atcgttgtgt caaaatactt gaatgcggct ggagcgccga 840
ggttggtaag agtaaacaaa tggataatat tttccgcctg ctcacgtatg ggtttatccc 900
tgtgcttgtt gtatgcgctt aatactttgt ccagattggc atcagctagg atgactctct 960
tactgaattc cgaaatttgc tctatgattt cgtcgagata atgtttgtgc tgctcaacaa 1020
aaagttgctt ctgttcgtta tcttcaggtg aacctttcaa cttctcgtaa tgggacgcta 1080
aatacaggaa attcacgtat ttagacggta gtgcgagttc gttccccttt tgaagctctc 1140
cggcgctagc caacatccgt tttcggccat tttctaactc aaacagacta tactttggta 1200
gtttaattat gagatccttt tttacttcct tgtaaccttt cgcctcaagg aagtcgatgg 1260
ggttcttttc aaaagacgag cgctccataa tcgttatccc caataattct ttgactgact 1320
tcagtttctt ggattttccc ttctcaactt ttgccactac taggacagaa taggcaactg 1380
tagggctatc gaagccaccg tactttttcg ggtcccagtc ctttttacga gcgatgagct 1440
tatcactatt cctttttgga agaatcgatt cctttgaaaa ccctccggtc tgcacctcag 1500
ttttctttac tatgttgact tggggcatgg acaaaacttt tctcaccgtc gcgaagtccc 1560
ggcccttatc ccatacgatt tcacctgtct ccccattggt ttcaattaaa ggtcgtttgc 1620
gtatctctcc gtttgccaga gtgatttccg tcttaaagaa attcataatg ttagaataaa 1680
agaagtattt ggctgtagcc ttgcctatct cctgttcgct tttcgcgatc atcttacgga 1740
cgtcataaac tttgtaatca ccatacacaa actcactttc tagcttcggg tatttcttaa 1800
tgagtgcggt ccctacgacg gcattaagat aagcgtcgtg cgcatggtgg tagttattta 1860
tctccctaac tttatagaat tgaaaatcct ttctgaagtc cgacaccaat tttgacttta 1920
aagtgattac tttgacttcc cgaatcagct tatcgttctc gtcgtatttc gtattcattc 1980
gggaatctag tatctgtgca acatgctttg tgatttggcg ggtttccacg agctgacgtt 2040
taataaatcc ggccttgtca agttcagaca agccacccct ctcagcttta gttaagttat 2100
cgaactttct ttgcgttatc agtttcgcat ttaggagctg ccgccaatag ttcttcattt 2160
tctttacgac ttcctcgctt ggaacattgt cacttttccc tcggttctta tccgagcgtg 2220
taagcacttt attgtcgatt gaatcgtcct tcaaaaagga ttggggtaca atgtgatcga 2280
cgtcgtaatc agataaacgg tttatgtcca gttcctgatc aacatacatg tcccttccat 2340
tttgtaggta atagaggtaa agtttctcgt tctgcaattg ggtattttcc acaggatgct 2400
cctttaagat ctggctgccc agttctttaa taccctcttc tattctcttc atccgctctc 2460
gactgttttt ttgccccttc tgagtcgttt gattttcgcg tgccatctcg attacaatgt 2520
tttccggttt gtgacgtccc atgaccttaa ctagctcatc cactactttg actgtctgga 2580
gtatgccctt tttgatggct ggcgaaccag caagattcgc aatatgttcg tgcaatgagt 2640
ccccttgtcc ggaaacctgt gccttttgta tatcctcttt gaaggttaaa gagtcatcat 2700
ggatcagctg cataaagttc ctattggcga agccgtcgct ctttagaaaa tcgagaatag 2760
ttttaccact ttgcttgtct cttatcccgt tgataagttt ccgcgacaat cgtccccagc 2820
ccgtatagcg acgcctcttt aactgtttca taaccttatc gtcgaacagg tgagcgtatg 2880
tttttagtct ttcctcaatc atttcccgat cttcaaagag ggtaagagtc aacactatat 2940
cttctaagat atcttcattc tcttcgttat ccaggaagtc cttatcttta attatcttta 3000
ggaggtcatg atacgtacca agtgacgcat taaatcgatc ttctaccccg gagatctcga 3060
cagaatcgaa gcattcaatt ttcttaaagt agtcctcttt caattgctta actgtcactt 3120
tgcggttggt cttgaataac agatctacta ttgctttctt ctgttctccg cttagaaagg 3180
cgggtttacg catgccctca gtgacatact taactttcgt gagttcattg tacactgtga 3240
aatactcgta aagtaaactg tgcttaggca atactttttc gttcggtaaa ttcttgtcaa 3300
agttggtcat cctctcgatg aacgattgag ctgacgcacc tttatcgaca acttcctcaa 3360
aattccatgg agtaatcgtt tcttcggact ttcttgtcat ccatgcgaac cgagagttcc 3420
ctcgggccag gggtcccaca tagtaaggta tgcgaaaggt taggattttc tcaatctttt 3480
cacgattgtc tttgaggaac ggataaaaat cctcctgcct tctaagtata gcatgcaatt 3540
cgcctaagtg gatttgatgt ggaatgctac cgttgtcgaa agtccgctgc tttcgcagta 3600
gatcttcgcg attgagtttt acaagcaact cttccgtccc atccatcttc tctaatatgg 3660
gtttgataaa cttgtagaat tcctcttgac tcgctccgcc gtcaatataa cctgcgtacc 3720
cgtttttcga ctgatcaaag aatatttcct tatatttctc aggcagttgc tgacggacta 3780
gggccttgag aagtgtcaag tcttggtgat gttcatcgta ccttttgatc attgaagcgg 3840
ataacggcgc cttggtaatc tcagtattaa ctctcagtat gtcagatagg aggattgcat 3900
cgctaaggtt tttggcagcc aaaaataagt ccgcatactg atctccaatt tgtgccagta 3960
gattgtcgag atcgtcatcg tacgtgtcct tactaagctg caatttggca tcttcagcta 4020
agtcgaagtt cgacttaaaa tttggtgtca ggcctagtga gagcgctata aggttaccga 4080
acaacccatt tttcttctct ccgggtaatt gtgcgatcag gttttctagc cgtcgggatt 4140
tagagaggcg ggcgctaaga atagccttcg catccacgcc acttgcattt atagggttct 4200
cttcaaacaa ctgattatag gtttgtacta actggatgaa cagtttgtcg acatccgagt 4260
tgtccggatt tagatcaccc tcaatgagaa agtgcccacg gaactttatc atatgggcaa 4320
gagccaagta gattaacctc aggtccgctt tatcagttga gtcaactagc ttttttctga 4380
ggtgataaat cgttgggtac ttttcatgat atgccacctc atctactatg tttccaaaga 4440
tggggtgccg ttcatgtttc ttgtcctctt cgacaaggaa ggactcttcc aaacggtgaa 4500
agaaagaatc gtcaactttg gccatctcat tgctaaaaat ttcttgtaag taacatattc 4560
ggttcttgcg acgtgtatac cttctccgag cggttcgttt caggcgagtc gcctctgccg 4620
tttcgccact atcgaatagg agggcaccga taagattctt tttaatcgaa tgacggtctg 4680
tgttccccaa caccttaaat ttctttgaag gtactttgta ttcatcggtt atgacagccc 4740
atccaacgga attagtgccg atggctaaac caatagaata ctttttatca ctttcgggtg 4800
tggcggactc tgaggtcccg ggagtctcgc tgccgctttt caacccggtg gcccagagaa 4860
tgtgtggggg cagtcgctgg taatgacaag actgaagagc gatggtaaag aatgtcagct 4920
gtggctgctt ccttctcaga atgttgagac aaggaggcag gcccagtatg atgcagtaca 4980
gttcaagaac gtacagtcgt acccacagat ggggatacct aggccagtgg gcttcattac 5040
tcgggctata attcacaaag tttctccagc agtatcctga ctcctgctca gtcataattt 5100
ggatagtcac acctgaagag atcaaatccc gcaggccttg tcgattgcgg gggtcagcgt 5160
ggtggtacag ccttgcgatg taaataaaca gagtgacgtg gggatacctt gacaggaatt 5220
cagtgatggc cctactacat tcgccgcatg ggctccagct gagaaaccag gtaatgctgc 5280
accttgtgtt cggacagaaa tatctttctg tcgtgaactt ctcgatgaag ttgacttcga 5340
cgtgcttgtt agtgttctgt gatgtatgtc gccaaatgga gtgccggccc ccccaattaa 5400
tttcgtaaag caggcaggtc tccttgcgga gctctctcgg atcgaagaat acctcaaact 5460
catggggctc gatccgccgt ctcaatgtgg ggtccacagc cactgggcca gtctctgagc 5520
tcatagtatt ggggatcccc cgggctgcag aagtaacacc aaacaacagg gtgagcatcg 5580
acaaaagaaa cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac 5640
atatagctgc tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat 5700
acttgtttat tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat 5760
gccatcatgt atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat 5820
atttccatcc atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa 5880
aattaataaa tacaccaggt agtttgaaac agtattctac tccgatctag aacgaatgaa 5940
cgaccgccca accacaccac atcatcacaa ccaagcgaac aaaaagcatc tctgtatatg 6000
catcagtaaa acccgcatca acatgtatac ctatcctaga tcgatatttc catccatcat 6060
cttcaattcg taactatgaa tatgtatggc acacacatac agatccaaaa ttaataaatc 6120
caccaggtag tttgaaacag aattctactc cgatctagaa cgaccgccca accagaccac 6180
atcatcacaa ccaagacaaa aaaaagcatg aaaagatgac ccgacaaaca agtgcacggc 6240
atatattgaa ataaaggaaa agggcaaacc aaaccctatg caacgaaaca aaaaaaatca 6300
tgaaatcgat cccgtctgcg gaacggctag agccatccca ggattcccca aagagaaaca 6360
ctggcaagtt agcaatcaga acgtgtctga cgtacaggtc gcatccgtgt acgaacgcta 6420
gcagcacgga tctaacacaa acacggatct aacacaaaca tgaacagaag tagaactacc 6480
gggccctaac catggaccgg aacgccgatc tagagaaggt agagaggggg ggggggggag 6540
gacgagcggc gtaccttgaa gcggaggtgc cgacgggtgg atttggggga gatctggttg 6600
tgtgtgtgtg cgctccgaac aacacgaggt tggggaaaga gggtgtggag ggggtgtcta 6660
tttattacgg cgggcgagga agggaaagcg aaggagcggt gggaaaggaa tcccccgtag 6720
ctgccgtgcc gtgagaggag gaggaggccg cctgccgtgc cggctcacgt ctgccgctcc 6780
gccacgcatt tctggatgcc gacagcggag caagtccaac ggtggagcgg aactctcgag 6840
aggggtccag aggcagcgac agagatgccg tgccgtctgc ttcgcttggc ccgacgcgac 6900
gctgctggtt cgctggttgg tgtccgttag actcgtcgac ggcgtttaac aggctggcat 6960
tatctactcg aaacaagaaa aatgtttcct tagttttttt aatttcttaa agggtatttg 7020
tttaattttt agtcacttta ttttattcta ttttatatct aaattattaa ataaaaaaac 7080
taaaatagag ttttagtttt cttaatttag aggctaaaat agaataaaat agatgtacta 7140
aaaaaattag tctataaaaa ccattaaccc taaaccctaa atggatgtac taataaaatg 7200
gatgaagtat tatataggtg aagctatttg caaaaaaaaa ggagaacaca tgcacactaa 7260
aaagataaaa ctgtagagtc ctgttgtcaa aatactcaat tgtcctttag accatgtcta 7320
actgttcatt tatatgattc tctaaaacac tgatattatt gtagtactat agattatatt 7380
attcgtagag taaagtttaa atatatgtat aaagatagat aaactgcact tcaaacaagt 7440
gtgacaaaaa aaatatgtgg taatttttta taacttagac atgcaatgct cattatctct 7500
agagaggggc acgaccgggt cacgctgcac tgcaggaatt cgatatcaag cttggcactg 7560
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 7620
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 7680
tcccaacagt tgcgcagcct gaatggcgaa tgctagagca gcttgagctt ggatcagatt 7740
gtcgtttccc gccttcagtt ttgcatgcct gcaggtcgac gattaaggaa tctttaaaca 7800
tacgaacaga tcacttaaag ttcttctgaa gcaacttaaa gttatcaggc atgcatggat 7860
cttggaggaa tcagatgtgc agtcagggac catagcacaa gacaggcgtc ttctactggt 7920
gctaccagca aatgctggaa gccgggaaca ctgggtacgt tggaaaccac gtgatgtgaa 7980
gaagtaagat aaactgtagg agaaaagcat ttcgtagtgg gccatgaagc ctttcaggac 8040
atgtattgca gtatgggccg gcccattacg caattggacg acaacaaaga ctagtattag 8100
taccacctcg gctatccaca tagatcaaag ctgatttaaa agagttgtgc agatgatccg 8160
tggcaggcac ctggacacga gacgcgtttt agagctagaa atagcaagtt aaaataaggc 8220
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttttcc acataatctc 8280
tagaggatcc aaactatcag tgtttgacag gatatattgg cgggtaaacc taagagaaaa 8340
gagcgtttat tagaataacg gatatttaaa agggcgtgaa aaggtttatc cgttcgtcca 8400
tttgtatgtg catgccaacc acagggttcc cctcgggatc aaagtacttt gatccaaccc 8460
ctccgctgct atagtgcagt cggcttctga cgttcagtgc agccgtcttc tgaaaacgac 8520
atgtcgcaca agtcctaagt tacgcgacag gctgccgccc tgcccttttc ctggcgtttt 8580
cttgtcgcgt gttttagtcg cataaagtag aatacttgcg actagaaccg gagacattac 8640
gccatgaaca agagcgccgc cgctggcctg ctgggctatg cccgcgtcag caccgacgac 8700
caggacttga ccaaccaacg ggccgaactg cacgcggccg gctgcaccaa gctgttttcc 8760
gagaagatca ccggcaccag gcgcgaccgc ccggagctgg ccaggatgct tgaccaccta 8820
gccctggcga cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc acccgcgacc 8880
tactggacat tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc ctggcagagc 8940
cgtgggccga caccaccacg ccggccggcc gcatggtgtt gaccgtgttc gccggcattg 9000
ccgagttcga gcgttcccta atcatcgacc gcacccggag cgggcgcgag gccgccaagg 9060
cccgaggcgt gaagtttggc ccccgcccta ccctcacccc ggcacagatc gcgcacgccc 9120
gcgagctgat cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg cttggcgtgc 9180
atcgctcgac cctgtaccgc gcacttgagc gcagcgagga agtgacgccc accgaggcca 9240
ggcggcgcgg tgccttccgt gaggacgcat tgaccgaggc cgacgccctg gcggccgccg 9300
agaatgaacg ccaagaggaa caagcatgaa accgcaccag gacggccagg acgaaccgtt 9360
tttcattacc gaagagatcg aggcggagat gatcgcggcc gggtacgtgt tcgagccgcc 9420
cgcgcacgtc tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg atgccaagct 9480
ggcggcctgg ccggccagct tggccgctga agaaaccgag cgccgccgtc taaaaaggtg 9540
atgtgtattt gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga tgcgatgagt 9600
aaataaacaa atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa ccagaaaggc 9660
gggtcaggca agacgaccat cgcaacccat ctagcccgcg ccctgcaact cgccggggcc 9720
gatgttctgt tagtcgattc cgatccccag ggcagtgccc gcgattgggc ggccgtgcgg 9780
gaagatcaac cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg cgacgtgaag 9840
gccatcggcc ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc ggacttggct 9900
gtgtccgcga tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag cccttacgac 9960
atatgggcaa ccgccgacct ggtggagctg gttaagcagc gcattgaggt cacggatgga 10020
aggctacaag cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat cggcggtgag 10080
gttgccgagg cgctggccgg gtacgagctg cccattcttg agtcccgtat cacgcagcgc 10140
gtgagctacc caggcactgc cgccgccggc acaaccgttc ttgaatcaga acccgagggc 10200
gacgctgccc gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact catttgagtt 10260
aatgaggtaa agagaaaatg agcaaaagca caaacacgct aagtgccggc cgtccgagcg 10320
cacgcagcag caaggctgca acgttggcca gcctggcaga cacgccagcc atgaagcggg 10380
tcaactttca gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg gtacgccaag 10440
gcaagaccat taccgagctg ctatctgaat acatcgcgca gctaccagag taaatgagca 10500
aatgaataaa tgagtagatg aattttagcg gctaaaggag gcggcatgga aaatcaagaa 10560
caaccaggca ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg ttggccaggc 10620
gtaagcggct gggttgtctg ccggccctgc aatggcactg gaacccccaa gcccgaggaa 10680
tcggcgtgac ggtcgcaaac catccggccc ggtacaaatc ggcgcggcgc tgggtgatga 10740
cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg caacgcatcg aggcagaagc 10800
acgccccggt gaatcgtggc aagcggccgc tgatcgaatc cgcaaagaat cccggcaacc 10860
gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag ggcgacgagc aaccagattt 10920
tttcgttccg atgctctatg acgtgggcac ccgcgatagt cgcagcatca tggacgtggc 10980
cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag gtgatccgct acgagcttcc 11040
agacgggcac gtagaggttt ccgcagggcc ggccggcatg gccagtgtgt gggattacga 11100
cctggtactg atggcggttt cccatctaac cgaatccatg aaccgatacc gggaagggaa 11160
gggagacaag cccggccgcg tgttccgtcc acacgttgcg gacgtactca agttctgccg 11220
gcgagccgat ggcggaaagc agaaagacga cctggtagaa acctgcattc ggttaaacac 11280
cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac ggccgcctgg tgacggtatc 11340
cgagggtgaa gccttgatta gccgctacaa gatcgtaaag agcgaaaccg ggcggccgga 11400
gtacatcgag atcgagctag ctgattggat gtaccgcgag atcacagaag gcaagaaccc 11460
ggacgtgctg acggttcacc ccgattactt tttgatcgat cccggcatcg gccgttttct 11520
ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc agatggttgt tcaagacgat 11580
ctacgaacgc agtggcagcg ccggagagtt caagaagttc tgtttcaccg tgcgcaagct 11640
gatcgggtca aatgacctgc cggagtacga tttgaaggag gaggcggggc aggctggccc 11700
gatcctagtc atgcgctacc gcaacctgat cgagggcgaa gcatccgccg gttcctaatg 11760
tacggagcag atgctagggc aaattgccct agcaggggaa aaaggtcgaa aaggtctctt 11820
tcctgtggat agcacgtaca ttgggaaccc aaagccgtac attgggaacc ggaacccgta 11880
cattgggaac ccaaagccgt acattgggaa ccggtcacac atgtaagtga ctgatataaa 11940
agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa cttattaaaa ctcttaaaac 12000
ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc gaagagctgc aaaaagcgcc 12060
tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg cgtcggccta tcgcggccgc 12120
tggccgctca aaaatggctg gcctacggcc aggcaatcta ccagggcgcg gacaagccgc 12180
gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc ctgcctcgcg cgtttcggtg 12240
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 12300
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 12360
gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc 12420
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 12480
aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 12540
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 12600
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 12660
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 12720
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 12780
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 12840
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 12900
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 12960
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 13020
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 13080
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 13140
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 13200
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 13260
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 13320
cgaaaactca cgttaaggga ttttggtcat gcattctagg tactaaaaca attcatccag 13380
taaaatataa tattttattt tctcccaatc aggcttgatc cccagtaagt caaaaaatag 13440
ctcgacatac tgttcttccc cgatatcctc cctgatcgac cggacgcaga aggcaatgtc 13500
ataccacttg tccgccctgc cgcttctccc aagatcaata aagccactta ctttgccatc 13560
tttcacaaag atgttgctgt ctcccaggtc gccgtgggaa aagacaagtt cctcttcggg 13620
cttttccgtc tttaaaaaat catacagctc gcgcggatct ttaaatggag tgtcttcttc 13680
ccagttttcg caatccacat cggccagatc gttattcagt aagtaatcca attcggctaa 13740
gcggctgtct aagctattcg tatagggaca atccgatatg tcgatggagt gaaagagcct 13800
gatgcactcc gcatacagct cgataatctt ttcagggctt tgttcatctt catactcttc 13860
cgagcaaagg acgccatcgg cctcactcat gagcagattg ctccagccat catgccgttc 13920
aaagtgcagg acctttggaa caggcagctt tccttccagc catagcatca tgtccttttc 13980
ccgttcaaca tcataggtgg tccctttata ccggctgtcc gtcattttta aatataggtt 14040
ttcattttct cccaccagct tatatacctt agcaggagac attccttccg tatcttttac 14100
gcagcggtat ttttcgatca gttttttcaa ttccggtgat attctcattt tagccattta 14160
ttatttcctt cctcttttct acagtattta aagatacccc aagaagctaa ttataacaag 14220
acgaactcca attcactgtt ccttgcattc taaaacctta aataccagaa aacagctttt 14280
tcaaagttgt tttcaaagtt ggcgtataac atagtatcga cggagccgat tttgaaaccg 14340
cggtgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac cctccgcgag 14400
atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc atcggtaaca 14460
tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg actgatgggc 14520
tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt tggctggctg 14580
gtggcaggat atattgtggt gtaaacaaat tgacgcttag acaacttaat aacacattgc 14640
ggacgttttt aatgtactga attaacgccg aattaattcg ggggatctgg attttagtac 14700
tggattttgg ttttaggaat tagaaatttt attgatagaa gtattttaca aatacaaata 14760
catactaagg gtttcttata tgctcaacac atgagcgaaa ccctatagga accctaattc 14820
ccttatctgg gaactactca cacattatta tggagaaact cgagcttgtc gatcgacaga 14880
tccggtcggc atctactcta tttctttgcc ctcggacgag tgctggggcg tcggtttcca 14940
ctatcggcga gtacttctac acagccatcg gtccagacgg ccgcgcttct gcgggcgatt 15000
tgtgtacgcc cgacagtccc ggctccggat cggacgattg cgtcgcatcg accctgcgcc 15060
caagctgcat catcgaaatt gccgtcaacc aagctctgat agagttggtc aagaccaatg 15120
cggagcatat acgcccggag tcgtggcgat cctgcaagct ccggatgcct ccgctcgaag 15180
tagcgcgtct gctgctccat acaagccaac cacggcctcc agaagaagat gttggcgacc 15240
tcgtattggg aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt tatgcggcca 15300
ttgtccgtca ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg gacttcgggg 15360
cagtcctcgg cccaaagcat cagctcatcg agagcctgcg cgacggacgc actgacggtg 15420
tcgtccatca cagtttgcca gtgatacaca tggggatcag caatcgcgca tatgaaatca 15480
cgccatgtag tgtattgacc gattccttgc ggtccgaatg ggccgaaccc gctcgtctgg 15540
ctaagatcgg ccgcagcgat cgcatccata gcctccgcga ccggttgtag aacagcgggc 15600
agttcggttt caggcaggtc ttgcaacgtg acaccctgtg cacggcggga gatgcaatag 15660
gtcaggctct cgctaaactc cccaatgtca agcacttccg gaatcgggag cgcggccgat 15720
gcaaagtgcc gataaacata acgatctttg tagaaaccat cggcgcagct atttacccgc 15780
aggacatatc cacgccctcc tacatcgaag ctgaaagcac gagattcttc gccctccgag 15840
agctgcatca ggtcggagac gctgtcgaac ttttcgatca gaaacttctc gacagacgtc 15900
gcggtgagtt caggcttttt catatctcat tgccccccgg atctgcgaaa gctcgagaga 15960
gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt 16020
ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag 16080
tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca 16140
cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa 16200
cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg 16260
tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta 16320
ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct 16380
tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag 16440
acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg 16500
gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt 16560
tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat 16620
ggaatccgag gaggtttccc gatattaccc tttgttgaaa agtctcaata gccctttggt 16680
cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt 16740
tggcaagctg ctctagccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 16800
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 16860
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 16920
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 16980
c 16981
<210>2
<211>16981bp
<212>DNA
<213>人工序列
<220>
<223>
<400>2
gaattcgagc tcggtacccc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 60
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tcccgatcta 120
gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat attttgtttt 180
ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat ctcataaata 240
acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga aattatatga 300
taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc caaatgtttg 360
aacgatcggg gaaattcgga tccccaatac tttagacttt cctcttcttc ttgggagaac 420
caccagagag catcttaatc ttgttctcac cgttgctatc ctgtatgacc agagcccaag 480
gcttgtattc aggggcgtcg ctagtcagaa gcatgacatt ctcgtcggtg ctctcgtcgt 540
aggcggtgtg cacgagtata tcgctttccg gcttgttccc aatgacttct tccacctcct 600
ctgggagcat gaggatggat tcctggataa ccagttgctt accggtctcc ttttcaataa 660
tatctgacag attagtagaa ccaccagagt cacccccaag ctgtgacaaa tctatccgag 720
tttcatataa tcccgtgatg gattggtgaa tcagtgtcgc gtctagcacc tccttggtag 780
aagtgtatcg tttgcgatct atcgttgtgt caaaatactt gaatgcggct ggagcgccga 840
ggttggtaag agtaaacaaa tggataatat tttccgcctg ctcacgtatg ggtttatccc 900
tgtgcttgtt gtatgcgctt aatactttgt ccagattggc atcagctagg atgactctct 960
tactgaattc cgaaatttgc tctatgattt cgtcgagata atgtttgtgc tgctcaacaa 1020
aaagttgctt ctgttcgtta tcttcaggtg aacctttcaa cttctcgtaa tgggacgcta 1080
aatacaggaa attcacgtat ttagacggta gtgcgagttc gttccccttt tgaagctctc 1140
cggcgctagc caacatccgt tttcggccat tttctaactc aaacagacta tactttggta 1200
gtttaattat gagatccttt tttacttcct tgtaaccttt cgcctcaagg aagtcgatgg 1260
ggttcttttc aaaagacgag cgctccataa tcgttatccc caataattct ttgactgact 1320
tcagtttctt ggattttccc ttctcaactt ttgccactac taggacagaa taggcaactg 1380
tagggctatc gaagccaccg tactttttcg ggtcccagtc ctttttacga gcgatgagct 1440
tatcactatt cctttttgga agaatcgatt cctttgaaaa ccctccggtc tgcacctcag 1500
ttttctttac tatgttgact tggggcatgg acaaaacttt tctcaccgtc gcgaagtccc 1560
ggcccttatc ccatacgatt tcacctgtct ccccattggt ttcaattaaa ggtcgtttgc 1620
gtatctctcc gtttgccaga gtgatttccg tcttaaagaa attcataatg ttagaataaa 1680
agaagtattt ggctgtagcc ttgcctatct cctgttcgct tttcgcgatc atcttacgga 1740
cgtcataaac tttgtaatca ccatacacaa actcactttc tagcttcggg tatttcttaa 1800
tgagtgcggt ccctacgacg gcattaagat aagcgtcgtg cgcatggtgg tagttattta 1860
tctccctaac tttatagaat tgaaaatcct ttctgaagtc cgacaccaat tttgacttta 1920
aagtgattac tttgacttcc cgaatcagct tatcgttctc gtcgtatttc gtattcattc 1980
gggaatctag tatctgtgca acatgctttg tgatttggcg ggtttccacg agctgacgtt 2040
taataaatcc ggccttgtca agttcagaca agccacccct ctcagcttta gttaagttat 2100
cgaactttct ttgcgttatc agtttcgcat ttaggagctg ccgccaatag ttcttcattt 2160
tctttacgac ttcctcgctt ggaacattgt cacttttccc tcggttctta tccgagcgtg 2220
taagcacttt attgtcgatt gaatcgtcct tcaaaaagga ttggggtaca atgtgatcga 2280
cgtcgtaatc agataaacgg tttatgtcca gttcctgatc aacatacatg tcccttccat 2340
tttgtaggta atagaggtaa agtttctcgt tctgcaattg ggtattttcc acaggatgct 2400
cctttaagat ctggctgccc agttctttaa taccctcttc tattctcttc atccgctctc 2460
gactgttttt ttgccccttc tgagtcgttt gattttcgcg tgccatctcg attacaatgt 2520
tttccggttt gtgacgtccc atgaccttaa ctagctcatc cactactttg actgtctgga 2580
gtatgccctt tttgatggct ggcgaaccag caagattcgc aatatgttcg tgcaatgagt 2640
ccccttgtcc ggaaacctgt gccttttgta tatcctcttt gaaggttaaa gagtcatcat 2700
ggatcagctg cataaagttc ctattggcga agccgtcgct ctttagaaaa tcgagaatag 2760
ttttaccact ttgcttgtct cttatcccgt tgataagttt ccgcgacaat cgtccccagc 2820
ccgtatagcg acgcctcttt aactgtttca taaccttatc gtcgaacagg tgagcgtatg 2880
tttttagtct ttcctcaatc atttcccgat cttcaaagag ggtaagagtc aacactatat 2940
cttctaagat atcttcattc tcttcgttat ccaggaagtc cttatcttta attatcttta 3000
ggaggtcatg atacgtacca agtgacgcat taaatcgatc ttctaccccg gagatctcga 3060
cagaatcgaa gcattcaatt ttcttaaagt agtcctcttt caattgctta actgtcactt 3120
tgcggttggt cttgaataac agatctacta ttgctttctt ctgttctccg cttagaaagg 3180
cgggtttacg catgccctca gtgacatact taactttcgt gagttcattg tacactgtga 3240
aatactcgta aagtaaactg tgcttaggca atactttttc gttcggtaaa ttcttgtcaa 3300
agttggtcat cctctcgatg aacgattgag ctgacgcacc tttatcgaca acttcctcaa 3360
aattccatgg agtaatcgtt tcttcggact ttcttgtcat ccatgcgaac cgagagttcc 3420
ctcgggccag gggtcccaca tagtaaggta tgcgaaaggt taggattttc tcaatctttt 3480
cacgattgtc tttgaggaac ggataaaaat cctcctgcct tctaagtata gcatgcaatt 3540
cgcctaagtg gatttgatgt ggaatgctac cgttgtcgaa agtccgctgc tttcgcagta 3600
gatcttcgcg attgagtttt acaagcaact cttccgtccc atccatcttc tctaatatgg 3660
gtttgataaa cttgtagaat tcctcttgac tcgctccgcc gtcaatataa cctgcgtacc 3720
cgtttttcga ctgatcaaag aatatttcct tatatttctc aggcagttgc tgacggacta 3780
gggccttgag aagtgtcaag tcttggtgat gttcatcgta ccttttgatc attgaagcgg 3840
ataacggcgc cttggtaatc tcagtattaa ctctcagtat gtcagatagg aggattgcat 3900
cgctaaggtt tttggcagcc aaaaataagt ccgcatactg atctccaatt tgtgccagta 3960
gattgtcgag atcgtcatcg tacgtgtcct tactaagctg caatttggca tcttcagcta 4020
agtcgaagtt cgacttaaaa tttggtgtca ggcctagtga gagcgctata aggttaccga 4080
acaacccatt tttcttctct ccgggtaatt gtgcgatcag gttttctagc cgtcgggatt 4140
tagagaggcg ggcgctaaga atagccttcg catccacgcc acttgcattt atagggttct 4200
cttcaaacaa ctgattatag gtttgtacta actggatgaa cagtttgtcg acatccgagt 4260
tgtccggatt tagatcaccc tcaatgagaa agtgcccacg gaactttatc atatgggcaa 4320
gagccaagta gattaacctc aggtccgctt tatcagttga gtcaactagc ttttttctga 4380
ggtgataaat cgttgggtac ttttcatgat atgccacctc atctactatg tttccaaaga 4440
tggggtgccg ttcatgtttc ttgtcctctt cgacaaggaa ggactcttcc aaacggtgaa 4500
agaaagaatc gtcaactttg gccatctcat tgctaaaaat ttcttgtaag taacatattc 4560
ggttcttgcg acgtgtatac cttctccgag cggttcgttt caggcgagtc gcctctgccg 4620
tttcgccact atcgaatagg agggcaccga taagattctt tttaatcgaa tgacggtctg 4680
tgttccccaa caccttaaat ttctttgaag gtactttgta ttcatcggtt atgacagccc 4740
atccaacgga attagtgccg atggctaaac caatagaata ctttttatca ctttcgggtg 4800
tggcggactc tgaggtcccg ggagtctcgc tgccgctttt caacccggtg gcccagagaa 4860
tgtgtggggg cagtcgctgg taatgacaag actgaagagc gatggtaaag aatgtcagct 4920
gtggctgctt ccttctcaga atgttgagac aaggaggcag gcccagtatg atgcagtaca 4980
gttcaagaac gtacagtcgt acccacagat ggggatacct aggccagtgg gcttcattac 5040
tcgggctata attcacaaag tttctccagc agtatcctga ctcctgctca gtcataattt 5100
ggatagtcac acctgaagag atcaaatccc gcaggccttg tcgattgcgg gggtcagcgt 5160
ggtggtacag ccttgcgatg taaataaaca gagtgacgtg gggatacctt gacaggaatt 5220
cagtgatggc cctactacat tcgccgcatg ggctccagct gagaaaccag gtaatgctgc 5280
accttgtgtt cggacagaaa tatctttctg tcgtgaactt ctcgatgaag ttgacttcga 5340
cgtgcttgtt agtgttctgt gatgtatgtc gccaaatgga gtgccggccc ccccaattaa 5400
tttcgtaaag caggcaggtc tccttgcgga gctctctcgg atcgaagaat acctcaaact 5460
catggggctc gatccgccgt ctcaatgtgg ggtccacagc cactgggcca gtctctgagc 5520
tcatagtatt ggggatcccc cgggctgcag aagtaacacc aaacaacagg gtgagcatcg 5580
acaaaagaaa cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac 5640
atatagctgc tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat 5700
acttgtttat tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat 5760
gccatcatgt atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat 5820
atttccatcc atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa 5880
aattaataaa tacaccaggt agtttgaaac agtattctac tccgatctag aacgaatgaa 5940
cgaccgccca accacaccac atcatcacaa ccaagcgaac aaaaagcatc tctgtatatg 6000
catcagtaaa acccgcatca acatgtatac ctatcctaga tcgatatttc catccatcat 6060
cttcaattcg taactatgaa tatgtatggc acacacatac agatccaaaa ttaataaatc 6120
caccaggtag tttgaaacag aattctactc cgatctagaa cgaccgccca accagaccac 6180
atcatcacaa ccaagacaaa aaaaagcatg aaaagatgac ccgacaaaca agtgcacggc 6240
atatattgaa ataaaggaaa agggcaaacc aaaccctatg caacgaaaca aaaaaaatca 6300
tgaaatcgat cccgtctgcg gaacggctag agccatccca ggattcccca aagagaaaca 6360
ctggcaagtt agcaatcaga acgtgtctga cgtacaggtc gcatccgtgt acgaacgcta 6420
gcagcacgga tctaacacaa acacggatct aacacaaaca tgaacagaag tagaactacc 6480
gggccctaac catggaccgg aacgccgatc tagagaaggt agagaggggg ggggggggag 6540
gacgagcggc gtaccttgaa gcggaggtgc cgacgggtgg atttggggga gatctggttg 6600
tgtgtgtgtg cgctccgaac aacacgaggt tggggaaaga gggtgtggag ggggtgtcta 6660
tttattacgg cgggcgagga agggaaagcg aaggagcggt gggaaaggaa tcccccgtag 6720
ctgccgtgcc gtgagaggag gaggaggccg cctgccgtgc cggctcacgt ctgccgctcc 6780
gccacgcatt tctggatgcc gacagcggag caagtccaac ggtggagcgg aactctcgag 6840
aggggtccag aggcagcgac agagatgccg tgccgtctgc ttcgcttggc ccgacgcgac 6900
gctgctggtt cgctggttgg tgtccgttag actcgtcgac ggcgtttaac aggctggcat 6960
tatctactcg aaacaagaaa aatgtttcct tagttttttt aatttcttaa agggtatttg 7020
tttaattttt agtcacttta ttttattcta ttttatatct aaattattaa ataaaaaaac 7080
taaaatagag ttttagtttt cttaatttag aggctaaaat agaataaaat agatgtacta 7140
aaaaaattag tctataaaaa ccattaaccc taaaccctaa atggatgtac taataaaatg 7200
gatgaagtat tatataggtg aagctatttg caaaaaaaaa ggagaacaca tgcacactaa 7260
aaagataaaa ctgtagagtc ctgttgtcaa aatactcaat tgtcctttag accatgtcta 7320
actgttcatt tatatgattc tctaaaacac tgatattatt gtagtactat agattatatt 7380
attcgtagag taaagtttaa atatatgtat aaagatagat aaactgcact tcaaacaagt 7440
gtgacaaaaa aaatatgtgg taatttttta taacttagac atgcaatgct cattatctct 7500
agagaggggc acgaccgggt cacgctgcac tgcaggaatt cgatatcaag cttggcactg 7560
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 7620
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 7680
tcccaacagt tgcgcagcct gaatggcgaa tgctagagca gcttgagctt ggatcagatt 7740
gtcgtttccc gccttcagtt ttgcatgcct gcaggtcgac gattaaggaa tctttaaaca 7800
tacgaacaga tcacttaaag ttcttctgaa gcaacttaaa gttatcaggc atgcatggat 7860
cttggaggaa tcagatgtgc agtcagggac catagcacaa gacaggcgtc ttctactggt 7920
gctaccagca aatgctggaa gccgggaaca ctgggtacgt tggaaaccac gtgatgtgaa 7980
gaagtaagat aaactgtagg agaaaagcat ttcgtagtgg gccatgaagc ctttcaggac 8040
atgtattgca gtatgggccg gcccattacg caattggacg acaacaaaga ctagtattag 8100
taccacctcg gctatccaca tagatcaaag ctgatttaaa agagttgtgc agatgatccg 8160
tggcacctgt tcaagatggt ggggtgtttt agagctagaa atagcaagtt aaaataaggc 8220
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttttcc acataatctc 8280
tagaggatcc aaactatcag tgtttgacag gatatattgg cgggtaaacc taagagaaaa 8340
gagcgtttat tagaataacg gatatttaaa agggcgtgaa aaggtttatc cgttcgtcca 8400
tttgtatgtg catgccaacc acagggttcc cctcgggatc aaagtacttt gatccaaccc 8460
ctccgctgct atagtgcagt cggcttctga cgttcagtgc agccgtcttc tgaaaacgac 8520
atgtcgcaca agtcctaagt tacgcgacag gctgccgccc tgcccttttc ctggcgtttt 8580
cttgtcgcgt gttttagtcg cataaagtag aatacttgcg actagaaccg gagacattac 8640
gccatgaaca agagcgccgc cgctggcctg ctgggctatg cccgcgtcag caccgacgac 8700
caggacttga ccaaccaacg ggccgaactg cacgcggccg gctgcaccaa gctgttttcc 8760
gagaagatca ccggcaccag gcgcgaccgc ccggagctgg ccaggatgct tgaccaccta 8820
gccctggcga cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc acccgcgacc 8880
tactggacat tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc ctggcagagc 8940
cgtgggccga caccaccacg ccggccggcc gcatggtgtt gaccgtgttc gccggcattg 9000
ccgagttcga gcgttcccta atcatcgacc gcacccggag cgggcgcgag gccgccaagg 9060
cccgaggcgt gaagtttggc ccccgcccta ccctcacccc ggcacagatc gcgcacgccc 9120
gcgagctgat cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg cttggcgtgc 9180
atcgctcgac cctgtaccgc gcacttgagc gcagcgagga agtgacgccc accgaggcca 9240
ggcggcgcgg tgccttccgt gaggacgcat tgaccgaggc cgacgccctg gcggccgccg 9300
agaatgaacg ccaagaggaa caagcatgaa accgcaccag gacggccagg acgaaccgtt 9360
tttcattacc gaagagatcg aggcggagat gatcgcggcc gggtacgtgt tcgagccgcc 9420
cgcgcacgtc tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg atgccaagct 9480
ggcggcctgg ccggccagct tggccgctga agaaaccgag cgccgccgtc taaaaaggtg 9540
atgtgtattt gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga tgcgatgagt 9600
aaataaacaa atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa ccagaaaggc 9660
gggtcaggca agacgaccat cgcaacccat ctagcccgcg ccctgcaact cgccggggcc 9720
gatgttctgt tagtcgattc cgatccccag ggcagtgccc gcgattgggc ggccgtgcgg 9780
gaagatcaac cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg cgacgtgaag 9840
gccatcggcc ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc ggacttggct 9900
gtgtccgcga tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag cccttacgac 9960
atatgggcaa ccgccgacct ggtggagctg gttaagcagc gcattgaggt cacggatgga 10020
aggctacaag cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat cggcggtgag 10080
gttgccgagg cgctggccgg gtacgagctg cccattcttg agtcccgtat cacgcagcgc 10140
gtgagctacc caggcactgc cgccgccggc acaaccgttc ttgaatcaga acccgagggc 10200
gacgctgccc gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact catttgagtt 10260
aatgaggtaa agagaaaatg agcaaaagca caaacacgct aagtgccggc cgtccgagcg 10320
cacgcagcag caaggctgca acgttggcca gcctggcaga cacgccagcc atgaagcggg 10380
tcaactttca gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg gtacgccaag 10440
gcaagaccat taccgagctg ctatctgaat acatcgcgca gctaccagag taaatgagca 10500
aatgaataaa tgagtagatg aattttagcg gctaaaggag gcggcatgga aaatcaagaa 10560
caaccaggca ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg ttggccaggc 10620
gtaagcggct gggttgtctg ccggccctgc aatggcactg gaacccccaa gcccgaggaa 10680
tcggcgtgac ggtcgcaaac catccggccc ggtacaaatc ggcgcggcgc tgggtgatga 10740
cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg caacgcatcg aggcagaagc 10800
acgccccggt gaatcgtggc aagcggccgc tgatcgaatc cgcaaagaat cccggcaacc 10860
gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag ggcgacgagc aaccagattt 10920
tttcgttccg atgctctatg acgtgggcac ccgcgatagt cgcagcatca tggacgtggc 10980
cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag gtgatccgct acgagcttcc 11040
agacgggcac gtagaggttt ccgcagggcc ggccggcatg gccagtgtgt gggattacga 11100
cctggtactg atggcggttt cccatctaac cgaatccatg aaccgatacc gggaagggaa 11160
gggagacaag cccggccgcg tgttccgtcc acacgttgcg gacgtactca agttctgccg 11220
gcgagccgat ggcggaaagc agaaagacga cctggtagaa acctgcattc ggttaaacac 11280
cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac ggccgcctgg tgacggtatc 11340
cgagggtgaa gccttgatta gccgctacaa gatcgtaaag agcgaaaccg ggcggccgga 11400
gtacatcgag atcgagctag ctgattggat gtaccgcgag atcacagaag gcaagaaccc 11460
ggacgtgctg acggttcacc ccgattactt tttgatcgat cccggcatcg gccgttttct 11520
ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc agatggttgt tcaagacgat 11580
ctacgaacgc agtggcagcg ccggagagtt caagaagttc tgtttcaccg tgcgcaagct 11640
gatcgggtca aatgacctgc cggagtacga tttgaaggag gaggcggggc aggctggccc 11700
gatcctagtc atgcgctacc gcaacctgat cgagggcgaa gcatccgccg gttcctaatg 11760
tacggagcag atgctagggc aaattgccct agcaggggaa aaaggtcgaa aaggtctctt 11820
tcctgtggat agcacgtaca ttgggaaccc aaagccgtac attgggaacc ggaacccgta 11880
cattgggaac ccaaagccgt acattgggaa ccggtcacac atgtaagtga ctgatataaa 11940
agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa cttattaaaa ctcttaaaac 12000
ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc gaagagctgc aaaaagcgcc 12060
tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg cgtcggccta tcgcggccgc 12120
tggccgctca aaaatggctg gcctacggcc aggcaatcta ccagggcgcg gacaagccgc 12180
gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc ctgcctcgcg cgtttcggtg 12240
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 12300
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 12360
gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc 12420
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 12480
aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 12540
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 12600
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 12660
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 12720
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 12780
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 12840
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 12900
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 12960
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 13020
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 13080
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 13140
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 13200
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 13260
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 13320
cgaaaactca cgttaaggga ttttggtcat gcattctagg tactaaaaca attcatccag 13380
taaaatataa tattttattt tctcccaatc aggcttgatc cccagtaagt caaaaaatag 13440
ctcgacatac tgttcttccc cgatatcctc cctgatcgac cggacgcaga aggcaatgtc 13500
ataccacttg tccgccctgc cgcttctccc aagatcaata aagccactta ctttgccatc 13560
tttcacaaag atgttgctgt ctcccaggtc gccgtgggaa aagacaagtt cctcttcggg 13620
cttttccgtc tttaaaaaat catacagctc gcgcggatct ttaaatggag tgtcttcttc 13680
ccagttttcg caatccacat cggccagatc gttattcagt aagtaatcca attcggctaa 13740
gcggctgtct aagctattcg tatagggaca atccgatatg tcgatggagt gaaagagcct 13800
gatgcactcc gcatacagct cgataatctt ttcagggctt tgttcatctt catactcttc 13860
cgagcaaagg acgccatcgg cctcactcat gagcagattg ctccagccat catgccgttc 13920
aaagtgcagg acctttggaa caggcagctt tccttccagc catagcatca tgtccttttc 13980
ccgttcaaca tcataggtgg tccctttata ccggctgtcc gtcattttta aatataggtt 14040
ttcattttct cccaccagct tatatacctt agcaggagac attccttccg tatcttttac 14100
gcagcggtat ttttcgatca gttttttcaa ttccggtgat attctcattt tagccattta 14160
ttatttcctt cctcttttct acagtattta aagatacccc aagaagctaa ttataacaag 14220
acgaactcca attcactgtt ccttgcattc taaaacctta aataccagaa aacagctttt 14280
tcaaagttgt tttcaaagtt ggcgtataac atagtatcga cggagccgat tttgaaaccg 14340
cggtgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac cctccgcgag 14400
atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc atcggtaaca 14460
tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg actgatgggc 14520
tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt tggctggctg 14580
gtggcaggat atattgtggt gtaaacaaat tgacgcttag acaacttaat aacacattgc 14640
ggacgttttt aatgtactga attaacgccg aattaattcg ggggatctgg attttagtac 14700
tggattttgg ttttaggaat tagaaatttt attgatagaa gtattttaca aatacaaata 14760
catactaagg gtttcttata tgctcaacac atgagcgaaa ccctatagga accctaattc 14820
ccttatctgg gaactactca cacattatta tggagaaact cgagcttgtc gatcgacaga 14880
tccggtcggc atctactcta tttctttgcc ctcggacgag tgctggggcg tcggtttcca 14940
ctatcggcga gtacttctac acagccatcg gtccagacgg ccgcgcttct gcgggcgatt 15000
tgtgtacgcc cgacagtccc ggctccggat cggacgattg cgtcgcatcg accctgcgcc 15060
caagctgcat catcgaaatt gccgtcaacc aagctctgat agagttggtc aagaccaatg 15120
cggagcatat acgcccggag tcgtggcgat cctgcaagct ccggatgcct ccgctcgaag 15180
tagcgcgtct gctgctccat acaagccaac cacggcctcc agaagaagat gttggcgacc 15240
tcgtattggg aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt tatgcggcca 15300
ttgtccgtca ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg gacttcgggg 15360
cagtcctcgg cccaaagcat cagctcatcg agagcctgcg cgacggacgc actgacggtg 15420
tcgtccatca cagtttgcca gtgatacaca tggggatcag caatcgcgca tatgaaatca 15480
cgccatgtag tgtattgacc gattccttgc ggtccgaatg ggccgaaccc gctcgtctgg 15540
ctaagatcgg ccgcagcgat cgcatccata gcctccgcga ccggttgtag aacagcgggc 15600
agttcggttt caggcaggtc ttgcaacgtg acaccctgtg cacggcggga gatgcaatag 15660
gtcaggctct cgctaaactc cccaatgtca agcacttccg gaatcgggag cgcggccgat 15720
gcaaagtgcc gataaacata acgatctttg tagaaaccat cggcgcagct atttacccgc 15780
aggacatatc cacgccctcc tacatcgaag ctgaaagcac gagattcttc gccctccgag 15840
agctgcatca ggtcggagac gctgtcgaac ttttcgatca gaaacttctc gacagacgtc 15900
gcggtgagtt caggcttttt catatctcat tgccccccgg atctgcgaaa gctcgagaga 15960
gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt 16020
ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag 16080
tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca 16140
cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa 16200
cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg 16260
tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta 16320
ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct 16380
tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag 16440
acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg 16500
gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt 16560
tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat 16620
ggaatccgag gaggtttccc gatattaccc tttgttgaaa agtctcaata gccctttggt 16680
cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt 16740
tggcaagctg ctctagccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 16800
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 16860
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 16920
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 16980
c 16981
<210>3
<211>16981bp
<212>DNA
<213>人工序列
<220>
<223>
<400>3
gaattcgagc tcggtacccc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 60
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tcccgatcta 120
gtaacataga tgacaccgcg cgcgataatt tatcctagtt tgcgcgctat attttgtttt 180
ctatcgcgta ttaaatgtat aattgcggga ctctaatcat aaaaacccat ctcataaata 240
acgtcatgca ttacatgtta attattacat gcttaacgta attcaacaga aattatatga 300
taatcatcgc aagaccggca acaggattca atcttaagaa actttattgc caaatgtttg 360
aacgatcggg gaaattcgga tccccaatac tttagacttt cctcttcttc ttgggagaac 420
caccagagag catcttaatc ttgttctcac cgttgctatc ctgtatgacc agagcccaag 480
gcttgtattc aggggcgtcg ctagtcagaa gcatgacatt ctcgtcggtg ctctcgtcgt 540
aggcggtgtg cacgagtata tcgctttccg gcttgttccc aatgacttct tccacctcct 600
ctgggagcat gaggatggat tcctggataa ccagttgctt accggtctcc ttttcaataa 660
tatctgacag attagtagaa ccaccagagt cacccccaag ctgtgacaaa tctatccgag 720
tttcatataa tcccgtgatg gattggtgaa tcagtgtcgc gtctagcacc tccttggtag 780
aagtgtatcg tttgcgatct atcgttgtgt caaaatactt gaatgcggct ggagcgccga 840
ggttggtaag agtaaacaaa tggataatat tttccgcctg ctcacgtatg ggtttatccc 900
tgtgcttgtt gtatgcgctt aatactttgt ccagattggc atcagctagg atgactctct 960
tactgaattc cgaaatttgc tctatgattt cgtcgagata atgtttgtgc tgctcaacaa 1020
aaagttgctt ctgttcgtta tcttcaggtg aacctttcaa cttctcgtaa tgggacgcta 1080
aatacaggaa attcacgtat ttagacggta gtgcgagttc gttccccttt tgaagctctc 1140
cggcgctagc caacatccgt tttcggccat tttctaactc aaacagacta tactttggta 1200
gtttaattat gagatccttt tttacttcct tgtaaccttt cgcctcaagg aagtcgatgg 1260
ggttcttttc aaaagacgag cgctccataa tcgttatccc caataattct ttgactgact 1320
tcagtttctt ggattttccc ttctcaactt ttgccactac taggacagaa taggcaactg 1380
tagggctatc gaagccaccg tactttttcg ggtcccagtc ctttttacga gcgatgagct 1440
tatcactatt cctttttgga agaatcgatt cctttgaaaa ccctccggtc tgcacctcag 1500
ttttctttac tatgttgact tggggcatgg acaaaacttt tctcaccgtc gcgaagtccc 1560
ggcccttatc ccatacgatt tcacctgtct ccccattggt ttcaattaaa ggtcgtttgc 1620
gtatctctcc gtttgccaga gtgatttccg tcttaaagaa attcataatg ttagaataaa 1680
agaagtattt ggctgtagcc ttgcctatct cctgttcgct tttcgcgatc atcttacgga 1740
cgtcataaac tttgtaatca ccatacacaa actcactttc tagcttcggg tatttcttaa 1800
tgagtgcggt ccctacgacg gcattaagat aagcgtcgtg cgcatggtgg tagttattta 1860
tctccctaac tttatagaat tgaaaatcct ttctgaagtc cgacaccaat tttgacttta 1920
aagtgattac tttgacttcc cgaatcagct tatcgttctc gtcgtatttc gtattcattc 1980
gggaatctag tatctgtgca acatgctttg tgatttggcg ggtttccacg agctgacgtt 2040
taataaatcc ggccttgtca agttcagaca agccacccct ctcagcttta gttaagttat 2100
cgaactttct ttgcgttatc agtttcgcat ttaggagctg ccgccaatag ttcttcattt 2160
tctttacgac ttcctcgctt ggaacattgt cacttttccc tcggttctta tccgagcgtg 2220
taagcacttt attgtcgatt gaatcgtcct tcaaaaagga ttggggtaca atgtgatcga 2280
cgtcgtaatc agataaacgg tttatgtcca gttcctgatc aacatacatg tcccttccat 2340
tttgtaggta atagaggtaa agtttctcgt tctgcaattg ggtattttcc acaggatgct 2400
cctttaagat ctggctgccc agttctttaa taccctcttc tattctcttc atccgctctc 2460
gactgttttt ttgccccttc tgagtcgttt gattttcgcg tgccatctcg attacaatgt 2520
tttccggttt gtgacgtccc atgaccttaa ctagctcatc cactactttg actgtctgga 2580
gtatgccctt tttgatggct ggcgaaccag caagattcgc aatatgttcg tgcaatgagt 2640
ccccttgtcc ggaaacctgt gccttttgta tatcctcttt gaaggttaaa gagtcatcat 2700
ggatcagctg cataaagttc ctattggcga agccgtcgct ctttagaaaa tcgagaatag 2760
ttttaccact ttgcttgtct cttatcccgt tgataagttt ccgcgacaat cgtccccagc 2820
ccgtatagcg acgcctcttt aactgtttca taaccttatc gtcgaacagg tgagcgtatg 2880
tttttagtct ttcctcaatc atttcccgat cttcaaagag ggtaagagtc aacactatat 2940
cttctaagat atcttcattc tcttcgttat ccaggaagtc cttatcttta attatcttta 3000
ggaggtcatg atacgtacca agtgacgcat taaatcgatc ttctaccccg gagatctcga 3060
cagaatcgaa gcattcaatt ttcttaaagt agtcctcttt caattgctta actgtcactt 3120
tgcggttggt cttgaataac agatctacta ttgctttctt ctgttctccg cttagaaagg 3180
cgggtttacg catgccctca gtgacatact taactttcgt gagttcattg tacactgtga 3240
aatactcgta aagtaaactg tgcttaggca atactttttc gttcggtaaa ttcttgtcaa 3300
agttggtcat cctctcgatg aacgattgag ctgacgcacc tttatcgaca acttcctcaa 3360
aattccatgg agtaatcgtt tcttcggact ttcttgtcat ccatgcgaac cgagagttcc 3420
ctcgggccag gggtcccaca tagtaaggta tgcgaaaggt taggattttc tcaatctttt 3480
cacgattgtc tttgaggaac ggataaaaat cctcctgcct tctaagtata gcatgcaatt 3540
cgcctaagtg gatttgatgt ggaatgctac cgttgtcgaa agtccgctgc tttcgcagta 3600
gatcttcgcg attgagtttt acaagcaact cttccgtccc atccatcttc tctaatatgg 3660
gtttgataaa cttgtagaat tcctcttgac tcgctccgcc gtcaatataa cctgcgtacc 3720
cgtttttcga ctgatcaaag aatatttcct tatatttctc aggcagttgc tgacggacta 3780
gggccttgag aagtgtcaag tcttggtgat gttcatcgta ccttttgatc attgaagcgg 3840
ataacggcgc cttggtaatc tcagtattaa ctctcagtat gtcagatagg aggattgcat 3900
cgctaaggtt tttggcagcc aaaaataagt ccgcatactg atctccaatt tgtgccagta 3960
gattgtcgag atcgtcatcg tacgtgtcct tactaagctg caatttggca tcttcagcta 4020
agtcgaagtt cgacttaaaa tttggtgtca ggcctagtga gagcgctata aggttaccga 4080
acaacccatt tttcttctct ccgggtaatt gtgcgatcag gttttctagc cgtcgggatt 4140
tagagaggcg ggcgctaaga atagccttcg catccacgcc acttgcattt atagggttct 4200
cttcaaacaa ctgattatag gtttgtacta actggatgaa cagtttgtcg acatccgagt 4260
tgtccggatt tagatcaccc tcaatgagaa agtgcccacg gaactttatc atatgggcaa 4320
gagccaagta gattaacctc aggtccgctt tatcagttga gtcaactagc ttttttctga 4380
ggtgataaat cgttgggtac ttttcatgat atgccacctc atctactatg tttccaaaga 4440
tggggtgccg ttcatgtttc ttgtcctctt cgacaaggaa ggactcttcc aaacggtgaa 4500
agaaagaatc gtcaactttg gccatctcat tgctaaaaat ttcttgtaag taacatattc 4560
ggttcttgcg acgtgtatac cttctccgag cggttcgttt caggcgagtc gcctctgccg 4620
tttcgccact atcgaatagg agggcaccga taagattctt tttaatcgaa tgacggtctg 4680
tgttccccaa caccttaaat ttctttgaag gtactttgta ttcatcggtt atgacagccc 4740
atccaacgga attagtgccg atggctaaac caatagaata ctttttatca ctttcgggtg 4800
tggcggactc tgaggtcccg ggagtctcgc tgccgctttt caacccggtg gcccagagaa 4860
tgtgtggggg cagtcgctgg taatgacaag actgaagagc gatggtaaag aatgtcagct 4920
gtggctgctt ccttctcaga atgttgagac aaggaggcag gcccagtatg atgcagtaca 4980
gttcaagaac gtacagtcgt acccacagat ggggatacct aggccagtgg gcttcattac 5040
tcgggctata attcacaaag tttctccagc agtatcctga ctcctgctca gtcataattt 5100
ggatagtcac acctgaagag atcaaatccc gcaggccttg tcgattgcgg gggtcagcgt 5160
ggtggtacag ccttgcgatg taaataaaca gagtgacgtg gggatacctt gacaggaatt 5220
cagtgatggc cctactacat tcgccgcatg ggctccagct gagaaaccag gtaatgctgc 5280
accttgtgtt cggacagaaa tatctttctg tcgtgaactt ctcgatgaag ttgacttcga 5340
cgtgcttgtt agtgttctgt gatgtatgtc gccaaatgga gtgccggccc ccccaattaa 5400
tttcgtaaag caggcaggtc tccttgcgga gctctctcgg atcgaagaat acctcaaact 5460
catggggctc gatccgccgt ctcaatgtgg ggtccacagc cactgggcca gtctctgagc 5520
tcatagtatt ggggatcccc cgggctgcag aagtaacacc aaacaacagg gtgagcatcg 5580
acaaaagaaa cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac 5640
atatagctgc tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat 5700
acttgtttat tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat 5760
gccatcatgt atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat 5820
atttccatcc atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa 5880
aattaataaa tacaccaggt agtttgaaac agtattctac tccgatctag aacgaatgaa 5940
cgaccgccca accacaccac atcatcacaa ccaagcgaac aaaaagcatc tctgtatatg 6000
catcagtaaa acccgcatca acatgtatac ctatcctaga tcgatatttc catccatcat 6060
cttcaattcg taactatgaa tatgtatggc acacacatac agatccaaaa ttaataaatc 6120
caccaggtag tttgaaacag aattctactc cgatctagaa cgaccgccca accagaccac 6180
atcatcacaa ccaagacaaa aaaaagcatg aaaagatgac ccgacaaaca agtgcacggc 6240
atatattgaa ataaaggaaa agggcaaacc aaaccctatg caacgaaaca aaaaaaatca 6300
tgaaatcgat cccgtctgcg gaacggctag agccatccca ggattcccca aagagaaaca 6360
ctggcaagtt agcaatcaga acgtgtctga cgtacaggtc gcatccgtgt acgaacgcta 6420
gcagcacgga tctaacacaa acacggatct aacacaaaca tgaacagaag tagaactacc 6480
gggccctaac catggaccgg aacgccgatc tagagaaggt agagaggggg ggggggggag 6540
gacgagcggc gtaccttgaa gcggaggtgc cgacgggtgg atttggggga gatctggttg 6600
tgtgtgtgtg cgctccgaac aacacgaggt tggggaaaga gggtgtggag ggggtgtcta 6660
tttattacgg cgggcgagga agggaaagcg aaggagcggt gggaaaggaa tcccccgtag 6720
ctgccgtgcc gtgagaggag gaggaggccg cctgccgtgc cggctcacgt ctgccgctcc 6780
gccacgcatt tctggatgcc gacagcggag caagtccaac ggtggagcgg aactctcgag 6840
aggggtccag aggcagcgac agagatgccg tgccgtctgc ttcgcttggc ccgacgcgac 6900
gctgctggtt cgctggttgg tgtccgttag actcgtcgac ggcgtttaac aggctggcat 6960
tatctactcg aaacaagaaa aatgtttcct tagttttttt aatttcttaa agggtatttg 7020
tttaattttt agtcacttta ttttattcta ttttatatct aaattattaa ataaaaaaac 7080
taaaatagag ttttagtttt cttaatttag aggctaaaat agaataaaat agatgtacta 7140
aaaaaattag tctataaaaa ccattaaccc taaaccctaa atggatgtac taataaaatg 7200
gatgaagtat tatataggtg aagctatttg caaaaaaaaa ggagaacaca tgcacactaa 7260
aaagataaaa ctgtagagtc ctgttgtcaa aatactcaat tgtcctttag accatgtcta 7320
actgttcatt tatatgattc tctaaaacac tgatattatt gtagtactat agattatatt 7380
attcgtagag taaagtttaa atatatgtat aaagatagat aaactgcact tcaaacaagt 7440
gtgacaaaaa aaatatgtgg taatttttta taacttagac atgcaatgct cattatctct 7500
agagaggggc acgaccgggt cacgctgcac tgcaggaatt cgatatcaag cttggcactg 7560
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 7620
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 7680
tcccaacagt tgcgcagcct gaatggcgaa tgctagagca gcttgagctt ggatcagatt 7740
gtcgtttccc gccttcagtt ttgcatgcct gcaggtcgac gattaaggaa tctttaaaca 7800
tacgaacaga tcacttaaag ttcttctgaa gcaacttaaa gttatcaggc atgcatggat 7860
cttggaggaa tcagatgtgc agtcagggac catagcacaa gacaggcgtc ttctactggt 7920
gctaccagca aatgctggaa gccgggaaca ctgggtacgt tggaaaccac gtgatgtgaa 7980
gaagtaagat aaactgtagg agaaaagcat ttcgtagtgg gccatgaagc ctttcaggac 8040
atgtattgca gtatgggccg gcccattacg caattggacg acaacaaaga ctagtattag 8100
taccacctcg gctatccaca tagatcaaag ctgatttaaa agagttgtgc agatgatccg 8160
tggcactgaa ttctcctggc ttgttgtttt agagctagaa atagcaagtt aaaataaggc 8220
tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttttcc acataatctc 8280
tagaggatcc aaactatcag tgtttgacag gatatattgg cgggtaaacc taagagaaaa 8340
gagcgtttat tagaataacg gatatttaaa agggcgtgaa aaggtttatc cgttcgtcca 8400
tttgtatgtg catgccaacc acagggttcc cctcgggatc aaagtacttt gatccaaccc 8460
ctccgctgct atagtgcagt cggcttctga cgttcagtgc agccgtcttc tgaaaacgac 8520
atgtcgcaca agtcctaagt tacgcgacag gctgccgccc tgcccttttc ctggcgtttt 8580
cttgtcgcgt gttttagtcg cataaagtag aatacttgcg actagaaccg gagacattac 8640
gccatgaaca agagcgccgc cgctggcctg ctgggctatg cccgcgtcag caccgacgac 8700
caggacttga ccaaccaacg ggccgaactg cacgcggccg gctgcaccaa gctgttttcc 8760
gagaagatca ccggcaccag gcgcgaccgc ccggagctgg ccaggatgct tgaccaccta 8820
gccctggcga cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc acccgcgacc 8880
tactggacat tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc ctggcagagc 8940
cgtgggccga caccaccacg ccggccggcc gcatggtgtt gaccgtgttc gccggcattg 9000
ccgagttcga gcgttcccta atcatcgacc gcacccggag cgggcgcgag gccgccaagg 9060
cccgaggcgt gaagtttggc ccccgcccta ccctcacccc ggcacagatc gcgcacgccc 9120
gcgagctgat cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg cttggcgtgc 9180
atcgctcgac cctgtaccgc gcacttgagc gcagcgagga agtgacgccc accgaggcca 9240
ggcggcgcgg tgccttccgt gaggacgcat tgaccgaggc cgacgccctg gcggccgccg 9300
agaatgaacg ccaagaggaa caagcatgaa accgcaccag gacggccagg acgaaccgtt 9360
tttcattacc gaagagatcg aggcggagat gatcgcggcc gggtacgtgt tcgagccgcc 9420
cgcgcacgtc tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg atgccaagct 9480
ggcggcctgg ccggccagct tggccgctga agaaaccgag cgccgccgtc taaaaaggtg 9540
atgtgtattt gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga tgcgatgagt 9600
aaataaacaa atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa ccagaaaggc 9660
gggtcaggca agacgaccat cgcaacccat ctagcccgcg ccctgcaact cgccggggcc 9720
gatgttctgt tagtcgattc cgatccccag ggcagtgccc gcgattgggc ggccgtgcgg 9780
gaagatcaac cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg cgacgtgaag 9840
gccatcggcc ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc ggacttggct 9900
gtgtccgcga tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag cccttacgac 9960
atatgggcaa ccgccgacct ggtggagctg gttaagcagc gcattgaggt cacggatgga 10020
aggctacaag cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat cggcggtgag 10080
gttgccgagg cgctggccgg gtacgagctg cccattcttg agtcccgtat cacgcagcgc 10140
gtgagctacc caggcactgc cgccgccggc acaaccgttc ttgaatcaga acccgagggc 10200
gacgctgccc gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact catttgagtt 10260
aatgaggtaa agagaaaatg agcaaaagca caaacacgct aagtgccggc cgtccgagcg 10320
cacgcagcag caaggctgca acgttggcca gcctggcaga cacgccagcc atgaagcggg 10380
tcaactttca gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg gtacgccaag 10440
gcaagaccat taccgagctg ctatctgaat acatcgcgca gctaccagag taaatgagca 10500
aatgaataaa tgagtagatg aattttagcg gctaaaggag gcggcatgga aaatcaagaa 10560
caaccaggca ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg ttggccaggc 10620
gtaagcggct gggttgtctg ccggccctgc aatggcactg gaacccccaa gcccgaggaa 10680
tcggcgtgac ggtcgcaaac catccggccc ggtacaaatc ggcgcggcgc tgggtgatga 10740
cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg caacgcatcg aggcagaagc 10800
acgccccggt gaatcgtggc aagcggccgc tgatcgaatc cgcaaagaat cccggcaacc 10860
gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag ggcgacgagc aaccagattt 10920
tttcgttccg atgctctatg acgtgggcac ccgcgatagt cgcagcatca tggacgtggc 10980
cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag gtgatccgct acgagcttcc 11040
agacgggcac gtagaggttt ccgcagggcc ggccggcatg gccagtgtgt gggattacga 11100
cctggtactg atggcggttt cccatctaac cgaatccatg aaccgatacc gggaagggaa 11160
gggagacaag cccggccgcg tgttccgtcc acacgttgcg gacgtactca agttctgccg 11220
gcgagccgat ggcggaaagc agaaagacga cctggtagaa acctgcattc ggttaaacac 11280
cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac ggccgcctgg tgacggtatc 11340
cgagggtgaa gccttgatta gccgctacaa gatcgtaaag agcgaaaccg ggcggccgga 11400
gtacatcgag atcgagctag ctgattggat gtaccgcgag atcacagaag gcaagaaccc 11460
ggacgtgctg acggttcacc ccgattactt tttgatcgat cccggcatcg gccgttttct 11520
ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc agatggttgt tcaagacgat 11580
ctacgaacgc agtggcagcg ccggagagtt caagaagttc tgtttcaccg tgcgcaagct 11640
gatcgggtca aatgacctgc cggagtacga tttgaaggag gaggcggggc aggctggccc 11700
gatcctagtc atgcgctacc gcaacctgat cgagggcgaa gcatccgccg gttcctaatg 11760
tacggagcag atgctagggc aaattgccct agcaggggaa aaaggtcgaa aaggtctctt 11820
tcctgtggat agcacgtaca ttgggaaccc aaagccgtac attgggaacc ggaacccgta 11880
cattgggaac ccaaagccgt acattgggaa ccggtcacac atgtaagtga ctgatataaa 11940
agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa cttattaaaa ctcttaaaac 12000
ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc gaagagctgc aaaaagcgcc 12060
tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg cgtcggccta tcgcggccgc 12120
tggccgctca aaaatggctg gcctacggcc aggcaatcta ccagggcgcg gacaagccgc 12180
gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc ctgcctcgcg cgtttcggtg 12240
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 12300
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 12360
gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc 12420
atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 12480
aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 12540
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 12600
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 12660
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 12720
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 12780
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 12840
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 12900
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 12960
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 13020
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 13080
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 13140
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 13200
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 13260
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 13320
cgaaaactca cgttaaggga ttttggtcat gcattctagg tactaaaaca attcatccag 13380
taaaatataa tattttattt tctcccaatc aggcttgatc cccagtaagt caaaaaatag 13440
ctcgacatac tgttcttccc cgatatcctc cctgatcgac cggacgcaga aggcaatgtc 13500
ataccacttg tccgccctgc cgcttctccc aagatcaata aagccactta ctttgccatc 13560
tttcacaaag atgttgctgt ctcccaggtc gccgtgggaa aagacaagtt cctcttcggg 13620
cttttccgtc tttaaaaaat catacagctc gcgcggatct ttaaatggag tgtcttcttc 13680
ccagttttcg caatccacat cggccagatc gttattcagt aagtaatcca attcggctaa 13740
gcggctgtct aagctattcg tatagggaca atccgatatg tcgatggagt gaaagagcct 13800
gatgcactcc gcatacagct cgataatctt ttcagggctt tgttcatctt catactcttc 13860
cgagcaaagg acgccatcgg cctcactcat gagcagattg ctccagccat catgccgttc 13920
aaagtgcagg acctttggaa caggcagctt tccttccagc catagcatca tgtccttttc 13980
ccgttcaaca tcataggtgg tccctttata ccggctgtcc gtcattttta aatataggtt 14040
ttcattttct cccaccagct tatatacctt agcaggagac attccttccg tatcttttac 14100
gcagcggtat ttttcgatca gttttttcaa ttccggtgat attctcattt tagccattta 14160
ttatttcctt cctcttttct acagtattta aagatacccc aagaagctaa ttataacaag 14220
acgaactcca attcactgtt ccttgcattc taaaacctta aataccagaa aacagctttt 14280
tcaaagttgt tttcaaagtt ggcgtataac atagtatcga cggagccgat tttgaaaccg 14340
cggtgatcac aggcagcaac gctctgtcat cgttacaatc aacatgctac cctccgcgag 14400
atcatccgtg tttcaaaccc ggcagcttag ttgccgttct tccgaatagc atcggtaaca 14460
tgagcaaagt ctgccgcctt acaacggctc tcccgctgac gccgtcccgg actgatgggc 14520
tgcctgtatc gagtggtgat tttgtgccga gctgccggtc ggggagctgt tggctggctg 14580
gtggcaggat atattgtggt gtaaacaaat tgacgcttag acaacttaat aacacattgc 14640
ggacgttttt aatgtactga attaacgccg aattaattcg ggggatctgg attttagtac 14700
tggattttgg ttttaggaat tagaaatttt attgatagaa gtattttaca aatacaaata 14760
catactaagg gtttcttata tgctcaacac atgagcgaaa ccctatagga accctaattc 14820
ccttatctgg gaactactca cacattatta tggagaaact cgagcttgtc gatcgacaga 14880
tccggtcggc atctactcta tttctttgcc ctcggacgag tgctggggcg tcggtttcca 14940
ctatcggcga gtacttctac acagccatcg gtccagacgg ccgcgcttct gcgggcgatt 15000
tgtgtacgcc cgacagtccc ggctccggat cggacgattg cgtcgcatcg accctgcgcc 15060
caagctgcat catcgaaatt gccgtcaacc aagctctgat agagttggtc aagaccaatg 15120
cggagcatat acgcccggag tcgtggcgat cctgcaagct ccggatgcct ccgctcgaag 15180
tagcgcgtct gctgctccat acaagccaac cacggcctcc agaagaagat gttggcgacc 15240
tcgtattggg aatccccgaa catcgcctcg ctccagtcaa tgaccgctgt tatgcggcca 15300
ttgtccgtca ggacattgtt ggagccgaaa tccgcgtgca cgaggtgccg gacttcgggg 15360
cagtcctcgg cccaaagcat cagctcatcg agagcctgcg cgacggacgc actgacggtg 15420
tcgtccatca cagtttgcca gtgatacaca tggggatcag caatcgcgca tatgaaatca 15480
cgccatgtag tgtattgacc gattccttgc ggtccgaatg ggccgaaccc gctcgtctgg 15540
ctaagatcgg ccgcagcgat cgcatccata gcctccgcga ccggttgtag aacagcgggc 15600
agttcggttt caggcaggtc ttgcaacgtg acaccctgtg cacggcggga gatgcaatag 15660
gtcaggctct cgctaaactc cccaatgtca agcacttccg gaatcgggag cgcggccgat 15720
gcaaagtgcc gataaacata acgatctttg tagaaaccat cggcgcagct atttacccgc 15780
aggacatatc cacgccctcc tacatcgaag ctgaaagcac gagattcttc gccctccgag 15840
agctgcatca ggtcggagac gctgtcgaac ttttcgatca gaaacttctc gacagacgtc 15900
gcggtgagtt caggcttttt catatctcat tgccccccgg atctgcgaaa gctcgagaga 15960
gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt 16020
ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag 16080
tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca 16140
cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa 16200
cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg 16260
tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta 16320
ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct 16380
tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag 16440
acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg 16500
gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt 16560
tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat 16620
ggaatccgag gaggtttccc gatattaccc tttgttgaaa agtctcaata gccctttggt 16680
cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt 16740
tggcaagctg ctctagccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 16800
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 16860
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 16920
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 16980
c 16981

Claims (13)

1.CRISPR/nCas9系统、脱氨酶、尿嘧啶DNA糖基化酶抑制蛋白和植物基因表达启动子在定点编辑植物基因中的应用;
所述植物基因表达启动子启动CRISPR/nCas9系统中nCas9核酸酶、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白的表达;
所述脱氨酶为APOBEC1,其编码基因序列为序列1的第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白的编码基因序列为序列1的第392-688位;
所述nCas9核酸酶的编码基因序列为序列1的第689-4789位;
所述植物基因表达启动子的核苷酸序列为序列1的第5545-7535位;
所述待编辑基因为OsSBEIIb和OsPDS。
2.CRISPR/nCas9系统、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白在定点编辑植物基因中的应用;
所述脱氨酶为APOBEC1,其编码基因序列为序列1的第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白的编码基因序列为序列1的第392-688位;
所述待编辑基因为OsSBEIIb和OsPDS。
3.由nCas9核酸酶、脱氨酶和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白、待编辑基因的sgRNA和植物基因表达启动子在定点编辑植物基因中的应用;
所述植物基因表达启动子驱动由所述nCas9核酸酶、所述脱氨酶和所述尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因的表达;
所述脱氨酶为APOBEC1,其编码基因序列为序列1的第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白的编码基因序列为序列1的第392-688位;
所述nCas9核酸酶的编码基因序列为序列1的第689-4789位;
所述植物基因表达启动子的核苷酸序列为序列1的第5545-7535位;
所述待编辑基因为OsSBEIIb和OsPDS;
所述sgRNA的核苷酸序列为序列1第7785-8268位或序列2第7785-8268位或序列3第7785-8268位。
4.由nCas9核酸酶、脱氨酶、连接所述nCas9核酸酶与所述脱氨酶的连接肽和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白、待编辑基因的sgRNA和植物基因表达启动子在定点编辑植物基因中的应用;
所述植物基因表达启动子驱动由所述nCas9核酸酶、所述脱氨酶、所述连接肽和所述尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因的表达;
所述脱氨酶为APOBEC1,其编码基因序列为序列1的第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白的编码基因序列为序列1的第392-688位;
所述nCas9核酸酶的编码基因序列为序列1的第689-4789位;
所述连接肽的编码基因序列为序列1的第4790-4837位;
所述植物基因表达启动子的核苷酸序列为序列1的第5545-7535位;
所述融合蛋白的编码基因序列为序列1的第392-5524位;
所述待编辑基因为OsSBEIIb和OsPDS;
所述sgRNA的核苷酸序列为序列1的第7785-8268位或序列2的第7785-8268位或序列3的第7785-8268位。
5.一种定点编辑植物基因的方法,所述方法包括如下步骤:将nCas9核酸酶编码基因、脱氨酶编码基因、连接所述nCas9核酸酶与所述脱氨酶的连接肽的编码基因、尿嘧啶DNA糖基化酶抑制蛋白的编码基因、待编辑基因的sgRNA的编码基因和植物基因启动子导入出发植物,实现出发植物中靶基因的定点编辑;
所述脱氨酶为APOBEC1,其编码基因序列为序列1的第4838-5524位;
所述尿嘧啶DNA糖基化酶抑制蛋白的编码基因序列为序列1的第392-688位;
所述nCas9核酸酶的编码基因序列为序列1的第689-4789位;
所述连接肽的编码基因序列为序列1的第4790-4837位;
所述植物基因表达启动子的核苷酸序列为序列1的第5545-7535位;
所述待编辑基因为OsSBEIIb和OsPDS;
所述sgRNA的核苷酸序列为序列1的第7785-8268位或序列2的第7785-8268位或序列3的第7785-8268位。
6.根据权利要求5所述的方法,其特征在于:
所述nCas9核酸酶编码基因、所述脱氨酶编码基因、所述连接所述nCas9核酸酶与所述脱氨酶的连接肽的编码基因、所述尿嘧啶DNA糖基化酶抑制蛋白基因、所述待编辑基因的sgRNA的编码基因和所述植物基因启动子通过重组质粒导入出发植物中;
所述重组质粒包括由nCas9核酸酶、脱氨酶、连接所述nCas9核酸酶与所述脱氨酶的连接肽和尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因、所述待编辑基因的sgRNA的编码基因和植物基因启动子;
所述植物基因启动子驱动由所述nCas9核酸酶、所述脱氨酶、所述连接所述nCas9核酸酶与所述脱氨酶的连接肽和所述尿嘧啶DNA糖基化酶抑制蛋白组成的融合蛋白的编码基因的表达。
7.根据权利要求6所述的方法,其特征在于:所述融合蛋白的编码基因序列为序列1的第392-5524位。
8.根据权利要求6或7所述的方法,其特征在于:所述重组质粒的核苷酸序列为序列1、序列2或序列3。
9.根据权利要求5-7中任一所述的方法,其特征在于:所述植物为单子叶植物。
10.根据权利要求9所述的方法,其特征在于:所述单子叶植物为水稻。
11.权利要求6-8中任一所述的重组质粒。
12.一种定点编辑植物基因组的系统,包括权利要求6-8中任一所述的重组质粒。
13.权利要求6-8中任一所述的重组质粒或权利要求12所述的系统在定点编辑植物基因中的应用。
CN201710098892.7A 2016-12-01 2017-02-23 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用 Active CN107043779B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2016110911077 2016-12-01
CN201611091107 2016-12-01

Publications (2)

Publication Number Publication Date
CN107043779A CN107043779A (zh) 2017-08-15
CN107043779B true CN107043779B (zh) 2020-05-12

Family

ID=59545361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710098892.7A Active CN107043779B (zh) 2016-12-01 2017-02-23 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用

Country Status (2)

Country Link
CN (1) CN107043779B (zh)
WO (1) WO2018099256A1 (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
CA3043774A1 (en) * 2016-11-14 2018-05-17 Caixia Gao A method for base editing in plants
CN107043779B (zh) * 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN109295053B (zh) * 2017-07-25 2023-12-22 中国科学院上海营养与健康研究所 通过诱导剪接位点碱基突变或多聚嘧啶区碱基置换调控rna剪接的方法
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
CN109321584B (zh) * 2017-12-27 2021-07-16 华东师范大学 一种简单定性/定量检测单碱基基因编辑技术工作效率的报告系统
JP2021523739A (ja) * 2018-05-11 2021-09-09 ビーム セラピューティクス インク. プログラム可能な塩基エディターシステムを用いて単一ヌクレオチド多型を編集する方法
CN110835632B (zh) * 2018-08-15 2022-01-11 华东师范大学 新型碱基转换编辑系统用于基因治疗的应用
CN110835634B (zh) * 2018-08-15 2022-07-26 华东师范大学 一种新型碱基转换编辑系统及其应用
CN110835629B (zh) * 2018-08-15 2022-07-26 华东师范大学 一种新型碱基转换编辑系统的构建方法及其应用
CN109321593B (zh) * 2018-11-07 2022-01-25 中国农业科学院植物保护研究所 一套用于水稻的人工基因编辑系统
CN113473845A (zh) * 2018-12-04 2021-10-01 先正达农作物保护股份公司 经由基因组编辑进行基因沉默
CN109593781B (zh) * 2018-12-20 2021-02-23 华中农业大学 陆地棉基因组的精准高效编辑方法
CN109652439A (zh) * 2018-12-27 2019-04-19 宜春学院 利用CRISPR/Cas9介导的腺嘌呤碱基编辑系统改良水稻稻瘟病广谱抗性的方法
CN109652440A (zh) * 2018-12-28 2019-04-19 北京市农林科学院 VQRn-Cas9&PmCDA1&UGI碱基编辑系统在植物基因编辑中的应用
CN109666693B (zh) * 2018-12-29 2022-08-16 北京市农林科学院 Mg132在碱基编辑系统编辑受体基因组中的应用
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
CN112239756B (zh) * 2019-07-01 2022-04-19 科稷达隆(北京)生物技术有限公司 一组来源于植物的胞嘧啶脱氨酶和其在碱基编辑系统中的应用
CN117264998A (zh) * 2019-07-10 2023-12-22 苏州齐禾生科生物科技有限公司 双功能基因组编辑系统及其用途
US20220380749A1 (en) * 2019-08-20 2022-12-01 Tianjin Institute Of Industrial Biotechnology, Chinese Academy Of Sciences Base editing systems for achieving c to a and c to g base mutation and application thereof
CN112779265B (zh) * 2019-11-11 2022-11-08 中国科学院遗传与发育生物学研究所 一种对植物特定基因进行饱和碱基编辑的育种方法
CN110878305B (zh) * 2019-12-09 2022-04-12 安徽省农业科学院水稻研究所 一种宽窗口单碱基编辑基因及其应用和育种方法
BR112022017704A2 (pt) * 2020-03-04 2022-11-01 Suzhou Qi Biodesign Biotechnology Company Ltd Método e sistema de edição de genoma multiplex
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CN114317518B (zh) * 2020-09-30 2024-01-12 北京市农林科学院 SpRYn-CBE碱基编辑系统在植物基因组碱基替换中的应用
CN114317590B (zh) * 2020-09-30 2024-01-16 北京市农林科学院 一种将植物基因组中的碱基c突变为碱基t的方法
CN112538492B (zh) * 2020-12-14 2022-10-11 安徽省农业科学院水稻研究所 一种识别PAM序列为NRTH的SpCas9n变体及相应碱基编辑系统
CN114591977B (zh) * 2022-02-28 2023-05-16 中国农业科学院作物科学研究所 通过精准编辑内源epsps基因获得抗草甘膦水稻的方法及其所用系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015133554A1 (ja) * 2014-03-05 2015-09-11 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014186686A2 (en) * 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
US9840699B2 (en) * 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
US20190225955A1 (en) * 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
CN108495932B (zh) * 2015-11-27 2022-08-09 国立大学法人神户大学 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体
CN107043779B (zh) * 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CN106609282A (zh) * 2016-12-02 2017-05-03 中国科学院上海生命科学研究院 一种用于植物基因组定点碱基替换的载体
CN106834341B (zh) * 2016-12-30 2020-06-16 中国农业大学 一种基因定点突变载体及其构建方法和应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015133554A1 (ja) * 2014-03-05 2015-09-11 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体

Also Published As

Publication number Publication date
WO2018099256A1 (zh) 2018-06-07
CN107043779A (zh) 2017-08-15

Similar Documents

Publication Publication Date Title
CN107043779B (zh) 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
CN106929532B (zh) 人工创制玉米雄性不育系与高效的转育方法
CN107254485A (zh) 一种能够快速构建植物基因定点敲除载体的新反应体系
CN112279903B (zh) 一种提高水稻穗期稻瘟病抗性的基因及其用途
CN106701810B (zh) 一种谷氨酸棒状杆菌的基因编辑系统及其应用
CN110229843B (zh) 陆地棉转化事件19pfa1-135-17及其特异性鉴定方法
CN112941087A (zh) 玉米ZmBES1/BZR1-2基因在提高植物耐旱性中的应用
CN112522298B (zh) 用于植物基因编辑的成套载体及其应用
CN110564752B (zh) 差异代理技术在c·t碱基替换细胞富集中的应用
CN107417779B (zh) 一种植物耐铝相关蛋白GmGRPL及其编码基因与应用
CN111593031B (zh) 水稻ALS突变基因、含有该基因的植物转基因筛选载体pCALSm3及其应用
CN111471684B (zh) 植物组成型启动子ALSpro及其应用
CN113185590B (zh) 一个调控水稻早抽穗开花的基因及其用途
CN109112130B (zh) 一种高盐及衰老特异诱导启动子、工程载体及应用
CN110628794B (zh) 以失活的筛选剂抗性基因为报告体系的c·t碱基替换的细胞富集技术及其应用
CN115873853A (zh) 一种植物角果特异启动子
CN109266631A (zh) 一种基因组定点敲除的方法
CN114317589B (zh) SpRYn-ABE碱基编辑系统在植物基因组碱基替换中的应用
CN114317596B (zh) 一种将植物基因组靶点序列中的a突变为g的方法
CN108949764B (zh) 一种黑暗及衰老特异诱导启动子、工程载体及应用
CN111560396B (zh) 植物转基因筛选载体pCALSm1及其应用
CN105154466B (zh) 一种双基因共表达重组载体及其构建方法和在三孢布拉霉中的应用
CN113373157B (zh) Gf14c基因在提高水稻耐盐抗性中的应用
CN105255859B (zh) 一种提高植物耐非生物胁迫能力的方法
CN111411098B (zh) 水稻ALS突变基因、含有该基因的植物转基因筛选载体pCALSm2及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant