CN109880846A - 一种用于植物基因组编辑载体、及其构建方法和应用 - Google Patents
一种用于植物基因组编辑载体、及其构建方法和应用 Download PDFInfo
- Publication number
- CN109880846A CN109880846A CN201910178891.2A CN201910178891A CN109880846A CN 109880846 A CN109880846 A CN 109880846A CN 201910178891 A CN201910178891 A CN 201910178891A CN 109880846 A CN109880846 A CN 109880846A
- Authority
- CN
- China
- Prior art keywords
- plasmid
- dna
- lir
- area
- setp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一种用于对植物基因组进行精准编辑的载体,包括依次连接的两个双生病毒大间区LIR、sgRNA表达盒和Cas9D10A基因片段;在两个大间区LIR之间连接有复制相关蛋白Rep/RepA片段、双生病毒小间区SIR和用于DNA重组编辑的HR片段;sgRNA表达盒是依据基因组目标位点DNA序列设计构建。基因编辑载体的构建方法包括以下步骤:第一步,构建质粒PMF115;第二步,构建质粒PMF125;第三步,依据基因组目标位点DNA序列,设计sgRNA表达盒,将sgRNA表达盒克隆到质粒PMF125;第四步,将用于重组的DNA片段HR克隆到质粒PMF115;第五步,将第四步构建质粒中两个LIR之间的DNA片段克隆到第三步构建的质粒中,从而获得最终基因编辑载体。
Description
技术领域
本发明属于基因工程技术领域,具体涉及一种用于对植物基因组的特定位点DNA进行精确编辑的载体、以及载体的构建方法和应用。
背景技术
基因定点突变与定点置换技术称为基因组编辑技术,也称为基因打靶技术,该技术能实现在生物体细胞基因组DNA的定点突变、定点整合及置换,从而人为定向改变基因的功能。利用这种技术能够实现对基因组DNA一个或多个碱基的变异,或者插入一段DNA,如一个基因,或者删除一段DNA,让基因的某些功能区域缺失。基因组编辑的方法包括:锌指核酸酶(Zinc finger nuclease,ZFN)技术、TALEN(Transcription activator-like effectornucleases)技术及CRISPR/Cas(Clustered regularly interspaced short palindromicrepeats/CRISPR-associated systems)技术等,其中CRISPR/Cas9构建简单,使用方便,从而得到了更广泛的运用。
CRISPR是细菌及古细菌基因组中存在的成串重复DNA,是降解入侵的病毒DNA或其他外源DNA的重要免疫机制。CRISPR系统分成三类,其中I类和III类需要多种CRISPR相关蛋白(Cas蛋白)才能发挥作用,而II类系统只需要一种Cas蛋白即可。例如,CRISPR/Cas9系统通过将入侵噬菌体和质粒DNA的片段整合到CRISPR中,并利用相应的CRISPR RNAs(crRNAs)来指导Cas9蛋白对同源DNA序列的降解。依据这种对付入侵细菌细胞病毒DNA的原理,设计出在高等生物中对基因进行编辑的系统,能够对细胞的基因组DNA进行原位修饰、改变,这不仅为研究基因功能提供了重要手段,而且在基因定向突变,改良农作物品种中,显示出广阔的应用前景。
发明内容
本发明提供了一种用于植物基因组编辑的载体、以及载体的构建和应用方法,实现对植物基因组特定位点DNA的精确修饰、编辑,以及将外源DNA定点整合到植物基因组的目的,从而达到按照设计改变原基因组特定位置DNA遗传信息的目的,将本发明提供的种载体用于对水稻稻瘟病抗性位点DNA的编辑修饰获得良好效果。
本发明通过下述技术方案实现:
一种用于植物基因组编辑载体构建的质粒PMF115,所述质粒包含有双生病毒复制相关的小间区SIR、大间区LIR和复制相关蛋白Rep/RepA三个DNA片段,所述双生病毒小间区SIR为Seq No.1,双生病毒大间区LIR为Seq No.2,复制相关蛋白Rep/RepA片段为Seq No.3。所述质粒用于克隆重组的DNA片段HR。质粒PMF115结构示意图如图1所示。双生病毒是指双生病毒科植物病毒,如小麦矮缩病毒。
基于上述质粒PMF115的构建方法,包括以下步骤:
Setp 1,根据双生病毒基因组序列设计并合成小间区SIR、大间区LIR和复制相关蛋白Rep/RepA三个DNA片段;其中,小间区SIR片段如Seq No.1所示,大间区LIR片段如SeqNo.2所示,复制相关蛋白Rep/RepA片段如Seq No.3所示,具体操作过程中,将合成的三个DNA片段分别克隆在PJWR质粒、pMV质粒和pMV质粒上;
Setp 2,将小间区SIR的DNA片段克隆到pGreenII0179的EcoRI和PstI双酶切位点,得到质粒0179-SIR。具体地,将含小间区SIR的质粒PJWR经EcoRI和PstI双酶切后,与经EcoRI和PstI双酶切后的pGreenII0179片段进行连接,得到质粒0179-SIR;
Setp 3,将大间区LIR的DNA片段克隆到质粒0179-SIR的KpnI和XhoI酶切位点,得到质粒0179-LIR-SIR。具体地,将含有大间区LIR的质粒pMV经KpnI和XhoI酶切后,与经KpnI和XhoI酶切后的0179-SIR片段进行连接,得到质粒0179-LIR-SIR;
Setp 4,将大间区LIR的DNA片段克隆到质粒0179-LIR-SIR的SacII和SacI酶切位点,得到质粒PMF096;具体地,采用F-LIR-SacII和R-LIR-SacI作为引物,以质粒0179-LIR-SIR为模板进行PCR扩增,得到的PCR片段克隆到质粒0179-LIR-SIR的SacII和SacI酶切位点,得到质粒0179-LIR-SIR-LIR,命名为PMF096;其中,F-LIR-SacII和R-LIR-SacI引物如下:
F-LIR-SacII:5’-TACCGCGGGGTAGTGAACAGAAGTCCG-3’;
R-LIR-SacI:5’-TAGAGCTCCGAGATGGGCTCCCACGC-3’;
Setp 5,在质粒PMF096的大间区LIR和小间区SIR中间克隆一个多克隆位点区,得到质粒PMF114,所述多克隆位点区包括XhoI、SalI、SmaI/XmaI、BamHI、SpeI、XbaI、NotI、HindIII、EcoRV;具体地,合成序列如下所示的F-PC和R-PC片段,将这两个单链DNA片段经变性后复性得到双链DNA的片段,再将其克隆到质粒PMF096的SalI和HindIII双酶切位点,获得在大间区LIR和小间区SIR中间含有多克隆位点区XhoI、SalI、SmaI/XmaI、BamHI、SpeI、XbaI、NotI、HindIII、EcoRV的质粒,即PMF114;
F-PC:5’-TCGACCCGGGGGATCCACTAGTTCTAGAGCGGCCGC-3’;
R-PC:5’-AGCTTGCGGCCGCTCTAGAACTAGTGGATCCCCCGGG-3’;
Setp 6,将Rep/RepA的DNA片段克隆到质粒PMF114的SacII和PstI双酶切位点,得到质粒PMF115,序列为Seq No.4;具体地,将含有复制相关蛋白Rep/RepA片段的质粒pMV经SacII和PstI双酶切后,与PMF114质粒经同样酶切后DNA片段连接即可。
一种与上述质粒PMF115配合使用构建植物基因组编辑载体的质粒PMF125,所述质粒PMF125是将质粒pYLCRISPR/Cas9pUbi-H中编码Cas9蛋白的氨基酸突变,使得Cas9由核酸酶变为切口酶。由于Cas9核酸酶含有两个功能域:RuvC和HNH,D10A突变使得RuvC丧失功能Cas9成为切口酶;同样地,突变在HNH功能域H840A,第840位氨基酸由组氨酸突变成丙氨酸,也可以使Cas9由核酸酶变为切口酶。所述质粒PMF125用于克隆目标基因的sgRNA表达盒,通过质粒PMF125直接与质粒PMF115配合使用,或者与构建质粒PMF115的中间质粒PMF096或PMF114配合使用构建植物基因组编辑载体。质粒PMF125的结构示意图如图2所示。
上述质粒PMF125的构建方法,包括以下步骤:
Setp 1,用BamHI酶切pYLCRISPR/Cas9pUbi-H质粒,得到约10kb和6.2kb两个片段,6.2Kb片段与质粒pUC19经BamHI酶切并去磷酸化的片段连接,得质粒T-p-cas9p;10kb片段经去磷酸化处理备用;
Setp 2,合成如下PCR引物:
F-p-cas9p:5’-CTGAGCTAGCGTTCGTACACGGAT-3’;
R-p-cas9p:5’-ATGCGCTAGCTCCACCGTCAATGTA-3’;
F-cas9pD10A:5’-TCCATCGGCCTCGCTATCGGCACCAAC-3’;
R-cas9pD10A:5’-GTTGGTGCCGATAGCGAGGCCGATGGA-3’;
以pYLCRISPR/Cas9pUbi-H质粒为模板,分别用引物F-p-cas9p和R-cas9pD10A、F-cas9pD10A和R-p-cas9p进行第一次PCR扩增;以两个第一次PCR扩增片段混合DNA为模板,用引物F-p-cas9p和R-p-cas9p进行第二次PCR扩增,第二次PCR扩增片段经NheI酶切与质粒T-p-cas9p经NheI酶切去磷酸化处理的大片段连接,得到质粒T-p-cas9pM;
Setp 3,质粒T-p-cas9pM经BamHI酶切,回收的片段与上述Setp 1的10kb大片段连接,从而获得载体质粒PMF125,序列为Seq No.5。
一种用于植物基因组编辑的载体,所述编辑载体包括依次连接的两个双生病毒大间区LIR、sgRNA表达盒和Cas9D10A基因,且所述两个双生病毒大间区LIR之间含有双生病毒复制相关蛋白Rep/RepA片段、双生病毒小间区SIR和用于重组的DNA片段HR;
所述sgRNA表达盒是依据目标基因组位点DNA序列设计构建而成,包括含启动子、依据靶序列设计的sgRNA的DNA片段及终止子;
所述用于重组的DNA片段HR是指用于与目标基因组位点DNA在细胞内重组,从而达到改变原编辑位点DNA遗传信息的DNA片段。
所述sgRNA表达盒为依据目标基因组位点DNA序列设计构建,包括含启动子、靶序列和sgRNA的DNA片段。基因组编辑载体如图3所示,用该载体转化植物,载体质粒的RB到LB的T-DNA片段整合进入植物细胞的基因组中,由于T-DNA含有两个双生病毒大间区(LIR),两者重组得到如图5所示的环状DNA分子。在转入表达的复制相关蛋白(Rep/RepA)作用下,形成的环状DNA类似于双生病毒,在植物细胞内自主大量复制,得到的大量含有HR的DNA就易于与基因组的同源目标位点DNA发生重组,从而实现对基因组的编辑修饰,特别是转入的Cas9D10A核酸酶的表达,在sgRNA的引导下,能在目标基因组的目标DNA上形成切口,使得这种重组概率大幅度提高,最终实现对基因组高效的编辑。
基于上述用于植物基因组编辑的载体的构建方法,包括以下步骤:
Setp 1,构建质粒PMF115;
Setp 2,构建质粒PMF125;
Setp 3,依据目标基因组位点DNA序列设计sgRNA表达盒,将所述sgRNA表达盒连入载体PMF125制备含sgRNA表达盒的质粒;
Setp 4,将用于重组DNA的片段HR连接到载体质粒PMF115;
Setp 5,将所述Setp 4构建的质粒中两个大间区LIR片段、以及两个大间区LIR之间的DNA片段克隆到Setp 3构建的质粒中,获得最终基因组编辑载体。
进一步地,用于植物基因组编辑的载体的构建方法,所述Setp 3中,sgRNA表达盒的设计步骤包括:
Setp 31,对目标基因组位点DNA序列,设计sgRNA靶序列,所述sgRNA靶序列为5’-N20NGG,其中GC含量为50%-70%,对应启动子为U3或U6;
具体地,sgRNA靶序列通常为5’-N20NGG,其中GC含量大于40%,最好为50%-70%,避免连续的4个碱基为T。如果sgRNA序列是5’-AN19NGG,选择U3作为启动子;如果sgRNA序列是5’-GN19NGG,选择U6作为启动子;如果sgRNA序列为5’-(T/C)N19NGG,可以任选U3或U6作为启动子;
Setp 32,PCR引物设计:根据sgRNA靶序列,合成重叠延伸PCR的引物,合成构建sgRNA表达盒的通用引物;
具体地,根据sgRNA靶序列,合成重叠延伸PCR的引物,合成构建sgRNA表达盒的通用引物;根据Setp 31设计的sgRNA靶序列,按下述表1合成重叠延伸PCR(Overlap PCR)的引物,按下述表2合成构建sgRNA表达盒的通用引物。
表1含靶位点DNA序列的重叠延伸PCR的引物
表2构建sgRNA表达盒的通用引物*
*注:GGTCTC为BsaI识别位点;ACTAGT为SpeI酶切位点;ACGCGT为MluI酶切位点。
Setp 33,重叠延伸PCR扩增构建sgRNA表达盒;
具体地,根据需要选择不同的启动子,再依照选用的启动子不同,分别从如下四个质粒中选择适当的一个作为第一轮PCR的扩增模板:
①pYLsgRNA-OsU3,GenBank登录号:KR029103;
②pYLsgRNA-OsU6a,GenBank登录号:KR029105;
③pYLsgRNA-OsU6b,GenBank登录号:KR029107;
④pYLsgRNA-OsU6c,GenBank登录号:KR029108。
两个PCR扩增的引物分别是U-F和OsU#T#-、gRT#-和gR-R为引物,扩增后分别得到U片段和T片段。
然后,以U片段和T片段混合为模板,Pps和Pgs为引物,进行第二轮PCR扩增,得到含有BsaI酶切位点的PCR产物。
上述重叠延伸PCR(Overlap PCR)扩增过程如图4所示。
第二轮扩增的PCR片段克隆到ZT4-Blunt载体(庄盟生物公司,货号ZC205),克隆片段经DNA测序验证。BsaI酶切质粒得到sgRNA表达盒,包括含启动子、靶序列、sgRNA的片段。
Setp 34,根据所设计的靶标序列数目组合扩增多个sgRNA表达盒。
具体地,可以根据所设计靶标序列数目组合扩增多个sgRNA表达盒,推荐按如下使用启动子及相应的PCR引物组合进行PCR扩增构建sgRNA表达盒:
1个目标位点:LacZ-OsU6a;
2个目标位点:LacZ-OsU6a+OsU6b;
3个目标位点:LacZ-OsU6a+OsU6b+OsU6c;
4个目标位点:LacZ-OsU6a+OsU6b+OsU6c+OsU3m;
5个目标位点:LacZ-OsU6a+OsU6a+OsU6b+OsU6c+OsU3m;
6个目标位点:LacZ-OsU6a+OsU6a+OsU6b+OsU6b+OsU6c+OsU3m;
7个目标位点:LacZ-OsU6a+OsU6a+OsU6b+OsU6b+OsU6c+OsU6c+OsU3m;
8个目标位点:LacZ-OsU6a+OsU6a+OsU6b+OsU6b+OsU6c+OsU6c+OsU3m+OsU3m。
例如,1个靶序列用Pps-GGL/Pgs-GGR;2个靶序列分别用:Pps-GGL/Pgs-GG2和Pps-GG2/Pgs-GGR;3个靶序列分别用Pps-GGL/Pgs-GG2、Pps-GG2/Pgs-GG3和Pps-GG3/Pgs-GGR;4个靶序列分别用Pps-GGL/Pgs-GG2、Pps-GG2/Pgs-GG3、Pps-GG3/Pgs-GG4和Pps-GG4/Pgs-GGR;依此类推。
Setp 35,sgRNA表达盒连入质粒PMF125:
具体地,sgRNA表达盒质粒经BsaI酶切分离的表达盒DNA片段,与BsaI酶切质粒PMF125的DNA片段连接,即得到含sgRNA表达盒的PMF125质粒。
下面事例为3个sgRNA表达盒时,它们的连接顺序(方向为5’-3’)。
进一步地,用于植物基因组编辑的载体的构建方法,所述Setp 4具体操作方法为:用于重组的DNA片段HR通过酶切连接或同源重组连接的方法连入质粒PMF115多克隆位点处;或者用于重组的DNA片段HR克隆到质粒PMF096或质粒PMF114得到中间质粒,然后再将Rep/RepA片段克隆进入上述中间质粒,即得到含HR片段的PMF115质粒。
操作方法如下:
Setp 41,根据sgRNA靶序列位点的基因组DNA序列,设计同源臂DNA,并与包括设计的突变、缺失或插入的DNA一起组成提供重组的片段HR。
Setp 42,提供重组的HR片段通过酶切连接或同源重组的方法连入质粒PMF115多克隆位点处;
①酶切的方法:根据载体PMF115中多克隆位点处可用酶切位点XhoI、SalI、SmaI/XmaI、BamHI、SpeI、XbaI、NotI、EcoRV及提供重组片段HR序列设计克隆酶切位点。通常采用PCR扩增获得HR片段,HR片段克隆到ZT4-Blunt(庄盟生物公司,货号ZC205),并测序克隆的HR验证。用设计的酶酶切HR片段,连接到PMF115质粒得到相应质粒。注意:Rep/RepA中含有一个HindIII酶切位点,PMF115多克隆位点中HindIII不能用于克隆。
②同源重组的方法:根据载体PMF115中多克隆位点处可用酶切位点XhoI、SalI、SmaI/XmaI、BamHI、SpeI、XbaI、NotI、EcoRV任选两个酶(假定为酶A和酶B)酶切PMF115质粒,得到线性PMF115质粒DNA。通常用PCR扩增方法得到HR片段,PCR引物以如下所示设计:
正向引物(F-HR):A酶切位点序列前15个碱基+A酶切位点序列+HR片段序列正向5’-端15~20bp碱基序列-3’。
反向引物(R-HR):B酶切位点序列前15个碱基+B酶切位点序列+HR序列反向5’-端15~20bp碱基序列-3’。
经酶切线性化的PMF115和PCR扩增片段,经重组酶(Vazyme公司,货号C112-01)连接得到相应的质粒。
或者,提供重组DNA的HR片段首先克隆到质粒PMF096或者PMF114,然后再将Rep/RepA片段克隆到这个质粒。特别是,在Rep/RepA中含有HindIII酶切位点,而克隆HR片段也需要用到HindIII酶切位点时,选择HR片段克隆到PMF096或者PMF114,然后再将Rep/RepA片段克隆到这个质粒,最终得到含有HR片段的编辑载体PMF115的质粒。
进一步地,用于植物基因组编辑载体的构建方法,所述Setp 5具体操作步骤包括:
以如下引物:F-LSL和R-LSL:
F-LSL:5’-TTGGAGTGGATGGATACTAGTGGTAGTGAACAGAAG-3’;
R-LSL:5’-GCGCCAATGATACCGACGCGTCGAGATGGGCTCCCA-3’;
用Setp 4构建的质粒DNA为模板进行PCR扩增,扩增得到的DNA片段包括两个病毒大间区LIR、以及位于两个病毒大间区LIR之间的复制相关蛋白Rep/RepA、双生病毒小间区SIR和用于重组的DNA片段HR(如图6所示);扩增片段与来自Setp 3含sgRNA表达盒的PMF125质粒的MluI和SpeI双酶切片段经重组酶连接,即获得最终的编辑载体,如图3所示。
或者,如果用于重组的DNA片段HR中不含MluI和NheI酶切位点,可采用酶切连接的方法将PCR扩增片段连入PMF125质粒中。具体地,用如下引物:
F-LIR-M:5’-TAACGCGTGGTAGTGAACAGAAGTCCG-3’;
R-LIR-N:5’-TAGCTAGCCGAGATGGGCTCCCACGC-3’;
用Setp 4构建的质粒DNA为模板进行PCR扩增,扩增得到DNA片段包括病毒大间区LIR、复制相关蛋白Rep/RepA、双生病毒小间区SIR和用于重组的DNA片段HR(如图6所示),将该PCR扩增片段经MluI和NheI酶切后,与来自Step3含sgRNA表达盒质粒PMF125的MluI和SpeI双酶切片段连接,即获得最终的编辑载体,如图3所示。
基于上述用于构建植物基因组编辑载体的质粒PMF115或质粒PMF125或用于植物基因组编辑的载体的应用。
本发明具有如下的优点和有益效果:
1、用本发明的基因组编辑载体转化植物,质粒的RB到LB的T-DNA片段整合进入植物细胞的基因组中,由于T-DNA含有两个双生病毒大间区(LIR),从而进行重组得到环状DNA分子(如图5所示)。在转入表达的复制相关蛋白(Rep/RepA)作用下,该环状DNA类似于双生病毒,在植物细胞内自主大量复制,得到的大量含有HR的DNA就易于与基因组的同源目标位点DNA发生重组,从而实现对基因组的编辑修饰,特别是转入的Cas9D10A核酸酶的表达,在sgRNA的引导下,能在基因组目标DNA上形成切口,使得这种重组概率大幅度提高,最终实现对基因组高效的编辑;
2、本发明改进了现有的CRISPR/Cas9基因编辑系统,实现了对基因组特定位点DNA的精确修饰、编辑。更确切地说,本发明提供了一种将外源DNA定点整合到植物基因组的方法,实现了按照需要进行设计,达到改变原基因组特定位置DNA遗传信息的目的。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明的质粒PMF115结构示意图;
图2为本发明的质粒PMF125结构示意图;
图3为本发明的基因组编辑载体结构示意图;
图4为本发明的整个重叠延伸PCR(Overlap PCR)扩增过程示意图;
图5为本发明的环状DNA分子示意图;
图6为本发明中PCR扩增的含病毒复制相关元件和提供重组DNA的HR片段示意图;
图7为本发明设计的水稻稻瘟病抗性基因替换供体片段示意图;
图8为本发明的转化水稻植株潮霉素标记基因的PCR检测琼脂糖凝胶电泳图;
图9为本发明的转化水稻植株Cas9基因的PCR检测琼脂糖凝胶电泳图;
图10为本发明用于水稻稻瘟病抗性基因进行编辑的实际效应;图中数字000对应的DNA序列为原来基因组DNA序列,其它是测定的植株发生编辑的DNA序列;
图11为稻瘟病抗性位点在水稻基因组各个染色体上的分布,图中数字是遗传图距单位厘摩,下划线的文字为SSR或者RFLP标记;此图片引自发表文献:Wang,X.,Lee,S.,Wang,J.,Ma,J.,Bianco,T.,&Jia,Y.(2014).Current advances on genetic resistanceto rice blast disease.In Rice-Germplasm,Genetics andImprovement.IntechOpen.http://dx.doi.org/10.5772/56824。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1
一、构建一种含有双生病毒复制相关原件、用于克隆用于重组DNA的片段HR的载体质粒PMF115,如图1所示。
质粒PMF115的构建方法如下:
1、首先根据侵染小麦的小麦矮缩病毒(Wheat dwarf virus)基因组序列(GenBank登录号:DQ868525.1)设计合成小间区SIR(Seq No.1)、大间区LIR(Seq No.2)和复制相关蛋白Rep/RepA(Seq No.3)三个DNA片段。
小间区(SIR)DNA片段由华大基因(HTTP://WWW.GENOMICS.CN/)合成,并克隆在质粒PJWR上;
大间区(LIR)DNA片段由华大基因合成,并克隆在质粒pMV上;
复制相关蛋白Rep/RepA的DNA片段,原基因DNA序列所含有的BsaI位点已经消除。该片段由华大基因合成,并克隆在质粒pMV上。
2、将上述含有小间区SIR的质粒经EcoRI和PstI双酶切后,回收约190bp的片段,与经EcoRI和PstI双酶切后的pGreenII0179(https://en.wikipedia.org/wiki/PGreen)片段进行连接,得到质粒0179-SIR。克隆片段经DNA测序验证。
3,将上述含有大间区LIR片段的质粒经KpnI和XhoI酶切后,回收约420bp的片段,与经KpnI和XhoI酶切后的0179-SIR片段进行连接,得到质粒0179-LIR-SIR。克隆片段经DNA测序验证。
4,合成下列PCR引物:
F-LIR-SacII:5’-TACCGCGGGGTAGTGAACAGAAGTCCG-3’;
R-LIR-SacI:5’-TAGAGCTCCGAGATGGGCTCCCACGC-3’;
采用F-LIR-SacII和R-LIR-SacI作为引物,以上述质粒0179-LIR-SIR为模板进行PCR扩增,得到的PCR扩增片段经SacII和SacI酶切,再与经同样酶切的0179-LIR-SIR片段进行连接,得到质粒0179-LIR-SIR-LIR,命名为PMF096。克隆片段经DNA测序验证。
5,合成下列单链DNA片段:
F-PC:5’-TCGACCCGGGGGATCCACTAGTTCTAGAGCGGCCGC-3’;
R-PC:5’-AGCTTGCGGCCGCTCTAGAACTAGTGGATCCCCCGGG-3’。
将F-PC和R-PC分别溶解配制成10μmol/L浓度,各取2μl混匀成4μl,95℃变性5min,慢退火(PCR反应升至95℃后直接停止关机,30分钟后取出放在室温),与经SalI和HindIII双酶切的质粒PMF096片段连接,获得在左边大间区LIR和小间区SIR中间含有多克隆位点区XhoI、SalI、SmaI/XmaI、BamHI、SpeI、XbaI、NotI、HindIII、EcoRV的质粒,PMF114。克隆片段经DNA测序验证。
6,将上述含有复制相关蛋白Rep/RepA合成DNA片段的质粒经SacII和PstI双酶切后,与上述PMF114质粒经SacII和PstI双酶切后回收的片段连接,最终得到所需质粒PMF115,序列为Seq No.4。克隆片段经DNA测序验证。
二、构建一种用于植物基因组编辑载体的质粒PMF125,如图2所示。
PMF125是把质粒pYLCRISPR/Cas9pUbi-H(华南农业大学刘耀光教授惠赠,GenBank登录号:KR029109)中编码Cas9的第10位氨基酸天冬氨酸突变成丙氨酸(D10A),使得Cas9核酸酶突变为切口酶后的质粒。
PMF125的构建方法如下:
1、用BamHI酶切pYLCRISPR/Cas9pUbi-H质粒,得到约10kb和6.2kb两个片段,6.2Kb片段与质粒pUC19经BamHI酶切并去磷酸化的片段连接,得质粒T-p-cas9p。10kb片段经去磷酸化处理备用。
2,合成如下PCR引物:
F-p-cas9p:5’-CTGAGCTAGCGTTCGTACACGGAT-3’;
R-p-cas9p:5’-ATGCGCTAGCTCCACCGTCAATGTA-3’;
F-cas9pD10A:5’-TCCATCGGCCTCGCTATCGGCACCAAC-3’;
R-cas9pD10A:5’-GTTGGTGCCGATAGCGAGGCCGATGGA-3’。
以pYLCRISPR/Cas9pUbi-H质粒为模板,分别用引物F-p-cas9p和R-cas9pD10A、F-cas9pD10A和R-p-cas9p进行PCR扩增,分别得到970bp片段1和1100bp片段2;将片段1和片段2等摩尔比混合作为模板,再用引物F-p-cas9p和R-p-cas9p进行PCR扩增,得到长约2100bp的片段;该片段经NheI酶切与上述第一步质粒T-p-cas9p经NheI酶切去磷酸化处理的大片段连接,得到质粒T-p-cas9pM。此克隆片段经DNA测序验证。
3,质粒T-p-cas9pM经BamHI酶切,回收6.2Kb的片段,与上述第一步得到的10kb大片段连接,从而获得载体质粒PMF125,序列为Seq No.5。
使用上述PMF115(或者PMF096和PMF114)和PMF125两个质粒,就可以构建用于精确修饰、编辑的植物细胞基因组DNA的载体。
实施例2
如图11所示,在水稻基因组第6染色体上存在着一个稻瘟病抗性基因位点,该位点的变异对水稻稻瘟病的许多不同的生理小种产生抗性,在水稻稻瘟病抗性中有着重要作用。
本实施例通过本发明的载体,将人工设计的DNA片段重组到位点,达到对抗病基因进行修饰、改良的目的。具体操作步骤如下:
一、编辑载体的构建
第一步,根据一个水稻基因组稻瘟病抗性位点的DNA序列(Seq No.6)确定sgRNA的目标序列:
sgRNA-1(正向):5’-TTGAGTAGCAAACTAAAGGAAGG-3’;
sgRNA-2(反向互补):5’-CCTCCCCTACTAAGGACACTCAG-3’;
第二步,依据确定的靶位点构建两个sgRNA表达盒:
①sgRNA-1表达盒
合成如下引物:
U-F:5’-CTCCGTTTTACCTGTGGAATCG-3’;
gR-R:5’-CGGAGGAAAATTCCATCCAC-3’;
gRpiz-1:5’-TTGAGTAGCAAACTAAAGGAGTTTTAGAGCTAGAAAt-3’
U6apiz-1:5’-TCCTTTAGTTTGCTACTCAACGGCAGCCAAGCCAGCA-3’
Pps-GGL:5’-TTCAGAGGTCTCTCTCGATGGAATCGGCAGCAAAGG-3’;
Pps-GG2-1:5’-AGCGTGGGTCTCGTCAGGGTCCATCCACTCCAAGCTC-3’。
PCR一扩:分别以U-F和U6apiz-1、gRpiz-1和gR-R分别为引物,以pYLgRNA-OsU6a质粒为模板扩增,分别获得片段1和片段2;PCR二扩:以等量片段1加片段2为模板,用Pps-GGL和Pps-GG2-1为引物扩增;获得PCR片段用BsaI酶切,得到OsU6a+sgRNA-1如下所示:
②sgRNA-2表达盒
合成如下引物:
gRpiz-2:5’-CTGAGTGTCCTTAGTAGGGGGTTTTAGAGCTAGAAAT-3’
U6bpiz-2:5’-CCCCTACTAAGGACACTCAGCAACACAAGCGGCAGC-3’
Pps-GG2-2:5’-TTCAGAGGTCTCTCTGACACTGGAATCGGCAGCAAAGG-3;’
Pps-GG3-1:5’-AGCGTGGGTCTCGTCTTCACTCCATCCACTCCAAGCTC-3’。
PCR一扩:分别以U-F和gRpiz-2、U6bpiz-2和gR-R分别为引物,以pYLgRNA-OsU6b质粒为模板扩增,分别获得片段3和片段4;PCR二扩:以等量片段3加片段4为模板,用Pps-GG2-2和Pps-GG3-1为引物扩增;获得PCR片段用BsaI酶切,得到OsU6b+sgRNA-2如下所示:
③将①和②中两个sgRNA表达盒片段与质粒PMF125经BsaI酶切片段连接,得重组质粒就含有2个sgRNA表达盒(5’-3’方向)如下,该质粒命名为PMF138。
第三步,克隆重组片段HR
依据来自水稻抗稻瘟病基因位点的DNA序列,采用DNA合成和PCR扩增相结合的方法构建同源重组的DNA片段。本发明分别构建4个不同的重组片段。如下图7所示它们在5’端的一部分(HR1)和3’端一部分(HR2)完全相同,中间为有差异的片段。具体操作如下:
①合成如下PCR引物,用于扩增HR1和HR2片段:
ZJ01:5’-TAGACTCTTGGGTCTGTCACCAAAAATAGCTAATGATCG-3’;
ZJ02:5’-GGAGAGAGCTCGCAGTCGCAGGTGATCACGTTG-3’;
M13R:5’-AGCGGATAACAATTTCACACAGGA-3’;
Pi2F:5’-CGATGCCATAACATTGCTACTGAG-3’。
②以有稻瘟病抗性位点DNA片段的质粒82779B-R1-4为模板,以Pi2F和ZJ01为一对、ZJ02和M13R为一对引物,分别进行PCR扩增,分别得到600多bp的HR1片段(Seq No.7)和200多bp的HR2片段(Seq No.8)。
③依据确定的稻瘟病抗性基因的DNA序列合成Pi9C(Seq No.9)、Pi50C(SeqNo.10)、Pigm-6(Seq No.11)和Pigm-8(Seq No.12)。
④合成序列如下的PCR引物,用于扩增全长重组片段(HR):
Pi2F-HR:5’-CGAGGTCGACCCGGGGGATCCCGATGCCATAACATTGCT-3’;
M13R-HR:5’-ATCAAGCTTGCGGCCGCTCTAGACAGGAAACAGCTATGACC-3’。
⑤以步骤②中克隆得到的HR1和HR2分别与步骤③合成的Pi9C、Pi50C、Pigm-6和Pigm-8合做模板,以Pi2F-HR和M13R-HR为引物进行PCR扩增,分别得到四条约2000bp左右的DNA片段,回收这些DNA片段分别与PMF115经BamHI和XbaI双酶切的产物进行同源重组克隆得重组质粒,PMF115-Pi9C的命名为PMF140,PMF115-Pi50C的命名为PMF141,PMF115-Pigm-6命名为PMF146,PMF115-Pigm-8命名为PMF147。PCR克隆片段经测序验证。
第四步,将重组片段(HR)及相关DNA片段克隆到上述PMF138质粒
①合成序列如下的PCR引物。
F-0179-HR:5’-GGAGTGGATGGATACTAGTTAGGGCGAATTGGGTACC-3’;
R-0179-HR:5’-GCCAATGATACCGACGCGTGAACAAAAGCTGGAGCTC-3’。
②用引物F-0179-HR和R-0179-HR,分别以第三步构建好的PMF140、PMF141、PMF146和PMF147质粒为模板进行PCR扩增,均得到4000多bp的条带,回收这些DNA片段与第二步构建好的质粒PMF138经MluI和SpeI双酶切片段进行同源重组连接,即获得稻瘟病基因位点DNA编辑载体,依次分别命名为PMF144、PMF145、PMF151和PMF152。克隆PCR片段经测序验证。
三、编辑载体转入农杆菌
1,农杆菌感受态细胞的制备
取出-80℃保存农杆菌LBA4404,接种在含有50mg/L利福平LB培养基培养皿培养(28℃,2-3天)。挑出培养LBA4404单菌落接种于50mL含50mg/L利福平液体LB培养基振动培养(28℃,150rpm),当农杆菌夜OD600=0.5,转入无菌50mL离心管离心(4000rpm,4min,4℃),去除上清液,加入5mL在冰水上预冷0.15mol/L NaCl,轻微震荡悬浮细菌细胞,充分混匀后再次离心(4000rpm,4min,4℃),得到的菌体中再次加入0.15M NaCl悬浮细胞,再离心收集菌体(4000rpm,4min,4℃);最后,在得到的菌体中加入冰水上预冷20mmol/L CaCl2溶液600μL,悬浮细菌细胞,加入DMSO(7%)混匀,分装于1mL的EP管,每管100μL;置于入液氮冷冻后立即冻存于-80℃低温冰箱备用。
2,载体质粒转化农杆菌
从-80℃低温冰箱取出农杆菌LAB4404感受态细胞,加入1μg左右编辑载体质粒,所述编辑载体质粒选择PMF144、PMF145、PMF151、PMF152中的任意一种,混匀后置于冰水30min;然后置入液氮冷冻1min,取出于37℃水浴至解冻,解冻后再次放入液氮冷冻1min,取出后37℃水浴至解冻,置于冰水2min后加入1mL LB培养基振动培养3-4h(28℃,140rpm);离心分离菌体,加入100μL LB液体培养基重悬,涂在含100mg/L卡那霉素+50mg/L链霉素的LB平板上培养(28℃,2-3天)长出菌落;取单个菌接种于含有100mg/L卡那霉素+50mg/L链霉素的液体LB(28℃,140rpm)培养培养16h,取2μL菌液进行PCR验证,阳性克隆在-80℃保存备用。
阳性克隆采用PCR方法检测潮霉素标记基因,PCR反应总体积50μL,按厂商(Takara,RR001A)说明配制。PCR扩增程序如下:94℃预变性5min;94℃变性30sec,58℃退火30sec,72℃延伸30sec,30个循环;72℃延伸5min。阳性克隆可以得到片段大小为800多bp左右的DNA片段。
其中引物如下:
HptII-F:5’-CGATTTGTGTACGCCCGACAGTC-3’;
HptII-R:5’-CGATGTAGGAGGGCGTGGATATG-3’。
四、编辑载体质粒的农杆菌转化水稻
1,水稻成熟胚愈伤组织的诱导培养
水稻成熟种子去壳,在70%乙醇浸泡30sec,然后在0.1%升汞中浸泡10min,无菌水冲洗7-8次,种子取出放在培养皿的无菌滤纸上吸干水分,接种到愈伤组织的诱导培养基上,29℃光照培养15d。切取成熟胚盾片长出的愈伤组织,并切成2-4mm的小块,再转接种到诱导培养基上培养3d。
诱导培养基:N6+300mg/L水解酪蛋白+2.8g/L L-脯氨酸+30g/L蔗糖+2mg/L 2,4-D+4g/L植物凝胶,pH 5.8。
2,农杆菌的培养和准备
将上述编辑载体的农杆菌LBA4404取出,接种在含有50mg/L链霉素+100mg/L卡那霉素的LB培养皿上培养(19℃,3d)。用接种环挑取少量农杆菌悬浮于15mL加入100μmol/L乙酰丁香酮的浸染培养基,菌液浓度控制在OD550=0.06-0.08。此菌液将用于下一步浸染水稻愈伤组织。
浸染培养基:N6+0.7g/L L-脯氨酸+68.4g/L蔗糖+36g/L葡萄糖+1.5mg/L 2,4-D,pH 5.2。
3,农杆菌浸染与共培养
将上述预培养的水稻愈伤组织转入50mL的离心管中,加入含有100μmol/L乙酰丁香酮浸染培养基10mL振荡均匀,然后去除液体;将上述准备好的10mL农杆菌悬浮液倒入,轻轻摇3min,倒掉菌液。将愈伤组织取出,放入培养皿的无菌滤纸上吸去多余菌液,愈伤组织转入共培养基培养(19℃,3d)。
共培养基:N6+300mg/L水解酪蛋白+2.8g/L L-脯氨酸+30g/L蔗糖+10g/L葡萄糖+2mg/L 2,4-D+100μmol/L乙酰丁香酮+4g/L植物凝胶,pH 5.8。
4,洗菌与抗性愈伤组织的筛选
共培养三天后取出愈伤组织,先用无菌水洗7-8次,再用加有250mg/L羧苄青霉素和10mg/L万古霉素的浸染培养基洗一次,然后愈伤组织转放到培养皿的无菌滤纸上吸去多余的液体,转入加50mg/L潮霉素和250mg/L羧苄基青霉素的筛选培养基培养(29℃,14d)。14天后愈伤组织转入筛选培养基再次筛选培养。
筛选培养基:N6+300mg/L水解酪蛋白+2.8g/L L-脯氨酸+30g/L蔗糖+2mg/L 2,4-D+4g/L植物凝胶,pH 5.8。
5,抗性愈伤组织的分化
将经两轮筛选后长出的旺盛抗性愈伤组织,转入含有50mg/L潮霉素、100mg/L头孢菌素和150mg/L羧苄青霉素的再生培养基上,在29℃光照下,经14-20天左右的培养,分化出绿色斑点,30天左右进一步分化成小苗。
再生培养基:MS+2g/L水解酪蛋白+30g/L蔗糖+30g/L山梨醇+2.0mg/L激动素+0.02mg/L萘乙酸+4g/L植物凝胶,pH 5.8。
6,转化植株的壮苗及移栽
当分化的芽长至约2-4cm时,将其转移至生根培养基,29℃光照培养2-3周。试管苗长到约8cm左右,打开试管炼苗3-4天,取出小苗用清水洗去植株根系上的培养基,移栽至土壤,温室培养,获得编辑潮霉素抗性基因的植株。
生根培养基:1/2MS+20g/L蔗糖+0.5mg/L萘乙酸+4g/L植物凝胶,pH 5.8。
五、转基因水稻植株的筛选鉴定
1,水稻植株总DNA提取
水稻植株DNA提取采用CTAB法。CTAB裂解液组成如下:1.4mol/L NaCl,0.1mol/LTris-HCl,20mmol/L EDTA,2%十六烷基三甲基溴化铵(CTAB),2%聚乙烯吡咯烷酮(PVP),1%(V/V)β-巯基乙醇。
具体步骤如下:取水稻上述转化水稻幼苗植株嫩叶片100mg于1.5mL离心管,在液氮中将其研磨成粉,加入600μL预热(65℃)的CTAB裂解液,涡旋震荡混匀,放入65℃水浴处理1h,取出加入600μL氯仿:异戊醇(24:1),反复颠倒混匀,然后离心(10000rpm,15min),取上清于1.5ml离心管,加入等体积的预冷异丙醇混匀,冰水上放置30min,离心(12000rpm,10min)沉淀DNA,去除上清液再加入1mL75%乙醇洗涤DNA沉淀,移去酒精风干后加入100μLTE溶解DNA,-20℃储存备用。
2,转化植株的PCR鉴定
①潮霉素标记基因PCR检测
转基因植株含有潮霉素筛选标记基因,采用如下潮霉素基因特异引物(HptII-F,HptII-R)进行PCR扩增,真正的转基因植物可以得到片段大小为800多bp左右的DNA片段,而转基因假阳性水稻无法扩增出这样的DNA片段。HptII-F和HptII-R引物如下:
HptII-F:5’-CGATTTGTGTACGCCCGACAGTC-3’;
HptII-R:5’-CGATGTAGGAGGGCGTGGATATG-3’。
PCR反应总体积50μL按厂商(Takara,货号:RR001A)说明配制。PCR扩增程序如下:94℃预变性5min;94℃变性30sec,58℃退火30sec,72℃延伸30sec,30个循环;72℃延伸5min。PCR产物经1%琼脂糖凝胶电泳观察,如图8所示。
②Cas转基因的PCR检测
使用如下转入基因Cas9的特异引物(F-Lcas9-RT,R-Lcas9-RT)进行PCR检测,转基因阳性植物可以得到片段大小约为600bp左右的DNA片段,阴性植物和非转基因水稻为无法扩增出这个DNA片段。F-Lcas9-RT和R-Lcas9-RT引物如下:
F-Lcas9-RT:5’-GAAGCGGAAGGTTGGTATT-3’;
R-Lcas9-RT:5’-TTGTCCACGTCGGAGTTAT-3’。
PCR反应总体积50μL,按厂商(Takara,货号:RR001A)说明配制。PCR扩增程序如下:94℃预变性5min;94℃变性30sec,55℃退火30sec,72℃延伸30sec,30个循环;72℃延伸5min。PCR产物经1%琼脂糖凝胶电泳观察,如图9所示。
六,转基因植株中稻瘟病抗性基因DNA编辑的鉴定
使用特异的引物(F-piz800,R-piz2607),PCR方法检测PMF145转化得到的转基因郑旱10号水稻植株,得到1800bp左右的DNA片段,该片段克隆到pMD19-T载体(Takara,货号:6013),选取转化大肠杆菌的阳性菌落,提取重组质粒DNA测序。
F-piz800和R-piz2607引物序列如下:
F-piz800:5’-AGAAGGGCAGTCGGATAGTA-3’;
R-piz2607:5’-ATCTTTTCCAACAGGGGTGAG-3’
PCR反应总体积50μL,按厂商(南京诺唯赞生物科技有限公司,货号:P112-03)说明配制。PCR扩增程序如下:94℃预变性5min;94℃变性30sec,55℃退火30sec,72℃延伸90sec,30个循环;72℃延伸5min。
测序结果如图10所示,在转基因水稻植株中存在着设计的重组DNA片段与原基因组抗稻瘟病位点DNA的重组发生,实验证明本发明的载体通过转化水稻,在转化植株中外源重组DNA的确可以重组到水稻基因组,实现对基因组DNA的定点编辑、修饰。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 四川省农业科学院生物技术核技术研究所
成都亿农农业科技有限公司
<120> 一种用于植物基因组编辑载体、及其构建方法和应用
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 190
<212> DNA
<213> 人工序列(1)
<400> 1
gaattctaat aaaataatat tttatttatc tcatgtcatt cgattacaga ggctcggcta 60
cgagcaaaga caaaccaaat tataacaaac aacaaccctt acacaatgac atcggaaaag 120
gaaatacaac accctgagat attacattta tagaaactgt acgccgtccg cgctaggaca 180
gtcactgcag 190
<210> 2
<211> 421
<212> DNA
<213> 人工序列(2)
<400> 2
ggtaccggta gtgaacagaa gtccggcagg tccttagcga aaaaacgggg tgtgccagaa 60
aactctatgc tctaccctgc gtggaggtgt gaattctgca cactgcaaat gcaatgtgtc 120
caatgattta tatagggcag gttttggcgg gagaacaggg ccctagtgtt cccacggtag 180
cgtagcgaat cgtgtgggcc ctgttaggtg tgcggtcggg tggcctccac gcgggttata 240
atattacccc gcgtggtggc ccccgacgcg cactcggctt ttcgtgagtg cgcggaggct 300
tttggaccac atcttttctg atcactttcg tgaaagatgg tgatttatca cacttttgat 360
gtggaaatgt gtgccatgcc ttagcttata aggaagtgcg tgggagccca tctcgctcga 420
g 421
<210> 3
<211> 1199
<212> DNA
<213> 人工序列(3)
<400> 3
ccgcggatgg cctcttcatc tacacccagg ttccgagtct attccaagta cctctttcta 60
acatatcctc aatgtaccct tgagccacag tacgccttgg attcacttcg cactctcttg 120
aacaaatatg agcccctcta catcgctgct gttagagagc tccacgaaga tggatcacca 180
catctgcacg ttctcgtgca gaacaagctt cgtgcttcca tcaccaatcc caatgcctta 240
aacctccgta tggatacatc tccattctcc atattccatc ctaatataca agctgccaaa 300
gactgcaacc aagttcgtga ttacatcacg aaggaggttg actccgatgt aaacacagct 360
gagtggggaa cattcgtggc tgtttcaact ccaggtcgta aagaccgtga tgcggatatg 420
aaacagatca ttgaatctag ttcctctcgc gaggaattcc tcagcatggt ttgcaatcgt 480
tttccgtttg aatggtctat ccgtctcaaa gacttcgagt acacggcacg ccatctattt 540
cctgacccag ttgccactta cacacctgag tttccaaccg aatcactcat ttgccatgag 600
actattgaaa gctggaaaaa tgaacatcta tactctgtaa gcctcgaatc ctatatcctt 660
tgtacttcca ctcctgcgga tcaagcgcaa tctgacttag agtggatgga cgattattcc 720
aggagtcacc ggggaggcat aagtccatct acatctgcgg gccaaccaga acaggaaaga 780
cttcctgggc aaggtcttta gggacacata attattataa cagtctagtt gacttcacaa 840
catatgacgt caacgccaag tataatatca tcgacgacat tccattcaag ttcacaccca 900
actggaagtg cttcgtcggg gctcagcgtg acttcacggt caatccaaaa tacggtaagc 960
gaaaagtgat acggggtggc ataccttgca tcattttagt taatccagac gaagattggc 1020
tcaaggatat gactcccgaa cagtcggatt acatgtactc taacgctgtt gttcactaca 1080
tgtatgaagg cgagacgttc atcaactact cgttcgcctc cggcgaagat gtcactgctt 1140
cgcagtgaac tagtcgatcc aggcctccca gctttcgtcc gtatcatcgg tttctgcag 1199
<210> 4
<211> 7297
<212> DNA
<213> 人工序列(4)
<400> 4
agctctcatc aaccgtggct ccctcacttt ctggctggat gatggggcga ttcaggcgat 60
ccccatccaa cagcccgccg tcgagcgggc ttttttatcc ccggaagcct gtggatagag 120
ggtagttatc cacgtgaaac cgctaatgcc ccgcaaagcc ttgattcacg gggctttccg 180
gcccgctcca aaaactatcc acgtgaaatc gctaatcagg gtacgtgaaa tcgctaatcg 240
gagtacgtga aatcgctaat aaggtcacgt gaaatcgcta atcaaaaagg cacgtgagaa 300
cgctaatagc cctttcagat caacagcttg caaacacccc tcgctccggc aagtagttac 360
agcaagtagt atgttcaatt agcttttcaa ttatgaatat atatatcaat tattggtcgc 420
ccttggcttg tggacaatgc gctacgcgca ccggctccgc ccgtggacaa ccgcaagcgg 480
ttgcccaccg tcgagcgcca gcgcctttgc ccacaacccg gcggccggcc gcaacagatc 540
gttttataaa tttttttttt tgaaaaagaa aaagcccgaa aggcggcaac ctctcgggct 600
tctggatttc cgatccccgg aattagagat cttggcagga tatattgtgg tgtaacgtta 660
tcgatctgga ttttagtact ggattttggt tttaggaatt agaaatttta ttgatagaag 720
tattttacaa atacaaatac atactaaggg tttcttatat gctcaacaca tgagcgaaac 780
cctataagaa ccctaatttc ccttatcggg aaactactca cacattattt atggagaaaa 840
tagagagaga tagatttgta gagagagact ggtgatttca gcgtaccgaa ttaattctcc 900
cgcgaccagc cgagcgagct tagcgaactg tggacgagaa ctgtgccacc aagcgtaagg 960
ccgttctctc gcatttgcct tgctaggctc gcgcgagttg ctggctgagg cgttctcgaa 1020
atcagctctt gttcggtcgg catctactct attcctttgc cctcggacga gtgctggggc 1080
gtcggtttcc actatcggcg agtacttcta cacagccatc ggtccagacg gccgcgcttc 1140
tgcgggcgat ttgtgtacgc ccgacagtcc cggctccgga tcggacgatt gcgtcgcatc 1200
gaccctgcgc ccaagctgca tcatcgaaat tgccgtcaac caagctctga tagagttggt 1260
caagaccaat gcggagcata tacgcccgga ggcgtggcga tcctgcaagc tccggatgcc 1320
tccgctcgaa gtagcgcgtc tgctgctcca tacaagccaa ccacggcctc cagaagaaga 1380
tgttggcgac ctcgtattgg gaatccccga acatcgcctc gctccagtca atgaccgctg 1440
ttatgcggcc attgtccgtc aggacattgt tggagccgaa atccgcgtgc acgaggtgcc 1500
ggacttcggg gcagtcctcg gcccaaagca tcagctcatc gagagcctgc gcgacggacg 1560
cactgacggt gtcgtccatc acagtttgcc agtgatacac atggggatca gcaatcgcgc 1620
atatgaaatc acgccatgta gtgtattgac cgattccttg cggtccgaat gggccgaacc 1680
cgctcgtctg gctaagatcg gccgcagcga tcgcatccat agcctccgcg accggctgaa 1740
gaacagcggg cagttcggtt tcaggcaggt cttgcaacgt gacaccctgt gcacggcggg 1800
agatgcaata ggtcaggctc tcgctgaact ccccaatgtc aagcacttcc ggaatcggga 1860
gcgcggccga tgcaaagtgc cgataaacat aacgatcttt gtagaaacca tcggcgcagc 1920
tatttacccg caggacatat ccacgccctc ctacatcgaa gctgaaagca cgagattctt 1980
cgccctccga gagctgcatc aggtcggaga cgctgtcgaa cttttcgatc agaaacttct 2040
cgacagacgt cgcggtgagt tcaggctttt tcatagggat cagcttgggc tgtcctctcc 2100
aaatgaaatg aacttcctta tatagaggaa gggtcttgcg aaggatagtg ggattgtgcg 2160
tcatccctta cgtcagtgga gatgtcacat caatccactt gctttgaaga cgtggttgga 2220
acgtcttctt tttccacgat gctcctcgtg ggtgggggtc catctttggg accactgtcg 2280
gcagaggcat cttgaatgat agcctttcct ttatcgcaat gatggcattt gtaggagcca 2340
ccttcctttt ctactgtcct ttcgatgaag tgacagatag ctgggcaatg gaatccgagg 2400
aggtttcccg aaattaccct ttgttgaaaa gtctcaatag ccctttggtc ttctgagact 2460
gtatctttga catttttgga gtaggggtac gataacatta acgtttacaa tttcgcgcca 2520
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 2580
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 2640
ttcccagtca cgacgttgta aaacgacggc cagtgaattg taatacgact cactataggg 2700
cgaattggta ccggtagtga acagaagtcc ggcaggtcct tagcgaaaaa acggggtgtg 2760
ccagaaaact ctatgctcta ccctgcgtgg aggtgtgaat tctgcacact gcaaatgcaa 2820
tgtgtccaat gatttatata gggcaggttt tggcgggaga acagggccct agtgttccca 2880
cggtagcgta gcgaatcgtg tgggccctgt taggtgtgcg gtcgggtggc ctccacgcgg 2940
gttataatat taccccgcgt ggtggccccc gacgcgcact cggcttttcg tgagtgcgcg 3000
gaggcttttg gaccacatct tttctgatca ctttcgtgaa agatggtgat ttatcacact 3060
tttgatgtgg aaatgtgtgc catgccttag cttataagga agtgcgtggg agcccatctc 3120
gctcgaggtc gacccggggg atccactagt tctagagcgg ccgcaagctt gatatcgaat 3180
tctaataaaa taatatttta tttatctcat gtcattcgat tacagaggct cggctacgag 3240
caaagacaaa ccaaattata acaaacaaca acccttacac aatgacatcg gaaaaggaaa 3300
tacaacaccc tgagatatta catttataga aactgtacgc cgtccgcgct aggacagtca 3360
ctgcagaaac cgatgatacg gacgaaagct gggaggcctg gatcgactag ttcactgcga 3420
agcagtgaca tcttcgccgg aggcgaacga gtagttgatg aacgtctcgc cttcatacat 3480
gtagtgaaca acagcgttag agtacatgta atccgactgt tcgggagtca tatccttgag 3540
ccaatcttcg tctggattaa ctaaaatgat gcaaggtatg ccaccccgta tcacttttcg 3600
cttaccgtat tttggattga ccgtgaagtc acgctgagcc ccgacgaagc acttccagtt 3660
gggtgtgaac ttgaatggaa tgtcgtcgat gatattatac ttggcgttga cgtcatatgt 3720
tgtgaagtca actagactgt tataataatt atgtgtccct aaagaccttg cccaggaagt 3780
ctttcctgtt ctggttggcc cgcagatgta gatggactta tgcctccccg gtgactcctg 3840
gaataatcgt ccatccactc taagtcagat tgcgcttgat ccgcaggagt ggaagtacaa 3900
aggatatagg attcgaggct tacagagtat agatgttcat ttttccagct ttcaatagtc 3960
tcatggcaaa tgagtgattc ggttggaaac tcaggtgtgt aagtggcaac tgggtcagga 4020
aatagatggc gtgccgtgta ctcgaagtct ttgagacgga tagaccattc aaacggaaaa 4080
cgattgcaaa ccatgctgag gaattcctcg cgagaggaac tagattcaat gatctgtttc 4140
atatccgcat cacggtcttt acgacctgga gttgaaacag ccacgaatgt tccccactca 4200
gctgtgttta catcggagtc aacctccttc gtgatgtaat cacgaacttg gttgcagtct 4260
ttggcagctt gtatattagg atggaatatg gagaatggag atgtatccat acggaggttt 4320
aaggcattgg gattggtgat ggaagcacga agcttgttct gcacgagaac gtgcagatgt 4380
ggtgatccat cttcgtggag ctctctaaca gcagcgatgt agaggggctc atatttgttc 4440
aagagagtgc gaagtgaatc caaggcgtac tgtggctcaa gggtacattg aggatatgtt 4500
agaaagaggt acttggaata gactcggaac ctgggtgtag atgaagaggc catccgcggg 4560
gtagtgaaca gaagtccggc aggtccttag cgaaaaaacg gggtgtgcca gaaaactcta 4620
tgctctaccc tgcgtggagg tgtgaattct gcacactgca aatgcaatgt gtccaatgat 4680
ttatataggg caggttttgg cgggagaaca gggccctagt gttcccacgg tagcgtagcg 4740
aatcgtgtgg gccctgttag gtgtgcggtc gggtggcctc cacgcgggtt ataatattac 4800
cccgcgtggt ggcccccgac gcgcactcgg cttttcgtga gtgcgcggag gcttttggac 4860
cacatctttt ctgatcactt tcgtgaaaga tggtgattta tcacactttt gatgtggaaa 4920
tgtgtgccat gccttagctt ataaggaagt gcgtgggagc ccatctcgga gctccagctt 4980
ttgttccctt tagtgagggt taattccgag cttggcgtaa tcatggtcat agctgtttcc 5040
tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa ghcataaagt 5100
gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc 5160
ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 5220
ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 5280
cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 5340
cagaatcagg ggataacgca ggaaagaaca tgaaggcctt gacaggatat attggcgggt 5400
aaactaagtc gctgtatgtg tttgtttgag atctcatgtg agcaaaaggc cagcaaaagg 5460
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 5520
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 5580
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 5640
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 5700
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 5760
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 5820
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 5880
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 5940
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aagaagagtt ggtagctctt 6000
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 6060
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 6120
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 6180
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgtgtaac 6240
attggtctag tgattagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat 6300
caggattatc aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac 6360
cgaggcagtt ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa 6420
catcaataca acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac 6480
catgagtgac gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt 6540
gttcaacagg ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat 6600
tcattcgtga ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac 6660
aaacaggaat cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac 6720
ctgaatcagg atattcttct aatacctgga atgctgtttt ccctgggatc gcagtggtga 6780
gtaaccatgc atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt 6840
ccgtcagcca gtttagtctg accatctcat ctgtaacaac attggcaacg ctacctttgc 6900
catgtttcag aaacaactct ggcgcatcgg gcttcccata caatcggtag attgtcgcac 6960
ctgattgccc gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg 7020
aatttaatcg cggccttgag caagacgttt cccgttgaat atggctcata acaccccttg 7080
tattactgtt tatgtaagca gacagtttta ttgttcatga tgatatattt ttatcttgtg 7140
caatgtaaca tcagagattt tgagacacaa cgtggctttg ttgaataaat cgaacttttg 7200
ctgagttgaa ggatcagatc acgcatcttc ccgacaacgc agaccgttcc gtggcaaagc 7260
aaaagttcaa aatcaccaac tggtccacct acaacaa 7297
<210> 5
<211> 16418
<212> DNA
<213> 人工序列(5)
<400> 5
tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60
gacgttttta atgtactgaa ttaacgccga attaattcgg gggatctgga ttttagtact 120
ggattttggt tttaggaatt agaaatttta ttgatagaag tattttacaa atacaaatac 180
atactaaggg tttcttatat gctcaacaca tgagcgaaac cctataggaa ccctaattcc 240
cttatctggg aactactcac acattattat ggagaaactc gagcttgtcg atcgacagat 300
ccggtcggca tctactctat ttctttgccc tcggacgagt gctggggcgt cggtttccac 360
tatcggcgag tacttctaca cagccatcgg tccagacggc cgcgcttctg cgggcgattt 420
gtgtacgccc gacagtcccg gctccggatc ggacgattgc gtcgcatcga ccctgcgccc 480
aagctgcatc atcgaaattg ccgtcaacca agctctgata gagttggtca agaccaatgc 540
ggagcatata cgcccggagt cgtggcgatc ctgcaagctc cggatgcctc cgctcgaagt 600
agcgcgtctg ctgctccata caagccaacc acggcctcca gaagaagatg ttggcgacct 660
cgtattggga atccccgaac atcgcctcgc tccagtcaat gaccgctgtt atgcggccat 720
tgtccgtcag gacattgttg gagccgaaat ccgcgtgcac gaggtgccgg acttcggggc 780
agtcctcggc ccaaagcatc agctcatcga gagcctgcgc gacggacgca ctgacggtgt 840
cgtccatcac agtttgccag tgatacacat ggggatcagc aatcgcgcat atgaaatcac 900
gccatgtagt gtattgaccg attccttgcg gtccgaatgg gccgaacccg ctcgtctggc 960
taagatcggc cgcagcgatc gcatccatag cctccgcgac cggttgtaga acagcgggca 1020
gttcggtttc aggcaggtct tgcaacgtga caccctgtgc acggcgggag atgcaatagg 1080
tcaggctctc gctaaactcc ccaatgtcaa gcacttccgg aatcgggagc gcggccgatg 1140
caaagtgccg ataaacataa cgatctttgt agaaaccatc ggcgcagcta tttacccgca 1200
ggacatatcc acgccctcct acatcgaagc tgaaagcacg agattcttcg ccctccgaga 1260
gctgcatcag gtcggagacg ctgtcgaact tttcgatcag aaacttctcg acagacgtcg 1320
cggtgagttc aggctttttc atatctcatt gccccccggg atctgcgaaa gctcgagaga 1380
gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt 1440
ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag 1500
tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca 1560
cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa 1620
cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg 1680
tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta 1740
ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct 1800
tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag 1860
acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg 1920
gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt 1980
tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat 2040
ggaatccgag gaggtttccc gatattaccc tttgttgaaa agtctcaata gccctttggt 2100
cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt 2160
tggcaagctg ctctagccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 2220
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 2280
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 2340
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 2400
cgaattcgag ctcggtacca actataacgg tcctaaggta gcgaaggatc cgctcgctac 2460
cttaagagag gatatccctc catcctataa tgtaggctat aggaactagg gcaaggccgg 2520
ccatgcggcc gcaagctggg tgcagcgtga cccggtcgtg cccctctcta gagataatga 2580
gcattgcatg tctaagttat aaaaaattac cacatatttt ttttgtcaca cttgtttgaa 2640
gtgcagttta tctatcttta tacatatatt taaactttac tctacgaata atataatcta 2700
tagtactaca ataatatcag tgttttagag aatcatataa atgaacagtt agacatggtc 2760
taaaggacaa ttgagtattt tgacaacagg actctacagt tttatctttt tagtgtgcat 2820
gtgttctcct ttttttttgc aaatagcttc acctatataa tacttcatcc attttattag 2880
tacatccatt tagggtttag ggttaatggt ttttatagac taattttttt agtacatcta 2940
ttttattcta ttttagcctc taaattaaga aaactaaaac tctattttag tttttttatt 3000
taataattta gatataaaat agaataaaat aaagtgacta aaaattaaac aaataccctt 3060
taagaaatta aaaaaactaa ggaaacattt ttcttgtttc gagtagataa tgccagcctg 3120
ttaaacgccg tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg 3180
ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc 3240
cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag 3300
acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcacggcag ctacggggga 3360
ttcctttccc accgctcctt cgctttccct tcctcgcccg ccgtaataaa tagacacccc 3420
ctccacaccc tctttcccca acctcgtgtt gttcggagcg cacacacaca caaccagatc 3480
tcccccaaat ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc ctcccccccc 3540
ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc ggtagttcta 3600
cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt 3660
acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag tgtttctctt 3720
tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca tgattttttt 3780
tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat gccgtgcact 3840
tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat gtggtctggt 3900
tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg gatttattaa 3960
ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag atgatggatg 4020
gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg catatacaga 4080
gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 4140
ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 4200
atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 4260
gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 4320
tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 4380
attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 4440
ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 4500
cctgttgttt ggtgttactt ctgcagatgg ctcctaagaa gaagcggaag gttggtattc 4560
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgctatcggc accaacagcg 4620
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 4680
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 4740
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 4800
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 4860
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 4920
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 4980
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 5040
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 5100
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 5160
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 5220
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 5280
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 5340
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 5400
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 5460
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 5520
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 5580
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 5640
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 5700
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 5760
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 5820
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 5880
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 5940
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 6000
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 6060
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 6120
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 6180
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 6240
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 6300
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggt acctaccacg 6360
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 6420
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 6480
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 6540
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 6600
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 6660
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 6720
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 6780
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 6840
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 6900
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 6960
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 7020
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 7080
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 7140
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 7200
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 7260
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 7320
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 7380
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 7440
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 7500
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggtaccg 7560
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 7620
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 7680
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 7740
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 7800
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 7860
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 7920
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 7980
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 8040
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 8100
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 8160
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 8220
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 8280
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 8340
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 8400
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 8460
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 8520
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 8580
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 8640
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 8700
aggccggaca ggctaagaaa aagaagtagg atcctcccga tcgttcaaac atttggcaat 8760
aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt 8820
tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt atgaggtggg 8880
tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc 8940
gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgggagcacc 9000
ggtaaggcgc gccgtagtgc tcgagagacc tctgaagtgg ccgattcatt aatgcagctg 9060
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta 9120
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg 9180
aattgtgagc ggataacaat ttcacacaag aaacagctat gaccatgatt acgccaagct 9240
atttaggtga cactatagaa tactcaagct atgcatcaag ctcaatgggt ctagtctgta 9300
gatacccatc acactggcga ccgctcgaac atcagtttaa ggtttacacc tataaaagag 9360
agagccgtta tcgtctgttt gtggatgtac agagtgatat tattgacacg ccggggcgac 9420
ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt 9480
acccggtggt gcatatcggg gatgaaagct ggcgcatgat gaccaccgat atggccagtg 9540
tgcctgtctc cgttatcggg gaagaagtgg ctgatctcag ccaccgcgaa aatgacatca 9600
aaaacgccat taacctgatg ttctggggaa tataaatgtc aggcctgaat ggcgaatgga 9660
cgcgccctgt agcggcgcat taagcgcggc gggtgagcgt gggtctcgcg gtatcattgg 9720
cgcgcctctc gagctagcgg ccgcatgcat cgatctccta catcgtataa attagcctat 9780
acgaagttat tgcatctatg tcgggtgcgg agaaagaggt aatgaaatgg cagtattaga 9840
tctgataact tcgtataatg tatgctatac gaagttatga ctgcaggtcg acacccataa 9900
tagctgtttg ccaagcttgg cactggccgt cgtttttaca acgtcgtgac tgggaaaacc 9960
ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata 10020
gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatgct 10080
agagcagctt gagcttggat cagattgtcg tttcccgcct tcagtttaaa ctatcagtgt 10140
ttgacaggat atattggcgg gtaaacctaa gagaaaagag cgtttattag aataacggat 10200
atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca 10260
gggttcccct cgggatcaaa gtactttgat ccaacccctc cgctgctata gtgcagtcgg 10320
cttctgacgt tcagtgcagc cgtcttctga aaacgacatg tcgcacaagt cctaagttac 10380
gcgacaggct gccgccctgc ccttttcctg gcgttttctt gtcgcgtgtt ttagtcgcat 10440
aaagtagaat acttgcgact agaaccggag acattacgcc atgaacaaga gcgccgccgc 10500
tggcctgctg ggctatgccc gcgtcagcac cgacgaccag gacttgacca accaacgggc 10560
cgaactgcac gcggccggct gcaccaagct gttttccgag aagatcaccg gcaccaggcg 10620
cgaccgcccg gagctggcca ggatgcttga ccacctacgc cctggcgacg ttgtgacagt 10680
gaccaggcta gaccgcctgg cccgcagcac ccgcgaccta ctggacattg ccgagcgcat 10740
ccaggaggcc ggcgcgggcc tgcgtagcct ggcagagccg tgggccgaca ccaccacgcc 10800
ggccggccgc atggtgttga ccgtgttcgc cggcattgcc gagttcgagc gttccctaat 10860
catcgaccgc acccggagcg ggcgcgaggc cgccaaggcc cgaggcgtga agtttggccc 10920
ccgccctacc ctcaccccgg cacagatcgc gcacgcccgc gagctgatcg accaggaagg 10980
ccgcaccgtg aaagaggcgg ctgcactgct tggcgtgcat cgctcgaccc tgtaccgcgc 11040
acttgagcgc agcgaggaag tgacgcccac cgaggccagg cggcgcggtg ccttccgtga 11100
ggacgcattg accgaggccg acgccctggc ggccgccgag aatgaacgcc aagaggaaca 11160
agcatgaaac cgcaccagga cggccaggac gaaccgtttt tcattaccga agagatcgag 11220
gcggagatga tcgcggccgg gtacgtgttc gagccgcccg cgcacgtctc aaccgtgcgg 11280
ctgcatgaaa tcctggccgg tttgtctgat gccaagctgg cggcctggcc ggccagcttg 11340
gccgctgaag aaaccgagcg ccgccgtcta aaaaggtgat gtgtatttga gtaaaacagc 11400
ttgcgtcatg cggtcgctgc gtatatgatg cgatgagtaa ataaacaaat acgcaagggg 11460
aacgcatgaa ggttatcgct gtacttaacc agaaaggcgg gtcaggcaag acgaccatcg 11520
caacccatct agcccgcgcc ctgcaactcg ccggggccga tgttctgtta gtcgattccg 11580
atccccaggg cagtgcccgc gattgggcgg ccgtgcggga agatcaaccg ctaaccgttg 11640
tcggcatcga ccgcccgacg attgaccgcg acgtgaaggc catcggccgg cgcgacttcg 11700
tagtgatcga cggagcgccc caggcggcgg acttggctgt gtccgcgatc aaggcagccg 11760
acttcgtgct gattccggtg cagccaagcc cttacgacat atgggccacc gccgacctgg 11820
tggagctggt taagcagcgc attgaggtca cggatggaag gctacaagcg gcctttgtcg 11880
tgtcgcgggc gatcaaaggc acgcgcatcg gcggtgaggt tgccgaggcg ctggccgggt 11940
acgagctgcc cattcttgag tcccgtatca cgcagcgcgt gagctaccca ggcactgccg 12000
ccgccggcac aaccgttctt gaatcagaac ccgagggcga cgctgcccgc gaggtccagg 12060
cgctggccgc tgaaattaaa tcaaaactca tttgagttaa tgaggtaaag agaaaatgag 12120
caaaagcaca aacacgctaa gtgccggccg tccgagcgca cgcagcagca aggctgcaac 12180
gttggccagc ctggcagaca cgccagccat gaagcgggtc aactttcagt tgccggcgga 12240
ggatcacacc aagctgaaga tgtacgcggt acgccaaggc aagaccatta ccgagctgct 12300
atctgaatac atcgcgcagc taccagagta aatgagcaaa tgaataaatg agtagatgaa 12360
ttttagcggc taaaggaggc ggcatggaaa atcaagaaca accaggcacc gacgccgtgg 12420
aatgccccat gtgtggagga acgggcggtt ggccaggcgt aagcggctgg gttgtctgcc 12480
ggccctgcaa tggcactgga acccccaagc ccgaggaatc ggcgtgacgg tcgcaaacca 12540
tccggcccgg tacaaatcgg cgcggcgctg ggtgatgacc tggtggagaa gttgaaggcc 12600
gcgcaggccg cccagcggca acgcatcgag gcagaagcac gccccggtga atcgtggcaa 12660
gcggccgctg atcgaatccg caaagaatcc cggcaaccgc cggcagccgg tgcgccgtcg 12720
attaggaagc cgcccaaggg cgacgagcaa ccagattttt tcgttccgat gctctatgac 12780
gtgggcaccc gcgatagtcg cagcatcatg gacgtggccg ttttccgtct gtcgaagcgt 12840
gaccgacgag ctggcgaggt gatccgctac gagcttccag acgggcacgt agaggtttcc 12900
gcagggccgg ccggcatggc cagtgtgtgg gattacgacc tggtactgat ggcggtttcc 12960
catctaaccg aatccatgaa ccgataccgg gaagggaagg gagacaagcc cggccgcgtg 13020
ttccgtccac acgttgcgga cgtactcaag ttctgccggc gagccgatgg cggaaagcag 13080
aaagacgacc tggtagaaac ctgcattcgg ttaaacacca cgcacgttgc catgcagcgt 13140
acgaagaagg ccaagaacgg ccgcctggtg acggtatccg agggtgaagc cttgattagc 13200
cgctacaaga tcgtaaagag cgaaaccggg cggccggagt acatcgagat cgagctagct 13260
gattggatgt accgcgagat cacagaaggc aagaacccgg acgtgctgac ggttcacccc 13320
gattactttt tgatcgatcc cggcatcggc cgttttctct accgcctggc acgccgcgcc 13380
gcaggcaagg cagaagccag atggttgttc aagacgatct acgaacgcag tggcagcgcc 13440
ggagagttca agaagttctg tttcaccgtg cgcaagctga tcgggtcaaa tgacctgccg 13500
gagtacgatt tgaaggagga ggcggggcag gctggcccga tcctagtcat gcgctaccgc 13560
aacctgatcg agggcgaagc atccgccggt tcctaatgta cggagcagat gctagggcaa 13620
attgccctag caggggaaaa aggtcgaaaa ggtctgtttc ctgtggatag cacgtacatt 13680
gggaacccaa agccgtacat tgggaaccgg aacccgtaca ttgggaaccc aaagccgtac 13740
attgggaacc ggtcacacat gtaagtgact gatataaaag agaaaaaagg cgatttttcc 13800
gcctaaaact ctttaaaact tattaaaact cttaaaaccc gcctggcctg tgcataactg 13860
tctggccagc gcacagccga agagctgcaa aaagcgccta cccttcggtc gctgcgctcc 13920
ctacgccccg ccgcttcgcg tcggcctatc gcggccgctg gccgctcaaa aatggctggc 13980
ctacggccag gcaatctacc agggcgcgga caagccgcgc cgtcgccact cgaccgccgg 14040
cgcccacatc aaggcaccct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 14100
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 14160
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 14220
tagcgatagc ggagtgtata ctggcttaac tatgcggcat cagagcagat tgtactgaga 14280
gtgcaccata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 14340
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 14400
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 14460
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 14520
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 14580
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 14640
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 14700
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 14760
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 14820
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 14880
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 14940
tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 15000
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 15060
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 15120
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 15180
ttggtcatgc attctaggta ctaaaacaat tcatccagta aaatataata ttttattttc 15240
tcccaatcag gcttgatccc cagtaagtca aaaaatagct cgacatactg ttcttccccg 15300
atatcctccc tgatcgaccg gacgcagaag gcaatgtcat accacttgtc cgccctgccg 15360
cttctcccaa gatcaataaa gccacttact ttgccatctt tcacaaagat gttgctgtct 15420
cccaggtcgc cgtgggaaaa gacaagttcc tcttcgggct tttccgtctt taaaaaatca 15480
tacagctcgc gcggatcttt aaatggagtg tcttcttccc agttttcgca atccacatcg 15540
gccagatcgt tattcagtaa gtaatccaat tcggctaagc ggctgtctaa gctattcgta 15600
tagggacaat ccgatatgtc gatggagtga aagagcctga tgcactccgc atacagctcg 15660
ataatctttt cagggctttg ttcatcttca tactcttccg agcaaaggac gccatcggcc 15720
tcactcatga gcagattgct ccagccatca tgccgttcaa agtgcaggac ctttggaaca 15780
ggcagctttc cttccagcca tagcatcatg tccttttccc gttccacatc ataggtggtc 15840
cctttatacc ggctgtccgt catttttaaa tataggtttt cattttctcc caccagctta 15900
tataccttag caggagacat tccttccgta tcttttacgc agcggtattt ttcgatcagt 15960
tttttcaatt ccggtgatat tctcatttta gccatttatt atttccttcc tcttttctac 16020
agtatttaaa gataccccaa gaagctaatt ataacaagac gaactccaat tcactgttcc 16080
ttgcattcta aaaccttaaa taccagaaaa cagctttttc aaagttgttt tcaaagttgg 16140
cgtataacat agtatcgacg gagccgattt tgaaaccgcg gtgatcacag gcagcaacgc 16200
tctgtcatcg ttacaatcaa catgctaccc tccgcgagat catccgtgtt tcaaacccgg 16260
cagcttagtt gccgttcttc cgaatagcat cggtaacatg agcaaagtct gccgccttac 16320
aacggctctc ccgctgacgc cgtcccggac tgatgggctg cctgtatcga gtggtgattt 16380
tgtgccgagc tgccggtcgg ggagctgttg gctggctg 16418
<210> 6
<211> 975
<212> DNA
<213> 人工序列(6)
<400> 6
gagtctagca catgcagttt gtccagatca attgaggatg ttacgggtct tggatcttga 60
agatgtgaca ttcttaatca ctcaaaaaga tttcgaccgt attgcattgt tgtgccactt 120
gaaatacttg agtattggat attcgtcatc catatattca cttcccagat ccattggtaa 180
actacagggc ctacaaactt tgaacatgcc gagcacatac attgcagcac taccaagtga 240
gatcagtaaa ctccaatgtc tgcatactct tcgttgtata ggacagtttc attatgacaa 300
ctttagtcta aaccacccaa tgaagtgcat aactaacaca atatgcctgc ctaaagtatt 360
cacaccttta gttagtcgcg atgatcgtgc aaaacaaatt gctgaattgc acatggccac 420
caaaagttgc tggtctgaat cattcggtgt gaaggtaccc aaaggaatag gtaagttgcg 480
agacttgcag gttctagagt atgtagatat caggcggacc agtagtagag caatcaaaga 540
gctggggcag ttaagcaagt tgaggaaatt aggtgtgata acaaaaggct cgacaaagga 600
aaaatgtaag atactttatg cagccattga gaagctctct tccctccaat atctctatgt 660
gaatgctgtg ttattatcag atattgaaac acttgagtgc ctagattcta tttcatctcc 720
tcctccccta ctaaggacac tcaggttgaa tggaagtctt gaagagatgc ctaactggat 780
tgagcagctc acgcacctga tgaagttcca cttattgagt agcaaactaa aggaaggtaa 840
aaccatgctg atacttgggg cactgcccaa cctcatgctc ctttctcttt atcataattc 900
ttatcttggg gagaagctag tattcaatac gggagcattc ccaaatctta gaacactttg 960
tatttacgaa ttgga 975
<210> 7
<211> 688
<212> DNA
<213> 人工序列(7)
<400> 7
cgatgccata acattgctac tgagaaaaac aaataaaaat catgaagaca tggaatcaaa 60
taaaaatatg caaaagatgg ttgaacgaat tgtaaataaa tgtggtcgtc taccattagc 120
aatacttaca ataggagctg tgcttgcaac taaacaggtg tcagaatggg agaaattcta 180
tgaacacctt ccttcagaac tagaaataaa cccaagcctg gaagctttga ggagaatggt 240
gaccctaggt tacaaccacc taccatccca tctgaaacca tgctttttgt atctaagtat 300
ctttcctgag gattttgaaa tcaaaaggaa tcgtctagta ggtagatgga tagcagaagg 360
gtttgttaga ccaaaggttg ggatgacgac taaggatgtc ggagaaagtt actttaatga 420
gctaatcaac cgaagtatga ttcaacgatc aagagtgggc atagcaggaa aaattaagac 480
ttgtcgaatt catgatatca tctgtgatat cacagtttca atctcgagac aggaaaattt 540
tgtattatta ccaatgggag atggctctga tttagttcag gaaaacactc gccacatagc 600
attccatggg agtatgtcct gcaaaacagg attggattgg agcattattc gatcattagc 660
tatttttggt gacagaccca agagtcta 688
<210> 8
<211> 284
<212> DNA
<213> 人工序列(8)
<400> 8
ggagagagct cgcagtcgca ggtgatcacg ttgacgacga acgacaggtt agtcactccc 60
tacatggcag cttaatgaac ttgtttctaa ttatgttttt gttcagtatt agccatcagc 120
tggtgatgtc gatgatttca actcatcctt tcatctctct tgttttctta acctaacagc 180
gaagagatag gcacagctca aaatcgtcga cctgcaggca gcagctttat cgtcgacctg 240
caggcatgca agcttggcgt aatcatggtc atagctgttt cctg 284
<210> 9
<211> 1352
<212> DNA
<213> 人工序列(8)
<400> 9
acagacccaa gagtctagca catgcagttt gtctagatca attgaggatg ttacgggtct 60
tggatcttga agatgtgaca ttcttaatca ctcaaaaaga tttcgaccgt attgcattgt 120
tgtgccactt gaaatacttg agtattggat attcgtcatc catatattca cttcccagat 180
ccattggtaa actacagggc ctacaaactt tgaacatgct gagaacatac attgcagcac 240
taccaagtga gatcagtaaa ctccaatgtc tgcatactct tcgttgtagt agaaagtttg 300
tttatgacaa ctttagtcta aaccacccaa tgaagtgcat aactaacaca atatgcctgc 360
ctaaagtatt cacaccttta gttagtcgcg atgatcgtgc aaaacaaatt gctgaattgc 420
acatggccac caaaagttgc tggtctgaat cattcggtgt gaaggtaccc aaaggaatag 480
gtaagttgcg agacttgcag gttctagagt atgtagatat caggcggacc agtagtagag 540
caatcaaaga gctggggcac ttaagcaagt tgaggaaatt aggtgtgata acaaaaggct 600
cgacaaagga aaaatgtaag atactttatg cagccattga gaagctctct tccctccaat 660
ctctctatgt gaatgctgcg ttattatcag atattgaaac acttgagtgc ctagattcta 720
tttcatctcc tcctccccta ctgaggacac tcgggttgaa tggaagtctt gaagagatgc 780
ctaactggat tgagcagctc actcacctga agaagatcta cttattgagg agcaaactaa 840
aggaaggtaa aaccatgctg atacttgggg cattgcccaa cctcatggtc ctttatcttt 900
attggaatgc ttaccttggg gagaagctag tattcaaaac gggagcattc ccaaatctta 960
gaacacttcg tatttacgaa ttggatcagc taagagagat gagatttgag gatggcagct 1020
cacccctgtt ggaaaagata gaaatctctt gctgcaggtt ggaatcaggg attattggta 1080
tcattcacct tccaaggctc aaggagattt cacttgaata caaaagtaaa gtggctaggc 1140
ttggtcagct ggagggagaa gtgaacacac acccaaatcg ccccgtgctg cgaatggaca 1200
gtgaccgaag ggatcacgac ctgggggctg aagccgaagg atcttctata gaagtgcaaa 1260
cagcagatcc tgttcctgat gccgaaggat cagtcactgt agcagtggaa gcaacggatc 1320
cccttcccga gcaggaggga gagagctcgc ag 1352
<210> 10
<211> 1352
<212> DNA
<213> 人工序列(10)
<400> 10
acagacccaa gagtctagca catgcagttt gtccagatca attgaggatg ttacgggtct 60
tggatcttga agatgtgaca ttcttaatca ctcaaaaaga tttcgaccgt attgcattgt 120
tgtgccactt gaaatacttg agtattggat attcgtcatc catatattca cttcccagat 180
ccattggtaa actacagggc ctacaaactt tgaacatgcc gagcacatac attgcagcac 240
taccaagtga gatcagtaaa ctccaatgtc tgcatactct tcgttgtata ggacagtttc 300
attatgacaa ctttagtcta aaccacccaa tgaagtgcat aactaacaca atatgcctgc 360
ctaaagtatt cacaccttta gttagtcgcg atgatcgtgc aaaacaaatt gctgaattgc 420
acatggccac caaaagttgc tggtctgaat cattcggtgt gaaggtaccc aaaggaatag 480
gtaagttgcg agacttgcag gttctagagt atgtagatat caagcggacc agtagtagag 540
caatcaaaga gctggggcag ttaagcaagt tgaggaaatt aggtgtgata acaaaaggct 600
cgacaaagga aaaatgtaag atactttatg cagccattga gaagctctct tccctccaat 660
atctctatgt gaatgctgcg ttattatcag atattgaaac acttgagtgc ctagattcta 720
tttcatctcc tcctccccta ctaagtacac tcaggttgaa tggaagtctt gaagagatgc 780
ctaactggat tgagcagctc actcacctga agaagttcta cttacggagg agcaaactaa 840
aggaaggtaa aaccatgctg atacttgggg cactgcccaa cctcatgttc ctttctcttt 900
atcataattc ttatcttggg gagaagctag tattcaaaac gggagcattc ccaaatctta 960
gaacactttg tatttacgaa ttggatcagc taagagagat cagatttgag gacggcagct 1020
cacccctgtt ggaaaagata gaaataggca agtgcaggtt ggaatctggg attattggta 1080
tcattcacct tccaaagctc aaggagattc caattacata cggaagtaaa gtggctgggc 1140
ttggtcagct ggagggagaa gtgaacgcac acccaaatcg ccccgtgctg ctaatggaca 1200
gtgaccgaag gtatcacgac ctgggggctg aagccgaagg atcttctata gaagtgcaaa 1260
cagcagatcc tgttcctgat gccgaaggat cagtcactgt agcagtggaa gcaacggatc 1320
cccttcccga gcaggaggga gagagctcgc ag 1352
<210> 11
<211> 1352
<212> DNA
<213> 人工序列(11)
<400> 11
acagacccaa gagtctagca catgcagttt gtccagatca attgaggatg ttacgggtct 60
tggatcttga agatgtgaca ttcttaatca ctcaaaaaga tttcgaccgt attgcattgt 120
tgtgccactt gaaatacttg agtattggat attcgtcatc catatattca cttcccagat 180
ccattggtaa actacagggc ctacaaactt tgaacatgcc gagcacatac attgcagcac 240
taccaagtga gatcagtaaa ctccaatgtc tgcatactct tcgttgtata ggacagtttc 300
attatgacaa ctttagtcta aaccacccaa tgaagtgcat aactaacaca atatgcctgc 360
ctaaagtatt cacaccttta gttagtcgcg atgatcgtgc aaaacaaatt gctgaattgc 420
acatggccac caaaagttgc tggtctgaat cattcggtgt gaaggtaccc aaaggaatag 480
gtaagttgcg agacttgcag gttctagagt atgtagatat caagcggacc agtagtagag 540
caatcaaaga gctggggcag ttaagcaagt tgaggaaatt aggtgtgata acaaaaggct 600
cgacaaagga aaaatgtaag atactttatg cagccattga gaagctctct tccctccaat 660
atctctatgt gaatgctgcg ttattatcag atattgaaac acttgagtgc ctagattcta 720
tttcatctcc tcctccccta ctaagtacac tcaggttgaa tggaagtctt gaagagatgc 780
ctaactggat tgagcagctc actcacctga agaagttcta cttacggagg agcaaactaa 840
aggaaggtaa aaccatgctg atacttgggg cactgcccaa cctcatgttc ctttctcttt 900
atcataattc ttatcttggg gagaagctag tattcaaaac gggagcattc ccaaatctta 960
gaacactttg tatttacgaa ttggatcagc taagagagat cagatttgag gacggcagct 1020
cacccctgtt ggaaaagata gaaataggca agtgcaggtt ggaatctggg attattggta 1080
tcattcacct tccaaagctc aaggagattc caattacata cggaagtaaa gtggctgggc 1140
ttggtcagct ggagggagaa gtgaacgcac acccaaatcg ccccgtgctg ctaatggaca 1200
gtgaccgaag gtatcacgac ctgggggctg aagccgaagg atcttctata gaagtgcaaa 1260
cagcagatcc tgttcctgat gccgaaggat cagtcactgt agcagtggaa gcaacggatc 1320
cccttcccga gcaggaggga gagagctcgc ag 1352
<210> 12
<211> 1352
<212> DNA
<213> 人工序列(11)
<400> 12
atagacccaa gagtctagca catgcagttt gtccagatca attgaggatg ttacgggtct 60
tggatcttga agatgtgaca ttcttaatca ctcaaaaaga tttcgaccgt attgcattgt 120
tgtgccactt gaaatacttg agtattggat attcgtcatc catatattca cttcccagat 180
ccattggtaa actacagggc ctacaaactt tgaacatgcc gagcacatac attgcagcac 240
taccaagtga gatcagtaaa ctccaatgtc tgcatactct tcgttgtata ggacagtttc 300
attatgacaa ctttagtcta aaccacccaa tgaagtgcat aactaacaca atatgcctgc 360
ctaaagtatt cacaccttta gttagtcgcg atgatcgtgc aaaacaaatt gctgaattgc 420
acatggccac caaaagttgc tggtctgaat cattcggtgt gaaggtaccc aaaggaatag 480
gtaagttgcg agacttgcag gttctagagt atgtagatat caagcggacc agtagtagag 540
caatcaaaga gctggggcag ttaagcaagt tgaggaaatt aggtgtgata acaaaaggct 600
cgacaaagga aaaatgtaag atactttatg cagccattga gaagctctct tccctccaat 660
atctctatgt gaatgctggg ttattatcag atattgaaac acttgagtgc ctagattcta 720
tttcctctcc tcctccccta ctgaggacac tcgtgttgta tggaattctt gaggagatgc 780
ctaactggat tgagcagctc atgcacctga agaagatcaa cttattgagc agcaaactaa 840
aggaaggtaa aaccatgctg atacttgggg cattgcccaa cctcatggtc cttgatcttt 900
atcagaaagc ttaccttggg gagaagctag tattcaaaac aggagcattc ccaaatctta 960
gaacacttgg tatttatgaa ttggatcagc taagagagat tagacttgag gacggcagct 1020
cgccccagtt ggaaaagata gaaatcagat tctgcaggtt ggaaccaggg attattggta 1080
ttatccacct tccaaggctc aaggagattt cacgtggata cgaaagtaaa gtggctgggc 1140
ttgctcagct ggagggagaa gtgaacgcac acccaaatcg ccccgtgctg ctaatgtaca 1200
gtgaccgaag gtatcacgac ctgggggctg aagccgaagg atcttctata gaagtgcaaa 1260
cagcagatcc tgttcctgat gccgaaggat cagtcactgt agcagtggaa gcaacggatc 1320
cccttcccga gcaggaggga gagagctcgc ag 1352
Claims (10)
1.一种用于植物基因组编辑载体构建的质粒PMF115,其特征在于,所述质粒包含有双生病毒复制相关的小间区SIR、大间区LIR和复制相关蛋白Rep/RepA三个DNA片段,所述双生病毒小间区SIR为Seq No.1,双生病毒大间区LIR为Seq No.2,复制相关蛋白Rep/RepA片段为Seq No.3。
2.基于权利要求1所述质粒PMF115的构建方法,其特征在于,包括以下步骤:
Setp 1,根据双生病毒基因组序列设计并合成小间区SIR、大间区LIR和复制相关蛋白Rep/RepA三个DNA片段;
Setp 2,将小间区SIR的DNA片段克隆到pGreenII0179得到质粒0179-SIR;
Setp 3,将大间区LIR的DNA片段克隆到质粒0179-SIR得到质粒0179-LIR-SIR;
Setp 4,将大间区LIR的DNA片段克隆到质粒0179-LIR-SIR得到质粒0179-LIR-SIR-LIR,即PMF096;
Setp 5,在质粒PMF096的大间区LIR和小间区SIR中间克隆一个多克隆位点区,得到质粒PMF114,所述多克隆位点区包括XhoI、SalI、SmaI/XmaI、BamHI、SpeI、XbaI、NotI、HindIII、EcoRV;
Setp 6,将Rep/RepA的DNA片段克隆到质粒PMF114得到质粒PMF115,序列为Seq No.4。
3.一种与权利要求1或2任一项所述质粒PMF115配合使用构建植物基因组编辑载体的质粒PMF125,其特征在于,所述质粒PMF125是将质粒pYLCRISPR/Cas9pUbi-H中编码Ca s9蛋白的氨基酸突变,使得Cas9由核酸酶变为切口酶。
4.基于权利要求3所述质粒PMF125的构建方法,其特征在于,包括以下步骤:
Setp 1,用BamHI酶切pYLCRISPR/Cas9pUbi-H质粒,得到10kb和6.2kb两个片段,6.2kb片段与质粒pUC19经BamHI酶切并去磷酸化的片段连接,得质粒T-p-cas9p;10kb片段经去磷酸化处理备用;
Setp 2,合成如下PCR引物:
F-p-cas9p:5’-CTGAGCTAGCGTTCGTACACGGAT-3’;
R-p-cas9p:5’-ATGCGCTAGCTCCACCGTCAATGTA-3’;
F-cas9pD10A:5’-TCCATCGGCCTCGCTATCGGCACCAAC-3’;
R-cas9pD10A:5’-GTTGGTGCCGATAGCGAGGCCGATGGA-3’;
以pYLCRISPR/Cas9pUbi-H质粒为模板,分别用引物F-p-cas9p和R-cas9pD10A、F-cas9pD10A和R-p-cas9p进行第一次PCR扩增;以两个第一次PCR扩增片段混合DNA为模板,用引物F-p-cas9p和R-p-cas9p进行第二次PCR扩增,第二次PCR扩增片段经NheI酶切与质粒T-p-cas9p经NheI酶切去磷酸化处理的大片段连接,得到质粒T-p-cas9pM;
Setp 3,质粒T-p-cas9pM经BamHI酶切,回收的片段与上述Setp 1的10kb大片段连接,从而获得载体质粒PMF125,序列为Seq No.5。
5.一种用于植物基因组编辑的载体,其特征在于,所述编辑载体包括依次连接的两个双生病毒大间区LIR、sgRNA表达盒和Cas9D10A基因,且所述两个双生病毒大间区LIR之间含有双生病毒复制相关蛋白Rep/RepA片段、双生病毒小间区SIR和用于重组的DNA片段HR;
所述sgRNA表达盒是依据目标基因组位点DNA序列设计构建而成,包括启动子、依据靶序列设计的sgRNA的DNA片段及终止子;
所述用于重组的DNA的片段HR是指用于与目标基因组位点DNA在细胞内重组,从而达到改变原编辑位点DNA遗传信息的DNA片段。
6.基于权利要求5所述的一种用于植物基因组编辑的载体的构建方法,其特征在于,包括以下步骤:
Setp 1,构建质粒PMF115;
Setp 2,构建质粒PMF125;
Setp 3,依据目标基因组位点DNA序列设计sgRNA表达盒,将所述sgRNA表达盒连入载体PMF125制备含sgRNA表达盒的质粒;
Setp 4,将用于重组的DNA片段HR连接到载体质粒PMF115;
Setp 5,将所述Setp 4构建的质粒中两个大间区LIR片段、以及两个大间区LIR之间的DNA片段克隆到Setp 3构建的质粒中,获得最终基因组编辑载体。
7.根据权利要求6所述的一种用于植物基因组编辑载体的构建方法,其特征在于,所述Setp 4具体操作方法为:用于重组的DNA片段HR通过酶切连接或同源重组连接的方法连入质粒PMF115多克隆位点处;或者用于重组的DNA片段HR克隆到质粒PMF096或质粒PMF114得到中间质粒,然后再将Rep/RepA片段克隆进入上述中间质粒,即得到含HR片段的PMF115质粒。
8.根据权利要求6所述的一种用于植物基因组编辑载体的构建方法,其特征在于,所述Setp 5具体操作步骤包括:
以如下引物:
F-LSL:5’-TTGGAGTGGATGGATACTAGTGGTAGTGAACAGAAG-3’;
R-LSL:5’-GCGCCAATGATACCGACGCGTCGAGATGGGCTCCCA-3’;
用Setp 4构建的质粒DNA为模板进行PCR扩增,扩增得到的DNA片段包括两个病毒大间区LIR、以及位于两个病毒大间区LIR之间的复制相关蛋白Rep/RepA、双生病毒小间区SIR和用于重组的DNA片段HR;扩增片段与来自Setp 3含sgRNA表达盒的PMF125质粒的MluI和SpeI双酶切片段经重组酶连接,即获得最终的编辑载体;
或者,以如下引物:
F-LIR-M:5’-TAACGCGTGGTAGTGAACAGAAGTCCG-3’;
R-LIR-N:5’-TAGCTAGCCGAGATGGGCTCCCACGC-3’;
用Setp 4构建的质粒DNA为模板进行PCR扩增,扩增得到DNA片段包括病毒大间区LIR、以及位于两个病毒大间区LIR之间的复制相关蛋白Rep/RepA、双生病毒小间区SIR和用于重组的DNA片段HR;扩增片段经MluI和NheI酶切后,与来自Step3含sgRNA表达盒质粒PMF125的MluI和SpeI双酶切片段连接,即获得最终的编辑载体。
9.基于权利要求1~8任一项所述的一种用于构建植物基因组编辑载体的质粒PMF115在植物基因组编辑中的应用。
10.基于权利要求3~8任一项所述的一种用于构建植物基因组编辑载体的质粒PMF125在植物基因组编辑中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910178891.2A CN109880846B (zh) | 2019-03-11 | 2019-03-11 | 一种用于植物基因组编辑载体、及其构建方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910178891.2A CN109880846B (zh) | 2019-03-11 | 2019-03-11 | 一种用于植物基因组编辑载体、及其构建方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109880846A true CN109880846A (zh) | 2019-06-14 |
CN109880846B CN109880846B (zh) | 2020-08-11 |
Family
ID=66931748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910178891.2A Active CN109880846B (zh) | 2019-03-11 | 2019-03-11 | 一种用于植物基因组编辑载体、及其构建方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109880846B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111088277A (zh) * | 2019-12-31 | 2020-05-01 | 中国农业科学院植物保护研究所 | 基于CRISPR/Cas9 SunTag系统抑制双生病毒侵染的载体及其构建和应用 |
CN111621515A (zh) * | 2020-05-14 | 2020-09-04 | 中国计量大学 | 一种增强CRISPR/Cas9系统基因编辑效率的方法 |
CN113564197A (zh) * | 2021-07-08 | 2021-10-29 | 上海师范大学 | 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用 |
WO2022223010A1 (zh) | 2021-04-21 | 2022-10-27 | 浙江大学 | 一种负链rna病毒载体及无需转化的植物基因组编辑方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106119269A (zh) * | 2016-06-23 | 2016-11-16 | 百奥迈科生物技术有限公司 | 一种在大肠杆菌中制备线性单链dna的方法 |
WO2018081081A1 (en) * | 2016-10-24 | 2018-05-03 | Javier Gil Humanes | Multiplex gene targeting in plants |
CN108486145A (zh) * | 2018-02-12 | 2018-09-04 | 中国科学院遗传与发育生物学研究所 | 基于CRISPR/Cas9的植物高效同源重组方法 |
-
2019
- 2019-03-11 CN CN201910178891.2A patent/CN109880846B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106119269A (zh) * | 2016-06-23 | 2016-11-16 | 百奥迈科生物技术有限公司 | 一种在大肠杆菌中制备线性单链dna的方法 |
WO2018081081A1 (en) * | 2016-10-24 | 2018-05-03 | Javier Gil Humanes | Multiplex gene targeting in plants |
CN108486145A (zh) * | 2018-02-12 | 2018-09-04 | 中国科学院遗传与发育生物学研究所 | 基于CRISPR/Cas9的植物高效同源重组方法 |
Non-Patent Citations (3)
Title |
---|
HAHN F.等: ""Homology-Directed Repair of a Defective Glabrous Gene in Arabidopsis With Cas9-Based Gene Targeting"", 《FRONT. PLANT SCI.》 * |
MA XINGLIANG等: ""A Robust CRISPR/Cas9 System for Convenient, High-Efficiency Multiplex Genome Editing in Monocot and Dicot Plants"", 《MOLECULAR PLANT》 * |
WANG M.等: ""Gene Targeting by Homology-Directed Repair in Rice Using a Geminivirus-Based CRISPR/Cas9 System"", 《MOLECULAR PLANT》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111088277A (zh) * | 2019-12-31 | 2020-05-01 | 中国农业科学院植物保护研究所 | 基于CRISPR/Cas9 SunTag系统抑制双生病毒侵染的载体及其构建和应用 |
CN111088277B (zh) * | 2019-12-31 | 2022-01-18 | 中国农业科学院植物保护研究所 | 基于CRISPR/Cas9 SunTag系统抑制双生病毒侵染的载体及其构建和应用 |
CN111621515A (zh) * | 2020-05-14 | 2020-09-04 | 中国计量大学 | 一种增强CRISPR/Cas9系统基因编辑效率的方法 |
WO2022223010A1 (zh) | 2021-04-21 | 2022-10-27 | 浙江大学 | 一种负链rna病毒载体及无需转化的植物基因组编辑方法 |
CN113564197A (zh) * | 2021-07-08 | 2021-10-29 | 上海师范大学 | 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用 |
CN113564197B (zh) * | 2021-07-08 | 2024-03-15 | 上海师范大学 | 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用 |
Also Published As
Publication number | Publication date |
---|---|
CN109880846B (zh) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10947549B2 (en) | Protein expression systems | |
CN109880846B (zh) | 一种用于植物基因组编辑载体、及其构建方法和应用 | |
WO2018103686A1 (zh) | 叶绿体基因组编辑方法 | |
CN101001951B (zh) | 分离转录终止序列的方法 | |
AU2018229457B2 (en) | Methods for production of synthetic promoters with defined specificity | |
CN114292324B (zh) | 一种共表达分子伴侣蛋白生产α-乳白蛋白的菌株及其应用 | |
CN115997023A (zh) | 与大豆中疾病抗性相关联的新颖的抗性基因 | |
CA3047829A1 (en) | Conferring resistance to geminiviruses in plants in alternative manner to gene drive, using crispr/cas systems | |
KR20190051045A (ko) | 식물에서의 표적화된 게놈 최적화 | |
CN109112136A (zh) | Ggc2基因的分离克隆及其在水稻改良中的应用 | |
KR20180137558A (ko) | 유전자내 식물 형질전환을 위한 구조체 및 벡터 | |
CN110423775B (zh) | 一种水稻基因组中稻瘟病抗性位点dna的编辑修饰方法、编辑载体 | |
KR102090078B1 (ko) | 배추의 내건성 관련 유전자 교정용 식물형질전환 벡터 및 이의 적용 방법 | |
CN108251450B (zh) | 原位过量表达载体pGV64及应用 | |
CN111454970B (zh) | 拟南芥莲座叶的相关基因在调节拟南芥莲座叶器官大小的应用 | |
KR102728467B1 (ko) | 만추성 형질을 가지는 배추 육성을 위한 leafy 유전자 교정용 벡터 및 이를 이용하는 형질전환방법 | |
KR20100102075A (ko) | 김치유산균 복제인자 및 이를 포함하는 벡터 | |
CN107267550B (zh) | 一种抗冻百合及利用抗冻蛋白基因转化百合的方法 | |
CN114807236A (zh) | 一种病毒穿梭质粒及其用途 | |
CN110499319A (zh) | 一种通过基因编辑技术提高番茄中番茄红素含量的方法 | |
KR100986292B1 (ko) | 김치유산균 복제인자 및 이를 포함하는 벡터 | |
KR101568342B1 (ko) | 원형질연락사를 통해 이동 가능한 복합체 및 그를 이용하여 식물 세포 간 목적 물질을 이동시키는 방법 | |
Getu | Tobacco (Nicotiana benthamiana Domin) Plant Transformation With and Without Selectable Marker Gene for Multiple Virus Resistance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |