草甘膦抗性转基因植物
技术领域
本发明涉及能耐受用草甘膦作为活性成分的除草剂处理的转基因甜菜植株。
背景技术
甜菜田间的杂草是农场主的主要问题。它们与农作物竞争因此而降低产量。现在没有单一的除草剂能有效控制所有杂草而不损伤甜菜作物本身(Miller等,甜菜研究杂志,26:3-4,1989)。实际上,农场主使用除草剂的混合物,它们也降低农作物的生长。同时,已发展对所述除草剂抗性的野草种类的数目持续增加(Schweizer等,甜菜研究杂志,28:1-23,1991),由此加重了甜菜田间杂草控制问题。
Roundup是广谱的、环境上优选的抑制杂草和农作物种类的除草剂。本发明的内容中,1升除草剂Roundup溶液含有260g其活性成分,即被叶吸收的草甘膦(常用名为N-膦酰基甲基-甘氨酸)。到目前为止,在20年使用期间没有发展出草甘膦抗性杂草(Holt等,植物生理学年鉴,1993);另外在甜菜中没有发现对草甘膦的耐受性。而且Roundup的预先使用在甜菜田间控制杂草方面比甜菜农业中常用的含有苯敌草、苯嗪草酮、甜菜呋的除草剂混合物更有效(Madsen等,杂草研究,35:105-111,1995)。
草甘膦通过不可逆地与5-烯醇丙酮酸莽草酸盐-3-磷酸合成酶(epsps)结合抑制芳香族氨基酸的生物合成。在叶绿体中,比酶催化莽草酸盐-3-磷酸和烯醇磷酸丙酮酸形成5-烯醇丙酮酸-3-磷酸和磷酸。在施用除草剂后约一周。可看到肉眼可见的效应,包括萎蔫、黄化后完全变褐、植物组织的萎凋和根的腐烂。
为赋予农作物种类草甘膦抗性,研究集中于向植物导入能增加草甘膦性epsps基因。除了植物,细胞和真菌也天然地表达epsps酶活性。发现来自农杆菌属种类的cp4/epsps赋予对草甘膦的抗性(Barry等,“氨基酸合成的抑制剂:赋予农作物植株对草甘膦抗性的策略:,于:植物中氨基酸的生物合成和分子调控,Singh等(编辑),美国植物生理学学会,第139-145页,1992)。将cp4/epsps基因导入大豆和油籽油菜在田间条件产生对叶面施用除草剂的耐受性(Delannay等,农作物科学,35:1461-1467,1995;Padgette等,农作物科学,35:1451-1461,1995)。
从农杆菌属种类LBAA分离的草甘膦氧化还原酶(gox)(Barry等,同上)将草甘膦降解成氨甲基膦酸对植物无毒的化合物。cp4/epsps和草甘膦氧化酶(gox)基因的结合已成功地用于得到对草甘膦有抗性的转基因小麦(Zhou等,植物细胞报告,15:159-163,1995)。
发明内容
本发明的目的是提供对足以实现最佳除草剂活性的高剂量的草甘膦有耐受性的甜菜植株。这样的植株可以进一步通过与优良甜菜株系回交来改良以优化农业特性如产量、病原体抗性等。
甜菜可以用根瘤农杆菌介导转化来转化(Fry等,植物分子生物学第三次国际会议,Tuscon,Arizona,USA;D′Halluin等,生物/技术,10:309-314,1992;Konwar。植物生化&生物技术杂志,3:37-41,1994)。农杆菌介导的转化常常导致多于一个拷贝的T-DNA整合入植物基因组。优选地将要整合的基因导入T-DNA,使它位于T-DNA右边则不是左边界附近,它几乎总是会转移到植物中。
根据本发明所述的植株对每公顷大约3×6升除草剂Roundup(每公顷约18升)的处理有耐受性。获得良好杂草控制的总标准剂量根据杂草压力在每公顷4-6升之间变动。在这些浓度时,除草剂处理不产生对植物活力和叶褪绿有任何可测到的影响。根据本发明所述的植株表现的耐受性由转基因表达的cp4/epsps酶活性赋予。本发明优选的实施方案已于1997年10月24日保存于国立工业和海洋微生物保藏有限公司(23 st Macher Drive,Aberdeen AB21RY,Scotland UK),保藏号为NCIMB 40905。
因此本发明涉及表达cp4/epsps酶活性的甜菜植株及其后代。具体地,本发明涉及对每公顷约4至约8升Roundup处理有耐受性的甜菜植株及其后代。
根据本发明所述的植株可以通过使用在T-DNA左和右边界序列间含有如SEQ ID No:5所述编码尤其是cp4/epsps的DNA片段的转化载体进行常规农杆菌介导的转化得到。
在本发明的范围内令人惊讶地发现,在转基因的基因组内缺失T-DNA左和右边界序列并导致转化载体DNA相当大部分的缺失而保留了编码cp4/epsps的DNA的转化结果(RRMax)提供了优良的草甘膦耐受性。特别是发现以SEQ ID No:1为特征的DNA片段整合入基因组高度重复的区域同时取代了该基因组重复序列的部分。与所用转化载体中与T-DNA右边界序列相连的转基因序列部分直接相邻的基因组DNA具有SEQ ID No:2中给出的序列。与整合的转基因DNA的另一末端直接相邻的基因组DNA具有SEQ ID No:3中给出的序列。新形成的基因组DNA排列的完整DNA序列在SEQ ID No:4中给出。
因此,本发明涉及甜菜植株及其后代,其中以SEQ ID No:1的核苷酸序列为特征的DNA形成植物基因组的部分,并且介所述的核苷酸序列取代了植物基因组内高度重复DNA序列。
此处优选的是其中与所述核苷酸序列直接连接的那些基因组部分分别以SEQ ID No:2和SEQ ID No:3的核苷酸序列为特征的甜菜植株及其后代。
进一步优选的是其中以SEQ ID No:4的核苷酸序列为特征的DNA形成植物基因组的部分的甜菜植株及其后代。
上述经操作已导入除草剂抗性的转基因种子和植株通过性繁殖或营养生长传代并因此可以在后代植株中保持和繁殖。通常所述的维持和繁殖使用已知的农业方法,这些方法发展来适应特别目的如耕种、插种或收获。正在生长的农作物易于受由昆虫或感染引起的侵袭和损伤,因此采取措施以控制植物病毒、昆虫、线虫和其它对提高产量不利的条件。这些措施包括机械措施如耕地或除去受侵染的植物和施用农业化学品如杀真菌剂、杀精剂、杀线虫剂、生长调节剂、成熟剂和杀昆虫剂。
根据本发明所述的转基因植物和种子的除草剂耐受性可进一步在植物育种中得到应用,以开发具有改良特性(如虫害、除草剂或逆境耐受性,改良的营养价值,提高的产量,引起更小的由于倒伏或断裂的损失的改良结构)的植物。各种育种步骤的特征在于成熟的人类干预如选择要杂交的株系、引导亲本株系的传粉或选择适当的后代植株。根据所需的特性采取不同的育种措施。相关技术在本领域内众所周知并且包括但不限于杂交、近交、回交育种、多线育种、品种掺合、种间杂交、非整倍体技术等。因此,根据本发明所述的转基因种子和植株可用于培育改良的植物株系,例如用于提高传统方法如除草剂或杀虫剂处理的效力或由于其修饰的遗传特性而允许用所述方法施用。选择性地,可以得到具有改良的逆境耐受性的新农作物,由于它们的优化遗传装备,产生比不能耐受相对不利发育条件的产品更高质量的收获产品。
在种子生产中,发芽质量和种子的均一性是必需的产品特征,而农场主收获和出售的种子的发芽质量和种子均一性并不重要。因为使农作物与其它农作物和杂草种子分开、控制种生疾病和生产具良好发芽率的种子是困难的,所以在培养、控制和销售纯种子领域有经验的种子生产者已开发了相当广泛和成熟的种子生产技术。因此农场主常用的方法是购买经鉴定符合特定质量标准的种子而不是使用从他自己的农作物收获的种子。用作种子的繁殖材料习惯用含有杀虫剂、杀昆虫剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂或其混合物的保护剂涂层处理。常规使用的保护剂涂层包含诸如克菌丹、萎锈灵、福美双(TMTD)、methalaxyl(Apron)和虫螨磷(Actellic)的化合物。如果需要,将这些化合物与其它载体、表面活性剂或配制领域常规使用的促进施用佐剂一起配制以提供针对由细菌、真菌或动物虫害引起的损伤的保护。保护剂涂层可以通过用液体制品浸渍繁殖材料或通过用混合的干或湿配方包裹来施用。也可能是其它施用方法如直接处理芽或果实。
本发明的另一方面提供新的农业方法如上面列举的方法,其特征在于使用根据本发明所述的转基因植物、转基因植物材料或转基因种子。
在另一实施方案中,本发明涉及来自转基因植物的转基因植物细胞、组织、器官、种子或植物部分。本发明也包括转基因植物后代及后代的转基因植物细胞、组织、器官、种子和植物部分。
本发明进一步涉及含有能表达cp4/epsps的具Roundup耐受性的甜菜种子的商品包及其使用说明。本发明内优选的是包含含有稳定整合入其基因的具有SEQ ID No:1所示核苷酸序列的DNA片段的转基因植物种子的商品包。
所用的转化方法学总结如下:
(a)用含有如SEQ ID No:5中所示的编码cp4/epsps的DNA片段的载体,使用根瘤农杆菌转化体外培养的甜菜子叶。
(b)在草甘膦存在时再生芽;
(c)将芽转移到温室的土壤中;
(d)用处理苗;
(e)对植株活力和叶褪绿进行目测评级;
(g)选择未受草甘膦处理影响的具有正常活力和叶子的完全正常的植株;并且
(h)使用传统育种技术繁殖所选植株。
具体地,在选择8-12周后,在约0.1至约10mM,优选地1mM草甘膦存在时再生芽。每个转基因芽进一步繁殖成10个拷贝,在将它转移至温室中生根前,可以用聚合酶链式反应(PCR)分析cp4/epsps转基因的存在。温室中光照条件是16小时光照和8小时黑暗,温度为22±2℃。在3-4叶期,用每公顷0.1-20升,优选地1升剂量的Roundup水溶液喷洒苗。草甘膦施用后2周基于0(死亡植株)到9(完受未受影响的植制)的等级对单个植物进行植株活力和植物褪绿的目测损伤评级。0-3的评级是易感植物的特征。3-7的评级表明耐受性的低至中间水平,8或9的评级表明耐受性的良好水平。具体地,评级有以下意义:
9:与未处理的对照相同的未受影响的植株
8:只有叶尖上很小的坏死,少于5%的叶面积受到影响并黄化
7:叶尖上很小的坏死开始卷曲,少于5%的叶面积受到影响并黄化
6,5,4:坏死和叶卷曲增强;叶变得比正常的更小
3,2:没有或非常有限的叶生长;所有的叶子卷曲并受坏死影响
1:无植物生长,最多5%的植株保持绿色
0:死亡植株
为收集田间实验数据,通过传统技术进一步繁殖或培育有正常活力并且不受草甘膦处理影响的(评分9)植株。
优选地,使用含有具有SEQ ID No:5给出序列的DNA片段的载体进行转化,其中DNA片段含有cp4/epsps和gox基因(都已被报道赋予某些植物种类对草甘膦的耐受性)和报告基因UidA基因(编码β-葡糖醛酸酶)。增强的35S启动子(odell等,自然313:810-812,1995)与UidA基因相连,玄参花叶病毒(FMV)启动子(Gouwda等,J.Cell.Biochem.Suppl.13D:301,1989)与cp4/epsps和gox基因相连。在cp4/epsps和gox基因的上游插入转运肽(Gasser等,生物化学杂志,263:4280-4289,1988)以将两个蛋白靶向叶绿体。
令人惊奇地发现,根据本发明产生的一个转化结果不受每公顷多达约3×6升(约18升)除草剂Roundup剂量的影响。分子分析表明:
●有整合于单一位点的单拷贝转基因DNA;
●整合的DNA编码cp4/epsps并对应于截短的载体DNA;
●整合的DNA取代了基因组DNA片段并具有SEQ ID No:1所示的序列;
●与整合的DNA直接相邻的基因组DNA的特征在于SEQ ID No:2和SEQ ID No:3的序列,导致SEQ ID No:4的新基因组序列排列;
●cp4/epsps和UidA基因是完整的,而gox基因是截断的;
●其它载体序列不存在于转基因植物中。
目前可以知道这一信息,即来自根据本发明所述的特定转化结果的植株可以容易地通过PCR方法与其它甜菜植株区分开。适当的引物对组合使得可以特异地鉴定仅存在于直接或间接来自相同转化结果的植物的基因组DNA序列。这样的事件不以任何方式限制在由农杆菌介导的转化得到的那些结果,而也可以来自bio1istic转化实验。
因此本发明涉及甜菜植株及其后代,其特征在于用其基因组DNA为模板的PCR导致以下片段的扩增:
当使用以SEQ ID No:B和SEQ ID No:a的序列为特征的寡核苷酸引物对时,739bp DNA片段;或者
当使用以SEQ ID No:D和SEQ ID No:e的序列为特征的寡核苷酸引物对时,834bp DNA片段;或者
当使用以SEQ ID No:A和SEQ ID No:b的序列为特征的寡核苷酸引物对时,1057bp DNA片段;或者
当使用以SEQ ID No:C和SEQ ID No:f的序列为特征的寡核苷酸引物对时,1224bp DNA片段。
实施例
以下实施例进一步描述了得到本发明和随后的结果时所用的材料和方法。它们通过举例说明提供,并且它们的复述不应认为是要求权利的本发明的限制。
实施例1 甜菜转化
用含有cp4/epsps和gox基因(能赋予草甘膦耐受性)、nptII基因(典型对抗生素卡那素的抗性)及报告基因uidA(编码β-葡糖醛酸酶。GUS)的载体转化A1012基因型甜菜。nptII和uidA基因与加强的35S启动子(odell等,自然,313:810-812,1995)功能性连接,而cp4/epsps和gox基因在玄参花叶病毒(FMV)启动子(Gouwda等,J.Cell.Biochem.Suppl.13D:301,1989)的控制下。另外,cp4/epsps和gox基因在5′与转运肽(Gasser等,生物化学杂志,263:4280-4289,1988)连接以使两个蛋白靶向叶绿体。cp4/epsps和uidA使用E9 3′终止子序列,而gox和nptII使用相应的NOS 3′序列。
使用根瘤农杆菌转化体外培养的甜菜(Beta vulgaris.L)。使用1mM浓度的草甘膦作为选择剂,如Fry等(“使用根瘤农杆菌的基因型依赖的甜菜转化”,第三次植物分子生物学国际会议,Tuscon,Arizona,USA,1991)和Konwar(植物生物化学及生物技术杂志,3:37-41,1994)所述使植物再生。为杀灭根癌农杆菌,将子叶在含500mg/l头孢的MS培养基中培养三次(45-50rpm,60分钟)。在1mM草甘膦和500mg/l头孢噻肟上筛选8~12周(包括每三周转至新鲜培养基上)后分析再生芽。将每一转基因芽进一步微量繁殖(micropropagate)成十个拷贝,分析转基因的存在并转移至温室中生根。
聚合酶链式反应(PCR)用于确定cp4/epsps基因的存在。从再生的体外芽收集20mg植物材料至微量离心管。基本上按照Tai等,植物分子生物学报告,8:297-303,1990抽提总DNA。次要的改进是加入500μl含有50mM Na-EDTA,1.25%SDS(重量/体积),0.38%Na-Bisulfite(重量/体积)和200μg/ml蛋白酶K的100mM Tris-HCl(pH8.0)并于65℃温育2小时。挑出未溶解的叶材料并于-20℃冷冻和沉淀总DNA 2小时。用Perkin-Elmer Gene-Amp PCR试剂盒(Perkin-Elmer公司)按照所含的说明进行PCR,使用含有10mMTris-HCl(pH8.3),500mM KCL,30mM MgCl2,1.0%NonidetP-40(重量/体积),24%蔗糖(重量/体积)中的0.4μM甲酚红和Taq Start Antibody(Clontech)的修饰的10×反应缓冲液。为扩增cp4/epsps序列,使用如下引物(Shah等,科学,233:478-481,1986):5′-CAC CGG TCT TTT GGA AGG TGA AG-3′(SEQ ID NO:6)和5-AAC GAG ACC CAT AAC GAG GAA GC-3′(SEQ ID NO:7).为扩增基因间调控序列(surA,surB),使用如下引物:5′-AAA CAG TCC CGT GCA TCC CCA AC-3′(SEQ ID NO:8)和5′-GAC GCT CTC CTT GAT TCT GTC CC-3′(SEQ ID NO:9).
不同双元载体间未见到转化效率的不同。
将微量繁殖的芽转移到温室的土壤中。温室中的光照条件是200μmol m-2sec-1(Osram Power Star HQI-Z,400w),16小时光照,8小时黑暗,温度为22±2℃。用Roundup处理来自260个独立转化子的三至四叶期小苗。使用刻度喷雾器以每公顷1升的剂量(360g.a.i.1-1)施用除草剂的水溶液。草甘膦施用后2周,基于0(完全叶坏死)至9(无可见影响)的等级,对每个植株进行植物毒性影响的目测损伤评级。对于75个不同的转化子,检测到的植物毒性效应在评分0-6之间变动。其它185个(75%)转化子评分为7或更高,这意味着在用除草剂处理之后,它们表现较少或不可见的影响。将它们与非转基因甜菜杂交以产生F1子代用于随后的田间实验评估。
进行田间实验以评估田间条件下的不同转化结果。每一块地包含三排,每排9米长,行间距0.5米。在每一块地插种一个不同的转化子。在子叶期每公顷1升(360g.a.i.1-1)的初始Roundup施用去除非转基因植物后,人工挑选各行至最终标准每20厘米1个植株。每一小块地分成独立处理的三部分。一部分用传统的除草剂苯嗪草酮(0.1kg a.i.ha-1)、苯敌草(0.2kg a.i.ha-1)和甜菜呋(0.1kg a.i.ha-1)处理。另一部分用每公顷2升Roun dup处理2次(1400g a.i.ha-1), 第三部分用4升Roundup处理2次(2880ga.i.l-1),在二叶期和四叶期处理植物。最后施用后二周,评估植物由于施用除草剂的植物毒性效应。发现症状从完全易感变化至完全耐受。观察到温室中评分和田间实验中评分的不同。这可能是由于温室和田间实验的环境不同,包括在玻璃下缺少紫外光。与用传统除草剂混合物处理相比,用不同剂量的Roundup处理的地区的植物间没有形态学或生理学上的变化。两个转化子在用每公顷2升2次和4升2次处理后,表现对Roundup的高度耐受性。
用Roundup喷酒后,通过植株活力(Tr.vig)和叶褪绿(Tr.chl)评级测定耐受性。不同的评级有如下意义:
9:与未处理的对照相同的未受影响的植株
8:只有叶尖上很小的坏死,少于5%的叶面积受到影响并黄化
7:叶尖上很小的坏死开始卷曲,少于5%的叶面积受到影响并黄化
6,5,4:坏死和叶卷曲增强;叶变得比正常的更小
3,2:没有或非常有限的叶生长;所有的叶子卷曲并受坏死影响
1:无植物生长,最多5%的植株保持绿色
0:死亡植株
用1+4+4升Roundup
/公顷(共9升/公顷)喷洒22个不同的转化结果(1-22项)和一个非转基因对照(23项)。目测损伤评级的结果在下表中给出。
项 |
活力评级 |
褪绿评级 |
1 |
9 |
9 |
2 |
6 |
7 |
3 |
2 |
3 |
4 |
5 |
7 |
5 |
9 |
8 |
6 |
3 |
3 |
7 |
7 |
7 |
8 |
7 |
8 |
9 |
4 |
6 |
10 |
5 |
6 |
11 |
5 |
5 |
12 |
4 |
5 |
13 |
9 |
9 |
14 |
3 |
5 |
15 |
4 |
4 |
16 |
2 |
3 |
17 |
1 |
1 |
18 |
2 |
2 |
19 |
6 |
8 |
20 |
7 |
5 |
21 |
4 |
5 |
22 |
5 |
7 |
23 |
0 |
0 |
(RRMax)(非转基因植物1)
实施例2 整合的转基因DNA的拷贝数
通过对在所用转化载体的左和右边界序列之外延伸的限制性片段的Southern印迹分析测定具有最高草甘膦耐受性的转化子(RRMax)的基因组内整合的转基因DNA的拷贝数。
按照Saghai-Maroof等,美国国家科学院院报,81:8014-8018,1984,从250mg冷冻干燥的甜菜材料分离来自RRMax和具有相同遗传学的非转基因植物的基因组DNA。所用转化载体的DNA作用为阳性对照。用120单位的限制性酶在400μl总体积中于37℃消化15μgDNA 4小时。使消化的DNA沉淀并重新溶解于50μl总体积中。消化的DNA、阳性对照质粒和标准的分子大小标记(用EcoRI和HindIII消化的λDNA)在0.8%琼脂糖凝胶上分离。用溴化乙锭观察DNA,并包括尺子进行摄影。然后将DNA转移到Hybond N+膜上并如Ausubel等(编辑),于“现代分子生物学常用方法”,Green PublishingAssociates,Inc.和John Wiley & Sons,Inc.,New York,1987所述与探针杂交。
通过聚合酶链式反应(PCR,其中所用的转化载体作用为反应的模板DNA)制备与cp4/epsps基因序列(SEQ ID No:5)的975-1766碱基对和gox基因序列(SEQ ID No:5)的7108-7535碱基对互补的探针。cp4/epsps探针用于测定邻近右边界区域的插入数。gox探针用于测定邻近左边界区域的插入数。使用BIO 101(La Jolla,CA)的Geneclean II试剂盒纯化PCR产物。使用AmershamInternational(Little Chalfont,UK)的MegaprimeTM DNA标记系统进行探针的32P标记。
拷贝数测定可以通过对邻近右边界区域的基因组DNA的分析进行。用限制性酶NcoI消化基因组DNA,NcoI切割35s启动子和uidA基因间的和甜菜基因组内的质粒来源的序列。用cp4/epsps基因的内部PCR片段探测膜。用NcoI消化并用cp4/epsps探针杂交后,在RRMax中检测到4.7kb的单一条带。这证明了转移DNA在单一位点的单拷贝。
拷贝数测定可以通过对邻近左边界区域的基因组DNA的分析进行。用限制性酶HindIII消化基因组DNA,HindIII切割gox的FMV启动子和uidA基因的E9 3′终止子间的和甜菜基因组内的质粒来源的序列。在用HindIII消化并用gox探针杂交后,检测到转化子在RRMax中的2.0kb的单一条带。因为预期的最小片段大小是≥4.4kb,所以结果表面在转移入植物基因组DNA的过程中质粒DNA的截断。而且结果证明了转移DNA单拷贝整合在单一位点。
实施例3 RRMax整合位点的序列分析
按照Saghai-Maroof等,同上,从250mg冷冻干燥的甜菜叶材料分离RRMax基因组DNA。制备在XhoI克隆位点中带有9-23kb大小插入的λFIXII噬菌体文库。并用cp4/epsps和gox探针探测以筛选覆盖整合结果的推测克隆。检测到与cp4/epsps或gox探针杂交的总共25个噬菌体。发现分别与cp4/epsps探针和gox探针杂交的2个克隆。纯化其中之一(Fritsch等,1987)并通过Southern印迹分析和PCR进一步评估。它含有15-16kb的基因组DNA插入,包括转基因DNA和侧翼的甜菜序列。所述侧翼序列通过PCR、使用与FMV启动子或gox基因序列匹配的引物结合与λFIXII克隆元件中的序列匹配的引物(详细的序列在下面1中给出)来扩增。整合的DNA/甜菜接合区域通过Sanger双脱氧介导的链终止法使用Applied Biosystem,373A型,2.1.1版测序。所用的测序引物在表2中给出。
表1 用于扩增边界区域的引物
引物 |
序列 |
#3 |
5′-CAAGAAGGTTGGTATCGCTG-3′(SEQ ID NO:10) |
#7 |
5′-TCTTTTGTGGTCGTCACTGCGTT-3′(SEQ ID NO:11) |
#8 |
5′-GCGAGCTCTAATACGACTCACTAT-3′(SEQ ID NO:12) |
#9 |
5′-CGCGAGCTCAATTAACCCTCACT-3′(SEQ ID NO:13) |
表2 测序引物
引物 |
序列 |
说明 |
S1 |
5′-TCTGTACCCTGACCTTGTTG-3′(SEQ ID NO:14) |
测定右边界区域侧翼序列 |
S3 |
5′-CGTGGATACCACATCGTGAT-3′(SEQ ID NO:15) |
测定左边界区域侧翼序列 |
S4 |
5′-ACCTTGGCTTGAAGTACTC-3(SEQ ID NO:16) |
测定左边界区域侧翼序列 |
序列分析表明整合在RRMax基因组中的转基因DNA具有SEQ IDNo:1中给出的核苷酸序列。整合起始点位于右边界序列和FMV启动子之间并终止于gox起始密码子下游的897碱基对。截短的gox基因的翻译终止密码子可在接合点下游的130和235碱基对找到。在gox起始密码子下游210碱基对识别了一个HindIII位点,而在下游650碱基对识别了一个转录终止信号(AATAAA)。SEQ ID No:2表示了与转基因DNA的右边界区域直接相连的基因组DNA序列,而SEQ ID No:3表示与转基因DNA的左边界区域直接相连的基因组DNA序列。
实施例4 RRMax整合的转基因DNA的特征鉴定
为进一步鉴定右边界区域,用限制性酶BamHI、HindIII、BcII或EcoRI消化基因组DNA和转化载体DNA。在Southern印迹分析中,用实施例2中所述的cp4/epsps PCR片段探测切开的DNA。与所用的限制性酶无关,用不同的限制性酶消化在Southern印迹分析中产生单一片段。检测到的片段大小在表3中表示。数据表明单一拷贝的DNA已转移至植物中,并且DNA向甜菜植株的转移导致cp4/epsps基因的完整转移。结果与实施例2中的拷贝数测定和实施例3的核苷酸序列一致。
表3 Southern印迹片段大小
酶 |
RRMax |
转化载体 |
BamHI |
>10kb |
9.7kb |
HindIII |
2.4kb |
2.4kb |
Bcll |
3.2kb |
2.9kb |
EcoRI |
1.8kb |
1.8kb |
为进一步鉴定整合的转基因片段,用限制性酶NcoI、BamHI或HindIII消化来自RRMax的基因组DNA。作为对照,用相同的限制性酶消化转化载体DNA。用横跨SEQ ID No:5中uidA基因的3796-4837碱基对的PCR扩增的DNA片段探测印迹。检测到的片段大小在表4中表示。与所用的限制性酶无关,用不同的限制性酶消化在放射自显影胶片上产生单一信号,这表明DNA插入具有与所用转化载体的内部DNA相同的特征。
表4 Southern印迹片段大小
酶 |
转化载体 |
RRMax |
Ncol |
3.4kb |
3.4kb |
BamHI |
3.2kb |
3.2kb |
HindIII |
3.2kb |
3.2kb |
为进一步鉴定左边界区域,用限制性酶NcoI、BamHI、HindIII或EcoRI消化转化载体DNA。在Southern分析中用实施2中所述的goxPCR片段探测切开的DNA。检测到的片段大小在表5中表示。与所用的限制性酶无关,用不同的限制性酶消化在放射自显影胶片上产生单一片段。用限制性酶NcoI、BamHI、HindIII或EcoRI消化预期识别已知大小的内部片段。但是,这些限制性酶没有产生这样的预期大小的内部片段。这表明NcoI、BamHI、HindIII或EcoRI的限制性位点在转基因植物中缺乏。这些结果与通过测序发现的gox基因仅部分整合入植物的结果一致。用限制性酶HindIII消化产生的2kb片段,进一步确定了测序数据,即HindIII位点位于基因组中gox基因的下游。结果也表明转基因DNA的单拷贝已转移到植物中。它们与实施例2中的拷贝数测定和实施例3中的核苷酸序列分析的最初结果很好地相关。单一拷贝已整合入植物基因组,而gox基因部分缺失。
表5 Southern印迹片段大小
酶 |
转化载体 |
T9100152 |
Ncol |
2.5kb |
3.0kb |
BamHI |
2.9kb |
>10kb |
HindIII |
9.5kb |
2.0kb |
EcoRI |
1.6kb |
3.6kb |
实施例5 其它载体DNA序列的缺失
为确定转化结果RRMax中oriV,ori-322,aad和nptII序列的缺失,Southern印迹分析可以使用覆盖oriV,ori-322,add和nptII的限制性酶/探针组合进行。
用限制性酶NspI消化转化载体DNA,NspI在17处位点切割质粒。为了分析,纯化覆盖oriV的NspI片段和覆盖ori-322和aad的片段并用于Southern印迹分析。具有SEQ ID No:26中给出的核苷酸序列的PCR扩增的片段用于探针nptII序列。用BIO 101(La Jolla,CA)的Geneclean II试剂盒纯化。用Amersham International(Littlechalfont,UK)的MegaprimeTM DNA标记系统进行P32的标记。
用限制性酶BamHI消化RRMax的基因组DNA,BamHI在分别位于SEQID No:5的碱基对2321、5544和8413的三处位点切割转化载体DNA。相应Southern转移膜与覆盖oriV探针的杂交没有检测到信号,必然得出结论:oriV不存在于RRMax中。
相应Southern转移膜与覆盖ori-322和aad的探针的杂交没有检测到信号。必然得出结论:ori-322和aad序列不存在于RRMax中。
相应Southern转移膜与nptII探针的杂交也未检测到信号,这证明nptII基因不存在于RRMax株系中。
实施例6 RRMax株系的稳定性
如实施例2中所述的用限制性酶BcII消化基因组DNA并使用cp4/epsps基因作为探针进行Southern印迹分析。来自2和3代的四株植物和来自4代的5株植物用于此分析。另外,3株非转基因植物用作负对照。最初转化结果的分析得到3.2kb的单一片段。如果导入的DNA在代与代之间稳定遗传,那么预期在所有植株中有相同的3.2kb片段。
如实施例2中所述的用HindIII消化基因组DNA并用gox基因的内部片段作为探针进行Southern印迹分析。最初转化结果的分析得到2.0kb的单一片段。子代的Southern印迹分析也得到2.0kb的单一片段,表明特征的稳定遗传。
实施例7 RRMax的PCR测定。
如实施例2中所述制备RRMax株系的基因组DNA。在PCR反应中,约0.5μg DNA用作模板DNA,且使用以表6中给出的序列为特征的特定引物组合,所述的特定组合和扩增片段的大小在表7中给出。在每个30-35扩增循环中,根据引物对组合,使用55℃和65℃之间的退火温度。
表6 引物序列
引物 |
序列 |
说明 |
A |
5’-TCAACCTACAGCTGATTTGGACC-3’(SEQ ID NO:17) |
邻近右边界接合点 |
B |
5’-GGACCGGAACGACAATCTGATC-3’(SEQ ID NO:18) |
邻近右边界接合点 |
C |
5’-CTAGGGAAGTCCAAATCAGCCG-3’(SEQ ID NO:19) |
邻近左边界接合点 |
D |
5’-TTTGGACCGGAACTTTCCAGAAG-3’(SEQ ID NO:20) |
邻近左边界接合点 |
a |
5’-CTAACTTGCGCCATCGGAGAAAC-3’(SEQ ID NO:21) |
cp4/epsps基因内 |
b |
5’-GACTTGTCACCTGGAATACGGAC-3’(SEQ ID NO:22) |
cp4/epsps基因内 |
c |
5’-ATTCTTGAGCTCATCAAGCAGCC-3’(SEQ ID NO:23) |
cp4/epsps基因内 |
e |
5’-AAGGTTGGTATCGCTGGAGCTG-3’(SEQ ID NO:24) |
gox序列内 |
f |
5’-TCTCCACAATGGCTTCCTCTATG-3’(SEQ ID NO:25) |
gox序列内 |
表7 特定引物组合
组合 |
扩增的片段大小 |
A+a |
757bp |
A+b |
1057bp |
A+c |
2352bp |
B+a |
739bp(SEQ ID NO:27) |
B+b |
1039bp |
B+c |
2334bp |
C+e |
888bp |
C+f |
1224bp |
D+e |
834bp |
D+f |
1178bp |
(1)基本信息
(i)申请人:NOVARTIS AG
(A)街道:Schwarzwaldallee 215
(B)城市:Basel
(C)国家:瑞士
(D)邮政编号:4058
(E)电话:+41 61 324 11 11
(F)传真:+41 61 322 75 32
(ii)发明名称:转基因植物
(iii)序列数:27
(iv)计算机可读形式
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.25(EPO)
(2)关于SEQ ID NO:1的信息:
(i)序列特征
(A)长度:8012个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:1:
AACGACAATC TGATCCCCAT CAAGCTTGAG CTCAGGATII AGCAGCATTC CAGATTGGGT 60
TCAATCAACA AGGTACGAGC CATATCACTT TATTCAAATT GGTATCGCCA AAACCAAGAA 120
GGAACTCCCA TCCTCAAAGG TTTGTAAGGA AGAATTCTCA GTCCAAAGCC TCAACAAGGT 180
CAGGGTACAG AGTCTCCAAA CCATTAGCCA AAAGCTACAG GAGATCAATG AAGAATCTTC 240
AATCAAAGTA AACTACTGTT CCAGCACATG CATCATGGTC AGTAAGTTTC AGAAAAAGAC 300
ATCCACCGAA GACTTAAAGT TAGTGGGCAT CTTTGAAAGT AATCTTGTCA ACATCGAGCA 360
GCTGGCTTGT GGGGACCAGA CAAAAAAGGA ATGGTGCAGA ATTGTTAGGC GCACCTACCA 420
AAAGCATCTT TGCCTTTATT GCAAAGATAA AGCAGATTCC TCTAGTACAA GTGGGGAACA 480
AAATAACGTG GAAAAGAGCT GTCCTGACAG CCCACTCACT AATGCGTATG ACGAACGCAG 540
TGACGACCAC AAAAGAATTC CCTCTATATA AGAAGGCATT CATTCCCATT TGAAGGATCA 600
TCAGATACTG AACCAATCCT TCTAGAAGAT CTAAGCTTAT CGATAAGCTT GATGTAATTG 660
GAGGAAGATC AAAATTTTCA ATCCCCATTC TTCGATTGCT TCAATTGAAG TTTCTCCGAT 720
GGCGCAAGTT AGCAGAATCT GCAATGGTGT GCAGAACCCA TCTCTTATCT CCAATCTCTC 780
GAAATCCAGT CAACGCAAAT CTCCCTTATC GGTTTCTCTG AAGACGCAGC AGCATCCACG 840
AGCTTATCCG ATTTCGTCGT CGTGGGGATT GAAGAAGAGT GGGATGACGT TAATTGGCTC 900
TGAGCTTCGT CCTCTTAAGG TCATGTCTTC TGTTTCCACG GCGTGCATGC TTCACGGTGC 960
AAGCAGCCGT CCAGCAACTG CTCGTAAGTC CTCTGGTCTT TCTGGAACCG TCCGTATTCC 1020
AGGTGACAAG TCTATCTCCC ACAGGTCCTT CATGTTTGGA GGTCTCGCTA GCGGTGAAAC 1080
TCGTATCACC GGTCTTTTGG AAGGTGAAGA TGTTATCAAC ACTGGTAAGG CTATGCAAGC 1140
TATGGGTGCC AGAATCCGTA AGGAAGGTGA TACTTGGATC ATTGATGGTG TTGGTAACGG 1200
TGGACTCCTT GCTCCTGAGG CTCCTCTCGA TTTCGGTAAC GCTGCAACTG GTTGCCGTTT 1260
GACTATGGGT CTTGTTGGTG TTTACGATTT CGATAGTACT TTCATTGGTG ACGCTTCTCT 1320
CACTAAGCGT CCAATGGGTC GTGTGTTGAA CCCACTTCGC GAAATGGGTG TGCAGGTGAA 1380
GTCTGAAGAC GGTGATCGTC TTCCAGTTAC CTTGCGTGGA CCAAAGACTC CAACGCCAAT 1440
CACCTACAGG GTACCTATGG CTTCCGCTCA AGTGAAGTCC GCTGTTCTGC TTGCTGGTCT 1500
CAACACCCCA GGTATCACCA CTGTTATCGA GCCAATCATG ACTCGTGACC ACACTGAAAA 1560
GATGCTTCAA GGTTTTGGTG CTAACCTTAC CGTTGAGACT GATGCTGACG GTGTGCGTAC 1620
CATCCGTCTT GAAGGTCGTG GTAAGCTCAC CGGTCAAGTG ATTGATGTTC CAGGTGATCC 1680
ATCCTCTACT GCTTTCCCAT TGGTTGCTGC CTTGCTTGTT CCAGGTTCCG ACGTCACCAT 1740
CCTTAACGTT TTGATGAACC CAACCCGTAC TGGTCTCATC TTGACTCTGC AGGAAATGGG 1800
TGCCGACATC GAAGTGATCA ACCCACGTCT TGCTGGTGGA GAAGACGTGG CTGACTTGCG 1860
TGTTCGTTCT TCTACTTTGA AGGGTGTTAC TGTTCCAGAA GACCGTGCTC CTTCTATGAT 1920
CGACGAGTAT CCAATTCTCG CTGTTGCAGC TGCATTCGCT GAAGGTGCTA CCGTTATGAA 1980
CGGTTTGGAA GAACTCCGTG TTAAGGAAAG CGACCGTCTT TCTGCTGTCG CAAACGGTCT 2040
CAAGCTCAAC GGTGTTGATT GCGATGAAGG TGAGACTTCT CTCGTCGTGC GTGGTCGTCC 2100
TGACGGTAAG GGTCTCGGTA ACGCTTCTGG AGCAGCTGTC GCTACCCACC TCGATCACCG 2160
TATCGCTATG AGCTTCCTCG TTATGGGTCT CGTTTCTGAA AACCCTGTTA CTGTTGATGA 2220
TGCTACTATG ATCGCTACTA GCTTCCCAGA GTTCATGGAT TTGATGGCTG GTCTTGGAGC 2280
TAAGATCGAA CTCTCCGACA CTAAGGCTGC TTGATGAGCT CAAGAATTCG AGCTCGGTAC 2340
CGGATCCTCT AGCTAGAGCT TTCGTTCGTA TCATCGGTTT CGACAACGTT CGTCAAGTTC 2400
AATGCATCAG TTTCATTGCG CACACACCAG AATCCTACTG AGTTCGAGTA TTATGGCATT 2460
GGGAAAACTG TTTTTCTTGT ACCATTTGTT GTGCTTGTAA TTTACTGTGT TTTTTATTCG 2520
GTTTTCGCTA TCGAACTGTG AAATGGAAAT GGATGGAGAA GAGTTAATGA ATGATATGGT 2580
CCTTTTGTTC ATTCTCAAAT TAATATTATT TGTTTTTTCT CTTATTTGTT GTGTGTTGAA 2640
TTTGAAATTA TAAGAGATAT GCAAACATTT TGTTTTGAGT AAAAATGTGT CAAATCGTGG 2700
CCTCTAATGA CCGAAGTTAA TATGAGGAGT AAAACACTTG TAGTTGTACC ATTATGCTTA 2760
TTCACTAGGC AACAAATATA TTTTCAGACC TAGAAAAGCT GCAAATGTTA CTGAATACAA 2820
GTATGTCCTC TTGTGTTTTA GACATTTATG AACTTTCCTT TATGTAATTT TCCAGAATCC 2880
TTGTCAGATT CTAATCATTG CTTTATAATT ATAGTTATAC TCATGGATTT GTAGTTGAGT 2940
ATGAAAATAT TTTTTAATGC ATTTTATGAC TTGCCAATTG ATTGACAACA TGCATCAATC 3000
GACCTGCAGC CACTCGAAGC GGCCGCGTTC AAGCTTCTGC AGGTCCGATG TGAGACTTTT 3060
CAACAAAGGG TAATATCCGG AAACCTCCTC GGATTCCATT GCCCAGCTAT CTGTCACTTT 3120
ATTGTGAAGA TAGTGGAAAA GGAAGGTGGC TCCTACAAAT GCCATCATTG CGATAAAGGA 3180
AAGGCCATCG TTGAAGATGC CTCTGCCGAC AGTGGTCCCA AAGATGGACC CCCACCCACG 3240
AGGAGCATCG TGGAAAAAGA AGACGTTCCA ACCACGTCTT CAAAGCAAGT GGATTGATGT 3300
GATGGTCCGA TGTGAGACTT TTCAACAAAG GGTAATATCC GGAAACCTCC TCGGATTCCA 3360
TTGCCCAGCT ATCTGTCACT TTATTGTGAA GATAGTGGAA AAGGAAGGTG GCTCCTACAA 3420
ATGCCATCAT TGCGATAAAG GAAAGGCCAT CGTTGAAGAT GCCTCTGCCG ACAGTGGTCC 3480
CAAAGATGGA CCCCCACCCA CGAGGAGCAT CGTGGAAAAA GAAGACGTTC CAACCACGTC 3540
TTCAAAGCAA GTGGATTGAT GTGATATCTC CACTGACGTA AGGGATGACG CACAATCCCA 3600
CTATCCTTCG CAAGACCCTT CCTCTATATA AGGAAGTTCA TTTCATTTGG AGAGGACACG 3660
CTGACAAGCT GACTCTAGCA GATCTCCATG GTCCGTCCTG TAGAAACCCC AACCCGTGAA 3720
ATCAAAAAAC TCGACGGCCT GTGGGCATTC AGTCTGGATC GCGAAAACTG TGGAATTGAT 3780
CAGCGTTGGT GGGAAAGCGC GTTACAAGAA AGCCGGGCAA TTGCTGTGCC AGGCAGTTTT 3840
AACGATCAGT TCGCCGATGC AGATATTCGT AATTATGCGG GCAACGTCTG GTATCAGCGC 3900
GAAGTCTTTA TACCGAAAGG TTGGGCAGGC CAGCGTATCG TGCTGCGTTT CGATGCGGTC 3960
ACTCATTACG GCAAAGTGTG GGTCAATAAT CAGGAAGTGA TGGAGCATCA GGGCGGCTAT 4020
ACGCCATTTG AAGCCGATGT CACGCCGTAT GTTATTGCCG GGAAAAGTGT ACGTATCACC 4080
GTTTGTGTGA ACAACGAACT GAACTGGCAG ACTATCCCGC CGGGAATGGT GATTACCGAC 4140
GAAAACGGCA AGAAAAAGCA GTCTTACTTC CATGATTTCT TTAACTATGC CGGAATCCAT 4200
CGCAGCGTAA TGCTCTACAC CACGCCGAAC ACCTGGGTGG ACGATATCAC CGTGGTGACG 4260
CATGTCGCGC AAGACTGTAA CCACGCGTCT GTTGACTGGC AGGTGGTGGC CAATGGTGAT 4320
GTCAGCGTTG AACTGCGTGA TGCGGATCAA CAGGTGGTTG CAACTGGACA AGGCACTAGC 4380
GGGACTTTGC AAGTGGTGAA TCCGCACCTC TGGCAACCGG GTGAAGGTTA TCTCTATGAA 4440
CTGTGCGTCA CAGCCAAAAG CCAGACAGAG TGTGATATCT ACCCGCTTCG CGTCGGCATC 4500
CGGTCAGTGG CAGTGAAGGG CGAACAGTTC CTGATTAACC ACAAACCGTT CTACTTTACT 4560
GGCTTTGGTC GTCATGAAGA TGCGGACTTA CGTGGCAAAG GATTCGATAA CGTGCTGATG 4620
GTGCACGACC ACGCATTAAT GGACTGGATT GGGGCCAACT CCTACCGTAC CTCGCATTAC 4680
CCTTACGCTG AAGAGATGCT CGACTGGGCA GATGAACATG GCATCGTGGT GATTGATGAA 4740
ACTGCTGCTG TCGGCTTTAA CCTCTCTTTA GGCATTGGTT TCGAAGCGGG CAACAAGCCG 4800
AAAGAACTGT ACAGCGAAGA GGCAGTCAAC GGGGAAACTC AGCAAGCGCA CTTACAGGCG 4860
ATTAAAGAGC TGATAGCGCG TGACAAAAAC CACCCAAGCG TGGTGATGTG GAGTATTGCC 4920
AACGAACCGG ATACCCGTCC TGCACGGGAA TATTTCGGCA TTTCGCCACT GGCGGAAGCA 4980
ACGCGTAAAC TCGACCCGAC GCGTCCGATC ACCTGCGTCA ATGTAATGTT CTGCGACGCT 5040
CACACCGATA CCATCAGCGA TCTCTTTGAT GTGCTGTGCC TGAACCGTTA TTACGGATGG 5100
TATGTCCAAA GCGGCGATTT GGAAACGGCA GAGAAGGTAC TGGAAAAAGA ACTTCTGGCC 5160
TGGCAGGAGA AACTGCATCA GCCGATTATC ATCACCGAAT ACGGCGTGGA TACGTTAGCC 5220
GGGCTGCACT CAATGTACAC CGACATGTGG AGTGAAGAGT ATCAGTGTGC ATGGCTGGAT 5280
ATGTATCACC GCGTCTTTGA TCGCGTCAGC GCCGTCGTCG GTGAACAGGT ATGGAATTTC 5340
GCCGATTTTG CGACCTCGCA AGGCATATTG CGCGTTGGCG GTAACAAGAA AGGGATCTTC 5400
ACTCGCGACC GCAAACCGAA GTCGGCGGCT TTTCTGCTGC AAAAACGCTG GACTGGCATG 5460
AACTTCGGTG AAAAACCGCA GCAGGGAGGC AAACAATGAA TCAACAACTC TCCTGGCGCA 5520
CCATCGTCGG CTACAGCCTC GGTGGGGAAT TCGAGCTCGC CCGGGGATCC TCTAGCTAGA 5580
GCTTTCGTTC GTATCATCGG TTTCGACAAC GTTCGTCAAG TTCAATGCAT CAGTTTCATT 5640
GCGCACACAC CAGAATCCTA CTGAGTTCGA GTATTATGGC ATTGGGAAAA CTGTTTTTCT 5700
TGTACCATTT GTTGTGCTTG TAATTTACTG TGTTTTTTAT TCGGTTTTCG CTATCGAACT 5760
GTGAAATGGA AATGGATGGA GAAGAGTTAA TGAATGATAT GGTCCTTTTG TTCATTCTCA 5820
AATTAATATT ATTTGTTTTT TCTCTTATTT GTTGTGTGTT GAATTTGAAA TTATAAGAGA 5880
TATGCAAACA TTTTGTTTTG AGTAAAAATG TGTCAAATCG TGGCCTCTAA TGACCGAAGT 5940
TAATATGAGG AGTAAAACAC TTGTAGTTGT ACCATTATGC TTATTCACTA GGCAACAAAT 6000
ATATTTTCAG ACCTAGAAAA GCTGCAAATG TTACTGAATA CAAGTATGTC CTCTTGTGTT 6060
TTAGACATTT ATGAACTTTC CTTTATGTAA TTTTCCAGAA TCCTTGTCAG ATTCTAATCA 6120
TTGCTTTATA ATTATAGTTA TACTCATGGA TTTGTAGTTG AGTATGAAAA TATTTTTTAA 6180
TGCATTTTAT GACTTGCCAA TTGATTGACA ACATGCATCA ATCGACCTGC AGCCCAAGCT 6240
TGAGCTCAGG ATTTAGCAGC ATTCCAGATT GGGTTCAATC AACAAGGTAC GAGCCATATC 6300
ACTTTATTCA AATTGGTATC GCCAAAACCA AGAAGGAAGT CCCATCCTCA AAGGTTTGTA 6360
AGGAAGAATT CTCAGTCCAA AGCCTCAACA AGGTCAGGGT ACAGAGTCTC CAAACCATTA 6420
GCCAAAAGCT ACAGGAGATC AATGAAGAAT CTTCAATCAA AGTAAACTAC TGTTCCAGCA 6480
CATGCATCAT GGTCAGTAAG TTTCAGAAAA AGACATCCAC CGAAGACTTA AAGTTAGTGG 6540
GCATCTTTGA AAGTAATCTT GTCAACATCG AGCAGCTGGC TTGTGGGGAC CAGACAAAAA 6600
AGGAATGGTG CAGAATTGTT AGGCGCACCT ACCAAAAGCA TCTTTGCCTT TATTGCAAAG 6660
ATAAAGCAGA TTCCTCTAGT ACAAGTGGGG AACAAAATAA CGTGGAAAAG AGCTGTCCTG 6720
ACAGCCCACT CACTAATGCG TATGACGAAC GCAGTGACGA CCACAAAAGA ATTCCCTCTA 6780
TATAAGAAGG CATTCATTCC CATTTGAAGG ATCATCAGAT ACTGAACCAA TCCTTCTAGA 6840
AGATCTCCAC AATGGCTTCC TCTATGCTCT CTTCCGCTAC TATGGTTGCC TCTCCGGCTC 6900
AGGCCACTAT GGTCGCTCCT TTCAACGGAC TTAAGTCCTC CGCTGCCTTC CCAGCCACCC 6960
GCAAGGCTAA CAACGACATT ACTTCCATCA CAAGCAACGG CGGAAGAGTT AACTGCATGC 7020
AGGTGTGGCC TCCGATTGGA AAGAAGAAGT TTGAGACTCT CTCTTACCTT CCTGACCTTA 7080
CCGATTCCGG TGGTCGCGTC AACTGCATGC AGGCCATGGC TGAGAACCAC AAGAAGGTTG 7140
GTATCGCTGG AGCTGGAATC GTTGGTGTTT GCACTGCTTT GATGCTTCAA CGTCGTGGAT 7200
TCAAGGTTAC CTTGATTGAT CCAAACCCAC CAGGTGAAGG TGCTTCTTTC GGTAACGCTG 7260
GTTGCTTCAA CGGTTCCTCC GTTGTTCCAA TGTCCATGCC AGGAAACTTG ACTAGCGTTC 7320
CAAAGTGGCT TCTTGACCCA ATGGGTCCAT TGTCCATCCG TTTCAGCTAC TTTCCAACCA 7380
TCATGCCTTG GTTGATTCGT TTCTTGCTTG CTGGAAGACC AAACAAGGTG AAGGAGCAAG 7440
CTAAGGCACT CCGTAACCTC ATCAAGTCCA CTGTGCCTTT GATCAAGTCC TTGGCTGAGG 7500
AGGCTGATGC TAGCCACCTT ATCCGTCACG AAGGTCACCT TACCGTGTAC CGTGGAGAAG 7560
CAGACTTCGC CAAGGACCGT GGAGGTTGGG AACTTCGTCG TCTCAACGGT GTTCGTACTC 7620
AAATCCTCAG CGCTGATGCA TTGCGTGATT TCGATCCTAA CTTGTCTCAC GCCTTTACCA 7680
AGGGAATCCT TATCGAAGAG AACGGTCACA CCATCAACCC ACAAGGTCTC GTGACTCTCT 7740
TGTTTCGTCG TTTCATCGCT AACGGTGGAG AGTTCGTGTC TGCTCGTGTT ATCGGATTCG 7800
AGACTGAAGG TCGTGCTCTC AAGGGTATCA CCACCACCAA CGGTGTTCTT GCTGTTGATG 7860
CAGCTGTTGT TGCAGCTGGT GCACACTCCA AGTCTCTTGC TAACTCCCTT GGTGATGACA 7920
TCCCATTGGA TACCGAACGT GGATACCACA TCGTGATCGC CAACCCAGAA GCTGCTCCAC 7980
GTATTCCAAC TACCGATGCT TCTGGAAAGT TC 8012
(2)关于SEQ ID NO:2的信息
(i)序列特征
(A)长度:89个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:2:
GGATTGGTT TGGGTTTGT CTGTGTGTTT AATGTGTTTA AGGGATGAAT TAGAATGCTC 60
TTAATCAACC TACAGCTGAT IIGGACCGG 89
(2)关于SEQ ID NO:3的信息:
(i)序列特征
(A)长度:697个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:3:
CGGTCCAAAT TTGTTTACAT TGTGTCCAAA TTTCGGCTGA TTTGGACTTC CCTAGCTATG 60
CCAACTAAGC TAATAAAAAA CATGAAACAA CAATTACAAA CTGTCGAGCA CACCTTCTAC 120
AAACTAGCTT AGATTTCTAT TGGAAGTTAC AAAACAGTAA AACTACCAAT AGGATACTAA 180
ATTAAACATA TTAAACTATT ACTCCTCAAA AGCTTGTACA ATTTGCAGAA GAAATGATGG 240
TTGCCCAAAA GCTTCAAAGG GAACCTGCTG GGAAGCCTGC TGGGACGCTG GGGATGCTGG 300
CAGCAGCATA CCTTGGCTTG AAGTACTCTT CTCTCATTGG TTTTGCTTCC CTTGCCCATG 360
TGGTCTTCAT ATGGCCTCAT TACTTCCCAA GGGCTTCAAA TCAGTAGGTG GTGGCAACCA 420
AAAGCATCAA AAACATCTCC TAAAACTAGC TTATACAACC GGATTACATG AGCTTATACT 480
AGCTTAACTC TTAAAGCATG ATTAACATAA TGATGTTTAA GGTGTCATTA AGTATTACTA 540
ATCTTGCTTA AGTAGAGATT AACATAGGAT TAGCCTAATC AAGTTGCTTA AGTAAGGTTT 600
TAGAATAAAC CGAGCTAGTT AGGCTTAAGT AGAGATTAAC ATAGGATTAG CCTAATCAAG 660
TTGCTTAAGT AAGGTTTTAG AATAAACCGA GCTAGTT 697
(2)关于SEQ ID NO:4的信息:
(i)序列特征
(A)长度:8798个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:4:
GGATTGTGTT TGGGTTTTGT CTGTCTGTTT AATGTGTTTA AGGGATGAAT TAGAATGCTC 60
TTAATCAACC TACAGCTGAT TTGGACCGGA ACGACAATCT GATCCCCATC AAGCTTGAGC 120
TCAGGATTTA GCAGCATTCC AGATTGGGTT CAATCAACAA GGTACGAGCC ATATCACTTT 180
ATTCAAATTG GTATCGCCAA AACCAAGAAG GAACTCCCAT CCTCAAAGGT TTGTAAGAAA 240
GAATTCTCAG TCCAAAGCCT CAACAAGGTC AGGGTACAGA GTCTCCAAAC CATTAGCCAA 300
AAGCTACAGG AGATCAATGA AGAATCTTCA ATCAAAGTAA ACTACTGTTC CAGCACATGC 360
ATCATGGTCA GTAAGTTTCA GAAAAAGACA TCCACCGAAG ACTTAAAGTT AGTGGGCATC 420
TTTGAAAGTA ATCTTGTCAA CATCGAGCAG CTGGCTTGTG GGGACCAGAC AAAAAAGGAA 480
TGGTGCAGAA TTGTTAGGCG CACCTACCAA AAGCATCTTT GCCTTTATTG CAAAGATAAA 540
GCAGATTCCT CTAGTACAAG TGGGGAACAA AATAACGTGG AAAAGAGCTG TCCTGACAGC 600
CCACTCACTA ATGCGTATGA CGAACGCAGT GACGACACCA AAAGAATTCC CTCTATATAA 660
GAAGGCATTC ATTCCCATTT GAAGGATCAT CAGATACTGA ACCAATCCTT CTAGAAGATC 720
TAAGCTTATC GATAAGCTTG ATGTAATTGG AGGAAGATCA AAATTTTCAA TCCCCATTCT 780
TCGATTGCTT CAATTGAAGT TTCTCCGATG GCGCAAGTTA GCAGAATCTG CAATGGTGTG 840
CAGAACCCAT CTCTTATCTC CAATCTCTCG AAATCCAGTC AACGCAAATC TCCCTTATCG 900
GTTTCTCTGA AGACGCAGCA GCATCCACGA GCTTATCCGA TTTCGTCGTC GTGGGGATTG 960
AAGAAGAGTG GGATGACGTT AATTGGCTCT GAGCTTCGTC CTCTTAAGGT CATGTCTTCT 1020
GTTTCCACGG CGTGCATGCT TCACGGTGCA AGCAGCCGTC CAGCAACTGC TCGTAAGTCC 1080
TCTGGTCTTT CTGGAACCGT CCGTATTCCA GGTGACAAGT CTATCTCCCA CAGGTCCTTC 1140
ATGTTTGGAG GTCTCGCTAG CGGTGAAACT CGTATCACCG GTCTTTTGGA AGGTGAAGAT 1200
GTTATCAACA CTGGTAAGGC TATGCAAGCT ATGGGTGCCA GAATCCGTAA GGAAGGTGAT 1260
ACTTGGATCA TTGATGGTGT TGGTAACGGT GGACTCCTTG CTCCTGAGGC TCCTCTCGAT 1320
TTCGGTAACG CTGCAACTGG TTGCCGTTTG ACTATGGGTC TTGTTGGTGT TTACGATTTC 1380
GATAGCACTT TCATTGGTGA CGCTTCTCTC ACTAAGACTC CAATGGGTCG TGTGTTGAAC 1440
CCACTTCGCG AAATGGGTGT GCAGGTGAAG TCTGAAGACG GTGATCGTCT TCCAGTTACC 1500
TTGCGTGGAC CAAAGACTCC AACGCCAATC ACCTACAGGG TACCTATGGC TTCCGCTCAA 1560
GTGAAGTCGG CTGTTCTGCT TGCTGGTCTC AACACCCCAG GTATCACCAC TGTTATCGAG 1620
CCAATCATGA CTCGTGACCA CACTGAAAAG ATGCTTCAAG GTTTTGGTGC TAACCTTACC 1680
GTTGAGACTG ATGCTGACGG TGTGCGTACC ATCCGTCTTG AAGGTCGTGG TAAGCTCACC 1740
GGTCAAGTGA TTGATGTTCC AGGTGATCCA TCCTCTACTG CTTTCCCATT GGTTGCTGCC 1800
TTGCTTGTTC CAGGTTCCGA CGTCACCATC CTTAACGTTT TGATGAACCC AACCCGTACT 1860
GGTCTCATCT TGACTCTGCA GGAAATGGGT GCCGACATCG AAGTGATCAA CCCACGTCTT 1920
GCTGGTGGAG AAGACGTGGC TGACTTGCGT GTTCGTTCTT CTACTTTGAA GGGTGTTACT 1980
GTTCCAGAAG ACCGTGCTCC TTCTATGATC GACGAGTATC CAATTCTCGC TGTTGCAGCT 2040
GCATTCGCTG AAGGTGCTAC CGTTATGAAC GGTTTGGAAG AACTCCGTGT TAAGGAAAGC 2100
GACCGTCTTT CTGCTGTCGC AAACGGTCTC AAGCTCAACG GTGTTGATTG CGATGAAGGT 2160
GAGACTTCTC TCGTCGTGCG TGGTCGTCCT GACGGTAAGG GTCTCGGTAA CGCTTCTGGA 2220
GCAGCTGTCG CTACCCACCT CGATCACCGT ATCGCTATGA GCTTCCTCGT TATGGGTCTC 2280
GTTTCTGAAA ACCCTGTTAC TGTTGATGAT GCTACTATGA TCGCTACTAG CTTCCCAGAG 2340
TTCATGGATT TGATGGCTGG TCTTGGAGCT AAGATCGAAC TCTCCGACAC TAAGGCTGCT 2400
TGATGAGCTC AAGAATTCGA GCTCGGTACC GGATCCTCTA GCTAGAGCTT TCGTTCGTAT 2460
CATCGGTTTC GACAACGTTC GTCAAGTTCA ATGCATCAGT TTCATTGCGC ACACACCAGA 2520
ATCCTACTGA GTTCGAGTAT TATGGCATTG GGAAAACTGT TTTTCTTGTA CCATTTGTTG 2580
TGCTTGTAAT TTACTGTGTT TTTTATTCGG TTTTCGCTAT CGAACTGTGA AATGGAAATG 2640
GATGGAGAAG AGTTAATGAA TGATATGGTC CTTTTGTTCA TTCTCAAATT AATATTATTT 2700
GTTTTTTCTC TTATTTGTTG TGTGTTGAAT TTGAAATTAT AAGAGATATG CAAACATTTT 2760
GTTTTGAGTA AAAATGTGTC AAATCGTGGC CTCTAATGAC CGAAGTTAAT ATGAGGAGTA 2820
AAACACTTGT AGTTGTACCA TTATGCTTAT TCACTAGGCA ACAAATATAT TTTCAGACCT 2880
AGAAAAGCTG CAAATGTTAC TGAATACAAG TATGTCCTCT TGTGTTTTAG ACATTTATGA 2940
ACTTTCCTTT ATGTAATTTT CCAGAATCCT TGTCAGATTC TAATCATTGC TTTATAATTA 3000
TAGTTATACT CATGGATTTG TAGTTGAGTA TGAAAATATT TTTTAATGCA TTTTATGACT 3060
TGCCAATTGA TTGACAACAT GCATCAATCG ACCTGCAGCC ACTCGAAGCG GCCGCGTTCA 3120
AGCTTCTGCA GGTCCGATGT GAGACTTTTC AACAAAGGGT AATATCCGGA AACCTCTTCG 3180
GATTCCATTG CCCAGCTATC TGTCACTTTA TTGTGAAGAT AGTGGAAAAG GAAGGTGGCT 3240
CCTACAAATG CCATCATTGC GATAAAGGAA AGGCCATCGT TGAAGATGCC TCTGCCGACA 3300
GTGGTCCCAA AGATGGACCC CCACCCACGA GGAGCATCGT GGAAAAAGAA GACGTTCCAA 3360
CCACGTCTTC AAAGCAAGTG GATTGATGTG ATGGTCCGAT GTGAGACTTT TCAACAAAGG 3420
GTAATATCCG GAAACCTCCT CGGATTCCAT TGCDCAGCTA TCTGTCACTT TATTGTGAAG 3480
ATAGTGGAAA AGGAAGGTGG CTCCTACAAA TGCCATCATT GCGATAAAGG AAAGGCCATC 3540
GTTGAAGATG CCTCTGCCGA CAGTGGTCCC AAAGATGGAC CCCCACCCAC GAGGAGCATC 3600
GTGGAAAAAG AAGACGTTCC AACCACGTCT TCAAAGCAAG TGGATTGATG TGATATCTCC 3660
ACTGACGTAA GGGATGACGC ACAATCCCAC TATCCTTCGC AAGACCCTTC CTCTATATAA 3720
GGAAGTTCAT TTCATTTGGA GAGGACACGC TGACAAGCTG ACTCTAGCAG ATCTCCATGG 3780
TCCGTCCTGT AGAAACCCCA ACCCGTGAAA TCAAAAAACT CGACGGCCTG TGGGCATTCA 3840
GTCTGGATCG CGAAAACTGT GGAATTGATC AGCGTTGGTG GGAAAGCGCG TTACAAGAAA 3900
GCCGGGCAAT TGCTGTGCCA GGCAGTTTTA ACGATCAGTT CGCCGATGCA GATATTCGTA 3960
ATTATGCGGG CAACGTCTGG TATCAGCGCC AAGTCTTTAT ACCGAAAGGT TGGGCAGGCC 4020
AGCGTATCGT GCTGCGTTTC GATGCGGTCA CTCATTACGG CAAAGTGTGG GTCAATAATC 4080
AGGAAGTGAT GGAGCATCAG GGCGGCTATA CGCCATTTGA AGCCGATGTC ACGCCGTATG 4140
TTATTGCCGG GAAAAGTGTA CGTATCACCG TTTGTGTGAA CAACGAACTG AACTGGCAGA 4200
CTATCCCGCC GGGAATGGTG ATTACCGACG AAAACGGCAA GAAAAAGCAG TCTTACTTCC 4260
ATGATTTCTT TAACTATGCC GGAATCCATC GCAGCGTAAT GCTCTACACC ACGCCGAACA 4320
CCTGGGTGGA CGATATCACC GGTTGTACGC ATGTCGCGCA AGACTGTAAC CACGCGTCTG 4380
TTGACTGGCA GGTGGTGGCC AATGGTGATG TCAGCGTTGA ACTGCGTGAT GCGGATCAAC 4440
AGGTGGTTGC AACTGGACAA GGCACTAGCG GGACTTTGCA AGTGGTGAAT CCGCACCTCT 4500
GGCAACCGGG TGAAGGTTAT CTCTATGAAC TGTGCGTCAC AGCCAAAAGC CAGACAGAGT 4560
GTGATATCTA CCCGCTTCGC GTCGGCATCC GGTCAGTGGC AGTGAAGGGC GAACAGTTCC 4620
TGATTAACCA CAAACCGTTC TACTTTACTG GCTTTGGTCG TCATGAAGAT GCGGACTTAC 4680
GTGGCAAAGG ATTCGATAAC GTGCTGATGG TGCACGACCA CGCATTAATG GACTGGATTG 4740
GGGCCAACTC CTACCGTACC TCGCATTACC CTTACGCTGA AGAGATGCTC GACTGGGCAG 4800
ATGAACATGG CATCGTGGTG ATTGATGAAA CTGCTGCTGT CGGCTTTAAC CTCTCTTTAG 4860
GCATTGGTTT CGAAGCGGGC AACAAGCCGA AAGAACTGTA CAGCGAAGAG GCAGTCAACG 4920
GGGAAACTCA GCAAGCGCAC TTACAGGCGA TTAAAGAGCT GATAGCGCGT GACAAAAACC 4980
ACCCAAGCGT GGTGATGTGG AGTATTGCCA ACGAACCGGA TACCCGTCCT GCACGGGAAT 5040
ATTTCGGCAT TTCGCCACTG GCGGAAGCAA CGCGTAAACT CGACCCGACG CGTCCGATCA 5100
CCTGCGTCAA TGTAATGTTC TGCGACGCTC ACACCGATAC CATCAGCGAT CTCTTTGATG 5160
TGCTGTGCCT GAACCGTTAT TACGGATGGT ATGTCCAAAG CGGCGATTTG GAAACGGCAG 5220
AGAAGGTACT GGAAAAAGAA CTTCTGGCCT GGCAGGAGAA ACTGCATCAG CCGATTATCA 5280
TCACCGAATA CGGCGTGGAT ACGTTAGCCG GGCTGCACTC AATGTACACC GACATGTGGA 5340
GTGAAGAGTA TCAGTGTGCA TGGCTGGATA TGTATCACCG CGTCTTTGAT CGCGTCAGCG 5400
CCGTCGTCGG TGAACAGGTA TGGAATTTCG CCGATTTTGC GACCTCGCAA GGCATATTGC 5460
GCGTTGGCGG TAACAAGAAA GGGATCTTCA CTCGCGACCG CAAACCGAAG TCGGCGGCTT 5520
TTCTGCTGCA AAAACGCTGG ACTGGCATGA ACTTCGGTGA AAAACCGCAG CAGGGAGGCA 5580
AACAATGAAT CAACAACTCT CCTGGCGCAC CATCGTCGGC TACAGCCTCG GTGGGGAATT 5640
CGAGCTCGCC CGGGGATCCT CTAGCTAGAG CTTTCGTTCG TATCATCGGT TTCGACAACG 5700
TTCGTCAAGT TCAATGCATC AGTTTCATTG CGCACACACC AGAATCCTAC TGAGTTCGAG 5760
TATTATGGCA TTGGGAAAAC TGTTTTTCTT GTACCATTTG TTGTGCTTGT AATTTACTGT 5820
GTTTTTTATT CGGTTTTCGC TATCGAACTG TGAAATGGAA ATGGATGGAG AAGAGTTAAT 5880
GAATGATATG GTCCTTTTGT TCATTCTCAA ATTAATATTA TTTGTTTTTT CTCTTATTTG 5940
TTGTGTGTTG AATTTGAAAT TATAAGAGAT ATGCAAACAT TTTGTTTTGA GTAAAAATGT 6000
GTCAAATCGT GGCCTCTAAT GACCGAAGTT AATATGAGGA GTAAAACACT TGTAGTTGTA 6060
CCATTATGCT TATTCACTAG GCAACAAATA TATTTTCAGA CCTAGAAAAG CTGCAAATGT 6120
TACTGAATAC AAGTATGTCC TCTTGTGTTT TAGACATTTA TGAACTTTCC TTTATGTAAT 6180
TTTCCAGAAT CCTTGTCAGA TTCTAATCAT TGCTTTATAA TTATAGTTAT ACTCATGGAT 6240
TTGTAGTTGA GTATGAAAAT ATTTTTTAAT GCATTTTATG ACTTGCCAAT TGATTGACAA 6300
CATGCATCAA TCGACCTGCA GCCCAAGCTT GAGCTCAGGA TTTAGCAGCA TTCCAGATTG 6360
GGTTCAATCA ACAAGGTACG AGCCATATCA CTTTATTCAA ATTGGTATCG CCAAAACCAA 6420
GAAGGAACTC CCATCCTCAA AGGTTTGTAA GGAAGAATTC TCAGTCCAAA GCCTCAACAA 6480
GGTCAGGGTA CAGAGTCTCC AAACCATTAG CCAAAAGCTA CAGGAGATCA ATGAAGAATC 6540
TTCAATCAAA GTAAACTACT GTTCCAGCAC ATGCATCATG GTCAGTAAGT TTCAGAAAAA 6600
GACATCCACC GAAGACTTAA AGTTAGTGGG CATCTTTGAA AGTAATCTTG TCAACATCGA 6660
GCAGCTGGCT TGTGGGGACC AGACAAAAAA GGAATGGTGC AGAATTGTTA GGCGCACCTA 6720
CCAAAAGCAT CTTTGCCTTT ATTGCAAAGA TAAAGCAGAT TCCTCTAGTA CAAGTGGGGA 6780
ACAAAATAAC GTGGAAAAGA GCTGTCCTGA CAGCCCACTC ACTAATGCGT ATGACGAACG 6840
CAGTGACGAC CACAAAAGAA TTCCCTCTAT ATAAGAAGGC ATTCATTCCC ATTTGAAGGA 6900
TCATCAGATA CTGAACCAAT CCTTCTAGAA GATCTCCACA ATGGCTTCCT CTATGCTCTC 6960
TTCCGCTACT ATGGTTGCCT CTCCGGCTCA GGCCACTATG GTCGCTCCTT TCAACGGACT 7020
TAAGTCCTCC GCTGCCTTCC CAGCCACCCG CAAGGCTAAC AACGACATTA CTTCCATCAC 7080
AAGCAACGGC GGAAGAGTTA ACTGCATGCA GGTGTGGCCT CCGATTGGAA AGAAGAAGTT 7140
TGAGACTCTC TCTTACCTTC CTGACCTTAC CGATTCCGGT GGTCGCGTCA ACTGCATGCA 7200
GGCCATGGCT GAGAACCACA AGAAGGTTGG TATCGCTGGA GCTGGAATCG TTGGTGTTTG 7260
CACTGCTTTG ATGCTTCAAC GTCGTGGATT CAAGGTTACC TTGATTGATC CAAACCCACC 7320
AGGTGAAGGT GCTTCTTTCG GTAACGCTGG TTGCTTCAAC GGTTCCTCCG TTGTTCCAAT 7380
GTCCATGCCA GGAAACTTGA CTAGCGTTCC AAAGTGGCTT CTTGACCCAA TGGGTCCATT 7440
GTCCATCCGT TTCAGCTACT TTCCAACCAT CATGCCTTGG TTGATTCGTT TCTTGCTTGC 7500
TGGAAGACCA AACAAGGTGA AGGAGCAAGC TAAGGCACTC CGTAACCTCA TCAAGTCCAC 7560
TGTGCCTTTG ATCAAGTCCT TGGCTGAGGA GGCTGATGCT AGCCACCTTA TCCGTCACGA 7620
AGGTCACCTT ACCGTGTACC GTGGAGAAGC AGACTTCGCC AAGGACCGTG GAGGTTGGGA 7680
ACTTCGTCGT CTCAACGGTG TTCGTACTCA AATCCTCAGC GCTGATGCAT TGCGTGATTT 7740
CGATCCTAAC TTGTCTCACG CCTTTACCAA GGGAATCCTT ATCGAAGAGA ACGGTCACAC 7800
CATCAACCCA CAAGGTCTCG TGACTCTCTT GTTTCGTCGT TTCATCGCTA ACGGTGGAGA 7860
GTTCGTGTCT GCTCGTGTTA TCGGATTCGA GACTGAAGGT CGTGCTCTCA AGGGTATCAC 7920
CACCACCAAC GGTGTTCTTG CTGTTGATGC AGCTGTTGTT GCAGCTGGTG CACACTCCAA 7980
GTCTCTTGCT AACTCCCTTG GTGATGACAT CCCATTGGAT ACCGAACGTG GATACCACAT 8040
CGTGATCGCC AACCCAGAAG CTGCTCCACG TATTCCAACT ACCGATGCTT CTGGAAAGTT 8100
CCGGTCCAAA TTTGTTTACA TTGTGTCCAA ATTTCGGCTG ATTTGGACTT CCCTAGCTAT 8160
GCCAACTAAG CTAATAAAAA ACATGAAACA ACAATTACAA ACTGTCGAGC ACACCTTCTA 8220
CAAACTAGCT TAGATTTCTA TTGGAAGTTA CAAAACAGTA AAACTACCAA TAGGATACTA 8280
AATTAAACAT ATTAAACTAT TACTCCTCAA AAGCTTGTAC AATTTGCAGA AGAAATGATG 8340
GTTGCCCAAA AGCTTCAAAG GGAACCTGCT GGGAAGCCTG CTGGGACGCT GGGGATGCTG 8400
GCAGCAGCAT ACCTTGGCTT GAAGTACTCT TCTCTCATTG GTTTTGCTTC CCTTGCCCAT 8460
GTGGTCTTCA TATGGCCTCA TTACTTCCCA AGGGCTTCAA ATCAGTAGGT GGTGGCAACC 8520
AAAAGCATCA AAAACATCTC CTAAAACTAG CTTATACAAC CGGATTACAT GAGCTTATAC 8580
TAGCTTAACT CTTAAAGCAT GATTAACATA ATGATGTTTA AGGTGTCATT AAGTATTACT 8640
AATCTTGCTT AAGTAGAGAT TAACATAGGA TTAGCCTAAT CAAGTTGCTT AAGTAAGGTT 8700
TTAGAATAAA CCGAGCTAGT TAGGCTTAAG TAGAGATTAA CATAGGATTA GCCTAATCAA 8760
GTTGCTTAAG TAAGGTTTTA GAATAAACCG AGCTAGTT 8798
(2)关于SEQ ID NO:5的信息:
(i)序列特征
(A)长度:8418个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:3:
AAGCTTGAGC TCAGGATTTA GCAGCATTCC AGATTGGGTT CAATCAACAA GGTACGAGCC 60
ATATCACTTT ATTCAAATTG GTATCGCCAA AACCAAGAAG GAACTCCCAT CCTCAAAGGT 120
TTGTAAGGAA GAATTCTCAG TCCAAAGCCT CAACAAGGTC AGGGTACAGA GTCTCCAAAC 180
CATTAGCCAA AAGCTACAGG AGATCAATGA AGAATCTTCA ATCAAAGTAA ACTACTGTTC 240
CAGCACATGC ATCATGGTCA GTAAGTTTCA GAAAAAGACA TCCACCGAAG ACTTAAAGTT 300
AGTGGGCATC TTTGAAAGTA ATCTTGTCAA CATCGAGCAG CTGGCTTGTG GGGACCAGAC 360
AAAAAAGGAA TGGTGCAGAA TTGTTAGGCG CACCTACCAA AAGCATCTTT GCCTTTATTG 420
CAAAGATAAA GCAGATTCCT CTAGTACAAG TGGGGAACAA AATAACGTGG AAAAGAGCTG 480
TCCTGACAGC CCACTCACTA ATGCGTATGA CGAACGCAGT GACGACCACA AAAGAATTCC 540
CTCTATATAA GAAGGCATTC ATTCCCATTT GAAGGATCAT CAGATACTGA ACCAATCCTT 600
CTAGAAGATC TAAGCTTATC GATAAGCTTG ATGTAATTGG AGGAAGATCA AAATTTTCAA 660
TCCCCATTCT TCGATTGCTT CAATTGAAGT TTCTCCGATG GCGCAAGTTA GCAGAATCTG 720
CAATGGTGTG CAGAACCCAT CTCTTATCTC CAATCTCTCG AAATCCAGTC AACGCAAATC 780
TCCCTTATCG GTTTCTCTGA AGACGCAGCA GCATCCACGA GCTTATCCGA TTTCGTCGTC 840
GTGGGGATTG AAGAAGAGTG GGATGACGTT AATTGGCTCT GAGCTTCGTC CTCTTAAGGT 900
CATGTCTTCT GTTTCCACGG CGTGCATGCT TCACGGTGCA AGCAGCCGTC CAGCAACTGC 960
TCGTAAGTCC TCTGGTCTTT CTGGAACCGT CCGTATTCCA GGTGACAAGT CTATCTCCCA 1020
CAGGTCCTTC ATGTTTGGAG GTCTCGCTAG CGGTGAAACT CGTATCACCG GTCTTTTGGA 1080
AGGTGAAGAT GTTATCAACA CTGGTAAGGC TATGCAAGCT ATGGGTGCCA GAATCCGTAA 1140
GGAAGGTGAT ACTTGGATCA TTGATGGTGT TGGTAACGGT GGACTCCTTG CTCCTGAGGC 1200
TCCTCTCGAT TTCGGTAACG CTGCAACTGG TTGCCGTTTG ACTATGGGTC TTGTTGGTGT 1260
TTACGATTTC GATAGCACTT TCATTGGTGA CGCTTCTCTC ACTAAGCGTC CAATGGGTCG 1320
TGTGTTGAAC CCACTTCGCG AAATGGGTGT GCAGGTGAAG TCTGAAGACG GTGATCGTCT 1380
TCCAGTTACC TTGCGTGGAC CAAAGACTCC AACGCCAATC ACCTACAGGG TACCTATGGC 1440
TTCCGCTCAA GTGAAGTCCG CTGTTCTGCT TGCTGGTCTC AACACCCCAG GTATCACCAC 1500
TGTTATCGAG CCAATCATGA CTCGTGACCA CACTGAAAAG ATGCTTCAAG GTTTTGGTGC 1560
TAACCTTACC GTTGAGACTG ATGCTGACGG TGTGCGTACC ATCCGTCTTG AAGGTCGTGG 1620
TAAGCTCACC GGTCAAGTGA TTGATGTTCC AGGTGATCCA TCCTCTACTG CTTTCCCATT 1680
GGTTGCTGCC TTGCTTGTTC CAGGTTCCGA CGTCACCATC CTTAACGTTT TGATGAACCC 1740
AACCCGTACT GGTCTCATCT TGACTCTGCA GGAAATGGGT GCCGACATCG AAGTGATCAA 1800
CCCACGTCTT GCTGGTGGAG AAGACGTGGC TGACTTGCGT GTTCGTTCTT CTACTTTGAA 1860
GGGTGTTACT GTTCCAGAAG ACCGTGCTCC TTCTATGATC GACGAGTATC CAATTCTCGC 1920
TGTTGCAGCT GCATTCGCTG AAGGTGCTAC CGTTATGAAC GGTTTGGAAG AACTCCGTGT 1980
TAAGGAAAGC GACCGTCTTT CTGCTGTCGC AAACGGTCTC AAGCTCAACG GTGTTGATTG 2040
CGATGAAGGT GAGACTTCTC TCGTCGTGCG TGGTCGTCCT GACGGTAAGG GTCTCGGTAA 2100
CGCTTCTGGA GCAGCTGTCG CTACCCACCT CGATCACCGT ATCGCTATGA GCTTCCTCGT 2160
TATGGGTCTC GTTTCTGAAA ACCCTGTTAC TGTTGATGAT GCTACTATGA TCGCTACTAG 2220
CTTCCCAGAG TTCATGGATT TGATGGCTGG TCTTGGAGCT AAGATCGAAC TCTCCGACAC 2280
TAAGGCTGCT TGATGAGCTC AAGAATTCGA GCTCGGTACC GGATCCTCTA GCTAGAGCTT 2340
TCGTTCGTAT CATCGGTTTC GACAACGTTC GTCAAGTTCA ATGCATCAGT TTCATTGCGC 2400
ACACACCAGA ATCCTACTGA GTTCGAGTAT TATGGCATTG GGAAAACTGT TTTTCTTGTA 2460
CCATTTGTTG TGCTTGTAAT TTACTGTGTT TTTTATTCGG TTTTCGCTAT CGAACTGTGA 2520
AATGGAAATG GATGGAGAAG AGTTAATGAA TGATATGGTC CTTTTGTTCA TTCTCAAATT 2580
AATATTATTT GTTTTTTCTC TTATTTGTTG TGTGTTGAAT TTGAAATTAT AAGAGATATG 2640
CAAACATTTT GTTTTGAGTA AAAATGTGTC AAATCGTGGC CTCTAATGAC CGAAGTTAAT 2700
ATGAGGAGTA AAACACTTGT AGTTGTACCA TTATGCTTAT TCACTAGGCA ACAAATATAT 2760
TTTCAGACCT AGAAAAGCTG CAAATGTTAC TGAATACAAG TATGTCCTCT TGTGTTTTAG 2820
ACATTTATGA ACTTTCCTTT ATGTAATTTT CCAGAATCCT TGTCAGATTC TAATCATTGC 2880
TTTATAATTA TAGTTATACT CATGGATTTC TAGTTGAGTA TGAAAATATT TTTTAATGCA 2940
TTTTATGACT TGCCAATTGA TTGACAACAT GCATCAATCG ACCTGCAGCC ACTCGAAGCG 3000
GCCGCGTTCA AGCTTCTGCA GGTCCGATGT GAGACTTTTC AACAAAGGGT AATATCCGGA 3060
AACCTCCTCG GATTCCATTG CCCAGCTATC TGTCACTTTA TTGTGAAGAT AGTGGAAAAG 3120
GAAGGTGGCT CCTACAAATG CCATCATTGC GATAAAGGAA AGGCCATCGT TGAAGATGCC 3180
TCTGCCGACA GTGGTCCCAA AGATGGACCC CCACCCACGA GGAGCATCGT GGAAAAAGAA 3240
GACGTTCCAA CCACGTCTTC AAAGCAAGTG GATTGATGTG ATGGTCCGAT GTGAGACTTT 3300
TCAACAAAGG GTAATATCCG GAAACCTCCT CGGATTCCAT TGCCCAGCTA TCTGTCACTT 3360
TATTGTGAAG ATAGTGGAAA AGGAAGGTGG CTCCTACAAA TGCCATCATT GCGATAAAGG 3420
AAAGGCCATC GTTGAAGATG CCTCTGCCGA CAGTGGTCCC AAAGATGGAC CCCCACCCAC 3480
GAGGAGCATC GTGGAAAAAG AAGACGTTCC AACCACGTCT TCAAAGCAAG TGGATTGATG 3540
TGATATCTCC ACTGACGTAA GGGATGACGC ACAATCCCAC TATCCTTCGC AAGACCCTTC 3600
CTCTATATAA GGAAGTTCAT TTCATTTGGA GAGGACACGC TGACAAGCTG ACTCTAGCAG 3660
ATCTCCATGG TCCGTCCTGT AGAAACCCCA ACCCGTGAAA TCAAAAAACT CGACGGCCTG 3720
TGGGCATTCA GTCTGGATCG CGAAAACTGT GGAATTGATC AGCGTTGGTG GGAAAGCGCG 3780
TTACAAGAAA GCCGGGCAAT TGCTGTGCCA GGCAGTTTTA ACGATCAGTT CGCCGATGCA 3840
GATATTCGTA ATTATGCGGG CAACGTCTGG TATCAGCGCG AAGTCTTTAT ACCGAAAGGT 3900
TGGGCAGGCC AGCGTATCGT GCTGCGTTTC GATGCGGTCA CTCATTACGG CAAAGTGTGG 3960
GTCAATAATC AGGAAGTGAT GGAGCATCAG GGCGGCTATA CGCCATTTGA AGCCGATGTC 4020
ACGCCGTATG TTATTGCCGG GAAAAGTGTA CGTATCACCG TTTGTGTGAA CAACGAACTG 4080
AACTGGCAGA CTATCCCGCC GGGAATGGTG ATTACCGACG AAAACGGCAA GAAAAAGCAG 4140
TCTTACTTCC ATGATTTCTT TAACTATGCC GGAATCCATC GCAGCGTAAT GCTCTACACC 4200
ACGCCGAACA CCTGGGTGGA CGATATCACC GTGGTGACGC ATGTCGCGCA AGACTGTAAC 4260
CACGCGTCTG TTGACTGGCA GGTGGTGGCC AATGGTGATG TCAGCGTTGA ACTGCGTGAT 4320
GCGGATCAAC AGGTGGTTGC AACTGGACAA GGCACTAGCG GGACTTTGCA AGTGGTGAAT 4380
CCGCACCTCT GGCAACCGGG TGAAGGTTAT CTCTATGAAC TGTGCGTCAC AGCCAAAAGC 4440
CAGACAGAGT GTGATATCTA CCCGCTTCGC GTCGGCATCC GGTCAGTGGC AGTGAAGGGC 4500
GAACAGTTCC TGATTAACCA CAAACCGTTC TACTTTACTG GCTTTGGTCG TCATGAAGAT 4560
GCGGACTTAC GTGGCAAAGG ATTCGATAAC GTGCTGATGG TGCACGACCA CGCATTAATG 4620
GACTGGATTG GGGCCAACTC CTACCGTACC TCGCATTACC CTTACGCTGA AGAGATGCTC 4680
GACTGGGCAG ATGAACATGG CATCGTGGTG ATTGATGAAA CTGCTGCTGT CGGCTTTAAC 4740
CTCTCTTTAG GCATTGGTTT CGAAGCGGGC AACAAGCCGA AAGAACTGTA CAGCGAAGAG 4800
GCAGTCAACG GGGAAACTCA GCAAGCGCAC TTACAGGCGA TTAAAGAGCT GATAGCGCGT 4860
GACAAAAACC ACCCAAGCGT GGTGATGTGG AGTATTGCCA ACGAACCGGA TACCCGTCCT 4920
GCACGGGAAT ATTTCGGCAT TTCGCCACTG GCGGAAGCAA CGCGTAAACT CGACCCGACG 4980
CGTCCGATCA CCTGCGTCAA TGTAATGTTC TGCGACGCTC ACACCGATAC CATCAGCGAT 5040
CGTCTTGATG TGCTGTGCCT CAACCGTTAT TACGGATGGT ATGTCCAAAG CGGCGATTTG 5100
GAAACGGCAG AGAAGGTACT GGAAAAAGAA CTTCTGGCCT GGCAGGAGAA ACTGCATCAG 5160
CCGATTATCA TCACCGAATA CGGCGTGGAT ACGTTAGCCG GGCTGCACTC AATGTACACC 5220
GACATGTGGA GTGAAGAGTA TCAGTGTGCA TGGCTGGATA TGTATCACCG CGTCTTTGAT 5280
CGCGTCAGCG CCGTCGTCGG TGAACAGGTA TGGAATTTCG CCGATTTTGC GACCTCGCAA 5340
GGCATATTGC GCGTTGGCGG TAACAAGAAA GGGATCTTCA CTCGCGACCG CAAACCGAAG 5400
TCGGCGGCTT TTCTGCTGCA AAAACGCTGG ACTGGCATGA ACTTCGGTGA AAAACCGCAG 5460
CAGGGAGGCA AACAATGAAT CAACAACTCT CCTGGCGCAC CATCGTCGGC TACAGCCTCG 5520
GTGGGGAATT CGAGCTCGCC CGGGGATCCT CTAGCTAGAG CTTTCGTTCG TATCATCGGT 5580
TTCGACAACG TTCGTCAAGT TCAATGCATC AGTTTCATTG CGCACACACC AGAATCCTAC 5640
TGAGTTCGAG TATTATGGCA TTGGGAAAAC TGTTTTTCTT GTACCATTTG TTGTGCTTGT 5700
AATTTACTGT GTTTTTTATT CGGTTTTCGC TATCGAACTG TGAAATGGAA ATGGATGGAG 5760
AAGAGTTAAT GAATGATATG GTCCTTTTGT TCATTCTCAA ATTAATATTA TTTGTTTTTT 5820
CTCTTATTTG TTGTGTGTTG AATTTGAAAT TATAAGAGAT ATGCAAACAT TTTGTTTTGA 5880
GTAAAAATGT GTCAAATCGT GGCCTCTAAT GACCGAAGTT AATATGAGGA GTAAAACACT 5940
TGTAGTTGTA CCTAAATGCT TATTCACTAG GCAACAAATA TATTTTCAGA CCTAGAAAAG 6000
CTGCAAATGT TACTGAATAC AAGTATGTCC TCTTGTGTTT TAGACATTTA TGAACTTTCC 6060
TTTATGTAAT TTTCCAGAAT CCTTGTCAGA TTCTAATCAT TGCTTTATAA TTATAGTTAT 6120
ACTCATGGAT TTGTAGTTGA GTATGAAAAT ATTTTTTAAT GCATTTTATG ACTTGCCAAT 6180
TGATTGACAA CATGCATCAA TCGACCTGCA GCCCAAGCTT GAGCTCAGGA TTTAGCAGCA 6240
TTCCAGATTG GGTTCAATCA ACAAGGTACG AGCCATATCA CTTTATTCAA ATTGGTATCG 6300
CCAAAACCAA GAAGGAACTC CCATCCTCAA AGGTTTGTAA GGAAGAATTC TCAGTCCAAA 6360
GCCTCAACAA GGTCAGGGTA CAGAGTCTCC AAACCATTAG CCAAAAGCTA CAGGAGATCA 6420
ATGAAGAATC TTCAATCAAA GTAAACTACT GTTCCAGCAC ATGCATCATG GTCAGTAAGT 6480
TTCAGAAAAA GACATCCACC GAAGACTTAA AGTTAGTGGG CATCTTTGAA AGTAATCTTG 6540
TCAACATCGA GCAGCTGGCT TGTGGGGACC AGACAAAAAA GGAATGGTGC AGAATTGTTA 6600
GGCGCACCTA CCAAAAGCAT CTTTGCCTTT ATTGCAAAGA TAAAGCAGAT TCCTCTAGTA 6660
CAAGTGGGGA ACAAAATAAC GTGGAAAAGA GCTGTCCTGA CAGCCCACTC ACTAATGCGT 6720
ATGACGAACG CAGTGACGAC CACAAAAGAA TTCCCTCTAT ATAAGAAGGC ATTCATTCCC 6780
ATTTGAAGGA TCATCAGATA CTGAACCAAT CCTTCTAGAA GATCTCCACA ATGGCTTCCT 6840
CTATGCTCTC TTCCGCTACT ATGGTTGCCT CTCCGGCTCA GGCCACTATG GTCGCTCCTT 6900
TCAACGGACT TAAGTCCTCC GCTGCCTTCC CAGCCACCCG CAAGGCTAAC AACGACATTA 6960
CTTCCATCAC AAGCAACGGC GGAAGAGTTA ACTGCATGCA GGTGTGGCCT CCGATTGGAA 7020
AGAAGAAGTT TGAGACTCTC TCTTACCTTC CTGACCTTAC CGATTCCGGT GGTCGCGTCA 7080
ACTGCATGCA GGCCATGGCT GAGAACCACA AGAAGGTTGG TATCGCTGGA GCTGGAATCG 7140
TTGGTGTTTG CACTGCTTTG ATGCTTCAAC GTCGTGGATT CAAGGTTACC TTGATTGATC 7200
CAAACCCACC AGGTGAAGGT GCTTCTTTCG GTAACGCTGG TTGCTTCAAC GGTTCCTCCG 7260
TTGTTCCAAT GTCCATGCCA GGAAACTTGA CTAGCGTTCC AAAGTGGCTT CTTGACCCAA 7320
TGGGTCCATT GTCCATCCGT TTCAGCTACT TTCCAACCAT CATGCCTTGG TTGATTCGTT 7380
TCTTGCTTGC TGGAAGACCA AACAAGGTGA AGGAGCAAGC TAAGGCACTC CGTAACCTCA 7440
TCAAGTCCAC TGTGCCTTTG ATCAAGTCCT TGGCTGAGGA GGCTGATGCT AGCCACCTTA 7500
TCCGTCACGA AGGTCACCTT ACCGTGTACC GTGGAGAAGC AGACTTCGCC AAGGACCGTG 7560
GAGGTTGGGA ACTTCGTCGT CTCAACGGTG TTCGTACTCA AATCCTCAGC GCTGATGCAT 7620
TGCGTGATTT CGATCCTAAC TTGTCTCACG CCTTTACCAA GGGAATCCTT ATCGAAGAGA 7680
ACGGTCACAC CATCAACCCA CAAGGTCTCG TGACTCTCTT GTTTCGTCGT TTCATCGCTA 7740
ACGGTGGAGA GTTCGTGTCT GCTCGTGTTA TCGGATTCGA GACTGAAGGT CGTGCTCTCA 7800
AGGGTATCAC CACCACCAAC GGTGTTCTTG CTGTTGATGC AGCTGTTGTT GCAGCTGGTG 7860
CACACTCCAA GTCTCTTGCT AACTCCCTTG GTGATGACAT CCCATTGGAT ACCGAACGTG 7920
GATACCACAT CGTGATCGCC AACCCAGAAG CTGCTCCACG TATTCCAACT ACCGATGCTT 7980
CTGGAAAGTT CATCGCTACT CCTATGGAGA TGGGTCTTCG TGTTGCTGGA ACCGTTGAGT 8040
TCGCTGGTCT CACTGCTGCT CCTAACTGGA AGCGTGCTCA CGTTCTCTAC ACTCACGCTC 8100
GTAAGTTGCT TCCAGCTCTC GCTCCTGCCA GTTCTGAAGA ACGTTACTCC AAGTGGATGG 8160
GTTTCCGTCC AAGCATCCCA GATTCCCTTC CAGTGATTGG TCGTGCTACC CGTACTCCAG 8220
ACGTTATCTA CGCTTTCGGT CACGGTCACC TCGGTATGAC TGGTGCTCCA ATGACCGCAA 8280
CCCTCGTTTC TGAGCTCCTC GCAGGTGAGA AGACCTCTAT CGACATCTCT CCATTCGCAC 8340
CAAACCGTTT CGGTATTGGT AAGTCCAAGC AAACTGGTCC TGCATCCTAA GTGGGAATTC 8400
GAGCTCGGTA CCGGATCC 8418
(2)关于SEQ ID NO:6的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:6:
CACCGGTCTT TTGGAAGGTG AAG 23
(2)关于SEQ ID NO:7的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:7:
AACGAGACCC ATAACGAGGA AGC 23
(2)关于SEQ ID NO:8的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:8:
AAACAGTCCC GTGCATCCCC AAC 23
(2)关于SEQ ID NO:9的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:9:
GACGCCTCC TTGATTCTGT CCC 23
(2)关于SEQ ID NO:10的信息:
(i)序列特征
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:10:
CAAGAAGGTT GGTATCGCTG
20
(2)关于SEQ ID NO:11的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:11:
TCTTTTGTGG TCGTCACTGC GTT
23
(2)关于SEQ ID NO:12的信息:
(i)序列特征
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:12:
GCGAGCTCTA ATACGACTCA CTAT
24
(2)关于SEQ ID NO:13的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:13:
CGCGAGCTCA ATTAACCCTC ACT 23
(2)关于SEQ ID NO:14的信息:
(i)序列特征
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:14:
TCTGTACCCT GACCTTGTTG 20
(2)关于SEQ ID NO:15的信息:
(i)序列特征
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:15:
CGTGGATACC ACATCGTGAT 20
(2)关于SEQ ID NO:16的信息:
(i)序列特征
(A)长度:19个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:16:
ACCTTGGCTT GAAGTACTC 19
(2)关于SEQ ID NO:17的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:17:
TCAACCTACA GCTGATTTGG ACC 23
(2)关于SEQ ID NO:18的信息:
(i)序列特征
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:18:
GGACCGGAAC GACAATCTGATC 22
(2)关于SEQ ID NO:19的信息:
(i)序列特征
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:19:
CTAGGGAAGT CCAAATCAGC CG 22
(2)关于SEQ ID NO:20的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:20:
TTTGGACCGG AACTTTCCAG AAG 23
(2)关于SEQ ID NO:21的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:21:
CTAACTTGCG CCATCGGAGA AAC 23
(2)关于SEQ ID NO:22的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:22:
GACTTGTCAC CTGGAATACG GAC 23
(2)关于SEQ ID NO:23的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:23:
ATTCTTGAGC TCATCAAGCA GCC 23
(2)关于SEQ ID NO:24的信息:
(i)序列特征
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:24:
AAGGTGGTA TCGCTGGAGC TG 22
(2)关于SEQ ID NO:25的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:25:
TCTCCACAAT GGCTTCCTCT ATG 23
(2)关于SEQ ID NO:26的信息:
(i)序列特征
(A)长度:671个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述: SEQ ID NO:26:
CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CGGCTATGAC 60
TGGGCACAAC AGACAATCGG CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG 120
CGCCCGGTTC TTTTTGTCAA GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG 180
GCAGCGCGGC TATCGTGGCT GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 240
GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA GGATCTCCTG 300
TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG CTGATGCAAT GCGGCGGCTG 360
CATACGCTTG ATCCGGCTAC CTGCCCATTC GACCACCAAG CGAAACATCG CATCGAGCGA 420
GCACGTACTC GGATGGAAGC CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG 480
GGGCTCGCGC CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 540
CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA TGGCCGCTTT 600
TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC GCTATCAGGA CTTAGCGTTG 660
GCTACCCGTG A 671
(2)关于SEQ ID NO:27的信息:
(i)序列特征
(A)长度:739个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线形
(ii)分子类型:DNA(基因组)
(iii)假设:无
(iii)反义:无
(xi)序列描述:SEQ ID NO:27:
GGACCGGAAC GACAATCTGA TCCCCATCAA GCTTGAGCTC AGGATTTAGC AGCATTCCAG 60
ATTGGGTTCA ATCAACAAGG TACGAGCCAT ATCACTTTAT TCAAATTGGT ATCGCCAAAA 120
CCAAGAAGGA ACTCCCATCC TCAAAGGTTT GTAAGGAAGA ATTCTCAGTC CAAAGCCTCA 180
ACAAGGTCAG GGTACAGAGT CTCCAAACCA TTAGCCAAAA GCTACAGGAG ATCAATGAAG 240
AATCTTCAAT CAAAGTAAAC TACTGTTCCA GCACATGCAT CATGGTCAGT AAGTTTCAGA 300
AAAAGACATC CACCGAAGAC TTAAAGTTAG TGGGCATCTT TGAAAGTAAT CTTGTCAACA 360
TCGAGCAGCT GGCTTGTGGG GACCAGACAA AAAAGGAATG GTGCAGAATT GTTAGGCGCA 420
CCTACCAAAA GCATCTTTGC CTTTATTGCA AAGATAAAGC AGATTCCTCT AGTACAAGTG 480
GGGAACAAAA TAACGTGGAA AAGAGCTGTC CTGACAGCCC ACTCACTAAT GCGTATGACG 540
AACGCAGTGA CGACCACAAA AGAATTCCCT CTATATAAGA AGGCATTCAT TCCCATTTGA 600
AGGATCATCA GATACTGAAC CAATCCTTCT AGAAGATCTA AGCTTATCGA TAAGCTTGAT 660
GTAATTGGAG GAAGATCAAA ATTTTCAATC CCCATTCTTC GATTGCTTCA ATTGAAGTTT 720
CTCCGATGGC GCAAGTTAG 739