CN1148453C

CN1148453C - 草甘膦抗性转基因植物

Info

Publication number: CN1148453C
Application number: CNB988016362A
Authority: CN
Inventors: M��帥; M·曼纳洛弗; ̹��; P·P·坦宁; �Ҷ��; P·斯狄恩
Original assignee: Syngenta Participations AG
Current assignee: Syngenta Participations AG
Priority date: 1997-10-31
Filing date: 1998-10-29
Publication date: 2004-05-05
Anticipated expiration: 2018-10-29
Also published as: HUP0001729A2; JP2001503280A; CZ300208B6; GB2337263A8; EP0950109A1; WO1999023232A1; CA2279258A1; UA85364C2; HUP0001729A3; CN1242803A; RU2224024C2; DE19881833B4; SK88599A3; CZ235199A3; US6531649B1; TR199901515T1; SE9902189L; WO1999023232B1; PL197872B1; SE9902189D0

Abstract

本发明涉及转基因甜菜植株，该植株由于cp4/epsps酶活性的表达而对每公顷约4至约18升Roundup^的处理有耐受性。植物可以其特异整合位点为特征。本发明进一步涉及可从所述植株得到的种子和产生所述植株的方法。

Description

草甘膦抗性转基因植物

技术领域

本发明涉及能耐受用草甘膦作为活性成分的除草剂处理的转基因甜菜植株。

背景技术

甜菜田间的杂草是农场主的主要问题。它们与农作物竞争因此而降低产量。现在没有单一的除草剂能有效控制所有杂草而不损伤甜菜作物本身(Miller等，甜菜研究杂志，26：3-4，1989)。实际上，农场主使用除草剂的混合物，它们也降低农作物的生长。同时，已发展对所述除草剂抗性的野草种类的数目持续增加(Schweizer等，甜菜研究杂志，28：1-23，1991)，由此加重了甜菜田间杂草控制问题。

Roundup^是广谱的、环境上优选的抑制杂草和农作物种类的除草剂。本发明的内容中，1升除草剂Roundup^溶液含有260g其活性成分，即被叶吸收的草甘膦(常用名为N-膦酰基甲基-甘氨酸)。到目前为止，在20年使用期间没有发展出草甘膦抗性杂草(Holt等，植物生理学年鉴，1993)；另外在甜菜中没有发现对草甘膦的耐受性。而且Roundup^的预先使用在甜菜田间控制杂草方面比甜菜农业中常用的含有苯敌草、苯嗪草酮、甜菜呋的除草剂混合物更有效(Madsen等，杂草研究，35：105-111，1995)。

草甘膦通过不可逆地与5-烯醇丙酮酸莽草酸盐-3-磷酸合成酶(epsps)结合抑制芳香族氨基酸的生物合成。在叶绿体中，比酶催化莽草酸盐-3-磷酸和烯醇磷酸丙酮酸形成5-烯醇丙酮酸-3-磷酸和磷酸。在施用除草剂后约一周。可看到肉眼可见的效应，包括萎蔫、黄化后完全变褐、植物组织的萎凋和根的腐烂。

为赋予农作物种类草甘膦抗性，研究集中于向植物导入能增加草甘膦性epsps基因。除了植物，细胞和真菌也天然地表达epsps酶活性。发现来自农杆菌属种类的cp4/epsps赋予对草甘膦的抗性(Barry等，“氨基酸合成的抑制剂：赋予农作物植株对草甘膦抗性的策略：，于：植物中氨基酸的生物合成和分子调控，Singh等(编辑)，美国植物生理学学会，第139-145页，1992)。将cp4/epsps基因导入大豆和油籽油菜在田间条件产生对叶面施用除草剂的耐受性(Delannay等，农作物科学，35：1461-1467，1995；Padgette等，农作物科学，35：1451-1461，1995)。

从农杆菌属种类LBAA分离的草甘膦氧化还原酶(gox)(Barry等，同上)将草甘膦降解成氨甲基膦酸对植物无毒的化合物。cp4/epsps和草甘膦氧化酶(gox)基因的结合已成功地用于得到对草甘膦有抗性的转基因小麦(Zhou等，植物细胞报告，15：159-163，1995)。

发明内容

本发明的目的是提供对足以实现最佳除草剂活性的高剂量的草甘膦有耐受性的甜菜植株。这样的植株可以进一步通过与优良甜菜株系回交来改良以优化农业特性如产量、病原体抗性等。

甜菜可以用根瘤农杆菌介导转化来转化(Fry等，植物分子生物学第三次国际会议，Tuscon，Arizona，USA；D′Halluin等，生物/技术，10：309-314，1992；Konwar。植物生化&生物技术杂志，3：37-41，1994)。农杆菌介导的转化常常导致多于一个拷贝的T-DNA整合入植物基因组。优选地将要整合的基因导入T-DNA，使它位于T-DNA右边则不是左边界附近，它几乎总是会转移到植物中。

根据本发明所述的植株对每公顷大约3×6升除草剂Roundup^(每公顷约18升)的处理有耐受性。获得良好杂草控制的总标准剂量根据杂草压力在每公顷4-6升之间变动。在这些浓度时，除草剂处理不产生对植物活力和叶褪绿有任何可测到的影响。根据本发明所述的植株表现的耐受性由转基因表达的cp4/epsps酶活性赋予。本发明优选的实施方案已于1997年10月24日保存于国立工业和海洋微生物保藏有限公司(23 st Macher Drive，Aberdeen AB21RY，Scotland UK)，保藏号为NCIMB 40905。

因此本发明涉及表达cp4/epsps酶活性的甜菜植株及其后代。具体地，本发明涉及对每公顷约4至约8升Roundup^处理有耐受性的甜菜植株及其后代。

根据本发明所述的植株可以通过使用在T-DNA左和右边界序列间含有如SEQ ID No：5所述编码尤其是cp4/epsps的DNA片段的转化载体进行常规农杆菌介导的转化得到。

在本发明的范围内令人惊讶地发现，在转基因的基因组内缺失T-DNA左和右边界序列并导致转化载体DNA相当大部分的缺失而保留了编码cp4/epsps的DNA的转化结果(RRMax)提供了优良的草甘膦耐受性。特别是发现以SEQ ID No：1为特征的DNA片段整合入基因组高度重复的区域同时取代了该基因组重复序列的部分。与所用转化载体中与T-DNA右边界序列相连的转基因序列部分直接相邻的基因组DNA具有SEQ ID No：2中给出的序列。与整合的转基因DNA的另一末端直接相邻的基因组DNA具有SEQ ID No：3中给出的序列。新形成的基因组DNA排列的完整DNA序列在SEQ ID No：4中给出。

因此，本发明涉及甜菜植株及其后代，其中以SEQ ID No：1的核苷酸序列为特征的DNA形成植物基因组的部分，并且介所述的核苷酸序列取代了植物基因组内高度重复DNA序列。

此处优选的是其中与所述核苷酸序列直接连接的那些基因组部分分别以SEQ ID No：2和SEQ ID No：3的核苷酸序列为特征的甜菜植株及其后代。

进一步优选的是其中以SEQ ID No：4的核苷酸序列为特征的DNA形成植物基因组的部分的甜菜植株及其后代。

上述经操作已导入除草剂抗性的转基因种子和植株通过性繁殖或营养生长传代并因此可以在后代植株中保持和繁殖。通常所述的维持和繁殖使用已知的农业方法，这些方法发展来适应特别目的如耕种、插种或收获。正在生长的农作物易于受由昆虫或感染引起的侵袭和损伤，因此采取措施以控制植物病毒、昆虫、线虫和其它对提高产量不利的条件。这些措施包括机械措施如耕地或除去受侵染的植物和施用农业化学品如杀真菌剂、杀精剂、杀线虫剂、生长调节剂、成熟剂和杀昆虫剂。

根据本发明所述的转基因植物和种子的除草剂耐受性可进一步在植物育种中得到应用，以开发具有改良特性(如虫害、除草剂或逆境耐受性，改良的营养价值，提高的产量，引起更小的由于倒伏或断裂的损失的改良结构)的植物。各种育种步骤的特征在于成熟的人类干预如选择要杂交的株系、引导亲本株系的传粉或选择适当的后代植株。根据所需的特性采取不同的育种措施。相关技术在本领域内众所周知并且包括但不限于杂交、近交、回交育种、多线育种、品种掺合、种间杂交、非整倍体技术等。因此，根据本发明所述的转基因种子和植株可用于培育改良的植物株系，例如用于提高传统方法如除草剂或杀虫剂处理的效力或由于其修饰的遗传特性而允许用所述方法施用。选择性地，可以得到具有改良的逆境耐受性的新农作物，由于它们的优化遗传装备，产生比不能耐受相对不利发育条件的产品更高质量的收获产品。

在种子生产中，发芽质量和种子的均一性是必需的产品特征，而农场主收获和出售的种子的发芽质量和种子均一性并不重要。因为使农作物与其它农作物和杂草种子分开、控制种生疾病和生产具良好发芽率的种子是困难的，所以在培养、控制和销售纯种子领域有经验的种子生产者已开发了相当广泛和成熟的种子生产技术。因此农场主常用的方法是购买经鉴定符合特定质量标准的种子而不是使用从他自己的农作物收获的种子。用作种子的繁殖材料习惯用含有杀虫剂、杀昆虫剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂或其混合物的保护剂涂层处理。常规使用的保护剂涂层包含诸如克菌丹、萎锈灵、福美双(TMTD^)、methalaxyl(Apron^)和虫螨磷(Actellic^)的化合物。如果需要，将这些化合物与其它载体、表面活性剂或配制领域常规使用的促进施用佐剂一起配制以提供针对由细菌、真菌或动物虫害引起的损伤的保护。保护剂涂层可以通过用液体制品浸渍繁殖材料或通过用混合的干或湿配方包裹来施用。也可能是其它施用方法如直接处理芽或果实。

本发明的另一方面提供新的农业方法如上面列举的方法，其特征在于使用根据本发明所述的转基因植物、转基因植物材料或转基因种子。

在另一实施方案中，本发明涉及来自转基因植物的转基因植物细胞、组织、器官、种子或植物部分。本发明也包括转基因植物后代及后代的转基因植物细胞、组织、器官、种子和植物部分。

本发明进一步涉及含有能表达cp4/epsps的具Roundup^耐受性的甜菜种子的商品包及其使用说明。本发明内优选的是包含含有稳定整合入其基因的具有SEQ ID No：1所示核苷酸序列的DNA片段的转基因植物种子的商品包。

所用的转化方法学总结如下：

(a)用含有如SEQ ID No：5中所示的编码cp4/epsps的DNA片段的载体，使用根瘤农杆菌转化体外培养的甜菜子叶。

(b)在草甘膦存在时再生芽；

(c)将芽转移到温室的土壤中；

(d)用处理苗；

(e)对植株活力和叶褪绿进行目测评级；

(g)选择未受草甘膦处理影响的具有正常活力和叶子的完全正常的植株；并且

(h)使用传统育种技术繁殖所选植株。

具体地，在选择8-12周后，在约0.1至约10mM，优选地1mM草甘膦存在时再生芽。每个转基因芽进一步繁殖成10个拷贝，在将它转移至温室中生根前，可以用聚合酶链式反应(PCR)分析cp4/epsps转基因的存在。温室中光照条件是16小时光照和8小时黑暗，温度为22±2℃。在3-4叶期，用每公顷0.1-20升，优选地1升剂量的Roundup^水溶液喷洒苗。草甘膦施用后2周基于0(死亡植株)到9(完受未受影响的植制)的等级对单个植物进行植株活力和植物褪绿的目测损伤评级。0-3的评级是易感植物的特征。3-7的评级表明耐受性的低至中间水平，8或9的评级表明耐受性的良好水平。具体地，评级有以下意义：

9：与未处理的对照相同的未受影响的植株

8：只有叶尖上很小的坏死，少于5％的叶面积受到影响并黄化

7：叶尖上很小的坏死开始卷曲，少于5％的叶面积受到影响并黄化

6，5，4：坏死和叶卷曲增强；叶变得比正常的更小

3，2：没有或非常有限的叶生长；所有的叶子卷曲并受坏死影响

1：无植物生长，最多5％的植株保持绿色

0：死亡植株

为收集田间实验数据，通过传统技术进一步繁殖或培育有正常活力并且不受草甘膦处理影响的(评分9)植株。

优选地，使用含有具有SEQ ID No：5给出序列的DNA片段的载体进行转化，其中DNA片段含有cp4/epsps和gox基因(都已被报道赋予某些植物种类对草甘膦的耐受性)和报告基因UidA基因(编码β-葡糖醛酸酶)。增强的35S启动子(odell等，自然313：810-812，1995)与UidA基因相连，玄参花叶病毒(FMV)启动子(Gouwda等，J.Cell.Biochem.Suppl.13D：301，1989)与cp4/epsps和gox基因相连。在cp4/epsps和gox基因的上游插入转运肽(Gasser等，生物化学杂志，263：4280-4289，1988)以将两个蛋白靶向叶绿体。

令人惊奇地发现，根据本发明产生的一个转化结果不受每公顷多达约3×6升(约18升)除草剂Roundup^剂量的影响。分子分析表明：

●有整合于单一位点的单拷贝转基因DNA；

●整合的DNA编码cp4/epsps并对应于截短的载体DNA；

●整合的DNA取代了基因组DNA片段并具有SEQ ID No：1所示的序列；

●与整合的DNA直接相邻的基因组DNA的特征在于SEQ ID No：2和SEQ ID No：3的序列，导致SEQ ID No：4的新基因组序列排列；

●cp4/epsps和UidA基因是完整的，而gox基因是截断的；

●其它载体序列不存在于转基因植物中。

目前可以知道这一信息，即来自根据本发明所述的特定转化结果的植株可以容易地通过PCR方法与其它甜菜植株区分开。适当的引物对组合使得可以特异地鉴定仅存在于直接或间接来自相同转化结果的植物的基因组DNA序列。这样的事件不以任何方式限制在由农杆菌介导的转化得到的那些结果，而也可以来自bio1istic转化实验。

因此本发明涉及甜菜植株及其后代，其特征在于用其基因组DNA为模板的PCR导致以下片段的扩增：

当使用以SEQ ID No：B和SEQ ID No：a的序列为特征的寡核苷酸引物对时，739bp DNA片段；或者

当使用以SEQ ID No：D和SEQ ID No：e的序列为特征的寡核苷酸引物对时，834bp DNA片段；或者

当使用以SEQ ID No：A和SEQ ID No：b的序列为特征的寡核苷酸引物对时，1057bp DNA片段；或者

当使用以SEQ ID No：C和SEQ ID No：f的序列为特征的寡核苷酸引物对时，1224bp DNA片段。

实施例

以下实施例进一步描述了得到本发明和随后的结果时所用的材料和方法。它们通过举例说明提供，并且它们的复述不应认为是要求权利的本发明的限制。

实施例1 甜菜转化

用含有cp4/epsps和gox基因(能赋予草甘膦耐受性)、nptII基因(典型对抗生素卡那素的抗性)及报告基因uidA(编码β-葡糖醛酸酶。GUS)的载体转化A1012基因型甜菜。nptII和uidA基因与加强的35S启动子(odell等，自然，313：810-812，1995)功能性连接，而cp4/epsps和gox基因在玄参花叶病毒(FMV)启动子(Gouwda等，J.Cell.Biochem.Suppl.13D：301，1989)的控制下。另外，cp4/epsps和gox基因在5′与转运肽(Gasser等，生物化学杂志，263：4280-4289，1988)连接以使两个蛋白靶向叶绿体。cp4/epsps和uidA使用E9 3′终止子序列，而gox和nptII使用相应的NOS 3′序列。

使用根瘤农杆菌转化体外培养的甜菜(Beta vulgaris.L)。使用1mM浓度的草甘膦作为选择剂，如Fry等(“使用根瘤农杆菌的基因型依赖的甜菜转化”，第三次植物分子生物学国际会议，Tuscon，Arizona，USA，1991)和Konwar(植物生物化学及生物技术杂志，3：37-41，1994)所述使植物再生。为杀灭根癌农杆菌，将子叶在含500mg/l头孢的MS培养基中培养三次(45-50rpm，60分钟)。在1mM草甘膦和500mg/l头孢噻肟上筛选8～12周(包括每三周转至新鲜培养基上)后分析再生芽。将每一转基因芽进一步微量繁殖(micropropagate)成十个拷贝，分析转基因的存在并转移至温室中生根。

聚合酶链式反应(PCR)用于确定cp4/epsps基因的存在。从再生的体外芽收集20mg植物材料至微量离心管。基本上按照Tai等，植物分子生物学报告，8：297-303，1990抽提总DNA。次要的改进是加入500μl含有50mM Na-EDTA，1.25％SDS(重量/体积)，0.38％Na-Bisulfite(重量/体积)和200μg/ml蛋白酶K的100mM Tris-HCl(pH8.0)并于65℃温育2小时。挑出未溶解的叶材料并于-20℃冷冻和沉淀总DNA 2小时。用Perkin-Elmer Gene-Amp PCR试剂盒(Perkin-Elmer公司)按照所含的说明进行PCR，使用含有10mMTris-HCl(pH8.3)，500mM KCL，30mM MgCl₂，1.0％NonidetP-40(重量/体积)，24％蔗糖(重量/体积)中的0.4μM甲酚红和Taq Start Antibody(Clontech)的修饰的10×反应缓冲液。为扩增cp4/epsps序列，使用如下引物(Shah等，科学，233：478-481，1986)：5′-CAC CGG TCT TTT GGA AGG TGA AG-3′(SEQ ID NO：6)和5-AAC GAG ACC CAT AAC GAG GAA GC-3′(SEQ ID NO：7).为扩增基因间调控序列(surA，surB)，使用如下引物：5′-AAA CAG TCC CGT GCA TCC CCA AC-3′(SEQ ID NO：8)和5′-GAC GCT CTC CTT GAT TCT GTC CC-3′(SEQ ID NO：9).

不同双元载体间未见到转化效率的不同。

将微量繁殖的芽转移到温室的土壤中。温室中的光照条件是200μmol m^-2sec^-1(Osram Power Star HQI-Z，400w)，16小时光照，8小时黑暗，温度为22±2℃。用Roundup^处理来自260个独立转化子的三至四叶期小苗。使用刻度喷雾器以每公顷1升的剂量(360g.a.i.1^-1)施用除草剂的水溶液。草甘膦施用后2周，基于0(完全叶坏死)至9(无可见影响)的等级，对每个植株进行植物毒性影响的目测损伤评级。对于75个不同的转化子，检测到的植物毒性效应在评分0-6之间变动。其它185个(75％)转化子评分为7或更高，这意味着在用除草剂处理之后，它们表现较少或不可见的影响。将它们与非转基因甜菜杂交以产生F1子代用于随后的田间实验评估。

进行田间实验以评估田间条件下的不同转化结果。每一块地包含三排，每排9米长，行间距0.5米。在每一块地插种一个不同的转化子。在子叶期每公顷1升(360g.a.i.1^-1)的初始Roundup^施用去除非转基因植物后，人工挑选各行至最终标准每20厘米1个植株。每一小块地分成独立处理的三部分。一部分用传统的除草剂苯嗪草酮(0.1kg a.i.ha^-1)、苯敌草(0.2kg a.i.ha^-1)和甜菜呋(0.1kg a.i.ha^-1)处理。另一部分用每公顷2升Roun dup^处理2次(1400g a.i.ha^-1)，第三部分用4升Roundup^处理2次(2880ga.i.l^-1)，在二叶期和四叶期处理植物。最后施用后二周，评估植物由于施用除草剂的植物毒性效应。发现症状从完全易感变化至完全耐受。观察到温室中评分和田间实验中评分的不同。这可能是由于温室和田间实验的环境不同，包括在玻璃下缺少紫外光。与用传统除草剂混合物处理相比，用不同剂量的Roundup^处理的地区的植物间没有形态学或生理学上的变化。两个转化子在用每公顷2升2次和4升2次处理后，表现对Roundup^的高度耐受性。

用Roundup^喷酒后，通过植株活力(Tr.vig)和叶褪绿(Tr.chl)评级测定耐受性。不同的评级有如下意义：

9：与未处理的对照相同的未受影响的植株

6，5，4：坏死和叶卷曲增强；叶变得比正常的更小

1：无植物生长，最多5％的植株保持绿色

0：死亡植株

用1+4+4升Roundup^/公顷(共9升/公顷)喷洒22个不同的转化结果(1-22项)和一个非转基因对照(23项)。目测损伤评级的结果在下表中给出。

项	活力评级	褪绿评级
项	活力评级	褪绿评级	1	9	9
2	6	7	1	9	9
2	6	7	3	2	3
4	5	7	3	2	3
4	5	7	5	9	8
6	3	3	5	9	8
6	3	3	7	7	7
8	7	8	7	7	7
8	7	8	9	4	6
10	5	6	9	4	6
10	5	6	11	5	5
12	4	5	11	5	5
12	4	5	13	9	9
14	3	5	13	9	9
14	3	5	15	4	4
16	2	3	15	4	4
16	2	3	17	1	1
18	2	2	17	1	1
18	2	2	19	6	8
20	7	5	19	6	8
20	7	5	21	4	5
22	5	7	21	4	5
22	5	7	23	0	0

(RRMax)(非转基因植物1)

实施例2 整合的转基因DNA的拷贝数

通过对在所用转化载体的左和右边界序列之外延伸的限制性片段的Southern印迹分析测定具有最高草甘膦耐受性的转化子(RRMax)的基因组内整合的转基因DNA的拷贝数。

按照Saghai-Maroof等，美国国家科学院院报，81：8014-8018，1984，从250mg冷冻干燥的甜菜材料分离来自RRMax和具有相同遗传学的非转基因植物的基因组DNA。所用转化载体的DNA作用为阳性对照。用120单位的限制性酶在400μl总体积中于37℃消化15μgDNA 4小时。使消化的DNA沉淀并重新溶解于50μl总体积中。消化的DNA、阳性对照质粒和标准的分子大小标记(用EcoRI和HindIII消化的λDNA)在0.8％琼脂糖凝胶上分离。用溴化乙锭观察DNA，并包括尺子进行摄影。然后将DNA转移到Hybond N⁺膜上并如Ausubel等(编辑)，于“现代分子生物学常用方法”，Green PublishingAssociates，Inc.和John Wiley & Sons，Inc.，New York，1987所述与探针杂交。

通过聚合酶链式反应(PCR，其中所用的转化载体作用为反应的模板DNA)制备与cp4/epsps基因序列(SEQ ID No：5)的975-1766碱基对和gox基因序列(SEQ ID No：5)的7108-7535碱基对互补的探针。cp4/epsps探针用于测定邻近右边界区域的插入数。gox探针用于测定邻近左边界区域的插入数。使用BIO 101(La Jolla，CA)的Geneclean II^试剂盒纯化PCR产物。使用AmershamInternational(Little Chalfont，UK)的Megaprime^TM DNA标记系统进行探针的³²P标记。

拷贝数测定可以通过对邻近右边界区域的基因组DNA的分析进行。用限制性酶NcoI消化基因组DNA，NcoI切割35s启动子和uidA基因间的和甜菜基因组内的质粒来源的序列。用cp4/epsps基因的内部PCR片段探测膜。用NcoI消化并用cp4/epsps探针杂交后，在RRMax中检测到4.7kb的单一条带。这证明了转移DNA在单一位点的单拷贝。

拷贝数测定可以通过对邻近左边界区域的基因组DNA的分析进行。用限制性酶HindIII消化基因组DNA，HindIII切割gox的FMV启动子和uidA基因的E9 3′终止子间的和甜菜基因组内的质粒来源的序列。在用HindIII消化并用gox探针杂交后，检测到转化子在RRMax中的2.0kb的单一条带。因为预期的最小片段大小是≥4.4kb，所以结果表面在转移入植物基因组DNA的过程中质粒DNA的截断。而且结果证明了转移DNA单拷贝整合在单一位点。

实施例3 RRMax整合位点的序列分析

按照Saghai-Maroof等，同上，从250mg冷冻干燥的甜菜叶材料分离RRMax基因组DNA。制备在XhoI克隆位点中带有9-23kb大小插入的λFIXII噬菌体文库。并用cp4/epsps和gox探针探测以筛选覆盖整合结果的推测克隆。检测到与cp4/epsps或gox探针杂交的总共25个噬菌体。发现分别与cp4/epsps探针和gox探针杂交的2个克隆。纯化其中之一(Fritsch等，1987)并通过Southern印迹分析和PCR进一步评估。它含有15-16kb的基因组DNA插入，包括转基因DNA和侧翼的甜菜序列。所述侧翼序列通过PCR、使用与FMV启动子或gox基因序列匹配的引物结合与λFIXII克隆元件中的序列匹配的引物(详细的序列在下面1中给出)来扩增。整合的DNA/甜菜接合区域通过Sanger双脱氧介导的链终止法使用Applied Biosystem，373A型，2.1.1版测序。所用的测序引物在表2中给出。

表1 用于扩增边界区域的引物

引物	序列
引物	序列	#3	5′-CAAGAAGGTTGGTATCGCTG-3′(SEQ ID NO：10)
#7	5′-TCTTTTGTGGTCGTCACTGCGTT-3′(SEQ ID NO：11)	#3	5′-CAAGAAGGTTGGTATCGCTG-3′(SEQ ID NO：10)
#7	5′-TCTTTTGTGGTCGTCACTGCGTT-3′(SEQ ID NO：11)	#8	5′-GCGAGCTCTAATACGACTCACTAT-3′(SEQ ID NO：12)
#9	5′-CGCGAGCTCAATTAACCCTCACT-3′(SEQ ID NO：13)	#8	5′-GCGAGCTCTAATACGACTCACTAT-3′(SEQ ID NO：12)

表2 测序引物

引物	序列	说明
引物	序列	说明	S1	5′-TCTGTACCCTGACCTTGTTG-3′(SEQ ID NO：14)	测定右边界区域侧翼序列
S3	5′-CGTGGATACCACATCGTGAT-3′(SEQ ID NO：15)	测定左边界区域侧翼序列	S1	5′-TCTGTACCCTGACCTTGTTG-3′(SEQ ID NO：14)	测定右边界区域侧翼序列
S3	5′-CGTGGATACCACATCGTGAT-3′(SEQ ID NO：15)	测定左边界区域侧翼序列	S4	5′-ACCTTGGCTTGAAGTACTC-3(SEQ ID NO：16)	测定左边界区域侧翼序列

序列分析表明整合在RRMax基因组中的转基因DNA具有SEQ IDNo：1中给出的核苷酸序列。整合起始点位于右边界序列和FMV启动子之间并终止于gox起始密码子下游的897碱基对。截短的gox基因的翻译终止密码子可在接合点下游的130和235碱基对找到。在gox起始密码子下游210碱基对识别了一个HindIII位点，而在下游650碱基对识别了一个转录终止信号(AATAAA)。SEQ ID No：2表示了与转基因DNA的右边界区域直接相连的基因组DNA序列，而SEQ ID No：3表示与转基因DNA的左边界区域直接相连的基因组DNA序列。

实施例4 RRMax整合的转基因DNA的特征鉴定

为进一步鉴定右边界区域，用限制性酶BamHI、HindIII、BcII或EcoRI消化基因组DNA和转化载体DNA。在Southern印迹分析中，用实施例2中所述的cp4/epsps PCR片段探测切开的DNA。与所用的限制性酶无关，用不同的限制性酶消化在Southern印迹分析中产生单一片段。检测到的片段大小在表3中表示。数据表明单一拷贝的DNA已转移至植物中，并且DNA向甜菜植株的转移导致cp4/epsps基因的完整转移。结果与实施例2中的拷贝数测定和实施例3的核苷酸序列一致。

表3 Southern印迹片段大小

酶	RRMax	转化载体
酶	RRMax	转化载体	BamHI	＞10kb	9.7kb
HindIII	2.4kb	2.4kb	BamHI	＞10kb	9.7kb
HindIII	2.4kb	2.4kb	Bcll	3.2kb	2.9kb
EcoRI	1.8kb	1.8kb	Bcll	3.2kb	2.9kb

为进一步鉴定整合的转基因片段，用限制性酶NcoI、BamHI或HindIII消化来自RRMax的基因组DNA。作为对照，用相同的限制性酶消化转化载体DNA。用横跨SEQ ID No：5中uidA基因的3796-4837碱基对的PCR扩增的DNA片段探测印迹。检测到的片段大小在表4中表示。与所用的限制性酶无关，用不同的限制性酶消化在放射自显影胶片上产生单一信号，这表明DNA插入具有与所用转化载体的内部DNA相同的特征。

表4 Southern印迹片段大小

酶	转化载体	RRMax
酶	转化载体	RRMax	Ncol	3.4kb	3.4kb
BamHI	3.2kb	3.2kb	Ncol	3.4kb	3.4kb
BamHI	3.2kb	3.2kb	HindIII	3.2kb	3.2kb

为进一步鉴定左边界区域，用限制性酶NcoI、BamHI、HindIII或EcoRI消化转化载体DNA。在Southern分析中用实施2中所述的goxPCR片段探测切开的DNA。检测到的片段大小在表5中表示。与所用的限制性酶无关，用不同的限制性酶消化在放射自显影胶片上产生单一片段。用限制性酶NcoI、BamHI、HindIII或EcoRI消化预期识别已知大小的内部片段。但是，这些限制性酶没有产生这样的预期大小的内部片段。这表明NcoI、BamHI、HindIII或EcoRI的限制性位点在转基因植物中缺乏。这些结果与通过测序发现的gox基因仅部分整合入植物的结果一致。用限制性酶HindIII消化产生的2kb片段，进一步确定了测序数据，即HindIII位点位于基因组中gox基因的下游。结果也表明转基因DNA的单拷贝已转移到植物中。它们与实施例2中的拷贝数测定和实施例3中的核苷酸序列分析的最初结果很好地相关。单一拷贝已整合入植物基因组，而gox基因部分缺失。

表5 Southern印迹片段大小

酶	转化载体	T9100152
酶	转化载体	T9100152	Ncol	2.5kb	3.0kb
BamHI	2.9kb	＞10kb	Ncol	2.5kb	3.0kb
BamHI	2.9kb	＞10kb	HindIII	9.5kb	2.0kb
EcoRI	1.6kb	3.6kb	HindIII	9.5kb	2.0kb

实施例5 其它载体DNA序列的缺失

为确定转化结果RRMax中oriV，ori-322，aad和nptII序列的缺失，Southern印迹分析可以使用覆盖oriV，ori-322，add和nptII的限制性酶/探针组合进行。

用限制性酶NspI消化转化载体DNA，NspI在17处位点切割质粒。为了分析，纯化覆盖oriV的NspI片段和覆盖ori-322和aad的片段并用于Southern印迹分析。具有SEQ ID No：26中给出的核苷酸序列的PCR扩增的片段用于探针nptII序列。用BIO 101(La Jolla，CA)的Geneclean II^试剂盒纯化。用Amersham International(Littlechalfont，UK)的Megaprime^TM DNA标记系统进行P³²的标记。

用限制性酶BamHI消化RRMax的基因组DNA，BamHI在分别位于SEQID No：5的碱基对2321、5544和8413的三处位点切割转化载体DNA。相应Southern转移膜与覆盖oriV探针的杂交没有检测到信号，必然得出结论：oriV不存在于RRMax中。

相应Southern转移膜与覆盖ori-322和aad的探针的杂交没有检测到信号。必然得出结论：ori-322和aad序列不存在于RRMax中。

相应Southern转移膜与nptII探针的杂交也未检测到信号，这证明nptII基因不存在于RRMax株系中。

实施例6 RRMax株系的稳定性

如实施例2中所述的用限制性酶BcII消化基因组DNA并使用cp4/epsps基因作为探针进行Southern印迹分析。来自2和3代的四株植物和来自4代的5株植物用于此分析。另外，3株非转基因植物用作负对照。最初转化结果的分析得到3.2kb的单一片段。如果导入的DNA在代与代之间稳定遗传，那么预期在所有植株中有相同的3.2kb片段。

如实施例2中所述的用HindIII消化基因组DNA并用gox基因的内部片段作为探针进行Southern印迹分析。最初转化结果的分析得到2.0kb的单一片段。子代的Southern印迹分析也得到2.0kb的单一片段，表明特征的稳定遗传。

实施例7 RRMax的PCR测定。

如实施例2中所述制备RRMax株系的基因组DNA。在PCR反应中，约0.5μg DNA用作模板DNA，且使用以表6中给出的序列为特征的特定引物组合，所述的特定组合和扩增片段的大小在表7中给出。在每个30-35扩增循环中，根据引物对组合，使用55℃和65℃之间的退火温度。

表6 引物序列

引物	序列	说明
引物	序列	说明	A	5’-TCAACCTACAGCTGATTTGGACC-3’(SEQ ID NO：17)	邻近右边界接合点
B	5’-GGACCGGAACGACAATCTGATC-3’(SEQ ID NO：18)	邻近右边界接合点	A	5’-TCAACCTACAGCTGATTTGGACC-3’(SEQ ID NO：17)	邻近右边界接合点
B	5’-GGACCGGAACGACAATCTGATC-3’(SEQ ID NO：18)	邻近右边界接合点	C	5’-CTAGGGAAGTCCAAATCAGCCG-3’(SEQ ID NO：19)	邻近左边界接合点
D	5’-TTTGGACCGGAACTTTCCAGAAG-3’(SEQ ID NO：20)	邻近左边界接合点	C	5’-CTAGGGAAGTCCAAATCAGCCG-3’(SEQ ID NO：19)	邻近左边界接合点
D	5’-TTTGGACCGGAACTTTCCAGAAG-3’(SEQ ID NO：20)	邻近左边界接合点	a	5’-CTAACTTGCGCCATCGGAGAAAC-3’(SEQ ID NO：21)	cp4/epsps基因内
b	5’-GACTTGTCACCTGGAATACGGAC-3’(SEQ ID NO：22)	cp4/epsps基因内	a	5’-CTAACTTGCGCCATCGGAGAAAC-3’(SEQ ID NO：21)	cp4/epsps基因内
b	5’-GACTTGTCACCTGGAATACGGAC-3’(SEQ ID NO：22)	cp4/epsps基因内	c	5’-ATTCTTGAGCTCATCAAGCAGCC-3’(SEQ ID NO：23)	cp4/epsps基因内
e	5’-AAGGTTGGTATCGCTGGAGCTG-3’(SEQ ID NO：24)	gox序列内	c	5’-ATTCTTGAGCTCATCAAGCAGCC-3’(SEQ ID NO：23)	cp4/epsps基因内
e	5’-AAGGTTGGTATCGCTGGAGCTG-3’(SEQ ID NO：24)	gox序列内	f	5’-TCTCCACAATGGCTTCCTCTATG-3’(SEQ ID NO：25)	gox序列内

表7 特定引物组合

组合	扩增的片段大小
组合	扩增的片段大小	A+a	757bp
A+b	1057bp	A+a	757bp
A+b	1057bp	A+c	2352bp
B+a	739bp(SEQ ID NO：27)	A+c	2352bp
B+a	739bp(SEQ ID NO：27)	B+b	1039bp
B+c	2334bp	B+b	1039bp
B+c	2334bp	C+e	888bp
C+f	1224bp	C+e	888bp
C+f	1224bp	D+e	834bp
D+f	1178bp	D+e	834bp

(1)基本信息

(i)申请人：NOVARTIS AG

(A)街道：Schwarzwaldallee 215

(B)城市：Basel

(C)国家：瑞士

(D)邮政编号：4058

(E)电话：+41 61 324 11 11

(F)传真：+41 61 322 75 32

(ii)发明名称：转基因植物

(iii)序列数：27

(iv)计算机可读形式

(A)介质类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0，版本#1.25(EPO)

(2)关于SEQ ID NO：1的信息：

(i)序列特征

(A)长度：8012个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：1：

AACGACAATC TGATCCCCAT CAAGCTTGAG CTCAGGATII AGCAGCATTC CAGATTGGGT 60

TCAATCAACA AGGTACGAGC CATATCACTT TATTCAAATT GGTATCGCCA AAACCAAGAA 120

GGAACTCCCA TCCTCAAAGG TTTGTAAGGA AGAATTCTCA GTCCAAAGCC TCAACAAGGT 180

CAGGGTACAG AGTCTCCAAA CCATTAGCCA AAAGCTACAG GAGATCAATG AAGAATCTTC 240

AATCAAAGTA AACTACTGTT CCAGCACATG CATCATGGTC AGTAAGTTTC AGAAAAAGAC 300

ATCCACCGAA GACTTAAAGT TAGTGGGCAT CTTTGAAAGT AATCTTGTCA ACATCGAGCA 360

GCTGGCTTGT GGGGACCAGA CAAAAAAGGA ATGGTGCAGA ATTGTTAGGC GCACCTACCA 420

AAAGCATCTT TGCCTTTATT GCAAAGATAA AGCAGATTCC TCTAGTACAA GTGGGGAACA 480

AAATAACGTG GAAAAGAGCT GTCCTGACAG CCCACTCACT AATGCGTATG ACGAACGCAG 540

TGACGACCAC AAAAGAATTC CCTCTATATA AGAAGGCATT CATTCCCATT TGAAGGATCA 600

TCAGATACTG AACCAATCCT TCTAGAAGAT CTAAGCTTAT CGATAAGCTT GATGTAATTG 660

GAGGAAGATC AAAATTTTCA ATCCCCATTC TTCGATTGCT TCAATTGAAG TTTCTCCGAT 720

GGCGCAAGTT AGCAGAATCT GCAATGGTGT GCAGAACCCA TCTCTTATCT CCAATCTCTC 780

GAAATCCAGT CAACGCAAAT CTCCCTTATC GGTTTCTCTG AAGACGCAGC AGCATCCACG 840

AGCTTATCCG ATTTCGTCGT CGTGGGGATT GAAGAAGAGT GGGATGACGT TAATTGGCTC 900

TGAGCTTCGT CCTCTTAAGG TCATGTCTTC TGTTTCCACG GCGTGCATGC TTCACGGTGC 960

AAGCAGCCGT CCAGCAACTG CTCGTAAGTC CTCTGGTCTT TCTGGAACCG TCCGTATTCC 1020

AGGTGACAAG TCTATCTCCC ACAGGTCCTT CATGTTTGGA GGTCTCGCTA GCGGTGAAAC 1080

TCGTATCACC GGTCTTTTGG AAGGTGAAGA TGTTATCAAC ACTGGTAAGG CTATGCAAGC 1140

TATGGGTGCC AGAATCCGTA AGGAAGGTGA TACTTGGATC ATTGATGGTG TTGGTAACGG 1200

TGGACTCCTT GCTCCTGAGG CTCCTCTCGA TTTCGGTAAC GCTGCAACTG GTTGCCGTTT 1260

GACTATGGGT CTTGTTGGTG TTTACGATTT CGATAGTACT TTCATTGGTG ACGCTTCTCT 1320

CACTAAGCGT CCAATGGGTC GTGTGTTGAA CCCACTTCGC GAAATGGGTG TGCAGGTGAA 1380

GTCTGAAGAC GGTGATCGTC TTCCAGTTAC CTTGCGTGGA CCAAAGACTC CAACGCCAAT 1440

CACCTACAGG GTACCTATGG CTTCCGCTCA AGTGAAGTCC GCTGTTCTGC TTGCTGGTCT 1500

CAACACCCCA GGTATCACCA CTGTTATCGA GCCAATCATG ACTCGTGACC ACACTGAAAA 1560

GATGCTTCAA GGTTTTGGTG CTAACCTTAC CGTTGAGACT GATGCTGACG GTGTGCGTAC 1620

CATCCGTCTT GAAGGTCGTG GTAAGCTCAC CGGTCAAGTG ATTGATGTTC CAGGTGATCC 1680

ATCCTCTACT GCTTTCCCAT TGGTTGCTGC CTTGCTTGTT CCAGGTTCCG ACGTCACCAT 1740

CCTTAACGTT TTGATGAACC CAACCCGTAC TGGTCTCATC TTGACTCTGC AGGAAATGGG 1800

TGCCGACATC GAAGTGATCA ACCCACGTCT TGCTGGTGGA GAAGACGTGG CTGACTTGCG 1860

TGTTCGTTCT TCTACTTTGA AGGGTGTTAC TGTTCCAGAA GACCGTGCTC CTTCTATGAT 1920

CGACGAGTAT CCAATTCTCG CTGTTGCAGC TGCATTCGCT GAAGGTGCTA CCGTTATGAA 1980

CGGTTTGGAA GAACTCCGTG TTAAGGAAAG CGACCGTCTT TCTGCTGTCG CAAACGGTCT 2040

CAAGCTCAAC GGTGTTGATT GCGATGAAGG TGAGACTTCT CTCGTCGTGC GTGGTCGTCC 2100

TGACGGTAAG GGTCTCGGTA ACGCTTCTGG AGCAGCTGTC GCTACCCACC TCGATCACCG 2160

TATCGCTATG AGCTTCCTCG TTATGGGTCT CGTTTCTGAA AACCCTGTTA CTGTTGATGA 2220

TGCTACTATG ATCGCTACTA GCTTCCCAGA GTTCATGGAT TTGATGGCTG GTCTTGGAGC 2280

TAAGATCGAA CTCTCCGACA CTAAGGCTGC TTGATGAGCT CAAGAATTCG AGCTCGGTAC 2340

CGGATCCTCT AGCTAGAGCT TTCGTTCGTA TCATCGGTTT CGACAACGTT CGTCAAGTTC 2400

AATGCATCAG TTTCATTGCG CACACACCAG AATCCTACTG AGTTCGAGTA TTATGGCATT 2460

GGGAAAACTG TTTTTCTTGT ACCATTTGTT GTGCTTGTAA TTTACTGTGT TTTTTATTCG 2520

GTTTTCGCTA TCGAACTGTG AAATGGAAAT GGATGGAGAA GAGTTAATGA ATGATATGGT 2580

CCTTTTGTTC ATTCTCAAAT TAATATTATT TGTTTTTTCT CTTATTTGTT GTGTGTTGAA 2640

TTTGAAATTA TAAGAGATAT GCAAACATTT TGTTTTGAGT AAAAATGTGT CAAATCGTGG 2700

CCTCTAATGA CCGAAGTTAA TATGAGGAGT AAAACACTTG TAGTTGTACC ATTATGCTTA 2760

TTCACTAGGC AACAAATATA TTTTCAGACC TAGAAAAGCT GCAAATGTTA CTGAATACAA 2820

GTATGTCCTC TTGTGTTTTA GACATTTATG AACTTTCCTT TATGTAATTT TCCAGAATCC 2880

TTGTCAGATT CTAATCATTG CTTTATAATT ATAGTTATAC TCATGGATTT GTAGTTGAGT 2940

ATGAAAATAT TTTTTAATGC ATTTTATGAC TTGCCAATTG ATTGACAACA TGCATCAATC 3000

GACCTGCAGC CACTCGAAGC GGCCGCGTTC AAGCTTCTGC AGGTCCGATG TGAGACTTTT 3060

CAACAAAGGG TAATATCCGG AAACCTCCTC GGATTCCATT GCCCAGCTAT CTGTCACTTT 3120

ATTGTGAAGA TAGTGGAAAA GGAAGGTGGC TCCTACAAAT GCCATCATTG CGATAAAGGA 3180

AAGGCCATCG TTGAAGATGC CTCTGCCGAC AGTGGTCCCA AAGATGGACC CCCACCCACG 3240

AGGAGCATCG TGGAAAAAGA AGACGTTCCA ACCACGTCTT CAAAGCAAGT GGATTGATGT 3300

GATGGTCCGA TGTGAGACTT TTCAACAAAG GGTAATATCC GGAAACCTCC TCGGATTCCA 3360

TTGCCCAGCT ATCTGTCACT TTATTGTGAA GATAGTGGAA AAGGAAGGTG GCTCCTACAA 3420

ATGCCATCAT TGCGATAAAG GAAAGGCCAT CGTTGAAGAT GCCTCTGCCG ACAGTGGTCC 3480

CAAAGATGGA CCCCCACCCA CGAGGAGCAT CGTGGAAAAA GAAGACGTTC CAACCACGTC 3540

TTCAAAGCAA GTGGATTGAT GTGATATCTC CACTGACGTA AGGGATGACG CACAATCCCA 3600

CTATCCTTCG CAAGACCCTT CCTCTATATA AGGAAGTTCA TTTCATTTGG AGAGGACACG 3660

CTGACAAGCT GACTCTAGCA GATCTCCATG GTCCGTCCTG TAGAAACCCC AACCCGTGAA 3720

ATCAAAAAAC TCGACGGCCT GTGGGCATTC AGTCTGGATC GCGAAAACTG TGGAATTGAT 3780

CAGCGTTGGT GGGAAAGCGC GTTACAAGAA AGCCGGGCAA TTGCTGTGCC AGGCAGTTTT 3840

AACGATCAGT TCGCCGATGC AGATATTCGT AATTATGCGG GCAACGTCTG GTATCAGCGC 3900

GAAGTCTTTA TACCGAAAGG TTGGGCAGGC CAGCGTATCG TGCTGCGTTT CGATGCGGTC 3960

ACTCATTACG GCAAAGTGTG GGTCAATAAT CAGGAAGTGA TGGAGCATCA GGGCGGCTAT 4020

ACGCCATTTG AAGCCGATGT CACGCCGTAT GTTATTGCCG GGAAAAGTGT ACGTATCACC 4080

GTTTGTGTGA ACAACGAACT GAACTGGCAG ACTATCCCGC CGGGAATGGT GATTACCGAC 4140

GAAAACGGCA AGAAAAAGCA GTCTTACTTC CATGATTTCT TTAACTATGC CGGAATCCAT 4200

CGCAGCGTAA TGCTCTACAC CACGCCGAAC ACCTGGGTGG ACGATATCAC CGTGGTGACG 4260

CATGTCGCGC AAGACTGTAA CCACGCGTCT GTTGACTGGC AGGTGGTGGC CAATGGTGAT 4320

GTCAGCGTTG AACTGCGTGA TGCGGATCAA CAGGTGGTTG CAACTGGACA AGGCACTAGC 4380

GGGACTTTGC AAGTGGTGAA TCCGCACCTC TGGCAACCGG GTGAAGGTTA TCTCTATGAA 4440

CTGTGCGTCA CAGCCAAAAG CCAGACAGAG TGTGATATCT ACCCGCTTCG CGTCGGCATC 4500

CGGTCAGTGG CAGTGAAGGG CGAACAGTTC CTGATTAACC ACAAACCGTT CTACTTTACT 4560

GGCTTTGGTC GTCATGAAGA TGCGGACTTA CGTGGCAAAG GATTCGATAA CGTGCTGATG 4620

GTGCACGACC ACGCATTAAT GGACTGGATT GGGGCCAACT CCTACCGTAC CTCGCATTAC 4680

CCTTACGCTG AAGAGATGCT CGACTGGGCA GATGAACATG GCATCGTGGT GATTGATGAA 4740

ACTGCTGCTG TCGGCTTTAA CCTCTCTTTA GGCATTGGTT TCGAAGCGGG CAACAAGCCG 4800

AAAGAACTGT ACAGCGAAGA GGCAGTCAAC GGGGAAACTC AGCAAGCGCA CTTACAGGCG 4860

ATTAAAGAGC TGATAGCGCG TGACAAAAAC CACCCAAGCG TGGTGATGTG GAGTATTGCC 4920

AACGAACCGG ATACCCGTCC TGCACGGGAA TATTTCGGCA TTTCGCCACT GGCGGAAGCA 4980

ACGCGTAAAC TCGACCCGAC GCGTCCGATC ACCTGCGTCA ATGTAATGTT CTGCGACGCT 5040

CACACCGATA CCATCAGCGA TCTCTTTGAT GTGCTGTGCC TGAACCGTTA TTACGGATGG 5100

TATGTCCAAA GCGGCGATTT GGAAACGGCA GAGAAGGTAC TGGAAAAAGA ACTTCTGGCC 5160

TGGCAGGAGA AACTGCATCA GCCGATTATC ATCACCGAAT ACGGCGTGGA TACGTTAGCC 5220

GGGCTGCACT CAATGTACAC CGACATGTGG AGTGAAGAGT ATCAGTGTGC ATGGCTGGAT 5280

ATGTATCACC GCGTCTTTGA TCGCGTCAGC GCCGTCGTCG GTGAACAGGT ATGGAATTTC 5340

GCCGATTTTG CGACCTCGCA AGGCATATTG CGCGTTGGCG GTAACAAGAA AGGGATCTTC 5400

ACTCGCGACC GCAAACCGAA GTCGGCGGCT TTTCTGCTGC AAAAACGCTG GACTGGCATG 5460

AACTTCGGTG AAAAACCGCA GCAGGGAGGC AAACAATGAA TCAACAACTC TCCTGGCGCA 5520

CCATCGTCGG CTACAGCCTC GGTGGGGAAT TCGAGCTCGC CCGGGGATCC TCTAGCTAGA 5580

GCTTTCGTTC GTATCATCGG TTTCGACAAC GTTCGTCAAG TTCAATGCAT CAGTTTCATT 5640

GCGCACACAC CAGAATCCTA CTGAGTTCGA GTATTATGGC ATTGGGAAAA CTGTTTTTCT 5700

TGTACCATTT GTTGTGCTTG TAATTTACTG TGTTTTTTAT TCGGTTTTCG CTATCGAACT 5760

GTGAAATGGA AATGGATGGA GAAGAGTTAA TGAATGATAT GGTCCTTTTG TTCATTCTCA 5820

AATTAATATT ATTTGTTTTT TCTCTTATTT GTTGTGTGTT GAATTTGAAA TTATAAGAGA 5880

TATGCAAACA TTTTGTTTTG AGTAAAAATG TGTCAAATCG TGGCCTCTAA TGACCGAAGT 5940

TAATATGAGG AGTAAAACAC TTGTAGTTGT ACCATTATGC TTATTCACTA GGCAACAAAT 6000

ATATTTTCAG ACCTAGAAAA GCTGCAAATG TTACTGAATA CAAGTATGTC CTCTTGTGTT 6060

TTAGACATTT ATGAACTTTC CTTTATGTAA TTTTCCAGAA TCCTTGTCAG ATTCTAATCA 6120

TTGCTTTATA ATTATAGTTA TACTCATGGA TTTGTAGTTG AGTATGAAAA TATTTTTTAA 6180

TGCATTTTAT GACTTGCCAA TTGATTGACA ACATGCATCA ATCGACCTGC AGCCCAAGCT 6240

TGAGCTCAGG ATTTAGCAGC ATTCCAGATT GGGTTCAATC AACAAGGTAC GAGCCATATC 6300

ACTTTATTCA AATTGGTATC GCCAAAACCA AGAAGGAAGT CCCATCCTCA AAGGTTTGTA 6360

AGGAAGAATT CTCAGTCCAA AGCCTCAACA AGGTCAGGGT ACAGAGTCTC CAAACCATTA 6420

GCCAAAAGCT ACAGGAGATC AATGAAGAAT CTTCAATCAA AGTAAACTAC TGTTCCAGCA 6480

CATGCATCAT GGTCAGTAAG TTTCAGAAAA AGACATCCAC CGAAGACTTA AAGTTAGTGG 6540

GCATCTTTGA AAGTAATCTT GTCAACATCG AGCAGCTGGC TTGTGGGGAC CAGACAAAAA 6600

AGGAATGGTG CAGAATTGTT AGGCGCACCT ACCAAAAGCA TCTTTGCCTT TATTGCAAAG 6660

ATAAAGCAGA TTCCTCTAGT ACAAGTGGGG AACAAAATAA CGTGGAAAAG AGCTGTCCTG 6720

ACAGCCCACT CACTAATGCG TATGACGAAC GCAGTGACGA CCACAAAAGA ATTCCCTCTA 6780

TATAAGAAGG CATTCATTCC CATTTGAAGG ATCATCAGAT ACTGAACCAA TCCTTCTAGA 6840

AGATCTCCAC AATGGCTTCC TCTATGCTCT CTTCCGCTAC TATGGTTGCC TCTCCGGCTC 6900

AGGCCACTAT GGTCGCTCCT TTCAACGGAC TTAAGTCCTC CGCTGCCTTC CCAGCCACCC 6960

GCAAGGCTAA CAACGACATT ACTTCCATCA CAAGCAACGG CGGAAGAGTT AACTGCATGC 7020

AGGTGTGGCC TCCGATTGGA AAGAAGAAGT TTGAGACTCT CTCTTACCTT CCTGACCTTA 7080

CCGATTCCGG TGGTCGCGTC AACTGCATGC AGGCCATGGC TGAGAACCAC AAGAAGGTTG 7140

GTATCGCTGG AGCTGGAATC GTTGGTGTTT GCACTGCTTT GATGCTTCAA CGTCGTGGAT 7200

TCAAGGTTAC CTTGATTGAT CCAAACCCAC CAGGTGAAGG TGCTTCTTTC GGTAACGCTG 7260

GTTGCTTCAA CGGTTCCTCC GTTGTTCCAA TGTCCATGCC AGGAAACTTG ACTAGCGTTC 7320

CAAAGTGGCT TCTTGACCCA ATGGGTCCAT TGTCCATCCG TTTCAGCTAC TTTCCAACCA 7380

TCATGCCTTG GTTGATTCGT TTCTTGCTTG CTGGAAGACC AAACAAGGTG AAGGAGCAAG 7440

CTAAGGCACT CCGTAACCTC ATCAAGTCCA CTGTGCCTTT GATCAAGTCC TTGGCTGAGG 7500

AGGCTGATGC TAGCCACCTT ATCCGTCACG AAGGTCACCT TACCGTGTAC CGTGGAGAAG 7560

CAGACTTCGC CAAGGACCGT GGAGGTTGGG AACTTCGTCG TCTCAACGGT GTTCGTACTC 7620

AAATCCTCAG CGCTGATGCA TTGCGTGATT TCGATCCTAA CTTGTCTCAC GCCTTTACCA 7680

AGGGAATCCT TATCGAAGAG AACGGTCACA CCATCAACCC ACAAGGTCTC GTGACTCTCT 7740

TGTTTCGTCG TTTCATCGCT AACGGTGGAG AGTTCGTGTC TGCTCGTGTT ATCGGATTCG 7800

AGACTGAAGG TCGTGCTCTC AAGGGTATCA CCACCACCAA CGGTGTTCTT GCTGTTGATG 7860

CAGCTGTTGT TGCAGCTGGT GCACACTCCA AGTCTCTTGC TAACTCCCTT GGTGATGACA 7920

TCCCATTGGA TACCGAACGT GGATACCACA TCGTGATCGC CAACCCAGAA GCTGCTCCAC 7980

GTATTCCAAC TACCGATGCT TCTGGAAAGT TC 8012

(2)关于SEQ ID NO：2的信息

(i)序列特征

(A)长度：89个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：2：

GGATTGGTT TGGGTTTGT CTGTGTGTTT AATGTGTTTA AGGGATGAAT TAGAATGCTC 60

TTAATCAACC TACAGCTGAT IIGGACCGG 89

(2)关于SEQ ID NO：3的信息：

(i)序列特征

(A)长度：697个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：3：

CGGTCCAAAT TTGTTTACAT TGTGTCCAAA TTTCGGCTGA TTTGGACTTC CCTAGCTATG 60

CCAACTAAGC TAATAAAAAA CATGAAACAA CAATTACAAA CTGTCGAGCA CACCTTCTAC 120

AAACTAGCTT AGATTTCTAT TGGAAGTTAC AAAACAGTAA AACTACCAAT AGGATACTAA 180

ATTAAACATA TTAAACTATT ACTCCTCAAA AGCTTGTACA ATTTGCAGAA GAAATGATGG 240

TTGCCCAAAA GCTTCAAAGG GAACCTGCTG GGAAGCCTGC TGGGACGCTG GGGATGCTGG 300

CAGCAGCATA CCTTGGCTTG AAGTACTCTT CTCTCATTGG TTTTGCTTCC CTTGCCCATG 360

TGGTCTTCAT ATGGCCTCAT TACTTCCCAA GGGCTTCAAA TCAGTAGGTG GTGGCAACCA 420

AAAGCATCAA AAACATCTCC TAAAACTAGC TTATACAACC GGATTACATG AGCTTATACT 480

AGCTTAACTC TTAAAGCATG ATTAACATAA TGATGTTTAA GGTGTCATTA AGTATTACTA 540

ATCTTGCTTA AGTAGAGATT AACATAGGAT TAGCCTAATC AAGTTGCTTA AGTAAGGTTT 600

TAGAATAAAC CGAGCTAGTT AGGCTTAAGT AGAGATTAAC ATAGGATTAG CCTAATCAAG 660

TTGCTTAAGT AAGGTTTTAG AATAAACCGA GCTAGTT 697

(2)关于SEQ ID NO：4的信息：

(i)序列特征

(A)长度：8798个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：4：

GGATTGTGTT TGGGTTTTGT CTGTCTGTTT AATGTGTTTA AGGGATGAAT TAGAATGCTC 60

TTAATCAACC TACAGCTGAT TTGGACCGGA ACGACAATCT GATCCCCATC AAGCTTGAGC 120

TCAGGATTTA GCAGCATTCC AGATTGGGTT CAATCAACAA GGTACGAGCC ATATCACTTT 180

ATTCAAATTG GTATCGCCAA AACCAAGAAG GAACTCCCAT CCTCAAAGGT TTGTAAGAAA 240

GAATTCTCAG TCCAAAGCCT CAACAAGGTC AGGGTACAGA GTCTCCAAAC CATTAGCCAA 300

AAGCTACAGG AGATCAATGA AGAATCTTCA ATCAAAGTAA ACTACTGTTC CAGCACATGC 360

ATCATGGTCA GTAAGTTTCA GAAAAAGACA TCCACCGAAG ACTTAAAGTT AGTGGGCATC 420

TTTGAAAGTA ATCTTGTCAA CATCGAGCAG CTGGCTTGTG GGGACCAGAC AAAAAAGGAA 480

TGGTGCAGAA TTGTTAGGCG CACCTACCAA AAGCATCTTT GCCTTTATTG CAAAGATAAA 540

GCAGATTCCT CTAGTACAAG TGGGGAACAA AATAACGTGG AAAAGAGCTG TCCTGACAGC 600

CCACTCACTA ATGCGTATGA CGAACGCAGT GACGACACCA AAAGAATTCC CTCTATATAA 660

GAAGGCATTC ATTCCCATTT GAAGGATCAT CAGATACTGA ACCAATCCTT CTAGAAGATC 720

TAAGCTTATC GATAAGCTTG ATGTAATTGG AGGAAGATCA AAATTTTCAA TCCCCATTCT 780

TCGATTGCTT CAATTGAAGT TTCTCCGATG GCGCAAGTTA GCAGAATCTG CAATGGTGTG 840

CAGAACCCAT CTCTTATCTC CAATCTCTCG AAATCCAGTC AACGCAAATC TCCCTTATCG 900

GTTTCTCTGA AGACGCAGCA GCATCCACGA GCTTATCCGA TTTCGTCGTC GTGGGGATTG 960

AAGAAGAGTG GGATGACGTT AATTGGCTCT GAGCTTCGTC CTCTTAAGGT CATGTCTTCT 1020

GTTTCCACGG CGTGCATGCT TCACGGTGCA AGCAGCCGTC CAGCAACTGC TCGTAAGTCC 1080

TCTGGTCTTT CTGGAACCGT CCGTATTCCA GGTGACAAGT CTATCTCCCA CAGGTCCTTC 1140

ATGTTTGGAG GTCTCGCTAG CGGTGAAACT CGTATCACCG GTCTTTTGGA AGGTGAAGAT 1200

GTTATCAACA CTGGTAAGGC TATGCAAGCT ATGGGTGCCA GAATCCGTAA GGAAGGTGAT 1260

ACTTGGATCA TTGATGGTGT TGGTAACGGT GGACTCCTTG CTCCTGAGGC TCCTCTCGAT 1320

TTCGGTAACG CTGCAACTGG TTGCCGTTTG ACTATGGGTC TTGTTGGTGT TTACGATTTC 1380

GATAGCACTT TCATTGGTGA CGCTTCTCTC ACTAAGACTC CAATGGGTCG TGTGTTGAAC 1440

CCACTTCGCG AAATGGGTGT GCAGGTGAAG TCTGAAGACG GTGATCGTCT TCCAGTTACC 1500

TTGCGTGGAC CAAAGACTCC AACGCCAATC ACCTACAGGG TACCTATGGC TTCCGCTCAA 1560

GTGAAGTCGG CTGTTCTGCT TGCTGGTCTC AACACCCCAG GTATCACCAC TGTTATCGAG 1620

CCAATCATGA CTCGTGACCA CACTGAAAAG ATGCTTCAAG GTTTTGGTGC TAACCTTACC 1680

GTTGAGACTG ATGCTGACGG TGTGCGTACC ATCCGTCTTG AAGGTCGTGG TAAGCTCACC 1740

GGTCAAGTGA TTGATGTTCC AGGTGATCCA TCCTCTACTG CTTTCCCATT GGTTGCTGCC 1800

TTGCTTGTTC CAGGTTCCGA CGTCACCATC CTTAACGTTT TGATGAACCC AACCCGTACT 1860

GGTCTCATCT TGACTCTGCA GGAAATGGGT GCCGACATCG AAGTGATCAA CCCACGTCTT 1920

GCTGGTGGAG AAGACGTGGC TGACTTGCGT GTTCGTTCTT CTACTTTGAA GGGTGTTACT 1980

GTTCCAGAAG ACCGTGCTCC TTCTATGATC GACGAGTATC CAATTCTCGC TGTTGCAGCT 2040

GCATTCGCTG AAGGTGCTAC CGTTATGAAC GGTTTGGAAG AACTCCGTGT TAAGGAAAGC 2100

GACCGTCTTT CTGCTGTCGC AAACGGTCTC AAGCTCAACG GTGTTGATTG CGATGAAGGT 2160

GAGACTTCTC TCGTCGTGCG TGGTCGTCCT GACGGTAAGG GTCTCGGTAA CGCTTCTGGA 2220

GCAGCTGTCG CTACCCACCT CGATCACCGT ATCGCTATGA GCTTCCTCGT TATGGGTCTC 2280

GTTTCTGAAA ACCCTGTTAC TGTTGATGAT GCTACTATGA TCGCTACTAG CTTCCCAGAG 2340

TTCATGGATT TGATGGCTGG TCTTGGAGCT AAGATCGAAC TCTCCGACAC TAAGGCTGCT 2400

TGATGAGCTC AAGAATTCGA GCTCGGTACC GGATCCTCTA GCTAGAGCTT TCGTTCGTAT 2460

CATCGGTTTC GACAACGTTC GTCAAGTTCA ATGCATCAGT TTCATTGCGC ACACACCAGA 2520

ATCCTACTGA GTTCGAGTAT TATGGCATTG GGAAAACTGT TTTTCTTGTA CCATTTGTTG 2580

TGCTTGTAAT TTACTGTGTT TTTTATTCGG TTTTCGCTAT CGAACTGTGA AATGGAAATG 2640

GATGGAGAAG AGTTAATGAA TGATATGGTC CTTTTGTTCA TTCTCAAATT AATATTATTT 2700

GTTTTTTCTC TTATTTGTTG TGTGTTGAAT TTGAAATTAT AAGAGATATG CAAACATTTT 2760

GTTTTGAGTA AAAATGTGTC AAATCGTGGC CTCTAATGAC CGAAGTTAAT ATGAGGAGTA 2820

AAACACTTGT AGTTGTACCA TTATGCTTAT TCACTAGGCA ACAAATATAT TTTCAGACCT 2880

AGAAAAGCTG CAAATGTTAC TGAATACAAG TATGTCCTCT TGTGTTTTAG ACATTTATGA 2940

ACTTTCCTTT ATGTAATTTT CCAGAATCCT TGTCAGATTC TAATCATTGC TTTATAATTA 3000

TAGTTATACT CATGGATTTG TAGTTGAGTA TGAAAATATT TTTTAATGCA TTTTATGACT 3060

TGCCAATTGA TTGACAACAT GCATCAATCG ACCTGCAGCC ACTCGAAGCG GCCGCGTTCA 3120

AGCTTCTGCA GGTCCGATGT GAGACTTTTC AACAAAGGGT AATATCCGGA AACCTCTTCG 3180

GATTCCATTG CCCAGCTATC TGTCACTTTA TTGTGAAGAT AGTGGAAAAG GAAGGTGGCT 3240

CCTACAAATG CCATCATTGC GATAAAGGAA AGGCCATCGT TGAAGATGCC TCTGCCGACA 3300

GTGGTCCCAA AGATGGACCC CCACCCACGA GGAGCATCGT GGAAAAAGAA GACGTTCCAA 3360

CCACGTCTTC AAAGCAAGTG GATTGATGTG ATGGTCCGAT GTGAGACTTT TCAACAAAGG 3420

GTAATATCCG GAAACCTCCT CGGATTCCAT TGCDCAGCTA TCTGTCACTT TATTGTGAAG 3480

ATAGTGGAAA AGGAAGGTGG CTCCTACAAA TGCCATCATT GCGATAAAGG AAAGGCCATC 3540

GTTGAAGATG CCTCTGCCGA CAGTGGTCCC AAAGATGGAC CCCCACCCAC GAGGAGCATC 3600

GTGGAAAAAG AAGACGTTCC AACCACGTCT TCAAAGCAAG TGGATTGATG TGATATCTCC 3660

ACTGACGTAA GGGATGACGC ACAATCCCAC TATCCTTCGC AAGACCCTTC CTCTATATAA 3720

GGAAGTTCAT TTCATTTGGA GAGGACACGC TGACAAGCTG ACTCTAGCAG ATCTCCATGG 3780

TCCGTCCTGT AGAAACCCCA ACCCGTGAAA TCAAAAAACT CGACGGCCTG TGGGCATTCA 3840

GTCTGGATCG CGAAAACTGT GGAATTGATC AGCGTTGGTG GGAAAGCGCG TTACAAGAAA 3900

GCCGGGCAAT TGCTGTGCCA GGCAGTTTTA ACGATCAGTT CGCCGATGCA GATATTCGTA 3960

ATTATGCGGG CAACGTCTGG TATCAGCGCC AAGTCTTTAT ACCGAAAGGT TGGGCAGGCC 4020

AGCGTATCGT GCTGCGTTTC GATGCGGTCA CTCATTACGG CAAAGTGTGG GTCAATAATC 4080

AGGAAGTGAT GGAGCATCAG GGCGGCTATA CGCCATTTGA AGCCGATGTC ACGCCGTATG 4140

TTATTGCCGG GAAAAGTGTA CGTATCACCG TTTGTGTGAA CAACGAACTG AACTGGCAGA 4200

CTATCCCGCC GGGAATGGTG ATTACCGACG AAAACGGCAA GAAAAAGCAG TCTTACTTCC 4260

ATGATTTCTT TAACTATGCC GGAATCCATC GCAGCGTAAT GCTCTACACC ACGCCGAACA 4320

CCTGGGTGGA CGATATCACC GGTTGTACGC ATGTCGCGCA AGACTGTAAC CACGCGTCTG 4380

TTGACTGGCA GGTGGTGGCC AATGGTGATG TCAGCGTTGA ACTGCGTGAT GCGGATCAAC 4440

AGGTGGTTGC AACTGGACAA GGCACTAGCG GGACTTTGCA AGTGGTGAAT CCGCACCTCT 4500

GGCAACCGGG TGAAGGTTAT CTCTATGAAC TGTGCGTCAC AGCCAAAAGC CAGACAGAGT 4560

GTGATATCTA CCCGCTTCGC GTCGGCATCC GGTCAGTGGC AGTGAAGGGC GAACAGTTCC 4620

TGATTAACCA CAAACCGTTC TACTTTACTG GCTTTGGTCG TCATGAAGAT GCGGACTTAC 4680

GTGGCAAAGG ATTCGATAAC GTGCTGATGG TGCACGACCA CGCATTAATG GACTGGATTG 4740

GGGCCAACTC CTACCGTACC TCGCATTACC CTTACGCTGA AGAGATGCTC GACTGGGCAG 4800

ATGAACATGG CATCGTGGTG ATTGATGAAA CTGCTGCTGT CGGCTTTAAC CTCTCTTTAG 4860

GCATTGGTTT CGAAGCGGGC AACAAGCCGA AAGAACTGTA CAGCGAAGAG GCAGTCAACG 4920

GGGAAACTCA GCAAGCGCAC TTACAGGCGA TTAAAGAGCT GATAGCGCGT GACAAAAACC 4980

ACCCAAGCGT GGTGATGTGG AGTATTGCCA ACGAACCGGA TACCCGTCCT GCACGGGAAT 5040

ATTTCGGCAT TTCGCCACTG GCGGAAGCAA CGCGTAAACT CGACCCGACG CGTCCGATCA 5100

CCTGCGTCAA TGTAATGTTC TGCGACGCTC ACACCGATAC CATCAGCGAT CTCTTTGATG 5160

TGCTGTGCCT GAACCGTTAT TACGGATGGT ATGTCCAAAG CGGCGATTTG GAAACGGCAG 5220

AGAAGGTACT GGAAAAAGAA CTTCTGGCCT GGCAGGAGAA ACTGCATCAG CCGATTATCA 5280

TCACCGAATA CGGCGTGGAT ACGTTAGCCG GGCTGCACTC AATGTACACC GACATGTGGA 5340

GTGAAGAGTA TCAGTGTGCA TGGCTGGATA TGTATCACCG CGTCTTTGAT CGCGTCAGCG 5400

CCGTCGTCGG TGAACAGGTA TGGAATTTCG CCGATTTTGC GACCTCGCAA GGCATATTGC 5460

GCGTTGGCGG TAACAAGAAA GGGATCTTCA CTCGCGACCG CAAACCGAAG TCGGCGGCTT 5520

TTCTGCTGCA AAAACGCTGG ACTGGCATGA ACTTCGGTGA AAAACCGCAG CAGGGAGGCA 5580

AACAATGAAT CAACAACTCT CCTGGCGCAC CATCGTCGGC TACAGCCTCG GTGGGGAATT 5640

CGAGCTCGCC CGGGGATCCT CTAGCTAGAG CTTTCGTTCG TATCATCGGT TTCGACAACG 5700

TTCGTCAAGT TCAATGCATC AGTTTCATTG CGCACACACC AGAATCCTAC TGAGTTCGAG 5760

TATTATGGCA TTGGGAAAAC TGTTTTTCTT GTACCATTTG TTGTGCTTGT AATTTACTGT 5820

GTTTTTTATT CGGTTTTCGC TATCGAACTG TGAAATGGAA ATGGATGGAG AAGAGTTAAT 5880

GAATGATATG GTCCTTTTGT TCATTCTCAA ATTAATATTA TTTGTTTTTT CTCTTATTTG 5940

TTGTGTGTTG AATTTGAAAT TATAAGAGAT ATGCAAACAT TTTGTTTTGA GTAAAAATGT 6000

GTCAAATCGT GGCCTCTAAT GACCGAAGTT AATATGAGGA GTAAAACACT TGTAGTTGTA 6060

CCATTATGCT TATTCACTAG GCAACAAATA TATTTTCAGA CCTAGAAAAG CTGCAAATGT 6120

TACTGAATAC AAGTATGTCC TCTTGTGTTT TAGACATTTA TGAACTTTCC TTTATGTAAT 6180

TTTCCAGAAT CCTTGTCAGA TTCTAATCAT TGCTTTATAA TTATAGTTAT ACTCATGGAT 6240

TTGTAGTTGA GTATGAAAAT ATTTTTTAAT GCATTTTATG ACTTGCCAAT TGATTGACAA 6300

CATGCATCAA TCGACCTGCA GCCCAAGCTT GAGCTCAGGA TTTAGCAGCA TTCCAGATTG 6360

GGTTCAATCA ACAAGGTACG AGCCATATCA CTTTATTCAA ATTGGTATCG CCAAAACCAA 6420

GAAGGAACTC CCATCCTCAA AGGTTTGTAA GGAAGAATTC TCAGTCCAAA GCCTCAACAA 6480

GGTCAGGGTA CAGAGTCTCC AAACCATTAG CCAAAAGCTA CAGGAGATCA ATGAAGAATC 6540

TTCAATCAAA GTAAACTACT GTTCCAGCAC ATGCATCATG GTCAGTAAGT TTCAGAAAAA 6600

GACATCCACC GAAGACTTAA AGTTAGTGGG CATCTTTGAA AGTAATCTTG TCAACATCGA 6660

GCAGCTGGCT TGTGGGGACC AGACAAAAAA GGAATGGTGC AGAATTGTTA GGCGCACCTA 6720

CCAAAAGCAT CTTTGCCTTT ATTGCAAAGA TAAAGCAGAT TCCTCTAGTA CAAGTGGGGA 6780

ACAAAATAAC GTGGAAAAGA GCTGTCCTGA CAGCCCACTC ACTAATGCGT ATGACGAACG 6840

CAGTGACGAC CACAAAAGAA TTCCCTCTAT ATAAGAAGGC ATTCATTCCC ATTTGAAGGA 6900

TCATCAGATA CTGAACCAAT CCTTCTAGAA GATCTCCACA ATGGCTTCCT CTATGCTCTC 6960

TTCCGCTACT ATGGTTGCCT CTCCGGCTCA GGCCACTATG GTCGCTCCTT TCAACGGACT 7020

TAAGTCCTCC GCTGCCTTCC CAGCCACCCG CAAGGCTAAC AACGACATTA CTTCCATCAC 7080

AAGCAACGGC GGAAGAGTTA ACTGCATGCA GGTGTGGCCT CCGATTGGAA AGAAGAAGTT 7140

TGAGACTCTC TCTTACCTTC CTGACCTTAC CGATTCCGGT GGTCGCGTCA ACTGCATGCA 7200

GGCCATGGCT GAGAACCACA AGAAGGTTGG TATCGCTGGA GCTGGAATCG TTGGTGTTTG 7260

CACTGCTTTG ATGCTTCAAC GTCGTGGATT CAAGGTTACC TTGATTGATC CAAACCCACC 7320

AGGTGAAGGT GCTTCTTTCG GTAACGCTGG TTGCTTCAAC GGTTCCTCCG TTGTTCCAAT 7380

GTCCATGCCA GGAAACTTGA CTAGCGTTCC AAAGTGGCTT CTTGACCCAA TGGGTCCATT 7440

GTCCATCCGT TTCAGCTACT TTCCAACCAT CATGCCTTGG TTGATTCGTT TCTTGCTTGC 7500

TGGAAGACCA AACAAGGTGA AGGAGCAAGC TAAGGCACTC CGTAACCTCA TCAAGTCCAC 7560

TGTGCCTTTG ATCAAGTCCT TGGCTGAGGA GGCTGATGCT AGCCACCTTA TCCGTCACGA 7620

AGGTCACCTT ACCGTGTACC GTGGAGAAGC AGACTTCGCC AAGGACCGTG GAGGTTGGGA 7680

ACTTCGTCGT CTCAACGGTG TTCGTACTCA AATCCTCAGC GCTGATGCAT TGCGTGATTT 7740

CGATCCTAAC TTGTCTCACG CCTTTACCAA GGGAATCCTT ATCGAAGAGA ACGGTCACAC 7800

CATCAACCCA CAAGGTCTCG TGACTCTCTT GTTTCGTCGT TTCATCGCTA ACGGTGGAGA 7860

GTTCGTGTCT GCTCGTGTTA TCGGATTCGA GACTGAAGGT CGTGCTCTCA AGGGTATCAC 7920

CACCACCAAC GGTGTTCTTG CTGTTGATGC AGCTGTTGTT GCAGCTGGTG CACACTCCAA 7980

GTCTCTTGCT AACTCCCTTG GTGATGACAT CCCATTGGAT ACCGAACGTG GATACCACAT 8040

CGTGATCGCC AACCCAGAAG CTGCTCCACG TATTCCAACT ACCGATGCTT CTGGAAAGTT 8100

CCGGTCCAAA TTTGTTTACA TTGTGTCCAA ATTTCGGCTG ATTTGGACTT CCCTAGCTAT 8160

GCCAACTAAG CTAATAAAAA ACATGAAACA ACAATTACAA ACTGTCGAGC ACACCTTCTA 8220

CAAACTAGCT TAGATTTCTA TTGGAAGTTA CAAAACAGTA AAACTACCAA TAGGATACTA 8280

AATTAAACAT ATTAAACTAT TACTCCTCAA AAGCTTGTAC AATTTGCAGA AGAAATGATG 8340

GTTGCCCAAA AGCTTCAAAG GGAACCTGCT GGGAAGCCTG CTGGGACGCT GGGGATGCTG 8400

GCAGCAGCAT ACCTTGGCTT GAAGTACTCT TCTCTCATTG GTTTTGCTTC CCTTGCCCAT 8460

GTGGTCTTCA TATGGCCTCA TTACTTCCCA AGGGCTTCAA ATCAGTAGGT GGTGGCAACC 8520

AAAAGCATCA AAAACATCTC CTAAAACTAG CTTATACAAC CGGATTACAT GAGCTTATAC 8580

TAGCTTAACT CTTAAAGCAT GATTAACATA ATGATGTTTA AGGTGTCATT AAGTATTACT 8640

AATCTTGCTT AAGTAGAGAT TAACATAGGA TTAGCCTAAT CAAGTTGCTT AAGTAAGGTT 8700

TTAGAATAAA CCGAGCTAGT TAGGCTTAAG TAGAGATTAA CATAGGATTA GCCTAATCAA 8760

GTTGCTTAAG TAAGGTTTTA GAATAAACCG AGCTAGTT 8798

(2)关于SEQ ID NO：5的信息：

(i)序列特征

(A)长度：8418个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：3：

AAGCTTGAGC TCAGGATTTA GCAGCATTCC AGATTGGGTT CAATCAACAA GGTACGAGCC 60

ATATCACTTT ATTCAAATTG GTATCGCCAA AACCAAGAAG GAACTCCCAT CCTCAAAGGT 120

TTGTAAGGAA GAATTCTCAG TCCAAAGCCT CAACAAGGTC AGGGTACAGA GTCTCCAAAC 180

CATTAGCCAA AAGCTACAGG AGATCAATGA AGAATCTTCA ATCAAAGTAA ACTACTGTTC 240

CAGCACATGC ATCATGGTCA GTAAGTTTCA GAAAAAGACA TCCACCGAAG ACTTAAAGTT 300

AGTGGGCATC TTTGAAAGTA ATCTTGTCAA CATCGAGCAG CTGGCTTGTG GGGACCAGAC 360

AAAAAAGGAA TGGTGCAGAA TTGTTAGGCG CACCTACCAA AAGCATCTTT GCCTTTATTG 420

CAAAGATAAA GCAGATTCCT CTAGTACAAG TGGGGAACAA AATAACGTGG AAAAGAGCTG 480

TCCTGACAGC CCACTCACTA ATGCGTATGA CGAACGCAGT GACGACCACA AAAGAATTCC 540

CTCTATATAA GAAGGCATTC ATTCCCATTT GAAGGATCAT CAGATACTGA ACCAATCCTT 600

CTAGAAGATC TAAGCTTATC GATAAGCTTG ATGTAATTGG AGGAAGATCA AAATTTTCAA 660

TCCCCATTCT TCGATTGCTT CAATTGAAGT TTCTCCGATG GCGCAAGTTA GCAGAATCTG 720

CAATGGTGTG CAGAACCCAT CTCTTATCTC CAATCTCTCG AAATCCAGTC AACGCAAATC 780

TCCCTTATCG GTTTCTCTGA AGACGCAGCA GCATCCACGA GCTTATCCGA TTTCGTCGTC 840

GTGGGGATTG AAGAAGAGTG GGATGACGTT AATTGGCTCT GAGCTTCGTC CTCTTAAGGT 900

CATGTCTTCT GTTTCCACGG CGTGCATGCT TCACGGTGCA AGCAGCCGTC CAGCAACTGC 960

TCGTAAGTCC TCTGGTCTTT CTGGAACCGT CCGTATTCCA GGTGACAAGT CTATCTCCCA 1020

CAGGTCCTTC ATGTTTGGAG GTCTCGCTAG CGGTGAAACT CGTATCACCG GTCTTTTGGA 1080

AGGTGAAGAT GTTATCAACA CTGGTAAGGC TATGCAAGCT ATGGGTGCCA GAATCCGTAA 1140

GGAAGGTGAT ACTTGGATCA TTGATGGTGT TGGTAACGGT GGACTCCTTG CTCCTGAGGC 1200

TCCTCTCGAT TTCGGTAACG CTGCAACTGG TTGCCGTTTG ACTATGGGTC TTGTTGGTGT 1260

TTACGATTTC GATAGCACTT TCATTGGTGA CGCTTCTCTC ACTAAGCGTC CAATGGGTCG 1320

TGTGTTGAAC CCACTTCGCG AAATGGGTGT GCAGGTGAAG TCTGAAGACG GTGATCGTCT 1380

TCCAGTTACC TTGCGTGGAC CAAAGACTCC AACGCCAATC ACCTACAGGG TACCTATGGC 1440

TTCCGCTCAA GTGAAGTCCG CTGTTCTGCT TGCTGGTCTC AACACCCCAG GTATCACCAC 1500

TGTTATCGAG CCAATCATGA CTCGTGACCA CACTGAAAAG ATGCTTCAAG GTTTTGGTGC 1560

TAACCTTACC GTTGAGACTG ATGCTGACGG TGTGCGTACC ATCCGTCTTG AAGGTCGTGG 1620

TAAGCTCACC GGTCAAGTGA TTGATGTTCC AGGTGATCCA TCCTCTACTG CTTTCCCATT 1680

GGTTGCTGCC TTGCTTGTTC CAGGTTCCGA CGTCACCATC CTTAACGTTT TGATGAACCC 1740

AACCCGTACT GGTCTCATCT TGACTCTGCA GGAAATGGGT GCCGACATCG AAGTGATCAA 1800

CCCACGTCTT GCTGGTGGAG AAGACGTGGC TGACTTGCGT GTTCGTTCTT CTACTTTGAA 1860

GGGTGTTACT GTTCCAGAAG ACCGTGCTCC TTCTATGATC GACGAGTATC CAATTCTCGC 1920

TGTTGCAGCT GCATTCGCTG AAGGTGCTAC CGTTATGAAC GGTTTGGAAG AACTCCGTGT 1980

TAAGGAAAGC GACCGTCTTT CTGCTGTCGC AAACGGTCTC AAGCTCAACG GTGTTGATTG 2040

CGATGAAGGT GAGACTTCTC TCGTCGTGCG TGGTCGTCCT GACGGTAAGG GTCTCGGTAA 2100

CGCTTCTGGA GCAGCTGTCG CTACCCACCT CGATCACCGT ATCGCTATGA GCTTCCTCGT 2160

TATGGGTCTC GTTTCTGAAA ACCCTGTTAC TGTTGATGAT GCTACTATGA TCGCTACTAG 2220

CTTCCCAGAG TTCATGGATT TGATGGCTGG TCTTGGAGCT AAGATCGAAC TCTCCGACAC 2280

TAAGGCTGCT TGATGAGCTC AAGAATTCGA GCTCGGTACC GGATCCTCTA GCTAGAGCTT 2340

TCGTTCGTAT CATCGGTTTC GACAACGTTC GTCAAGTTCA ATGCATCAGT TTCATTGCGC 2400

ACACACCAGA ATCCTACTGA GTTCGAGTAT TATGGCATTG GGAAAACTGT TTTTCTTGTA 2460

CCATTTGTTG TGCTTGTAAT TTACTGTGTT TTTTATTCGG TTTTCGCTAT CGAACTGTGA 2520

AATGGAAATG GATGGAGAAG AGTTAATGAA TGATATGGTC CTTTTGTTCA TTCTCAAATT 2580

AATATTATTT GTTTTTTCTC TTATTTGTTG TGTGTTGAAT TTGAAATTAT AAGAGATATG 2640

CAAACATTTT GTTTTGAGTA AAAATGTGTC AAATCGTGGC CTCTAATGAC CGAAGTTAAT 2700

ATGAGGAGTA AAACACTTGT AGTTGTACCA TTATGCTTAT TCACTAGGCA ACAAATATAT 2760

TTTCAGACCT AGAAAAGCTG CAAATGTTAC TGAATACAAG TATGTCCTCT TGTGTTTTAG 2820

ACATTTATGA ACTTTCCTTT ATGTAATTTT CCAGAATCCT TGTCAGATTC TAATCATTGC 2880

TTTATAATTA TAGTTATACT CATGGATTTC TAGTTGAGTA TGAAAATATT TTTTAATGCA 2940

TTTTATGACT TGCCAATTGA TTGACAACAT GCATCAATCG ACCTGCAGCC ACTCGAAGCG 3000

GCCGCGTTCA AGCTTCTGCA GGTCCGATGT GAGACTTTTC AACAAAGGGT AATATCCGGA 3060

AACCTCCTCG GATTCCATTG CCCAGCTATC TGTCACTTTA TTGTGAAGAT AGTGGAAAAG 3120

GAAGGTGGCT CCTACAAATG CCATCATTGC GATAAAGGAA AGGCCATCGT TGAAGATGCC 3180

TCTGCCGACA GTGGTCCCAA AGATGGACCC CCACCCACGA GGAGCATCGT GGAAAAAGAA 3240

GACGTTCCAA CCACGTCTTC AAAGCAAGTG GATTGATGTG ATGGTCCGAT GTGAGACTTT 3300

TCAACAAAGG GTAATATCCG GAAACCTCCT CGGATTCCAT TGCCCAGCTA TCTGTCACTT 3360

TATTGTGAAG ATAGTGGAAA AGGAAGGTGG CTCCTACAAA TGCCATCATT GCGATAAAGG 3420

AAAGGCCATC GTTGAAGATG CCTCTGCCGA CAGTGGTCCC AAAGATGGAC CCCCACCCAC 3480

GAGGAGCATC GTGGAAAAAG AAGACGTTCC AACCACGTCT TCAAAGCAAG TGGATTGATG 3540

TGATATCTCC ACTGACGTAA GGGATGACGC ACAATCCCAC TATCCTTCGC AAGACCCTTC 3600

CTCTATATAA GGAAGTTCAT TTCATTTGGA GAGGACACGC TGACAAGCTG ACTCTAGCAG 3660

ATCTCCATGG TCCGTCCTGT AGAAACCCCA ACCCGTGAAA TCAAAAAACT CGACGGCCTG 3720

TGGGCATTCA GTCTGGATCG CGAAAACTGT GGAATTGATC AGCGTTGGTG GGAAAGCGCG 3780

TTACAAGAAA GCCGGGCAAT TGCTGTGCCA GGCAGTTTTA ACGATCAGTT CGCCGATGCA 3840

GATATTCGTA ATTATGCGGG CAACGTCTGG TATCAGCGCG AAGTCTTTAT ACCGAAAGGT 3900

TGGGCAGGCC AGCGTATCGT GCTGCGTTTC GATGCGGTCA CTCATTACGG CAAAGTGTGG 3960

GTCAATAATC AGGAAGTGAT GGAGCATCAG GGCGGCTATA CGCCATTTGA AGCCGATGTC 4020

ACGCCGTATG TTATTGCCGG GAAAAGTGTA CGTATCACCG TTTGTGTGAA CAACGAACTG 4080

AACTGGCAGA CTATCCCGCC GGGAATGGTG ATTACCGACG AAAACGGCAA GAAAAAGCAG 4140

TCTTACTTCC ATGATTTCTT TAACTATGCC GGAATCCATC GCAGCGTAAT GCTCTACACC 4200

ACGCCGAACA CCTGGGTGGA CGATATCACC GTGGTGACGC ATGTCGCGCA AGACTGTAAC 4260

CACGCGTCTG TTGACTGGCA GGTGGTGGCC AATGGTGATG TCAGCGTTGA ACTGCGTGAT 4320

GCGGATCAAC AGGTGGTTGC AACTGGACAA GGCACTAGCG GGACTTTGCA AGTGGTGAAT 4380

CCGCACCTCT GGCAACCGGG TGAAGGTTAT CTCTATGAAC TGTGCGTCAC AGCCAAAAGC 4440

CAGACAGAGT GTGATATCTA CCCGCTTCGC GTCGGCATCC GGTCAGTGGC AGTGAAGGGC 4500

GAACAGTTCC TGATTAACCA CAAACCGTTC TACTTTACTG GCTTTGGTCG TCATGAAGAT 4560

GCGGACTTAC GTGGCAAAGG ATTCGATAAC GTGCTGATGG TGCACGACCA CGCATTAATG 4620

GACTGGATTG GGGCCAACTC CTACCGTACC TCGCATTACC CTTACGCTGA AGAGATGCTC 4680

GACTGGGCAG ATGAACATGG CATCGTGGTG ATTGATGAAA CTGCTGCTGT CGGCTTTAAC 4740

CTCTCTTTAG GCATTGGTTT CGAAGCGGGC AACAAGCCGA AAGAACTGTA CAGCGAAGAG 4800

GCAGTCAACG GGGAAACTCA GCAAGCGCAC TTACAGGCGA TTAAAGAGCT GATAGCGCGT 4860

GACAAAAACC ACCCAAGCGT GGTGATGTGG AGTATTGCCA ACGAACCGGA TACCCGTCCT 4920

GCACGGGAAT ATTTCGGCAT TTCGCCACTG GCGGAAGCAA CGCGTAAACT CGACCCGACG 4980

CGTCCGATCA CCTGCGTCAA TGTAATGTTC TGCGACGCTC ACACCGATAC CATCAGCGAT 5040

CGTCTTGATG TGCTGTGCCT CAACCGTTAT TACGGATGGT ATGTCCAAAG CGGCGATTTG 5100

GAAACGGCAG AGAAGGTACT GGAAAAAGAA CTTCTGGCCT GGCAGGAGAA ACTGCATCAG 5160

CCGATTATCA TCACCGAATA CGGCGTGGAT ACGTTAGCCG GGCTGCACTC AATGTACACC 5220

GACATGTGGA GTGAAGAGTA TCAGTGTGCA TGGCTGGATA TGTATCACCG CGTCTTTGAT 5280

CGCGTCAGCG CCGTCGTCGG TGAACAGGTA TGGAATTTCG CCGATTTTGC GACCTCGCAA 5340

GGCATATTGC GCGTTGGCGG TAACAAGAAA GGGATCTTCA CTCGCGACCG CAAACCGAAG 5400

TCGGCGGCTT TTCTGCTGCA AAAACGCTGG ACTGGCATGA ACTTCGGTGA AAAACCGCAG 5460

CAGGGAGGCA AACAATGAAT CAACAACTCT CCTGGCGCAC CATCGTCGGC TACAGCCTCG 5520

GTGGGGAATT CGAGCTCGCC CGGGGATCCT CTAGCTAGAG CTTTCGTTCG TATCATCGGT 5580

TTCGACAACG TTCGTCAAGT TCAATGCATC AGTTTCATTG CGCACACACC AGAATCCTAC 5640

TGAGTTCGAG TATTATGGCA TTGGGAAAAC TGTTTTTCTT GTACCATTTG TTGTGCTTGT 5700

AATTTACTGT GTTTTTTATT CGGTTTTCGC TATCGAACTG TGAAATGGAA ATGGATGGAG 5760

AAGAGTTAAT GAATGATATG GTCCTTTTGT TCATTCTCAA ATTAATATTA TTTGTTTTTT 5820

CTCTTATTTG TTGTGTGTTG AATTTGAAAT TATAAGAGAT ATGCAAACAT TTTGTTTTGA 5880

GTAAAAATGT GTCAAATCGT GGCCTCTAAT GACCGAAGTT AATATGAGGA GTAAAACACT 5940

TGTAGTTGTA CCTAAATGCT TATTCACTAG GCAACAAATA TATTTTCAGA CCTAGAAAAG 6000

CTGCAAATGT TACTGAATAC AAGTATGTCC TCTTGTGTTT TAGACATTTA TGAACTTTCC 6060

TTTATGTAAT TTTCCAGAAT CCTTGTCAGA TTCTAATCAT TGCTTTATAA TTATAGTTAT 6120

ACTCATGGAT TTGTAGTTGA GTATGAAAAT ATTTTTTAAT GCATTTTATG ACTTGCCAAT 6180

TGATTGACAA CATGCATCAA TCGACCTGCA GCCCAAGCTT GAGCTCAGGA TTTAGCAGCA 6240

TTCCAGATTG GGTTCAATCA ACAAGGTACG AGCCATATCA CTTTATTCAA ATTGGTATCG 6300

CCAAAACCAA GAAGGAACTC CCATCCTCAA AGGTTTGTAA GGAAGAATTC TCAGTCCAAA 6360

GCCTCAACAA GGTCAGGGTA CAGAGTCTCC AAACCATTAG CCAAAAGCTA CAGGAGATCA 6420

ATGAAGAATC TTCAATCAAA GTAAACTACT GTTCCAGCAC ATGCATCATG GTCAGTAAGT 6480

TTCAGAAAAA GACATCCACC GAAGACTTAA AGTTAGTGGG CATCTTTGAA AGTAATCTTG 6540

TCAACATCGA GCAGCTGGCT TGTGGGGACC AGACAAAAAA GGAATGGTGC AGAATTGTTA 6600

GGCGCACCTA CCAAAAGCAT CTTTGCCTTT ATTGCAAAGA TAAAGCAGAT TCCTCTAGTA 6660

CAAGTGGGGA ACAAAATAAC GTGGAAAAGA GCTGTCCTGA CAGCCCACTC ACTAATGCGT 6720

ATGACGAACG CAGTGACGAC CACAAAAGAA TTCCCTCTAT ATAAGAAGGC ATTCATTCCC 6780

ATTTGAAGGA TCATCAGATA CTGAACCAAT CCTTCTAGAA GATCTCCACA ATGGCTTCCT 6840

CTATGCTCTC TTCCGCTACT ATGGTTGCCT CTCCGGCTCA GGCCACTATG GTCGCTCCTT 6900

TCAACGGACT TAAGTCCTCC GCTGCCTTCC CAGCCACCCG CAAGGCTAAC AACGACATTA 6960

CTTCCATCAC AAGCAACGGC GGAAGAGTTA ACTGCATGCA GGTGTGGCCT CCGATTGGAA 7020

AGAAGAAGTT TGAGACTCTC TCTTACCTTC CTGACCTTAC CGATTCCGGT GGTCGCGTCA 7080

ACTGCATGCA GGCCATGGCT GAGAACCACA AGAAGGTTGG TATCGCTGGA GCTGGAATCG 7140

TTGGTGTTTG CACTGCTTTG ATGCTTCAAC GTCGTGGATT CAAGGTTACC TTGATTGATC 7200

CAAACCCACC AGGTGAAGGT GCTTCTTTCG GTAACGCTGG TTGCTTCAAC GGTTCCTCCG 7260

TTGTTCCAAT GTCCATGCCA GGAAACTTGA CTAGCGTTCC AAAGTGGCTT CTTGACCCAA 7320

TGGGTCCATT GTCCATCCGT TTCAGCTACT TTCCAACCAT CATGCCTTGG TTGATTCGTT 7380

TCTTGCTTGC TGGAAGACCA AACAAGGTGA AGGAGCAAGC TAAGGCACTC CGTAACCTCA 7440

TCAAGTCCAC TGTGCCTTTG ATCAAGTCCT TGGCTGAGGA GGCTGATGCT AGCCACCTTA 7500

TCCGTCACGA AGGTCACCTT ACCGTGTACC GTGGAGAAGC AGACTTCGCC AAGGACCGTG 7560

GAGGTTGGGA ACTTCGTCGT CTCAACGGTG TTCGTACTCA AATCCTCAGC GCTGATGCAT 7620

TGCGTGATTT CGATCCTAAC TTGTCTCACG CCTTTACCAA GGGAATCCTT ATCGAAGAGA 7680

ACGGTCACAC CATCAACCCA CAAGGTCTCG TGACTCTCTT GTTTCGTCGT TTCATCGCTA 7740

ACGGTGGAGA GTTCGTGTCT GCTCGTGTTA TCGGATTCGA GACTGAAGGT CGTGCTCTCA 7800

AGGGTATCAC CACCACCAAC GGTGTTCTTG CTGTTGATGC AGCTGTTGTT GCAGCTGGTG 7860

CACACTCCAA GTCTCTTGCT AACTCCCTTG GTGATGACAT CCCATTGGAT ACCGAACGTG 7920

GATACCACAT CGTGATCGCC AACCCAGAAG CTGCTCCACG TATTCCAACT ACCGATGCTT 7980

CTGGAAAGTT CATCGCTACT CCTATGGAGA TGGGTCTTCG TGTTGCTGGA ACCGTTGAGT 8040

TCGCTGGTCT CACTGCTGCT CCTAACTGGA AGCGTGCTCA CGTTCTCTAC ACTCACGCTC 8100

GTAAGTTGCT TCCAGCTCTC GCTCCTGCCA GTTCTGAAGA ACGTTACTCC AAGTGGATGG 8160

GTTTCCGTCC AAGCATCCCA GATTCCCTTC CAGTGATTGG TCGTGCTACC CGTACTCCAG 8220

ACGTTATCTA CGCTTTCGGT CACGGTCACC TCGGTATGAC TGGTGCTCCA ATGACCGCAA 8280

CCCTCGTTTC TGAGCTCCTC GCAGGTGAGA AGACCTCTAT CGACATCTCT CCATTCGCAC 8340

CAAACCGTTT CGGTATTGGT AAGTCCAAGC AAACTGGTCC TGCATCCTAA GTGGGAATTC 8400

GAGCTCGGTA CCGGATCC 8418

(2)关于SEQ ID NO：6的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：6：

CACCGGTCTT TTGGAAGGTG AAG 23

(2)关于SEQ ID NO：7的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：7：

AACGAGACCC ATAACGAGGA AGC 23

(2)关于SEQ ID NO：8的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：8：

AAACAGTCCC GTGCATCCCC AAC 23

(2)关于SEQ ID NO：9的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：9：

GACGCCTCC TTGATTCTGT CCC 23

(2)关于SEQ ID NO：10的信息：

(i)序列特征

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：10：

CAAGAAGGTT GGTATCGCTG

20

(2)关于SEQ ID NO：11的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：11：

TCTTTTGTGG TCGTCACTGC GTT

23

(2)关于SEQ ID NO：12的信息：

(i)序列特征

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：12：

GCGAGCTCTA ATACGACTCA CTAT

24

(2)关于SEQ ID NO：13的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：13：

CGCGAGCTCA ATTAACCCTC ACT 23

(2)关于SEQ ID NO：14的信息：

(i)序列特征

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：14：

TCTGTACCCT GACCTTGTTG 20

(2)关于SEQ ID NO：15的信息：

(i)序列特征

(A)长度：20个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：15：

CGTGGATACC ACATCGTGAT 20

(2)关于SEQ ID NO：16的信息：

(i)序列特征

(A)长度：19个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：16：

ACCTTGGCTT GAAGTACTC 19

(2)关于SEQ ID NO：17的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：17：

TCAACCTACA GCTGATTTGG ACC 23

(2)关于SEQ ID NO：18的信息：

(i)序列特征

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：18：

GGACCGGAAC GACAATCTGATC 22

(2)关于SEQ ID NO：19的信息：

(i)序列特征

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：19：

CTAGGGAAGT CCAAATCAGC CG 22

(2)关于SEQ ID NO：20的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：20：

TTTGGACCGG AACTTTCCAG AAG 23

(2)关于SEQ ID NO：21的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：21：

CTAACTTGCG CCATCGGAGA AAC 23

(2)关于SEQ ID NO：22的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：22：

GACTTGTCAC CTGGAATACG GAC 23

(2)关于SEQ ID NO：23的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：23：

ATTCTTGAGC TCATCAAGCA GCC 23

(2)关于SEQ ID NO：24的信息：

(i)序列特征

(A)长度：22个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：24：

AAGGTGGTA TCGCTGGAGC TG 22

(2)关于SEQ ID NO：25的信息：

(i)序列特征

(A)长度：23个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：25：

TCTCCACAAT GGCTTCCTCT ATG 23

(2)关于SEQ ID NO：26的信息：

(i)序列特征

(A)长度：671个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述： SEQ ID NO：26：

CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CGGCTATGAC 60

TGGGCACAAC AGACAATCGG CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG 120

CGCCCGGTTC TTTTTGTCAA GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG 180

GCAGCGCGGC TATCGTGGCT GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 240

GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA GGATCTCCTG 300

TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG CTGATGCAAT GCGGCGGCTG 360

CATACGCTTG ATCCGGCTAC CTGCCCATTC GACCACCAAG CGAAACATCG CATCGAGCGA 420

GCACGTACTC GGATGGAAGC CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG 480

GGGCTCGCGC CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 540

CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA TGGCCGCTTT 600

TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC GCTATCAGGA CTTAGCGTTG 660

GCTACCCGTG A 671

(2)关于SEQ ID NO：27的信息：

(i)序列特征

(A)长度：739个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线形

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：无

(xi)序列描述：SEQ ID NO：27：

GGACCGGAAC GACAATCTGA TCCCCATCAA GCTTGAGCTC AGGATTTAGC AGCATTCCAG 60

ATTGGGTTCA ATCAACAAGG TACGAGCCAT ATCACTTTAT TCAAATTGGT ATCGCCAAAA 120

CCAAGAAGGA ACTCCCATCC TCAAAGGTTT GTAAGGAAGA ATTCTCAGTC CAAAGCCTCA 180

ACAAGGTCAG GGTACAGAGT CTCCAAACCA TTAGCCAAAA GCTACAGGAG ATCAATGAAG 240

AATCTTCAAT CAAAGTAAAC TACTGTTCCA GCACATGCAT CATGGTCAGT AAGTTTCAGA 300

AAAAGACATC CACCGAAGAC TTAAAGTTAG TGGGCATCTT TGAAAGTAAT CTTGTCAACA 360

TCGAGCAGCT GGCTTGTGGG GACCAGACAA AAAAGGAATG GTGCAGAATT GTTAGGCGCA 420

CCTACCAAAA GCATCTTTGC CTTTATTGCA AAGATAAAGC AGATTCCTCT AGTACAAGTG 480

GGGAACAAAA TAACGTGGAA AAGAGCTGTC CTGACAGCCC ACTCACTAAT GCGTATGACG 540

AACGCAGTGA CGACCACAAA AGAATTCCCT CTATATAAGA AGGCATTCAT TCCCATTTGA 600

AGGATCATCA GATACTGAAC CAATCCTTCT AGAAGATCTA AGCTTATCGA TAAGCTTGAT 660

GTAATTGGAG GAAGATCAAA ATTTTCAATC CCCATTCTTC GATTGCTTCA ATTGAAGTTT 720

CTCCGATGGC GCAAGTTAG 739

Claims

1.表达cp4/epsps酶活性的甜菜植株细胞，其特征在于当使用以SEQID NO：18和SEQ ID NO：21的序列为特征的寡核苷酸引物对和以SEQ IDNO：20和SEQ ID NO：25的序列为特征的寡核苷酸引物对时，以其基因组DNA为模板的PCR扩增产生739bp的DNA片段和1178bp的DNA片段。

2.根据权利要求1所述的植株细胞，其中以SEQ ID NO：27的核苷酸序列为特征的DNA形成植物基因组的部分。

3.根据权利要求1所述的植株细胞，其特征在于当使用以SEQ ID NO：17和SEQ ID NO：22的序列为特征的寡核苷酸引物对时，以其基因组DNA为模板的PCR扩增产生1057bp的DNA片段。

4.根据权利要求1所述的植株细胞，其特征在于当使用以SEQ ID NO：19和SEQ ID NO：25的序列为特征的寡核苷酸引物对时，以其基因组DNA为模板的PCR扩增产生1224bp的DNA片段。

5.根据权利要求1所述的植株细胞，其中以SEQ ID NO：1的核苷酸序列为特征的DNA形成植物细胞基因组的部分。

6.根据权利要求5所述的植株细胞，其中所述的核苷酸序列取代了高度重复的DNA序列。

7.根据权利要求6所述的植株细胞，其中DNA的特征在于SEQ ID NO：4的核苷酸序列形成植物细胞基因组的部分。

8.包含权利要求1-7中的任意一项所述的特征的种子细胞。

9.包含权利要求5所述的特征的种子细胞，以登记号NCIMB 40905保藏。

10.产生包含权利要求1所述的植株细胞的转基因甜菜植株的方法，包括

(a)用携带含有编码cp4/epsps的DNA片段的载体的农杆菌转化体外培养的甜菜子叶，其中以该DNA片段为PCR反应的模板，使用以SEQ IDNO：18和SEQ ID NO：21的序列为特征的寡核苷酸引物对和以SEQ ID NO：20和SEQ ID NO：25的序列为特征的寡核苷酸引物对时，可扩增产生739bp的DNA片段和1178bp的DNA片段；

(b)在草甘膦存在时再生芽；

(c)将芽转移到温室的土壤中；

(d)用草甘膦处理苗；

(e)以0-9的等级对植株活力和叶褪绿进行目测评级；

(g)选择植株活力和叶褪绿评级为9的植株；并且

(h)通过传统育种技术繁殖所选植株。

11.根据权利要求10所述的方法，其中编码cp4/epsps蛋白的载体是含有具有SEQ ID NO：5中给出的核苷酸序列的DNA片段的载体。

12.根据权利要求10所述的方法，其中通过PCR分析再生芽中编码cp4/epsps的DNA的存在。

13.草甘膦耐受性甜菜植株细胞，可通过用使cp4/epsps在植物中表达的基因进行农杆菌介导的转化得到，其中所述的植株缺失左和右-DNA边界序列。